Сегодня 28 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-сервис
Быстрый переход

Google предложит музыкантам ИИ-продюсера вместо генератора случайных мелодий — компания поглотила ProducerAI

Музыкальный стартап ProducerAI вошёл в состав экспериментального подразделения Google Labs для создания продвинутой среды аудиопродакшена. Инструмент позволяет не только генерировать треки, но и создавать для них обложки и видеоклипы, используя весь стек нейросетевых технологий компании Google.

 Источник изображения: Grok

Источник изображения: Grok

По сообщению The Verge, сервис работает на базе предварительной версии модели Lyria 3 и даёт возможность создавать аудиоконтент при помощи виртуального агента. Инструмент позволяет генерировать звуки, дорабатывать тексты песен, создавать ремиксы и даже проектировать новые музыкальные инструменты через текстовые команды. Директор по управлению продуктами Google Labs Элиас Роман (Elias Roman) назвал главным преимуществом платформы возможность вести пошаговый полноценный диалог с нейросетью, отметив непригодность метода случайной генерации музыкального материала для получения действительно серьёзного результата.

Помимо Lyria 3 для генерации музыки и чат-бота Gemini, ProducerAI задействует модель Nano Banana для создания обложек альбомов и Veo для генерации видео. При этом во все результаты встраивается водяной знак SynthID, маркирующий ИИ-контент. При разработке платформы команда сотрудничала с The Chainsmokers, Lecrae, Anjulie и другими артистами. Американский диджей и продюсер Алекс Полл (Alex Pall) из The Chainsmokers назвал платформу по-настоящему «выстроенной с учётом опыта музыкантов». ProducerAI была запущена в июле 2025 года как идеологический наследник проекта Riffusion.

Несмотря на то что музыкальная индустрия всё активнее внедряет инструменты искусственного интеллекта для создания песен, например такие, как ElevenLabs, Udio и Suno, многие артисты выражают недовольство ИИ-клонами. Bandcamp даже полностью запретил музыку, созданную с помощью ИИ, на своей платформе, а стриминговый сервис Deezer разработал технологию для её обнаружения с целью понижения в рейтинге треков, созданных с использованием ИИ.

Как отмечает The Verge, ProducerAI останется самостоятельным продуктом в структуре Labs и будет доступен пользователям более чем в 250 странах с лимитированным бесплатным доступом и платной подпиской. Стартовый тариф стоимостью $8 в месяц включает кредиты на создание примерно 600 композиций. Более дорогие планы за $24 и $64 предназначены для активной студийной работы.

ByteDance пообещала отучить ИИ-генератор Seedance 2.0 копировать голливудских актеров и персонажей

Создание видеороликов с помощью ИИ-сервисов сталкивается с рядом юридических претензий, поскольку киностудии, правообладатели и знаменитости не желают допускать копирования их интеллектуальной собственности и образов без разрешения. Китайская ByteDance после запуска профильного сервиса Seedance 2.0 вынуждена была пообещать правообладателям ввести защитные механизмы, которые учитывали бы их интересы.

 Источник изображения: ByteDance

Как и многие подобные сервисы, Seedance 2.0 позволяет создавать реалистичные видео на основе текстовых запросов. Социальные сети после запуска Seedance 2.0 сразу же наводнились видеороликами с персонажами, охраняемыми авторским правом, а также образами, напоминающими реальных знаменитостей. Поскольку многие из них имели американское происхождение, то к создателям подобных роликов у правообладателей возникли справедливые претензии.

«Мы принимаем меры по усилению существующих защитных механизмов, чтобы предотвратить неправомерное использование интеллектуальной собственности и схожести (со знаменитостями) со стороны пользователей», — заявили представители ByteDance ресурсу CNBC. Свои претензии к создателям сервиса Seedance 2.0 довольно быстро направила отраслевая ассоциация MPA, которая в США представляет интересы большинства крупных киностудий и платформы Netflix. Она призвала ByteDance решительно пресечь неправомерную активность по использованию защищаемых интеллектуальными правами образов. По словам представителей ассоциации, подобная активность не только нарушает американские законы, но и угрожает миллионам рабочих мест в США.

Студия Disney направила в адрес ByteDance письмо с требованиями прекратить неправомерное использование принадлежащих ей персонажей. По мнению представителей Disney, китайская ByteDance для обучения ИИ-модели якобы использовала полученную пиратским образом библиотеку образов, считая её публично доступной. Ранее Disney подписала соглашение с OpenAI, которое позволяет пользователям ИИ-сервисов последней внедрять в генерируемые видео ряд узнаваемых персонажей, принадлежащих студии. Требования прекратить нарушение прав в сфере интеллектуальной собственности в адрес ByteDance на прошлой неделе направила и Paramount Skydance.

xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении

Компания xAI представила масштабное обновление инструмента генерации видео Grok Imagine 1.0. В новой версии теперь можно создавать ролики длиной до 10 секунд в разрешении 720 пикселей и синхронизировать звук. ИИ стал лучше понимать текстовые запросы и научился работать с уточняющими инструкциями.

 Источник изображения: Grok

Источник изображения: Grok

Как сообщает издание Mint, разработчики назвали этот релиз крупнейшим обновлением системы, а Илон Маск (Elon Musk) в своём сообщении подтвердил, что версия 1.0 уже доступна. Представители xAI отметили, что обновление привнесёт повышение чёткости изображения и плавности визуального ряда для эффективного использования в творческих проектах и соцсетях.

Ключевым нововведением стала работа со звуком. Пользователи смогут добавлять персонажам выразительные голоса с эмоциональной окраской, а также накладывать фоновую музыку, которая автоматически синхронизируется с происходящим на экране. В компании считают, что сочетание голоса и музыки делает сгенерированный контент более реалистичным и кинематографичным.

Серьёзные изменения коснулись и логики взаимодействия с нейросетью. Grok Imagine 1.0 научился обрабатывать уточняющие запросы, что позволит корректировать детали сцены и дорабатывать результат без необходимости начинать генерацию с нуля, как это было раньше.

За последние 30 дней платформа уже сгенерировала более одного миллиарда видео и популярность сервиса не уменьшается. Также сообщается, что API-модель показывает сильные результаты в бенчмарках Artificial Analysis, измерящих качество контента, созданного искусственным интеллектом Grok.

Ответ OpenAI: Anthropic превратила Claude в рабочую станцию со встроенными Canva, Slack и Figma

Компания Anthropic объявила о запуске новой функции, позволяющей работать со сторонними приложениями непосредственно в интерфейсе чат-бота Claude. Нововведение направлено на расширение возможностей использования искусственного интеллекта (ИИ) в корпоративной среде и упрощение взаимодействия с привычными сервисами.

 Источник изображений: Anthropic

Источник изображений: Anthropic

Как передаёт TechCrunch, на старте система поддерживает интеграцию с такими сервисами, как Slack, Canva, Figma, Box и Clay, а в ближайшее время разработчики планируют добавить поддержку облачной CRM-платформы Salesforce. Механизм работы предполагает авторизацию в каком-либо сервисе, после чего Claude получает к нему доступ, позволяя выполнять конкретные действия внутри своего интерфейса. Например, отправлять сообщения коллегам в мессенджере, генерировать графики или работать с файлами в облачном хранилище.

В Anthropic считают, что анализ данных, дизайна, контента и в целом управление проектами будет происходить гораздо эффективнее в одном визуальном интерфейсе, что позволит вносить правки быстрее, чем при использовании каждого сервиса по отдельности. Технология аналогична системе внедрения сторонних приложений OpenAI, запущенной в октябре 2024 года. Обе платформы построены на базе открытого стандарта Model Context Protocol (MCP). Доступ к нововведению получили подписчики тарифных планов Pro, Max, Team и Enterprise. Пользователям бесплатной версии функция недоступна. Активация и выбор сервисов происходят через специальный каталог Claude.

Новая статья: Лучшие ИИ-сервисы и приложения 2025 года: боты одолевают

Данные берутся из публикации Лучшие ИИ-сервисы и приложения 2025 года: боты одолевают

xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно

Компания xAI Илона Маска (Elon Musk), представила новую модель искусственного интеллекта для задач программирования под названием Grok Code Fast 1. Модель, которую компания описывает как «быструю и экономичную», призвана сократить время на медленные циклы обработки, характерные для других ИИ-ассистентов.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Grok Code Fast 1 построена на новой архитектуре, для предварительного обучения которой был специально сформирован массив данных, содержащий готовый к применению программный код. Дополнительно модель была дообучена на реальных запросах на внесение изменений в код (Pull Request, PR) и эталонных задачах по написанию кода, что, по утверждению xAI, позволило адаптировать её к практическому использованию. Система обучена работе с такими инструментами и командами, как grep (глобальный поиск регулярных выражений), терминал и редакторы файлов, что делает её пригодной для интеграции в повседневные рабочие процессы внутри популярных интегрированных сред разработки (IDE).

Модель поддерживает несколько языков программирования, включая TypeScript, Python, Java, Rust, C++ и Go. Компания заявляет, что Grok Code Fast 1 способна создавать проекты с нуля, отвечать на сложные вопросы по структуре кодовой базы и исправлять ошибки при минимальном участии разработчика. На тестовом наборе SWE-Bench-Verified, который широко используется для оценки возможностей ИИ в программировании, модель показала результат в 70,8%. При этом в xAI подчёркивают, что ключевую роль в формировании функциональности сыграла обратная связь от реальных разработчиков.

Особое внимание xAI уделила отзывчивости модели. Благодаря новым методам обслуживания и оптимизации кеширования она может практически мгновенно выполнять множественные вызовы инструментов, что позволяет разработчикам видеть результаты в реальном времени без задержек. Главный директор по продукту GitHub Марио Родригес (Mario Rodriguez) отметил в ходе тестирования и скорость, и качество модели в решении агентных задач кодирования, добавив, что эта разработка представляет собой убедительную новую опцию для разработчиков.

xAI подтвердила, что планирует регулярно обновлять Grok Code Fast 1, внедряя улучшения в течение нескольких дней, а не недель. Уже ведётся обучение новой версии модели, которая получит поддержку параллельных вызовов инструментов и увеличенной длины контекста. Как отмечает eWeek, тем самым xAI вступает в гонку с такими компаниями, как Microsoft (с GitHub Copilot) и OpenAI (с Codex), активно развивающими направление автономных ИИ-ассистентов для разработчиков.

Для привлечения первых пользователей модель будет доступна бесплатно в течение одной недели через партнёрские платформы, включая GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, Opencode и Windsurf. По истечении пробного периода стоимость использования через API xAI составит $0,20 за миллион входных токенов, $1,50 за миллион выходных токенов и $0,02 за миллион закешированных входных токенов. xAI также опубликовала руководство по созданию эффективных промптов для Grok Code Fast.

Google открыла доступ к Vids для всех: ИИ-видеоредактор стал бесплатным, но не без ограничений

Google запустила бесплатную версию видеоредактора Vids, работающего на базе искусственного интеллекта (ИИ). Ранее этот инструмент был доступен исключительно подписчикам Google Workspace и специальных тарифов с ИИ, но теперь все пользователи смогут использовать его базовую версию, которая включает шаблоны, стоковый медиаконтент и ограниченный набор ИИ-возможностей.

 Источник изображений: Google

Источник изображений: Google

Vids, представленный в прошлом году как часть пакета Workspace, предназначен для быстрого создания видео-презентаций. Он помогает пользователям формировать раскадровки, предлагая сцены, подбирая стоковые изображения и фоновую музыку с помощью алгоритмов. Как сообщает The Verge, ссылаясь на слова директора по продукту Вишну Шиваджи (Vishnu Sivaji), упрощённая версия сохраняет значительную часть основных возможностей приложения, однако в ней отсутствуют некоторые новейшие ИИ-функции, анонсированные одновременно с открытием доступа. В частности, бесплатная версия не позволяет использовать ИИ-аватары для озвучивания текста от имени пользователя.

В рамках обновления платные подписчики получат доступ к выбору из 12 готовых аватаров с уникальной внешностью и голосом, в которые можно загружать собственный сценарий. При этом функция создания персонального ИИ-аватара, аналогичная реализованной в Zoom, в Vids пока недоступна. На вопрос о такой возможности Шиваджи ответил, что компания не готова делиться планами на этот счёт.

Также Google расширила возможности генерации видео: теперь можно создавать 8-секундные ролики на основе конкретного изображения, например фотографии нового продукта. Кроме того, появился инструмент, автоматически удаляющий из записи слова-паразиты и паузы, что полезно при подготовке собственных видео для презентаций.

В компании считают, что новые функции помогут бизнесу сэкономить время и деньги при производстве видеоконтента различного назначения, в том числе обучающих роликов, так как, по словам Шиваджи, традиционное производство даже 10-минутного видео с живыми актёрами может занимать до полугода и обходиться в десятки тысяч долларов из-за затрат на написание сценария, его согласование, аренду студии, съёмку и монтаж.

Microsoft представила VibeVoice — открытый ИИ, превращающий текст в полуторачасовые подкасты

Microsoft представила проект с открытым исходным кодом VibeVoice в области искусственного интеллекта — новую систему синтеза речи, способную генерировать из текста аудиоподкасты длительностью до 90 минут на английском или китайском языке. Технология уже доступна для тестирования любому желающему онлайн или с установкой на локальное устройство пользователя.

 Источник изображения: AI

Источник изображения: AI

Разработчики охарактеризовали VibeVoice как новаторский фреймворк, созданный для генерации продолжительного по времени аудиоконтента с несколькими участниками непосредственно из текста. Как пишет Windows Central, система решает ключевые проблемы традиционных синтезаторов речи (TTS), такие как масштабируемость, согласованность характеристик голоса и естественность чередования реплик в диалоге. Модель способна синтезировать аудио продолжительностью до 90 минут с участием до четырёх уникальных голосов, что превосходит ограничения в 1-2 спикера, характерные для многих предыдущих ИИ-моделей.

В настоящее время для тестирования доступны две версии модели: на 1,5 и 7 млрд параметров. Первая может генерировать до 90 минут аудио с длиной контекста 64 тыс. токенов, тогда как вторая, предположительно более качественная из-за большего размера, ограничена 45 минутами и окном в 32 тысячи токенов. Также ожидается выпуск облегчённой версии на 0,5 млрд параметров, предназначенной для работы в реальном времени. Для локальной работы меньшая модель требует около 7 Гбайт видеопамяти, а для большей может потребоваться до 18 Гбайт VRAM.

На текущий момент ИИ-модель VibeVoice обучена только на английском и китайском языках, включая мандаринскую разновидность (севернокитайский или путунхуа). Однако в Microsoft отмечают, что в будущих версиях планируется расширение поддержки других языков. Система способна передавать эмоции, управлять сменой реплик между участниками и генерировать естественные диалоги, хотя попытки воспроизведения музыки пока остаются неудачными. Голоса звучат довольно реалистично, однако их искусственное происхождение остаётся заметным. В перспективе разработчики рассматривают возможность интеграции функции клонирования голоса.

Разработчики отмечают, что при запуске потоковой версии аудиогенерации VibeVoice может быть интегрирована в чат-ассистенты, позволяя обходиться без внешних серверов. Дополнительные сведения, включая инструкции по установке и настройке, доступны в официальном репозитории VibeVoice в GitHub и на платформе Hugging Face.

Тысячи приватных диалогов с Grok утекли в поиск Google

Тысячи диалогов пользователей с чат-ботом Grok компании xAI Илона Маска (Elon Musk), оказались доступны через поисковые системы, сообщает TechCrunch со ссылкой на Forbes. Каждый раз, когда пользователь Grok нажимает кнопку «Поделиться» в разговоре с чат-ботом, создаётся уникальный URL-адрес, который затем можно передать по электронной почте, в текстовом сообщении или в социальных сетях.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Эти URL-адреса с приватными диалогами могут быть проиндексированы поисковыми роботами Google, Bing и DuckDuckGo и появиться в результатах поиска глобальной сети. Функция, позволяющая генерировать публичные URL, аналогичным образом недавно затронула и пользователей чат-ботов от компаний Meta✴ и OpenAI, и в случае с Grok она также привела к утечке диалогов с небезопасным контентом — среди них запросы о взломе криптокошельков, откровенные беседы с персонифицированными ИИ-персонажами и просьбы предоставить инструкции по синтезу запрещённых препаратов.

Хотя в правилах использования сервиса xAI прямо запрещено применять бота для поощрения действий, «критически вредящих человеческой жизни», а также для разработки «биологического, химического оружия или оружия массового уничтожения», однако это не помешало пользователям направлять соответствующие запросы к Grok.

Согласно анализу диалогов, оказавшихся в открытом доступе через Google, бот предоставлял пошаговые инструкции по изготовлению запрещённых препаратов, перечислял методы совершения суицида, давал советы по созданию взрывоопасных устройств и даже сформулировал детальный план убийства самого Маска.

Представители xAI пока не ответили на запрос о комментарии, а также не уточнили, с какого времени ссылки на диалоги с Grok начали индексироваться поисковыми системами.

Напомним, что в конце прошлого месяца пользователи ChatGPT сообщили о похожей ситуации — их переписки также попадали в поисковую выдачу Google, на что OpenAI отреагировала, назвав это «кратковременным экспериментом». В ответ в Х появилось сообщение от компании Маска с фразой «Grok ftw» с комментарием, что в xAI «нет функции "Поделиться"» и что «конфиденциальность — её приоритет».

OpenAI заработала $2 млрд на мобильном приложении ChatGPT — в 30 раз больше всех конкурентом вместе

Мобильное приложение ChatGPT от OpenAI заработало $2 млрд с момента своего запуска в мае 2023 года, принося в среднем $2,91 с каждой установки. Основной рост пришёлся на 2025 год — доход за первые семь месяцев составил $1,35 млрд, что на 673 % больше, чем за аналогичный период 2024 года. Эта сумма примерно в 30 раз превышает совокупные доходы от мобильных приложений конкурентов в лице Claude, Copilot и Grok.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

По сообщению TechCrunch со ссылкой на данные компании Appfigures, специализирующейся на исследовании мобильного рынка, ChatGPT демонстрирует беспрецедентную монетизацию. В среднем приложение приносит $193 млн в месяц — для сравнения, ближайший конкурент Grok от xAI генерирует лишь $3,6 млн, что составляет 1,9 % от показателей ChatGPT. Разрыв ещё заметнее в пересчёте на одну загрузку: $2,91 у ChatGPT против $0,75 у Grok и $0,28 у Copilot.

Главными рынками оказались США (38 % выручки) и Германия (5,3 %), тогда как больше всего загрузок пришлось на Индию (13,7 %). Глобальное же число установок ChatGPT подтверждает доминирование компании: 690 млн против 39,5 млн у Grok.

 Источник изображения: appfigures.com

Источник изображения: appfigures.com

Только за 2025 год приложение скачали 318 млн раз — в 2,8 раза больше, чем за тот же период прошлого года. Среднемесячное количество загрузок выросло на 180 %, достигнув 45 млн. При этом Grok изначально отставал в мобильном сегменте и до января 2025 года у него не было отдельного приложения для iOS, а версия для Android появилась лишь в марте. Эксперты отмечают, что эти данные отражают только доходы от мобильных пользователей, не учитывая веб-подписки и API.

Бывшие сотрудники Google запустили ИИ, который создаёт вирусные видео в один клик

Стартап OpenArt, основанный бывшими сотрудниками Google в 2022 году, запустил в открытой бета-версии функцию «История в один клик» (One-Click Story), позволяющую превратить короткий текст, сценарий или песню в минутное видео с развитием сюжета. Платформа, насчитывающая около 3 млн активных пользователей в месяц, использует более 50 моделей искусственного интеллекта и предлагает шаблоны для создания персонажей и музыкальных клипов.

 Источник изображений: OpenArt

Источник изображений: OpenArt

Пользователи могут выбрать один из трёх шаблонов: «Влог персонажа» (Character Vlog), «Музыкальное видео» (Music Video) или «Объяснение» (Explainer). Для генерации контента применяются более 50 ИИ-моделей, включая DALL·E 3, GPT, Imagen, Flux Kontext и Stable Diffusion. Если, например, загружается песня, алгоритм проанализирует её текст и создаст анимацию в соответствии с тематическим содержанием. После генерации ролик можно редактировать в режиме раскадровки, корректируя промпты для отдельных сцен.

Однако тестирование сервиса журналистами TechCrunch выявило потенциальные риски, связанные с нарушением прав интеллектуальной собственности. В частности, в режиме Character Vlog возможна генерация образов, схожих с такими персонажами, как Пикачу, Спанч Боб и Марио. Стоит отметить, что недавно, в июне, Disney и Universal подали в суд на компанию Midjourney, занимающуюся разработкой искусственного интеллекта, из-за изображений, созданных с помощью ИИ.

Генеральный директор OpenArt Коко Мао (Coco Mao) отметила, что используемые модели по умолчанию блокируют запросы с защищёнными персонажами, но в отдельных случаях такие образы всё же могут быть сгенерированы. Также компания заявила о готовности к переговорам с крупными правообладателями о лицензировании контента.

OpenArt работает по кредитной системе: базовый тариф стоит $14 в месяц и включает 4000 кредитов, за которые можно создать до четырёх One-Click Story, 40 видео, 4000 изображений и использовать до четырёх персонажей. Расширенный тариф стоит $30 в месяц за 12 000 кредитов и включает до 12 историй One-Click Story. Тариф Infinite стоит $56 в месяц за 24 000 кредитов; также доступен командный тариф — $35 в месяц с участника.

Сервис ориентирован как на создание развлекательного контента для TikTok и YouTube, так и на образовательные ролики или рекламу. На данный момент компания привлекла $5 млн от Basis Set Ventures и DCM Ventures, имеет положительный денежный поток и прогнозирует годовой объём выручки свыше $20 млн.

Бывший инженер OpenAI раскрыл, каково это — работать в компании мечты

Бывший инженер OpenAI и сооснователь Segment Калвин Френч-Оуэн (Calvin French-Owen), работавший над одним из самых перспективных продуктов компании — Codex, поделился в своём блоге впечатлением от года работы в OpenAI. Его рассказ раскрывает картину быстрого роста, внутреннего хаоса, бессонных ночей и неожиданной свободы.

 Источник изображения: AI

Источник изображения: AI

Френч-Оуэн описал стремительный рост компании — за год её штат увеличился с 1000 до 3000 сотрудников, что, по его словам, привело к внутреннему хаосу, начиная от коммуникации и заканчивая процессами найма и выпуска продуктов. В то же время культура компании остаётся похожей на стартап: сотрудники могут быстро реализовывать свои идеи, хотя это иногда и приводит к дублированию усилий. Например, Френч-Оуэн отметил, что видел по несколько библиотек для одних и тех же задач, таких как управление очередями.

Уровень программистов варьируется от опытных инженеров Google, способных писать код для миллиардов пользователей, до свежих PhD-выпускников без подобного опыта. Однако в сочетании с гибкостью языка программирования Python это превращало основной код OpenAI в своеобразную «свалку», где что-то постоянно ломалось или работало слишком медленно. Впрочем, руководство осознаёт проблему и пытается её решить.

Френч-Оуен сравнил OpenAI с Meta✴ времён раннего Facebook✴ — та же скорость и готовность идти на риск. Например, команда из восьми инженеров, четырёх исследователей, двух дизайнеров и маркетологов смогла создать и запустить Codex всего за семь недель, почти без перерывов на сон. Но успех превзошёл ожидания: продукт мгновенно привлёк пользователей, просто появившись в боковой панели ChatGPT. При этом Френч-Оуэн отмечает, что OpenAI остаётся крайне закрытой компанией, болезненно реагирующей на различные утечки.

Также была затронута тема безопасности ИИ. Вопреки мнению критиков, OpenAI не игнорирует риски, но фокусируется не на апокалиптических сценариях, а на практических проблемах, например борьбе с разжиганием ненависти, оскорблениями, манипуляциями, вредоносными запросами и другими опасными инструкциями. Долгосрочные угрозы тоже изучаются, особенно с учётом того, что сотни миллионов людей используют ChatGPT для медицинских консультаций или психологической поддержки.

Френч-Оуэн подчеркнул, что ушёл не из-за каких-либо конфликтов или «драмы», а потому что хочет вернуться к роли сооснователя стартапа. Ранее он вместе с партнёрами создал Segment — стартап в сфере управления клиентскими данными, который был приобретён Twilio в 2020 году за $3,2 млрд.

Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки

Alibaba представила ИИ нового поколения, который существенно упростит пользователям создание и редактирование изображений на основе текстов и визуальных материалов. Модель, получившая название Qwen VLo, станет частью серии ИИ-сервисов под брендом Qwen и позволит не только генерировать изображения по текстовым запросам, но и модифицировать уже существующие.

 Источник изображения: Copilot

Источник изображения: Copilot

Как сообщает Bloomberg, новая модель не только анализирует данные, но и способна на их основе генерировать высокачественные изображения. Например, пользователь может ввести текстовой запрос, а после генерации попросить добавить какие-либо детали, например, шляпу для кота. Также можно загрузить готовое изображение и «дорисовать» его.

Одной из ключевых особенностей Qwen VLo является технология прогрессивной генерации, при которой пользователь может наблюдать за процессом создания изображения шаг за шагом. Например, можно отправить запрос «Создай картинку милого кота», и система начнёт формировать изображение прямо на глазах.

В своём блоге компания также отметила, что новая версия модели не просто «воспринимает окружающий мир, но и способна создавать высококачественные реконструкции на основе этого восприятия». Это соотносится с тем, что ранее генеральный директор компании Эдди Ву (Eddie Wu) заявлял, что основной целью Alibaba на текущий момент является разработка сильного искусственного интеллекта (AGI), который будет обладать уровнем развития человека.

Модель Qwen VLo позиционируется как конкурентный ответ на другие решения рынка, включая продукты OpenAI. Однако Alibaba также сталкивается с агрессивной конкуренцией внутри Китая, например, со стороны DeepSeek, которая произвела в индустрии фурор, заявив о создании мощной модели всего за несколько миллионов долларов. В ответ компания Alibaba ещё активнее стала добавлять новые функции для обработки текстов, изображений, аудио и видео, также оптимизируя модель и для работы на смартфонах.

Runway готовит платформу для создания игр с помощью ИИ

ИИ-стартап Runway, чья оценочная стоимость составляет $3 млрд, намерен расширить горизонты своего влияния. После крупного успеха нейросети в киноиндустрии, компания планирует запустить платформу для генерации видеоигр.

 Источник изображения: Runway

Источник изображения: Runway

По словам генерального директора компании Кристобаля Валенсуэлы (Cristóbal Valenzuela), первые пользователи смогут протестировать новый продукт уже на следующей неделе. Пока это просто минималистичный интерфейс, позволяющий взаимодействовать с моделью в текстовом чате и создавать изображения, но в дальнейшем появится возможность генерировать полноценные игры, сообщает The Verge.

Runway в настоящий момент активно ведёт переговоры с крупными игровыми студиями о внедрении своих технологий в производственные процессы и о доступе к их базам данных для обучения моделей. По мнению Валенсуэлы, игровая индустрия сейчас находится примерно в той же точке, в которой находилась киноиндустрия пару лет назад, когда впервые столкнулась с применением ИИ в процессе создания контента. Тогда тоже наблюдалось немалое сопротивление, но со временем ИИ-технологии начали активно внедряться в работу. Глава Runway уверен, что сейчас процесс принятия ИИ в играх будет происходить быстрее.

Компания уже имеет опыт сотрудничества с крупнейшими игроками развлекательного рынка. Например, её технологии применялись при производстве сериала Amazon «Дом Дэвида», также продолжается сотрудничество почти со всеми голливудскими студиями и большинством компаний из списка Fortune 100. Валенсуэла считает, что если Runway может помочь студии ускорить производство фильма на 40 процентов, то аналогичный эффект возможен и в разработке игр.

«Бездонная яма плагиата»: Disney и Universal подали в суд на Midjourney из-за ИИ

Кинокомпании Disney и Universal подали иск против Midjourney, обвинив сервис в создании копий их персонажей с помощью искусственного интеллекта (ИИ). Иск, поданный в федеральный суд Центрального округа Калифорнии, касается генерации изображений таких персонажей, как Шрек, Дарт Вейдер, Базз Лайтер и других защищённых авторским правом известных героев.

 Источник изображений: theverge.com

Источник изображений: theverge.com

В заявлении говорится, что Midjourney действует как «виртуальный торговый автомат», производя бесконечные незаконные копии их работ. По мнению истцов, сервис сознательно использует популярных персонажей для продвижения своих инструментов, не вкладывая средств в их создание. В качестве примеров приведены изображения инопланетянина Йоды — одного из главных героев «Звёздных войн», Человека-паука, Эльзы из «Холодного сердца» и персонажей из «Миньонов».

Disney и Universal утверждают, что Midjourney игнорирует их требования прекратить нарушение авторских прав, в отличие от других сервисов ИИ, которые внедрили защитные механизмы. Особую обеспокоенность вызывает готовящийся к выпуску видеогенератор Midjourney, который, по мнению студий, уже сейчас может нарушать их права в связи с обучением ИИ на защищённом авторском контенте. Компании потребовали суда присяжных.

Как отмечает издание The Verge, это первый крупный иск Голливуда против генеративного ИИ, однако подобные судебные разбирательства становятся все более частыми. Ранее с исками к OpenAI, создателю ChatGPT, обращались The New York Times, группа авторов во главе с Джорджем Мартином (George R.R. Martin), а также издатели других газет. На компанию Anthropic, разработавшую чат-бот Claude, подали иски компании Universal Music и Reddit.


window-new
Soft
Hard
Тренды 🔥
OpenAI договорилась об использовании своих ИИ-моделей Пентагоном вместо Anthropic 2 ч.
Сотни сотрудников Google и OpenAI поддержали Anthropic в противостоянии с Пентагоном 3 ч.
Новая статья: 30 лет Resident Evil: юбилейное путешествие по играм серии. Часть 1 10 ч.
Аудитория ChatGPT разрослась до 900 млн пользователей в неделю 12 ч.
Борьба со спойлерами вышла на новый уровень: в Китае арестовали видных датамайнеров Genshin Impact 12 ч.
«Дешёвая пародия с YouTube»: фанаты не оценили первый кадр из сериала God of War от Amazon 14 ч.
OpenAI раздулась до $840 млрд — создатель ChatGPT привлёк $110 млрд от Amazon, Nvidia и Softbank 15 ч.
Мультиплеерный экшен Spellcasters Chronicles от создателей Heavy Rain и Detroit: Become Human оказался в раннем доступе Steam почти никому не нужен 15 ч.
Женщина в суде обвинила Instagram и YouTube в том, что она не может оторваться от соцсетей 16 ч.
Sony прокачала апскейлер PSSR для PS5 Pro, но пока только в Resident Evil Requiem 16 ч.