Сегодня 23 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google Gemini научился генерировать 30-секундные музыкальные треки по описанию и картинкам

Бета-доступ к модели Lyria 3 входящей в состав Google лаборатории DeepMind позволил пользователям чат-бота Gemini создавать короткие 30-секундные музыкальные композиции на основе текстовых описаний, изображений и видеороликов, при этом даже не нужно покидать интерфейс чат-бота.

 Источник изображения: Nvidia

Источник изображения: Nvidia

С этой недели доступ к данному инструменту генерирования музыки получили пользователи Google по всему миру, на первом этапе поддерживаются запросы и результаты на английском, немецком, испанском, французском, японском, корейском и португальском языках, а также хинди. Запросы в этом сервисе могут упоминать как конкретные музыкальные стили, так и эмоциональный настрой, либо какие-то типичные жизненные ситуации. Сервис позволяет генерировать как инструментальные композиции, так и произведения с вокалом на текст, предложенный пользователем. Для более точного результата с точки зрения формируемого настроения пользователь может прилагать к текстовому запросу фотографии или видеоролики.

Google подчёркивает, что подобный инструмент не направлен на создание музыкальных шедевров, а в большей мере ориентирован на развлечение и самовыражение пользователей. Для более удобного распространения созданных 30-секундных музыкальных композиций Google будет снабжать их обложками, сгенерированными при помощи Nano Banana. Эти композиции также можно будет использовать совместно с инструментом Dream Track, который позволяет сопровождать публикуемые в YouTube короткие видеоролики музыкой независимых авторов. Учитывая предыдущий опыт внедрения средств генерирования музыки при помощи ИИ, компания Google в модели Lyria 3 предусмотрела механизмы защиты от слепого копирования произведений конкретных авторов и голосов определённых исполнителей. Lyria существует с 2023 года, но доступ к ней был ограничен облачной платформой Google Vertex. Интеграция подобных возможностей в Google Gemini делает инструмент для генерирования музыки более доступным, но в этой сфере компания отстаёт по графику от многих конкурентов типа TikTok и Microsoft.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Пришло время снова поднять чёрный флаг!»: Ubisoft наконец анонсировала Assassin’s Creed Black Flag Resynced 10 мин.
Релиз «Кибер Бэкап» 18.5: многопоточность, поддержка LDAPS, расширенная интеграция с Kubernetes и многое другое 13 мин.
Евросоюз принуждает Google открыть Android для конкурентов Gemini 26 мин.
«Крупнейший рынок в истории человечества»: SpaceX оценила свой потенциал в $28,5 трлн, из которых 97 % — не космос, а ИИ 57 мин.
Первое сюжетное дополнение к Vampire: The Masquerade — Bloodlines 2 даст почувствовать себя шерифом вампиров — трейлер и дата выхода Loose Cannon 2 ч.
Тим Кук рассказал, какой была его первая большая ошибка на посту главы Apple 3 ч.
«Белый список» пополнили сайты и приложения банков, доставки, магазинов и волонтёрских организаций 3 ч.
BioWare слишком занята, чтобы показывать новую Mass Effect 3 ч.
ЦСР: В 2025 году российский рынок СУБД превысил 100 млрд руб. 3 ч.
«Игра года грядёт»: релизный трейлер научно-фантастического экшена Saros игроки встретили с восторгом 3 ч.
Honor представила конкурентов MacBook Air — MagicBook X14 Plus и X16 Plus с Intel Panther Lake и дисплеями 120 Гц 2 ч.
Honor представила мощный игровой ноутбук Win H9 с шестёркой вентиляторов для тихой работы 2 ч.
Илону Маску придётся вернуть Tesla $29 млрд чтобы получить давнюю премию в $56 млрд 2 ч.
Китай оценил мощность своей ИИ-инфраструктуры — оценки США были ниже в 6000 раз 2 ч.
Marvell приобрела Polariton, разработчика решений в области плазмоники 3 ч.
Эпоха возрождения компьютерных клубов в России: обороты выросли почти в 40 раз за пять лет и продолжают расти 3 ч.
NASA разгонит спрос на GPU среди учёных из-за лавины данных с новых телескопов 3 ч.
Беспилотный тягач Navio проехал по России 2800 км без водителя в кабине 4 ч.
ИИ-агент спроектировал полноценный процессор на RISC-V за 12 часов — промпт содержал всего 219 слов 4 ч.
DJI представила дроны для начинающих Lito 1 и X1 — 4К и автономность до 36 минут по цене от €309 4 ч.