Сегодня 02 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила AudioCraft — генератор музыки и шума на основе искусственного интеллекта

Meta представила ИИ-генератор музыки AudioCraft с открытым исходным кодом, который создаёт аудио, полностью основываясь на текстовом запросе пользователя. AudioCraft объединяет три отдельные модели ИИ: MusicGen предназначена для создания музыки и обучена на «20 000 часов музыки, принадлежащей Meta или лицензированной специально для этой цели», AudioGen генерирует звуки и эффекты окружающей среды, а EnCodec обеспечивает качественную обработку звука.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Музыканты давно экспериментируют с электронным звуком, но компьютерные программы создают музыку на основе существующих звуковых сэмплов. Аудио от AudioCraft генерируется лишь из текстовой подсказки. Meta предоставила журналистам образцы аудио, сгенерированного при помощи AudioCraft. Шумовые эффекты, такие как свист, ветер, вой сирен и автомобильные сигналы звучали весьма достоверно. А вот гитарные партии показались слушателям неестественными.

Сейчас музыка, сгенерированная AudioCraft, больше всего напоминает muzak (слегка пренебрежительный термин, применяемый для большинства форм фоновой музыки, независимо от источника, «музыка для лифта») или непритязательный атмосферный эмбиент, и не претендует на роль следующего большого поп-хита. Тем не менее, Meta считает, что AudioCraft может открыть новую волну музыкальной моды, как это когда-то сделали первые синтезаторы.

Meta признала сложность создания моделей ИИ для генерации музыки, по утверждению представителя компании эта задача на несколько порядков труднее, чем генерация текста при помощи ИИ, подобного Llama 2. Компания полагает, что открытый исходный код AudioCraft поможет разнообразить данные, используемые для его обучения.

«Мы понимаем, что наборы данных, используемые для обучения наших моделей, не отличаются разнообразием: большая часть музыки в западном стиле, пары аудио-текст с текстом и метаданными написаны на английском языке, — пояснил представитель Мета. — Поделившись кодом для AudioCraft, мы надеемся, что другим исследователям будет легче тестировать новые подходы к ограничению или устранению потенциальной предвзятости и неправильного использования генеративных моделей».

Meta — далеко не пионер в области генерации аудио при помощи ИИ. Большая языковая модель MusicLM от Google вполне успешно генерирует аудио, правда доступна она только исследователям. Сгенерированная ИИ песня с голосовым сходством Drake и The Weeknd мгновенно стала вирусной. Недавно Граймс (Grimes) разрешила использовать имитацию своего голоса в треках ИИ. В свою очередь, звукозаписывающие лейблы и артисты уже забили тревогу, поскольку многие модели ИИ могут использовать для обучения материалы, защищённые авторским правом.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Базис» и Татарстан создадут импортонезависимую облачную инфраструктуру для госсервисов и бизнеса республики 7 мин.
Надёжный инсайдер: Ubisoft дала зелёный свет The Crew 4 27 мин.
«Базис» и СберТех обеспечат бизнесу удобную и устойчивую инфраструктуру 37 мин.
Java отметила 30-летие — это по-прежнему один из популярнейших языков программирования 2 ч.
«Если будем распыляться, у нас ничего не выйдет»: CD Projekt останется верна большим RPG вроде The Witcher 4 и Cyberpunk 2, несмотря на соблазны 2 ч.
Выручка ИИ-стартапа Anthropic достигла $3 млрд в годовом выражении, но до OpenAI ещё далеко 3 ч.
Разработчик Bulletstorm и Gears of War: E-Day остановил производство двух секретных игр — в People Can Fly пройдут новые увольнения 4 ч.
Грядущая конференция Apple WWDC для разработчиков будет скудна на новости в сфере ИИ 8 ч.
Valorant получит долгожданный просмотр сыгранных матчей и переедет на Unreal Engine 5 до конца 2025 года 13 ч.
На долю взлома аккаунтов на «Госуслугах» приходится 90 % от общего числа преступлений с неправомерным доступом к данным 01-06 07:04
Представлены ленточные приводы и картриджи LTO-10 ёмкостью до 75 Тбайт 13 мин.
Минцифры урезало госфинансирование отечественных базовых станций: из 46 млрд рублей осталось только 20 млрд 19 мин.
Вышла плата Banana Pi BPI-R4 Pro для маршрутизаторов с Wi-Fi 7, 2.5/10GbE-портами и пятью слотами M.2 47 мин.
Принадлежащая Alibaba турецкая Trendyol Group построит ЦОД на 48 МВт в Анкаре 50 мин.
Blue Origin свозила на границу космоса ещё шесть туристов на ракете New Shepard 3 ч.
Новая статья: Сравнительный тест камер флагманских смартфонов (2025): Apple iPhone 16 Pro Max, HONOR Magic 7 Pro, HUAWEI Mate 70 Pro, Samsung Galaxy S25 Ultra, vivo X200 Pro, Xiaomi 15 Ultra 11 ч.
Новая статья: Тест-драйв российского электромобиля «Атом»: гибрид «Оки» и Tesla 13 ч.
Трамп отозвал кандидатуру Джареда Айзекмана на пост главы NASA — в этом замешан Илон Маск 20 ч.
США готовят полный запрет продаж коммерческих дронов DJI и других китайских производителей 20 ч.
xMEMS готовит ультразвуковые кулеры µCooling для E3.S и M.2 SSD 23 ч.