Сегодня 15 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → генерация звука

Meta✴ представила AudioCraft — генератор музыки и шума на основе искусственного интеллекта

Meta представила ИИ-генератор музыки AudioCraft с открытым исходным кодом, который создаёт аудио, полностью основываясь на текстовом запросе пользователя. AudioCraft объединяет три отдельные модели ИИ: MusicGen предназначена для создания музыки и обучена на «20 000 часов музыки, принадлежащей Meta или лицензированной специально для этой цели», AudioGen генерирует звуки и эффекты окружающей среды, а EnCodec обеспечивает качественную обработку звука.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Музыканты давно экспериментируют с электронным звуком, но компьютерные программы создают музыку на основе существующих звуковых сэмплов. Аудио от AudioCraft генерируется лишь из текстовой подсказки. Meta предоставила журналистам образцы аудио, сгенерированного при помощи AudioCraft. Шумовые эффекты, такие как свист, ветер, вой сирен и автомобильные сигналы звучали весьма достоверно. А вот гитарные партии показались слушателям неестественными.

Сейчас музыка, сгенерированная AudioCraft, больше всего напоминает muzak (слегка пренебрежительный термин, применяемый для большинства форм фоновой музыки, независимо от источника, «музыка для лифта») или непритязательный атмосферный эмбиент, и не претендует на роль следующего большого поп-хита. Тем не менее, Meta считает, что AudioCraft может открыть новую волну музыкальной моды, как это когда-то сделали первые синтезаторы.

Meta признала сложность создания моделей ИИ для генерации музыки, по утверждению представителя компании эта задача на несколько порядков труднее, чем генерация текста при помощи ИИ, подобного Llama 2. Компания полагает, что открытый исходный код AudioCraft поможет разнообразить данные, используемые для его обучения.

«Мы понимаем, что наборы данных, используемые для обучения наших моделей, не отличаются разнообразием: большая часть музыки в западном стиле, пары аудио-текст с текстом и метаданными написаны на английском языке, — пояснил представитель Мета. — Поделившись кодом для AudioCraft, мы надеемся, что другим исследователям будет легче тестировать новые подходы к ограничению или устранению потенциальной предвзятости и неправильного использования генеративных моделей».

Meta — далеко не пионер в области генерации аудио при помощи ИИ. Большая языковая модель MusicLM от Google вполне успешно генерирует аудио, правда доступна она только исследователям. Сгенерированная ИИ песня с голосовым сходством Drake и The Weeknd мгновенно стала вирусной. Недавно Граймс (Grimes) разрешила использовать имитацию своего голоса в треках ИИ. В свою очередь, звукозаписывающие лейблы и артисты уже забили тревогу, поскольку многие модели ИИ могут использовать для обучения материалы, защищённые авторским правом.


window-new
Soft
Hard
Тренды 🔥
ИИ Google Gemini отказался играть в шахматы с древней приставкой Atari 2600, испугавшись поражения 40 мин.
Rockstar неожиданно устроила раздачу ремастера GTA III в App Store — возможно, по ошибке 57 мин.
Количество утечек данных в России снизилось на 15 %, но проблем по-прежнему хватает 3 ч.
«Базис» реализовал 80 улучшений в новой версии платформы виртуализации Basis Dynamix Enterprise 4.3.0 4 ч.
«Радоваться здесь нечему»: новый патч для The Elder Scrolls IV: Oblivion Remastered не впечатлил экспертов Digital Foundry 4 ч.
Google начала тестировать новую панель поиска в Chrome с акцентом на ИИ 6 ч.
Google, OpenAI, xAI и Anthropic получили контракты Пентагона на сумму до $200 млн каждый 6 ч.
Facebook начнёт блокировать аккаунты за использование некачественного и чужого контента 8 ч.
Один сбитый бит — и всё пропало: атака GPUHammer на ускорители Nvidia ломает ИИ с минимальными усилиями 14 ч.
Механизмы, конвейерные ленты, роботы: в Steam стартовал «Фестиваль автоматизации» со скидками, демоверсиями и не только 14 ч.
Китайский грузовик «Тяньчжоу-9» доставил рекордные 6,5 тонн на орбитальную станцию — и это не предел 5 мин.
Samsung отменила конец эпохи стилусов, пообещав возвращение S Pen в улучшенном виде 15 мин.
NVIDIA возобновит поставки ускорителей H20 в Китай 18 мин.
«Сбер» расширил ассортимент QLED-телевизоров Sber моделями на 32 и 43 дюйма 19 мин.
$20 за терабайт: Seagate начала поставки 30-Тбайт жёстких дисков Exos M и IronWolf Pro 25 мин.
Meta вложит сотни миллиардов долларов в «мультигигаваттные» ИИ ЦОД 29 мин.
Galaxy S26 может получить Exynos 2600 — Samsung LSI заявила о подготовке новых чипов и пообещала «хорошие результаты» 33 мин.
Intel уволит в четыре раза больше сотрудников в Аризоне, чем планировала 56 мин.
Цукерберг потратит сотни миллиардов долларов на создание суперинтеллекта 59 мин.
Массовые отключения интернета в России решено упорядочить — Минцифры обсуждает регламент с операторами 2 ч.