Сегодня 25 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia представила ИИ-модель Fugatto, которая «понимает и генерирует звук, как это делают люди»

Nvidia представила новую экспериментальную генеративную модель ИИ, которую компания описывает как «швейцарский армейский нож для звука». Модель Fugatto (Foundational Generative Audio Transformer Opus 1) использует текстовые подсказки для генерации новых или изменения существующих музыкальных, голосовых и звуковых файлов. В создании модели принимали участие разработчики со всего мира, что усилило «многоакцентные и многоязычные возможности модели».

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Мы хотели создать модель, которая понимает и генерирует звук, как это делают люди», — рассказал участник проекта и менеджер по прикладным исследованиям звука в Nvidia Рафаэль Валле (Rafael Valle). Компания предложила несколько сценариев, в которых модель Fugatto может оказаться востребованной:

  • Музыкальные продюсеры могут быстрого создать прототип песни, которую легко редактировать, пробуя разные стили, голоса и инструменты.
  • Fugatto может использоваться при создании инструментов для изучения языка с выбором наиболее подходящего голоса.
  • Разработчики видеоигр могут использовать её для создания вариаций предварительно записанных ресурсов, чтобы соответствовать изменениям в игре на основе выбора и действий игроков.

Исследователи утверждают, что модель при некоторой дополнительной тонкой настройке также может выполнять задачи, не входившие в её предварительное обучение. Модель может объединять отдельные инструкции, например, генерировать речь с определёнными интонациями и акцентом или звук пения птиц во время грозы. Модель также умеет генерировать изменяющиеся со временем звуки, например, шум приближающегося ливня или удаляющегося поезда.

Fugatto не является первой технологией генеративного ИИ, которая может создавать звуки из текстовых подсказок. Ранее Meta выпустила аналогичную модель ИИ с открытым исходным кодом. Google предлагает ИИ-инструмент собственной разработки для преобразования текста в музыку MusicLM, доступ к которому можно получить через сайт компании AI Test Kitchen.

Nvidia пока не предоставила публичный доступ к Fugatto и воздержалась от комментариев на этот счёт.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хакеры научились проникать на ПК через поддельный экран «Центра обновления Windows» 15 мин.
Культовый хоррор Cold Fear в духе Resident Evil 4 вернулся из цифрового небытия в улучшенном виде и с полным переводом на русский 52 мин.
Появились первые намёки, во что превратятся Android и ChromeOS после слияния 2 ч.
«Стресс-тест не только серверов, но и наших мозгов с нервами»: режиссёр Escape from Tarkov подвёл итоги недели с релиза и раскрыл, что ждёт игру дальше 3 ч.
Adobe запустила раздачу годовой подписки на Photoshop Web — россияне тоже могут её получить 3 ч.
Ubisoft анонсировала дерзкий и «дико интересный» сериал Far Cry от создателей «Фарго» и «В Филадельфии всегда солнечно» 3 ч.
Конец эпохи Windows 10 спровоцировал миграцию пользователей на Linux 4 ч.
Google вернула себе трон ИИ: Gemini 3 разгромила конкурентов в тестах 6 ч.
Стример взялся проходить Minecraft на принтере, который печатает новый кадр раз в две секунды 6 ч.
Yandex B2B Tech открыла доступ к Alice AI LLM — самому мощному семейству нейросетей «Яндекса» 7 ч.
Huawei представила гибридный планшет MatePad Edge — 14,2" OLED, ПК-процессор и батарея на 12 900 мА·ч от $845 20 мин.
Финляндия создаст крупнейший в мире тепловой аккумулятор из целой горы песка 2 ч.
Японский конкурент TSMC начнёт строительство 1,4-нм фабрики чипов в 2027 году 2 ч.
Framework перестала продавать модули памяти из-за перекупщиков и предупредила о повышении цен 3 ч.
TSMC подала в суд на бывшего топ-менеджера, который переметнулся в Intel 3 ч.
Акции Nvidia обвалились на 4 % из-за слухов о том, что Meta нацелилась на ИИ-чипы Google 3 ч.
«Алиса, открой шторы»: «Яндекс» показал множество гаджетов для умного дома 3 ч.
Компьютеры в России вот-вот снова подорожают — закупочные цены уже выросли на 5–10 % из-за кризиса памяти 3 ч.
JBOG-массив OpenYard HG402 допускает установку восьми GPU 3 ч.
Нехватка ИИ-мощностей и проблемы с производительностью вынудили многих клиентов AWS обратиться к конкурентам 4 ч.