Сегодня 04 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ElevenLabs обучила ИИ создавать звуковые эффекты для видео

На минувшей неделе OpenAI представила модель искусственного интеллекта Sora, обученную генерировать реалистичные видеоролики по текстовому описанию. Стартап ElevenLabs предложил собственное решение Sound Effects для наложения звуковых эффектов на такие ролики.

 Источник изображения: youtube.com/@elevenlabsio

Источник изображения: youtube.com/@elevenlabsio

Компанию ElevenLabs основали в 2022 году бывший инженер Google по машинному обучению Пётр Дабковски (Piotr Dabkowski) и бывший специалист Palantir по стратегии внедрения Мати Станишевски (Mati Staniszewski). Компания выпустила модель по преобразованию текста в речь и дублированного перевода на 20 языков с сохранением оригинального тона и тембра голоса.

Новый проект ElevenLabs получил название Sound Effects — он предназначается для создания звуковых эффектов для лишённых звука видеороликов; звук генерируется по текстовому описанию. Работу очередной ИИ-модели компания продемонстрировала на примере роликов, созданных нейросетью OpenAI Sora. Для этого использовались простые описания вроде «шум волн», «звон металла», «чириканье птиц» и «двигатель гоночной машины».

ElevenLabs не раскрыла технических подробностей, касающихся работы ИИ-системы, но результаты работы новой модели вполне убедительны — фоновые звуки получились реалистичными: городской шум, шаги на оживлённой улице, сигналы человекоподобного робота и закадровый текст, который как будто читает голливудский актёр. Компании ещё предстоит рассказать, как она планирует защитить свой проект от попыток недобросовестного использования — ElevenLabs Sound Effects может заинтересовать мошенников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Дождались: 15 лет спустя Meta выпустила полноценное приложение Instagram для iPad 6 ч.
Старые Pixel получили новый интерфейс Material 3 Expressive и свежие ИИ-функции Google 6 ч.
Буквально одно слово в решении суда спасло сделку Apple и Google на $20 млрд в год 6 ч.
В Android закрыли уязвимость, позволявшую захватить контроль над смартфоном через Bluetooth или Wi-Fi 6 ч.
«007 кадров», 30 минут геймплея и дата выхода: Sony устроила демонстрацию шпионского боевика 007 First Light от создателей Hitman 7 ч.
Браузер Chrome обновился до 140-й версии — закрыты шесть уязвимостей, включая критическую 8 ч.
«Наслаждайтесь последними днями покоя»: перезапуск Painkiller не выйдет 9 октября 10 ч.
Акции Google резко подорожали после того, как компания увернулась от принудительной продажи Chrome 11 ч.
«С возвращением, Crazy Taxi»: стартовавший в раннем доступе симулятор CyberTaxi: Lunatic Nights напомнил игрокам о легендарной серии аркад 13 ч.
Легендарный шутер Quake III Arena стал доступен в браузерах — бесплатно, без регистраций, смс и рекламы 13 ч.
В Москве начал работать первый в России беспилотный трамвай — он перевозит пассажиров по маршруту №10 6 ч.
Новая статья: ИИтоги июля 2025 г.: прорывы и последствия 6 ч.
Рынок коммерческих ЦОД в России показал антирекорд по приросту стойко-мест 7 ч.
Lexar выпустила комплекты памяти Thor RGB DDR5 2nd Gen — до 128 Гбайт и до 6400 МТ/с 9 ч.
Intel выпустила профессиональную видеокарту Arc B50 начального уровня за $349 10 ч.
Acer показала первый ноутбук на Intel Panther Lake — Swift 16 AI с гигантским тачпадом 11 ч.
Garmin представила смарт-часы Fenix 8 Pro с поддержкой сотовой и спутниковой связи, но есть нюанс 11 ч.
Прототип орбитального ЦОД Axiom Space и Red Hat для экспериментов с периферийными вычислениями прибыл на МКС 12 ч.
TSMC отвергла слухи, что Дженсен Хуанг пытался на неё надавить от имени Трампа 13 ч.
«К2 НейроТех» представил ПАК-AI 2.0 с увеличенной на 30 % производительностью 13 ч.