Сегодня 26 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ElevenLabs обучила ИИ создавать звуковые эффекты для видео

На минувшей неделе OpenAI представила модель искусственного интеллекта Sora, обученную генерировать реалистичные видеоролики по текстовому описанию. Стартап ElevenLabs предложил собственное решение Sound Effects для наложения звуковых эффектов на такие ролики.

 Источник изображения: youtube.com/@elevenlabsio

Источник изображения: youtube.com/@elevenlabsio

Компанию ElevenLabs основали в 2022 году бывший инженер Google по машинному обучению Пётр Дабковски (Piotr Dabkowski) и бывший специалист Palantir по стратегии внедрения Мати Станишевски (Mati Staniszewski). Компания выпустила модель по преобразованию текста в речь и дублированного перевода на 20 языков с сохранением оригинального тона и тембра голоса.

Новый проект ElevenLabs получил название Sound Effects — он предназначается для создания звуковых эффектов для лишённых звука видеороликов; звук генерируется по текстовому описанию. Работу очередной ИИ-модели компания продемонстрировала на примере роликов, созданных нейросетью OpenAI Sora. Для этого использовались простые описания вроде «шум волн», «звон металла», «чириканье птиц» и «двигатель гоночной машины».

ElevenLabs не раскрыла технических подробностей, касающихся работы ИИ-системы, но результаты работы новой модели вполне убедительны — фоновые звуки получились реалистичными: городской шум, шаги на оживлённой улице, сигналы человекоподобного робота и закадровый текст, который как будто читает голливудский актёр. Компании ещё предстоит рассказать, как она планирует защитить свой проект от попыток недобросовестного использования — ElevenLabs Sound Effects может заинтересовать мошенников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Боузер прощается с Грибным королевством: президент Nintendo of America уйдёт в отставку, чтобы освободить место «руководству нового поколения» 39 мин.
OpenAI анонсировала ChatGPT Pulse — ИИ-агента, который следит за пользователем постоянно 2 ч.
Трамп одобрил сделку по американскому TikTok — сервис оценили всего в $14 млрд, но это не точно 12 ч.
Starbreeze извинилась за вероломное повышение цены сборника Infamous Collection с DLC для Payday 2 и отменила подорожание 15 ч.
Кроссплатформенная поддержка модов для The Witcher 3: Wild Hunt не выйдет в 2025 году — CD Projekt Red отложила горячо ожидаемое обновление 16 ч.
Подростковые аккаунты в Facebook теперь доступны по всему миру — у них повышена приватность и усилен родительский контроль 17 ч.
Hades 2 вырвалась из раннего доступа — критики и пользователи Steam оценили игру на 94 % 17 ч.
Selectel запустила программу OpenFix по работе с открытым кодом за вознаграждение 18 ч.
Эффектный геймплейный трейлер раскрыл дату выхода амбициозного корейского боевика Crimson Desert — предзаказ доступен в российском Steam 18 ч.
В App Store завирусилось приложение Neon — людям платят за записи их телефонных разговоров 19 ч.
Стартап FuriosaAI представил ИИ-сервер NXT RNGD с производительностью 4 Пфлопс 2 ч.
Пинки, увечья и коллективный разум: представлен радикальный, но действенный метод обучения ИИ для роботов 2 ч.
Портативный Xbox оказался дороже, чем домашние Series X и Series S вместе — есть вариант подешевле 2 ч.
Media Stream AI построит в Манчестере 2-МВт ИИ ЦОД с охлаждением водой из местного канала 3 ч.
Анонсированы 11,2-дюймовые планшеты Xiaomi Pad 8 и Pad 8 Pro на чипах Snapdragon и по цене от $308 3 ч.
Вашингтон под угрозой пошлин заставит чипмейкеров выпускать 50 % продукции для США в самих США 3 ч.
Сервер хранения AIC SB407-VA допускает установку 60 накопителей LFF SATA/SAS 3 ч.
HYPERPC представила серию премиальных компьютеров Lumen для геймеров, ИИ-разработчиков и 3D-художников 4 ч.
Индустриальный компьютер Biostar EdgeComp MU-N150 на базе Intel Twin Lake выполнен в корпусе объёмом 0,6 л 4 ч.
Подготовка к выпуску iPhone 17 стоила сотрудникам Foxconn ночных смен, переработки и задержки зарплат 4 ч.