Сегодня 12 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → elevenlabs

ElevenLabs запустила ИИ-генератор звуковых эффектов по текстовому описанию

ElevenLabs представила AI Sound Effects, инструмент на базе генеративного ИИ, способный по текстовому запросу генерировать различные звуковые эффекты. По словам ElevenLabs, при обучении ИИ-модели и создании библиотек она сотрудничала с медиаплатформой Shutterstock. Последняя предоставила лицензии на использование материалов из библиотеки контента многим компаниям ИИ-индустрии, включая OpenAI, Meta и Google.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

ElevenLabs уже предлагает пользователям созданные с помощью ИИ версии человеческих голосов для озвучивания текстов и исполнения музыки. А новый инструмент поможет создавать звуковые эффекты для подкастов, фильмов или игр, включая взрывы, плеск воды и т.д. Сообщается, что AI Sound Effects может генерировать звуковые эффекты продолжительностью до 22 секунд на основе подсказок пользователя. Их можно комбинировать с голосовой и музыкальной платформой компании. Сервис предоставляет пользователям как минимум четыре варианта загружаемых аудиоклипов.

Sound Effects предоставляется бесплатно и на коммерческой основе. При бесплатном доступе пользователю устанавливается лимит в 10 000 символов, и он должен ссылаться при публикации клипа на ElevenLabs, добавив в заголовок elevenlabs.io. При платном доступе клиенты смогут использовать сгенерированные аудиоклипы как угодно, получив коммерческую лицензию.

В случае создания звуковых эффектов пользователю будет взиматься 40 символов за секунду аудио, если он сам установит продолжительность аудиоклипа. При продолжительности звукового эффекта по умолчанию за каждый запрос будет взиматься плата в размере 200 символов.

На рынке уже есть библиотеки с клипами со звуковыми эффектами для нужд авторов, режиссёров и разработчиков видеоигр. Но их тарифы зачастую очень высоки, и нередко возникают проблемы с подбором нужного типа звука. ElevenLabs сообщила в блоге, что разработала Sound Effects «для быстрого, доступного и масштабного создания насыщенных и захватывающих звуковых ландшафтов».

Похожие решения уже предлагают другие ИИ-разработчики. В прошлом году Stability AI выпустила Stable Audio для создания аудиоклипов с музыкальными треками и звуковыми эффектами, а ИИ-модели Meta AudioCraft генерируют естественный звук, например, фоновый шум, такой как ветер или движение транспорта.

ElevenLabs обучила ИИ создавать звуковые эффекты для видео

На минувшей неделе OpenAI представила модель искусственного интеллекта Sora, обученную генерировать реалистичные видеоролики по текстовому описанию. Стартап ElevenLabs предложил собственное решение Sound Effects для наложения звуковых эффектов на такие ролики.

 Источник изображения: youtube.com/@elevenlabsio

Источник изображения: youtube.com/@elevenlabsio

Компанию ElevenLabs основали в 2022 году бывший инженер Google по машинному обучению Пётр Дабковски (Piotr Dabkowski) и бывший специалист Palantir по стратегии внедрения Мати Станишевски (Mati Staniszewski). Компания выпустила модель по преобразованию текста в речь и дублированного перевода на 20 языков с сохранением оригинального тона и тембра голоса.

Новый проект ElevenLabs получил название Sound Effects — он предназначается для создания звуковых эффектов для лишённых звука видеороликов; звук генерируется по текстовому описанию. Работу очередной ИИ-модели компания продемонстрировала на примере роликов, созданных нейросетью OpenAI Sora. Для этого использовались простые описания вроде «шум волн», «звон металла», «чириканье птиц» и «двигатель гоночной машины».

ElevenLabs не раскрыла технических подробностей, касающихся работы ИИ-системы, но результаты работы новой модели вполне убедительны — фоновые звуки получились реалистичными: городской шум, шаги на оживлённой улице, сигналы человекоподобного робота и закадровый текст, который как будто читает голливудский актёр. Компании ещё предстоит рассказать, как она планирует защитить свой проект от попыток недобросовестного использования — ElevenLabs Sound Effects может заинтересовать мошенников.


window-new
Soft
Hard
Тренды 🔥
Anthropic научила чат-бота Claude припоминать старые диалоги с пользователем 17 мин.
Анонсирована корейская Black Myth: Wukong — фэнтезийный AAA-экшен Woochi the Wayfarer по мотивам классического романа 31 мин.
Илон Маск пригрозил Apple «незамедлительным» иском за занижение рейтинга Grok в App Store 2 ч.
Telegram заблокировал сотни каналов за мошенничество и шантаж 2 ч.
Telegram дважды за день оштрафовали в России за неудаление запрещённых материалов 3 ч.
США конфисковали серверы и $1 млн в биткоинах у хакеров-вымогателей BlackSuit 3 ч.
Эксперты надеются, что Трамп разберётся с Microsoft из-за её халатного отношения к безопасности 5 ч.
Изучай, расширяй, эксплуатируй, уничтожай: в Steam стартовал фестиваль 4X-стратегий, а Endless Legend 2 получила временную демоверсию 14 ч.
У DeepSeek произошёл масштабный сбой — регистрация новых пользователей ограничена 14 ч.
Microsoft начала тестировать облачные ПК для аварийной замены обычных через Windows 365 14 ч.
С начала года «Россети Московский регион» выявили более 145 тыс. нелегальных ВОЛС 29 мин.
Apple может выдохнуть: Трамп отложил 145-процентные пошлин на товары из Китая до ноября 46 мин.
InnoGrit выпустила SSD N3X со сверхнизкой задержкой для ИИ-систем 2 ч.
В 10 раз дешевле замены: CATL начала оказывать услуги по ремонту тяговых батарей в Китае 2 ч.
YADRO лидирует по показателю лояльности среди отечественных производителей серверов и СХД 2 ч.
Скидки и заканчивающиеся льготы оживили рынок электромобилей в США — продажи Tesla и других выросли на 20 % в июле 3 ч.
Японцы открыли «противоречивую» молекулу для улучшения экранов OLED и медицинских подкожных сканеров 4 ч.
Власти рекомендуют китайским компаниям избегать использования ускорителей Nvidia H20 4 ч.
На фоне бума ИИ компания Micron решилась улучшить свой квартальный прогноз 5 ч.
Дань в 15 % позволит Nvidia наладить поставки в Китай более продвинутых чипов с архитектурой Blackwell 7 ч.