Сегодня 31 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» раскрыл алгоритм распознавания голосовых команд в шумных условиях

Инженеры «Яндекса» опубликовали научную статью, в которой раскрыли принципы работы нейросети, обеспечивающей распознавание голосовых команд в условиях внешнего шума. Компания уже применяет эту технологию, и теперь внедрить её смогут разработчики по всему миру.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

Работа будет представлена на международной конференции по речевым технологиям Interspeech, которая пройдёт с 17 по 21 августа в нидерландском Роттердаме; среди прочих участников мероприятия значатся Microsoft, Google DeepMind и Google AR.

Разработанная специалистами «Яндекса» технология используется в умных колонках и «ТВ Станциях». Она позволяет устройствам с «Алисой» правильно интерпретировать голосовые команды, если что-то пытается этому помешать: играет музыка, шумит вода, гудит вечеринка, или за окном грохочет стройка — система услышит пользователя, даже если он не будет пытаться перекричать песню или не станет выключать пылесос. Используя эту технологию, любая компания сможет повысить качество работы голосового помощника с искусственным интеллектом и уменьшить долю ложных срабатываний.

Если человеческий голос раздаётся на фоне музыки, эффективными считаются алгоритмы эхоподавления; в случае других посторонних источников лучше работает шумоподавление, которое, однако, ухудшает и разборчивость человеческой речи. Поэтому в «Яндексе» разработали attention-механизм на основе нейросетей — на вход ему подаются сразу оба сигнала, с эхо- и шумоподавлением, и система динамически выбирает наиболее чёткий, адаптируясь к звуковому фону от источников разной природы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Обещанная Павлом Дуровым интеграция Grok c Telegram до сих пор не случилась и, похоже, уже никогда не случится 35 мин.
Запустилась соцсеть Moltbook, где общаются только ИИ-агенты — людям разрешили только наблюдать 5 ч.
Google переполошила геймдев: выход ИИ-генератора миров Project Genie уронил акции крупнейших разработчиков 5 ч.
Новая статья: Arknights: Endfield — если бы Satisfactory была китайской гачей. Рецензия 11 ч.
Хардкорный шутер Road to Vostok о выживании на границе Финляндии и России скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер 12 ч.
Россияне стали больше сидеть во «ВКонтакте» и смотреть «VK видео» 13 ч.
Разработчики Yakuza Kiwami 3 пообещали исправить графику к релизу — пока ремейк местами выглядит хуже, чем игра 16-летней давности 15 ч.
Microsoft исправила сбои входа и загрузки в свежем обновлении Windows 11 16 ч.
В Китае ликвидировали одну из крупнейших в мире сетей пиратской манги 16 ч.
Режиссёр Даррен Аронофски выпустит сгенерированный ИИ сериал о войне за независимость США 16 ч.
Продажи человекоподобных роботов в Китае взлетят более чем вдвое в этом году — а цены упадут 3 ч.
Kioxia намерена нарастить долю рынка NAND, пока конкуренты заняты памятью для ИИ 3 ч.
Уже три компании из Китая пробились в топ-20 крупнейших поставщиков оборудования для выпуска чипов 4 ч.
Blue Origin заморозит космический туризм минимум на два года ради концентрации на лунной миссии 5 ч.
Неооблака «засасывают» ИИ-данные как чёрные дыры, меняя поведение Сети 13 ч.
Финны начали варить пиво «на песке» — местная пивоварня установила песочный теплоаккумулятор 14 ч.
Музыкальные издатели потребовали от Anthropic $3 млрд за «вопиющее пиратство» 14 ч.
Китай тоже планирует строительство гигаваттных космических ЦОД 14 ч.
От технологического наследия к построению будущего — Atos перезапустила бренд Bull для HPC, ИИ и квантовых инноваций 15 ч.
США продвигают «атомные кампусы» с ослабленными требованиями к ядерной безопасности, чтобы запитать ИИ ЦОД 15 ч.