Новости Software

Microsoft поставила новый рекорд в точности распознавания речи

Microsoft сообщила об очередных доработках системы распознавания речи и снижении частоты появления ошибочных слов при обработке голосовых данных до рекордного показателя 5,1 %. В октябре прошлого года группе исследователей компании удалось достичь отметки 5,9 %, что обозначило паритет с человеком.

В обоих исследованиях сотрудники проводили транскрибирование записей с корпуса бесед Switchboard. Он включает примерно 2,4 тысячи диалогов и используется для тестирования систем распознавания голоса с начала 90-х годов XX века.

Новое исследование было проведено с целью достижения уровня точности, соответствующего уровню профессиональных наборщиков текста из аудиофайлов. У них была возможность прослушать материал несколько раз и определить его разговорный контекст, параллельно работая со своими коллегами.

По сравнению с прошлогодним достижением исследователи снизили частоту ошибочных слов приблизительно на 12 %. Они смогли достичь нового показателя благодаря улучшению акустических и языковых моделей на базе нейронных сетей. Также исследователи сумели заставить систему использовать цельные диалоги. Это позволило ей адаптировать транскрипции к контексту и прогнозировать слова и фразы — примерно так же, как и разговаривающие друг с другом люди.

Система распознавания речи Microsoft используется в таких сервисах как Cortana, Presentation Translator и Microsoft Cognitive Services.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Китайский Linux-дистрибутив Ubuntu Kylin 20.04 портировали на платформу RISC-V 4 ч.
Глава Bloober Team хихикнул, комментируя слухи о связи студии с ремейком Silent Hill 2 4 ч.
Суд обязал Oracle выплатить HPE $3 млрд в связи с отказом от поддержки Itanium 5 ч.
Анонс даты выхода психологического хоррора Fobia — St. Dinfna Hotel сопроводили демонстрацией пяти минут геймплея 6 ч.
Мошенники стали наживаться на уходе Apple из России — предлагают пополнить Apple ID и не только 6 ч.
Приключенческий симулятор выживания Among the Trolls погрузит игроков в мир финского фольклора 6 ч.
Во второй половине мая Game Pass пополнится Sniper Elite 5, Vampire Survivors, Hardspace: Shipbreaker и не только 7 ч.
Авторы Mutant Year Zero анонсировали Miasma Chronicles — тактическое приключение в декорациях постапокалиптической Америки 7 ч.
Techland показала первый концепт-арт своей фэнтезийной ролевой игры, над которой работает с 2016 года 8 ч.
THQ Nordic выпустит стратегический экшен The Valiant от создателей Sudden Strike 8 ч.
X5 Group развернёт собственное облако Salt на инфраструктуре Selectel 2 ч.
Новая статья: Не рутовать. Как отключить рекламу в смартфонах Xiaomi на MIUI 13 простейшими методами 3 ч.
AMD заявила, что Radeon RX 6000 дают лучшую производительность на доллар, чем видеокарты NVIDIA 3 ч.
Британская компания не может запустить ракету Skylark L с сентября 2021 года из-за бюрократии в Исландии 5 ч.
Phanteks представила водоблоки для видеокарт MSI GeForce RTX 3090 Ti Suprim (X) и RTX 3090 Ti Gaming (X) Trio 6 ч.
Китайская YMTC начала рассылать образцы 192-слойных чипов флеш-памяти 3D NAND 8 ч.
Google открыла кампус Bay View, работающий на возобновляемых источниках энергии 9 ч.
ASUS представила игровые ноутбуки ROG Strix Scar 17 SE и ROG Flow X16 на базе Alder Lake-HX и Ryzen 6000 9 ч.
Meta переманила из Intel руководителя разработки сетевого «кремния» для дата-центров 10 ч.
Частным астронавтам миссии Axiom-1 пришлось неожиданно много работать на МКС 11 ч.