Разработчики облачной платформы Yandex Cloud обновили построенный на основе машинного обучения сервис Yandex SpeechKit, предназначенный для синтеза и распознавания речи. Теперь при переводе голоса в текст сервис автоматически добавляет знаки препинания в нужных местах.
Новая функция называется «Пунктуатор». Она работает как при распознавании речи в режиме онлайн для сценариев с голосовыми помощниками, так и при обработке предзаписанных аудиофайлов. Новая функция основана на двух последовательно работающих моделях машинного обучения. Первая осуществляет перевод голоса в текст, а вторая расставляет знаки препинания в соответствии с нормами русского языка. В настоящее время упомянутая функция справляется с расстановкой основных знаков пунктуации русского языка. Взаимодействовать «Пунктуатором» могут все пользователи Yandex SpeechKit.
Разработчики уверены, что нововведение улучшит опыт пользователей в сценариях, предполагающих, что с речевыми технологиями напрямую взаимодействует человек. Прежде всего речь идёт о работе с голосовыми помощниками, автоматическом транскрибировании и формировании субтитров. Отмечается, то распознаваемый нейросетью текст максимально приближён к литературному.
«Мы развиваем сервисы Yandex Cloud, отвечая на запросы наших клиентов, а иногда и предвосхищая их. Многие наши заказчики сегодня используют Yandex SpeechKit для создания голосовых помощников с диалоговым интерфейсом. В таких проектах распознанный машинный текст важно сделать максимально приближённым к тому, как его написал бы реальный собеседник. «Пунктуатор» решает эту задачу просто», — отметил Василий Ершов, руководитель разработки Yandex SpeechKit.
Источник: