Теги → речевые технологии

Сбер запустила сервис голосовых технологий SmartSpeech

«Сбер» запускает сервис речевых технологий для бизнеса SmartSpeech. Он позволит компаниям без специального оборудования подключить речевые сервисы, такие как интерактивное голосовое меню, автоответчик и многое другое. До конца года сервис, разработанный командой SberDevices, будет бесплатным.

SmartSpeech можно использовать в приложениях, на сайтах или умных устройствах для озвучивания команд, подписей к пунктам меню или для голосового ввода. Используемые сервисом технологии также можно использовать для создания голосовых меню, позволяющих оптимизировать работу контакт-центров. SmartSpeech используется и в самом «Сбербанке». Он является основой для семейства виртуальных ассистентов «Салют». Он же позволяет узнать баланс карты при звонке по номеру 900.

Одной из главных задач бизнеса, которую, по мнению «Сбера» решит SmartSpeech, это быстрое, эффективное и малозатратное решение вопросов, с которыми обращаются клиенты. Уникальные модели распознавания речи собеседника позволяют сделать взаимодействие с роботом, использующим технологии SmartSpeech, максимально естественным и удобным. Сервис уже предлагает несколько голосов, и их библиотека продолжает расширяться. SmartSpeech генерирует максимально естественную речь, практически лишённую фонетических ошибок.

SmartSpeech использует передовые наработки в сфере машинного обучения. Нейросети обрабатывают огромные массивы данных, использую мощности суперкомпьютера «Кристофари» от «Сбера». Для распознавания речи используются архитектуры Jasper и QuartzNet. Качественного синтеза речи удалось добиться путём модификации архитектуры Tacotron 2, путём внедрения в неё контроля за частотой тона речи, паузами, а также изменениями интонации. Для этого использовалась информация, полученная из модели BERT, которая была предварительно обучена русскому языку на огромном количестве текстов. Это позволило сделать синтез речи SmartSpeech максимально естественным.

Компании, которые желают протестировать SmartSpeech, смогут воспользоваться предоставляемым «Сбером» API для подключения и и использования речевых сервисов в своих продуктах. API использует протоколы HTTP и gRPC, поэтому код можно очень быстро встроить практически в любую систему.

«Яндекс» готовится экспортировать свой комплекс речевых технологий

В 2013 году «Яндекс» представила комплекс речевых технологий SpeechKit, который нашёл применение в поисковых, картографических и навигационных сервисах компании. Теперь «Яндекс» планирует начать экспорт своих технологий за границу.

В этом ей должен помочь Виталий Юрченко — бывший топ-менеджер американской Nuance в России и СНГ, специализирующейся на разработке графического и лингвистического ПО. Недавно он присоединился к «Яндексу», где возглавил департамент развития бизнеса речевых технологий и продуктов Yandex SpeechKit. Представители компании отметили, что в Европе и США уже ведутся переговоры. На первых порах изучаются возможности внедрения технологий «Яндекса» в подключённые автомобили и системы голосового управления транспортными средствами. Пока компания не спешит сообщать названия потенциальных партнёров, но подчёркивает при этом, что речь идёт о мировых автопроизводителях.

Тем временем «Яндекс» не забывает и о российском рынке и договорилась об интеграции комплекса речевых технологий в колл-центрах нескольких банков. А ранее, напомним, стало известно о заключении соглашения с Камазом.

window-new
Soft
Hard
Тренды 🔥
Недавнее обновление Windows 10 может вызвать проблемы с сетевой печатью 33 мин.
Новая статья: Twelve Minutes — голова в петле, ужин на столе. Рецензия 38 мин.
Видео: безуспешные попытки подготовить человечество к нависшей угрозе в сюжетном трейлере ELEX II 2 ч.
SpongeBob SquarePants: The Cosmic Shake предложит отправиться в миры грёз, чтобы спасти вселенную 2 ч.
PayPal запустила транзакции с криптовалютами в Великобритании — прежде они были доступны только в США 2 ч.
THQ Nordic анонсировала Jagged Alliance 3 — за разработку отвечают создатели Surviving Mars 3 ч.
Культовый экшен Outcast получит полноценное продолжение спустя более чем 20 лет после релиза 3 ч.
Ремейк Destroy All Humans! 2 выйдет в 2022 году только на ПК и консолях нового поколения 3 ч.
Google добавил функцию защиты конфиденциальности из Android 11 в старые версии ОС 3 ч.
Видео: пустынные красоты мира и «яичные» апгрейды в новом ролике Sable 3 ч.