Новости Software

Google обновила облачный речевой API рядом новых возможностей

Google Cloud Speech, облачный речевой API, позволяющий разработчикам использовать службы поискового гиганта для преобразования голоса в текст, получил первое крупное обновление с момента своего запуска в 2016 году. Наиболее существенное новшество, пожалуй, — поддержка трёх десятков новых языков в дополнение к 89 понимаемым службой ранее.

Впрочем, «языки» — это не вполне верно: с точки зрения Google различные региональные диалекты английского, испанского или арабского входят в этот список отдельным пунктом. Так или иначе, среди новых языков присутствуют такие, как бенгальский, латвийский, суахили и другие, покрывающие в совокупности порядка миллиарда человек.

Кроме того, Google внесла и другие ключевые новшества в свою службу. Среди прочего речь идёт о поддержке временных меток на уровне слов. Идея состоит в том, чтобы пометить каждое слово своей меткой времени, чтобы разработчики могли, например, позволить пользователям слышать, кто произнёс то или иное слово. Это особенно интересно для транскрипционных и переводческих услуг, которые используют этот API для ускорения своих рабочих процессов. Иметь возможность разметить звук текстовыми метками, по словам соучредителя Happy Scribe Андрэ Бастье (André Bastie), существенно снижает время, затрачиваемое на проверку автоматических транскрипций (его компания берёт за такую работу $0,1 на минуту интервью).

Кроме того, длительность файлов, загружаемых разработчиками в службу, повышена с 80 минут до 3 часов (при необходимости можно запросить дополнительное расширение). Как и прежде, разработчики могут использовать Google Cloud Speech API бесплатно на отрывках до 60 минут, а каждые дополнительные 15 секунд оплачиваются по тарифу $0,006.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
88 % пользователей iOS 14.5 запрещают приложениями отслеживать их активность 2 ч.
Hardspace: Shipbreaker получила крупнейшее обновление с переделанным первым актом и новой системой прогресса 2 ч.
В Steam стартовали распродажи игр Devolver Digital и Bandai Namco со скидками до 90 % 3 ч.
Экранная клавиатура Google Gboard теперь доступна на смарт-часах с Wear OS 3 ч.
Переработки, излишняя амбициозность и вырезанный контент: бывший сотрудник 343 Industries рассказал, какой получается Halo Infinite 3 ч.
Официально: запуск расширения World of Warcraft: Burning Crusade Classic состоится в ночь с 1 на 2 июня 3 ч.
Первая Mass Effect из сборника Legendary Edition получит изначальное русское озвучение, которое расстроило многих фанатов 4 ч.
«Для тех, кто любит боль»: Mass Effect Legendary Edition позволит отключить улучшенное управление «Мако» 4 ч.
В Epic Games Store раздают Pine, на очереди — The Lion's Song 5 ч.
Глава Gearbox опроверг слухи о совместной разработке ответвления Borderlands и намекнул на следующую игру студии 5 ч.