Новости Software

Google обновила облачный речевой API рядом новых возможностей

Google Cloud Speech, облачный речевой API, позволяющий разработчикам использовать службы поискового гиганта для преобразования голоса в текст, получил первое крупное обновление с момента своего запуска в 2016 году. Наиболее существенное новшество, пожалуй, — поддержка трёх десятков новых языков в дополнение к 89 понимаемым службой ранее.

Впрочем, «языки» — это не вполне верно: с точки зрения Google различные региональные диалекты английского, испанского или арабского входят в этот список отдельным пунктом. Так или иначе, среди новых языков присутствуют такие, как бенгальский, латвийский, суахили и другие, покрывающие в совокупности порядка миллиарда человек.

Кроме того, Google внесла и другие ключевые новшества в свою службу. Среди прочего речь идёт о поддержке временных меток на уровне слов. Идея состоит в том, чтобы пометить каждое слово своей меткой времени, чтобы разработчики могли, например, позволить пользователям слышать, кто произнёс то или иное слово. Это особенно интересно для транскрипционных и переводческих услуг, которые используют этот API для ускорения своих рабочих процессов. Иметь возможность разметить звук текстовыми метками, по словам соучредителя Happy Scribe Андрэ Бастье (André Bastie), существенно снижает время, затрачиваемое на проверку автоматических транскрипций (его компания берёт за такую работу $0,1 на минуту интервью).

Кроме того, длительность файлов, загружаемых разработчиками в службу, повышена с 80 минут до 3 часов (при необходимости можно запросить дополнительное расширение). Как и прежде, разработчики могут использовать Google Cloud Speech API бесплатно на отрывках до 60 минут, а каждые дополнительные 15 секунд оплачиваются по тарифу $0,006.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
ИИ, аватары, облака и финансы: Deutsche Bank и NVIDIA объявили о партнёрстве 4 ч.
Мифологический шутер PERISH с кооперативом на четверых и трассировкой лучей получил дату выхода и улучшенную демоверсию 7 ч.
Слухи: Sony одобрила перезапуск Uncharted, но не от Naughty Dog 9 ч.
Соавтора «Соника» снова арестовали — теперь из-за Final Fantasy 10 ч.
Банк России готов разрешить майнерам продавать криптовалюты, но только на иностранных биржах 11 ч.
Декабрьское обновление Telegram принесло анонимную регистрацию, автоудаление всего, антиспам и многое другое 11 ч.
Google объявила самые популярные темы поиска в 2022 году: игра Wordle, Джонни Депп и Букингемский дворец 11 ч.
В WhatsApp появился конструктор аватаров, которые можно использовать как стикеры 12 ч.
Amazon урегулировала обвинения Еврокомиссии в притеснении сторонних продавцов 13 ч.
Европа может запретить Meta навязывать пользователям целевую рекламу 14 ч.
Uber запускает сервис роботакси, несмотря на снижение ажиотажа вокруг беспилотных автомобилей 26 мин.
Новая статья: Обзор ноутбука realme Book Prime: тонкий, легкий, быстрый… твой? 5 ч.
Equinix повысит температуру в машинных залах для сокращения энергозатрат 6 ч.
Гнущийся игровой монитор Corsair Xeneon Flex можно будет заказать с 15 декабря — цена $2000 и предложение ограничено 6 ч.
Твердотельный накопитель Phison на 8 Тбайт прошёл сертификацию NASA и полетит на Луну в 2023 году 7 ч.
Fractal Design представила корпус North с фронтальной панелью из дерева 8 ч.
Прогноз по квартальным поставкам iPhone специалисты снизили ещё на 3 млн единиц 8 ч.
TECNO представила флагман Phantom X2 Pro с выдвижным объективом 50-Мп портретной камеры 9 ч.
IDC: объём мирового рынка корпоративного WLAN-оборудования вырос на треть 9 ч.
Первый спутник «Экспресс-РВ» в рамках проекта «Сфера» отправится в космос в 2025 году 11 ч.