Сегодня 10 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила звуковую ИИ-модель Gemini 3.5 Live Translate для синхронного перевода с сохранением интонации

Компания Google представила новую модель Gemini 3.5 Live Translate, предназначенную для голосового перевода в режиме реального времени. Нейросеть автоматически распознает более 70 языков и генерирует перевод, сохраняя оригинальную интонацию, темп и высоту голоса спикера.

 Источник изображения: Google

Источник изображения: Google

В отличие от систем, ожидающих окончания фразы, новый алгоритм обрабатывает аудиопоток синхронно. Задержка между оригинальной репликой и переводом составляет несколько секунд и позволяет избежать неестественных пауз в диалоге. Модель адаптирована к работе в шумных условиях и не требует ручной настройки дополнительных параметров. В целях безопасности и борьбы с дезинформацией все сгенерированные аудиозаписи маркируются невидимым цифровым водяным знаком SynthID.

Инструмент уже доступен разработчикам в формате публичной предварительной версии через Gemini Live API и Google AI Studio, а интеграция с такими профильными платформами, как Agora, LiveKit и Vision Agents, позволяет создавать приложения без необходимости выстраивать собственную сложную инфраструктуру потоковой передачи медиа. В настоящее время технологию также тестирует азиатский сервис такси и доставки Grab, обрабатывающий более 10 миллионов звонков в месяц, для обеспечения коммуникации между водителями и клиентами.

В корпоративном сегменте внедрение алгоритма начнётся в текущем месяце в рамках закрытого тестирования для подписчиков Google Workspace в сервисе видеоконференций Google Meet. Обновление позволит переводить беседы, используя более 2000 языковых комбинаций в рамках одной встречи, тогда как предыдущая версия системы поддерживала только пять языков и требовала обязательное наличие английского. Широкий релиз для бизнеса запланирован на конец года.

Рядовые пользователи получат доступ к функции через глобальное обновление приложения Google Translate на платформах iOS и Android. При подключении любых наушников система будет транслировать переведённую речь напрямую собеседнику. Для владельцев устройств на базе Android также предусмотрен специальный «режим прослушивания» (listening mode), который позволяет услышать перевод прямо через динамик телефона. Как объясняет Google в свом блоге, эта функция может быть полезна в ситуациях, когда «нужно быстро услышать перевод, не привлекая внимания окружающих, и под рукой нет наушников».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google представила звуковую ИИ-модель Gemini 3.5 Live Translate для синхронного перевода с сохранением интонации 56 мин.
Microsoft исправила три опасные уязвимости нулевого дня и ещё 200 багов в своём ПО 57 мин.
ИИ помог обновить драйверы для AMD Radeon почти 20-летней давности 3 ч.
Orion soft представил платформу StarGuard AI для безопасной работы с ИИ 3 ч.
В ядре Linux нашли серьёзную уязвимость, созданную всего одним лишним символом в коде 5 ч.
«Могли бы обойтись электронным письмом»: новый трейлер боевика The Duskbloods от авторов Bloodborne и Elden Ring разочаровал фанатов 5 ч.
Meta будет использовать активность пользователей на других сайтах для персонализации их лент и ответов ИИ 6 ч.
Nintendo подтвердила ремейк легендарной The Legend of Zelda: Ocarina of Time эксклюзивно для Switch 2 6 ч.
«Всё по-честному, без обмана»: Сулейман из Microsoft отказался от своих слов о полной замене офисных сотрудников ИИ 6 ч.
Dragon’s Dogma 2 всё-таки получит большое дополнение и улучшения оптимизации — первый трейлер и детали Dragon's Dogma 2: Dark Arisen 7 ч.
Новая статья: Обзор игрового ноутбука ASUS ROG Zephyrus G14 GU405: пример удачной погони за двумя зайцами 2 ч.
NASA представило экипаж луной миссии Artemis 3, но до Луны он не доберётся 3 ч.
Финская твердотельная чудо-батарея Donut Lab оказалась фикцией — и способом выманить $25 млн у инвесторов 4 ч.
MaxSun выпустила низкопрофильную GeForce RTX 5060 с тройкой вентиляторов за $501 6 ч.
В AMD предсказали, что цены на DDR5 вернутся в норму только через два года 6 ч.
Спутниковый Wi-Fi на борту авиалайнеров станет важным «полем битвы» между SpaceX Starlink и Amazon Leo 7 ч.
NVIDIA поможет SK hynix, Naver, Doosan, SK Telecom и LG расширить ИИ-инфраструктуру Южной Кореи 8 ч.
Oriole Networks и AMD успешно запустили ИИ-сеть на фотонных технологиях, но пока в лабораторных условиях 8 ч.
Геймерский смартфон-слайдер Ayaneo показался в видеообзоре до старта продаж 8 ч.
Samsung Foundry может впервые за четыре года выйти на прибыль 10 ч.