Сегодня 11 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила звуковую ИИ-модель Gemini 3.5 Live Translate для синхронного перевода с сохранением интонации

Компания Google представила новую модель Gemini 3.5 Live Translate, предназначенную для голосового перевода в режиме реального времени. Нейросеть автоматически распознает более 70 языков и генерирует перевод, сохраняя оригинальную интонацию, темп и высоту голоса спикера.

 Источник изображения: Google

Источник изображения: Google

В отличие от систем, ожидающих окончания фразы, новый алгоритм обрабатывает аудиопоток синхронно. Задержка между оригинальной репликой и переводом составляет несколько секунд и позволяет избежать неестественных пауз в диалоге. Модель адаптирована к работе в шумных условиях и не требует ручной настройки дополнительных параметров. В целях безопасности и борьбы с дезинформацией все сгенерированные аудиозаписи маркируются невидимым цифровым водяным знаком SynthID.

Инструмент уже доступен разработчикам в формате публичной предварительной версии через Gemini Live API и Google AI Studio, а интеграция с такими профильными платформами, как Agora, LiveKit и Vision Agents, позволяет создавать приложения без необходимости выстраивать собственную сложную инфраструктуру потоковой передачи медиа. В настоящее время технологию также тестирует азиатский сервис такси и доставки Grab, обрабатывающий более 10 миллионов звонков в месяц, для обеспечения коммуникации между водителями и клиентами.

В корпоративном сегменте внедрение алгоритма начнётся в текущем месяце в рамках закрытого тестирования для подписчиков Google Workspace в сервисе видеоконференций Google Meet. Обновление позволит переводить беседы, используя более 2000 языковых комбинаций в рамках одной встречи, тогда как предыдущая версия системы поддерживала только пять языков и требовала обязательное наличие английского. Широкий релиз для бизнеса запланирован на конец года.

Рядовые пользователи получат доступ к функции через глобальное обновление приложения Google Translate на платформах iOS и Android. При подключении любых наушников система будет транслировать переведённую речь напрямую собеседнику. Для владельцев устройств на базе Android также предусмотрен специальный «режим прослушивания» (listening mode), который позволяет услышать перевод прямо через динамик телефона. Как объясняет Google в свом блоге, эта функция может быть полезна в ситуациях, когда «нужно быстро услышать перевод, не привлекая внимания окружающих, и под рукой нет наушников».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Абеляр, запускай игру»: для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение «Неисчислимый музеон» и крупное обновление 1.6 19 мин.
«Некоторое количество перемещений рабочих мест»: Anthropic разработала план на случай, если ИИ оставит людей без работы 20 мин.
Gears of War: E-Day станет самой продолжительной игрой серии от The Coalition — новые подробности консольного эксклюзива Xbox 2 ч.
Антивирусное импортозамещение сработало: в России почти перестали пользоваться иностранным защитным ПО 2 ч.
Deezer выпустил детектор ИИ-музыки для других стримингов 3 ч.
Амбициозный авиасимулятор «Корея. Серия Ил-2» опоздает на вылет — новый трейлер и дата полноценного релиза 3 ч.
Anthropic извинилась за непрозрачность в вопросах безопасности Claude Fable 5 4 ч.
ИИ-агент OpenClaw провалил тесты на фишинговые атаки 4 ч.
Google представила очень быструю открытую ИИ-модель DiffusionGemma, которая принципиально отличается от других 4 ч.
ChatGPT может подешеветь — OpenAI собирается усилить борьбу с Anthropic 4 ч.
Google начала переговоры с Samsung о производстве части ИИ-чипа TPU следующего поколения 57 мин.
Huawei готовится вскоре повысить цены на свои устройства 2 ч.
Meta хочет зарабатывать больше денег не на рекламе, но у неё плохо получается 2 ч.
Инстансы Amazon EC2 M9g и M9gd на базе Graviton5 уже доступны в ряде регионов 3 ч.
Развитие ЦОД может столкнуться с «энергетической стеной» к 2030 году 3 ч.
Meta и Reliance Industries расширят партнёрство, построив ИИ-совместимый ЦОД в Индии 3 ч.
Потребление воды ИИ вырастет до 2,27 млрд кубометров к 2030 году — в основном из-за роста энергопотребления 4 ч.
«Мегафон» запустил магистральную линию на базе компактных 400G‑трансиверов российского производства 4 ч.
Vertiv представила серверную стойку Rack Extreme, которая выдержит более 2000 кг оборудования 6 ч.
Xiaomi получила разрешение на выпуск «электромобилей с расширителем запаса хода» в виде ДВС 6 ч.