Сегодня 28 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google научила Gemini 2.5 понимать и передавать эмоции в диалогах

На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.

 Источник изображения: Google

Источник изображения: Google

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.

Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.

Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.

Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Автосохранение в Microsoft Word теперь включено по умолчанию — но копии сохраняются не на ПК 21 мин.
В Elden Ring Nightreign скоро появятся экспедиции повышенной сложности — анонсирован режим Deep of Night для самых смелых 49 мин.
Нелинейный шутер Judas от создателя BioShock вернулся из небытия с новыми подробностями и ключевой иллюстрацией 2 ч.
Xiaomi представила HyperOS 3 — углубленная совместимость с Apple, редизайн, Super Island и многое другое 2 ч.
«Яндекс» оштрафовали за отказ предоставить ФСБ доступ к «Умному дому с Алисой» 3 ч.
Apple добилась удаления приложение iTorrent из альтернативного магазина AltStore PAL 3 ч.
Представлен Avanpost CA — российский аналог Microsoft Certificate Authority 4 ч.
Новые меры по борьбе с киберпреступниками могут ударить по «белым хакерам» в России 6 ч.
Разработчик Dread Delusion анонсировал Entropy — олдскульную пошаговую ролевую игру про актёра театра, на мир которого напали демоны 7 ч.
«Яндекс» запустил новую ИИ-модель YandexGPT 5.1 Pro, но доступна она пока лишь бизнесу 8 ч.
Honor представила глобальную версию тончайшего складного смартфона Magic V5 — от €1999 в Европе 59 мин.
xMEMS Labs показала прототип умных очков с ультратонким динамиком и твердотельным кулером 3 ч.
Foxconn инвестировала более $200 млн в производство в Мексике, вероятно — для выпуска ИИ-серверов 3 ч.
В России стартовали продажи крайне доступного смартфона Infinix Smart 10 3 ч.
Tokyo Electron открестилась от участия в краже секретных разработок TSMC 3 ч.
AMD прекратила выпуск коробочных кулеров Wraith Prism и Wraith Spire для Ryzen 5000, 7000 и 8000G 3 ч.
В России обвалились продажи ноутбуков — россияне выбирают дешёвые модели и всё чаще предпочитают маркетплейсы 3 ч.
OKO Phone 5 для российских госслужащих поступил в продажу с устаревшей начинкой и свежей ОС «Аврора» 3 ч.
Можно пожёстче: российские производители предложили усложнить госзакупки иностранной электроники 4 ч.
Самолёт SolarStratos побил рекорд высоты полёта на солнечной тяге 6 ч.