Сегодня 13 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sony анонсировала первую за четыре года новую Ratchet & Clank, но есть нюанс — это мобильный мультиплеерный шутер 14 мин.
Создатели Lineage и Guild Wars анонсировали MMORPG во вселенной Horizon от Sony — первый геймплей и подробности Horizon Steel Frontiers 3 ч.
ElevenLabs получила разрешение от голливудских звёзд на коммерческое применение их ИИ-голосов 3 ч.
Valve добавит поддержку Android-игр в Steam вместе с VR-гарнитурой 6 ч.
Хоррор об ужасах долговой ямы CloverPit получил хардкорный режим и достиг миллиона проданных копий — разработчики «в полном шоке» 12 ч.
OpenAI представила GPT-5.1 — ChatGPT станет умнее и приятнее в общении 12 ч.
Разработчики Vampire: The Masquerade — Bloodlines 2 рассказали, как будут улучшать игру до конца 2025 года 14 ч.
Российский корпоративный центр сертификации SafeTech CA получил масштабное обновление 15 ч.
«Безмерно благодарны вам»: продажи Kingdom Come: Deliverance 2 взяли новую высоту 16 ч.
Nintendo показала первый трейлер фильма «Галактика Супер Марио в кино» — фанаты в восторге 17 ч.
«Группа Астра» представила семейство ПАК XPlatform для построения ИТ-инфраструктуры «под ключ» 13 мин.
GlobalFoundries рассчитывает тоже извлечь выгоду из бума ИИ 16 мин.
Цены на флеш-память взлетят на 40–50 %: все производители сократили выпуск NAND 28 мин.
OpenAI сжигает миллиарды и зарабатывает крохи — окупаемость может наступить лишь через десять лет 3 ч.
Waymo выпустила беспилотные такси на шоссе в трёх районах США 4 ч.
Foxconn ожидает, что в следующем году поставки ИИ-серверов удвоятся 5 ч.
Microsoft готова использовать разработки OpenAI для совершенствования собственных чипов 6 ч.
На строительство ЦОД в этом году будет потрачено больше, чем на разведку новых месторождений нефти 7 ч.
Новая статья: Обзор и тестирование стильного корпуса 1stplayer GM7: сталь, пластик, два стекла 12 ч.
От ИИ ЦОД до роботов: AMD анонсировала долгосрочную стратегию роста 12 ч.