Сегодня 16 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Тысячи пользователей пожаловались на сбои в работе соцсети X 24 мин.
Календарь релизов — 16–22 февраля: Styx: Blades of Greed, Norse: Oath of Blood и Forgotlings 42 мин.
Две Assassin’s Creed, эвакуационный шутер по Второй мировой и не только: инсайдер выяснил, какие игры Ubisoft отменила вместе с ремейком «Принца Персии» 2 ч.
Blizzard: несмотря на 14 лет с релиза, в Diablo III до сих пор играют «миллионы» 2 ч.
YouTube усугубил войну с блокировщиками рекламы — пользователям начали отключать комментарии и описания роликов 2 ч.
Для безопасности и совместимости: IT-гиганты сформировали трансграничное объединение Trusted Tech Alliance 3 ч.
Microsoft начала блокировать загрузку ISO-образов Windows 11 через Rufus 3 ч.
Создатель завирусившегося ИИ-агента OpenClaw присоединился к OpenAI 3 ч.
Облачные сервисы в 2025 году росли в России самыми быстрыми темпами, опередив ИИ-сегмент 4 ч.
ByteDance пообещала отучить ИИ-генератор Seedance 2.0 копировать голливудских актеров и персонажей 5 ч.
Ту самую компьютерную колонку из 90-х увеличили до человеческого роста — и она работает 27 мин.
Apple проведёт презентацию 4 марта — ожидаются iPhone 17e, новые Mac и iPad 2 ч.
«Атомный ИИ»: Deep Atomic предлагает строить сразу и ЦОД, и АЭС для него 2 ч.
GPU видеокарты за $5090 буквально лопнул от экстремального разгона — MSI RTX 5090 Lightning Z не пережила эксперимент 2 ч.
Oxide Computer готовит блейд-платформу на базе AMD EPYC Turin 3 ч.
Одна из самых редких GeForce RTX 5090 всплыла на eBay по цене от $7000 до $15 000 5 ч.
МКС снова укомплектована космонавтами и астронавтами после экстренной эвакуации в январе 8 ч.
Попутного ветра: AWS резко сократила развёртывание СЖО для Trainium3, решив обойтись преимущественно воздушным охлаждением 8 ч.
Китайская Montage Technology выпустила серверные процессоры Jintide на базе Intel Xeon 6 10 ч.
Мировой рынок оптических коммутаторов к 2029 году достигнет $2,5 млрд, но львиная доля всё равно придётся на Google 10 ч.