Сегодня 15 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Снова жду игру»: первое открытое бета-тестирование российского MMO-шутера Pioner стартует в октябре 6 мин.
Samsung начала развёртывание OneUI 8 на базе Android 16 39 мин.
Журналисты раскрыли новые подробности игры Insomniac про Венома и сроки выхода Marvel’s Wolverine 49 мин.
Сюжетный боевик Squadron 42 во вселенной Star Citizen могут опять перенести — разработчик поставил под сомнение релиз в 2026 году 6 ч.
«Будто фанатский фильм посмотрел»: Netflix подтвердила дату выхода четвёртого сезона «Ведьмака», а новый тизер сериала утонул в дизлайках 7 ч.
Юрлицо российского игрового движка Nau Engine, в который VK хотела вложить 1 млрд руб., ликвидируется 7 ч.
Создатель инди-хита Balatro пожаловался на выгорание и перенёс выход патча 1.1 на неопределённый срок 7 ч.
«Я хотел бы сделать это ради детей», — Трамп собирается снова отсрочить запрет TikTok в США 7 ч.
«Т-банк» запустил бесконтактную оплату для iPhone через Bluetooth Low Energy 7 ч.
МТС отменила комиссию при пополнении аккаунта Steam, но лишь временно 8 ч.
AMD записала Ryzen 9000X3D в «клуб 1000 FPS» — такая скорость обещана в киберспортивных играх 4 мин.
Вместе с iPhone 17 компания Apple выпустила динамическую зарядку с плавающей до 60 Вт мощностью 15 мин.
Cougar выпустила корпус CFV235 с «парящим» отсеком для материнской платы 2 ч.
Следующий флагманский чип Qualcomm получит название Snapdragon 8 Elite Gen 5 — компания пояснила свою логику 3 ч.
Adata представила два суперкулера XPG Maestro Plus c дисплеями и корпус XPG Valor Air Pro 4 ч.
Продажи Ethernet-коммутаторов и маршрутизаторов корпоративного класса растут на фоне бума ИИ 4 ч.
Производители флеш-памяти готовятся резко задрать цены — грядёт подорожание SSD 5 ч.
Gigabyte выпустила компактный ИИ ПК AI Top Atom на базе суперчипа NVIDIA GB10 5 ч.
Китайские власти обвинили Nvidia в нарушении закона при покупке Mellanox в 2020 году 6 ч.
Квартальные затраты на рынке физической инфраструктуры ЦОД приблизились к $9 млрд — продажи СЖО подскочили на 156 % 7 ч.