Сегодня 05 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила рассуждающую ИИ-модель Gemini 2.5 Flash с высокой производительностью и эффективностью

Google выпустила новую ИИ-модель, призванную обеспечить высокую производительность с упором на эффективность. Она называется Gemini 2.5 Flash и вскоре станет доступна в составе платформы Vertex AI облака Google Cloud для развёртывания и управления моделями искусственного интеллекта (ИИ).

 Источник изображения: Google

Источник изображения: Google

Компания отмечает, что Gemini 2.5 Flash предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки запроса в зависимости от их сложности.

«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд. Эта гибкость является ключом к оптимизации производительности Flash в высоконагруженных и чувствительных к затратам приложениях», — написала компания в своём официальном блоге.

На фоне растущей стоимости использования флагманских ИИ-моделей Gemini 2.5 Flash может оказаться крайней полезной. Более дешёвые и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим флагманским вариантам, но ценой потери некоторой точности.

Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для проверки фактов ей требуется немного больше времени, чтобы ответить на запросы. Google утверждает, что 2.5 Flash идеально подходит для работы с большими объёмами данных и использования в реальном времени, в частности, для таких задач, как обслуживание клиентов и анализ документов.

«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат. Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором», — описывает новую ИИ-модель компания.

Google не опубликовала отчёт по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения её преимуществ и недостатков. Ранее компания говорила, что не публикует отчёты для моделей, которые она считает экспериментальными.

Google также объявила, что с третьего квартала планирует интегрировать модели Gemini, такие как 2.5 Flash в локальные среды. Они будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. В компании добавили, что работают с Nvidia над установкой Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты смогут приобрести через Google или по своим каналам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Еврокомиссия подтвердила: правила по ИИ вступят в силу без отсрочки 7 ч.
Microsoft закрыла офис в Пакистане после 25 лет работы 7 ч.
ChatGPT стал инструментом для фишеров — пользователи получают неправильные ссылки 7 ч.
Новая статья: Two Falls (Nishu Takuatshina) — в поисках взаимопонимания. Рецензия 11 ч.
Продюсер Xbox посоветовал уволенным сотрудникам обратиться к ИИ, чтобы «снять эмоциональную нагрузку» 11 ч.
Загадочный хоррор OD от Кодзимы не попал в число жертв Microsoft — «по крайней мере, пока» 11 ч.
Создатели Helldivers 2 ответили, выйдет ли игра в Game Pass — «однозначно» нет 12 ч.
Google изменит поиск под давлением ЕС: в топе выдачи теперь будут сайты конкурентов 12 ч.
Наследие 3dfx Interactive живёт: энтузиасты открыли дорогу к браузерной эмуляции культовых игр конца 90-х 13 ч.
Разработчики Subnautica 2 не объяснили внезапную смену руководства, но зато в игре не будет лутбоксов и боевых пропусков 15 ч.
Японская Rapidus заручилась поддержкой Siemens в сфере выпуска 2-нм чипов 3 ч.
Arctic выпустила высокоэффективные вентиляторы P12 Pro и P14 Pro с подсветкой и без неё 4 ч.
На финансовом положении Intel отказ для выпуска чипов по техпроцессу 18A для клиентов скажется минимально 4 ч.
Внедрение памяти типов CXL и PIM затрудняется текущей конъюнктурой рынка ИИ 4 ч.
По мнению Arm, нынешний подход к использованию чиплетов плохо себя окупает 5 ч.
В Китае набрали популярность «обманки» для автопилота Tesla, которые позволяют не держаться за руль 6 ч.
Загадочные кошельки с 10 000 биткоинов «ожили» спустя 14 лет 7 ч.
CoreWeave первой в отрасли развернула кластер на базе NVIDIA GB300 NVL72 9 ч.
Плотнее, быстрее, дешевле: керамические накопители Cerabyte готовятся составить конкуренцию LTO 11 ч.
ЕС наведёт порядок в космосе: готовится первый в истории «Европейский закон о космосе» 12 ч.