Сегодня 18 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048

Компания Google представила предварительную версию новой ИИ-модели Gemini 2.5 с функцией Computer Use, которая способна взаимодействовать с веб-сайтами через браузер, имитируя действия человека. Модель применяет визуальное понимание и логическое рассуждение для выполнения, например, таких задач, как заполнение и отправка форм без использования API или другого программного интерфейса.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

Как сообщает The Verge, модель Gemini 2.5 Computer Use предназначена для работы с пользовательскими интерфейсами, созданными для людей, а не для автоматизированных систем. По заявлению Google, технология уже применялась в агентских функциях AI Mode и в исследовательском прототипе Project Mariner, где ИИ-агенты самостоятельно выполняли задачи в браузере, например, добавляли товары в корзину на основе списка ингредиентов.

Интересно, что анонс новой модели состоялся спустя день после того, как OpenAI представила новые приложения для ChatGPT в рамках ежегодного мероприятия Dev Day, продолжив развитие функции ChatGPT Agent, способной выполнять сложные задачи от имени пользователя. При этом Anthropic ещё в прошлом году выпустила версию модели Claude с функцией Computer Use. Однако Google заявляет, что её модель «превосходит ведущие аналоги по нескольким веб- и мобильным бенчмаркам».

В отличие от ChatGPT Agent и инструмента Anthropic, Gemini 2.5 Computer Use имеет доступ только к браузеру, а не ко всей операционной системе. Google подчеркнула, что решение «пока не оптимизировано для управления на уровне настольной ОС» и поддерживает 13 действий, включая открытие веб-браузера, ввод текста, а также перетаскивание элементов.

Сообщается, что модель уже доступна разработчикам через платформы Google AI Studio и Vertex AI. Кроме того, публичная демонстрация размещена в виртуальном браузере BrowserBase, где можно наблюдать, как ИИ выполняет такие задачи, как «сыграть в игру 2048» или «просмотреть Hacker News в поисках обсуждаемых тем».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Объявлены номинанты The Game Awards 2025 — Clair Obscur: Expedition 33 вне конкуренции 11 ч.
Ролевой экшен Where Winds Meet в антураже фэнтезийного Китая привлёк свыше 2 млн игроков за первые сутки 12 ч.
Календарь релизов 17 – 23 ноября: Moonlighter 2, Demonschool, Forestrike и Neon Inferno 13 ч.
Новый уровень сложности, переработка механик, улучшения A-Life и многое другое: для S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел крупный патч 1.7 13 ч.
Microsoft анонсировала игровую презентацию Xbox Partner Preview — на ней покажут Tides of Annihilation, 007 First Light, Reanimal и многое другое 14 ч.
Nintendo показала первые кадры из фильма по The Legend of Zelda — фанаты в восторге 15 ч.
Владелец Amazon Джефф Безос нашёл себе новую работу в сфере ИИ 15 ч.
Capcom пообещала уберечь Resident Evil Requiem от судьбы Monster Hunter Wilds, которая даже спустя восемь месяцев страдает от проблем с оптимизацией 17 ч.
Программный «ускоритель» Huawei обещает практически удвоить производительность дефицитных ИИ-чипов 18 ч.
Биткоин вновь упал — и обнулил весь рост с начала года 19 ч.