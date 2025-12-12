Google представила новую, «значительно более мощную» версию ИИ-агента Gemini Deep Research, способную выполнять долгосрочные исследовательские задачи и отражать их результаты в подробных отчётах. В настоящее время агент доступен для разработчиков и вскоре появится в потребительских приложениях Google, включая Gemini, Google Search и NotebookLM.

Обновлённый ИИ-агент Gemini Deep Research станет первым встроенным агентом нового интерфейса Interactions API, который служит «единым интерфейсом для взаимодействия» с моделями (например, Gemini 3 Pro) и агентами. Сообщается, что новый API Google отражает новейшие возможности моделей, такие как «мышление» и использование продвинутых инструментов, выходящих за рамки генерации текста.

«Мы расширим возможности встроенных агентов и представим возможность создавать и использовать собственные агенты. Это позволит пользователям подключать модели Gemini, встроенные агенты Google и собственные агенты с помощью одного API», — сообщила Google в блоге.

«Оптимизированный для длительных задач сбора и синтеза контекста», агент Gemini Deep Research использует возможности Gemini 3 Pro. Google позиционирует свою систему как «специально обученную для уменьшения иллюзорности и максимизации качества отчётов при выполнении сложных задач». В ответ на поступивший запрос пользователя она «формулирует запросы, читает результаты, выявляет пробелы в знаниях и выполняет повторный поиск». По словам компании, также был «значительно улучшен веб-поиск, позволяющий ей перемещаться глубоко по сайтам в поисках конкретных данных».

Одной из областей, где Gemini 3 Pro превосходит своих предшественников, является визуальное мышление. По данным Google, модель может выполнять такие задачи, как планирование траекторий движения складского робота. При решении задач обработки документов она может извлекать информацию из рукописного текста, диаграмм и математических обозначений.

Новая версия Gemini Deep Research использует функции визуального мышления Gemini 3 Pro для автоматизации задач поиска данных. Например, агент может сканировать загруженные пользователем документы, чтобы найти определённую информацию.

Обновлённый Gemini Deep Research превзошёл Gemini 3 Pro в ряде тестов. В частности, Gemini Deep Research показал 46,4 % против 43,2 % у Gemini 3 Pro на полном наборе HLE (Humanity’s Last Exam, логика и знания), 66,1 % против 56,6 % на DeepSearchQA (комплексное веб-исследование) и 59,2 % против 49,4 % на BrowseComp (поиск труднодоступных фактов).