Google вернула себе трон ИИ: Gemini 3 разгромила конкурентов в тестах

Читать в полной версии

На минувшей неделе Google выпустила большую языковую модель искусственного интеллекта Gemini 3, которая значительно обошла все конкурирующие проекты — противостоять ей неспособны даже нейросети, лежащие в основе сервиса ChatGPT, гласят результаты многочисленных тестов, сообщает Wall Street Journal.

Источник изображений: blog.google

Уникальное достижение подтвердило, что сотрудники Google не напрасно подвергали Gemini 3 многочисленным и всесторонним испытаниям. Её просили шутить и пытались поставить в тупик математическими задачами, но каждый раз разработчики убеждались, что создали нечто, способное склонить чашу весов в пользу компании. Суровую проверку устроила ей директор по управлению продуктами Gemini Тулси Доши (Tulsee Doshi) — модель попросили писать на гуджарати, распространённом в Индии, но малоизвестном в интернете языке, и та справилась лучше предшественников.

Те же, порой неожиданные, результаты, получили и в других компаниях, которым довелось поработать с Gemini 3 до её официального выхода. Администрация сервиса Box, который специализируется на управлении документами с помощью ИИ, поначалу решила, что при тестировании была допущена какая-то ошибка, потому что результаты оказались значительно выше, чем демонстрировали другие модели. Но в итоге пришлось признать очевидное, потому что при каждом тестировании прирост по сравнению с конкурентами выражался двузначными процентными пунктами.

Google впервые за всё время ощутимо вырвалась вперёд, обойдя таких тяжеловесов как OpenAI и Anthropic. OpenAI ChatGPT пока остаётся лидером потребительского рынка с аудиторией 800 млн пользователей, в то время как у Gemini их сейчас 650 млн; Anthropic Claude считается одной из ведущих моделей для программирования. Но, считают пользователи и аналитики, Gemini 3 имеет все шансы стать предпочтительным инструментом для решения самых разных задач. Google планирует положить новую модель в основу генератора изображений Nano Banana; пользователи же высоко оценили её интеллект, точность ответов и творческие возможности.

Три года назад, когда вышел сервис ChatGPT, над Google нависла экзистенциальная угроза: инвесторы стали опасаться, что поисковая система уступит чат-ботам значительную долю трафика, и компания начала упорно сражаться за успех. Гендиректор Google Сундар Пичаи (Sundar Pichai) при поддержке других членов руководства начал радикальный пересмотр стратегии в области ИИ — работу над моделями консолидировали, к проектам подключился даже один из основателей компании Сергей Брин (Sergey Brin). В мае компания представила целый комплект сложных продуктов на базе ИИ, включая полноценный «Режим ИИ» для поисковой системы, но на тот момент не смогла добиться прорыва. Таковым стал дебют генератора изображений Nano Banana в августе — с лета аудитория Gemini выросла на 200 млн человек до 650 млн. Закрепить будущий успех Google сумела в сентябре, когда судья по антимонопольному делу отказался налагать на неё суровые штрафные санкции — он отметил, что хотя компания и является монополистом, динамика рынка уже меняется, и в первую очередь из-за ИИ. Рыночная стоимость Google опередила капитализацию Microsoft и превысила $3,6 трлн; с начала года акции компании подорожали более чем на 50 % и более чем на 60 % — с лета.

Google разрабатывала Gemini 3 как модель, способную преуспеть в самых сложных областях ИИ: она призвана «видеть», анализировать и генерировать все виды контента, в том числе текст, изображения, аудио, видео и программный код. Создатели стремились улучшить её способности к рассуждению, чтобы усовершенствовать возможности модели как персонального помощника в программировании и решении других задач. После выпуска Gemini 3 компания Google опубликовала результаты более чем 20 тестов — в них она значительно обошла конкурирующие решения от OpenAI и Anthropic; только в программировании уступила Anthropic Claude Sonnet 4.5. Часть тестов Google проделала сама, часть доверила другим компаниям. Одной из важных побед стал результат испытания Vending Bench по управлению торговым автоматом — здесь ИИ приходится отслеживать запасы, делать заказы и устанавливать цены, чтобы в симуляции получать прибыль. Впервые за всё время Google интегрировала новую модель ИИ в поисковую службу с первого дня; но воспользоваться ей пока могут не все — в ближайшее время компания расширит аудиторию до всех жителей США.