Google теперь обрабатывает 3,2 квадриллиона ИИ-токенов в месяц — в семь раз больше, чем год назад

20.05.2026 10:47, Павел Котов

Глава Google Сундар Пичаи (Sundar Pichai) рассказал на конференции I/O 2026, в каких объёмах компания обрабатывает алгоритмы искусственного интеллекта, и предложил способ значительно сэкономить на этом — перейти на новую модель Gemini 3.5 Flash.

Источник изображений: blog.google

Два года назад инфраструктура Google обрабатывала 9,7 трлн токенов в месяц, в прошлом году этот показатель вырос до 480 трлн, а сейчас компания обрабатывает уже 3,2 квадриллиона токенов в месяц. Каждый месяц 8,5 млн разработчиков создают приложения, используя модели Google Gemini и затрачивая 19 млрд токенов в минуту на вызовы через API. За последние 12 месяцев более 375 клиентов израсходовали более 1 трлн токенов каждый — спрос на ИИ со стороны бизнеса остаётся высоким. Обработка алгоритмов в таких объёмах стала возможной благодаря огромным капиталовложениям Google в центры обработки данных, вычислительные мощности и собственные ускорители TPU. В 2022 году капзатраты компании составили $31 млрд в год; по итогам этого года данный показатель достигнет от $180 млрд до $190 млрд.

Гендиректора компании на презентации сменил глава подразделения Google DeepMind Демис Хассабис (Demis Hassabis), который рассказал, что важным шагом на пути к сильному ИИ (AGI) является новая модель Gemini Omni. Она объединяет возможности генератора изображений Nano Banana, генератора видео Veo, генератора миров Genie и системы физического моделирования, в точности описывая механизмы взаимодействия объектов с учётом кинетической энергии и гравитации. Далее Сундар Пичаи рассказал о расширении присутствия технологии SynthID — маркировки созданных ИИ материалов. Google решила обеспечить поддержку технологии C2PA: в поиске или Chrome можно будет обвести материал и поинтересоваться, был ли он создан с помощью ИИ. О поддержке SynthID заявили OpenAI, Kakao и ElevenLabs.

Глава Google также рассказал о преимуществах новой модели Gemini 3.5 Flash. По возможностям она превосходит Gemini 3.1 Pro, но работает вчетверо быстрее (289 токенов в секунду), а в приложениях генерации программного кода Antigravity — уже в 12 раз быстрее. Крупнейшие клиенты Google Cloud обрабатывают около 1 трлн токенов в день — перевод 80 % рабочих нагрузок на Gemini 3.5 Flash позволит им экономить более $41 млрд в год. Новая ИИ-модель также эффективно обеспечивает работу агента Gemini Spark, способного круглосуточно выполнять задачи в фоновом режиме, расходуя относительно небольшое число токенов. До конца лета приложение получит интеграцию с браузером Chrome.

Наконец, вице-президент поискового направления рассказала о возможностях Gemini 3.5 Flash в поиске: сервис научился принимать данные любых форматов в качестве запросов, запускать умеющих следить за обновлениями поисковых агентов и даже генерировать мини-приложения прямо в поисковой выдаче, используя сервис Antigravity.