Сегодня 12 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → android bench

Google назвала лучшие ИИ-модели для разработки Android-приложений — Gemini проиграл GPT

Google в очередной раз обновила свой рейтинг Android Bench, в котором собраны лучшие модели искусственного интеллекта для разработки приложений под Android. В списке появилось множество моделей с открытыми весами; приводится подробная информация об использованных токенах и стоимости работы с этими моделями.

 Источник изображения: developer.android.com

Источник изображения: developer.android.com

Одна из областей, в которой большие языковые модели по-настоящему преуспели, — это написание программного кода, их способность оказывать помощь в разработке приложений и других проектов ПО. В первом рейтинге Android Bench победителем была Google Gemini 3.1 Pro, впоследствии на уровне с ней стала выступать OpenAI GPT 5.4, а по состоянию на 18 мая в лидеры выбилась GPT 5.5, которая почти на 2 % обошла и Gemini 3.1 Pro, и GPT 5.4.

Результаты тестирования стали прозрачнее, потому что Google привела некоторые подробности. Теперь в рейтинге указываются средняя задержка — время, затраченное на решение ста задач за десять прогонов; среднее общее количество токенов — потребление токенов за один прогон по итогам десяти; и средняя стоимость — расходы на запуск одного бенчмарка в американских долларах.

Это помогло понять, что хотя GPT 5.5 и несколько мощнее, выполнение тех же задач на Gemini 3.1 Pro обходится более чем вдвое дешевле. Из открытых моделей лучший результат показала GLM 5.1. Недавно Google выпустила мощную Gemini 3.5 Flash, а вскоре дебютирует и более мощная Gemini 3.5 Pro — будет интересно посмотреть, как они выступят против теперешнего лидера OpenAI GPT 5.5.


window-new
Soft
Hard
Тренды 🔥
В Steam пробралась демоверсия ретрофутуристического хоррора RetroSpace, вдохновлённого System Shock 2 ч.
Ролевой боевик Valor Mortis от создателей Ghostrunner не выйдет в один день с Control Resonant — объявлена новая дата релиза 4 ч.
«Абеляр, запускай игру»: для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение «Неисчислимый музеон» и крупное обновление 1.6 5 ч.
«Некоторое количество перемещений рабочих мест»: Anthropic разработала план на случай, если ИИ оставит людей без работы 5 ч.
Gears of War: E-Day станет самой продолжительной игрой серии от The Coalition — новые подробности консольного эксклюзива Xbox 6 ч.
Deezer выпустил детектор ИИ-музыки для других стримингов 7 ч.
Амбициозный авиасимулятор «Корея. Серия Ил-2» опоздает на вылет — новый трейлер и дата полноценного релиза 7 ч.
Anthropic извинилась за непрозрачность в вопросах безопасности Claude Fable 5 8 ч.
ИИ-агент OpenClaw провалил тесты на фишинговые атаки 8 ч.
Google представила очень быструю открытую ИИ-модель DiffusionGemma, которая принципиально отличается от других 8 ч.
Gigabyte представила бюджетную плату B840M Force WIFI6E с разгоном DDR5 и оптимизациями для Ryzen X3D 2 ч.
Google начала переговоры с Samsung о производстве части ИИ-чипа TPU следующего поколения 5 ч.
Huawei готовится вскоре повысить цены на свои устройства 6 ч.
Meta хочет зарабатывать больше денег не на рекламе, но у неё плохо получается 6 ч.
Инстансы Amazon EC2 M9g и M9gd на базе Graviton5 уже доступны в ряде регионов 7 ч.
Развитие ЦОД может столкнуться с «энергетической стеной» к 2030 году 7 ч.
Meta и Reliance Industries расширят партнёрство, построив ИИ-совместимый ЦОД в Индии 7 ч.
Потребление воды ИИ вырастет до 2,27 млрд кубометров к 2030 году — в основном из-за роста энергопотребления 8 ч.
«Мегафон» запустил магистральную линию на базе компактных 400G‑трансиверов российского производства 8 ч.
Vertiv представила серверную стойку Rack Extreme, которая выдержит более 2000 кг оборудования 10 ч.