Сегодня 11 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google назвала лучшие ИИ-модели для разработки Android-приложений — Gemini проиграл GPT

Google в очередной раз обновила свой рейтинг Android Bench, в котором собраны лучшие модели искусственного интеллекта для разработки приложений под Android. В списке появилось множество моделей с открытыми весами; приводится подробная информация об использованных токенах и стоимости работы с этими моделями.

 Источник изображения: developer.android.com

Источник изображения: developer.android.com

Одна из областей, в которой большие языковые модели по-настоящему преуспели, — это написание программного кода, их способность оказывать помощь в разработке приложений и других проектов ПО. В первом рейтинге Android Bench победителем была Google Gemini 3.1 Pro, впоследствии на уровне с ней стала выступать OpenAI GPT 5.4, а по состоянию на 18 мая в лидеры выбилась GPT 5.5, которая почти на 2 % обошла и Gemini 3.1 Pro, и GPT 5.4.

Результаты тестирования стали прозрачнее, потому что Google привела некоторые подробности. Теперь в рейтинге указываются средняя задержка — время, затраченное на решение ста задач за десять прогонов; среднее общее количество токенов — потребление токенов за один прогон по итогам десяти; и средняя стоимость — расходы на запуск одного бенчмарка в американских долларах.

Это помогло понять, что хотя GPT 5.5 и несколько мощнее, выполнение тех же задач на Gemini 3.1 Pro обходится более чем вдвое дешевле. Из открытых моделей лучший результат показала GLM 5.1. Недавно Google выпустила мощную Gemini 3.5 Flash, а вскоре дебютирует и более мощная Gemini 3.5 Pro — будет интересно посмотреть, как они выступят против теперешнего лидера OpenAI GPT 5.5.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam пробралась демоверсия ретрофутуристического хоррора RetroSpace, вдохновлённого System Shock 29 мин.
Ролевой боевик Valor Mortis от создателей Ghostrunner не выйдет в один день с Control Resonant — объявлена новая дата релиза 3 ч.
«Абеляр, запускай игру»: для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение «Неисчислимый музеон» и крупное обновление 1.6 4 ч.
«Некоторое количество перемещений рабочих мест»: Anthropic разработала план на случай, если ИИ оставит людей без работы 4 ч.
Gears of War: E-Day станет самой продолжительной игрой серии от The Coalition — новые подробности консольного эксклюзива Xbox 5 ч.
Deezer выпустил детектор ИИ-музыки для других стримингов 6 ч.
Амбициозный авиасимулятор «Корея. Серия Ил-2» опоздает на вылет — новый трейлер и дата полноценного релиза 6 ч.
Anthropic извинилась за непрозрачность в вопросах безопасности Claude Fable 5 7 ч.
ИИ-агент OpenClaw провалил тесты на фишинговые атаки 7 ч.
Google представила очень быструю открытую ИИ-модель DiffusionGemma, которая принципиально отличается от других 7 ч.
Gigabyte представила бюджетную плату B840M Force WIFI6E с разгоном DDR5 и оптимизациями для Ryzen X3D 51 мин.
Google начала переговоры с Samsung о производстве части ИИ-чипа TPU следующего поколения 4 ч.
Huawei готовится вскоре повысить цены на свои устройства 5 ч.
Meta хочет зарабатывать больше денег не на рекламе, но у неё плохо получается 5 ч.
Инстансы Amazon EC2 M9g и M9gd на базе Graviton5 уже доступны в ряде регионов 6 ч.
Развитие ЦОД может столкнуться с «энергетической стеной» к 2030 году 6 ч.
Meta и Reliance Industries расширят партнёрство, построив ИИ-совместимый ЦОД в Индии 6 ч.
Потребление воды ИИ вырастет до 2,27 млрд кубометров к 2030 году — в основном из-за роста энергопотребления 7 ч.
«Мегафон» запустил магистральную линию на базе компактных 400G‑трансиверов российского производства 7 ч.
Vertiv представила серверную стойку Rack Extreme, которая выдержит более 2000 кг оборудования 9 ч.