Google сама показала, что новая Gemini 3.5 Flash не лучшая ИИ-модель для Android-разработки

Читать в полной версии

Google обновила рейтинг Android Bench, и картина оказалась загадочной: новая модель искусственного интеллекта Gemini 3.5 Flash по качеству написания программного кода для приложений под Android оказалась слабее предшественницы, и за её работу взимается плата втрое выше.

Источник изображения: blog.google

Новая модель Google Gemini 3.5 Flash только попала в этот рейтинг и не добралась даже до пятёрки лидеров. На первом месте оказалась OpenAI GPT 5.5 с результатом в 74 балла, второе и третье места поделили GPT 5.4 и Google Gemini 3.1 Pro Preview с результатом в 72,4 балла, вариант Flash оказался и ниже новых моделей Anthropic Claude Opus.

Google Gemini 3.5 Flash набрала 63,7 балла, заняв шестое место в общем зачёте. Неприятно удивили показатели её эффективности: среднее число токенов составило 355,9, и это значительно больше, чем у других систем. Средняя стоимость достигла $147,1, это самая дорогая модель в списке, и притом с самой низкой производительностью, чем у конкурентов.

Источник изображения: developer.android.com

Показатели удивительны тем, что модели серии Google Flash традиционно отличаются высокой скоростью и низкими ценами. Представив Gemini 3.5 Flash, компания заявила, что она генерирует качественный программный код, эффективно поддерживает управление ИИ-агентами и сложными рабочими процессами; а по ряду тестов она даже обошла Gemini 3.1 Pro.

Но Android Bench говорит об обратном. Вопрос в том, сможет ли Google повысить качество Gemini 3.5 Flash, или перспективная Gemini 3.5 Pro будет больше соответствовать обещаниям компании. Пока же собственные цифры Google демонстрируют, что новое — не всегда лучшее.