Подразделение Google DeepMind, занимающееся разработками в сфере искусственного интеллекта, заявило о создании новой ИИ-системы под названием AlphaEvolve, ориентированной на разбор задач с поддающимися машинной обработке решениями. Разработчики уверены, что этот алгоритм поможет оптимизировать инфраструктуру, которую Google использует для обучения больших языковых моделей (LLM).

Источник изображений: DeepMind
В сообщении говорится, что в настоящее время DeepMind работает над созданием пользовательского интерфейса для AlphaEvolve. После завершения этого процесса доступ к ИИ-алгоритму получит ограниченное число исследователей, а позже — более широкая аудитория.
Большинство ИИ-моделей периодически галлюцинируют, что обусловлено их вероятностной архитектурой: они иногда выдумывают факты. Любопытно, что новые ИИ-алгоритмы, такие как o3 от OpenAI, галлюцинируют чаще, чем их предшественники. Это свидетельствует о сложности самой проблемы.
Для борьбы с галлюцинациями в AlphaEvolve реализован специальный механизм — автоматическая система оценок. Она задействует ИИ-модели для генерации, критики и формирования пула возможных ответов на поставленный вопрос, а также автоматически оценивает точность этих ответов.
AlphaEvolve — не первая система, использующая подобный подход. Разные исследователи, включая команду DeepMind, уже несколько лет применяют схожие методы в различных математических областях. Однако сейчас DeepMind утверждает, что использование в AlphaEvolve «самых современных» моделей, таких как Gemini, делает систему значительно более мощной по сравнению с предыдущими аналогами.

Процесс взаимодействия пользователя с AlphaEvolve начинается с постановки задачи. При желании пользователь может добавить больше деталей, включая инструкции, уравнения, фрагменты кода и соответствующую литературу. Также необходимо предоставить механизм для автоматической оценки ответов в виде формулы.
Поскольку AlphaEvolve может решать только те задачи, точность решений которых она способна самостоятельно оценить, система работает лишь с определёнными типами задач — в частности, в областях информатики и оптимизации систем. Ещё одно существенное ограничение заключается в том, что ИИ-система способна описывать решения только в виде алгоритмов, что делает её малопригодной для решения нечисловых задач.
В ходе тестирования AlphaEvolve решала около 50 математических задач, охватывающих различные области — от геометрии до комбинаторики. В итоге ИИ-система смогла «воспроизвести» уже известные решения в 75 % случаев и найти улучшенные варианты решений в 20 % случаев. DeepMind также протестировала систему на практических задачах, таких как повышение эффективности работы центров обработки данных Google и ускорение обучения ИИ-моделей. По данным разработчиков, AlphaEvolve создала алгоритм, который позволил вернуть в оборот 0,7 % вычислительных ресурсов Google по всему миру. Система также предложила вариант оптимизации, позволивший сократить общее время обучения моделей семейства Gemini на 1 %.
Следует отметить, что пока AlphaEvolve не совершила прорывных открытий. В одном из экспериментов система предложила вариант улучшения дизайна ИИ-ускорителя Google TPU, который ранее уже был найден с помощью других алгоритмов. Однако DeepMind приводит те же аргументы, что и многие другие разработчики в сфере ИИ: AlphaEvolve способна экономить время, позволяя специалистам сосредоточиться на решении других задач.
Источник: