На прошедшей в мае конференции I/O 2025 компания Google анонсировала режим глубокого мышления (Deep Think) для своей передовой нейросети Gemini. И хотя он ещё недоступен широкому кругу пользователей, ИИ-модель с его помощью сумела добиться результата на уровне золотой медали в Международной математической олимпиаде (IMO).
Источник изображения: Google
Международная математическая олимпиада является одним из наиболее престижных соревнований для молодых математиков, которое проводится ежегодно с 1959 года. Каждая страна, принимающая участие в этом мероприятии, представлена шестью сильнейшими математиками школьного возраста. Им предстоит соревноваться в решении шести исключительно сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Золотые медали получают лучшие участники (примерно 8 % от общего количества соревнующихся).
На прошлой неделе состоялась IMO 2025. Теперь же Google объявила, что «продвинутая версия Gemini Deep Think решила пять из шести задач IMO, набрав в общей сложности 35 баллов и добившись результата на уровне золотой медали». Вместе с этим Google опубликовала ход решений, которые использовал ИИ-алгоритм на олимпиаде. «Чтобы максимально использовать логические возможности Deep Think, мы дополнительно обучили эту версию Gemini с помощью новых методов обучения с подкреплением, которые позволяют задействовать больше данных для многоэтапных рассуждений, решения проблем и доказательства теорем. Мы также предоставили Gemini доступ к тщательно отобранному набору решений математических задач и добавили в инструкции несколько общих указаний на то, как следует решать задачи IMO», — говорится в сообщении Google.
Олимпиада IMO является хорошей возможностью для проверки способностей ИИ-алгоритма в решении математических задач и ведении рассуждений. В прошлом году алгоритм Google добился результата на уровне серебряной медали, решив четыре из шести задач и набрав в сумме 28 баллов. В этом году ИИ-модель «работала от начала до конца на естественном языке, приводя строгие математические доказательства непосредственно из описаний задач — и всё это в рамках 4,5-часового регламента соревнований». Новый алгоритм способен одновременно исследовать и комбинировать несколько возможных вариантов решения задачи, прежде чем дать окончательный ответ. Ранее нейросеть могла лишь следовать одной выбранной цепочке рассуждений.