Сегодня 16 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новая ИИ-модель от DeepMind смогла бы получить «золото» на Международной математической олимпиаде

DeepMind, дочернее предприятие Google, специализирующееся на исследованиях в сфере искусственного интеллекта (ИИ), сообщило о новых достижениях ИИ-модели AlphaGeometry2 в решении геометрических задач. В недавно опубликованном исследовании DeepMind сообщается, что AlphaGeometry2 успешно решила 84 % задач (42 из 50) Международной математической олимпиады (IMO) с 2000 по 2024 год, набрав средний балл золотого медалиста (40,9).

 Источник изображения: Google

Источник изображения: Google

AlphaGeometry2 является улучшенной версией ИИ-системы AlphaGeometry, вышедшей в январе прошлого года. В июле прошлого года DeepMind продемонстрировала возможности системы, объединившей ИИ-модели AlphaProof и AlphaGeometry2, которой удалось решить 4 из 6 задач IMO.

AlphaGeometry2, используя лингвистическую модель на основе архитектуры Gemini и усовершенствованный механизм символической дедукции способна определять стратегии решения задач с точностью, превосходящей возможности большинства экспертов-людей.

Принятый подход объединяет два основных компонента: лингвистическую модель, способную генерировать предложения на основе подробного геометрического описания, и символический механизм DDAR (Deductive Database Arithmetic Reasoning), который проверяет логическую связность предлагаемых решений, создавая дедуктивное замыкание на основе доступной информации.

Проще говоря, модель Gemini AlphaGeometry2 предлагает символическому механизму шаги и конструкции на формальном математическом языке, и механизм, следуя определённым правилам, проверяет эти шаги на логическую согласованность.

Ключевым элементом, который позволил AlphaGeometry2 превзойти по скорости предшественника AlphaGeometry, является алгоритм SKEST (Shared Knowledge Ensemble of Search Trees), который реализует итеративную стратегию поиска, основанную на обмене знаниями между несколькими параллельными деревьями поиска. Это позволяет одновременно исследовать несколько путей решения, увеличивая скорость обработки и улучшая качество сгенерированных доказательств.

Эффективность системы удалось значительно повысить с новой реализацией DDAR на C++, что в 300 раз увеличило её скорость по сравнению с версией, написанной на Python.

Вместе с тем из-за технических особенностей AlphaGeometry2 пока ограничена в возможности решать задачи с переменным числом точек, нелинейными уравнениями или неравенствами. Поэтому DeepMind изучает новые стратегии, такие как разбиение сложных задач на подзадачи и применение обучения с подкреплением для выхода ИИ на новый уровень в решении сложных математических задач.

Как сообщается, AlphaGeometry2 технически не является первой ИИ-системой, достигшей уровня золотого медалиста по геометрии, но она первая, достигшая этого с набором задач такого размера.

При этом AlphaGeometry2 использует гибридный подход, поскольку модель Gemini имеет архитектуру нейронной сети, в то время как её символический механизм основан на правилах.

Сторонники использования нейронных сетей утверждают, что интеллектуальных действий, от распознавания речи до генерации изображений, можно добиться только благодаря использованию огромных объёмов данных и вычислений. В отличие от символических систем ИИ, которые решают задачи, определяя наборы правил манипуляции символами, предназначенных для определённых задач, нейронные сети пытаются решать задачи посредством статистической аппроксимации (замены одних результатов другими, близкими к исходным) и обучения на примерах. В свою очередь, сторонники символического ИИ считают, что он более подходит для эффективного кодирования глобальных знаний.

В DeepMind считают, что поиск новых способов решения сложных геометрических задач, особенно в евклидовой геометрии, может стать ключом к расширению возможностей ИИ. Решение задач требует логического рассуждения и способности выбирать правильный шаг из нескольких возможных. По мнению DeepMind, эти способности будут иметь решающее значение для будущего универсальных моделей ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming 9 мин.
«Ведьмаки в ловушки не попадаются»: CD Projekt Red предупредила игроков о мошенниках, которые приглашают на «бету» The Witcher 4 2 ч.
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 3 ч.
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 4 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 4 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 6 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 6 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 8 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 8 ч.
Opera Mini получила ИИ-помощника Aria AI 9 ч.
Голландцы установили мировой рекорд по скорости передачи данных по воздуху инфракрасным лучом 44 мин.
Будущая AR-гарнитура Apple Vision Air получит лёгкий титановый корпус 54 мин.
Kia представила конкурента Tesla Model 3 — электрический седан EV4 по цене $35 000 2 ч.
Представлен геймерский смартфон Nubia RedMagic 10 Air — со Snapdragon 8 Gen 3 и батареей на 6000 мА·ч за $475 3 ч.
Будущее OLED-мониторов за квантовыми точками — QD-OLED захватят 73 % рынка в этом году 3 ч.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 4 ч.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 4 ч.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 4 ч.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 6 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 6 ч.