Сегодня 21 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде

Китайский стартап DeepSeek представил новую ИИ-модель DeepseekMath-V2, которая показывает впечатляющие результаты при решении сложных математических задач. Алгоритм справился с многими заданиями Международной математической олимпиады (IMO 2025) и Китайской математической олимпиады (CMO 2024), показав при этом результат на уровене золотой медали.

 Источник изображений: the-decoder.com

Источник изображений: the-decoder.com

В сообщении сказано, что DeepseekMath-V2 набрала 118 из 120 баллов в задачах Putnam, что существенно выше лучшего результата человека в 90 баллов. DeepSeek отмечает, что ранее ИИ-модели часто выдавали верные ответы в сложных математических задачах, но при этом не показывали правильного хода решения. Для исправления ситуации ИИ-модель задействует многоэтапный процесс с отдельным верификатором для оценки корректности шагов решения задачи и необходимости их перепроверки. Такая структура позволяет алгоритму проверять и совершенствовать свои решения в режиме реального времени.

С технической стороны DeepseekMath-V2 построена на основе базовой модели Deepseek-V3.2-Exp-Base. В описании DeepSeek ни разу не упоминается использование внешних инструментов, таких как калькуляторы или интерпретаторы кода. В ключевых экспериментах одна и та же модель DeepseekMath-V2 используется как для генерации доказательств, так и для их проверки. Высокая производительность алгоритма обусловлена способностью подвергать критике и улучшать собственные выводы вместо того, чтобы задействовать внешнее программное обеспечение. Для решения более сложных задач модель наращивает вычислительные мощности на этапе тестирования, параллельно создавая и проверяя множество возможных доказательств, чтобы повысить уровень уверенности в правильности конечного ответа.

Релиз DeepSeek последовал за анонсом ещё не выпущенных ИИ-моделей OpenAI и Google Deepmind, которые достигли схожих результатов в решении сложных математических задач. Примечательно, что эти алгоритмы достигли такого результата за счёт способности к рассуждению, а не целевой оптимизации для математических олимпиад. Если на деле успехи этих алгоритмов действительно окажутся столь впечатляющими, то это будет означать, что языковые модели приблизились к моменту, когда они смогут решать сложные, абстрактные задачи, что традиционно считалось исключительно человеческим навыком.

Отметим, что решение DeepSeek раскрыть технические детали модели DeepseekMath-V2 резко контрастирует с секретностью, которую соблюдают Google и OpenAI. Американские компании держат в тайне подробности об архитектуре собственных ИИ-моделей, тогда как китайский стартап буквально раскрывает все карты, наглядно показывая, что компания идёт вровень с ведущими отраслевыми представителями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ностальгия пользуется спросом: нуарный ретрошутер Mouse: P.I. For Hire показал «крайне успешный» старт и порадовал издателя продажами 3 ч.
«Чёрт, выглядит великолепно»: утечка кадров из трейлера Assassin’s Creed Black Flag Resynced впечатлила фанатов 3 ч.
Meta тестирует WhatsApp Plus — подписку, которая добавляет косметические улучшения 13 ч.
В Steam и VK Play вышла «Былина» — грандиозная экшен-RPG в мире славянских мифов 13 ч.
Календарь релизов 20–26 апреля: Vampire Crawlers, Masters of Albion, Kiln и Tides of Tomorrow 14 ч.
Nvidia улучшила ReSTIR: трассировка путей стала в 2–3 раза быстрее и чище 14 ч.
Всё тайное становится явным: Ubisoft наконец подтвердила, когда покажет Assassin's Creed Black Flag Resynced 16 ч.
ChatGPT перестал работать у многих пользователей по всему миру — OpenAI ведёт расследование 16 ч.
ИИ стал оружием хакеров: кибератаки стали быстрее и сложнее 17 ч.
Дата выхода, актёрский состав и самый амбициозный проект A24: раскрыты новые подробности фильма по Elden Ring 18 ч.
NASA собрало первую ступень SLS для миссии Artemis III — запуск на Луну намечен на 2027 год 20 мин.
Разработку устройств Apple возглавил Джони Сруджи 24 мин.
Космический грузовик «Прогресс МС-32» ярко завершил свою миссию, разрушившись в атмосфере 25 мин.
«Мыльницы» снова в моде: продажи фотоаппаратов в России подскочили на четверть 2 ч.
Представлен полностью электрический Mercedes-Benz С-класса с запасом хода 762 км 3 ч.
Испанцы разрабатывают аппаратный «стоп-кран» для защиты от бэкдоров в зарубежных чипов 3 ч.
Землетрясение в Японии магнитудой 7,7 балла больше всего навредило производству химикатов для выпуска чипов 3 ч.
ИИ-лаборатория Джеффа Безоса готовится привлечь $10 млрд финансирования 5 ч.
Amazon согласилась вложить в Anthropic ещё $25 млрд 7 ч.
Meta бесплатно обучит американцев работе с волоконно-оптическими сетями, чтобы побыстрее развернуть свои ИИ ЦОД 12 ч.