Сегодня 03 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде

Китайский стартап DeepSeek представил новую ИИ-модель DeepseekMath-V2, которая показывает впечатляющие результаты при решении сложных математических задач. Алгоритм справился с многими заданиями Международной математической олимпиады (IMO 2025) и Китайской математической олимпиады (CMO 2024), показав при этом результат на уровене золотой медали.

 Источник изображений: the-decoder.com

Источник изображений: the-decoder.com

В сообщении сказано, что DeepseekMath-V2 набрала 118 из 120 баллов в задачах Putnam, что существенно выше лучшего результата человека в 90 баллов. DeepSeek отмечает, что ранее ИИ-модели часто выдавали верные ответы в сложных математических задачах, но при этом не показывали правильного хода решения. Для исправления ситуации ИИ-модель задействует многоэтапный процесс с отдельным верификатором для оценки корректности шагов решения задачи и необходимости их перепроверки. Такая структура позволяет алгоритму проверять и совершенствовать свои решения в режиме реального времени.

С технической стороны DeepseekMath-V2 построена на основе базовой модели Deepseek-V3.2-Exp-Base. В описании DeepSeek ни разу не упоминается использование внешних инструментов, таких как калькуляторы или интерпретаторы кода. В ключевых экспериментах одна и та же модель DeepseekMath-V2 используется как для генерации доказательств, так и для их проверки. Высокая производительность алгоритма обусловлена способностью подвергать критике и улучшать собственные выводы вместо того, чтобы задействовать внешнее программное обеспечение. Для решения более сложных задач модель наращивает вычислительные мощности на этапе тестирования, параллельно создавая и проверяя множество возможных доказательств, чтобы повысить уровень уверенности в правильности конечного ответа.

Релиз DeepSeek последовал за анонсом ещё не выпущенных ИИ-моделей OpenAI и Google Deepmind, которые достигли схожих результатов в решении сложных математических задач. Примечательно, что эти алгоритмы достигли такого результата за счёт способности к рассуждению, а не целевой оптимизации для математических олимпиад. Если на деле успехи этих алгоритмов действительно окажутся столь впечатляющими, то это будет означать, что языковые модели приблизились к моменту, когда они смогут решать сложные, абстрактные задачи, что традиционно считалось исключительно человеческим навыком.

Отметим, что решение DeepSeek раскрыть технические детали модели DeepseekMath-V2 резко контрастирует с секретностью, которую соблюдают Google и OpenAI. Американские компании держат в тайне подробности об архитектуре собственных ИИ-моделей, тогда как китайский стартап буквально раскрывает все карты, наглядно показывая, что компания идёт вровень с ведущими отраслевыми представителями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Исследователи создали червя на основе ИИ — он может использовать любую известную компьютерную уязвимость 7 мин.
В один день с Control Resonant выйдет психологический хоррор Silent Hill: Townfall — с туманным островом конца 90-х и видом от первого лица 4 ч.
Meta передумала следить за всеми действиями сотрудников после волны недовольства 4 ч.
Трамп всё-таки подписал указ об обязательных проверках ИИ-моделей — его считают угрозой для отрасли ИИ 4 ч.
Tomb Raider: Legacy of Atlantis получил точную дату релиза, новый трейлер и скриншоты — ремейк классической Tomb Raider не выйдет в 2026 году 4 ч.
Новая история, новые герои, новый разработчик: анонсирована Until Dawn 2 5 ч.
Stuntman: Hollywood отправит игроков исполнять легендарные трюки из «Назад в будущее», «Форсажа», «Рыцаря дорог» и других хитов кинематографа 5 ч.
Anthropic доверит свой самый опасный ИИ Mythos 150 организациям в 15 странах по всему миру 5 ч.
Тест 3DMark для трассировки лучей получил поддержку нативного 4K, ИИ-масштабирования и генерации кадров 6 ч.
Google позволит исключать сайты из ИИ-поиска без потери позиций в выдаче 6 ч.
ЦОД проекта Fairwater заработал в Висконсине, Microsoft одобрила использование систем NVIDIA Vera Rubin 2 ч.
Ayar Labs присоединилась к экосистеме NVIDIA NVLink Fusion с собственной CPO-технологией 2 ч.
Honor раскрыла новые подробности о Robot Phone с камерой на подвесе и успокоила насчёт его надёжности 3 ч.
Строительство ЦОД в США захлёбывается в нехватке энергии, но у Google есть план 3 ч.
Новые ВМ Azure Cobalt 200 оптимизированы для ИИ-нагрузок с агентами и в 1,5 раза быстрее ВМ Azure Cobalt 100 3 ч.
G.Skill показала самую быструю память для рабочих станций — восьмиканальный комплект DDR5-10000 ECC RDIMM 3 ч.
ASRock показала платы X870E Taichi 10th Anniversary и Z890 Taichi 10th Anniversary для AMD и Intel 3 ч.
Apacer представила технологию охлаждения GraTherX для модулей DDR5 4 ч.
Apple попала в яблочко: бюджетный MacBook Neo оказался бестселлером и открыл новые рынки 4 ч.
Gigabyte показала материнскую плату с LGA 1954 для следующих Intel Core Ultra, но это не точно 4 ч.