Сегодня 04 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде

Китайский стартап DeepSeek представил новую ИИ-модель DeepseekMath-V2, которая показывает впечатляющие результаты при решении сложных математических задач. Алгоритм справился с многими заданиями Международной математической олимпиады (IMO 2025) и Китайской математической олимпиады (CMO 2024), показав при этом результат на уровене золотой медали.

 Источник изображений: the-decoder.com

Источник изображений: the-decoder.com

В сообщении сказано, что DeepseekMath-V2 набрала 118 из 120 баллов в задачах Putnam, что существенно выше лучшего результата человека в 90 баллов. DeepSeek отмечает, что ранее ИИ-модели часто выдавали верные ответы в сложных математических задачах, но при этом не показывали правильного хода решения. Для исправления ситуации ИИ-модель задействует многоэтапный процесс с отдельным верификатором для оценки корректности шагов решения задачи и необходимости их перепроверки. Такая структура позволяет алгоритму проверять и совершенствовать свои решения в режиме реального времени.

С технической стороны DeepseekMath-V2 построена на основе базовой модели Deepseek-V3.2-Exp-Base. В описании DeepSeek ни разу не упоминается использование внешних инструментов, таких как калькуляторы или интерпретаторы кода. В ключевых экспериментах одна и та же модель DeepseekMath-V2 используется как для генерации доказательств, так и для их проверки. Высокая производительность алгоритма обусловлена способностью подвергать критике и улучшать собственные выводы вместо того, чтобы задействовать внешнее программное обеспечение. Для решения более сложных задач модель наращивает вычислительные мощности на этапе тестирования, параллельно создавая и проверяя множество возможных доказательств, чтобы повысить уровень уверенности в правильности конечного ответа.

Релиз DeepSeek последовал за анонсом ещё не выпущенных ИИ-моделей OpenAI и Google Deepmind, которые достигли схожих результатов в решении сложных математических задач. Примечательно, что эти алгоритмы достигли такого результата за счёт способности к рассуждению, а не целевой оптимизации для математических олимпиад. Если на деле успехи этих алгоритмов действительно окажутся столь впечатляющими, то это будет означать, что языковые модели приблизились к моменту, когда они смогут решать сложные, абстрактные задачи, что традиционно считалось исключительно человеческим навыком.

Отметим, что решение DeepSeek раскрыть технические детали модели DeepseekMath-V2 резко контрастирует с секретностью, которую соблюдают Google и OpenAI. Американские компании держат в тайне подробности об архитектуре собственных ИИ-моделей, тогда как китайский стартап буквально раскрывает все карты, наглядно показывая, что компания идёт вровень с ведущими отраслевыми представителями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple прокачала Xcode, внедрив вайб-кодинг с ИИ-агентами OpenAI и Anthropic 4 ч.
Disney+ скоро начнёт заполняться ИИ-контентом от OpenAI Sora, но на другие проекты это не повлияет 4 ч.
Наимпортозамещались: темпы роста продаж отечественного ПО снизились и будут снижаться далее 4 ч.
ChatGPT «упал» по всему миру: тысячи человек остались без ответов чат-бота OpenAI 4 ч.
Стала известна дата «смерти» ChromeOS — Google обеспечит достойный срок поддержки угасающей ОС 5 ч.
Магазин Epic Games Store станет быстрее и удобнее для пользователей 5 ч.
В Steam и VK Play вышла демоверсия российского шутера Grimps с «плюшевым» насилием и креативным арсеналом 5 ч.
Драматичный трейлер подтвердил новую дату выхода Forgotlings — нарисованной вручную метроидвании в мире оживших потерянных вещей 7 ч.
The Outer Worlds 2 и Avowed не оправдали ожиданий Microsoft, но это не конец для Obsidian 7 ч.
PayPal обзавёлся новым гендиректором — это бывший глава HP Энрике Лорес 8 ч.
Новая статья: Почему MSI Spatium M560 дешевле других PCIе 5.0 SSD? Обзор с ответом 4 ч.
Western Digital раскрыла сроки выпуска HDD на 100 Тбайт — модели на 40–44 Тбайт с HAMR уже почти готовы 5 ч.
В межзвёздной среде впервые нашли сложное соединение серы — ещё одно свидетельство космического происхождения органики 9 ч.
В Китае запретили электромобили с выдвижными дверными ручками 10 ч.
OpenAI не устроили чипы NVIDIA для инференса, теперь она ищет альтернативы 11 ч.
Apple захватила 69 % американского рынка смартфонов — у Samsung в пять раз меньше 12 ч.
Xiaomi выпустила на глобальный рынок 27-дюймовый 200-Гц FHD-монитор G27i 2026 за $157 12 ч.
«Шоковая заморозка» для серверов: китайские учёные научились охлаждать системы ИИ за 20 секунд без фреона 13 ч.
Сделка на триллион с четвертью: SpaceX приобрела xAI 13 ч.
«Байкал Электроникс» открыл свободный доступ к документации на серийный микроконтроллер Baikal-U 13 ч.