Сегодня 29 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде

Китайский стартап DeepSeek представил новую ИИ-модель DeepseekMath-V2, которая показывает впечатляющие результаты при решении сложных математических задач. Алгоритм справился с многими заданиями Международной математической олимпиады (IMO 2025) и Китайской математической олимпиады (CMO 2024), показав при этом результат на уровене золотой медали.

 Источник изображений: the-decoder.com

Источник изображений: the-decoder.com

В сообщении сказано, что DeepseekMath-V2 набрала 118 из 120 баллов в задачах Putnam, что существенно выше лучшего результата человека в 90 баллов. DeepSeek отмечает, что ранее ИИ-модели часто выдавали верные ответы в сложных математических задачах, но при этом не показывали правильного хода решения. Для исправления ситуации ИИ-модель задействует многоэтапный процесс с отдельным верификатором для оценки корректности шагов решения задачи и необходимости их перепроверки. Такая структура позволяет алгоритму проверять и совершенствовать свои решения в режиме реального времени.

С технической стороны DeepseekMath-V2 построена на основе базовой модели Deepseek-V3.2-Exp-Base. В описании DeepSeek ни разу не упоминается использование внешних инструментов, таких как калькуляторы или интерпретаторы кода. В ключевых экспериментах одна и та же модель DeepseekMath-V2 используется как для генерации доказательств, так и для их проверки. Высокая производительность алгоритма обусловлена способностью подвергать критике и улучшать собственные выводы вместо того, чтобы задействовать внешнее программное обеспечение. Для решения более сложных задач модель наращивает вычислительные мощности на этапе тестирования, параллельно создавая и проверяя множество возможных доказательств, чтобы повысить уровень уверенности в правильности конечного ответа.

Релиз DeepSeek последовал за анонсом ещё не выпущенных ИИ-моделей OpenAI и Google Deepmind, которые достигли схожих результатов в решении сложных математических задач. Примечательно, что эти алгоритмы достигли такого результата за счёт способности к рассуждению, а не целевой оптимизации для математических олимпиад. Если на деле успехи этих алгоритмов действительно окажутся столь впечатляющими, то это будет означать, что языковые модели приблизились к моменту, когда они смогут решать сложные, абстрактные задачи, что традиционно считалось исключительно человеческим навыком.

Отметим, что решение DeepSeek раскрыть технические детали модели DeepseekMath-V2 резко контрастирует с секретностью, которую соблюдают Google и OpenAI. Американские компании держат в тайне подробности об архитектуре собственных ИИ-моделей, тогда как китайский стартап буквально раскрывает все карты, наглядно показывая, что компания идёт вровень с ведущими отраслевыми представителями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Windows 11 быстрее Windows 10 прописалась на 1 млрд компьютеров, похвасталась Microsoft 30 мин.
Ubisoft подтвердила The Division Definitive Edition — это не ремастер 2 ч.
Главы Агентства кибербезопасности США слил служебные документы в ChatGPT — теперь ИИ использует их для обучения 4 ч.
«Средневековая Богемия ещё никогда не была такой красивой»: PS Store «засветил» подробности ремастера Kingdom Come: Deliverance для PS5 13 ч.
Google заплатит $135 млн за тайный сбор данных пользователей Android и больше не будет «шпионить» без спроса 15 ч.
Литовский маркетплейс рассекретил статуэтку по ремейку Assassin’s Creed IV: Black Flag — Ubisoft отреагировала мемом из GTA: San Andreas 15 ч.
Открытая игра без открытого мира: новые подробности амбициозного ролевого боевика Control Resonant от создателей Alan Wake 2 16 ч.
Microsoft улучшила бесшовный перенос приложений между Android и Windows 11 17 ч.
План «Б» для стареющего Linux: у сообщества появился план на случай ухода Линуса Торвальдса 17 ч.
Спустя почти год CD Projekt Red вернула карточную ролевую игру «Кровная вражда: Ведьмак. Истории» на iOS и Android 17 ч.
AAEON готовит индустриальный компьютер UP Xtreme PTL Edge на базе Intel Panther Lake для ИИ-задач 9 мин.
Конец неопределённости: Пекин одобрил импорт NVIDIA H200 17 мин.
В Японии начали испытания пассажирского самолёта с «кожей акулы» — оно экономит топливо и снижает выбросы 35 мин.
Samsung утроила квартальную прибыль до рекордных $14 млрд, но по итогам года впервые уступила SK hynix 49 мин.
Microsoft построит в Висконсине третий «самый передовой» ИИ ЦОД в мире по проекту Fairwater 2 ч.
Продажи электромобилей рухнули: Tesla впервые в истории отчиталась о падении годовой выручки 3 ч.
SK hynix превратит бывший флеш-бизнес Intel в ИИ-гиганта: в новое подразделение в США вложат $10 млрд 6 ч.
Новая статья: Обзор и тестирование корпуса MSI Velox 300R AirFlow PZ 9 ч.
Apple попытается удержать iPhone 18 от подорожания, несмотря на глобальный дефицит памяти 10 ч.
Новая статья: Обзор HUAWEI WiFi Mesh X3 Pro: маршрутизатор как арт-объект 11 ч.