Сегодня 25 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах

Китайская лаборатория искусственного интеллекта (ИИ) DeepSeek представила открытую версию своей модели искусственного интеллекта R1 со способностью к рассуждению, которая, по заявлению разработчиков, превосходит ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

 Источник изображения: Alexander Sinn / Unsplash

Источник изображения: Alexander Sinn / Unsplash

Как сообщает издание TechCrunch, модель R1 превосходит OpenAI o1 в таких бенчмарках, как AIME, MATH-500 и SWE-bench Verified. Эти тесты охватывают различные области, включая математические задачи, программирование и общую производительность модели. AIME оценивает производительность моделей с помощью других ИИ-моделей, MATH-500 представляет собой набор задач по математике, а SWE-bench Verified ориентирован на программирование.

Особенностью R1 является её способность к самопроверке, что помогает исключить ошибки, характерные для других моделей. Однако этот подход требует больше времени для получения ответа — от нескольких секунд до нескольких минут. Тем не менее, такие модели считаются более надёжными в сложных областях, таких как математика, физика и различные науки.

В DeepSeek заявили, что R1 содержит 671 миллиард параметров, что делает её одной из крупнейших моделей в мире. Для удобства пользователей компания также выпустила упрощённые версии R1 с объёмом параметров от 1,5 до 70 миллиардов. При этом, самая компактная версия может работать даже на обычном ноутбуке, в то время как для полного варианта требуется более мощное оборудование. Тем не менее, R1 доступна через API компании по цене, которая, как утверждается, на 90–95% ниже, чем у OpenAI o1.

Отмечается, что у R1 есть и некоторые недостатки. Поскольку модель разработана в Китае, она подлежит обязательной проверке со стороны регуляторов на соответствие «основным социалистическим ценностям». Например, R1 отказывается отвечать на вопросы о событиях на площади Тяньаньмэнь или о независимости Тайваня, что характерно для многих китайских ИИ-моделей, которые избегают обсуждения острых для Поднебесной политических тем.

Стоит сказать, что DeepSeek стала первой китайской лабораторией, вступившей в реальную конкуренцию с OpenAI o1, представив предварительный вариант R1 ещё в ноябре. Однако за ней последовали и другие игроки, включая Alibaba и Kimi, принадлежащую компании Moonshot AI. По мнению исследователя искусственного интеллекта из Университета Джорджа Мейсона Дина Балла (Dean Ball), всё это свидетельствует о том, что китайские ИИ-компании продолжают оставаться «быстрыми последователями» в технологической гонке. «Успех упрощённых версий DeepSeek […] показывает, что мощные рассуждающие модели будут становиться всё более доступными и смогут работать даже на локальном оборудовании», — отметил Балл в своём посте на X.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Улучшенная версия классической Final Fantasy VII стартовала в Steam с рейтингом 35 % 14 мин.
Пентагон поставил Anthropic ультиматум: открыть полный доступ к ИИ до пятницы или столкнуться с санкциями 49 мин.
«Фабрика слухов работает на износ»: Activision опровергла сообщения о самостоятельной Call of Duty Zombies, но всё не так просто 2 ч.
Регулятор раскрыл планы Devolver Digital на продолжение «Крутого Сэма» — Serious Sam: Shatterverse скоро выйдет из тени 3 ч.
Discord отложил глобальное внедрение проверки возраста, но ненадолго 12 ч.
Anthropic научила ИИ-платформу Claude Cowork справляться с большим числом офисных задач 13 ч.
Google предложит музыкантам ИИ-продюсера вместо генератора случайных мелодий — компания поглотила ProducerAI 15 ч.
Marvel’s Wolverine выйдет до GTA VI — Sony подтвердила дату релиза жестокого боевика от создателей «Человека-паука» 16 ч.
Blizzard анонсировала новую Overwatch, но это мобильная игра — первый геймплей и подробности Overwatch Rush 17 ч.
Death Stranding 2: On the Beach оптимизируют даже для бюджетных ПК — объявлены системные требования 18 ч.
Akash Systems начала поставки первых в мире GPU-серверов с алмазным охлаждением 6 мин.
Разработчик аэротакси Archer Aviation обвинил конкурента Vertical Aerospace в воровстве разработок 2 ч.
Врата раздора: ИИ-мегапроект Stargate на $500 млрд забуксовал из-за конфликта OpenAI, Oracle и SoftBank 2 ч.
Россияне купили 10 млн роутеров и сетевых устройств в прошлом году — максимум за пять лет 2 ч.
Xenium X900 — кнопочный телефон с поддержкой 4G, видеосвязи и передачи геопозиции 3 ч.
Шоу должно продолжаться: Spotify представила урну для праха с Bluetooth-колонкой и вечным плейлистом 3 ч.
HP готовится к затяжному кризису на рынке памяти — поставки ПК рухнут более чем на 10 % по итогам года 3 ч.
Трёхстворчатый Samsung Galaxy Z TriFold поступил в продажу в России — за две недели предзаказа он сбросил 100 000 рублей 3 ч.
Несмотря на разрешение, в Китай не поставлено ни одного Nvidia H200, признались в Минторге США 8 ч.
Новая статья: Обзор складного смартфона Google Pixel 10 Pro Fold, который не боится пыли 11 ч.