Сегодня 15 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах

Китайская лаборатория искусственного интеллекта (ИИ) DeepSeek представила открытую версию своей модели искусственного интеллекта R1 со способностью к рассуждению, которая, по заявлению разработчиков, превосходит ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

 Источник изображения: Alexander Sinn / Unsplash

Источник изображения: Alexander Sinn / Unsplash

Как сообщает издание TechCrunch, модель R1 превосходит OpenAI o1 в таких бенчмарках, как AIME, MATH-500 и SWE-bench Verified. Эти тесты охватывают различные области, включая математические задачи, программирование и общую производительность модели. AIME оценивает производительность моделей с помощью других ИИ-моделей, MATH-500 представляет собой набор задач по математике, а SWE-bench Verified ориентирован на программирование.

Особенностью R1 является её способность к самопроверке, что помогает исключить ошибки, характерные для других моделей. Однако этот подход требует больше времени для получения ответа — от нескольких секунд до нескольких минут. Тем не менее, такие модели считаются более надёжными в сложных областях, таких как математика, физика и различные науки.

В DeepSeek заявили, что R1 содержит 671 миллиард параметров, что делает её одной из крупнейших моделей в мире. Для удобства пользователей компания также выпустила упрощённые версии R1 с объёмом параметров от 1,5 до 70 миллиардов. При этом, самая компактная версия может работать даже на обычном ноутбуке, в то время как для полного варианта требуется более мощное оборудование. Тем не менее, R1 доступна через API компании по цене, которая, как утверждается, на 90–95% ниже, чем у OpenAI o1.

Отмечается, что у R1 есть и некоторые недостатки. Поскольку модель разработана в Китае, она подлежит обязательной проверке со стороны регуляторов на соответствие «основным социалистическим ценностям». Например, R1 отказывается отвечать на вопросы о событиях на площади Тяньаньмэнь или о независимости Тайваня, что характерно для многих китайских ИИ-моделей, которые избегают обсуждения острых для Поднебесной политических тем.

Стоит сказать, что DeepSeek стала первой китайской лабораторией, вступившей в реальную конкуренцию с OpenAI o1, представив предварительный вариант R1 ещё в ноябре. Однако за ней последовали и другие игроки, включая Alibaba и Kimi, принадлежащую компании Moonshot AI. По мнению исследователя искусственного интеллекта из Университета Джорджа Мейсона Дина Балла (Dean Ball), всё это свидетельствует о том, что китайские ИИ-компании продолжают оставаться «быстрыми последователями» в технологической гонке. «Успех упрощённых версий DeepSeek […] показывает, что мощные рассуждающие модели будут становиться всё более доступными и смогут работать даже на локальном оборудовании», — отметил Балл в своём посте на X.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Перегруженные рутиной ИИ-агенты начали критиковать капитализм и поддерживать профсоюзы 59 мин.
Ненасытный ИИ может снова отправить OpenAI на поиски денег — даже рекордных $122 млрд инвестиций мало 2 ч.
Вайбкодить теперь можно на ходу: в ChatGPT для смартфонов появился Codex 2 ч.
«Группа Астра» запустила магазин приложений Astra Store для корпоративного рынка 3 ч.
Исследование: 9 из 10 финансовых советов блогеров признали плохими — но люди всё равно довольны 3 ч.
Первый этап дела «Маск против Альтмана» завершён — теперь слово за присяжными 4 ч.
Subnautica 2 достигла двух миллионов проданных копий спустя всего 12 часов раннего доступа 4 ч.
Дилогию VR-приключений Moss превратят в одну игру для ПК и консолей — трейлер и подробности Moss: The Forgotten Relic 4 ч.
«Выглядит сногсшибательно»: подводный геймплей в Assassin’s Creed Black Flag Resynced заворожил фанатов 5 ч.
Великобритания инициировала антимонопольное расследование практик лицензирования ПО в экосистеме Microsoft 5 ч.
MSI представила игровой монитор MAG OLED 271QPX32 — QD-OLED Penta Tandem, 1440p и 320 Гц 15 мин.
Представлен флагманский игровой ноутбук Asus ROG Strix SCAR 18 с потреблением до 320 Вт 2 ч.
Немецкие учёные добились рекордного КПД при превращении солнечного света в водород 3 ч.
Asus представила трёхлитровый игровой ПК ROG NUC 16 — он меньше PS5, но в 7,5 раз дороже 3 ч.
Геймерские AR-очки Asus ROG Xreal R1 доступны для предзаказа за $849 4 ч.
ИИ-бум превратил Kioxia в одну из самых дорогих компаний Японии — прибыль взлетела на 93 % 4 ч.
Пока мир гонится за ИИ-чипами, китайская SMIC зарабатывает на зрелых техпроцессах 4 ч.
Импортозамещение забуксовало: продажи российских ноутбуков рухнули почти на 70 % 4 ч.
JCB представила гоночный автомобиль Hydromax на 1200-сильном водородном ДВС — он создан для рекордов 4 ч.
Hobot выпустила робота-мойщика окон Hobot SP10 с подвижными скребками для кристально чистого результата 4 ч.