Сегодня 09 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах

Китайская лаборатория искусственного интеллекта (ИИ) DeepSeek представила открытую версию своей модели искусственного интеллекта R1 со способностью к рассуждению, которая, по заявлению разработчиков, превосходит ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

 Источник изображения: Alexander Sinn / Unsplash

Источник изображения: Alexander Sinn / Unsplash

Как сообщает издание TechCrunch, модель R1 превосходит OpenAI o1 в таких бенчмарках, как AIME, MATH-500 и SWE-bench Verified. Эти тесты охватывают различные области, включая математические задачи, программирование и общую производительность модели. AIME оценивает производительность моделей с помощью других ИИ-моделей, MATH-500 представляет собой набор задач по математике, а SWE-bench Verified ориентирован на программирование.

Особенностью R1 является её способность к самопроверке, что помогает исключить ошибки, характерные для других моделей. Однако этот подход требует больше времени для получения ответа — от нескольких секунд до нескольких минут. Тем не менее, такие модели считаются более надёжными в сложных областях, таких как математика, физика и различные науки.

В DeepSeek заявили, что R1 содержит 671 миллиард параметров, что делает её одной из крупнейших моделей в мире. Для удобства пользователей компания также выпустила упрощённые версии R1 с объёмом параметров от 1,5 до 70 миллиардов. При этом, самая компактная версия может работать даже на обычном ноутбуке, в то время как для полного варианта требуется более мощное оборудование. Тем не менее, R1 доступна через API компании по цене, которая, как утверждается, на 90–95% ниже, чем у OpenAI o1.

Отмечается, что у R1 есть и некоторые недостатки. Поскольку модель разработана в Китае, она подлежит обязательной проверке со стороны регуляторов на соответствие «основным социалистическим ценностям». Например, R1 отказывается отвечать на вопросы о событиях на площади Тяньаньмэнь или о независимости Тайваня, что характерно для многих китайских ИИ-моделей, которые избегают обсуждения острых для Поднебесной политических тем.

Стоит сказать, что DeepSeek стала первой китайской лабораторией, вступившей в реальную конкуренцию с OpenAI o1, представив предварительный вариант R1 ещё в ноябре. Однако за ней последовали и другие игроки, включая Alibaba и Kimi, принадлежащую компании Moonshot AI. По мнению исследователя искусственного интеллекта из Университета Джорджа Мейсона Дина Балла (Dean Ball), всё это свидетельствует о том, что китайские ИИ-компании продолжают оставаться «быстрыми последователями» в технологической гонке. «Успех упрощённых версий DeepSeek […] показывает, что мощные рассуждающие модели будут становиться всё более доступными и смогут работать даже на локальном оборудовании», — отметил Балл в своём посте на X.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google обяжут продать Chrome, но позволят инвестировать в искусственный интеллект 13 мин.
Новая статья: Like a Dragon: Pirate Yakuza in Hawaii — якудза в треуголке. Рецензия 3 ч.
В двух регионах РФ заблокировали Telegram — в Госдуме заверили, что на всю страну меры пока что не распространятся 3 ч.
ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей 14 ч.
Microsoft создаст суверенный «рассуждающий» ИИ, который сможет потягаться с OpenAI и DeepSeek 14 ч.
«Нам потребуется больше времени»: поумневшая Siri задержится до 2026 года, подтвердила Apple 15 ч.
Сотрудник производителя DVD с фильмами продавал диски пиратам до релиза — теперь ему грозит 20 лет тюрьмы 18 ч.
Илону Маску предстоит дать показания по иску акционеров Twitter третьего апреля 19 ч.
Новая статья: Rift of the NecroDancer — дофаминовый разлом. Рецензия 08-03 00:04
В раннем доступе Steam вышла комедийная песочница про секретного агента в школе магии, которая выглядит как те самые игры по «Гарри Поттеру» 07-03 23:31
Первый ЦОД Stargate получит 64 тыс. ИИ-ускорителей NVIDIA GB200 к концу 2026 года 4 ч.
Lenovo представила серверы ThinkSystem SR630 V4 и SR650(a) V4 на базе Intel Xeon Granite Rapids-SP 6500P/6700P 5 ч.
QCT представила компактный edge-сервер QuantaEdge EGX88D-1U с 24 25GbE-портами на базе Intel Xeon Granite Rapids-D 5 ч.
AMD разыграет пять видеокарт Radeon RX 9070 XT — две из них подпишет Лиза Су 9 ч.
Названа дата «спасения» застрявших на МКС астронавтов NASA 12 ч.
SpaceX разрешили повысить мощность сигнала Starlink для видеозвонков из глухомани 16 ч.
Британским провайдерам предложили тянуть «оптику» по заброшенным газовым трубам и водопроводам 18 ч.
Apple увернулась от запрета на поставки умных часов Watch в США по патентному иску AliveCor 21 ч.
Google отключилась от российских IX и ЦОД, но о полном уходе из страны речи нет 08-03 02:05
В Ростове-на-Дону запустили завод электроники, который сможет выпускать до 500 тысяч изделий в год 08-03 00:34
Включить темный режим