Сегодня 25 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Китайский стартап DeepSeek прославился в начале года, выпустив рассуждающую модель R1, которая смогла конкурировать с ИИ-моделями американских технологических гигантов, несмотря на скромный бюджет. Теперь DeepSeek опубликовал в сотрудничестве с исследователями университета Цинхуа статью с подробным описанием нового подхода к обучению моделей с подкреплением, позволяющего значительно повысить их эффективность. Об этом сообщил ресурс SCMP.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Согласно публикации, новый метод направлен на то, чтобы помочь ИИ-моделям лучше соответствовать человеческим предпочтениям, используя механизм вознаграждений за более точные и понятные ответы. Обучение с подкреплением доказало свою эффективность в ускорении решения задач ИИ в ограниченных сферах и приложениях. Однако его использование для более общих задач оказалось не столь эффективным. Команда DeepSeek пытается решить этот вопрос, объединив генеративное моделирование вознаграждения (GRM) и так называемую настройку самокритики на основе принципов. Как утверждается в статье, новый подход с целью улучшения возможностей рассуждений больших языковых моделей (LLM) превзошёл существующие методы, что подтверждено проверкой моделей в различных тестах, и позволил получить самую высокую производительность для общих запросов при использовании меньших вычислительных ресурсов.

Новые модели получили название DeepSeek-GRM — сокращение от термина Generalist Reward Modeling (универсальное моделирование вознаграждения). Компания сообщила, что новые модели будут с открытым исходным кодом, однако сроки их выхода пока не объявлены. В прошлом месяце агентство Reuters сообщило со ссылкой на информированные источники, что в апреле компания также выпустит DeepSeek-R2, преемника рассуждающей модели R1.

Другие ведущие разработчики в сфере ИИ, включая китайскую Alibaba Group Holding и OpenAI из Сан-Франциско (США), также работают над улучшением возможностей рассуждения и самосовершенствования ИИ-моделей, отметил Bloomberg.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Абсолютно роскошно»: художник заворожил фанатов The Elder Scrolls V: Skyrim воссозданием Забытой долины на Unreal Engine 5 2 ч.
Не только для любителей гольфа: Sony подтвердила на удивление щедрую мартовскую подборку игр PS Plus 2 ч.
Microsoft «передумала» отказываться от поддержки устаревших принтеров в Windows 11 3 ч.
Лучшая игра серии со времён Resident Evil 4: критики вынесли вердикт Resident Evil Requiem 3 ч.
«Группа Астра» представила комплексное решение для создания VDI-инфраструктур 3 ч.
ЦБ разрешит иностранным криптобиржам и обменникам работать в России — а нелегалов приравняют к «чёрным банкирам» 4 ч.
Издатель Styx: Blades of Greed и RoboCop: Rogue City подал заявление о неплатёжеспособности 5 ч.
Геймдев для всех: собака с помощью Anthropic Claude Code написала компьютерную игру 5 ч.
Valve напутала с объёмами видеопамяти в январской статистике Steam 6 ч.
Амбициозная гоночная игра от бывших разработчиков Forza Horizon осталась без издателя — у Amazon Games другие планы 6 ч.
Застой Samsung продолжается: флагманы Galaxy S26 и S26+ получили минимальные улучшения и цену от 90 000 рублей 2 ч.
Samsung представила беспроводные Hi-Fi-наушники Galaxy Buds4 и Buds4 Pro с автономностью до 20 часов и ценой от 15 000 рублей 2 ч.
Samsung прекратит выпускать 2D NAND и перепрофилирует фабрики на HBM4 3 ч.
Лень британских учёных обернулась открытием лучших в мире натрий-ионных аккумуляторов 3 ч.
Nothing показала розовую версию будущего смартфона Phone (4a) 4 ч.
Бразилия снова оштрафовала Apple за отсутствие зарядки в комплекте iPhone 5 ч.
Первый трансатлантический оптоволоконный кабель демонтируют — он провёл на дне 37 лет 5 ч.
Миссия NASA Crew-13 продолжит традицию перекрёстных полётов на МКС — в экипаж назначен космонавт Сергей Тетерятников 5 ч.
Honor представили самый тонкий Android-планшет в мире — MagicPad 4 5 ч.
Axelera AI привлекла $250 млн для разработки европейских ИИ-чипов 5 ч.