Сегодня 29 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Китайский стартап DeepSeek прославился в начале года, выпустив рассуждающую модель R1, которая смогла конкурировать с ИИ-моделями американских технологических гигантов, несмотря на скромный бюджет. Теперь DeepSeek опубликовал в сотрудничестве с исследователями университета Цинхуа статью с подробным описанием нового подхода к обучению моделей с подкреплением, позволяющего значительно повысить их эффективность. Об этом сообщил ресурс SCMP.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Согласно публикации, новый метод направлен на то, чтобы помочь ИИ-моделям лучше соответствовать человеческим предпочтениям, используя механизм вознаграждений за более точные и понятные ответы. Обучение с подкреплением доказало свою эффективность в ускорении решения задач ИИ в ограниченных сферах и приложениях. Однако его использование для более общих задач оказалось не столь эффективным. Команда DeepSeek пытается решить этот вопрос, объединив генеративное моделирование вознаграждения (GRM) и так называемую настройку самокритики на основе принципов. Как утверждается в статье, новый подход с целью улучшения возможностей рассуждений больших языковых моделей (LLM) превзошёл существующие методы, что подтверждено проверкой моделей в различных тестах, и позволил получить самую высокую производительность для общих запросов при использовании меньших вычислительных ресурсов.

Новые модели получили название DeepSeek-GRM — сокращение от термина Generalist Reward Modeling (универсальное моделирование вознаграждения). Компания сообщила, что новые модели будут с открытым исходным кодом, однако сроки их выхода пока не объявлены. В прошлом месяце агентство Reuters сообщило со ссылкой на информированные источники, что в апреле компания также выпустит DeepSeek-R2, преемника рассуждающей модели R1.

Другие ведущие разработчики в сфере ИИ, включая китайскую Alibaba Group Holding и OpenAI из Сан-Франциско (США), также работают над улучшением возможностей рассуждения и самосовершенствования ИИ-моделей, отметил Bloomberg.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Илон Маск выступил в суде против Альтмана и назвал его вором, укравшим благотворительную организацию 2 ч.
Lenovo купила разработчика, чей BIOS установлен в миллионы ПК по всему миру 13 ч.
Вампирская ролевая игра The Blood of Dawnwalker от ветеранов CD Projekt Red вышла из тени — 13 минут геймплея, дата релиза и предзаказ в России 13 ч.
ИИ заполоняет интернет: 35 % появившихся за последние годы сайтов были созданы нейросетями 13 ч.
Nvidia выпустила драйвер с поддержкой новой версии мобильной GeForce RTX 5070 13 ч.
Nacon закроет студию Spiders — разработчиков Greedfall и Steelrising никто не захотел купить 14 ч.
Игроки не оценили S&box — духовный наследник Garry’s Mod собирает в Steam «смешанные» отзывы 15 ч.
Режиссёр Resident Evil 2 спустя почти 30 лет раскрыл секрет происхождения имени Леона Кеннеди 15 ч.
Google «Play Маркет» начнёт помечать приложения, оптимизированные для больших экранов 15 ч.
Минцифры РФ прорабатывает введение платы за VPN-трафик 16 ч.
Framework оценила мобильную GeForce RTX 5070 12GB в $1199 и предупредила о повышении цен на версию с 8 Гбайт памяти 10 мин.
Apple и Google активно интересуются услугами Intel по контрактному производству чипов 16 мин.
Выручка Seagate в прошлом квартале взлетела на 44 % на крыльях ИИ-бума 56 мин.
ЕС обязал производителей ноутбуков перейти на зарядку через USB Type-C — игровые модели мощностью более 100 Вт стали исключением 2 ч.
Власти США заблокировали поставки оборудования для производства чипов в адрес китайской Hua Hong 4 ч.
Новая статья: Обзор Infinix NOTE 60: нестандартный подход к смартфону среднего класса 7 ч.
Tenstorrent представила ИИ-серверы Galaxy Blackhole для быстрой генерации токенов и без дезагрегации 8 ч.
Новая статья: Обзор DIGMA DiCam 970: экшен-камера с очень богатой комплектацией для новичка 9 ч.
Corsair выпустила кабель питания для видеокарт ThermalProtect 12V-2×6 со встроенным датчиком температуры 10 ч.
В Китае стартовали испытания мощнейшего мобильного атомного реактора на грузовом автомобиле 11 ч.