Сегодня 09 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Китайский стартап DeepSeek прославился в начале года, выпустив рассуждающую модель R1, которая смогла конкурировать с ИИ-моделями американских технологических гигантов, несмотря на скромный бюджет. Теперь DeepSeek опубликовал в сотрудничестве с исследователями университета Цинхуа статью с подробным описанием нового подхода к обучению моделей с подкреплением, позволяющего значительно повысить их эффективность. Об этом сообщил ресурс SCMP.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Согласно публикации, новый метод направлен на то, чтобы помочь ИИ-моделям лучше соответствовать человеческим предпочтениям, используя механизм вознаграждений за более точные и понятные ответы. Обучение с подкреплением доказало свою эффективность в ускорении решения задач ИИ в ограниченных сферах и приложениях. Однако его использование для более общих задач оказалось не столь эффективным. Команда DeepSeek пытается решить этот вопрос, объединив генеративное моделирование вознаграждения (GRM) и так называемую настройку самокритики на основе принципов. Как утверждается в статье, новый подход с целью улучшения возможностей рассуждений больших языковых моделей (LLM) превзошёл существующие методы, что подтверждено проверкой моделей в различных тестах, и позволил получить самую высокую производительность для общих запросов при использовании меньших вычислительных ресурсов.

Новые модели получили название DeepSeek-GRM — сокращение от термина Generalist Reward Modeling (универсальное моделирование вознаграждения). Компания сообщила, что новые модели будут с открытым исходным кодом, однако сроки их выхода пока не объявлены. В прошлом месяце агентство Reuters сообщило со ссылкой на информированные источники, что в апреле компания также выпустит DeepSeek-R2, преемника рассуждающей модели R1.

Другие ведущие разработчики в сфере ИИ, включая китайскую Alibaba Group Holding и OpenAI из Сан-Франциско (США), также работают над улучшением возможностей рассуждения и самосовершенствования ИИ-моделей, отметил Bloomberg.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Tubi стал первым стримингом, интегрированным в ChatGPT 20 мин.
Апелляционный суд США постановил, что Anthropic представляет угрозу для цепочек поставок с точки зрения национальной безопасности 3 ч.
Meta вернулась в ИИгру: «Лаборатория суперинтеллекта» представила мощную нейросеть Muse Spark 8 ч.
Разработчики Forza Horizon 6 показали полную карту Японии и шесть минут из взрывного вступления игры 11 ч.
Microsoft без объяснений заблокировала аккаунт VeraCrypt — выпуск обновлений популярного шифровальщика под Windows сорван 12 ч.
«Сломанная, скучная, безликая»: боевик Samson: A Tyndalston Story от создателя Just Cause разочаровал и критиков, и игроков 12 ч.
Valve, вероятно, разрабатывает SteamGPT — ИИ-поддержку для Steam 13 ч.
VK запустила подписку «VK Видео Премиум» для просмотра роликов без рекламы 13 ч.
Valve выпустила приложение Steam Link для Apple Vision Pro 13 ч.
«Былина» скоро станет явью — грандиозная экшен-RPG в мире славянских мифов получила дату выхода в Steam 13 ч.