Сегодня 01 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek придумал, как повысить эффективность ИИ-моделей с помощью самообучения

Китайский стартап DeepSeek прославился в начале года, выпустив рассуждающую модель R1, которая смогла конкурировать с ИИ-моделями американских технологических гигантов, несмотря на скромный бюджет. Теперь DeepSeek опубликовал в сотрудничестве с исследователями университета Цинхуа статью с подробным описанием нового подхода к обучению моделей с подкреплением, позволяющего значительно повысить их эффективность. Об этом сообщил ресурс SCMP.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Согласно публикации, новый метод направлен на то, чтобы помочь ИИ-моделям лучше соответствовать человеческим предпочтениям, используя механизм вознаграждений за более точные и понятные ответы. Обучение с подкреплением доказало свою эффективность в ускорении решения задач ИИ в ограниченных сферах и приложениях. Однако его использование для более общих задач оказалось не столь эффективным. Команда DeepSeek пытается решить этот вопрос, объединив генеративное моделирование вознаграждения (GRM) и так называемую настройку самокритики на основе принципов. Как утверждается в статье, новый подход с целью улучшения возможностей рассуждений больших языковых моделей (LLM) превзошёл существующие методы, что подтверждено проверкой моделей в различных тестах, и позволил получить самую высокую производительность для общих запросов при использовании меньших вычислительных ресурсов.

Новые модели получили название DeepSeek-GRM — сокращение от термина Generalist Reward Modeling (универсальное моделирование вознаграждения). Компания сообщила, что новые модели будут с открытым исходным кодом, однако сроки их выхода пока не объявлены. В прошлом месяце агентство Reuters сообщило со ссылкой на информированные источники, что в апреле компания также выпустит DeepSeek-R2, преемника рассуждающей модели R1.

Другие ведущие разработчики в сфере ИИ, включая китайскую Alibaba Group Holding и OpenAI из Сан-Франциско (США), также работают над улучшением возможностей рассуждения и самосовершенствования ИИ-моделей, отметил Bloomberg.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft выпустила публичное превью WSL Containers для запуска контейнеров Linux в Windows 5 ч.
Уязвимость BlueHammer в Windows Defender не потеряла актуальность, несмотря на апрельский патч 5 ч.
Журналисты раскрыли масштаб будущих увольнений в Xbox — под угрозой закрытия оказалась даже Arkane Studios и её Marvel’s Blade 6 ч.
ИИ научили говорить как пещерный человек — чтобы экономить миллионы на токенах 7 ч.
Meta не сумела отделаться от иска о детской зависимости от соцсетей — суд состоится 18 августа 9 ч.
Улыбаемся и машем: Quantic Dream отвергла опасения работников о судьбе Star Wars Eclipse 9 ч.
Последняя игра легендарного арт-директора Half-Life 2 отправит геймеров в апокалиптический вестерн — первый трейлер и детали Guns of Eschaton 10 ч.
Релиз российской ОС SelectOS 2.0: повышенная защищённость и поддержка ИИ-нагрузок 10 ч.
Соавтор Dragon Age назвал ИИ «страшной чумой», которая мешает разработчикам осваивать ремесло создания игр 11 ч.
Вышло официальное приложение OpenClaw для управления ИИ-агентами со смартфона 12 ч.
Новая статья: Ryzen и двухранговая DDR5: проверяем комплект G.Skill Trident Z5 Royal DDR5-6400 CL32 64GB 4 ч.
Южная Корея инвестирует почти $3 трлн в полупроводники и ИИ 5 ч.
Titan Army показала безочковый 3D-монитор M27E6V-3D с 4K, 190 Гц и очень высокой яркостью для геймеров 7 ч.
В эпоху «автоматизированной дезинформации» стало слишком легко заявлять об обнаружении инопланетян 10 ч.
Xiaomi выпустила смартфон Redmi K90 Ultra — Snapdragon 8 Elite, вентилятор и батарея на 8550 мА·ч по цене от $420 10 ч.
Проприетарные беспроводные зарядки скоро канут в Лету — на подходе единый стандарт Qi 50 Вт 10 ч.
Грядущие складные смартфоны Samsung Galaxy Z 8 Fold и Flip показались до анонса 11 ч.
Первые модули DDR5 с поддержкой AMD EXPO Ultra Low Latency оказались до 79 % дороже обычных 12 ч.
Firmus при поддержке NVIDIA развернёт в Индонезии ИИ-кластер из 170 тыс. ускорителей 13 ч.
Dreame выпустила в России робот-пылесос L60 Pro Ultra за 110 тыс. рублей 13 ч.