Сегодня 25 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Крошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAI

Samsung бросила вызов господствующей в отрасли искусственного интеллекта философии «чем больше, тем лучше» и продемонстрировала, что малая модель в связанных с рассуждениями сложных задачах может давать более качественные ответы, чем лидирующие на рынке большие языковые модели.

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Исследователь Алексия Жоликёр-Мартино (Alexia Jolicoeur-Martineau) из подразделения Samsung SAIL Montréal предложила сдвинуть парадигму в сторону более эффективных алгоритмических подходов к ИИ — потребность во всё более крупных моделях оказывается сомнительной. Архитектура и методы рассуждений малой рекурсивной модели (Tiny Recursive Model — TRM) могут оказаться важнее масштабов, открывая новые возможности для создания мощного, более доступного и дружественного к экологии ИИ.

Основным нововведением является уникальный подход TRM к решению задач. Она не генерирует окончательный ответ за один проход, как это делают большие языковые модели, а при помощи рекурсивного процесса в несколько этапов уточняет свои решения. Сначала генерируется первый черновик ответа, затем модель входит в цикл, многократно критикуя и улучшая собственную логику, совершая до 16 проходов, чтобы получить более точное окончательное решение. Это позволяет исправлять ошибки в цепочках рассуждений, зачастую вызывающих сбои в работе крупных моделей, у которых одна ошибка может сделать несостоятельным весь ответ. Идея TRM упрощает и расширяет известную ранее концепцию иерархических рассуждающих моделей (Hierarchical Reasoning Model — HRM), в которых совместно работают две небольшие нейросети. TRM обходится одной малой нейросетью, демонстрируя, что рекурсивный подход способен обеспечить более качественный результат.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

В серии сложных тестов ARC-AGI разработанная Samsung TRM на 7 млн параметров показала достойные результаты: 45 % в ARC-AGI-1 и 8 % в ARC-AGI-2. Она выступила лучше, чем такие лидеры рынка как DeepSeek-R1, Google Gemini 2.5 Pro и OpenAI o3-mini, у которых число параметров в несколько тысяч раз больше. TRM продемонстрировала удивительную способность делать выводы, опираясь на небольшие наборы обучающих данных. Обучившись на 1000 примеров судоку, она решила 87,4 % из 423 000 головоломок. Такие результаты у модели с размером всего в 0,01 % от размеров её гигантских конкурентов подтверждают эффективность метода рекурсивных рассуждений.

Исследование может оказать влияние на дальнейшее развитие отрасли ИИ: крупнейшие игроки продолжают вкладывать миллиарды долларов в разработку моделей на сотни миллиардов и триллионы параметров, исходя из того, что масштаб определяет результат. Исследователи Samsung ставят этот тезис под сомнение, утверждая, что интеллектуальные алгоритмы могут оказаться эффективнее, чем основанная на прямом переборе высокая вычислительная мощность. Модели, способные давать качественные ответы, смогут разрабатывать небольшие организации с ограниченными вычислительными ресурсами. ИИ сможет эффективнее работать локально на мобильных устройствах без потребности в облачных вычислениях. Итеративный метод TRM означает, что на обработку одной задачи требуется больше времени, но в некоторых случаях правильный ответ оказывается важнее скорости.

Автор открыла исходный код модели, приглашая сообщество проверить её выводы и принять участие в дальнейшем развитии проекта. У ИИ появилась возможность стать мощнее, эффективнее и доступнее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Бум ИИ помог Micron нарастить норму прибыли до впечатляющих 84,9 % 2 ч.
Qualcomm ожидает, что к 2029 году будет получать от реализации серверных чипов по $15 млрд в год 4 ч.
Новая статья: Обзор HONOR MagicPad 4: самый изящный планшет 9 ч.
Усиленная версия китайского робопса Lynx M20S прошла по горным склонам в 30-градусный мороз 9 ч.
Акции Cerebras Systems упали, несмотря на почти двукратный рост выручки 11 ч.
Zoox обновила своё роботакси — старт массовых перевозок людей за деньги намечен на конец года 14 ч.
OpenAI и Broadcom представили кастомный ускоритель Jalapeño для ИИ-инференса 14 ч.
Власти США потребовали от Meta передать свои ИИ-модели на проверку безопасности 15 ч.
OpenAI представила свой дебютный чип Jalapeno — он сулит удешевление работы ChatGPT 15 ч.
Вирджиния первой в истории одобрила налог на электричество для ЦОД, включая то, что операторы будут генерировать сами 16 ч.