Крошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAI

Samsung бросила вызов господствующей в отрасли искусственного интеллекта философии «чем больше, тем лучше» и продемонстрировала, что малая модель в связанных с рассуждениями сложных задачах может давать более качественные ответы, чем лидирующие на рынке большие языковые модели.

Источник изображения: Steve Johnson / unsplash.com

Исследователь Алексия Жоликёр-Мартино (Alexia Jolicoeur-Martineau) из подразделения Samsung SAIL Montréal предложила сдвинуть парадигму в сторону более эффективных алгоритмических подходов к ИИ — потребность во всё более крупных моделях оказывается сомнительной. Архитектура и методы рассуждений малой рекурсивной модели (Tiny Recursive Model — TRM) могут оказаться важнее масштабов, открывая новые возможности для создания мощного, более доступного и дружественного к экологии ИИ.

Основным нововведением является уникальный подход TRM к решению задач. Она не генерирует окончательный ответ за один проход, как это делают большие языковые модели, а при помощи рекурсивного процесса в несколько этапов уточняет свои решения. Сначала генерируется первый черновик ответа, затем модель входит в цикл, многократно критикуя и улучшая собственную логику, совершая до 16 проходов, чтобы получить более точное окончательное решение. Это позволяет исправлять ошибки в цепочках рассуждений, зачастую вызывающих сбои в работе крупных моделей, у которых одна ошибка может сделать несостоятельным весь ответ. Идея TRM упрощает и расширяет известную ранее концепцию иерархических рассуждающих моделей (Hierarchical Reasoning Model — HRM), в которых совместно работают две небольшие нейросети. TRM обходится одной малой нейросетью, демонстрируя, что рекурсивный подход способен обеспечить более качественный результат.

Источник изображения: BoliviaInteligente / unsplash.com

В серии сложных тестов ARC-AGI разработанная Samsung TRM на 7 млн параметров показала достойные результаты: 45 % в ARC-AGI-1 и 8 % в ARC-AGI-2. Она выступила лучше, чем такие лидеры рынка как DeepSeek-R1, Google Gemini 2.5 Pro и OpenAI o3-mini, у которых число параметров в несколько тысяч раз больше. TRM продемонстрировала удивительную способность делать выводы, опираясь на небольшие наборы обучающих данных. Обучившись на 1000 примеров судоку, она решила 87,4 % из 423 000 головоломок. Такие результаты у модели с размером всего в 0,01 % от размеров её гигантских конкурентов подтверждают эффективность метода рекурсивных рассуждений.

Исследование может оказать влияние на дальнейшее развитие отрасли ИИ: крупнейшие игроки продолжают вкладывать миллиарды долларов в разработку моделей на сотни миллиардов и триллионы параметров, исходя из того, что масштаб определяет результат. Исследователи Samsung ставят этот тезис под сомнение, утверждая, что интеллектуальные алгоритмы могут оказаться эффективнее, чем основанная на прямом переборе высокая вычислительная мощность. Модели, способные давать качественные ответы, смогут разрабатывать небольшие организации с ограниченными вычислительными ресурсами. ИИ сможет эффективнее работать локально на мобильных устройствах без потребности в облачных вычислениях. Итеративный метод TRM означает, что на обработку одной задачи требуется больше времени, но в некоторых случаях правильный ответ оказывается важнее скорости.

Автор открыла исходный код модели, приглашая сообщество проверить её выводы и принять участие в дальнейшем развитии проекта. У ИИ появилась возможность стать мощнее, эффективнее и доступнее.