Сегодня 12 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Крошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAI

Samsung бросила вызов господствующей в отрасли искусственного интеллекта философии «чем больше, тем лучше» и продемонстрировала, что малая модель в связанных с рассуждениями сложных задачах может давать более качественные ответы, чем лидирующие на рынке большие языковые модели.

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Исследователь Алексия Жоликёр-Мартино (Alexia Jolicoeur-Martineau) из подразделения Samsung SAIL Montréal предложила сдвинуть парадигму в сторону более эффективных алгоритмических подходов к ИИ — потребность во всё более крупных моделях оказывается сомнительной. Архитектура и методы рассуждений малой рекурсивной модели (Tiny Recursive Model — TRM) могут оказаться важнее масштабов, открывая новые возможности для создания мощного, более доступного и дружественного к экологии ИИ.

Основным нововведением является уникальный подход TRM к решению задач. Она не генерирует окончательный ответ за один проход, как это делают большие языковые модели, а при помощи рекурсивного процесса в несколько этапов уточняет свои решения. Сначала генерируется первый черновик ответа, затем модель входит в цикл, многократно критикуя и улучшая собственную логику, совершая до 16 проходов, чтобы получить более точное окончательное решение. Это позволяет исправлять ошибки в цепочках рассуждений, зачастую вызывающих сбои в работе крупных моделей, у которых одна ошибка может сделать несостоятельным весь ответ. Идея TRM упрощает и расширяет известную ранее концепцию иерархических рассуждающих моделей (Hierarchical Reasoning Model — HRM), в которых совместно работают две небольшие нейросети. TRM обходится одной малой нейросетью, демонстрируя, что рекурсивный подход способен обеспечить более качественный результат.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

В серии сложных тестов ARC-AGI разработанная Samsung TRM на 7 млн параметров показала достойные результаты: 45 % в ARC-AGI-1 и 8 % в ARC-AGI-2. Она выступила лучше, чем такие лидеры рынка как DeepSeek-R1, Google Gemini 2.5 Pro и OpenAI o3-mini, у которых число параметров в несколько тысяч раз больше. TRM продемонстрировала удивительную способность делать выводы, опираясь на небольшие наборы обучающих данных. Обучившись на 1000 примеров судоку, она решила 87,4 % из 423 000 головоломок. Такие результаты у модели с размером всего в 0,01 % от размеров её гигантских конкурентов подтверждают эффективность метода рекурсивных рассуждений.

Исследование может оказать влияние на дальнейшее развитие отрасли ИИ: крупнейшие игроки продолжают вкладывать миллиарды долларов в разработку моделей на сотни миллиардов и триллионы параметров, исходя из того, что масштаб определяет результат. Исследователи Samsung ставят этот тезис под сомнение, утверждая, что интеллектуальные алгоритмы могут оказаться эффективнее, чем основанная на прямом переборе высокая вычислительная мощность. Модели, способные давать качественные ответы, смогут разрабатывать небольшие организации с ограниченными вычислительными ресурсами. ИИ сможет эффективнее работать локально на мобильных устройствах без потребности в облачных вычислениях. Итеративный метод TRM означает, что на обработку одной задачи требуется больше времени, но в некоторых случаях правильный ответ оказывается важнее скорости.

Автор открыла исходный код модели, приглашая сообщество проверить её выводы и принять участие в дальнейшем развитии проекта. У ИИ появилась возможность стать мощнее, эффективнее и доступнее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Соавтор Overwatch вернулся с новой игрой — мультиплеерным шутером The Legend of California в открытом мире Дикого Запада 29 мин.
«Эксперт РА» перешло на ПО для управления динамической ИТ-инфраструктурой от «Базиса» 36 мин.
«Эксперт РА» перешло на ПО для управления динамической ИТ-инфраструктурой от «Базиса» 37 мин.
Perplexity представила Personal Computer — облачного ИИ-агента для компьютеров Apple Mac mini 2 ч.
Создаваемые в Google Genie 3 игровые миры начинают «разрушаться» примерно через минуту 3 ч.
AMD анонсировала FSR Diamond для графики Xbox следующего поколения 4 ч.
Google рассказала, как улучшит производительность и автономность Android-смартфонов 10 ч.
Microsoft добавит «режим Xbox» на каждый компьютер с Windows 11 11 ч.
Valve отвергла обвинения властей Нью-Йорка в организации азартных игр и сравнила лутбоксы в Counter-Strike 2 c Лабубу 12 ч.
Две критические уязвимости Microsoft Office получили экстренные патчи 12 ч.
Meta представила четыре новых ИИ-ускорителя MTIA — с FP8-производительностью до 10 Пфлопс 24 мин.
Участники рынка заявили, что в ближайшие годы цены на память не снизятся 57 мин.
Meta раскрыла подробности своих планов по выпуску ИИ-чипов 2 ч.
Интерфейс складного iPhone будет напоминать Apple iPad 2 ч.
Intel столкнулась с иском со стороны акционера из-за сделки с американскими властями 3 ч.
Складной смартфон Oppo Find N6, релиз которого намечен на 17 марта, получил ранний обзор и распаковку 3 ч.
Илон Маск объяснил, что будет представлять собой Macrohard — совместный проект xAI и Tesla 5 ч.
Новая статья: Обзор GIGABYTE GAMING A16 PRO: самый доступный игровой ноутбук с графикой на 16 Гбайт 10 ч.
Xbox Project Helix получит ИИ-генератор кадров и рейтрейсинг нового поколения — девкиты выйдут в 2027 году 11 ч.
Valve рассказала, как будет проверять игры на совместимость с приставкой Steam Machine и VR-гарнитурой Steam Frame 12 ч.