Сегодня 11 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Крошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAI

Samsung бросила вызов господствующей в отрасли искусственного интеллекта философии «чем больше, тем лучше» и продемонстрировала, что малая модель в связанных с рассуждениями сложных задачах может давать более качественные ответы, чем лидирующие на рынке большие языковые модели.

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Исследователь Алексия Жоликёр-Мартино (Alexia Jolicoeur-Martineau) из подразделения Samsung SAIL Montréal предложила сдвинуть парадигму в сторону более эффективных алгоритмических подходов к ИИ — потребность во всё более крупных моделях оказывается сомнительной. Архитектура и методы рассуждений малой рекурсивной модели (Tiny Recursive Model — TRM) могут оказаться важнее масштабов, открывая новые возможности для создания мощного, более доступного и дружественного к экологии ИИ.

Основным нововведением является уникальный подход TRM к решению задач. Она не генерирует окончательный ответ за один проход, как это делают большие языковые модели, а при помощи рекурсивного процесса в несколько этапов уточняет свои решения. Сначала генерируется первый черновик ответа, затем модель входит в цикл, многократно критикуя и улучшая собственную логику, совершая до 16 проходов, чтобы получить более точное окончательное решение. Это позволяет исправлять ошибки в цепочках рассуждений, зачастую вызывающих сбои в работе крупных моделей, у которых одна ошибка может сделать несостоятельным весь ответ. Идея TRM упрощает и расширяет известную ранее концепцию иерархических рассуждающих моделей (Hierarchical Reasoning Model — HRM), в которых совместно работают две небольшие нейросети. TRM обходится одной малой нейросетью, демонстрируя, что рекурсивный подход способен обеспечить более качественный результат.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

В серии сложных тестов ARC-AGI разработанная Samsung TRM на 7 млн параметров показала достойные результаты: 45 % в ARC-AGI-1 и 8 % в ARC-AGI-2. Она выступила лучше, чем такие лидеры рынка как DeepSeek-R1, Google Gemini 2.5 Pro и OpenAI o3-mini, у которых число параметров в несколько тысяч раз больше. TRM продемонстрировала удивительную способность делать выводы, опираясь на небольшие наборы обучающих данных. Обучившись на 1000 примеров судоку, она решила 87,4 % из 423 000 головоломок. Такие результаты у модели с размером всего в 0,01 % от размеров её гигантских конкурентов подтверждают эффективность метода рекурсивных рассуждений.

Исследование может оказать влияние на дальнейшее развитие отрасли ИИ: крупнейшие игроки продолжают вкладывать миллиарды долларов в разработку моделей на сотни миллиардов и триллионы параметров, исходя из того, что масштаб определяет результат. Исследователи Samsung ставят этот тезис под сомнение, утверждая, что интеллектуальные алгоритмы могут оказаться эффективнее, чем основанная на прямом переборе высокая вычислительная мощность. Модели, способные давать качественные ответы, смогут разрабатывать небольшие организации с ограниченными вычислительными ресурсами. ИИ сможет эффективнее работать локально на мобильных устройствах без потребности в облачных вычислениях. Итеративный метод TRM означает, что на обработку одной задачи требуется больше времени, но в некоторых случаях правильный ответ оказывается важнее скорости.

Автор открыла исходный код модели, приглашая сообщество проверить её выводы и принять участие в дальнейшем развитии проекта. У ИИ появилась возможность стать мощнее, эффективнее и доступнее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
РКН перешёл к полной блокировке YouTube спустя 1,5 года «замедления» — эксперты связали это с мерами против Telegram 4 ч.
Nothing запустила бета-версию Essential Apps — ИИ-конструктора мини-приложений 6 ч.
Nebius Аркадия Воложа купит за $275 млн разработчика поисковых систем для ИИ-агентов Tavily 6 ч.
Тактический роглайк о разведении кошек Mewgenics от автора The Binding of Isaac и Super Meat Boy стартовал в Steam с рейтингом 97 % 7 ч.
Анонсирована Terrinoth: Heroes of Descent — тактическая RPG по популярной настольной игре Descent 7 ч.
Спустя шесть лет после релиза средневековая песочница Besiege отправит игроков покорять космос — подробности аддона The Broken Beyond 8 ч.
ИИ научился формировать политические взгляды так же эффективно, как человек — и людей это не смущает 9 ч.
DuckDuckGo добавила голосовое общение с ИИ-ботом Duck.ai с защитой приватности 9 ч.
Напряжённый трейлер раскрыл дату выхода нелинейного хоррора нового поколения Directive 8020 от создателей Until Dawn 9 ч.
Google упростила удаление персональных данных и интимных фото из поиска 10 ч.
Новая статья: Обзор смартфона vivo X300 Pro: маленькие изменения, которые ведут к большому результату 5 ч.
Filum представила серию беспроводных клавиатур FL-WKB с ярким дизайном и подключением по Bluetooth или 2,4 ГГц 6 ч.
Представлены доступные геймерские мониторы AOC Gaming 24G4ZR и AOC Gaming 27G4ZR на панелях Fast IPS 9 ч.
Камера для звёзд и туманностей: OM System представила OM-3 Astro, которая видит больше обычных беззеркалок 9 ч.
Путь к 1 нм: в TSMC одобрили рекордные $45 млрд инвестиций в производство 10 ч.
Cisco представила 102,4-Тбит/с чип-коммутатор Silicon One G300 11 ч.
Китай поднял в небо крупнейшую «летающую маршрутку» — eVTOL на 10 пассажиров и с 28 двигателями 11 ч.
AMD назначила Ариэля Келмана директором по маркетингу — с фокусом на дата-центры и ИИ 12 ч.
SMIC показала 61-процентный рост выручки на фоне ИИ-бума, санкций и импортозамещения 13 ч.
IBM сворачивает продажи серверов POWER10 14 ч.