Сегодня 25 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные решили одну из главных проблем ИИ-моделей — создан первый ИИ с «бесконечной» памятью

Учёные из Массачусетского технологического института (MIT) элегантно решили одну из главных проблем ИИ — ограничения контекстного окна. Обычно LLM оперирует сотней-другой тысяч токенов, что не позволяет полноценно работать с многотомными архивами. Новая рекурсивная модель лишена этого недостатка, используя вместо памяти систему навигации по контексту.

 Источник изображения: The Neuron

Источник изображения: The Neuron

Новый подход реализован в архитектуре «рекурсивной языковой модели» (Recursive Language Models, RLM). Традиционные большие языковые модели удерживают всю необходимую информацию внутри так называемого контекстного окна с довольно жёстким и ограниченным числом токенов и быстро теряют точность выводов, когда объём входных данных превышает этот лимит. Модель RLM предлагает иной подход: она не пытается запомнить исходные данные целиком, а рассматривает их как внешнее пространство, по которому можно перемещаться и из которого можно извлекать релевантные фрагменты по мере необходимости. Навигация заменяет память.

Ключевое отличие RLM от LLM заключается в том, что механизм обращения к информации становится динамическим и рекурсивным (с вложениями, как в случае древовидной структуры папок файловой системы). Модель анализирует запрос, формирует поисковое действие, получает необходимые сегменты данных и повторяет процесс до достижения заданной глубины понимания. В результате архитектура способна работать с массивами информации, превышающими традиционную вместимость контекстного окна в десятки и сотни раз, без непомерного увеличения вычислительных ресурсов.

Предлагаемая технология открывает новые возможности для сфер, требующих работы с объёмными документами или сложными структурированными данными. Например, в юридической практике ИИ сможет анализировать полные архивы дел, а не только отдельные фрагменты; в программировании — воспринимать большие объёмы кода; в аналитике — сочетать и сопоставлять множество научных публикаций без предварительной обработки. Способность модели работать с масштабными наборами данных снижает риски искажений фактов и ошибок, связанных с «потерей» контекста из-за того, что он на каком-то этапе выпал из памяти модели.

Специалисты MIT предоставили как полноценную библиотеку, реализующую принципы RLM, так и минимальный эталонный код, что упростит знакомство с технологией для всех заинтересованных лиц и ускорит её внедрение. Некоторые компании уже начали адаптировать архитектуру под свои продукты, что лишний раз подтвердило применимость RLM за пределами лабораторий. Таким образом, модели Recursive Language Models могут стать значимым этапом в эволюции нейросетевых архитектур, поскольку предлагают не увеличение объёма памяти модели, а качественно новый способ работы с большими массивами информации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
AMD выпустила систему разгона памяти EXPO 1.2 — потенциал она раскроет на Zen 6 4 ч.
Microsoft позволит бесконечно откладывать обновления Windows 11 в течение 35-дневного периода 7 ч.
Google инвестирует в Anthropic $40 млрд и предоставит 5 ГВт вычислительных мощностей на фоне обострившейся ИИ-гонки 13 ч.
Новая статья: Mouse: P.I. For Hire — чёрно-белый Doom с мышами. Рецензия 20 ч.
ОАЭ намерены перевести половину госсектора под управление агентного ИИ за два года 21 ч.
«Открыла новую главу для корейских игр»: Crimson Desert заслужила уважение премьер-министра Южной Кореи 22 ч.
Режиссёр Resident Evil Requiem засветил продажи игры на фотографии с корпоратива Capcom 24 ч.
Вопреки опасениям фанатов, в Assassin’s Creed Black Flag Resynced всё-таки будет кровь и «даже не в виде платного DLC» 24-04 19:29
«Готическая версия Returnal»: трейлер хоррор-шутера Luna Abyss с датой релиза вызвал у игроков конкретные ассоциации 24-04 18:47
«Очень рады и до сих пор ошеломлены»: продажи Clair Obscur: Expedition 33 к первой годовщине превысили 8 миллионов копий 24-04 17:46
Мышь с 2,25" сенсорным экраном: Turtle Beach представила Command Series MC7 за $160 2 ч.
Энтузиаст взломал VBIOS на древней видеокарте S3, чтобы сделать чёрный цвет по-настоящему чёрным 2 ч.
Астрономы впервые наблюдали необъяснимый взрыв сверхновой — для него пришлось выдумывать новую теорию 2 ч.
$50 за защиту RTX 5090 от выгорания: Asus раскрыла цену специального кабеля ROG Equalizer 3 ч.
Маск перестал считать OpenAI и Сэма Альтмана мошенниками, но судиться не передумал 4 ч.
Сотрудников Nvidia и лично Хуанга восхитила работа OpenAI Codex на основе GPT-5.5 4 ч.
Геймерский смартфон OnePlus Ace 6 Ultra с чипом MediaTek Dimensity 9500 и батареей на 8600 мА·ч представят 28 апреля 4 ч.
Японский кубсат-оригами OrigamiSat-2 успешно расправился на орбите и вырос в 25 раз 4 ч.
Axiomtek PICO570 — x86-одноплатник на базе Intel Meteor Lake для периферийных ИИ-задач 6 ч.
Новая версия набора команд SCSI улучшает масштабируемость и отказоустойчивость СХД 6 ч.