Сегодня 03 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные решили одну из главных проблем ИИ-моделей — создан первый ИИ с «бесконечной» памятью

Учёные из Массачусетского технологического института (MIT) элегантно решили одну из главных проблем ИИ — ограничения контекстного окна. Обычно LLM оперирует сотней-другой тысяч токенов, что не позволяет полноценно работать с многотомными архивами. Новая рекурсивная модель лишена этого недостатка, используя вместо памяти систему навигации по контексту.

 Источник изображения: The Neuron

Источник изображения: The Neuron

Новый подход реализован в архитектуре «рекурсивной языковой модели» (Recursive Language Models, RLM). Традиционные большие языковые модели удерживают всю необходимую информацию внутри так называемого контекстного окна с довольно жёстким и ограниченным числом токенов и быстро теряют точность выводов, когда объём входных данных превышает этот лимит. Модель RLM предлагает иной подход: она не пытается запомнить исходные данные целиком, а рассматривает их как внешнее пространство, по которому можно перемещаться и из которого можно извлекать релевантные фрагменты по мере необходимости. Навигация заменяет память.

Ключевое отличие RLM от LLM заключается в том, что механизм обращения к информации становится динамическим и рекурсивным (с вложениями, как в случае древовидной структуры папок файловой системы). Модель анализирует запрос, формирует поисковое действие, получает необходимые сегменты данных и повторяет процесс до достижения заданной глубины понимания. В результате архитектура способна работать с массивами информации, превышающими традиционную вместимость контекстного окна в десятки и сотни раз, без непомерного увеличения вычислительных ресурсов.

Предлагаемая технология открывает новые возможности для сфер, требующих работы с объёмными документами или сложными структурированными данными. Например, в юридической практике ИИ сможет анализировать полные архивы дел, а не только отдельные фрагменты; в программировании — воспринимать большие объёмы кода; в аналитике — сочетать и сопоставлять множество научных публикаций без предварительной обработки. Способность модели работать с масштабными наборами данных снижает риски искажений фактов и ошибок, связанных с «потерей» контекста из-за того, что он на каком-то этапе выпал из памяти модели.

Специалисты MIT предоставили как полноценную библиотеку, реализующую принципы RLM, так и минимальный эталонный код, что упростит знакомство с технологией для всех заинтересованных лиц и ускорит её внедрение. Некоторые компании уже начали адаптировать архитектуру под свои продукты, что лишний раз подтвердило применимость RLM за пределами лабораторий. Таким образом, модели Recursive Language Models могут стать значимым этапом в эволюции нейросетевых архитектур, поскольку предлагают не увеличение объёма памяти модели, а качественно новый способ работы с большими массивами информации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Головокружительный трейлер подтвердил дату выхода Denshattack! — безумного платформера про неподвластный гравитации поезд 4 мин.
Просыпайся, самурай: первую волну мартовских новинок Game Pass возглавила Cyberpunk 2077 55 мин.
Драйвер Nvidia 595.71 WHQL ограничил ручной разгон у GeForce RTX 50-й серии 58 мин.
Meta начала тестировать платформу для ИИ-поиска товаров 60 мин.
Alibaba представила малые ИИ-модели Qwen3.5, которые работают на ноутбуке и обходят аналоги OpenAI 2 ч.
SAP выплатит почти полмиллиарда доларров за то, что «заманила» Teradata в невыгодное совместное предприятие почти 20 лет назад 2 ч.
«Разница поразительна»: Capcom удалила из ремейка Resident Evil 4 скандальную защиту The Enigma Protector, и фанаты в восторге 2 ч.
Не только игры: Unreal Engine стал неотъемлемой частью всей творческой индустрии 3 ч.
Microsoft ускорила рейтрейсинг в DirectX 12 за счёт переупорядочивания лучей — прирост скорости до 90 % 5 ч.
Слухи: разработку многострадальной The Wolf Among Us 2 опять перезапустили, но релиз уже не за горами 5 ч.
Apple представила 18-ядерные процессоры M5 Pro и M5 Max «с рекордной однопоточной производительностью» 2 мин.
Apple представила новые мониторы Studio Display и Studio Display XDR по цене от $1599 17 мин.
Microsoft добавила в ROG Xbox Ally X автоматическую запись игровых хайлайтов — NPU наконец-то пригодился 2 ч.
Corning представила защитное стекло Gorilla Glass Ceramic 3 с долгосрочной прочностью 2 ч.
NVIDIA инвестировала $4 млрд в поставщиков лазеров и фотоники для ИИ ЦОД Lumentum и Coherent 2 ч.
«Росскосмос» починил стартовую площадку «Союзов» на «Байконуре» и готовится к запуску «Прогресса» 2 ч.
Иранские дроны повредили два дата-центра Amazon в ОАЭ и «зацепили» ещё один в Бахрейне 3 ч.
Теорию о магнитной памяти в двумерных материалах доказали экспериментом — ждём прорывов в ёмкости HDD? 3 ч.
Tecno анонсировала глобальные версии смартфонов Camon 50 Ultra 5G и Camon 50 4 ч.
MSI выпустила GeForce RTX 5070 Light Edition и Void Edition по мотивам World of Warcraft: Midnight 4 ч.