Сегодня 19 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ

Сравнительный анализ моделей ИИ крайне непрост, а их создателей часто обвиняют в предвзятости, пристрастности и усложнении понимания результатов тестов для обычных людей. Поэтому вместо того чтобы зацикливаться на абстрактных математических и логических испытаниях, исследователи предложили протестировать ИИ при помощи классического платформера Super Mario Bros. от Nintendo.

 Источник изображения: Hao AI Lab

Источник изображения: Hao AI Lab

В эксперименте использовалась эмулированная версия Super Mario Bros., которая была интегрирована с пользовательским фреймворком GamingAgent от исследователей Hao AI Lab из Калифорнийского университета в Сан-Диего. Эта система позволяла моделям ИИ управлять Марио, генерируя код Python. Все модели получали одинаковые базовые инструкции вроде «Перепрыгни через этого врага», а также визуализации состояния игры в виде скриншотов.

Хотя со стороны Super Mario Bros. кажется простым двухмерным платформером, исследователи обнаружили, что классическая игра Nintendo бросает серьёзный вызов ИИ, заставляя планировать сложные последовательности движений и на лету адаптировать стратегии игрового процесса.

Лучшей моделью в освоении Super Mario Bros. исследователи признали Claude 3.7 от Anthropic, которая продемонстрировала впечатляющие рефлексы, связав точные прыжки и умело избегая врагов. Её предшественница, Claude 3.5, также показала достойные результаты, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google отстали от конкурентов.

Как оказалось, логическое мышление не является ключом к успеху в Super Mario Bros. — важен расчёт времени. Даже небольшая задержка может отправить Марио на предыдущую контрольную точку. Исследователи предполагают, что более «сознательные» и склонные к рассуждению модели, вероятно, слишком долго рассчитывали следующие шаги, что приводило к частым неудачам.

Конечно, использование ретроигр для оценки ИИ — это по большей части эксперимент. Способность ИИ победить Super Mario Bros. не определяет степень его реальной пользы, хотя наблюдать, как обученные на миллиардах параметров модели сражаются (и часто проигрывают) с детской, казалось бы, игрой несомненно увлекательно.

Для желающих поставить самостоятельный эксперимент Hao AI Lab открыла исходный код своей GamingAgent на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Nvidia выпустила драйвер с поддержкой GeForce RTX 5060 33 мин.
Календарь релизов — 19–25 мая: RoadCraft, Deliver At All Costs и Tainted Grail: The Fall of Avalon 50 мин.
Преступники пришли за криптоэлитой в реальном мире — участились похищения, нападения и запугивания 2 ч.
Microsoft «провалила» облачную реформу в Европе 3 ч.
Nvidia уточнила, когда в Doom: The Dark Ages на ПК появится трассировка пути и реконструкция лучей DLSS 3 ч.
«До сих пор мурашки от музыки»: официальный трейлер в честь 10-летия The Witcher 3: Wild Hunt подарил фанатам мощный заряд ностальгии 4 ч.
HPE предложила клиентам VMware новые решения с Morpheus VM Essentials 7 ч.
Журналисты выяснили, какие функции Nintendo Switch 2 будут недоступны игрокам в России 8 ч.
«Самое позорное, что я видел от этой компании»: разработчики Star Citizen возмутили игроков анонсом геймплейных апгрейдов за реальные деньги 9 ч.
Doom: The Dark Ages показала в Steam худший пиковый онлайн среди игр новейшей трилогии, но этому есть объяснение 10 ч.
MSI представила свою первую портативную консоль на чипе AMD — это Claw A8 с мощным Ryzen Z2 Extreme 58 мин.
Asus представила флагманский Wi-Fi-роутер ROG Rapture GT-BE19000AI со встроенным ИИ для геймеров 2 ч.
Asus, HP, Dell и другие партнёры Nvidia представили настольные ИИ-суперкомпьютеры DGX Spark и рабочие станции DGX Station 2 ч.
Asus показала флагманскую игровую мышь ROG Harpe II Ace весом 48 грамм и коврик с улучшенным теплоотводом 2 ч.
Asus представила видеокарты, материнские платы и корпуса с поддержкой BTF 2.5 для сборки «чистых» ПК 3 ч.
Asus представила «самый быстрый киберспортивный монитор» — Strix Ace XG248QSG разгоняется до 610 Гц 3 ч.
Asus представила XG Station 3 для подключения огромных видеокарт к ноутбукам через Thunderbolt 5 4 ч.
Анонсированы смартфоны Huawei Nova 14 и Nova 14 Pro без следов Android и со 100-Вт зарядкой 4 ч.
Asus показала огромную видеокарту RTX 5080 Noctua Edition и «адскую» ROG Astral RTX 5080 Doom Edition 5 ч.
Huawei представила смартфон Nova 14 Ultra со спутниковой связью и новейшей HarmonyOS 5 5 ч.