Сегодня 23 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → super mario bros.

Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ

Сравнительный анализ моделей ИИ крайне непрост, а их создателей часто обвиняют в предвзятости, пристрастности и усложнении понимания результатов тестов для обычных людей. Поэтому вместо того чтобы зацикливаться на абстрактных математических и логических испытаниях, исследователи предложили протестировать ИИ при помощи классического платформера Super Mario Bros. от Nintendo.

 Источник изображения: Hao AI Lab

Источник изображения: Hao AI Lab

В эксперименте использовалась эмулированная версия Super Mario Bros., которая была интегрирована с пользовательским фреймворком GamingAgent от исследователей Hao AI Lab из Калифорнийского университета в Сан-Диего. Эта система позволяла моделям ИИ управлять Марио, генерируя код Python. Все модели получали одинаковые базовые инструкции вроде «Перепрыгни через этого врага», а также визуализации состояния игры в виде скриншотов.

Хотя со стороны Super Mario Bros. кажется простым двухмерным платформером, исследователи обнаружили, что классическая игра Nintendo бросает серьёзный вызов ИИ, заставляя планировать сложные последовательности движений и на лету адаптировать стратегии игрового процесса.

Лучшей моделью в освоении Super Mario Bros. исследователи признали Claude 3.7 от Anthropic, которая продемонстрировала впечатляющие рефлексы, связав точные прыжки и умело избегая врагов. Её предшественница, Claude 3.5, также показала достойные результаты, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google отстали от конкурентов.

Как оказалось, логическое мышление не является ключом к успеху в Super Mario Bros. — важен расчёт времени. Даже небольшая задержка может отправить Марио на предыдущую контрольную точку. Исследователи предполагают, что более «сознательные» и склонные к рассуждению модели, вероятно, слишком долго рассчитывали следующие шаги, что приводило к частым неудачам.

Конечно, использование ретроигр для оценки ИИ — это по большей части эксперимент. Способность ИИ победить Super Mario Bros. не определяет степень его реальной пользы, хотя наблюдать, как обученные на миллиардах параметров модели сражаются (и часто проигрывают) с детской, казалось бы, игрой несомненно увлекательно.

Для желающих поставить самостоятельный эксперимент Hao AI Lab открыла исходный код своей GamingAgent на GitHub.

Спидраннер прошёл New Super Mario Bros. Wii с привязанными к телу контроллерами, одновременно играя на пианино

Проходить видеоигры на скорость — дело и без того непростое, но для спидрана платформера New Super Mario Bros. Wii на фестивале Awesome Games Done Quick 2025 стример FunkopotamusWes решил усложнить себе задачу ещё больше.

 Источник изображения: Nintendo

Источник изображения: Nintendo

В отличие от обычного спидрана, скоростное прохождение New Super Mario Bros. Wii в исполнении FunkopotamusWes сопровождалось одновременной игрой на пианино — энтузиаст параллельно воспроизводил саундтрек платформера.

Для этого FunkopotamusWes (или просто Wes) написал собственные аранжировки музыкальных композиций из New Super Mario Bros. Wii (ознакомиться с ними можно по ссылке), соответствующие его уровню овладения инструментом.

 Источник изображения: X (Games Done Quick)

Источник изображения: X (Games Done Quick)

Так как руки Wes заняты игрой на пианино, контролировать персонажа New Super Mario Bros. Wii энтузиасту пришлось необычным способом — привязав контроллеры (спидраннер адаптировал для игры пару Joy-Con от Switch) к своему телу.

Система управления выглядит следующим образом:

  • первый Joy-Con (привязан к голове) — Wes управляет Марио, наклоняя голову в разные стороны;
  • второй Joy-Con (привязан к ступне) — бампер (бег) спидраннер прожимает пальцем ноги, а для прыжка (нажатие на стик) наступает на контроллер.

Хотя итоговое время прохождения оказалось далеко от мирового рекорда, присутствующие на Awesome Games Done Quick 2025 зрители в едином порыве повставали со своих мест, чтобы отметить достижение Wes овациями.

Как будто прохождения на скорость, параллельно играя на пианино и управляя персонажем головой и ногой, было мало, после завершения спидрана Wes перепрошёл в такой же манере первый уровень, но уже с завязанными глазами.


window-new
Soft
Hard
Тренды 🔥
Microsoft объявила о партнёрстве между Xbox и Discord, но скрыла детали 6 ч.
Google начала рекламировать поумневшую Apple Siri — в её основу ляжет ИИ Gemini 7 ч.
Tides of Tomorrow уже в продаже: асинхронное приключение от авторов Road 96, где игрок расплачивается за ошибки своих предшественников 7 ч.
Tencent и Alibaba готовы инвестировать в DeepSeek — стартап уже оценивается в более чем $20 млрд 8 ч.
В Steam и на консолях стартовала закрытая «бета» амбициозного ролевого боевика The Expanse: Osiris Reborn в духе Mass Effect — 35 минут геймплея 11 ч.
Первая за 25 лет новая игра о приключениях разумного дельфина Экко войдёт в сборник Ecco the Dolphin: Complete — подробности «правильного ремастера» 11 ч.
«Google Карты» скоро получат мощную порцию искусственного интеллекта 12 ч.
Паранормальный экшен Control теперь доступен на iPhone и iPad — с переработанным управлением и не только 12 ч.
В популярном ИИ-протоколе нашли критическую уязвимость — отвечающая за него Anthropic ничего исправлять не будет 12 ч.
Разработчики приложения Telega пожаловались на Apple в ФАС 13 ч.
Для обучения и инференса — Google анонсировала ИИ-ускорители TPU 8t и TPU 8i 3 ч.
Новая статья: Да воссияет кремний 5 ч.
Новый великий космический телескоп NASA «Роман» прошёл основные испытания — до запуска меньше пяти месяцев 7 ч.
BMW представила флагманскую «семёрку» на платформе Neue Klasse — спорный стиль, много экранов и «скрытые технологии» 8 ч.
Google представила пару ИИ-чипов TPU 8 с упором на эффективность и комплексный ИИ-сервис Workspace Intelligence 9 ч.
Начались продажи флагманского процессора Ryzen 9 9950X3D2 Dual Edition с двойным 3D V-Cache за $899 9 ч.
Meta подала заявку на расширение кампуса в Эль-Пасо и анонсировала 28-й по счёту дата-центр в США — в Талсе 10 ч.
Стартап Миры Мурати закупил у Google мощности для обучения ИИ на несколько миллиардов 12 ч.
Asus перестала выпускать смартфоны, но готовит большой планшет 12 ч.
Anthropic ищет аналитика для оценки геополитических рисков и угроз персоналу, офисам и дата-центрам 13 ч.