Сегодня 05 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → искусственный интеллект

Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ

Сравнительный анализ моделей ИИ крайне непрост, а их создателей часто обвиняют в предвзятости, пристрастности и усложнении понимания результатов тестов для обычных людей. Поэтому вместо того чтобы зацикливаться на абстрактных математических и логических испытаниях, исследователи предложили протестировать ИИ при помощи классического платформера Super Mario Bros. от Nintendo.

 Источник изображения: Hao AI Lab

Источник изображения: Hao AI Lab

В эксперименте использовалась эмулированная версия Super Mario Bros., которая была интегрирована с пользовательским фреймворком GamingAgent от исследователей Hao AI Lab из Калифорнийского университета в Сан-Диего. Эта система позволяла моделям ИИ управлять Марио, генерируя код Python. Все модели получали одинаковые базовые инструкции вроде «Перепрыгни через этого врага», а также визуализации состояния игры в виде скриншотов.

Хотя со стороны Super Mario Bros. кажется простым двухмерным платформером, исследователи обнаружили, что классическая игра Nintendo бросает серьёзный вызов ИИ, заставляя планировать сложные последовательности движений и на лету адаптировать стратегии игрового процесса.

Лучшей моделью в освоении Super Mario Bros. исследователи признали Claude 3.7 от Anthropic, которая продемонстрировала впечатляющие рефлексы, связав точные прыжки и умело избегая врагов. Её предшественница, Claude 3.5, также показала достойные результаты, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google отстали от конкурентов.

Как оказалось, логическое мышление не является ключом к успеху в Super Mario Bros. — важен расчёт времени. Даже небольшая задержка может отправить Марио на предыдущую контрольную точку. Исследователи предполагают, что более «сознательные» и склонные к рассуждению модели, вероятно, слишком долго рассчитывали следующие шаги, что приводило к частым неудачам.

Конечно, использование ретроигр для оценки ИИ — это по большей части эксперимент. Способность ИИ победить Super Mario Bros. не определяет степень его реальной пользы, хотя наблюдать, как обученные на миллиардах параметров модели сражаются (и часто проигрывают) с детской, казалось бы, игрой несомненно увлекательно.

Для желающих поставить самостоятельный эксперимент Hao AI Lab открыла исходный код своей GamingAgent на GitHub.

AMD представила «лучшие и самые стабильные» графические драйверы — Adrenalin 25.3.1 с множеством ИИ-функций

Одновременно с анонсом видеокарт нового поколения Radeon RX 9070 XT и RX 9070 компания AMD представила и новые драйверы Adrenalin версии 25.3.1. Самым серьёзным изменением стало масштабное внедрение искусственного интеллекта для обнаружения нестабильности и ошибок рендеринга. В связи с этим AMD уже успела назвать новые драйвера «лучшими и самыми стабильными драйверами, которые она когда-либо выпускала, с меньшим количеством ошибок рендеринга».

 Источник изображений: AMD

Источник изображений: AMD

AMD представила целый ряд простых функции на базе ИИ. Все они управляются новым менеджером установки AMD, значок которого по умолчанию находится рядом со значком ПО AMD в системном трее. Помимо обновления драйверов видеокарты, он умеет обновлять драйверы чипсета материнских плат AMD.

В комплект новых драйверов включены также такие ИИ-функции, как AMD Chat, AMD Image Inspector и AI Apps Manager.

AMD Chat — это чат-бот, разработанный для ответов на вопросы, касающиеся конфигурации оборудования ПК пользователя. У чат-бота можно узнать температуру графического процессора, производительность центрального процессора, эффективность охлаждения и много другой подобной информации. Ещё AMD Chat можно попросить изменить настройки Adrenalin, правда поддерживает он пока только английский и китайский. Но зато умеет генерировать изображения. Причём ИИ работает полностью локально. Однако требование как минимум 25 Гбайт места на накопителе может остановить многих пользователей от загрузки этого ИИ-помощника.

Image Inspector умеет находить и сообщать об ошибках и неполадках рендеринга. AMD в новых драйверах уже использует ИИ для поиска внутренних проблем, а Image Inspector — это только дополнительная функция, которая вовлекает пользователя в этот процесс. Используя специализированные ресурсы графического процессора, Image Inspector может автоматически фиксировать ошибки рендеринга и отправлять их в AMD. Степень влияние этой функции на производительность ещё только предстоит выяснить.

AI Apps Manager составляет и предоставляет владельцу ПК список программных утилит, использующих ИИ, которые уже установлены на его компьютере или доступны для установки.


window-new
Soft
Hard
Тренды 🔥
Amazon собралась бросить вызов OpenAI, Google и Anthropic, и готовит собственную рассуждающую ИИ-модель 6 ч.
«Новый стандарт для жанра и даже больше»: кооперативное приключение Split Fiction от создателей It Takes Two привело критиков в восторг 7 ч.
«Сбер» предсказал всплеск ИИ-мошенничества, к которому никто не готов, к середине этого года 7 ч.
Activision наконец анонсировала Tony Hawk’s Pro Skater 3 + 4 — с кроссплеем, релизом в июле и Палачом Рока из Doom 8 ч.
Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ 9 ч.
Слухи: Ubisoft перезапустила разработку мультиплеерной Far Cry в духе Escape from Tarkov, а у Far Cry 7 всё хорошо 10 ч.
Инсайдер: релиз Gears of War: E-Day отложат на 2026 год, но есть и хорошая новость 12 ч.
Китайские власти порекомендовали специалистам в области ИИ не ездить в США 13 ч.
IBM закрыла R&D-центр в Китае, оставив без работы 1,8 тыс. специалистов 15 ч.
Ubisoft объяснила, почему тянула с разработкой Assassin’s Creed Shadows, хотя фанаты годами требовали перенести серию в Японию 17 ч.