Сегодня 15 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → искусственный интеллект

Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ

Сравнительный анализ моделей ИИ крайне непрост, а их создателей часто обвиняют в предвзятости, пристрастности и усложнении понимания результатов тестов для обычных людей. Поэтому вместо того чтобы зацикливаться на абстрактных математических и логических испытаниях, исследователи предложили протестировать ИИ при помощи классического платформера Super Mario Bros. от Nintendo.

 Источник изображения: Hao AI Lab

Источник изображения: Hao AI Lab

В эксперименте использовалась эмулированная версия Super Mario Bros., которая была интегрирована с пользовательским фреймворком GamingAgent от исследователей Hao AI Lab из Калифорнийского университета в Сан-Диего. Эта система позволяла моделям ИИ управлять Марио, генерируя код Python. Все модели получали одинаковые базовые инструкции вроде «Перепрыгни через этого врага», а также визуализации состояния игры в виде скриншотов.

Хотя со стороны Super Mario Bros. кажется простым двухмерным платформером, исследователи обнаружили, что классическая игра Nintendo бросает серьёзный вызов ИИ, заставляя планировать сложные последовательности движений и на лету адаптировать стратегии игрового процесса.

Лучшей моделью в освоении Super Mario Bros. исследователи признали Claude 3.7 от Anthropic, которая продемонстрировала впечатляющие рефлексы, связав точные прыжки и умело избегая врагов. Её предшественница, Claude 3.5, также показала достойные результаты, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google отстали от конкурентов.

Как оказалось, логическое мышление не является ключом к успеху в Super Mario Bros. — важен расчёт времени. Даже небольшая задержка может отправить Марио на предыдущую контрольную точку. Исследователи предполагают, что более «сознательные» и склонные к рассуждению модели, вероятно, слишком долго рассчитывали следующие шаги, что приводило к частым неудачам.

Конечно, использование ретроигр для оценки ИИ — это по большей части эксперимент. Способность ИИ победить Super Mario Bros. не определяет степень его реальной пользы, хотя наблюдать, как обученные на миллиардах параметров модели сражаются (и часто проигрывают) с детской, казалось бы, игрой несомненно увлекательно.

Для желающих поставить самостоятельный эксперимент Hao AI Lab открыла исходный код своей GamingAgent на GitHub.

AMD представила «лучшие и самые стабильные» графические драйверы — Adrenalin 25.3.1 с множеством ИИ-функций

Одновременно с анонсом видеокарт нового поколения Radeon RX 9070 XT и RX 9070 компания AMD представила и новые драйверы Adrenalin версии 25.3.1. Самым серьёзным изменением стало масштабное внедрение искусственного интеллекта для обнаружения нестабильности и ошибок рендеринга. В связи с этим AMD уже успела назвать новые драйвера «лучшими и самыми стабильными драйверами, которые она когда-либо выпускала, с меньшим количеством ошибок рендеринга».

 Источник изображений: AMD

Источник изображений: AMD

AMD представила целый ряд простых функции на базе ИИ. Все они управляются новым менеджером установки AMD, значок которого по умолчанию находится рядом со значком ПО AMD в системном трее. Помимо обновления драйверов видеокарты, он умеет обновлять драйверы чипсета материнских плат AMD.

В комплект новых драйверов включены также такие ИИ-функции, как AMD Chat, AMD Image Inspector и AI Apps Manager.

AMD Chat — это чат-бот, разработанный для ответов на вопросы, касающиеся конфигурации оборудования ПК пользователя. У чат-бота можно узнать температуру графического процессора, производительность центрального процессора, эффективность охлаждения и много другой подобной информации. Ещё AMD Chat можно попросить изменить настройки Adrenalin, правда поддерживает он пока только английский и китайский. Но зато умеет генерировать изображения. Причём ИИ работает полностью локально. Однако требование как минимум 25 Гбайт места на накопителе может остановить многих пользователей от загрузки этого ИИ-помощника.

Image Inspector умеет находить и сообщать об ошибках и неполадках рендеринга. AMD в новых драйверах уже использует ИИ для поиска внутренних проблем, а Image Inspector — это только дополнительная функция, которая вовлекает пользователя в этот процесс. Используя специализированные ресурсы графического процессора, Image Inspector может автоматически фиксировать ошибки рендеринга и отправлять их в AMD. Степень влияние этой функции на производительность ещё только предстоит выяснить.

AI Apps Manager составляет и предоставляет владельцу ПК список программных утилит, использующих ИИ, которые уже установлены на его компьютере или доступны для установки.


window-new
Soft
Hard
Тренды 🔥
Власти США заподозрили Китай в несанкционированном доступе к модели Mythos компании Anthropic 3 ч.
Веб-версия Google Earth получила общедоступный авиасимулятор 3 ч.
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 14-06 00:05
Новая статья: Gamesblender № 780: RE Veronica, Stellar Blade 2, Gears of War: E-Day, Senua — главные анонсы июня 13-06 23:32
Вышло приложение ASCILINE Engine для трансляции «неблокируемого» ASCII-видео 13-06 16:39
ИИ-стартап Mistral AI ведёт переговоры о привлечении €3 млрд при оценке в €20 млрд 13-06 16:38
Авторитетное консалтинговое агентство KPMG опубликовало доклад об ИИ — и в нём нашли ИИ-галлюцинации 13-06 15:54
Google начала развёртывать поисковых ИИ-агентов — но пока лишь для платных пользователей 13-06 13:18
Водители Tesla научились обманывать автопилот игрушечной головой — чтобы листать соцсети за рулём 13-06 11:18
Генпрокуроры нескольких штатов США запустили проверку в отношении OpenAI 13-06 11:12
Mimulus анонсировала услугу архивирования данных с использованием ДНК 8 мин.
96 NVMe SSD с СЖО и четыре RTX Pro 6000: Wiwynn показала сверхбыстрое хранилище на базе NVIDIA SCADA 16 мин.
Trouver выпустила робот-пылесос S70 Roller с роликовым мопом и станцией самообслуживания 49 мин.
SK hynix ускоряет график поставки образцов HBM4E, не желая отставать от Samsung 59 мин.
Из старых смартфонов можно создавать недорогие центры обработки данных, как доказали американские учёные 2 ч.
Valvoline анонсировала жидкости Beyond by Valvoline для СЖО дата-центров 9 ч.
Новая статья: Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем 10 ч.
«Произошёл сбой»: электромобиль Tesla на автопилоте протаранил ворота гаража 17 ч.
Физики впервые запустили ядерные часы — они могут превзойти атомные по точности и помочь в поисках тёмной материи 18 ч.
Colt и Ciena успешно испытали «постквантовый» трансатлантический 800-Гбит/с канал 20 ч.