Опрос
|
реклама
Быстрый переход
Классический платформер Super Mario Bros. стал настоящим испытанием для ИИ
04.03.2025 [21:33],
Сергей Сурабекянц
Сравнительный анализ моделей ИИ крайне непрост, а их создателей часто обвиняют в предвзятости, пристрастности и усложнении понимания результатов тестов для обычных людей. Поэтому вместо того чтобы зацикливаться на абстрактных математических и логических испытаниях, исследователи предложили протестировать ИИ при помощи классического платформера Super Mario Bros. от Nintendo. ![]() Источник изображения: Hao AI Lab В эксперименте использовалась эмулированная версия Super Mario Bros., которая была интегрирована с пользовательским фреймворком GamingAgent от исследователей Hao AI Lab из Калифорнийского университета в Сан-Диего. Эта система позволяла моделям ИИ управлять Марио, генерируя код Python. Все модели получали одинаковые базовые инструкции вроде «Перепрыгни через этого врага», а также визуализации состояния игры в виде скриншотов. Хотя со стороны Super Mario Bros. кажется простым двухмерным платформером, исследователи обнаружили, что классическая игра Nintendo бросает серьёзный вызов ИИ, заставляя планировать сложные последовательности движений и на лету адаптировать стратегии игрового процесса. Лучшей моделью в освоении Super Mario Bros. исследователи признали Claude 3.7 от Anthropic, которая продемонстрировала впечатляющие рефлексы, связав точные прыжки и умело избегая врагов. Её предшественница, Claude 3.5, также показала достойные результаты, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google отстали от конкурентов. Как оказалось, логическое мышление не является ключом к успеху в Super Mario Bros. — важен расчёт времени. Даже небольшая задержка может отправить Марио на предыдущую контрольную точку. Исследователи предполагают, что более «сознательные» и склонные к рассуждению модели, вероятно, слишком долго рассчитывали следующие шаги, что приводило к частым неудачам. Конечно, использование ретроигр для оценки ИИ — это по большей части эксперимент. Способность ИИ победить Super Mario Bros. не определяет степень его реальной пользы, хотя наблюдать, как обученные на миллиардах параметров модели сражаются (и часто проигрывают) с детской, казалось бы, игрой несомненно увлекательно. Для желающих поставить самостоятельный эксперимент Hao AI Lab открыла исходный код своей GamingAgent на GitHub. AMD представила «лучшие и самые стабильные» графические драйверы — Adrenalin 25.3.1 с множеством ИИ-функций
28.02.2025 [18:13],
Сергей Сурабекянц
Одновременно с анонсом видеокарт нового поколения Radeon RX 9070 XT и RX 9070 компания AMD представила и новые драйверы Adrenalin версии 25.3.1. Самым серьёзным изменением стало масштабное внедрение искусственного интеллекта для обнаружения нестабильности и ошибок рендеринга. В связи с этим AMD уже успела назвать новые драйвера «лучшими и самыми стабильными драйверами, которые она когда-либо выпускала, с меньшим количеством ошибок рендеринга». AMD представила целый ряд простых функции на базе ИИ. Все они управляются новым менеджером установки AMD, значок которого по умолчанию находится рядом со значком ПО AMD в системном трее. Помимо обновления драйверов видеокарты, он умеет обновлять драйверы чипсета материнских плат AMD. В комплект новых драйверов включены также такие ИИ-функции, как AMD Chat, AMD Image Inspector и AI Apps Manager. AMD Chat — это чат-бот, разработанный для ответов на вопросы, касающиеся конфигурации оборудования ПК пользователя. У чат-бота можно узнать температуру графического процессора, производительность центрального процессора, эффективность охлаждения и много другой подобной информации. Ещё AMD Chat можно попросить изменить настройки Adrenalin, правда поддерживает он пока только английский и китайский. Но зато умеет генерировать изображения. Причём ИИ работает полностью локально. Однако требование как минимум 25 Гбайт места на накопителе может остановить многих пользователей от загрузки этого ИИ-помощника. Image Inspector умеет находить и сообщать об ошибках и неполадках рендеринга. AMD в новых драйверах уже использует ИИ для поиска внутренних проблем, а Image Inspector — это только дополнительная функция, которая вовлекает пользователя в этот процесс. Используя специализированные ресурсы графического процессора, Image Inspector может автоматически фиксировать ошибки рендеринга и отправлять их в AMD. Степень влияние этой функции на производительность ещё только предстоит выяснить. AI Apps Manager составляет и предоставляет владельцу ПК список программных утилит, использующих ИИ, которые уже установлены на его компьютере или доступны для установки. |