Новости Software

ИИ DeepMind Agent57 проходит игры Atari лучше человека

Заставить нейронную сеть проходить несложные видеоигры — идеальный способ проверить эффективность её обучения благодаря простой возможности оценивать результаты прохождения. Разработанный в 2012 году компанией DeepMind (часть холдинга Alphabet) эталонный тест из 57 каноничных игр Atari 2600 стал лакмусовой бумажкой для проверки возможностей самообучающихся систем. И вот Agent57, передовой RL-агент (Reinforcement Learning — обучение с подкреплением) DeepMind, на днях показал огромный скачок по сравнению с предыдущими системами и стал первой итерацией ИИ, превосходящей базовые показатели игрока-человека.

 J - показатель RL-агента Agent57

J - показатель RL-агента Agent57

ИИ Agent57 учитывает опыт предыдущих систем компании и объединяет алгоритмы эффективного исследования среды с мета-контролем. В частности, Agent57 доказал свои сверхчеловеческие навыки в Pitfall, Montezuma's Revenge, Solaris и Skiing — играх, которые были серьезным испытанием для предыдущих нейросетей. Согласно результатам исследований, для достижения лучших результатов Pitfall и Montezuma's Revenge заставляют ИИ больше экспериментировать. Solaris и Skiing сложны для нейросетей, потому что признаков успеха не так много — ИИ в течение длительного времени не знает, совершает ли он правильные действия. DeepMind основывалась на своих старых агентах ИИ, чтобы Agent57 мог принимать более правильные решения в отношении исследования среды и оценки результатов прохождение игр, а также оптимизировать компромисс между краткосрочным и долгосрочным поведением в таких играх как Skiing.

Результаты впечатляют, но ИИ ещё предстоит пройти долгий путь. Эти системы могут справиться только с одной игрой за раз, что, по словам разработчиков, противоречит возможностям человека: «Истинная гибкость, которая так легко даётся человеческому мозгу, всё ещё находится за пределами досягаемости ИИ».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Мультиплеер оригинальной Dark Souls 2 на ПК заработал после 10 месяцев простоя 3 ч.
Sony подтвердила раздачу Mass Effect Legendary Edition и Biomutant подписчикам PS Plus в декабре 4 ч.
В глазах критиков супергеройская тактика Marvel’s Midnight Suns оказалась гибридом XCOM и Persona 5 — к лучшему или худшему 4 ч.
«Ростелеком-ЦОД» и КРОК займутся импортозамещением в области ITSM 6 ч.
Криптоброкер Genesis заявил, что всеми силами старается избежать банкротства 7 ч.
Объём донатов игровым стримерам в России вырос на 20 % 8 ч.
«Это игра на следующие 10–20 лет»: Тодд Говард надеется, что The Elder Scrolls VI будет таким же долгожителем, как Skyrim 10 ч.
My.Games ищет покупателей на игры, зависящие от лицензий зарубежных компаний 10 ч.
Запись полного прохождения и первый обзор хоррора The Callisto Protocol от создателя Dead Space попали в Сеть до релиза 10 ч.
Платные подписки Twitter Blue могут не вернуться на iOS — Маск не хочет отдавать Apple комиссию в 30 % 11 ч.