Новости Software

ИИ DeepMind Agent57 проходит игры Atari лучше человека

Заставить нейронную сеть проходить несложные видеоигры — идеальный способ проверить эффективность её обучения благодаря простой возможности оценивать результаты прохождения. Разработанный в 2012 году компанией DeepMind (часть холдинга Alphabet) эталонный тест из 57 каноничных игр Atari 2600 стал лакмусовой бумажкой для проверки возможностей самообучающихся систем. И вот Agent57, передовой RL-агент (Reinforcement Learning — обучение с подкреплением) DeepMind, на днях показал огромный скачок по сравнению с предыдущими системами и стал первой итерацией ИИ, превосходящей базовые показатели игрока-человека.

J - показатель RL-агента Agent57

J - показатель RL-агента Agent57

ИИ Agent57 учитывает опыт предыдущих систем компании и объединяет алгоритмы эффективного исследования среды с мета-контролем. В частности, Agent57 доказал свои сверхчеловеческие навыки в Pitfall, Montezuma's Revenge, Solaris и Skiing — играх, которые были серьезным испытанием для предыдущих нейросетей. Согласно результатам исследований, для достижения лучших результатов Pitfall и Montezuma's Revenge заставляют ИИ больше экспериментировать. Solaris и Skiing сложны для нейросетей, потому что признаков успеха не так много — ИИ в течение длительного времени не знает, совершает ли он правильные действия. DeepMind основывалась на своих старых агентах ИИ, чтобы Agent57 мог принимать более правильные решения в отношении исследования среды и оценки результатов прохождение игр, а также оптимизировать компромисс между краткосрочным и долгосрочным поведением в таких играх как Skiing.

Результаты впечатляют, но ИИ ещё предстоит пройти долгий путь. Эти системы могут справиться только с одной игрой за раз, что, по словам разработчиков, противоречит возможностям человека: «Истинная гибкость, которая так легко даётся человеческому мозгу, всё ещё находится за пределами досягаемости ИИ».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Видео: основные персонажи и обновлённая графика в релизном трейлере сборника The Great Ace Attorney Chronicles 2 ч.
Ролевой экшен NEO: The World Ends With You поступил в продажу для консолей и получил первые оценки 3 ч.
Instagram защитит детей до 16 лет, сделав их аккаунты закрытыми по умолчанию 3 ч.
Последнее обновление iOS, вероятно, закрыло уязвимость, которую использовало шпионское ПО Pegasus 4 ч.
Владельцы оригинальной Dark Souls в Steam скоро лишатся 50-процентной скидки на ремастер 4 ч.
Видео: сражения, необычные костюмы персонажей и строительство деревни в релизном трейлере Tribes of Midgard 5 ч.
200 тыс. игроков одновременно отметились в закрытой «бете» New World на этих выходных 6 ч.
Facebook собрала команду для реализации идеи Цукерберга о сетевой «метавселенной» 6 ч.
Ох уж эти тизеры: Норман Ридус выложил видео с кроликом из Silent Hill 6 ч.
Видео: драка в лесной чаще в отрывке из анимационного фильма Mortal Kombat Legends: Battle of the Realms 6 ч.
Электрическое аэротакси Joby Aviation преодолело 240 км на одном заряде — это самый дальний полёт электротранспорта 19 мин.
ZTE представила беспроводные наушники ZTE Buds и ZTE LiveBuds Pro стоимостью от $26 25 мин.
Lucasfilm наняла блогера, который создаёт очень качественные дипфейки 29 мин.
Facebook отзовёт около 4 миллионов VR-гарнитур Oculus Quest 2 — они вызывали раздражение у пользователей 2 ч.
SK Hynix запустит массовое производство памяти DDR5 в ближайшие месяцы 2 ч.
Представлена Sony ZV-E10 — камера со сменным объективом для видеоблогеров 3 ч.
Флагманский процессор Qualcomm следующего поколения получит ядро Cortex-X2 с частотой выше 3 ГГц 3 ч.
Tesla отложила выпуск электрических тягача Semi и пикапа Cybertruck до следующего года 4 ч.
Легендарный компьютер MITS Altair 8800 возродился в IoT-облаке Azure Sphere 5 ч.
Беспроводные наушники Nothing Ear (1) с необычным дизайном за $99 поступят в продажу 17 августа 5 ч.