Новости Software

Искусственный интеллект Google может сам себя обучить играть в игры

Искусственный интеллект Google DeepMind AI научился проходить 49 игр Atari — об этом сообщил в свежей публикации журнал Nature. Возможно, это звучит не так уж привлекательно само по себе, но речь идёт о том, что искусственный интеллект сам себя обучает игре — это большой шаг вперёд в деле машинного обучения.

Google поглотила компанию DeepMind Technologies в прошлом году, предложив за покупку больше, чем Facebook. На момент оглашения сделки общественность гадала: будет ли приобретение использоваться для совершенствования алгоритмов поиска или же в робототехнике. Ответ прост: приёмы машинного обучения, которые были использованы в последнем исследовании, опубликованном в журнале Nature, позволяют компьютерам находить зависимость в поступающих данных.

Стоит отметить, что методы, использованные Google для обучения компьютеров играть в видеоигры, как отмечается в публикации, известны уже несколько десятилетий, но они ранее не объединялись в таком удобном и полезном виде. «Наш подход демонстрирует впечатляющую приспособляемость», — отметил Бернхард Шёлькопф (Bernhard Schölkopf), директор Института интеллектуальных систем имени Макса Планка.

Алгоритм не узкоспециализированный — после обучения одной игре он может легко научиться играть и в 48 других.  При этом, как отмечает господин Шёлькопф, игры Atari, участвовавшие в эксперименте, куда больше соответствуют хаосу реального мира, чем более логичные и структурированные игры вроде шахмат. Это хорошая новость для технологий автопилота и других компьютерных систем, создаваемых для взаимодействия и анализа реального мира — другими словами, Google получила ещё один инструмент, позволяющий сделать хаос чуть более структурированным.

Обучение основано на очень старом подходе: так называемом положительном подкреплении. Всякий раз, когда компьютер получат больше очков или же перемещается на новый уровень, он вознаграждается. Новый искусственный интеллект показал себя лучше, чем предыдущие методы в 43 играх, и смог превзойти людей в 29 из них. На представленном видео можно отследить, как алгоритм Google обучался игре в классическую Breakout — явно видно, как стратегия постепенно становилась всё более и более эффективной:

Авторы исследования под руководством соучредителя DeepMind и вице-президента по разработкам Google Демиса Хассабиса (Demis Hassabis) отмечают, то что метод положительного подкрепления является формой обучения людей и животных — он обычно не используется для компьютеров. Применение вдохновлённых биологией методов может открыть новое направление в создании искусственного интеллекта. Будем надеяться, что однажды подобные системы смогут решать что-то более полезное, чем простенькие игры Atari. Впрочем, такому алгоритму, если судить по научно-фантастическим произведениям, не стоит поручать решение проблемы перенаселения планеты.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Google снизила комиссию для приложений с подписками из Play Маркет до 15 %, а для потоковых музыкальных сервисов — до 10 % 47 мин.
Патч для Windows 11, исправляющий работу кеша в процессорах AMD Ryzen, стал доступен всем пользователям 3 ч.
NetApp анонсировала обновление портфеля решений для гибридных облаков 3 ч.
Microsoft готовится к запуску Windows 10 November 2021 Update (21H2) — вышла предрелизная тестовая сборка 3 ч.
NVIDIA представила подписку GeForce NOW RTX 3080 с возможностью трансляции игр в разрешении до 4К 4 ч.
Nintendo исправила ошибку в Metroid Dread, которая мешала пройти игру 5 ч.
Focus Entertainment приобрела студию-разработчика Shady Part of Me 5 ч.
В New World появилась возможность перемещаться между серверами, но региональную миграцию реализуют позже 6 ч.
Психологический хоррор Happy Game от авторов Machinarium поступит в продажу 28 октября 6 ч.
Among Us получила дату выхода на консолях PlayStation и Xbox — 14 декабря 6 ч.
Частная космическая станция Starlab появится на орбите Земли к 2027 году — она будет принимать туристов и проводить исследования 2 ч.
Intel предложила протокол HTTPA для повышения безопасности веб-приложений 3 ч.
Акции IBM упали в цене после квартального отчёта 3 ч.
Новая статья: Обзор системного блока Raskat Standart 500 (82648): игровой ПК, который мы заслужили 3 ч.
Razer представила игровые гарнитуры Kraken V3 с улучшенным дизайном и звуком, а также тактильной отдачей в моделях Pro и HyperSense 3 ч.
Razer представила свои первые СЖО, вентиляторы и блоки питания для игровых компьютеров — все с RGB-подсветкой 3 ч.
Материнские платы Gigabyte и MSI на чипсете Intel Z690 для процессоров Alder Lake показались на фото 4 ч.
Грядущий AMD Ryzen Threadripper PRO 5975WX на Zen 3 оказался до 34 % быстрее своего предшественника в Geekbench 4 ч.
Honor скоро представит доступный 5G-смартфон Play 5 Youth Edition 5 ч.
Arm представит в 2022 году новый GPU, который будет вдвое быстрее актуального в задачах ИИ 5 ч.