Новости Software

Программа AlphaGo холдинга Alphabet победила чемпиона Европы по Го

Исследователи искусственного интеллекта приблизились к новому ориентиру для сравнения человеческого разума и машины. Научно-исследовательская компания Google DeepMind, работающая в составе Google под эгидой холдинга Alphabet, сообщила о том, что её программа AlphaGo, сочетающая два отдельных алгоритма, нанесла сокрушительное поражение профессиональному игроку в игру Го в матче из пяти партий. Это первая победа искусственного интеллекта в борьбе с игроком в Го такого уровня — для участия в матче был приглашён трёхкратный чемпион Европы Фань Хуэй.

Разработчики из DeepMind сообщили, что программа AlphaGo достигла результата 99,8 % побед (494 партии из 495) в сражениях с другими программами для игры в Го. Состязание AlphaGo с чемпионом Европы состоялось в октябре прошлого года, и с тех пор программа продолжала тренировки, сообщил Демис Хассабис (Demis Hassabis). Основанная им DeepMind Technologies была приобретена Google в 2014 году.

В марте состоится матч AlphaGo против одного из сильнейших игроков в Го в мире Ли Седоля (Lee Sedol). Турнир пройдёт в Сеуле (Южная Корея). Победитель получит приз $1 млн. По словам Хассабиса, если выиграет программа AlphaGo, выигрыш направят на благотворительность.

Как рассказывает Хассабис, традиционный для искусственного интеллекта способ построения дерева поиска по всем возможным вариантам оказался бесполезным для игры Го. Поэтому в созданной программе AlphaGo был использован другой подход, заключающийся в сочетании двух алгоритмов: расширенного поиска по дереву и глубоких нейронных сетей. Эти нейронные сети получили описание Го в качестве входных данных и обработали его через 12 различных сетевых слоев, содержащих миллионы подобных нейронам соединений. Одна нейронная сеть (сеть политики) выбирает следующий ход, остальные сети (сети оценки) предсказывают победителя игры.

После продолжительных тренировок программа «научилась» предсказывать победителя с вероятностью более 57 %. Для повышения мастерства AlphaGo научили новым стратегиям с помощью игры между нейронными сетями, используя способ проб и ошибок, известный как обучение с подкреплением. Эту ёмкую задачу удалось реализовать с помощью платформы Google Cloud Platform.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥