Игровой ИИ DeepMind внезапно преуспел в оптимизации фундаментальных алгоритмов

08.06.2023 17:16, Павел Котов

Модели искусственного интеллекта серии DeepMind Alpha оказались первыми в мире по ряду категорий — например, AlphaGo впервые обыграла чемпиона мира по го. Теперь эти модели, первоначально обученные на играх, решили использовать для других задач, к которым они продемонстрировали неожиданные способности.

Источник изображений: deepmind.com

Первоначально AlphaGo обучали на играх, в которые играли люди. Её наследница AlphaGo Zero обучалась, играя сама с собой, а AlphaZero таким же способом освоила шахматы и японскую игру сёги. MuZero обучилась этим и другим играм, даже не зная их правил, которые, к слову, ограничивают игрока в способах решения задачи.

В принадлежащих Google центрах обработки данных (ЦОД) работает система Borg, ответственная за распределение задач — она анализирует запросы и мгновенно распределяет необходимые ресурсы. В своей работе система руководствуется установленными вручную правилами, которые в принципе не могут учитывать всех реальных схем распределения рабочей нагрузки, порождая тем самым неизбежную неэффективность, которую к тому же трудно отследить.

В какой-то момент данные Borg передали модели AlphaZero, которая начала выявлять закономерности в распределении ресурсов ЦОД в зависимости от поступающих задач, после чего разработала новые способы прогнозирования этой нагрузки и управления ею. В реальных производственных условиях это помогло сократить долю недостаточно используемого оборудования на 19 %, что в масштабах Google представляется значительной величиной.

Нейросети MuZero поручили работу с видео на YouTube на предмет повышения эффективности сжатия — эта область позволяет добиваться заметных результатов даже при небольшой оптимизации. Модели удалось снизить битрейт видео на 4 %, что в масштабах YouTube это немало, и предложить новые споособы группировки кадров. Наконец, родственная AlphaZero модель AlphaDev помогла улучшить алгоритмы сортировки по сравнению со стандартными в используемой Google библиотеке. Она также оптимизировала функцию хеширования для небольших диапазонов байтов (от 9 до 16), снизив нагрузку на 30 процентов.

Иными словами, первоначально предназначенные для побед в играх ИИ-модели сумели изучить, казалось бы, чуждые для себя области и предложить для них способы оптимизировать рабочие задачи, проявив при этом определённую гибкость. А в прошлом году AlphaZero разработала новые, более эффективные способы умножения некоторых математических матриц — впервые за полвека.