ИИ одолел профессиональных игроков в StarCraft II: Разработчикам пришлось поддаться

Автор

Нейросеть DeepMind победила профессиональных игроков в StarCraft II

Искусственный интеллект AlphaStar, созданный компанией DeepMind (принадлежит холдингу Alphabet Inc.), одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени. Об этом говорится на сайте компании.

Матчи алгоритма с двумя профессиональными игроками — Дарио Вуншем (Dario "TLO" Wünsch) и Гжегожем Коминч (Grzegorz "MaNa" Komincz) — проходили еще в декабре, но на этой неделе, 24 января, состоялся последний поединок, перед которым свойства программы изменили. В результате победа впервые досталась человеку.

Ранее алгоритмы DeepMind одолели сильнейшего игрока в го и намного лучше предсказали форму белка, по сравнению с профессиональными биологами. Однако в каждом из этих случаев для искусственного интеллекта была открыта вся доступная информация. Со стратегией в реальном времени, такой как StarCraft II, все иначе: это игра с закрытой информацией. Машина не знает, что происходит за туманом войны, и не может предсказать действия игрока, поэтому ей приходится адаптироваться к его маневрам сиюминутно.

Разработчики программы использовали для ее обучения игры реальных людей, которые им предоставила компания Blizzard. Переняв поведенческие паттерны игроков, она научилась побеждать встроенный в игру искусственный интеллект самой высокой сложности в 95 процентах случаев. Затем ее агенты стали соревноваться друг с другом в турнире на выбивание. Он проходил в ускоренном режиме, поэтому каждый из них наиграл примерно 200 лет. 

Выбрав самого успешного агента, авторы выставили его против TLO и MaNa. Сперва он выиграл пять из пяти матчей у TLO, а затем другая версия нейросети столько же раз одолела MaNa. При этом алгоритм совершал меньше действий в минуту, чем его противники. Вероятно, это объясняется небольшим преимуществом, которым он все-таки обладал. В отличие от человека, он видел не часть известной карты (тот же экран), а всю ее целиком, поэтому ему не приходилось переключаться между разными областями. Более того, зрители заметили, что он отдавал приказы трем отрядам, находящимся в разных зонах, одновременно, на что точно не способен человек.

В последнем матче разработчики пошли на уступки и отключили эту способность ИИ — в этот раз выиграл MaNa. Однако авторы заметили, что версия алгоритма, которой нужно перемещать камеру, обучалась в турнире всего семь дней, что составляет половину от предыдущего периода тренировок. Сам MaNa похвалил действия программы: "Играй я с реальным человеком, он бы не смог так филигранно управлять своими сталкерами (юнит одной из расс. — Прим. ред.)".

Разработчики сказали, что такие игры, как StarCraft II, служат лишь тренировочной площадкой для искусственного интеллекта. В дальнейшем он примется за другие цели. Например, ранее в DeepMind заявили, что их алгоритм будет диагностировать болезни глаз.