ИИ обыграл в покер пятерых профессиональных игроков

Автор
ИИ обыграл в покер пятерых профессиональных игроков

На это исследование понадобилось более двух лет.

В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов.

Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы - Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, "сидя" с ними всеми за одним столом, прямо как в традиционных казино. О разработке ученых пишет журнал Science.

Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру.

[news_post id='5074736' name='' img='' align='left']

Авторы Pluribus оснастили его "абстрактным действием" и "абстрактной информацией" - так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения. Во время тестов Pluribus, используя метод самообучения и систему "минимизации сожалений" (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад. Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре.

Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ.

Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов. В итоге с помощью своей уникальной и в чем-то "парадоксальной" стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов.

Космическая 3D-медицина: печать кожи и костей уже реальность (Видео)

"Главный плюс Pluribus - способность совмещать разные стратегии. Это то, к чему идут профессиональные игроки в покер. Мало у кого получается менять тактику случайным образом и оставаться в плюсе. Почти все люди не справляются с такой задачей", - рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ.