popup.error.login.title
popup.error.login.text
Оценка игроков
0
?/10

Привет, всем! Недавно я прочел статью  Дара О'Кирни «Теория всего». Может быть, она покажется занятной и другим игрокам, мне, во всяком случае, некоторые выдержки из нее показались довольно интересными. Поэтому я решил поделиться этой информацией с вами.

Как-то раз я услышал рассказ об одном игроке, использующем некоторые уловки, которые можно назвать мошенническими. Он прятал в руке фишку, заводил за спину обе руки и предлагал противнику угадать, в какой именно руке спрятана фишка. Заключив с противником пари, что тот не сможет это угадать, он вытягивал перед ним руки.

Весь фокус состоял в том, что делал он это определенным образом: он вытягивал одну руку вперед, прямо под нос противнику, словно предлагая выбрать как раз ее. Вторую же руку держал намного дальше от лица противника. Хитрость заключалась в том, что находилась фишка всегда в дальней руке, а не в той, которую он держал под носом у противника. Должен сказать, что из десяти человек девять не угадывали. Можно проследить их мыслительный процесс – «слишком очевидным кажется то, что фишка не будет находиться в руке у меня под носом, поэтому он должен ее взять именно в эту руку, заставив меня подумать, что она у него в другой». Или другой вариант – «если фишка находится в руке у меня под носом, то, выбрав другую руку, буду глупо выглядеть».

Для меня же, как математика, в этой истории интереснее всего было узнать, что один человек все-таки правильно угадал руку и вовсе не потому, что повезло, а потому, что он применил «теорию игр». На первый взгляд «теория игр» кажется чем-то несерьезным. Однако, это на самом деле область математики, посвященная изучению принятия стратегических решений. А так как игры это наиболее очевидный источник примеров из реальной жизни, отсюда и название.

Одной из целей этой «теории игр» является "решение" любой игры в форме оптимальной стратегии. То есть такой стратегии, при которой независимо, что ваш противник делает, в долгосрочной перспективе он вас победить не сможет, а если он оптимальной стратегии придерживаться не будет, то проиграет, в свою очередь, в долгосрочной перспективе. 

Если два или больше участника игры придерживаются такой оптимальной стратегии, то тип решения тогда называют "Равновесием Нэша".  Разработал эту концепцию математик Джон Форбс Нэш, о жизни которого снят фильм "Игры разума". В чем ее суть? Если друг против друга два игрока играют оптимально, то до тех пор, пока кто-нибудь из них не начнет от стратегии равновесия отклоняться, свой выигрыш ни один из них увеличить не сможет. Это как два камня на самой вершине горы – они будут балансировать до тех пор, пока какой-нибудь из них не начнет перевешивать, после чего оба скатятся вниз.

Такие игры, где придерживаются равновесия Нэша, называют неэксплуатируемыми. Противники не могут получить выгоду от недостатков стратегии друг друга, поэтому не могут ни проиграть, ни выиграть.

Что же делать в этом случае? Не спешите с выводами, в этой концепции есть подвох, и даже не один. Сразу скажу, что она работает более эффективно для простых игр, например, «угадай руку» или «камень, ножницы, бумага», чем для таких сложных, как покер.

Так вот, первая проблема в том, что в сложных играх точно никогда невозможно узнать, что равновесие Нэша возможно. Равновесие Нэша в покере решили только для ряда очень простых и специфических ситуаций, таких, например, когда единственными вариантами с коротким стеком на префлопе остались фолд или олл-ин, то делать олл-ин нужно с какими руками? При помощи концепции равновесия Нэша довольно легко можно определить правильные руки для рейз-фолда, рейз-колла, фолда и репуша в тех ситуациях, когда стек менее 20ВВ. 

Но все эти примеры для безлимитного холдема. В лимитном же покере команда Альбертского университета экспертов по искусственному интеллекту с несколькими сотнями мощнейших компьютеров рассчитывают равновесие Нэша для хедз-апа. При чем они утверждают, что для лимитного хедз-апа делают расчеты специально, потому что если количество игроков будет больше двух, то рассчитать равновесие Нэша будет или невозможно, или его просто не будет. Поэтому решить равновесие Нэша в безлимитном холдеме с разными размерами ставок даже и для хедз-апа становится невероятно трудно. 

Второй проблемой является то, что даже если и можно найти равновесие Нэша, это работает хорошо, в основном, для игр с нулевыми суммами, когда проигрыш одних игроков равен выигрышу других. Однако, покер  такой игрой бывает редко. При игре в покер уплачиваются регистрационные сборы и взимается рейк. Если бы неэксплуатируемое равновесие Нэша мы и нашли, то долгосрочным победителем, к тому же единственным, был бы дом, то есть казино, онлайн-сайты или организаторы живых турниров.

Поясню на примере.  Допустим, игроки  А и Б дошли до ривера, в банке находится 1000.  Игрок А идет с 1000 олл-ин. Игрок Б должен 1000 коллировать, чтобы банк в 2000 выиграть. Поэтому, если побить блеф игрока А он в состоянии, то должен коллировать, когда полагает, что игрок А блефует больше, чем в половине случаев, но если он полагает, что  игрок А блефует меньше, чем в половине случаев, то должен сброситься.

Если предположить, что игрок Б не представляет, насколько часто игрок А блефует, то скорее всего,  он применит теорию игр и будет коллировать ровно в половине случаев, когда может побить блеф. Предположим, что игрок А тоже придерживается равновесия Нэша, и блефовать он будет также в половине случаев.

Но если кто-либо из игроков отклоняется от равновесия Нэша, что происходит тогда? Допустим, игрок А решил не блефовать вовсе. Теперь он будет всегда делать только вэлью-беты. Раз он не блефует, то и прибыли ни он, ни его противник от блефа не получают.

При втором варианте, когда игрок А решает блефовать всегда, они тоже останутся при своих: если даже игрок А будет блефовать всегда, то игрок Б будет коллировать в половине случаев и будет выигрывать половину банков.

И что здесь самое главное? Если игрок  А будет блефовать с неэксплуатируемой частотой равной 50%, то есть в половине случаев, то ли, как маньяк, с частотой равной 100%, то ли, как осторожный нит, с частотой равной 0%, но все равно, со своими блефами он не опустится ниже точки безубыточности, точно так же и игрок Б будет иметь свою точку безубыточности, когда будет коллировать в половине случаев. И это состояние будет длиться до тех пор, пока игрок  Б будет коллировать именно в половине случаев, другими словами, будет жестко поддерживать равновесие Нэша.

И все же, допустим, в конце концов, игрок  Б заметит, что игрок А то ли никогда не блефует, то ли блефует всегда, и решит частоту своих коллов отрегулировать.

В ситуации, когда игрок  Б заметил, что игрок А не блефует никогда, то он просто перестал коллировать, когда побитые его руки были блефом. Игрок  А в таких случаях по-прежнему продолжает и не проигрывать, и не выигрывать с помощью блефа, так как просто не применяет его, но он также больше не выигрывает и вэлью-беты, потому что теперь игрок Б постоянно сбрасывается. Получается, что игрок  А от равновесия Нэша отклонился и  позволил, тем самым, своему противнику эксплуатировать выбранную им стратегию, то есть воспользоваться тем обстоятельством, что он никогда не блефует.

Давайте теперь рассмотрим ситуацию, когда игрок  А выбрал стратегию маньяка. Лишь только игрок  Б это поймет, он будет каждый раз коллировать, когда сможет побить блеф. Здесь игрок  А будет всегда проигрывать, когда блефует, но, частично компенсирует свои проигрыши тем, что будут коллироваться и его вэльюбеты, правда не в полной мере, так как блефует он гораздо чаще, чем следует.

В обоих этих случаях игрок  А от равновесия Нэша отклонился в сторону эксплуатируемых стратегий, и игрок Б от равновесия Нэша отклонился, но для того, чтобы воспользоваться уязвимостью своего противника. Прибыль в этих случаях получают не от привязки к равновесию Нэша, которое здесь просто гарантирует, что проигрыш не будет больше выигрыша независимо от стратегии противника. Хотя стоит упомянуть об одном НО. Отклоняясь от равновесия Нэша для эксплуатации недостатков игрока А,  игрок Б открывает, тем самым, и себя для эксплуатации.

Допустим, каким-то способом игроку  А удалось убедить игрока Б, что он блефует всегда, хотя он на самом деле никогда не блефует. Тогда он вообще не будет проигрывать деньги, применяя блеф, и его вэлью-беты, при этом будут коллироваться. В этом случае эксплуататор становится эксплуатируемым.

Но вернемся к игре "угадай руку". В заинтересовавшем меня случае парень, сделавший правильный вывод, сообразил, что противник его, как умный человек, не стал бы просто так предлагать пари, а, скорее всего, использовал бы какую-то уловку, предназначенную для того, чтобы повлиять на выбор спорщика. 

Вместо того, чтобы проследить за мотивами противника, опытного в конкретном пари, он решил просто придерживаться равновесия Нэша. В данном случае это означало следующее: никакая уловка не поставит его в невыгодное положение. Для игры в "угадай руку" будет достигнуто равновесие Нэша заранее случайным выбором руки и жестким его отстаиванием, независимо от действий противника.

Оценка игроков
0
?/10
Напишите свой комментарий
Набрано 0 символов, минимум 50, максимум 2000
Поставьте свою оценку
Ваша оценка
0/10
Ошибка валидации
Проверьте ввод данных
Об авторе