8. Как использовать смешанные стратегии на практике

We use cookies. Read the Privacy and Cookie Policy

При поиске или выборе смешанной стратегии в игре с нулевой суммой следует помнить о нескольких важных моментах. Во-первых, для эффективного использования смешанной стратегии в такой игре ее участникам нужно сделать нечто большее, чем просто вычислить выраженные в процентах равновесные вероятности применения каждого из своих действий. На самом деле в игре с розыгрышем очка в теннисе Эверт не может просто выбирать стратегию ПЛ в семи из десяти случаев и стратегию ПД в трех из десяти случаев, механически чередуя семь ударов по линии и три удара по диагонали. Почему? Потому что смешивание стратегий должно помочь вам в полной мере воспользоваться элементом неожиданности в игре против соперника. Если вы задействуете узнаваемую схему игры, соперник наверняка это выявит и обернет себе на пользу.

Отсутствие закономерности означает, что после любой последовательности выбранных стратегий вероятность выбора стратегии ПЛ или ПД в следующий раз остается такой же, как всегда. Скажем, если стратегия ПЛ случайно используется несколько раз подряд, это отнюдь не означает, что ее «обязательно» должна сменить стратегия ПД. На практике многие ошибочно рассуждают совсем иначе, поэтому слишком часто чередуют варианты выбора по сравнению с тем, какой была бы их истинная случайная последовательность, и крайне редко используют несколько идентичных вариантов подряд. Тем не менее обнаружение закономерности в наблюдаемых действиях требует сложных статистических расчетов, которые соперники зачастую не в состоянии выполнять во время игры. Как мы увидим в разделе 9, анализ результатов финальных матчей турниров Большого шлема привел к выводу, что подающие игроки слишком часто чередовали свои подачи, но принимающие не смогли обнаружить и воспользоваться этим отклонением от истинного вероятностного выбора действий.

Важность предотвращения предсказуемости наиболее очевидна в случае непрерывного взаимодействия в играх с нулевой суммой. Поскольку в таких играх интересы игроков диаметрально противоположны, ваш соперник всегда стремится использовать ваш выбор действий с максимальной выгодой для себя. Таким образом, если вы регулярно ведете против друг друга одну и ту же игру, соперник будет постоянно искать способ взломать код, используемый вами для рандомизации своих ходов. И если ему это удастся, у него появится шанс увеличить свой выигрыш в следующих раундах игры. Однако даже в случае однократных игр с нулевой суммой смешивание стратегий приносит пользу благодаря тактической неожиданности.

Победитель Мировой серии покера Дэниел Харрингтон, написавший в соавторстве с Биллом Роберти ряд замечательных книг об игре в разновидность покера под названием «техасский холдем», отмечает важность рандомизации стратегии в покере, позволяющей помешать сопернику угадать, какие карты у вас на руках, и использовать ваше поведение с выгодой для себя[101]. Поскольку людям зачастую трудно вести себя непредсказуемо, Харрингтон дает следующий совет относительно того, как применять комбинацию таких чистых стратегий, «поднять ставку» и «ответить»:

Очень трудно точно вспомнить, что ты делал в последних четырех или пяти случаях при возникновении похожей ситуации. К счастью, это и не надо. Просто используй тот маленький генератор случайных чисел, который ты носишь в течение дня с собой. Что это? Ты и не знаешь, что у тебя такое есть? Да это секундная стрелка на твоих часах. Если ты знаешь, что в ранней позиции и при наличии на руках старшей пары ты должен повышать ставку в 80 % случаев и отвечать в остальных 20 %, то просто посмотри на часы и обрати внимание на положение секундной стрелки. Поскольку 80 % от 60 составляют 48, ты должен повышать ставку, если секундная стрелка находится между делениями от 0 до 48, и только отвечать, если между 48 и 60. Этот метод хорош тем, что даже если бы кто-то точно знал, что ты делаешь, он бы все равно не смог предсказать твоих дальнейших действий![102]

Безусловно, при использовании секундной стрелки часов для реализации смешанной стратегии важно, чтобы ваши часы не были слишком точными, иначе соперник сможет использовать такие же часы и предугадает ваши намерения!

До сих пор мы исходили из предположения, что вы заинтересованы в применении смешанной стратегии, чтобы предотвратить возможное использование соперником ваших действий в своих интересах. Однако если он не придерживается равновесной стратегии, вы можете попытаться воспользоваться его ошибкой. В качестве иллюстрации приведем пример из эпизода мультсериала «Симпсоны», в котором Барт и Лиза играют друг с другом в игру «камень, ножницы, бумага». (В упражнении S10 дано полное описание этой игры три на три; вам предстоит вычислить равновесную комбинацию стратегий каждого игрока.) Перед выбором стратегий Барт думает: «Конечно, камень. Он самый сильный». В то же время Лиза думает: «Бедный предсказуемый Барт. Он всегда выбирает камень». Как и следовало ожидать, наилучший ответ Лизы — стратегия «бумага» против своего незадачливого соперника; ей нет необходимости применять равновесную комбинацию стратегий.

Более тонкий пример использования действий соперника в своих интересах можно наблюдать в разыгрываемой парами студентов версии игры в теннис под названием «лучший из 100». Как и профессиональные теннисисты, наши студенты слишком часто переключаются с одной стратегии на другую, по всей видимости, считая, что выбор ПЛ пять раз подряд выглядит не таким уж «случайным». Для того чтобы извлечь из этого поведения выгоду для себя, игрок в роли Навратиловой смог предвидеть, что после выбора стратегии ПЛ три раза подряд игрок в роли Эверт, по всей вероятности, перейдет к стратегии ПД, и это можно обернуть себе на пользу, также переключившись на стратегию ПД. Этому игроку следовало бы поступать так чаще, чем в случае рандомизации каждого раунда игры в отдельности, но в идеале не так часто для того, чтобы игрок в роли Эверт заметил это и не научился повторять одну и ту же стратегию большее количество раз.

И наконец, игроки должны понять и принять тот факт, что применение смешанных стратегий защищает вас от использования соперником ваших действий в своих интересах и обеспечивает вам максимально возможный ожидаемый выигрыш в игре с соперником, который делает свой лучший выбор, но это не более чем математическое ожидание. В особых случаях игра может закончиться для вас неблагоприятным исходом. Например, длинный пас на третьем дауне с одним оставшимся ярдом, сделанный, чтобы держать защиту в напряжении, может завершиться неудачей в любом конкретном случае. Если вы выбираете смешанную стратегию в ситуации, за которою несете ответственность перед руководством, вы должны предусмотреть такой вариант. Вам следует заранее объяснить целесообразность использования вашей стратегии, скажем, своему тренеру или боссу. Они должны понять, почему вы ее выбрали и почему считаете, что она обеспечит вам наилучший выигрыш в среднем, хотя иногда и чревата достаточно низким выигрышем. Однако даже такое заблаговременное планирование не всегда способно защитить вашу «репутацию», поэтому вы должны быть готовы к критике при нежелательном исходе игры.