9. Эмпирические данные о смешивании стратегий

We use cookies. Read the Privacy and Cookie Policy
А. Игры с нулевой суммой

Первые исследователи, проводившие лабораторные эксперименты в области теории игр, как правило, пренебрегали смешанными стратегиями. Дуглас Дэвис и Чарльз Холт сказали по этому поводу следующее: «Участников экспериментов редко (если вообще когда-либо) можно было увидеть за подбрасыванием монеты, а когда впоследствии им говорили, что равновесие подразумевает рандомизацию, это вызывало у них удивление и скептицизм»[103]. Когда ожидаемое равновесие подразумевает смешивание двух или более чистых стратегий, результаты экспериментов показывают, что некоторые участники группы придерживаются одной чистой стратегии, тогда как остальные — другой, но это не истинное смешивание стратегий одним игроком. При многократной игре участников эксперимента в игры с нулевой суммой отдельные игроки часто со временем выбирают другие чистые стратегии. Тем не менее создается впечатление, что они ошибочно принимают чередование за случайный выбор, то есть переключаются между стратегиями чаще, чем того требует истинная рандомизация.

В ходе последующих исследований были получены несколько более достоверные данные в пользу смешивания в играх с нулевой суммой. Когда участники лабораторных экспериментов имеют возможность накопить большой опыт, они действительно осваивают навыки смешивания стратегий в играх с нулевой суммой. Тем не менее отклонения от равновесных прогнозов остаются весьма существенными. Усредненные по всем участникам эксперимента эмпирические вероятности, как правило, достаточно близки к вероятностям, рассчитанным посредством равновесия, но многие игроки все же выбирают стратегии в пропорциях, далеких от предсказанных равновесием. Колин Камерер сказал об этом следующее: «Общая картина такова, что смешанные равновесия в среднем не приводят к неверным догадкам в отношении поведения людей»[104].

Один случай практического применения рандомизации произошел в Малайе в конце 1940-х годов[105]. Британская армия сопровождала продовольственные конвои, чтобы защитить их от нападений коммунистов-террористов. Последние могли либо организовать масштабное нападение, либо провести мелкий снайперский обстрел, чтобы напугать водителей грузовиков, дабы те отказались от выполнения такой работы в следующий раз. Британское сопровождение могло либо группироваться в одном месте, либо рассредоточиться по всему конвою. Для армии сосредоточение позволяло эффективнее противостоять масштабной атаке, а рассредоточение было действенно против снайперов. Для террористов масштабное нападение было лучше при рассредоточенном сопровождении, а снайперский обстрел — при концентрации военных. В этой игре с нулевой суммой есть только одно равновесие в смешанных стратегиях. Командир отряда сопровождения, даже не слышавший о теории игр, решил проблему следующим образом. Каждое утро во время формирования конвоя он брал травинку в одну из рук и прятал руки за спиной, предлагая солдатам угадать, в какой руке травинка. В зависимости от ответа солдата командир выбирал тот или иной тип сопровождения конвоя. Хотя о точных показателях выигрышей в этой игре судить трудно, поэтому мы не можем сказать, было ли верным смешивание стратегий в соотношении 50 на 50, этот офицер правильно оценил необходимость рандомизации и важности использования новой процедуры рандомизации каждый день, чтобы избежать формирования закономерности или слишком частого чередования вариантов выбора.

Самые убедительные данные в поддержку смешанных стратегий в играх с нулевой суммой связаны со спортом, особенно его профессиональными видами, в которых игроки накапливают большой опыт, а присущее им стремление к победе подкрепляет крупное материальное вознаграждение при ее достижении.

Марк Уокер и Джон Вудерс проанализировали игру «подача — возврат подачи» между теннисистами высшего уровня во время матчей Уимблдонского турнира[106] и представили это взаимодействие как игру с двумя участниками (подающим и принимающим), в которой каждый игрок имеет две чистые стратегии. Подающий может делать подачу под правую или левую руку принимающего, а принимающий может делать предположения о том, в какую сторону отправит подачу подающий, и двигаться именно туда. Поскольку во время турниров высшего уровня в мужском одиночном разряде подачи выполняются очень быстро, принимающий не может предпринять ответное действие после того, как увидит фактическое направление подачи, поэтому ему приходится двигаться в соответствии со своей оценкой возможного направления. Таким образом, это игра с одновременными ходами. Кроме того, так как принимающий стремится правильно угадать действия подающего, а подающий старается ввести в заблуждение принимающего, в этой игре мы видим равновесие в смешанных стратегиях. Отследить стратегию принимающего на видеозаписи невозможно (разве можно увидеть, на какую ногу он переносит вес?), поэтому полную матрицу выигрышей для проверки, смешивают ли игроки свои чистые стратегии в соответствии с равновесными прогнозами, воссоздать нельзя. Тем не менее правильность важного теоретического прогноза можно проверить, рассчитав частоту, с которой подающий выигрывает очко в случае каждой из имеющихся в его распоряжении стратегий подачи.

Если теннисисты используют равновесные комбинации стратегий в игре «подача — возврат подачи», подающий должен выигрывать очко с одинаковой вероятностью независимо от того, делает ли он подачу под правую или под левую руку принимающего. В реальном теннисном матче два игрока разыгрывают не менее сотни очков; следовательно, это предоставляет достаточно данных, чтобы проверить, выполняется ли это условие в каждом матче. Уокер и Вудерс составили таблицу результатов подач в 10 матчах. В каждом матче используются четыре типа комбинаций «подача — возврат подачи»: игрок А делает подачу игроку Б и наоборот в сочетании с подачей с правой или с левой стороны корта. Таким образом, Уокер и Вудерс проанализировали данные о 40 ситуациях с розыгрышем подачи и обнаружили, что в 39 из них показатели результативности подающего в случае подачи под правую и под левую руку попадали в допустимые пределы статистической погрешности.

По всей вероятности, теннисисты высшего уровня накопили достаточно большой общий опыт игры в теннис и ее ведения против различных соперников, для того чтобы усвоить общий принцип смешивания стратегий в правильном соотношении в игре против конкретных противников. Тем не менее, чтобы добиться необходимого уровня непредсказуемости, в любой последовательности подач не должно быть никакой закономерности: выбор стороны при каждой подаче не должен зависеть от предыдущего выбора. Как уже отмечалось в контексте применения смешанных стратегий на практике, игроки могут слишком часто чередовать чистые стратегии, не осознавая того, что чередование — такая же закономерность, как и неоднократное повторение одного и того же действия. И данные действительно подтверждают тот факт, что подающие чередовали свои стратегии слишком часто. Однако, согласно тем же данным, такое отклонение от истинного смешивания стратегий оказалось не настолько большим, чтобы соперники его заметили и использовали с выгодой для себя.

Как было показано в разделе 8, пенальти в футболе — еще один подходящий контекст для изучения смешанных стратегий. Преимущество анализа штрафных ударов состоит в том, что это действительно позволяет отслеживать стратегии, используемые как игроком, выполняющим пенальти, так и вратарем, то есть видеть не только, куда бьющий игрок собирается послать мяч, но и в какую сторону бросается вратарь. Это означает, что мы можем вычислить фактические вероятности смешивания стратегий и сравнить их с теоретическими прогнозами. Недостаток этого контекста по сравнению с теннисом состоит в том, что два игрока сталкиваются друг с другом не более чем несколько раз за сезон. Для того чтобы собрать достаточно данных, вместо анализа конкретных случаев противоборства между игроками необходимо проанализировать показатели всех вратарей и игроков, выполняющих пенальти. По результатам двух исследований, основанных именно на таких данных, было получено убедительное подтверждение теоретических прогнозов.

Проанализировав большой объем данных, предоставленных профессиональными футбольными лигами Европы, Игнасио Уэрта составил таблицу выигрышей, соответствующих средней вероятности успешных ударов бьющего игрока (рис. 7.12)[107]. Поскольку в эти данные включены показатели бьющих игроков как с правой, так и с левой ноги, а значит, у них разное естественное направление удара, здесь естественной считается стратегия «направо». (Игроки, выполняющие пенальти, обычно бьют по мячу внутренней стороной стопы. Для игрока, бьющего с правой ноги, естественным является удар направо от вратаря, а с левой — удар налево от вратаря.) Каждый игрок располагает двумя вариантами стратегий — «налево» и «направо». Когда вратарь выбирает стратегию «направо», это означает, что он будет прикрывать естественное направление удара бьющего игрока.

Рис. 7.12. Вероятности успешного выполнения пенальти в европейских высших лигах

Воспользовавшись свойством безразличия соперника, можно легко определить, что бьющий игрок должен выбирать стратегию «налево» в 38,3 % случаев, а стратегию «направо» в 61,7 % случаев. Такая комбинация стратегий обеспечивает показатель результативности ударов 79,6 % независимо от того, какую стратегию выберет вратарь. Вратарь, со своей стороны, должен выбирать стратегии «налево» и «направо» в 41,7 и 58,3 процентах случаев соответственно; эта комбинация стратегий позволит ему удержать показатель результативности ударов бьющего игрока на уровне 79,6 %.

Что же происходит на самом деле? Игроки, выполняющие пенальти, применяли стратегию «налево» в 40,0 % случаев, а вратари — в 41,3 % случаев. Эти показатели максимально близки к теоретическим прогнозам. Выбранные комбинации стратегий почти полностью защищены от использования соперником в своих интересах. Смешанная стратегия бьющего игрока обеспечивает показатель результативности ударов 79 % против стратегии вратаря «налево» и 80 % против стратегии вратаря «направо». Смешанная стратегия вратаря удерживает показатель результативности бьющих игроков на уровне 79,3 % при выборе ими стратегии «налево», а при тратегии «направо» в 79,7 % случаев.

В ранее опубликованной работе Пьер-Андре Кьяппори, Тимоти Гроусклоуз и Стивен Левитт использовали аналогичные данные и получили аналогичные результаты[108]. Кроме того, они проанализировали всю последовательность выбора стратегий каждым игроком, бьющим пенальти, и каждым вратарем и не нашли случаев чрезмерного чередования. Это можно объяснить тем, что большинство одиннадцатиметровых штрафных ударов представляют собой единичные события, происходящие на протяжении многих матчей, в отличие от многократно повторяющихся розыгрышей очка в теннисе, поэтому в случае пенальти игроки чаще не учитывают то, что происходило во время предыдущих пенальти. Тем не менее все эти данные говорят о том, что действия игроков во время выполнения пенальти в футболе даже ближе к истинному смешиванию стратегий, чем в игре «подача — возврат подачи» в теннисе.

При столь убедительном эмпирическом подтверждении теории было бы резонно спросить, эффективны ли навыки смешивания стратегий, приобретенные игроками в футболе, в других игровых контекстах. Результаты одного исследования подтвердили, что да (испанские профессиональные футболисты играли в точном соответствии с равновесными прогнозами во время лабораторных экспериментов в матричных играх с нулевой суммой два на два и четыре на четыре). Тем не менее в ходе другого исследования воспроизвести эти результаты не удалось. В его рамках анализировались показатели игроков американской Высшей лиги футбола, а также участников Мировой серии покера (у которых, как говорилось в разделе 8, также есть профессиональные причины для предотвращения использования их действий соперниками с выгодой для себя посредством смешивания стратегий) и было установлено, что поведение профессиональных игроков во время абстрактных матричных игр так же далеко от равновесия, как и поведение студентов. Как и в случае исследований с участием профессиональных шахматистов, о которых шла речь в главе 3, при наличии опыта профессиональные игроки смешивают стратегии в соответствии с теорией равновесия в своей профессиональной сфере, но этот опыт не приводит их автоматически к равновесию в новых и незнакомых играх[109].

Б. Игры с ненулевой суммой

Лабораторные эксперименты со смешиванием стратегий в играх с ненулевой суммой дают еще более отрицательные результаты, чем аналогичные эксперименты в играх с нулевой суммой. И это неудивительно. Как мы уже убедились, в таких играх свойство, в соответствии с которым равновесная комбинация стратегий каждого игрока становится причиной безразличия соперника в отношении выбора между чистыми стратегиями, — логическое свойство самого равновесия. В отличие от игр с нулевой суммой, у каждого участника игры с ненулевой суммой зачастую нет положительных или целевых причин добиваться безразличия других игроков. В таком случае игрокам труднее понять и освоить логику рассуждений, лежащую в основе вычисления вероятностей применения чистых стратегий в смешанной стратегии, что проявляется в их поведении.

В группе участников эксперимента, играющих в игру с ненулевой суммой, можно увидеть, как одни игроки придерживаются одной чистой стратегии, тогда как другие — другой. Этот тип смешивания в группе не согласуется с теорией равновесий в смешанных стратегиях, хотя у такого смешивания есть интересная эволюционная интерпретация, которую мы проанализируем в главе 12.

Как мы говорили выше в разделе 5.Б, вероятности применения чистых стратегий в смешанной стратегии каждого игрока не должны меняться при изменении его выигрышей. Однако на самом деле именно это и происходит: как правило, игроки выбирают то или иное действие чаще, если их собственный выигрыш от этого увеличивается[110]. Игроки действительно меняют свои действия в ходе повторных раундов игры с разными партнерами, но не в соответствии с равновесными прогнозами.

Общий вывод таков: в играх с ненулевой суммой следует интерпретировать и применять равновесия в смешанных стратегиях как минимум с большой осторожностью.