3. Доминирование

We use cookies. Read the Privacy and Cookie Policy

Существует категория игр, в которых одна стратегия неизменно оказывается лучше или хуже другой. В таких случаях применяется один способ, позволяющий упростить поиск равновесия Нэша и его интерпретацию.

Эту концепцию отлично иллюстрирует известная игра под названием «дилемма заключенных». Рассмотрим сюжет, регулярно используемый в телесериале Law and Order («Закон и порядок»). Предположим, мужа и жену арестовали по подозрению в преступном сговоре в целях убийства молодой женщины. Детективы Грин и Лупо размещают их в разных камерах предварительного заключения и допрашивают по отдельности. Реальных улик, связывающих эту пару с убийством, очень мало, хотя есть доказательства того, что они причастны к похищению жертвы. Детективы объясняют каждому подозреваемому, что им обоим грозит тюремное заключение за похищение сроком до 3 лет, даже если ни один из них не признается. Кроме того, мужу и жене по отдельности внушают, что детективам «известны» подробности произошедшего и что один из них участвовал в совершении преступления по принуждению второго. При этом подразумевается, что тюремный срок одного признавшегося будет существенно сокращен, если все подробно изложить на бумаге. (Во многих фильмах такого рода в этот момент на стол обычно кладут стандартный блокнот с отрывными страницами из желтой линованной бумаги и карандаш.) И наконец, супругов убеждают, что, если они оба признают свою вину, можно будет говорить о снижении их тюремных сроков, но не настолько, как в случае, если бы один из них сознался, а другой отрицал свою вину.

В такой ситуации муж и жена — два участника игры с одновременными ходами, в которой каждый игрок должен сделать выбор: сознаваться в убийстве или нет. Оба знают, что в случае отказа признать свою вину каждому из них светит 3 года тюрьмы за причастность к похищению. Подозреваемые также знают, что если один из них сознается, то получит всего 1 год благодаря сотрудничеству с полицией, тогда как другой отправится в тюрьму минимум на 25 лет. Если сознаются оба, у них будет возможность договориться о сокращении тюремного срока до 10 лет для каждого.

Варианты выбора и исходы этой игры представлены в таблице игры на рис. 4.4. Стратегии «признать вину» и «отрицать вину» можно также обозначить как «отказ от сотрудничества» и «сотрудничество», поскольку это отображает роли двух игроков в отношениях между ними. Таким образом, стратегия «отказ от сотрудничества» означает нарушение любой молчаливой договоренности с супругом (супругой), а стратегия «сотрудничество» — совершение действия, которое поможет супругу (супруге), а не сотрудничество с полицейскими.

Рис. 4.4. Дилемма заключенных

Здесь выигрыши — это длительность тюремного заключения в случае каждого исхода игры, поэтому более низкие значения лучше для каждого игрока. Этим данный пример отличается от большинства анализируемых нами игр, в которых более высокий выигрыш — это хорошо, а не плохо. Так что хотим вас предупредить, что больше — не всегда лучше. Когда значения выигрышей отражают рейтинг исходов игры, лучшая альтернатива часто обозначается 1, а последовательно увеличивающиеся числа соответствуют следующим худшим альтернативам. Кроме того, в таблице игры с нулевой суммой, в которой показаны только выигрыши одного игрока, построенные по принципу «чем больше, тем лучше», меньшие числа для другого игрока будут лучше. В представленной здесь дилемме заключенных меньшие числа лучше для обоих игроков. Следовательно, если вам когда-либо придется составлять таблицу выигрышей, где большие числа — это плохо, вы должны четко предупредить об этом читателя, но и сами, если будете читать составленные кем-то примеры, не забывайте о данном нюансе.

Теперь рассмотрим игру с дилеммой заключенных на рис. 4.4 с точки зрения мужа. Он должен подумать, что предпочтет жена. Предположим, он убежден, что она сознается. Тогда его лучший выбор — тоже сознаться, поскольку так он получит 10 лет тюрьмы вместо 25 лет в случае отрицания вины. А если муж полагает, что жена не признается? Опять же, его лучший выбор — сознаться, так как это гарантирует ему всего год заключения вместо трех, которые бы ему обеспечило отрицание вины. Таким образом, в данной игре стратегия «признать вину» для мужа лучше стратегии «отрицать вину» независимо от его убеждений в отношении выбора жены. Будем говорить, что с точки зрения мужа «признать вину» — это доминирующая стратегия, а «отрицать вину» — доминируемая стратегия. Точно так же мы могли бы сказать, что стратегия «признать вину» доминирует над стратегией «отрицать вину» или что стратегия «отрицать вину» доминируется стратегией «признать вину».

Если то или иное действие явно лучшее для игрока независимо от действий других игроков, есть веские основания полагать, что рациональный игрок выберет именно его. Если то или иное действие явно худшее для игрока независимо от действий других игроков, есть не менее серьезные основания считать, что рациональный игрок будет его избегать. Следовательно, доминирование (когда оно существует) образует убедительную основу для теории решений игр с одновременными ходами.

А. Наличие доминирующих стратегий у обоих игроков

В представленной выше дилемме заключенных доминирование должно привести мужа к выбору стратегии «признать вину». Аналогичная логика применима и к выбору жены. Ее стратегия «признать вину» также доминирует над стратегией «отрицать вину», поэтому жена тоже решит сознаться. Следовательно, сочетание стратегий («признать вину», «признать вину») и есть прогнозируемый исход данной игры. Обратите внимание, что это равновесие Нэша. (На самом деле это единственное равновесие Нэша в данной игре.) Каждый игрок выбирает свою оптимальную стратегию.

В нашей игре лучший выбор каждого игрока не зависит от правильности его убеждений в отношении другого игрока (в этом и есть смысл доминирования), однако каждый игрок приписывает другому такую же рациональность, которую демонстрирует сам, поэтому оба должны быть в состоянии сформировать правильные убеждения. А фактическое действие каждого игрока будет наилучшим ответом на фактическое действие другого игрока. Обратите внимание, что факт доминирования стратегии «признать вину» над стратегией «отрицать вину» в случае обоих игроков совершенно не зависит от того, действительно ли они виновны, как во многих эпизодах телесериала «Закон и порядок», или обвинение против них сфабриковано, как в фильме L.A. Confidential («Секреты Лос-Анджелеса»). Все зависит исключительно от схемы выигрышей, определяемой продолжительностью сроков заключения.

Любая игра со схемой выигрышей как на рис. 4.4 обозначается общим названием «дилемма заключенных». А если конкретнее, то дилемме заключенных свойственны три ключевые особенности. Во-первых, в распоряжении каждого игрока есть две стратегии: сотрудничать с соперником (в нашем примере — отрицать любую причастностью к преступлению) или нет (признать вину в совершении преступления). Во-вторых, каждый игрок имеет доминирующую стратегию (признать вину или отказаться от сотрудничества). И наконец, равновесие в доминирующих стратегиях хуже для обоих игроков, чем неравновесная ситуация, при которой каждый игрок использует доминируемую стратегию (сотрудничать с соперниками).

Игры такого типа особенно важны при изучении теории игр по двум причинам. Первая — структура выигрышей, присущая дилемме заключенных, присутствует во многих стратегических ситуациях, касающихся экономической, социальной, политической и даже биологической конкуренции. Столь широкий диапазон применения дилеммы заключенных повышает важность ее изучения и понимания со стратегической точки зрения. Этой теме посвящена вся глава 10 и некоторые разделы других глав.

Вторая — несколько необычный характер равновесного исхода, достигаемого в играх с дилеммой заключенных. Оба игрока выбирают свои доминирующие стратегии, однако полученный равновесный исход обеспечивает им выигрыши ниже, чем они могли бы получить, предпочтя доминируемые стратегии. Следовательно, в дилемме заключенных равновесный исход, по сути, плохой исход для игроков. Существует иной исход, который оба бы предпочли равновесному, но проблема в том, как гарантировать, что никто из игроков не прибегнет к обману. На данной особенности дилеммы заключенных сфокусировались специалисты по теории игр и поставили вполне резонный вопрос: что могут сделать участники игры «дилемма заключенных», чтобы достичь ее лучшего исхода? Мы пока оставим его открытым и продолжим обсуждение игр с одновременными ходами, а затем вернемся к нему и проанализируем более подробно в главе 10.

Б. Наличие доминирующей стратегии у одного игрока

Если у рационального игрока есть доминирующая стратегия, он обязательно ее использует, и другой игрок может в этом не сомневаться. В дилемме заключенных это касается обоих игроков, тогда как в ряде других игр — только одного из участников. Если вы играете в игру, не имея доминирующей стратегии в отличие от соперника, можете исходить из предположения, что он применит ее, а значит, у вас есть возможность выбрать свое равновесное действие (наилучший ответ) с учетом данного факта.

Проиллюстрируем этот случай на примере игры между Конгрессом, отвечающим за фискальную политику (налоги и правительственные расходы), и Федеральной резервной системой (ФРС), осуществляющей монетарную политику[47]. В упрощенной версии, в которой представлены только самые важные аспекты такой игры, фискальная политика Конгресса может сводиться либо к сбалансированному бюджету, либо к дефициту бюджета, а ФРС может устанавливать либо высокие, либо низкие процентные ставки. В реальной жизни эту игру нельзя однозначно отнести к числу игр с одновременными ходами, поскольку даже если выбор в ней делается последовательно, не всегда бывает понятно, кто ходил первым. Мы рассмотрим здесь вариант игры с одновременными ходами, а в главе 6 проанализируем, как будут отличаться исходы при изменении правил игры.

Почти все хотят снижения налогов. При этом немало претендентов на государственное финансирование: оборона, образование, здравоохранение и т. д. Кроме того, существуют различные политически влиятельные группы (в том числе фермеры и отрасли промышленности, страдающие от иностранной конкуренции), нуждающиеся в правительственных субсидиях. Поэтому Конгресс находится под постоянным давлением в плане как снижения налогов, так и увеличения расходов. Однако такой подход становится причиной образования дефицита бюджета, что, в свою очередь, может повлечь за собой рост инфляции. Главная задача ФРС — предотвратить инфляцию. Но ФРС тоже пребывает под политическим прессингом со стороны многих заинтересованных групп, ратующих за снижение процентных ставок, особенно домовладельцев, которым выгодны более низкие ставки по ипотечным кредитам. Снижение процентных ставок приводит к повышению спроса на автомобили, жилье и капиталовложения компаний, но этот спрос может обусловить и рост инфляции. Как правило, ФРС охотно понижает процентные ставки, но только до тех пор, пока нет угрозы инфляции. А она уменьшается, если правительство поддерживает сбалансированность бюджета. С учетом всех этих условий мы построили для этой игры матрицу выигрышей, представленную на рис. 4.5.

Рис. 4.5. Игра с фискальной и монетарной политикой

Для Конгресса лучший (выигрыш 4) — исход с дефицитом бюджета и низкими процентными ставками, что удовлетворяет всех непосредственных участников политического процесса. Правда, это чревато проблемами в будущем, но в политике временные интервалы непродолжительны. По той же причине худший для Конгресса (выигрыш 1) — исход со сбалансированным бюджетом и высокими процентными ставками. Из двух других исходов Конгресс предпочитает исход со сбалансированным бюджетом и низкими процентными ставками (выигрыш 3): он отвечает интересам домовладельцев как представителей важного среднего класса, а низкие процентные ставки предполагают меньше расходов на обслуживание государственного долга, поэтому в сбалансированном бюджете остается место для многих других статей расходов или снижения налогов.

Для ФРС худший (выигрыш 1) — исход с бюджетным дефицитом и низкими процентными ставками, поскольку это сочетание самое инфляционное; лучший (выигрыш 4) — исход со сбалансированным бюджетом и низкими процентными ставками, потому что это сочетание может выдержать высокий уровень экономической активности без большого риска инфляции. Сопоставив два оставшихся исхода с высокими процентными ставками, ФРС выбирает исход со сбалансированным бюджетом, так как он снижает риск инфляции.

Теперь давайте поищем в этой игре доминирующие стратегии. ФРС добьется более высоких результатов за счет низких процентных ставок, если считает, что Конгресс выберет сбалансированный бюджет (в таком случае выигрыш ФРС составит 4, а не 3). С другой стороны, ФРС выгоднее поднять процентные ставки исходя из убеждения, что Конгресс предпочтет дефицит бюджета (тогда выигрыш ФРС составит 2, а не 1). Таким образом, у ФРС нет доминирующей стратегии, а вот у Конгресса она есть. Если он убежден, что ФРС введет низкие процентные ставки, ему выгоднее выбрать бюджетный дефицит, а не сбалансированный бюджет (при этом выигрыш Конгресса составит 4 вместо 3), как, собственно, и в случае высоких процентных ставок (выигрыш Конгресса составит 2 вместо 1). Следовательно, выбор бюджетного дефицита — доминирующая стратегия Конгресса.

Итак, выбор Конгресса очевиден. Какими бы ни были его убеждения в отношении действий ФРС, он предпочтет дефицит бюджета. ФРС же может учесть этот выбор при принятии своего решения. Федеральная резервная система должна отталкиваться от убеждения, что Конгресс применит свою доминирующую стратегию (дефицит бюджета), и исходя из этого выбрать свою лучшую стратегию, то есть высокие процентные ставки.

При таком исходе игры каждая сторона получает выигрыш 2. Однако внимательное изучение рис. 4.5 показывает, что, как и в дилемме заключенных, существует еще один исход (а именно сбалансированный бюджет и низкие процентные ставки), способный обеспечить обоим игрокам более высокие выигрыши (3 для Конгресса и 4 для ФРС). Почему же он недостижим в качестве равновесия? Проблема в том, что у Конгресса возникнет искушение отклониться от заявленной стратегии и незаметно создать дефицит бюджета. ФРС, в свою очередь, зная о подобном соблазне и во избежание худшего исхода (выигрыш 1), тоже отклонится от своей стратегии и повысит ставки. В главе 6 и главе 9 мы расскажем, как обе стороны могут преодолеть эту трудность, чтобы достичь обоюдовыгодного исхода. Но следует отметить, что в большинстве стран в разные времена эти два политических органа действительно оказывались в тупиковой ситуации, когда фискальная политика была слишком мягкой, а монетарная требовала ужесточения, чтобы сдерживать инфляцию.

В. Последовательное исключение доминируемых стратегий

До сих пор в рассмотренных нами играх в распоряжении каждого игрока было по две чистые стратегии. Если одна стратегия в таких играх доминирующая, а другая — доминируемая, то выбор первой равнозначен исключению второй. В более масштабных играх некоторые стратегии игрока могут быть доминируемыми, даже если при этом ни одна стратегия не доминирует над остальными. Если игроки оказываются в игре данного типа, у них есть шанс добиться равновесия посредством исключения доминируемых стратегий из рассмотрения в качестве возможных вариантов выбора. Такое исключение уменьшает размер игры, а в «новой» игре у того же игрока или у его соперника может быть другая доминируемая стратегия, которую тоже можно удалить. В «новой» игре у одного из участников может даже появиться доминирующая стратегия. Последовательное, или итеративное, исключение доминируемых стратегий сводится к их удалению и сокращению размера игры до тех пор, пока дальнейшее сокращение не станет невозможным. Когда этот процесс завершается уникальным исходом, говорят, что игра разрешима по доминированию. Такой исход представляет собой равновесие Нэша, а стратегии, которые его обеспечивают, — равновесные стратегии каждого игрока.

Давайте возьмем в качестве примера этого процесса игру, представленную на рис. 4.1. Рассмотрим первые стратегии Строки. Если какая-то стратегия неизменно обеспечивает этому игроку худшие выигрыши, то она является доминируемой и ее можно исключить из рассмотрения в поисках равновесного выбора Строки. В данном примере единственная доминируемая стратегия Строки — «высоко», над которой доминирует стратегия «внизу»: если Столбец выберет стратегию «слева», Строка получит выигрыш 5 за счет стратегии «внизу» и 4 — за счет стратегии «высоко»; если Столбец предпочтет стратегию «справа», Строка получит выигрыш 9, применив стратегию «внизу», и только 6 в случае «высоко». Следовательно, мы можем исключить стратегию «высоко» из рассмотрения. Теперь проанализируем варианты выбора Столбца на предмет исключения. Стратегия Столбца «слева» доминируется стратегией «справа» (что подтверждают аналогичные рассуждения: 1 < 2, 2 < 3 и 6 < 7). Обратите внимание, что мы не могли сделать такой вывод раньше, до удаления стратегии Строки «высоко»: в игре против стратегии Строки «высоко» Столбец получил бы выигрыш 5 за счет стратегии «слева» и только 4 за счет стратегии «справа». Стало быть, первый этап исключения стратегии Строки «высоко» позволяет перейти ко второму этапу, сводящемуся к удалению стратегии Столбца «слева». Таким образом, в контексте оставшегося набора стратегий («вверху», «низко» и «внизу» у Строки и «посредине» и «справа» у Столбца) стратегии Строки «вверху» и «внизу» доминируемы стратегией «низко». Когда у Строки остается только стратегия «низко», Столбец выберет свой наилучший ответ — а именно стратегию «посредине».

Следовательно, эта игра разрешима по доминированию, а ее исход — «низко»/«посредине» с выигрышами 5, 4. Мы определили его как равновесие Нэша, когда впервые иллюстрировали данную концепцию с помощью этой игры. Теперь более подробно рассмотрели процесс размышлений игроков, приводящий к формированию правильных убеждений. Рациональный игрок Строка не выберет стратегию «высоко». Рациональный игрок Столбец поймет это и, взвесив эффективность своих стратегий против оставшихся у Строки, не выберет «слева». Строка, в свою очередь, предвидя это, не выберет ни «вверху», ни «внизу». И наконец, Столбец, проанализировав все это, применит «посредине».

Другие игры могут быть не разрешимы по доминированию, а последовательное исключение доминируемых стратегий может не обеспечить уникальный исход игры. Но даже в таких случаях исключение доминируемых стратегий позволяет уменьшить размер игры и облегчить ее решение с помощью одного или более методов, описанных в следующих разделах. Стало быть, исключение доминируемых стратегий может стать полезным шагом на пути к решению большой игры с одновременными ходами, даже если не предоставляет возможности решить ее полностью.

До сих пор в процессе анализа итеративного исключения доминируемых стратегий все сравнения выигрышей носили однозначный характер. Но что если выигрыши окажутся равными? Рассмотрим вариант предыдущей игры, показанной на рис. 4.3. В этой ее версии стратегии «высоко» (у Строки) и «слева» (у Столбца) также исключаются. На следующем этапе «низко» по-прежнему доминирует над «вверху», а вот доминирование «низко» над «внизу» стало менее очевидным. Эти две стратегии обеспечивают Строке равные выигрыши в борьбе против стратегии Столбца «посредине», хотя стратегия «низко» все же гарантирует Строке более высокий выигрыш по сравнению со стратегией «внизу» при их использовании против стратегии Столбца «справа». Будем говорить, что с точки зрения Строки в данный момент стратегия «низко» слабо доминирует над стратегией «внизу». Напротив, стратегия «низко» строго доминирует над стратегией «вверху», поскольку обеспечивает более высокие выигрыши, чем стратегия «вверху», разыгранная против обеих стратегий Столбца («посредине» и «справа»), анализируемых на данном этапе.

А теперь хотим предупредить вас вот о чем: последовательное исключение слабо доминируемых стратегий может привести к потере некоторых равновесий Нэша. Рассмотрим игру, представленную на рис. 4.6, где мы вводим Ровену как игрока вместо Строки и Колина вместо Столбца[48]. В случае Ровены стратегия «вверх» слабо доминируема стратегией «вниз»; если Колин сыграет «налево», то Ровена получит лучший выигрыш, применив стратегию «вниз», а не «вверх», а если Колин сыграет «направо», то Ровена получит один и тот же выигрыш от обеих своих стратегий. Точно так же для Колина стратегия «направо» слабо доминирует над стратегией «налево». В таком случае разрешимость по доминированию говорит нам, что сочетание стратегий «вниз»/«направо» — равновесие Нэша. Это действительно так, но «вниз»/«налево» и «вверх»/«направо» — тоже равновесия Нэша. Рассмотрим сочетание «вниз»/«налево». Когда Ровена выбирает «вниз», Колин не может улучшить свой выигрыш, переключившись на стратегию «направо», а когда Колин выбирает «налево», лучший ответ Ровены — сыграть «вниз». Аналогичные рассуждения позволяют убедиться, что «вверх»/«направо» — также равновесие Нэша.

Рис. 4.6. Исключение слабо доминируемых стратегий

В связи с этим при использовании слабого доминирования для исключения некоторых стратегий целесообразно проверить, не пропустили ли вы какие-либо равновесия, с помощью других методов (таких как метод, представленный в следующем разделе). Решение по итеративному доминированию можно считать вероятным равновесием Нэша в этой игре с одновременными ходами, однако следует учитывать также важность множественности равновесий и другие равновесия сами по себе. Мы рассмотрим эти вопросы в следующих главах, проанализировав множественность равновесий в главе 5 и взаимосвязи между играми с последовательными и одновременными ходами в главе 6.