Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 [ 48 ] 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227

§ 17. СМЕШАННЫЕ СТРАТЕГИИ. РЕШЕНИЕ ВСЕХ ИГР 17.1. Два элементарных примера

17.1.1. Для того чтобы преодолеть трудности в случае неполной определенности, который мы рассматриваем, в частности, в п. 14.7, лучше всего возвратиться к простейшим примерам. Это игра в орлянку , а также игра камень, мешок и ножницы (см. пп. 14.7.2 и 14.7.3). Поскольку существует основанное на здравом смысле отношение к проблемам , возникающим в этих играх, мы надеемся получить ключ к нахождению решения в случае неполной определенности игры двух лиц с нулевой суммой, рассматривая и анализируя это отношение.

Уже было замечено, что при игре в орлянку ни один из способов игры (ни выбор герба , ни выбор решетки является лучшим ), не и единственное, что имеет смысл,- это раскрыть намерения противника. Это, на первый взгляд, преграждает путь к решению, так как правила игры запрещают игрокам получать информацию* о выборах противника в момент совершения хода. Однако это обстоятельство не соответствует реальному положению дел: в игре в орлянку против мало-мальски разумного противника игрок не будет стремиться обнаружить намерения противника, а постарается скрыть свои собственные намерения, выбирая в последовательных партиях герб и решетку без какой-либо, закономерности. Таким образом, если мы попытаемся описать стратегию в одной партии - так как в действительности нам приходится рассматривать одну партию, а не целую их последовательность, - то предпочтительнее всего выразить это следующим образом. Стратегия игрока состоит не в выборе герба и не в выборе решетки , а в выборе герба с вероятностью 1/2 и решетки с вероятностью 1/2.

17.1.2. Можно представить себе, что рациональный способ игры в орлянку состоит в том, чтобы перед совершением выбора в партии выбрать решение играть герб или решетку г) с помощью некоторого случайного устройства 50:50. Дело в том, что такая процедура предохраняет игрока от потерь. Действительно, что бы ни делал противник, ожидаемый выигрыш игрока равен нулю 2). Это верно, в частности, и тогда, когда противник играет герб , и тогда, когда он играет решетку , и тогда, когда он играет герб и решетку с некоторыми вероятностями 3).

Следовательно, если мы разрешим игроку в игре в орлянку использовать статистическую стратегию, т. е. смешивать возможные способы игры с некоторыми вероятностями (выбираемыми им самим), то он сможет избежать потерь. Действительно, выше мы определили статистическую стратегию, применяя которую игрок не может проиграть независимо от того, что бы ни делал его противник. То же самое верно и для противника, т. е. он может применять статистическую стратегию, которая не даст игроку выиграть независимо от его действий 4).

г) Например, игрок может бросить игральную кость так, чтобы противник не видел результата бросания, и выбирать герб , если получившееся в результате бросания число четное, и решетку в противном случае.

2) Именно вероятность его выигрыша равна вероятности проигрыша, потому что в указанных условиях вероятность угадать, равно как и вероятность не угадать, равна 1/2, что бы противник ни предпринял.

3) Скажем р, 1 - р. Для самого игрока мы приняли вероятности 1/2, 1/2.

4) Все это, конечно, следует понимать в статистическом смысле: то, что игрок не может проиграть, означает, что вероятность проигрыша вероятности выигрыша. То, что он не может выиграть, означает, что первая вероятность не меньше второй. В действительности каждая партия будет заканчиваться выигрышем или проигрышем, поскольку орлянка не знает ничьих.



Читатель может заметить большое сходство этих рассуждений с рассуждениями из п. 14.5 1). С этой точки зрения является вполне законным рассматривать нуль как значение партии для игры в орлянку , а статистическую смесь герба и решетки в пропорции 50:50 - как оптимальную стратегию.

Ситуация в игре камень, мешок и ножницы вполне аналогична. Здравый смысл подсказывает, что оптимальный способ игры заключается в выборе каждой из трех альтернатив с вероятностями 1/3 2). Значение партии, как и обоснование качества такой стратегии, может быть мотивировано так же, как и в предыдущем случае 3).

17.2. Обобщение изложенной точки зрения

17.2.1. Представляются правдоподобными попытки распространить результаты, полученные для игр в орлянку и в камень, мешок и ножницы , на все игры двух лиц с нулевой суммой.

Мы будем иметь дело с нормальной формой игры, принимая, как и раньше, т4 = 1, . . ., Pi и т2 = 1, . . ., Р2 в качестве возможных выборов игроков и считая выигрыш игрока 1 равным Ж т2). Мы не делаем здесь предположений о полной определенности игры.

Попытаемся повторить процедуру, оказавшуюся успешной в п. 17.1. Это значит, что мы будем рассматривать игроков, для которых теория игры заключается не в выборе определенных, стратегий, а в выборе нескольких стратегий с определенными вероятностями 4). Таким образом, игрок 1 будет выбирать не число т4 = 1, . . ., р1? т. е. не стратегию 2*1, a Pi чисел £1? . . ., \§х - соответственно вероятности стратегий 2}, . . ., 2J*1. Аналогично игрок 2 будет выбирать не число т2 = = 1, . . ., р2, т. е. не стратегию 2J2, а р2 чисел tji, . . ., г)з2, которые являются вероятностями стратегий 22, . . ., 2f2. Поскольку эти вероятности относятся к попарно несовместимым и единственно возможным альтернативам, числа £Т1 и %2 подчиняются условиям

(17:1:а) gTl0, Sgtl = l,

(17:l:b) тьО, 2 Лт2 = 1

т2=1

и никаким другим.

Образуем векторы \ = . . ., и т] = {г]!, . . ., щ2}. Только

-> ->

что выписанные условия означают, что £ £ S$v a rj £ S$2 (см. п. 16.2.2).

При таком положении дел игрок выбирает не стратегии, как раньше, а только вероятности, с которыми он использует их в партии. Это

А) Имеются в виду утверждения (14:C:d) и (14:С:е) из п. 14.5.1.

2) Как и ранее, здесь можно использовать случайное устройство. Одним из возможных является прием, упомянутый в сноске 1 на стр. 168. Например, игрок может выбрать камень , если на кости выпадают 1 или 2, мешок , если выпадают 3 и 4, и ножницы , если выпадают 5 или 6.

3) В игре камень, мешок и ножницы ничья существует, однако проигрыш не означает, что вероятность проигрыша 2 вероятности выигрыша, и выигрыш не означает обратного. См. сноску 4 на стр. 168.

4) То, что эти вероятности одни и те же для всех стратегий (в примерах предыдущего пункта 1/2, 1/2 или 1/3, 1/3, 1/3), является, конечно, случайностью. Можно ожидать, что это равенство появилось ввиду симметричности появления в этих играх различных альтернатив. Теперь мы переходим к допущению, что существенным в формировании стратегии было появление самих вероятностей, тогда как их конкретные значения носят второстепенный характер.



обобщение встречается со значительными трудностями в случае не полной определенности. Мы видели, что характеристической чертой этого случая являются потерих) игрока, если его намерения становятся известными противнику. Поэтому в такой игре для игрока является очень важным скрыть от противника свои намерения 2). Случайный выбор нескольких различных стратегий, для которых определенными являются только их вероятности, представляется весьма эффективным для этого путем. При такой игре противник не может узнать, какую стратегию выберет игрок, поскольку последний сам этого не знает 3). Незнание является, конечно, самой лучшей гарантией против прямого или косвенного раскрытия информации.

17.2.2. Может показаться, что в данном случае мы несколько ограничили свободу действий игрока. Может случиться, что он захочет играть одну определенную стратегию, исключив все остальные, или, желая выбирать некоторые стратегии с определенными вероятностями, захочет полностью исключить возможность выбора остальных 4). Мы подчеркиваем, что такие возможности находятся целиком в рамках нашей схемы. Игрок, не желающий играть те или иные стратегии, просто будет выбирать каждую из них с вероятностью нуль. Игрок, желающий играть одну определенную стратегию, исключив все остальные, выберет ее с вероятностью единица, а все остальные - с вероятностью нуль.

Таким образом, если игрок 1 захочет играть то он в качестве

вектора выберет координатный вектор 8Xl (см. п. 16.1.3). Аналогично,

если игрок 2 захочет выбрать стратегию 2J2, то он выберет в качестве г\

вектор 8t2. В свете предыдущих рассмотрений мы будем называть вектор

£ £ Sfa или вектор т £ S$2 статистической или смешанной стратегией

соответственно игроков 1 или 2. Координатные векторы STl или 6Тз отвечают, как мы уже видели, первоначальным стратегиям xt или т?, т. е. SJ1 или E2t2 игроков 1 или 2. Мы будем называть их точными или чистыми стратегиями.

17.3. Оправдание процедуры применительно к отдельной партии

17.3.1. На данном этапе читатель может почувствовать неудобство и усмотреть противоречие между двумя точками зрения, которые мы в наших рассуждениях считали одинаково реалистичными. С одной стороны, мы всегда настаивали на том, что наша теория является статической (см. п. 4.8.2) и что мы исследуем течение одной партии, а не последо-

*) А > 0 из п. 14.7.1.

2) Но это не обязательно единственная цель.

3) Если противник имеет достаточную статистическую информацию о стиле игрока или если он обладает достаточным здравым смыслом в рационализации своего поведения, то он сумеет обнаружить вероятности (точнее говоря, частоты) различных стратегий. (Мы не вдаемся сейчас в обсуждение того, как и каким образом это может произойти. См. п. 17.3.1.) Однако сущностью понятий вероятности и случайности является то, что никто ни при каких условиях не может предсказать, что фактически произойдет в каждом отдельном случае. (Исключение составляют вырожденные вероятности, по поводу которых см. дальше.)

4) В этом случае он, очевидно, увеличивает опасность обнаружения своей стратегии противником. Однако может оказаться, что эта стратегия или стратегии имеют сами по себе такие преимущества перед остальными стратегиями, что сведут на нет эту неприятность. Это происходит, например, при использовании оптимальных стратегий в случае полной определенности (см. п. 14.5, в частности утверждения (14:С:а), (14:С:Ь), (14:С:с) из п. 14.5.2).



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 [ 48 ] 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227