Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 [ 69 ] 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227

Итак, мы видим, что в дискретной игре корректное использование блефа является очень сложным и деликатным делом, которое предоставляет весьма небольшие преимущества блефующему игроку.

Возможно, что этоявление типичное и встречается в более сложных реальных играх. Оно показывает, сколь осторожным следует быть при формулировке предположений или утверждений, затрагивающих непрерывность в этой теории х). Но практическая значимость - т. е. размер выигрыша или проигрыша - по-видимому, не велика, и все это, вероятно, является белым пятном даже для самых опытных игроков.

19.13. т возможных ставок

19.13.1. Рассмотрим второй случай, (В), т.е. предположим, что расклады по-прежнему непрерывны, но допускается назначение ставок более чем двумя способами. Иными словами, мы заменяем две ставки

а>6(>0)

на ряд, скажем, из т ставок

i > а2 > ... > tfm-i > ат (> 0).

В этом случае решение также напоминает решение, описываемое на рис. 24 2). Существует такое 3) z°, что для z > z° игроку не следует делать ничего, кроме назначения самых высоких ставок, в то время как при z<z° ему следует случайным образом с определенными вероятностями варьировать ставки (назначать различные ставки, всегда включая самую большую аг). Какие ставки и с какими вероятностями следует делать, определяется значением z.

Замечание. Если ставки, которые он должен назначить, суть ар, aq, ... . . ., ап (1 < р < д< . . . <с п), то можно показать, что вероятности, с которыми эти ставки следует назначать, должны быть соответственно равны

ill J (с==±+±+ + ±\

cat сар caq * сап \ at ~ ар* * ~ ап )

Иными словами, вероятность каждой ставки, которая может быть назначена, должна быть обратно пропорциональна ее величине.

Какие именно ар, aq, . . . , ат следует выбирать на самом деле при данном z, определяется более сложным критерием, который мы не будем здесь рассматривать.

Заметим, что величина с необходима только для того, чтобы сумма всех вероятностей была равна 1. Читатель может сам проверить, что вероятности на рис. 24 равны этим значениям.

Итак, мы имеемзону блефа и выше нее зону высоких ставок - фактически же только зону наивысших ставок,- именно так, как на рис. 24. Но блеф - в его собственной зоне z z° - имеет более сложную и изменяющуюся структуру, чем на рис. 24.

Мы не будем вдаваться в детальный анализ этой структуры, хотя это и представляет определенный интерес. Однако одну из ее особенностей мы упомянем.

J) В связи с этим напомним проблему, сформулированную во второй части замечания на стр. 220.

2) На самом деле это верно только при некотором дополнительном ограничении, запрещающем раскрытие при более высокой ставке. Иными словами, предполагается, что каждый игрок сразу делает свою последнюю наивысшую ставку и пасует (соглашаясь с последствиями), если ставка противника превзойдет его собственную.

3) Аналог величины ъ ~--на рис. 24.



19.13.2. Пусть даны два числа

а>6>0.

Возьмем их в качестве высшей и низшей ставок:

ai = a, ат - Ъ.

Далее, пусть т-> оо и выберем оставшиеся ставки а2, . ...am-i так, чтобы они заполняли интервал

с неограниченно возрастающей плотностью (см. приведенные ниже в сноске 1 на этой стр. два примера). Если теперь описанная выше оптимальная стратегия стремится к пределу, т. е. к асимптотической стратегии при т -> оо, то предельную стратегию можно интерпретировать как оптимальную стратегию для игры, в которой размеры ставок лежат между верхней и нижней границами (а и Ъ) и могут быть любыми числами между ними (т. е. в (19:24)). Тем самым снимается упомянутое в начале п. 19.3 требование минимального интервала между ставками.

Теперь этого нет. Например, мы можем вставить между ах = а и ат = Ъ числа а2, . . . , am i как в арифметической, так и в геометрической прогрессии1). В обоих случаях при т -> оо получаются некоторые асимптотические стратегии, но эти две стратегии отличаются многими существенными деталями.

Если мы рассмотрим игру, в которой все ставки (19:24) допустимы и в этом смысле являются равноправными, то в этом случае возможно непосредственное нахождение оптимальных стратегий. При этом оказывается, что оптимальными будутчне только обе упомянутые выше стратегии, но и многие другие.

Это показывает, к каким осложнениям можно прийти, отказавшись от минимального интервала между ставками. Именно оптимальная стратегия предельного случая не может служить приближением для оптимальных стратегий всех близких случаев с конечным числом ставок. Тем самым еще раз подчеркивается значимость заключительных замечаний

19.14.1. Рассмотрим третий, последний случай, (С). Единственный полученный пока результат в этом направлении состоит в том, что мы можем заменить одновременные ставки обоих игроков на две последовательные, т. е. договориться, что сначала назначает ставку игрок 1, а затем игрок 2.

Таким образом, формулированные в п. 19.4 правила модифицируются следующим образом.

х) В первом случае они определяются по формуле

(19:24)

в п. 19.12.

19.14. Чередующиеся ставки

((га-р)а-\-(р-1) Ь) для р = 1,2,...,т - 1, /п,

во втором случае-по формуле

ар=т угат-РЫ>-1ъ для р=\, 2,

т - \, т.



Сначала каждый игрок в результате случайного хода получает свой расклад 5 = 1, . . . , S; каждое из.этих чисел имеет одну и ту же вероятность 1/S. Обозначим расклады игроков 1 и 2 соответственно через s4 и s2.

После этого г) игрок 1 своим личным ходом выбирает либо а, либо Ь, т. е. высокую или низкую ставку 2). Он осуществляет это только на основе собственного расклада, ничего при этом не зная о раскладе партнера. Если его ставка низкая, то игра закончена. Если его ставка высокая, то игрок 2 личным ходом выбирает 3) либо а, либо Ь, т. е. высокую или низкую ставку. Он осуществляет это только на основе собственного расклада и выбора противника, ничего не зная при этом о раскладе партнера.

В этом состоит партия игры. По ее окончании расплата производится

следующим образом. Если ставка игрока 1 низкая, то при = s2 игрок 1

получает от игрока 2 соответственно 0. Если ставки обоих игроков высо-

-Ъ а

кие, то при Si = s2 игрок 1 получает от игрока 2 соответственно 0.

Если ставка 1 высокая, а ставка игрока 2 низкая, то игрок 1 получает 4) от игрока 2 только Ъ.

19.14.2. Рассмотрение чистых и смешанных стратегий теперь можно провести, по существу, точно так же, как это было сделано для исходного варианта покера в п. 19.5.

Укажем основные направления этого рассмотрения, что будет вполне понятно для читателя, если он вспомнит сказанное в пп. 19.4-19.7.

Чистая стратегия в этой игре состоит, очевидно, в следующем. Для каждого расклада s = 1, . . . , S указывается назначаемая ставка:- высокая или низкая. Проще всего это описать с помощью числового индекса: is = 1, 2, причем is = 1 соответствует высокой ставке, a is = 2 - низкой. Таким образом, стратегия игрока состоит в задании таких индексов ig. для каждого s = 1, . . . , S, т. е. в задании последовательности iu . . . , is.

Это относится к каждому из игроков 1 и 2; поэтому описанную выше стратегию мы будем обозначать через 24 . . . , is) или соответственно через 22 (/ь . . , 7s)- Таким образом, количество стратегий у игроков одинаково - их столько же, сколько последовательностей iu . . . , is* т. е. число их равно 2s. В обозначениях из п. 11.2.2 мы имеем

6, = 62 = 6 = 2S.

(Подчеркнем, что рассматриваемая игра не симметрична!)

Теперь мы должны записать выигрыш, получаемый игроком 1, если игроки используют стратегии 21 . . . , is), 22 (/ь . , 7s) соответственно. Он определяется элементом матрицы SK . . . , is 7ь 7s)* Если расклады игроков будут s} и s2, то выигрыш игрока 1 можно записать, используя сформулированные выше правила, следующим образом. Он равен <£Sing (si-S2) (hx, 7s2) гДе sign (54 - s2) - знак числа st - s2f а три функции

*) Мы продолжаем с этого места, как если бы игрок 2 уже сделал низкую ставку, а игрок 1 выбирал бы, что ему делать: раскрывать или повышать. На этом этапе мы рассматриваем пасование.

2) То есть повышает или раскрывается (см. сноску

3) То есть раскрывается или пасует.

4) При интерпретации этих правил вспомним приведенные выше сноски. Формально говоря, следовало бы вспомнить и замечание на стр. 213.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 [ 69 ] 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227