Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 [ 43 ] 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227

§ 15] игры с полной информацией 453

основанное на четко определенных понятиях. Ценность приводимых правдоподобных рассуждений заключается том, что они легче уясняются и MOfyTf быть повторены применительно к другим играм с полной информацией, выходящим за пределы класса игр двух лиц с нулевой суммой. Мы хотим здесь подчеркнуть, что та же критика приложима и в общем случае и что ее нельзя оставить без опровержения. Действительно, решение в общем случае (даже для игр с полной информацией) будет найдено совсем иным путем. Наши рассуждения прояснят природу различия между случаем игр двух лиц с нулевой суммой и общим случаем. Это будет достаточно важным для обоснования существенно отличающихся друг от друга методов, которые будут применяться в общем случае (см. § 24).

15.8.2. Рассмотрим игру двух лиц с нулевой суммой Г с полной информацией. Воспользуемся обозначениями} п. 15.6.2, указав аЖи с#2, . . ., qMv; оь а2, . . ., crv; ки к2 Ю, . . ., К (ои а2, . . ., а);

вероятности; операторы Mov М02 , . . ., MGv ; последо-

вательность игр (15:9), полученную из Г, и функцию JF± (л (оь . . ., ov)).

Начнем исследование игры Г с последнего хода e#v, после чего пойдем в обратном направлении через ходы c#V-i, <М 2, ... Предположим сначала, что выборы о4, о2, ..., ov i соответственно при ходах <Jiu М2, ...

qMv-i уже сделаны и совершается выбор ov (при ходе ©#v).

Если ход eSv случайный, т. е. если fev(i, о2, av i) = 0, то ov будет принимать значения 1, 2, a>v(ou av 4) соответственно с вероятностями /?v(l), jPv(2), Pv(&v(Gti v-i))- Поэтому математическое ожидание выигрыша (игрока 1) (л(а1? av b av)) будет равно

av!(ai,..., av-1)

2 Pv (<*v) Fi (Я ((Ti, . . ., Ov.!, 0V)).

Если o/fiv является личным ходом игрока £1 или 2, т. е. если К(ои 0 = 1 или 2, то игрок будет при выборе 0V максимизировать или минимизировать i{n(ou ..., ov i, av)), т. е. исходом игры будет maxJr1(n(o1, 0v i, cv)) или тт#1(л(01, ov-1, ov)).

Таким образом, во всех случаях математическое ожидание выигрыша (после выборов 04, 0V 4) равно

(nfr, .... 0V)).

Предположим, далее, что выбраны только 01г ov 2 (при ходах

аМу 2) и предстоит выбрать о (при ходе e#V-i). Поскольку определенный выбор ov-i приводит, как мы уже видели,

к исходу ((Tli (я (a1? av)), который является функцией

только от 04, ov-1 (так как операция MGv связывает пере-

менную av), мы можем поступить так же, как и раньше. Нам нужно только заменить v; a4, ..., av; Мо1<Tv l)i (л (a4, ..., av)) соответственно на v - 1; alf ..., av-i; (01, (°b * °v-4У 4 (л (a4,. .. ov)). Следовательно, ожидаемый выигрыш в игре после выполнения



выборов ai, av 2 равен

<::(0b--av-X(aie.(SK

Аналогично математическое ожидание выигрыша в игре после выборов а1? ..., av 3 равно

<:22(aiMlnf1..... a~)*l( (ot,crv)).

Наконец, математическое ожидание выигрыша во всей игре -перед тем как она началась - равно

М%М* ... Mlnf1 Mlf1av-l)t(n(at, av)).

А это в точности совпадает со значением v из (15:12) в п. 15.6.2 1).

15.8.3. Основным возражением , против процедуры, описанной в п. 15.8.2, является то, что этот подход к значению для партии игры Г предполагает наличие рационального поведения всех игроков; иными словами, стратегия игрока 1 основана на предположении об оптимальности стратегии игрока 2, и наоборот.

Положим, в частности, kv-i (al7 . . ., crv 2) = 1, kv (a4, . . ., av i) = = 2. Тогда игрок 1 при ходе выбирает av 4 в предположении, что

игрок 2 при ходе oMv выбирает av рациональным образом. Единственным оправданием для такого предположения является то, что выбор av 4 приводит к выигрышу min $F ± (я (аи . . ., av)), т. е.

к MaJ(ai av l) (я (а4, . . ., av)) (см. определение в п. 15.8.2).

Во второй части п. 4.2.1 мы пришли к заключению, что гипотезы о рациональном поведении противников следует избегать. Аргументация в п. 15.8.2 не удовлетворяет этому требованию.

Однако можно согласиться с тем, что в игре двух лиц с нулевой суммой можно предположить рациональность поведения противника, поскольку ошибки противника никогда не вредят игроку. Действительно, так как речь идет об игре с двумя участниками, и сумма их выигрышей равна нулю, любые потери, которые несет один игрок (в том числе вследствие своей неразумности), необходимо оборачиваются равным по величине выигрышем другого игрока 2). В таком виде этому соображению далеко до полноты, но оно может быть тщательно разработано. Однако для нас нет необходимости проводить здесь строгие рассуждения: мы располагаем доказательством пп. 15.4-15.6, которое для такой критики неуязвимо 3).

г) Представляя себе применение указанной процедуры в какой-либо конкретной игре, следует помнить, что длина игры Г предполагается фиксированной. Если v является в действительности переменной, как это имеет место в большинстве игр (см. замечание 1 на стр. 85), то следует сделать ее постоянной, дополнив игру фиктивными бессодержательными ходами, как это описано в конце п. 7.2.3. Только после этого становится допустимым обратное движение через ходы o#v, gv i, . . <М±. Для практических построений эта процедура, конечно, не лучше, чем описанная в пп. 15.4-15.6.

Возможно, некоторые простые игры типа игры в крестики и нолики могут быть эффективно исследованы таким способом.

2) Это не обязательно так, если игра не является игрой с нулевой суммой или же если она имеет более двух игроков.

3) См. в связи с этим (14:D:a), (14:D:b), (14:C:d), (14:С:е) в п. 14.5.1 и (14:С:а), 14:С:Ь) в п. 14.5.2.



Тем не менее предыдущие рассуждения могут оказаться значимыми для некоторого существенного аспекта вопроса. Мы увидим, как влияет изменение условий в более общем случае (без ограничения играми двух лиц с нулевой суммой, о котором говорилось в конце п. 15.8.1).

§ 16. ЛИНЕЙНОСТЬ И ВЫПУКЛОСТЬ

16.1. Геометрические основания

16.1.1. Задача, с которой нам сейчас придется иметь дело, заключается в нахождении решений для всех игр двух лиц с нулевой суммой; нри этом мы встречаемся с трудностями, вытекающими из неполной определенности игры. Мы добьемся успеха, пользуясь теми же идеями, которым мы следовали в случае определенности: окажется, что эти идеи можно обобщить настолько, что будут охвачены все игры двух лиц с нулевой суммой. Для того чтобы это сделать, мы должны будем воспользоваться некоторыми возможностями теории вероятностей (см. пп. 17.1, 17.2). Кроме того, окажется необходимым также применение несколько необычного математического аппарата. Наш анализ в § 13 составляет одну его часть; для оставшегося удобнее всего будет возвращение к математико-геометрической теории линейности и выпуклости. Две теоремы о выпуклых телах будут иметь особенное значение 1).

По этим причинам мы перейдем к изучению - в той степени, в какой они нам понадобятся, - понятий линейности и выпуклости.

16.1.2. Подробный анализ понятия тг-мерного линейного (евклидова) пространства для нас не является необходимым. Достаточно будет сказать, что это пространство описывается п числовыми координатами. В соответствии с этим определим для каждого тг=1, 2, . . ., п-мерное линейное пространство Ln как множество тг-наборов вещественных чисел. Эти тг-наборы можно рассматривать также как функции xt переменной i с областью определения (1, . . ., п) в смысле пп. 13.1.2, 13.1.3 2). Мы, как это принято делать, будем называть i индексом, а не переменной; однако это не влияет на существо дела. В частности, мы имеем

хп} = {у1, уп}

в том и только в том случае, когда xt = yt для всех i = 1, . . ., п (см. конец п. 13.1.3). Ln можно рассматривать также как простейшее возможное пространство числовых функций, заданных на фиксированном конечном множестве (1, . . ., п) 3).

Эти 7г-наборы чисел, или функции из Ln, мы будем называть точками или векторами пространства Ьп и записывать как

(16:1) х = {хи . .., хп).

Значения xt для фиксированного i - 1, . . ., п (значения функции хг)

называются компонентами вектора х.

х) См. Т. Bonessen, W. Fenchel, Theorie der konvexen Korper, in Ergeb-nissen der Mathematik und ihrer Grenzgebiete , vol. III/l, Berlin, 1934; дальнейшие исследования в H. W е у 1, Elementare Theorie der konvexen Polyeder, Commentarii Mathematici Helvetici, vol. VII, 1935, pp. 290-306 (русск. пер. в сб. Матричные игры , физматгиз, 1961, стр. 254-273).

2) тг-наборы {х±1 . . ., хп} являются не просто множествами в смысле п. 8.2.1. Нумерация х посредством индекса i = 1, . . ., п является столь же существенной, как и объединение их значений. См. сходную ситуацию в сноске 1 на стр. 95.

3) Многое в современном анализе подтверждает эту точку зрения.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 [ 43 ] 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227