Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 [ 64 ] 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227

Теперь интуитивно ясно, что ожидаемое значение К (I, ц) зависит только от этих вероятностей pf1, of и не зависит от отдельных вероятностей

Замечание. Это означает, что две различные смешанные (чистые) стратегии могут с точки зрения фактического эффекта быть одинаковыми.

Для иллюстрации этого рассмотрим простой пример. Пусть S - 2, т. е. имеются только высокий и низкий расклады. Рассмотрим i = 2, 3 как один случай, т. е. пусть имеется только высокая и низкая ставки. Тогда будут существовать четыре возможные (чистые) стратегии, которым мы дадим специальные имена.

Отважная : при каждом раскладе высокая ставка.

Осторожная : при каждом раскладе низкая ставка.

Нормальная : высокая ставка при высоком раскладе и низкая при низком.

Блеф : высокая ставка при низком раскладе и низкая при высоком.

Тогда (50-50)-смесь отважной и осторожной стратегий эквивалентна (50-50)-

смеси нормальной стратегии и блефа, поскольку в каждом из этих случаев игрок будет,

в соответствии с исходом случайного испытания, назначать 50-50 высокую или низкую

ставку при любом раскладе.

Тем не менее в принятых нами обозначениях эти смешанные стратегии оказыва-

->

ются различными, т. е. они оказываются различными векторами £.

Это означает, конечно, что наши обозначения, будучи полностью подходящими в общем случае, оказываются для многих конкретных игр избыточными. Это частое явление при математических рассмотрениях, преследующих общие цели. Пока мы разрабатывали общую теорию, у нас не было причин принимать во внимание эту избыточность. Но сейчас, при рассмотрении конкретной игры, мы от нее избавимся.

Легко видеть, как непосредственно интерпретируется формула (19:3). Дляэтого достаточно вспомнить смысл функции Xsign (si-s2) (& 1) и интерпретацию величин pf1, of.

19.5.3. Понятно, что как по своему смыслу, так и в силу формальных определений (19:1), (19:2) числа pf1, of удовлетворяют условиям

(19:4) все р?0, Spfl,

все ofO, 5Х2 = 1-

С другой стороны, любые pf1, of, удовлетворяющие этим условиям*

можно получить из соответствующих £, г] по формулам (19:1), (19:2). Это понятно как математически х), так и интуитивно. Любая система таких чисел pf1, of является набором вероятностей, определяющих возможный способ поведения. Поэтому они должны соответствовать некоторой смешанной стратегии.

Соотношения (19:4) и (19:5) дают возможность составлять трехмерные векторы

Тогда условия (19:4), (19:5) утверждают, что все pSl, принадлежат S3.

Это показывает, каких больших упрощений мы добились благодаря

-у ->-

введению этих векторов. Именно вектор (или т]) принадлежал S$,

*) Положим, например, £ib f ig = р1. . . pfg, т];ь . . is == ah а% и проверим, что (17:1:а) и (17:1:Ь) из п. 17.2.1 являются следствием условий (19:4) (19:5).

(19:5)



т. е. зависел от р - 1 = 3s - 1 числовых параметров; psi (или о82) составляют множество, состоящее из S векторов в 53, т. е. каждый из них зависит от двух числовых констант. Число 3 - 1 много больше числа 2S даже при умеренных *) S.

19.6. Формулировка задачи

19.6. Поскольку мы имеем дело с симметричной игрой, мы можем

использовать характеристику оптимальных (смешанных) стратегий,

-> -

т. е. характеристику £ £ А, указанную в (17:Н) из п. 17.11.2. Она состоит

в следующем: стратегия £ должна быть оптимальной против самой себя, т. е. предполагается, что min К (g, ц) должен достигаться при ц =

~> ->

Далее, в п. 19.5 мы видели, что функция К (g, rj) фактически зависит -> -> ->- >->->

OTpS1, aS2. Поэтому можно переписатьее в виде К (р1, . . ., psj а1, . . . , os).-Тогда формула (19:3) из п. 19.5.2 утверждает (мы несколько изменили порядок суммирования), что

(19:6) К (р\ ..., ps а\ ..., 0s) ==-L 2 2 2Wn(Sl-82) (i, j) p!xaf,

si, г S2, j

и p1, ..., ps для оптимальной стратегии характеризуется тем, что

-> -* -> -> min К (р1, ..., ps a1, ..., os)

ai, a s

достигается при a1 = p1, . . ., as = ps. Можно найти и явные условия для этого, используя, по существу, тот же метод, который был применен

к аналогичной задаче в п. 17.9.1; мы сжато изложим его.

-> ->

Минимум по (а1, . . ., as) функции (19:6) равен минимуму, взятому

-> ->

отдельно по каждой из переменных а1, . . ., as. Рассмотрим поэтому

->

некоторую переменную oS2. Единственное ограничение, которому она удовлетворяет, состоит в принадлежности ее к £3, т. е.

все afO, 2о52=1. j=i

Функция (19:6) линейна по этим трем компонентам а®2, а2, в**. Следовательно, минимум по aS2 будет находиться там, где обратятся в нуль все те компоненты af, коэффициенты которых (по /, см. ниже) не достигают наименьшего возможного значения.

Обозначая через -- yf коэффициент при of, равный

~С2 2 <sign(s1-s2) {U /) рЛ

мы из (19:6) получаем

8i, г

(19:7) К (р1, ..., ps о1.....с*) = -±- 2 Yfor;

S2. J

*) В действительности £ равно приблизительно 2,5-10е (см. сноску 4 на стр. 209); поэтому оба числа 3s - 1 и 2S большие, но первое из них несравненно больше.



Тогда условием минимума (по о82) будет:

(19:8) Для каждой пары s2, j, для которой у)2 не достигает минимума

(по / *)), должно быть of = 0. Следовательно, характеристика оптимальной стратегии - минимиза-ция при о1 = р1, . . gs = ps - состоит в следующем:

-У -У -у -

(19:А) р1, . . ., ps описывают оптимальную стратегию, т. е. £

в том и только том случае, если для каждой пары s2, 1, Для которой yf не достигает минимума (по / х)), имеем of = 0. На основе матричных схем табл. 15-17 выпишем, наконец, явные

выражения для yf:

S2 - 1

<19:9:а) Ysi2 = 4 { 2 (~flP?~а№~Ь№)~Ъ№ +

i=i

+ 2 faPF + ep!1-6??)}.

Sl=s2 + 1

S2-1

<19:9:b) yf = -i- { S (~ P?1-&PI1 - &P11) +

Si=l

+ S (ЙР!1 + &Р1+6Р1)} Si=S2+l 82-1

< 19:9:c) yf = 4 { 2 (&P?X~ 6P?- bP?) + &P?2 +

si=l S

+ 2 (&PSl1 + &Pi1 + &PS31)}.

si=s2+l

19.7. Переход от дискретной задачи к непрерывной

19.7.1. Критерий (19:А) из п. 19.6 вместе с формулами (19:7), (19:9:а), (19:9:Ь) и (19:9:с) можно использовать для нахождения всех оптимальных стратегий 2). Эти рассуждения носят несколько утомительный комбинаторный характер и содержат анализ ряда возможностей. Получающиеся при этом результаты качественно сходны с результатами, получаемыми далее при несколько измененных предположениях. Различие между ними касается лишь некоторых деликатных вопросов, которые можно назвать тонкой структурой стратегии. Более подробно мы остановимся на этом в п. 19.12.

Нас сейчас интересуют главным образом основные характеристики решения, а не эти вопросы тонкой структуры . Сначала обратим внимание на дискретную структуру последовательности возможных раскладов.

х) Имеется в виду минимум по /, а не по s2, /!

2) Это нахождение было уже проделано одним из нас и будет опубликовано в другом месте.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 [ 64 ] 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227