Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 [ 53 ] 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227

Используя дополнительно (13:D*) из п. 13.5.2, а также предшествую* щее (17:В:а) замечание о множествах А ж В, мы получаем:

-> -

(17:G:f) Оба игрока 1 и 2 игрют оптимально в игру Г, т. е. £ £А, -у - -> -*

а г\ £ В в том и только в том случае, когда £, ц является седловой

точкой функции К (£, Г]). Все это делает вполне понятным, что v можно в действительности интерпретировать как значение партии игры Г (для 1) и что А и В содержат оптимальные способы игры соответственно для игроков 1 и 2. Во всех рассуждениях (17:G:a) - (17:G:f) нет ничего эвристического или неопределенного. Мы не делали никаких специальных предположений о способностях игроков, о том, кто чью стратегию обнаружил и т. п. Точно так же наши результаты не основываются и на вере в рациональное поведение противника; важность этого момента мы неоднократно подчеркивали. (См. конец п. 14.1.2, а также п. 15.8.3.)

17.9. Дальнейшие свойства оптимальных стратегий

17.9.1. Результаты (17:С:с) и (17:C:f) в п. 17.8.2 дают также простую и явную характеризацию элементов нашего решения, т. е. число v и множества векторов А ж В.

Согласно (17:С:с) А и В определяют v; следовательно, достаточно только изучить ~А, В, что мы и сделаем, опираясь на утверждение (17:C:f).

На основании этого критерия % £А и г\ £В тогда и только тогда, -у -> -у -у

когда пара £, г\ является седловой точкой функции К (g, rj). Это означает, что

тахК(1\ т)), V

min К (£, т)).

Мы получили это в явном виде, использовав выражение (17:2) из п. 17.4.1 и п. 17.6 для К (, п), а также выражения в лемме (17:А) из п. 17.5.2 для

-У -У -У -у

max К (£\т]) и min К (£, т)). Теперь наши уравнения приобретают такой

вид:

С 02

max 2 & К> Ъ) Пег*

vi vi i Ti T2=1

2j . 2j . fa> t2) ItiTlta = 1 32

min 2 fa, r2) gtl.

Ti=l T2=l

01 32

Замечая, что 2 Sti - 2 т)т2=1> мы можем также написать

n=l т2=1

01 02 02

2 (max ) 2 Ж fa, т2) %2( - 2 W (т4, т2) %2) gTl = О,

Ti=l Т2=1 Т2=1

02 01 01

2 (-min) 2 ЗР(т1,та)&Г1(+ 2 (TbgjnO. т2=1 т: ti=1 xi=l



Слева в этих уравнениях коэффициенты при gtl и rjt2 все О1). Кроме того, все gtl, rjt2 и сами 0. Следовательно, эти равенства имеют место только в том случае, если все слагаемые слева обращаются в нуль. Иными словами, для всех ti = 1, . . ., Pi, для которых коэффициент при £Г1 не равен нулю, должно быть £tl =0; точно так же для всех т2 = 1, . . . 32, для которых коэффициент при г]Т2 не равен нулю, должно бытьг]Г2=0. Резюмируем:

(17:D) 6 А и ц 6 В в том и только в том случае, когда имеет место следующее:

Для всех ti = 1, . . ., Pi, для которых 2 (tu X2J Цх2

Т2=1

не принимает своего максимального значения (по т4), мы имеем Ътг = 0.

Для всех т2 = 1, . . ., р2, для которых 2 Ж (ть t2) In не принимает своего минимального значения (по т2), мы имеем

11X2 = 0.

Легко сформулировать эти принципы словесно. Они выражают следующее.

Если £ и г] - оптимальные смешанные стратегии, то не содержит

-> ->

стратегий т4, которые не оптимальны (для игрока 1) против т), а т) не содержит стратегий т2, которые не оптимальны (для игрока 2)

против Иными словами, т, как и следовало ожидать, оказываются оптимальными друг против друга.

17.9.2. Другое замечание, которое можно сделать в связи с этим, таково:

(17:Е) Игра вполне определена в частном в том и только в том случае, когда для каждого игрока существует оптимальная чистая стратегия.

С точки зрения наших предыдущих рассуждений, в особенности процесса обобщения, с помощью которого мы перешли от чистых стратегий к смешанным, это утверждение можно считать интуитивно убедительным. Однако мы приведем математическое доказательство, которое столь же просто. Оно состоит в следующем.

В последней части п. 17.5.2 мы видели, что как у4, так и v[ получаются

применением операции шах к min 2 3T(ti, т2) £Tl, но по различным

1 Т2 Tl=1

множествам изменения . Для v4 это будет множество всех 8Ti (т4 = = 1, . . ., Pi), а для у[ - множество S. Таким образом, максимизация производится по множеству чистых стратегий в первом случае и по множеству смешанных стратегий во втором. Следовательно, v4 = v, т. е. равенство двух максимумов возможно в том и только в том случае, когда максимум во втором множестве достигается (хотя бы однажды) в пределах первого множества. Это, согласно (17:D), означает, что множеству А должна принадлежать хотя бы одна чистая стратегия, т. е. хотя бы одна чистая стратегия должна быть оптимальной. Таким образом,

г) Проследите, как появились здесь max и min.



(17:F:a) v4 = v[ в том и только в том случае, когда для игрока 1 существует оптимальная чистая стратегия.

(17:F:b) v2 = v2 в том и только в том случае, когда для игрока 2 существует оптимальная чистая стратегия.

Теперь мы имеем = v2 = v, а полная определенность в частном означает Vi = v2 = v, откуда v4 = и v2 = v2. Таким образом, (17:F:a) и (17:F:b) дают вместе (17:Е).

17.10. Ошибки и их следствия. Перманентная оптимальность

17.10.1. Из предыдущих рассуждений мы выяснили, что представляет собой оптимальная смешанная стратегия. Скажем еще несколько слов о других смешанных стратегиях. Мы хотим выразить отличие этих стра-

тегий (т. е. векторов ц) от оптимальности и таким образом определить величину ошибки при использовании стратегий, не являющихся оптимальными. Однако мы не будем пытаться исчерпать этот вопрос, имеющий много интересных ответвлений.

Для всех £ £ дУрх и всех т) £ S$2 определим числовые функции (17:13:а) а () = v - min К (!, ij)

(17:13:Ь) (3 (ц) = max К (f, ц) - v.

Согласно лемме (17:А) из п. 17.5.2 это равносильно

(17:13:а*) a(g) = v-min 2 < fa, т2) £Tl,

Т2 *l=3l 32

(17:13:Ь*) р(т]) = тах 2 SJTfa, т2)т]т2-у.

Ti Т2=1

Определение

-> -> -> ->

v = max min К (£, n) = min max К (£, n) -> -> -> ->

£ л л £

гарантирует нам, что всегда

а(1)0, (З(л)О.

Теперь утверждения (17:В:а), (17:В:Ь) и (17:С:а), (17:С:Ь) из п. 17.8

->

дают нам, что стратегия g является оптимальной в том и только в том случае, когда а (£) = 0, a п является оптимальной в том и только в том случае, когда р (п) = 0.

Таким образом, а (£) и р (п) являются удобными числовыми опи-

-> ->

саниями для произвольных £ и л их расстояний от оптимальных стра-

-> ->

тегий. Явное словесное определение а (£), р (п) делает это еще более правдоподобным: формулы (17:13:а), (17:13:Ь) или (17:13:а*), (17:13:Ь*)



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 [ 53 ] 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227