Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 [ 222 ] 223 224 225 226 227

(Больше того, в относящейся к 1950 г. книге Вальда Статистические решающие функции теоретико-игровая сторона вопроса была представлена играми в нормальной форме, несмотря на всю позиционность проблемы по существу.)

Заметим сразу же, что эти вопросы после выхода в свет монографии фон Неймана и Моргенштерна находились в совершенно различных состояниях. Кооперативная теория была разработана весьма глубоко: ее результаты касались узловых вопросов теории, а некоторые частные случаи были разобраны с исчерпывающей подробностью. Теория же позиционных игр ограничивалась громоздкой системой определений да теоремой об играх с полной информацией (известной к тому же в своих основных чертах со времен работы Цермело [1] о шахматах).

2. Тем больший интерес представляет работа Куна [1]. Прежде всего, в ней было сформулировано естественное и прозрачное определение позиционной игры, в том числе четко определены стратегии игроков как функции на множествах их информационных состояний (а содержательно - на семействах множеств позиций, неразличимых для игрока в соответствующий момент; эти множества позиций называются информационными множествами). Кроме того, в этой работе было выяснено внутреннее строение той неопределенности, с которой приходится иметь дело игроку в позиционной игре. В качестве такого атома неопределенности Кун выбирает факт перекрывания одним информационным множеством другого. Содержательно перекрывание информационным множеством V информационного множества U означает, что находящийся в множестве U игрок не знает одновременно, находилась ли ранее игра в множестве U и какое решение было в U принято (очевидно, тем из игроков, чья очередь хода была в U). Очевидно, в играх с полной информацией, в которых каждое информационное множество состоит из единственной позиции, никакие информационные множества друг друга не перекрывают.

3. Чем больше перекрываний имеется среди информационных множеств в игре, тем большим оказывается, вообще говоря, необходимое смешивание в оптимальных (или, если речь идет об общих бескоалиционных играх, в равновесных) стратегиях. Так, если игрок имеет полную память, т. е. если его собственные информационные множества не перекрывают друг друга, то игрок может ограничиться стратегиями поведения, т. е. такими смешанными стратегиями, в которых его действия смешиваются в различных информационных множествах независимо. Дальнейшее развитие этих идей содержится в статьях Томпсона [1] и Н. Н. Воробьева [2, 6].

В каждой позиционной игре существенную роль играет множество позиций с указанием возможных переходов от одних позиций к другим, т. е. некоторый объект, изучаемый теорией графов. Систематическое рассмотрение комбинаторного аспекта в позиционных играх заставляет применять терминологию и методы теории графов. Весьма большое число результатов теории игр было изложено с этих позиций Бержем в его книге [1].

Расщепление информационного множества на более мелкие информационные множества содержательно означает увеличение информации, которой располагают игроки, а формально - расширение множества их стратегий. В частности, при полном расщеплении информационных множеств до однопозиционных в полученном расширенном множестве стратегий будут содержаться оптимальные (соответственно равновесные) стратегии. Ясно, что полное расщепление для существования чистых



оптимальных стратегий является достаточным, но не необходимым. Необходимые условия такого расщепления были указаны Берчем [1].

В идущей от статьи Куна [1] теории позиционных игр принимается, что информационные множества не должны предшествовать сами себе , т. е. что игрок не должен на протяжении одной партии принимать дважды решение в одном и том же информационном состоянии. Это ограничение представляется не вполне естественным и потому несколько стеснительным. Исбелл [1] положил начало теории финитарных игр, которые этим условием не ограничены.

4. На первый взгляд теорема о существовании ситуаций равновесия в чистых стратегиях для игр с полной информацией представляется весьма общим фактом, поддающимся широким обобщениям. Однако Гейл и Стюарт [1] привели пример позиционной игры (разумеется, бесконечной) с полной информацией, в которой игроки не имели чистых оптимальных стратегий. Этот пример показал, что теория бесконечных позиционных игр с полной информацией является весьма сложной. Дальнейшие результаты в этом направлении принадлежат Вульфу [1], Окстоби [1], Ханани [1], Э. Д. Стоц-кому [1], Дэвису [1], Мыцельскому [1] и др.

Вместе с тем весьма прямолинейное использование аксиомы выбора при построении этого примера давало основания предполагать, что он принадлежит к числу парадоксов, порождаемых применением этой аксиомы. Последовательным развитием такой точки зрения занялись Штейнгауз и Мыцельский [1]. Они приняли полную определенность антагонистической игры с полной информацией за самостоятельную аксиому теории множеств (в ее абстрактной формулировке, очевидно, можно обойтись без теоретико-игровой терминологии), назвав ее аксиомой определенности. Интуитивный смысл этой аксиомы состоит в том, что для абсолютно осведомленных в правилах и тонкостях игры участников исход партии предопределен. Такая игра должна по существу быть чисто комбинаторной. Ясно, что аксиома определенности противоречит примеру Гейла - Стюарта. В действительности она противоречит примененной при построении этого примера аксиоме выбора. Однако в известной мере аксиома определенности способна также и заменять аксиому выбора. Мыцельский показал [2], что большое число следствий аксиомы выбора удается доказать на основе аксиомы определенности и без использования аксиомы выбора. В частности, в его работе, написанной совместно со Сверчков-ским [1], из аксиомы определенности выводится измеримость по Лебегу любого линейного множества. Дальнейшее изучение игр с полной информацией в этом направлении было проведено Мыцельским в статье [1].

5. В позиционных играх выигрыши выплачиваются игрокам лишь в окончательных позициях партии. Поэтому, говоря формально, сравнивать между собой игроки могут только окончательные позиции. Однако (если говорить для определенности об антагонистических играх) пребывание игрока в любой позиции уже предопределяет некоторый его выигрыш, которым можно измерять ценность самой позиции. Таким образом, пере-* ход игры из позиции в позицию может означать для игроков приобретение некоторых временных преимуществ, которые вполне могут быть утрачены при дальнейшей неоптимальной игре. В связи со сказанным целесообразно рассматривать такие игры, в которых непосредственная борьба ведется за те или иные позиции игры, которые оказываются своеобразными ресурсами игроков в ходе их дальнейшей борьбы. Применительно шахматам такой подход детально развивает М. М. Ботвинник [1].



В литературе рассматривалось довольно много игр такого рода. Одной из наиболее общих представляется схема рекурсивной игры, введенная Эвереттом [1].

Партия рекурсивной игры состоит из последовательности элементарных (например, матричных) игр, причем исходом каждой элементарной игры является снова элементарная игра либо окончание всей игры, сопро- * вождающееся расплатой. Говоря точнее, если в какой-то момент игралась элементарная игра Г\ причем игроки выбрали стратегии i, /, то с некоторыми определенными вероятностями (зависящими от выбранных стратегий) в следующий момент будет играться некоторая элементарная игра Т1 из того же набора или же вся партия закончится. Оказывается, если элементарные игры имеют значения, то и рекурсивные игры имеют значения в стационарных стратегиях и тем самым е-оптимальные стационарные стратегии при любом г > 0.

6, Близкими к рекурсивным играм являются игры на выживание, исследованные Милнором и Шепли [1]. В таких играх в каждый момент времени игроки обладают соответственно ресурсами riiR - r (0 <<**<#) и играют в матричную игру аи \\. Выигрыши в этой игре присоединяются к ресурсам игроков, с которыми они вступают в игру в следующий момент. Игра заканчивается при исчерпании всех ресурсов одного из игроков, причем победитель получает единицу (размерность которой, вообще говоря, никак не связана с размерностью ресурсов).

Если такая игра имеет значение, то оно является функцией начального количества ресурсов г0 у игрока 1, которая есть монотонное решение функционального уравнения ср (г) = val Ф (г + atj) при граничных условиях ф (г) = 0 для г 0 и ф (г) = 1 для г R.

Обобщение этой игры получается при переходе от матричных игр к произвольным бескоалиционным играм или, что, по существу, близко, к векторным ресурсам. Такого рода игры рассматривал И. В. Романовский [1].

Сходными с играми на выживание являются игры на истощение, о которых см. статью Исбелла и Марлоу [1].

7. Новые трудности принципиального характера возникают при переходе к изучению динамических игр, в которых принятие решений игроками происходит не в дискретные моменты времени, а является непрерывным во времени процессом. Основным изучавшимся классом таких игр являются дифференциальные игры.

Дифференциальная игра схематически может быть описана следующим образом. Пусть заданы связное ограниченное подмножество А конечномерного евклидова пространства, начальная точка х° и система дифференциальных уравнений

- = fj(x{, . . ., хп\ t, ф, г)), / = 1, .. ., п. (5)

Здесь переменные Xj называются переменными состояния (или фазовыми координатами), а ф и г) - управляющими переменными (соответственно для первого и второго игрока), которые выбираются игроками из некоторого заранее заданного множества функций, зависящих от временного параметра t и от переменных состояния. Если выбор функций ф и г) приводит к разрешимости системы дифференциальных уравнений, то партия игры реализуется в виде некоторой траектории в множестве А. На множестве всех траекторий определяется функция выигрыша. Обычно считается, что игра заканчивается с выходом траектории на границу А,



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 [ 222 ] 223 224 225 226 227