Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 [ 45 ] 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92


Рис. 1а Рис. 16

принимая во внимание следующее немаловажное обстоятельство: для того чтобы взойти на новую вершину, необходимо спуститься с покоренной, и чем ниже точка спуска, тем больших усилий потребует подъем.

Поэтому разумно поступить, например, так: отметить на каждом из маршрутов самую нижнюю точку, затем выбрать тот из них, отмеченная точка которого окажется самой высокой (чем ниже опустишься, тем более трудным будет подъем) (рис. 16).

Другая группа туристов намерена преодолеть горный хребет. И здесь тоже существуют разные возможные маршруты. Их сложность также оценивается перепадом высот, и выбирается тот из маршрутов, самая верхняя точка которого оказывается самой нижней (рис. 2).


Рис. 2

Ясно, что оба оптимальных маршрута должны проходить через точку перевала, или, как ее еще называют, седловую точку.

Схема рассуждений туристов очень напоминает ту, которая была применена для разрешения игры с разноцветными кружками.

Поиска можно интерпретировать так: на каждом из маршрутов (см. рис. 16) делаются замеры высот над уровнем моря до тех пор, пока не будет найдена точка маршрута с наименьшей высотой, которая является



оценкой сложности этого маршрута. Затем среди этих чисел выбирается наибольшее (самый легкий маршрут).

Поиск/? можно проинтерпретировать по схожей схеме (см. рис. 2).

Матричные игры с седловой точкой важны и интересны, однако более типичным является случай, когда применение описанного выше алгоритма приводит к неравенству

а<р.

В частности, матрица описанной выше игры чет-нечет седловой точки не имеет (в ней а = -1, /? = 1).

Как показывает следующий пример, в случае а < /5 предложенный выбор стратегий к равновесной ситуации, вообще говоря, не приводит, и при многократном повторении игры у игроков вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанной выше последовательности действий (по поиску максиминной и минимаксной стратегий).

Пример 3. Рассмотрим 3 х 3-игру, заданную матрицей

4 -1

-2 13.

,0 2 -3,

Применив предложенный алгоритм

находим нижнее значение игры а = -2 и соответствующую ему стратегию А2, и верхнее значение игры (5 = 2 и соответствующую ему стратегию В2.

Нетрудно убедиться в том, что пока игроки придерживаются этих стратегий, средний выигрыш при многократном повторении игры будет равен 1. Он больше нижнего значения игры, но меньше верхнего значения.

Однако если игроку В станет известно, что игрок А придерживается стратегии Аъ он немедленно ответит на это стратегией В\ и сведет выигрыш игрока А к проигрышу -2. В свою очередь, на стратегию Вх у игрока А имеется ответная стратегия Аи дающая ему выигрыш 4.

Тем самым, ситуация {Аъ ВД равновесной не является.



5.1.2. Смешанные стратегии

Итак, в случае, когда нижнее а и верхнее /? значения игры не совпадают,

а<Р,

игрок Л может обеспечить себе выигрыш, не меньший а, а игрок В имеет возможность не проиграть ему больше, чем р.

Возникает естественный вопрос - как поступить с разностью Р - а, как разделить ее между игроками?

Предыдущие построения на этот вопрос ответа не дают - тесны рамки возможных действий игроков. И поэтому ясно, что механизм, обеспечивающий получение каждым из игроков как можно большей доли этой разности, следует искать в определенном расширении стратегических возможностей, имеющихся у игроков изначально.

Для поиска компромиссного распределения разности Р - а между игроками будем считать, что игра повторяется многократно. Заметим, что хотя при этом правила игры не меняются (как и раньше, они описываются матрицей А), игроки в ходе повторяющихся разыгрываний могут выбирать свои стратегии произвольным образом. Если, к примеру, игроки будут выбирать свои первоначальные, чистые, стратегии случайным образом, то это обеспечит наибольшую скрытность выбора каждым игроком своей линии поведения (результат зыбора не может стать известным противнику, поскольку он до последнего момента неизвестен самому игроку).

В результате описанных действий мы переходим к смешанному рас-ширению игры.

Случайная величина, значениями которой являются стратегии игрока, называется его смешанной стратегией.

Тем самым, задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его чистые стратегии.

Рассмотрим произвольную т х л-игру, заданную т х л-матрицей

A=(aik).

Так как игрок А имеет т чистых стратегий, то его смешанная стратегия может быть описана набором т неотрицательных чисел

сумма которых равна 1,



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 [ 45 ] 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92