Промышленный лизинг Промышленный лизинг  Методички 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 [ 16 ] 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90

ном повторении игры обоим игрокам следует менять свои стратегии. Тогда возникает вопрос: а каким образом их менять, чтобы в среднем выигрыш одного и проигрыш другого был аналогично одноходовой игре, ограничиваясь снизу и сверху соответственно?

Для ответа на этот вопрос введем вероятность (относительную частоту) Xt применения игроком А г-й стратегии, и У) - вероятность применения у-й стратегии игроком В. Совокупности этих вероятностей определяют векторы Х = {х\, хг,хт), где

=1и Y={yu% ...> }, где y/=L

1=1 7=1

Эти векторы или наборы вероятностей выбора чистых стратегий называются смешанными стратегиями игроков.

В частности, решение игры с седловой точкой дается векторами х и у, среди компонент которых xio = 1, х, = 0 (i Ф i0) nyjo=l,

У/= ° 0*;<>)-

Для получения ограничений на средний выигрыш или проигрыш рассмотрим математическое ожидание выигрыша первого игрока

п т

M№y) = £X°Wr (2.6.4)

7=1 <=1

Если второй игрок В выбрал некоторую смешанную стратегию F, то первому игроку, естественно, считать лучшей ту смешанную стратегию X, при которой достигается max М(Х; Г):

М(Х;У) = тахМ(Х;У)

Аналогично, при выборе первым игроком некоторой стратегии X второму игроку следует выбирать стратегию У такую, что

М(А ;У) = min М(А ;У)

Ясно, что X зависит от У и У зависит от X. Перед каждым игроком, таким образом, возникает задача выбора оптимальной стратегии, под которой для игрока А понимается смешанная стратегия X, которая максимизирует математическое ожидание его выигрыша, для игрока В - стратегия У*, минимизирующая математическое ожидание его проигрыша.

Основная теорема теории игр (доказана фон Нейманом в 1928 году) утверждает:

каждая матричная игра с нулевой суммой имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий, то есть существуют стратегии X* и У*, оптимальные для обоих игроков, причем

max min М (X; У) = min max М (X; У) = М (X *; У *).

Число V= M(X*;Y*) называют ценой игры.

Примечание. Нулевая сумма означает, что выигрыш одного игрока равен проигрышу другого.

Из основной теоремы следует, что каждая конечная игра имеет цену и она лежит между нижней и верхней ценами игры

a<V</3 (2.6.5)

И если один из игроков придерживается своей оптимальной стратегии, то выигрыш (проигрыш) его остается неизменным независимо от тактики другого игрока, если, конечно, последний не выходит за пределы своих полезных стратегий, иначе выигрыш (проигрыш) возрастает.

Это означает выполнение неравенств

ССдХ* >V(j =1,П),

£ay.y*<V(;==l,m). (2.6.6)

Примечание. Эти неравенства будут необходимы при сведении матричной игры к задаче линейного программирования.

2.6.2. Сведение матричной игры к задаче линейного программирования

При наличии неопределенности, причиной которой является присутствие нескольких принципов оптимальности G = {G,}, i = l,w, удобно воспользоваться двойственной задачей линейного программирования.

Будем считать, что принципу G, соответствует определенный критерий оптимальности Kt. В качестве К(, могут выступать: экономические, технические, социальные и иные критерии оптималь-



ности. Показатели К;, являются функцией управляемых факторов

X = {Xj} / = 1, т и неуправляемых факторов Y = {У;} i = 1, т.

Итак, набору принципов G\(X, Y), G2{X, Y), Gm{X, Y) соответствует набор критериев оптимальности К\(Х, Y), K2(X,Y),

Km{X, Y). Располагая множеством критериев К - {К(Х, К),}, i = 1, т, необходимо определить вектор управляемых переменных Х- (Х\, Хг, Хт), принадлежащий допустимой области решений X, который обеспечивает оптимальное (в определенном смысле) решение по каждому из частных критериев.

Рассмотрим матрицу игры (2.2.1). Соотношениям отыскания нижней а и верхней /3 цены игры можно поставить в соответствие эквивалентные им задачи:

max {а: М(Х; Y)>a}, (2.6.7)

min {/3: M(X;Y)<p}, (2.6.8)

т т

где М(Х; Y) = ]Г £ щ*, ] (2-6.9)

j=i 1=1

есть математическое ожидание выигрыша первого игрока. Тогда для любой чистой стратегии Y(J) игрока П

Щ = Oi = 0, у2 = 0, Уи, = 0, у] = 1, Ум = 0, ут = 0)

можно записать

M(X;YU)) = x (2.6.10)

а для любой чистой стратегии X(i) игрока Р

X(f) = (xi = 0, хг = 0, хм = 0, х,- = 1, Xi+\ - 0, хт = 0) мджно записать

M(xb);Y) = 2evyj- (2.6.11)

Следовательно, задачи (2.6.7) - (2.6.11) допускают следующую запись в форме задач линейного программирования:

max{a:M(X;Y(j)) = ieijxl >a,j = l,m; xt >0, i = l,m; =1}, 1=1 1=1

(2.6.12)

[тп{Р:М(Х(1);У) = 2еуу/<Р, i = l,m; y,>0, j = l,m; £y;=l}.

;=i y=i

(2.6.13)

Нетрудно видеть, что задачи (2.6.12) и (2.6.13) взаимнодвой-ственные, а поэтому их оптимальные значения должны совпадать, т.е. aonm ~ /Зет = V, где V - цена игры (требуемое значение эффективности).

Для задачи (2.6.12) положим:

Г,=ИГ = 1, (2.6.14)

а для задачи (2.6.13) положим:

uj=y z=V- (2615)

Тогда отыскание оптимальной смешанной стратегии Апт игрока Р приводит к необходимости решения следующей задачи линейного программирования:

минимизировать линейную функцию

T=h + h+ ... + tm (2.6.16)

при условиях

eij U L J = ! и; 11 0, i = 1, т, (2.6.17)

а отыскание оптимальной смешанной стратегии К0пт игрока П приводит к необходимости решения следующей задачи линейного программирования:

максимизировать линейную функцию

Z = щ + и2 + ... + ип (2.6.18)

при условиях

eyUj <1, i = l,m; и, >0, /=1,п. (2.6.19)

Исходя из основной теоремы теории двойственности, задачи (2.6.16) -г- (2.6.19) имеют конечное решение и Tm[n = Zmax.



2.6.3. Выбор оптимального ассортимента продукции

Применяя изложенный математический аппарат двойственной задачи линейного программирования, рассмотрим пример выбора оптимального ассортимента и объема продукции швейного предприятия. Эта социальная задача сферы сервиса связана с удовлетворением потребностей населения в бытовых услугах и направлена на улучшение основных производственных показателей эффекта бытового обслуживания, заключающегося в снижении стоимости товаров, экономии свободного времени и улучшении качества обслуживания.

Рассмотрим работу швейного предприятия, выпускающего детские костюмы, платья и плащи, сбыт которых зависит от состояния погоды, при этом реализация продукции происходит через фирменные магазины.

По данным наблюдений за предшествующие одиннадцать лет предприятие в течении апреля - мая в условиях теплой погоды может реализовать 600 костюмов, 2000 платьев и 300 плащей, в условиях прохладной погоды -1000 костюмов, 500 платьев и 800 плащей и в условиях обычной погоды - 800 костюмов, 1100 платьев и 600 плащей. Затраты на единицу продукции в течение указанных месяцев составили для костюмов 30 ден. ед., для платьев 10 ден. ед. и для плащей 15 ден. ед., а цена реализации равна соответственно 50 ден. ед., 20 ден. ед. и 28 ден. ед.

Задача заключается в максимизации средней величины прибыли от реализации выпущенной продукции с учетом неопределенности погоды в рассматриваемые месяцы.

Подобная задача рассматривается как игра с природой. Ее отличительная особенность состоит в том, что в ней сознательно действует только один из участников (предприятие), называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные ходы партнер по игре.

Первоочередной задачей является построение платежной матрицы.

Предприятие располагает тремя чистыми стратегиями: стратегия Pi с расчетом на теплую погоду, стратегия Рг с расчетом па прохладную погоду и стратегия Р3 с расчетом на обычную погоду.

Природа, рассматриваемая как второй игрок, также распола-

гает тремя стратегиями: обычная погода (стратегия ПО, прохладная погода (стратегия Пг) и теплая погода (стратегия Пз).

Если предприятие выберет стратегию Pi, то в случае обычной погоды (стратегия природы ПО доход составит:

(50 - 30) 600 + (20 - 10)1100 + (28 - 15)300 - (20 - 10)(2000 - 1000)=

= 17900 ден. ед.,

в случае прохладной погоды (стратегия природы Пг) доход будет равен

20 600 + 10 500 + 13 300 - 10(2000 - 500) = 5900 ден. ед.,

и в случае теплой погоды (стратегия природы Пз) имеем доход, равный

20 600 + 10 2000 + 13 300 = 35900 ден. ед.

Если предприятие выберет стратегию Р2, то реализация продукции в условиях обычной погоды дает доход:

20 800 + 10 500 + 13 600 - 20(1000 - 800) - 13(800 - 600) = = 22000 ден. ед.,

в условиях прохладной погоды доход будет:

20 1000 + 10 500 + 13 800 = 35400 ден. ед.,

а в условиях теплой погоды имеем доход:

20 600 + 10 500 + 13 300 - 20(1000 - 600) - 13(800 - 300) =

= 6400 ден. ед.

Если предприятие выберет стратегию Рз, то в случае обычной погоды доход будет равен:

20 800 + 10 1100 + 13 600 = 34800 ден. ед.,

при прохладной погоде имеем доход, равный:

2р - 800 + 10 500 + 13 600 - 10(1100 - 500) = 22800 ден. ед.,

и в случае теплой погоды доход составит:

20 -600+ 10-1100 + 13 300 - 20(800 - 600) - 13(600 - 300) = = 16000 ден. ед.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 [ 16 ] 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90