5.4. Связь матричных игр с линейным программированием

 Пусть имеется игра без седловой точки с матрицей (аij) (табл. 5.12). Допустим, что все выигрыши аij положительны (этого всегда можно добиться, прибавляя ко всем членам матрицы достаточно большое число М; от этого цена игры увеличится на М, а решение , v не изменится). Если все аij положительны, то, конечно, и цена игры (средний выигрыш при оптимальной стратегии) тоже положительна: v > 0.

Мы хотим найти решение игры, т.е. две оптимальные смешанные стратегии:

= (р1,  р2, …, рm);  = (q1, q2, …, qn) ,

дающие каждой стороне максимально возможный для нее средний выигрыш (минимальный проигрыш).

Таблица 5.12 Заданная матрица игры

В1

В2

Вn

А1

a11

a12

¼

a1n

А2

a21

a22

¼

a2n

Аm

аm1

аm2

аmn

Найдем сначала . Мы знаем, что если один из игроков (в данном случае это А) применяет свою оптимальную стратегию, то другой (В) не может улучшить свое положение, отступая от своей оптимальной стратегии. Заставим противника (В) отступать от своей оптимальной стратегии, пользуясь чистыми стратегиями B1, B2,…, Вп (а мы тем временем упорно держимся стратегии ). В любом случае наш выигрыш будет не меньше, чем v:

                       (5.1)

Разделим неравенства (5.1) на положительную величину v и введем обозначения:

               (5.2)

Тогда условия (5.1) примут вид:

                      (5.3)

где х1, х2, …, хт – неотрицательные переменные.

Согласно выражению (5.2) и того, что

p1 + р2 + …+ pm = 1,

переменные х1, х2, …, хт удовлетворяют условию:

х1 + х2 + …+ хт = 1/v.                        (5.4)

Но v есть не что иное, как наш гарантированный выигрыш; естественно, мы хотим сделать его максимальным, а значит, величину 1/v минимальной.

Таким образом, задача решения игры свелась к математической задаче: найти неотрицательные значения переменных х1, х2, …, хт такие, чтобы они удовлетворяли линейным ограничениям-неравенствам (5.3) и обращали в минимум линейную функцию этих переменных:

х1 + х2+ …+ хт => min.                     (5.5)

Таким образом, задача решения игры свелась к задаче линейного программирования с п ограничениями-неравенствами и т переменными. Зная х1, х2, …, хт, можно найти цену игры v, а по формулам (5.2) найти p1, р2, …, pm и, значит, оптимальную стратегию .

Оптимальная стратегия игрока В находится аналогично, с той разницей, что В стремится минимизировать, а не максимизировать выигрыш, а значит, обратить не в минимум, а в максимум величину 1/v, а в ограничениях-неравенствах вместо знаков ³ будут стоять знаки £. Пара задач линейного программирования, по которой находятся оптимальные стратегии (), является парой двойственных задач линейного программирования.

Таким образом, решение игры  эквивалентно решению пары задач линейного программирования. Нужно заметить, что и, наоборот,  для любой пары двойственных задач линейного программирования может быть построена эквивалентная ей матричная игра (на том, как это делается, мы останавливаться не будем).