Podstawy teorii gier

1. Podstawowe pojęcia teorii gier

Teoria gier

to jest rozdział badań operacyjnych, który zajmuje się opracowaniem

metod podejmowania decyzji w warunkach sytuacji konfliktowych i warunkach
niepewności.

Zbiór reguł definiujących jednoznacznie kolejność działalności jednej ze stron

(jednego z graczy) w sytuacji konfliktowej nazywa się

strategią

„

Grą

” nazywa się zbiór omówionych wcześniej graczami reguł i warunków.

Jeśli n gracze G

, G

, ... , G

, przejmują udział w grze, wtedy podstawowe zadanie

teorii gier brzmi: jak powinien postępować gracz z numerem j (j=1, 2, ... , n)
dla osiągnięcia swojego celu – maksymalizacji wygranej?

Przepuśćmy dalej, że w końcu gry każdy gracz G

otrzymuje kwotę v

, którą

nazywamy wygranej w tej grze. Jeżeli

, to gra jest

wygrana

graczem G

, jeśli

, to

przegranej

graczem G

, a jeśli

= 0

, to gra skończyła się

remisem

W dużej ilości przypadków mamy

gry o sumie zero

: v

+ v

+ ... + v

= 0. W

takich grach suma wygranej przechodzi od jednego gracza do drugiego, bez
wykorzystania zewnętrznych źródeł.

W takich zadaniach suma wygranej jest stała, zmienia się tylko suma wygranej

każdego gracza. W przeciwnym przypadku mamy grę o sumie niezerowej.

W grze może brać udział dwóch lub więcej graczy lub koalicji.

Poniżej rozważamy:

— gry dwuosobowe o sumie zero, w tym tzw. gry z naturą,
— gry dwuosobowe o sumie dowolnej, niekooperacyjne i kooperacyjne,
— gry wieloosobowe, niekooperacyjne i kooperacyjne.

Podstawa matematycznej teorii gier jest schemat gry dwuosobowej z sumą zero. Jest to gra
ściśle konkurencyjna, nie ma w niej miejsca na negocjacje między graczami — co jeden z nich
wygrywa, co drugi przegrywa. Jeżeli w grze ściśle konkurencyjnej każdy z graczy dysponuje
jedynie skończoną liczbą strategii, to nazywa się grą macierzową. Optymalne postępowanie
obu graczy określone przez teorię gier ma charakter zasady stabilności: każdemu z graczy
niewygodnie jest zmieniaé swoja strategie, jeżeli jego przeciwnik pozostawi swoją strategię nie
zmieniona.

W grach dwuosobowych o sumie dowolnej wypłaty dla graczy określa się przy każdym
podjęciu decyzji, przy czym interesy obu graczy nie są (nie musza być) dokładnie przeciwne,
bardzo często obaj mogą nawet zyskać przez współpracą. Ponieważ zyski jednego gracza nie
muszą być równe stratom drugiego, to wypłaty każdego z nich zapisujemy w osobnej macierzy
(tablicy), skąd bierze się nazwa gry dwumacierzowe.
Rozróżnią się dwa rodzaje gier dwumacierzowych: 1) niekooperacyjne oraz 2) kooperacyjne.

W grach dwumacierzowych niekooperacyjnych jakiekolwiek porozumienie (np.
skorelowane strategie czy wypłaty uboczne) jest zabronione.

W przypadku dwumacierzowych gier kooperacyjnych różnego rodzaju współpraca między
obu graczami jest dozwolona.

Teoria wieloosobowych gier niekooperacyjnych niewiele różni się od teorii dwuosobowych
gier niekooperacyjnych o sumie dowolnej. W przypadku wieloosobowych gier kooperacyjnych
występuje pojęcie koalicji, która może powstać i utrzymać się przez pewien czas tylko pod
warunkiem, że poszczególni jej członkowie powinni osiągnąć pewnego rodzaju równowagę lub
stabilność.

2. Gry macierzowe o sumie zero

W ogólnym przypadku gra macierzowa
definiuje się przez prostokątną macierz
wymiaru m x n. Numer i wiersza macierzy
odpowiada numeru strategii A

gracza P, oraz

numer kolumny B

odpowiada numeru

strategii gracza D.

...
...

...

... ... ...

...







...

Elementy macierzy a

są wartości rzeczywiste i

odpowiada sumie, wygranej przez graca P u gracza
D, jeśli P wybiera strategie A

, oraz D wybiera

strategie B

. Macierz A zwykle nazywa się macierzą

wypłat.

Przykład. Rzucanie monety. Pierwszy gracz P

wybiera jedną z dwóch stron monety. Drugi gracz D
nie znając wyboru pierwszego, też wybiera jedną ze
stron monety. Reguły gry są następujące: gracz D
zapłaci 1 zł graczowi P, jeśli po jednoczesnym rzucaniu
monet graczami P i D wypadli takie same stronę
(orzeł-orzeł lub reszka-reszka), w przeciwnych
przypadkach (orzeł-reszka lub reszka-orzeł) 1 zł płaci
gracz P graczowi D (gracz P wygrywa (–1) zł). Przy
takim przypuszczeniu mówimy, że gracz D gra na
minimum, oraz gracz P – na maksimum.

Strategii

graczy

orzeł

reszk

orzeł

-1

reszka

-1

maxmin



minmax



Dolną czystą ceną gry (maksyminem) nazywa się

wartość

Górną czystą ceną gry (minimaksem) nazywa się

wartość

Strategii graczy, odpowiadające maksyminu (minimaksu), nazywają się straregii
maksyminowymi (minimaksowymi).

Przykład. Znaleźć się strategii maksyminowe i minimaksowe w grze macierzowej:

-3

Dla każdego wiersza znajdziemy najmniejszą wartość i
zapiszemy w kolumnę a: (-3, 3, 1, 2).

To oznacza, że dla dowolnej strategii gracza D najgorsza

wygrana gracza P będzie odpowiednie (-3, 3, 1, 2). Z
drugiej strony, gracz P powinien wybrać taką strategie
(wiersz), żeby maksymalizować swoją wygraną. Wtedy a
= max(-3, 3, 1, 2) = 3 i strategią maksyminową dla gracza
P będzie strategia A2.

Analogicznie znajdziemy minimaksową strategie gracza

D. Ponieważ gracz D wybiera strategii według kolumn,
wtedy w najgorszym przypadku on może przegrać
odpowiednie 5, 8, 7, 9. Dla minimalizacji przegranej gracz
D wybiera strategię dla min(5, 7, 8, 9), tj. minmaksowi: b =
min(5, 7, 8, 9) = 5. Z macierzy wypłat widać, że strategią
minimaksową gracza D będzie B1.

Sytuacją równowagi a = b reprezentuje

punkt

siodłowy

, utworzony przez pary strategii Ai i Bj

odpowiednio graczy P i D, przy których osiągana jest
relacja:

maxmin

minmax



3. Czysty i mieszany strategii

Wyróżniają strategii czyste i mieszane.

Czysta strategia

Ai (i=1,2,...,m) pierwszego gracza P (czysta strategia Bj

(j=1,2,...,n) drugiego gracza D) — są to możliwa strategia pierwszego (drugiego)
gracza wybrana z prawdopodobieństwem p=1.





; ;...; ;...;

p p



0 ( 1,2,..., )











; ;...; ;...;

q q





Mieszaną strategią

pierwszego (drugiego) gracza nazywa się wektor

, gdzie

(wektor

, gdzie

Ponieważ gracze wybierają swoje czyste strategii losowo i niezależnie od drugiego
graczy, gra ma przypadkowy charakter i wielkość wygranej (przegranej) też będzie
wartością losową. Wtedy średnia wartość wygranej (przegranej) — wartość
oczekiwana — jest funkcją od mieszanych strategii р, q:

( , )

ij i j

f p q

a pq





Czyste strategii gracza wchodzące do jego optymalnej mieszanej strategii z

prawdopodobieństwami nie równymi zero, nazywają się aktywnymi strategiami
gracza.

Jest prawidłowe twierdzenie o aktywnych strategiach (bez dowodu).
Twierdzenie. Jeśli jeden z graczy wykorzystuje swoją optymalną mieszaną

strategię, to jego wygrana zostanie niezmiennej i równa się cenie gry niezależnie
od tego, jaką strategie stosuje inny gracz, jeżeli tylko on nie wychodzi za przedziały
swoich aktywnych strategii.

Na podstawie twierdzenia rozwiązanie gry macierzowej będzie uproszczono, jeśli

wyjaśnić dominowanie jednych strategii nad innymi.

Przykład. Uprościć grę macierzową
Rozwiązanie. Ponieważ elementy drugiego i czwartego

wiersza są równe, tj. mamy dwa dublujących się wierszy.
Wyeliminujemy, na przykład, czwarty wiersz.

Porównujemy elementy wierszy. Wszystkie elementy

drugiego wierszu są mniejszy od odpowiednich elementów
trzeciego wierszu. Wtedy strategia A

jest niewygodna

graczowi P. Wyeliminujemy również drugi wiersz.

Porównujemy elementy kolumn. Elementy pierwszej

kolumny są dominujące nad elementami trzeciej i szóstej
kolumny (są najmniejszy). Wyeliminujemy 3-cią i 6-tą
kolumnę. Analogicznie, elementy drugiej kolumny są
dominujące nad elementami czwartej kolumny. Graczowi D
jest niewygodnie wykorzystać strategii B

, B

Otrzymujemy uproszczoną macierz gry:

Jeżeli potrzebujemy macierz z dodatnimi elementami,

wystarczy dodać do wszystkich elementów, na przykład,
wartość +4.

-4 -2 2

-4 -2

4. Metoda Brown’a rozwiązania zadań teorii gier

Krok gracza

21*

23*

Krok

gracza

12*

15*

25*

max

min

14*

 

1 4 0

0 3 1 1

, ,

, , ,

5 5 5

5 5 5 5







 

5 5 0

1 6 1 3

10 10 10

10 10 10 10







Stopień przybliżenia do rozwiązania zależy od wyboru pierwszego kroku i od ilości
kroków. Na przykład, dla n=5

n=10

5. Zadania teorii gier a zadania planowania liniowego

Niech mamy grę rozmiarem m x n z macierzą { aij } :

...
...

...

... ... ...

...











; ;...; ;...;

p p







; ;...; ;...;

q q



11 1

21 2

12 1

22 2

...
...

...

mn m

a p a p

a p

a p a p

a p

a p a p

a p



 







 







 





0, 1,2,..., .









Zaznaczymy przez

optymalne mieszane strategii graczy P i D. Strategia р* gracza P gwarantuje

jemu wygraną nie niższą niż v niezależnie od wyboru strategii B

graczem D. Ten fakt

możemy zapisać w postaci:

gdz

Analogicznie, strategia q* gracza D gwarantuje jemu przegraną nie wyższą niż v
niezależnie od wyboru strategii Ai graczem P. Ten fakt możemy zapisać w postaci:

11 1

12 2

12 1

22 2

1 1

2 2

...
...

...

n n

mn n

a q a q

a q

a q a q

a q

a q a q

a q



 







 







 





gdzie

0, 1,2,..., .









, ( 1,2,..., ; 1,2,..., )

m j



11 1

21 2

12 1

22 2

...

m m

mn m

a x a x

a x

a x a x

a x

a x a x

a x



 







 







 





0, 1,2,..., .









Przekształcimy układy nierówności. Dla tego podzielmy nierówności na v>0 i
wprowadzimy zaznaczenia

Otrzymuj

emy:

gdzie

11 1

12 2

12 1

22 2

1 1

2 2

...

n n

mn n

a y a y

a y

a y a y

a y

a y a y

a y



 







 







 





gdzie

0, 1,2,..., .









Ponieważ gracz P dąży do maksymalizacji ceny gry

, wtedy

będzie minimalizowana

Optymalna mieszana strategia gracza D jest dualną do zadania PL dla gracza P:

będzie

maksymalizowana.

Rozwiązując parę dualnych zadań PL metodą simplex (lub graficznej dla dwóch
zmiennych), znajdziemy:

, ( 1,2,..., ; 1,2,..., )





Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9

Wyszukiwarka

Podobne podstrony:
BO W07 Gry Stat
choroby wirus i bakter ukł odd Bo
1 bo
BO WYKLAD 03 2
BO W 4
w06
chlamydiofiloza bo i ov
BO I WYKLAD 01 3 2011 02 21
Historia gry Heroes of Might and Magic
Gry i zabawy ruchowe do zab emocj
bo mój skrypt zajebiaszczy
BO WYK2 Program liniowe optymalizacja
inf2 w06
2 BO 2 1 PP Przykłady Segregator [v1]
PB BO W1
Gry i Zabawy, Zabawy rzutne, poznanie gry Boccia
Odp z BO

więcej podobnych podstron

BO W06 Gry

Document Outline