Teoria Gier
Początki teori gier
W 1913 r. Ernest Zelmer udowdnił
pierwsze formalne twierdzenie o grach
towarzyskich (dotyczyło szachów)
W 1928 r. John von Neumann opublikową
fundamentalne twierdzenie o
dwuosobowych grach o sumie zero
Za datę powstania teorii gier powszechnie
uznaje się rok 1944, w którym to została
opublikowana monogram matematyka
Johna von Neumanna oraz ekonomisty
Oskara Mergensterna: Theory of Games
and EconomicBehavior
Obecnie z tej teorii korzystają
praktycy z różnych dziedzin:
Ekonomi
Nauk politycznych
Prawa
Biologii (ewolucyjna teoria gier – John M.
Smith)
Stosunków międzynarodowych
Filozofii
Matematyki
Informatyce
Co to jest teoria gier?
TORIA GIER to dział matematyki
zajmujący się badaniem
optymalnego zachowania w
przypadku konfliktu interesów.
Teoria gier wywodzi się z badania
gier hazardowych i taka jest też jej
terminologia.Dlatego mniej
formalnie teorie gier możemy
definiować jako dziedzine nauki
zajmującą się badaniem sytuacji
konfilktowych i kooperacyjnych
pomiędzy uczestnikami gry.
Podstawowe pojęcia
GRA - to dowolna sytuacja konfliktowa
GRACZ -to dowolny jej uczestnik
(graczem może być na przykład
człowiek, przedsiębiorstwo lub zwierzę)
SUMA GRY – różnica pomiędzy
zyskiem z gry wygrywających,a stratą
przegrywających
STRATEGIA - postępowanie.
Gry dzielą się na:
Gry o sumie stałej
Gry o sumie zmiennej
Gry sprawiedliwe
Gry niesprawiedliwe
Gry dwóosobowe
Gry wieloosobowe
Hipoteza Czerwonej Królowej
Hipoteza Czerwonej Królowej
- koncepcja wyjaśniająca między
innymi proces "ewolucyjnego
wyścigu zbrojeń", powstała w
1973.
Mówi ona,że silna konkurencja
wymusza stałe zmiany
ewolucyjne o charakterze
kierunkowym
Zjawisko altruizmu
Jest to wydatkowanie energii przez jednego
osobnika na rzecz zwiększenie szansy
przeżycia innego osobnika tego samego
gatunku. Takie zjawiska możemy często
zaobserwować w naturze. Do takich zjawisk
należy np. opieka rodziców nad potomstwem
albo obrona stada pawianów przez dorosłe
samce.
Altruizm możemy też spotkać wśród
niespokrewnionych organizmów tego
sanmego gatunku np. iskanie myszy
przez inne myszy lub dzielenie się wypitą
krwią przez nietoperze wampiry
Dylemat więźnia
Dylemat więźnia to jeden z najsłynniejszych
problemów w teorii gier. Jest oparty na
dwuosobowej grze o nie zerowej sumie, w
której każdy z graczy może zyskać oszukując
przeciwnika, ale obaj stracą jeśli obaj będą
oszukiwać.
W grze tej dopuszczone są tylko dwie
strategie:
Współpraca
Zdrada
Cel każdego gracza: maksymalizacja swoich
zysków
Iterowany dylemat więźnia
Iterowany dylemat więźnia - polega
na rozgrywaniu tej samej gry
wielokrotnie. Wtedy każdy gracz ma
możliwość ukarania drugiego gracza za
oszukiwanie w poprzedniej rundzie. W
tej sytuacji, jeśli straty wynikające z
ukarania będą większe niż zyski z
oszukiwania, współpraca obu graczy
może utworzyć stan równowagi
Iliterowany dylemat więźnia
c.d.
Okazało się,że przy tej odmianie dylematu
więźnia egoistyczna strategia dawała średnio
gorsze wyniki(mniejsze zyski) niż bardziej
altruistyczna postawa.
Dzięki tej odmianie dylematu więźnia można
zaobserwować możliwość ewolucyjnego
wykształcenia się zachowań altruistycznych z
nastawionych na własny zysk, wyłącznie za
pomocą selekcji naturalnej.
W wielu przypadkach stosunki
międzygatunkowe oraz wewnątrzgatunkowe to
właśnie gra w Iterowany
Dylemat Więźnia.
Iterowy Dylemat Więźnia w przyrodzie na
przykładzie myszy
Turniej
W 1984 roku Robert Axelrod zaprosił
akademików z całego świata do uczestnictwa w
turnieju dla programów komputerowych,
grających w iterowany dylemat więźnia.
Przysyłane programy różniły się pod względem
złożoności, startowego zachowania, reakcji na
działanie przeciwnika itp.
Strategie:
przypadkowa
wet za wet
wet za dwa wety
prostoduszny tester
tester skruszony
oszust
frajer
pamiętliwy
Analizując najlepsze strategie, Axelrod przedstawił
kilka cech którymi się one wyróżniały:
Przyjazność - oznaczająca nie oszukiwanie dopóki
przeciwnik tego nie zrobił.
Mściwość - oznaczająca reagowanie na zdradę
przeciwnika. Bez tej cechy, strategia nie mogła
dawać dobrych rezultatów. Przykładowo strategia
Zawsze Współpracuj dawała bardzo kiepskie
wyniki, gdyż wielu przeciwników bezlitośnie
wykorzystywało takiego gracza.
Skłonność do wybaczania - oznaczająca
wracanie do współpracy po okresie zemsty za
oszustwo. To pozwalało uzyskać znacznie lepsze
wyniki niż ciągłe wzajemne mszczenie się.
Brak zazdrości - oznaczająca nie staranie się
uzyskać lepszego wyniku niż przeciwnik.
Wnioski jakie wyciągnął
Axelrod z analizy turnieju
Dbanie wyłącznie o własne zyski można najlepiej
realizować będąc przyjaznym i wybaczającym.
W iterowanym dylemacie więźnia, optymalna strategia
zależy od tego jak grają przeciwnicy i jak reagują na
współpracę i zdradę (np., gdyby wszyscy gracze grali
strategią Zawsze Oszukuj, to jeden gracz grający
strategią Wet Za Wet uzyskałby nieco gorszy wynik niż
reszta)
W pewnych sytuacjach optymalna okazuje się
strategia zwana Pavlov. Polega ona na współpracy w
pierwszej rundzie i zawsze jeśli w poprzedniej rundzie
gracze zagrali tak samo. Jeśli w poprzedniej rundzie
gracze zagrali różnie, strategia każe zdradzić.
Strategia „Jastrzębia” i
„Gołębia”
Jastrząb – zawsze walczy o swoje i nie
przestanie nawet w przypadku
odniesienia dużych strat.
Gołąb – w przypadku pojawienia się
pierwszych symptomów porażki podda
się,ulegnie presji albo wycofa się.
Jaki wybór przyniesie nam
pożądane efekty, czy warto
przyjąć nastawienie
"twardziela"?
Strategia ewolucyjnie stabilna
Jest to taka strategia, której
od chwili rozpowszechnienia
w danej populacji nie jest w
stanie wyprzeć żadna
strategia alternatywna.
Oznacza to, że jeśli jakiś
sposób postępowania
zostanie przyjęty przez
większość, to zachowania
podporządkowane innym
strategiom będą z reguły
przynosić porażkę.
Przyporządkujmy różnym
wynikom starcia z innymi
pewne wartości liczbowe
wygrana(np. pozyskanie zasobów)
+50
Przegrana (niezrealizowanie celu)
0
Klęska(np. Utrata pozyskanych
zasobów) -100
długotrwała, przeciągająca się
walka -10
Strategia „Gołębia”
zwycięzcy uzyskiwaliby wynik +50 lub -10
przeciętny "zysk" wygranego wynosiłby
+40
przeciętny "wynik" przegranego to -10 (bo
Gołębie z definicji nie walczą do ciężkich
strat)
jeśli w grupie takiej pojawi się choć jeden
Jastrząb, zawsze wygra i jego zysk
wyniesie +50
Wniosek: by zrealizować
jakiekolwiek swoje cele, Gołębie
będą musiały zacząć postępować
w bardziej drapieżny sposób i w
populacji zaczną dominować
zachowania rządzące się strategią
Jastrzębia
Strategia „Jastrzębia”
zwycięzcy uzyskiwaliby wynik +50
Przegrany uzyska wynik -100 (bo z założenia
Jastrzębie walczą do upadłego)
Pojawienie się osobnika postępującego jak
Gołąb da mu w tej sytuacji przewagę,bo
przegrywając wszelkie starcia lecz nie
odnosząc ciężkich strat będzie miał zawsze
wynik 0!
Wnisek: Można się więc spodziewać,
że w społeczności Jastrzębi zacznie
rozpowszechniać się asekurancki
wzorzec właściwy Gołębiom, który
zacznie dominować i ... powrócimy do
stanu opisanego w poprzednim
przypadku.
Strategia
„Gołębia” i
„Jastrzębia” nie
są strategiami
ewolucyjnie
stabilnymi!!!!!!!
!!
Bibliografia
http://pl.wikipedia.org/wiki/Teoria_gier
http://pl.wikipedia.org/wiki/Hipoteza_Czerwonej_Kr%C
http://bioinfo.mol.uj.edu.pl/articles/Loska04
http://math.uni.lodz.pl/~scibor/stara/download/gt.pdf