Játékelmélet és hálózati alkalmazásai 2. ea

Játékelmélet és hálózati alkalmazásai 2. ea Csercsik Dávid ITK PPKE Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 1 / 20

1 Nevezetes normál formájú játékok Iteráció Szigorúan dominált stratégiák iteratív kiküszöbölése Dominancia Játékok tulajdonságai Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2 / 20

Definíciók I Játékosok: N = {1,..,n} Stratégiahalmazok: S 1,...,S n (teljes) stratégiatér: ezek szorzata - S = S 1... S n kifizetőfüggvények: f i : S R, i = 1,..,n G = {S 1,...,S n ; f 1,...,f n } Olyan játékok ahol S i -k végesek: véges játékok 2 játékos esetén mindkét játékos kifizetőfüggvénye megadható egy-egy mátrixal: A mátrix sorainak száma: S 1, a mátrix oszlopainak száma: S 2 Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 3 / 20

Fogolydilemma 1. fogoly 2. fogoly N V N (-2,-2) (-10,-1) V (-1,-10) (-5,-5) táblázat: Fogolydilemma kifizetési bimátrixa. V: vall, N: Nem vall Az 1. fogoly nem tudja mit fog csinálni a másik, de a V stratégia választásával mindkét esetben jobban jár. (A 2. ue.) "szigorúan dominált stratégiák kiküszöbölése" Itt egyértelmű Nash-egyensúly (NE) -ra vezet. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4 / 20

Nemek harca fiú lány Wellhello Auróra Wellhello (1,2) (0,0) Auróra (0,0) (2,1) táblázat: Nemek harca játék kifizetési bimátrixa Itt két NE is van, ha mindketten a Wellhellot vagy mindketten a Aurórát választják. Tegyük most fel, hogy valójában a Wellhellot szeretik mindketten jobban, ez 2-2, a Auróra pedig 1-1 egység örömöt szerez. Ekkor is mindkét azonos választás Nash-egyensúlyban van, annak ellenére, hogy a Auróra a teljes haszon tekintetében egyértelműen rosszabb (Pareto-szuboptimális - akkor lenne Pareto optimális ha nem létezne olyan alternatíva ami az egyik játékos kifizetését javítja és a másikét nem rontja). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 5 / 20

Héja-galamb játék (hawk and dove game) A fogolydilemmához hasonló héja-galamb játék konfliktushelyzetek modellezését célozza (kocsmai verekedések, háborúk, biológiában különböző fajok vetélkedése stb.). Mindkét félnek két stratégiája van, a provokáló (héja) és a kompromisszumkereső (galamb). héja galamb héja (0,0) (4,1) galamb (1,4) (3,3) táblázat: Héja-galamb játék kifizetési bimátrixa A játék másik elnevezése a gyáva nyúl : amikor egy keskeny egyenes úton egymással szembe indul két autós. Amelyik előbb félrerántja a kormányt, az gyáva nyúl, gúny és megvetés tárgya. Ha viszont egyik sem rántja félre, akkor két bátor halottal lesz gazdagabb a helyi legendárium. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 6 / 20

Iterált fogolydilemma 1979-ben és 1982-ben is versenyt írtak ki az iterált Fogolydilemma kapcsán. Iterált stratégiát megvalósító programokat kellett beküldeni, és ezeket eresztették össze fix számú körben. A világ minden tájáról érkeztek különböző, akár igen nagy bonyolultságú megoldások, ámde mindegyiken felülkerekedett Anatol Rapoport szociológus Tit-for-Tat (TFT) stratégiája - Szemet-Szemért: az első körben kooperálunk, később pedig azt tesszük, amit ellenfelünk tett az előző körben. Később a versenyeket kiíró Robert Axelrod még további két analízissel igazolta a TFT stratégia hatékonyságát/ésszerűségét az iterált Fogolydilemma esetében: (1) végzett egy úgynevezett ökológiai analízist, ahol egy végtelen méretű populáció az eredeti versenyekben résztvevő programokból alkotott adott arányú részpopulációinak alakulását vizsgálta, feltéve, hogy ezek mérete (pontosabban a teljes populációhoz viszonyított arányuk) függ az átlagos hasznuktól, amit egy-egy körben nyernek. Itt is a TFT részpopuláció jött ki győztesként. A másik kísérlet, (2) evolúciós analízis címen vált ismertté. Itt Axelrod egy genetikus algoritmushoz hasonló környezetet konstruált, és azon belül evolvált bináris kromoszómák (génszekvenciák) által kódolt iterált stratégiákat. Ezeket vetette körről körre, generációról generációra össze, és a sikeresebbek örökítődhettek tovább. Ennél a kísérletnél is a TFT-hez igen hasonló tulajdonságokkal rendelkező iterált stratégiát kódoló génszekvencia jött ki eredményül. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 7 / 20

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 8 / 20

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Az 1. játékos egyik stratégiája sem dominálja szigorúan a másikat, de a 2. játékos K stratégiája szigorúan dominálja J-t elhagyjuk. A megmaradt mátrixban F szigorúan dominálja L-et, az így megmaradtban pedig K dominálja B-t. (F,K) "Szigorúan dominált stratégiák iteratív kiküszöbölése" Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 9 / 20

Nullösszegű játékok Minden A valós mátrix definiál egy játékot, ahol a sorjátékos az egyik sort, az oszlopjátékos az egyik oszlopot választja, és a sorjátékos nyereménye a választott sor és oszlop találkozásában levő a ij elem, míg az oszlopjátékosé a ij. A mátrix - kifizetési mátrix, A mátrix sorai/oszlopai - a sor/oszlop játékos tiszta stratégiái, pl (feltüntetve a minimális nyereséget és a maximális veszteséget): A = 0 1 0 3 3 2 1 2 1 3 0 1 3 3 1 3-1 0-1 0 3 1 3 2 1 2 0 1 3 0 1 Ha a sorjátékos a második sort választja, az oszlopjátékos pedig a harmadik oszlopot, akkor garantált, hogy a sor legalább 1-et nyer, de az is, hogy többet nem. Azaz ezek megjátszását optimális illetve egyensúlyi stratégiáknak tekinthetjük. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 10 / 20

Nullösszegű játékok II: A nyeregpont Jelentse m i az i-edik sor minimumát, M j pedig a j-edik oszlop maximumát, azaz Legyen továbbá Ekkor m i = mina ij, M j = max j i a ij m = maxm i és M = minm j i j m M (a minimumok maximuma a maximumok minimuma) Ha m = M akkor r,s hogy a rs = m = M (ez a mátrix nyeregpontja) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 11 / 20

Cournot-duopólium Egy folytonos példa Egy iparág, két meghatározó vállalat, melyek egy homogén terméket állítanak elő. Stratégiák: termelési volumenek. Adott az inverz keresleti függvény, amely az iparág össztermeléséhez rendeli hozzá azt a legmagasabb árat, amelyen a piac kiürül. Adott a vállalatok (azonos) költségfüggvénye. Definiáljuk azt a játékot ahol a kifizetőfüggvények a bruttó nyereségek (a költségekkel csökkentett árbevétel). Tfh: az inverz keresleti függvény és a költségfüggvény lineáris. Ha q 1 és q 2 jelölik a két vállalat (nemnegatív) termelési volumenét, akkor az i játékos kifizetőfüggvénye: f i (q 1,q 2 ) = q i p(q 1,q 2 ) C(q i ) p(q 1,q 2 ) = max{a b(q 1 +q 2 ), 0} C(q i ) = cq i, a,b,c > 0, a > c, i = 1, 2 c - termelési költség, q i - termelt mennyiség, p - a termék ára 0 termelési volumen 0 nyereség. Túl nagy termelési volumen veszteség, függetlenül attól, mekkora termelést választ a másik. NE-t lásd később. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 12 / 20

Dominancia S i : Azon stratégiaprofilok halmaza, amik nem tartalmazzák az i játékos stratégiáját. (csonka stratégiaprofilok) ha s i S i akkor s = (s i,s i ) az a stratégiaprofil ahol az i játékos az s i stratégiáját, míg a többiek s i -t játszák. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben s i és t i S i az i játékos két stratégiája. s i szigorúan dominálja t i -t ha gyengén dominálja ha f i (s i,s i ) > f i (t i,s i ) s i S i Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 13 / 20

Nash-egyensúly Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt Nash-egyensúlypontnak (NEP v NE) nevezünk, ha f i (s i,s i) f i (s i,s i) s i S i i = 1,...,n vegyük észre hogy egyszerre csak 1 játékos válthat stratégiát Definíció Az s S stratégiaprofilt domináns Nash-egyensúlypontnak (DNEP) nevezünk, ha f i (s i,s i ) f i (s i,s i ) s S i = 1,...,n "függetlenül attól hogy a másik mit játszik, én a DNEP-hez tartozó stratégiával járok jobban" - minden játékosra pl a fogolydilemmában a (V,V) DNEP, a nemek harcában a (W,W) nem DNEP. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 14 / 20

Erős Nash-egyensúly (N>2) esetén érdekes. Koalíció: játékosok egy halmaza. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt erős Nash-egyensúlypontnak (SNE) nevezünk, ha s NE, és C 2 N f i (s C,s C ) f i(s C,s C ) i C &( j C) (f j (s C,s C ) < f j(s C,s C )) (mindenki legalább olyan jól jár) (egyvalaki szigorúan jobban jár) Az erős Nash-egyensúly (SNE - Strong Nash Equilibrium) egy olyan NE, amire igaz hogy nem létezik olyan koalíció ami ha koordináltan változtatja meg a stratégiáját - a többiek változatlan döntése mellett - akkor azzal minden tagja jobban jár (és legalább egyikük szigorúan). Szemben a NE unilaterális deviációival, az SNE koalíciós elhajlást is megenged. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 15 / 20

Erős Nash-egyensúly: Ellenpélda Legyen S 1 = {F,L}, S 2 = {B,J}, S 3 = {E,H} P3 : S 3 = E P3 : S 3 = H P1 P2 B J F (2,2,2) (3,1,0) L (0,1,3) (1,2,3) P1 P2 B J F (1,4,1) (0,0,0) L (3,0,3) (2,1,-1) S=(F,B,E) NE (unilaterális deviációkra stabil), de C = {1, 3} hogy T=(L,B,H) esetén f i (T) > f i (S) i C Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 16 / 20

Felcserélhetőség Definíció Ha s = (s 1,...,s n ) és t = (t 1,...,t n ) a G = {S 1,...,S n ; f 1,...,f n } játék két NEP-je és u = (u 1,...,u n ) u i {s i,t i } i = 1,...,n szintén NEP akkor s és t felcserélhetőek. Ha G-nek csak egyetlen NEP-je van vagy 2 NEP-je felcserélhető, akkor G rendelkezik a felcserélhetőségi tulajdonsággal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 17 / 20

Antagonizmus Definíció A G = {S 1,S 2 ;f 1,f 2 } kétszemélyes játékot antagonisztikusnak nevezzük, ha s 1,t 1 S 1 és s 2,t 2 S 2 stratégiapárosra f 1 (s 1,s 2 ) f 1 (t 1,t 2 ) f 2 (s 1,s 2 ) f 2 (t 1,t 2 ) (ha átmegyünk t-ből s-be, az első játékos kifizetése pontosan akkor nő ha a másodiké csökken) Antagonisztikus játékokban a játékosok érdekei ellentétesek. A konstans összegű játékok (f 1 +f 2 = c) antagonisztikusak, de nem minden antagonisztikus játék konstans összegű. Tétel Minden antagonisztikus játék rendelkezik a felcserélhetőségi tulajdonsággal, és minden NEP-ben mindkét játékos kifizetőfüggvényének értéke azonos (nem a két játékosra, hanem a két NEP-ra vonatkozva). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 18 / 20

Nash halmaz, stratégiai ekvivalencia E. = G = {S 1,...,S n ; f 1,...,f n } NEP-jei. e f iff ha e és f E felcserélhetőek. A reláció reflexív, szimmetrikus de nem tranzitív. Definíció Az E egy olyan D részhalmazát, amelyre d 1,d 2 D esetén d 1 d 2 Nash-halmaznak nevezzük. Ha egy Nash-halmaz nem valódi részhalmaza egyetlen Nash-halmaznak sem, akkor maximális Nash-halmaznak hívjuk. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n } H = {S 1,...,S n ; g 1,...,g n } G és H stratégiailag ekvivalens, ha NEP-jaik halmaza megegyezik. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 19 / 20

3 tétel Tétel G = {S 1,...,S n ; f 1,...,f n } játék esetén ha ϕ i : R R szig. mon. növő minden i-re, akkor a H = {S 1,...,S n ; ϕ 1 f 1,...,ϕ n f n } játék stratégiailag ekvivalens G-vel. Tétel A G = {S 1,...,S n ; f 1,...,f n } játék játékban a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen NEP-et sem vesztünk el. Tétel Ha a G = {S 1,...,S n ; f 1,...,f n } játék véges, és a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen s stratégiaprofil marad, akkor s a G játék egyetlen NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 20 / 20