Játékelmélet és hálózati alkalmazásai 2. ea Csercsik Dávid ITK PPKE Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 1 / 31
1 Az információ szerepe Játékok extenzív formában Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 2 / 31
Definíciók I Játékosok: N = {1,.., n} Stratégiahalmazok: S 1,..., S n ezek szorzata: S = S 1... S n kifizetőfüggvények: f i : S R, i = 1,.., n G = {S 1,..., S n ; f 1,..., f n } ahol S i -k végesek: véges játékok minden játékos kifizetőfüggvénye megadható egy n-dim mátrixal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 3 / 31
Fogolydilemma 1. fogoly 2. fogoly N V N (-2,-2) (-10,-1) V (-1,-10) (-5,-5) 1. táblázat. Fogolydilemma kifizetési bimátrixa. V: vall, N: Nem vall Az 1. fogoly nem tudja mit fog csinálni a másik, de a V stratégia választásával mindkét esetben jobban jár. (A 2. ue.) szigorúan dominált stratégiák kiküszöbölése Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 4 / 31
Iterált fogolydilemma Tit-for-Tat (TFT)- Szemet-Szemért: az első körben kooperálunk, később pedig azt tesszük, amit ellenfelünk tett az előző körben. 1979-ben és 1982-ben is versenyt írtak ki az iterált Fogolydilemma kapcsán. Iterált stratégiát megvalósító programokat kellett beküldeni, és ezeket eresztették össze fix számú körben. A világ minden tájáról érkeztek különböző, akár igen nagy bonyolultságú megoldások, ámde mindegyiken felülkerekedett Anatol Rapoport szociológus TFT stratégiája. Később a versenyeket kíıró Robert Axelrod még további két anaĺızissel igazolta a TFT stratégia hatékonyságát/ésszerűségét az iterált Fogolydilemma esetében: (1) végzett egy úgynevezett ökológiai anaĺızist, ahol egy végtelen méretű populáció az eredeti versenyekben résztvevő programokból alkotott adott arányú részpopulációinak alakulását vizsgálta, feltéve, hogy ezek mérete (pontosabban a teljes populációhoz viszonyított arányuk) függ az átlagos hasznuktól, amit egy-egy körben nyernek. Itt is a TFT részpopuláció jött ki győztesként. A másik kísérlet, (2) evolúciós anaĺızis címen vált ismertté. Itt Axelrod egy genetikus algoritmushoz hasonló környezetet konstruált, és azon belül evolvált bináris kromoszómák (génszekvenciák) által kódolt iterált stratégiákat. Ezeket vetette körről körre, generációról generációra össze, és a sikeresebbek örökítődhettek tovább. Ennél a kísérletnél is a TFT-hez igen hasonló tulajdonságokkal rendelkező iterált stratégiát kódoló génszekvencia jött ki eredményül. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 5 / 31
2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 6 / 31
2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Az 1. játékos egyik stratégiája sem dominálja szigorúan a másikat, de a 2. játékos K stratégiája szigorúan dominálja J-t elhagyjuk. A megmaradt mátrixban F szigorúan dominálja L-et, az így magmaradtban pedig K dominálja B-t. (F, K) Szigorúan dominált stratégiák iteratív kiküszöbölése Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 7 / 31
Cournot-duopólium Egy folytonos példa Egy iparág, két meghatározó vállalat, melyek egy homogén terméket álĺıtanak elő. Stratégiák: termelési volumenek. Adott az inverz keresleti függvény, amely az iparág össztermeléséhez rendeli hozzá azt a legmagasabb árat, amelyen a piac kiürül. Adott a vállalatok (azonos) költségfüggvénye. Definiáljuk azt a játékot ahol a kifizetőfüggvények a bruttó nyereségek (a költségekkel csökkentett árbevétel). Tfh: az inverz keresleti függvény és a költségfüggvény lineáris. Ha q 1 és q 2 jelölik a két vállalat (nemnegatív) termelési volumenét, akkor az i játékos kifizetőfüggvénye: f i (q 1, q 2 ) = q i p(q 1, q 2 ) c(q i ) p(q 1, q 2 ) = max{a b(q 1 + q 2 ), 0} c(q i ) = cq i, a, b, c > 0, a > c, i = 1, 2 0 termelési volumen 0 nyereség. Túl nagy termelési volumen veszteség, függetlenül attól, mekkora termelést választ a másik. Elég a megoldást [0, b a ]-n keresni. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 8 / 31
Dominancia S i : Azon stratégiaprofilok halmaza, amik nem tartalmazzák az i játékos stratégiáját. (csonka stratégiaprofilok) ha s i S i akkor s = (s i, s i ) az a stratégiaprofil ahol az i játékos az s i stratégiáját, míg a többiek s i -t játszák. Definíció Legyen G = {S 1,..., S n ; f 1,..., f n }-ben s i és t i S i az i játékos két stratégiája. s i szigorúan dominálja t i -t ha f i (s i, s i ) > f i (t i, s i ) s i S i gyengén dominálja ha Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 9 / 31
Nash-egyensúly Definíció Legyen G = {S 1,..., S n ; f 1,..., f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt Nash-egyensúlypontnak (NEP) nevezünk, ha f i (s i, s i) f i (s i, s i) s i S i i = 1,..., n vegyük észre hogy egyszerre csak 1 játékos válthat stratégiát Definíció Az s S stratégiaprofilt domináns Nash-egyensúlypontnak (DNEP) nevezünk, ha f i (si, s i ) f i (s i, s i ) s S i = 1,..., n pl a fogolydilemmában a (V,V). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 10 / 31
Felcserélhetőség Definíció Ha s = (s 1,..., s n ) és t = (t 1,..., t n ) a G = {S 1,..., S n ; f 1,..., f n } játék két NEP-je és u = (u 1,..., u n ) u i {s i, t i } i = 1,..., n szintén NEP akkor s és t felcserélhetőek. Ha G-nek csak egyetlen NEP-je van vagy 2 NEP-je felcserélhető, akkor G rendelkezik a felcserélhetőségi tulajdonsággal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 11 / 31
Antagonizmus Definíció A G = {S 1, S 2 ; f 1, f 2 } kétszemélyes játékot antagonisztikusnak nevezzük, ha s 1, t 1 S 1 és s 2, t 2 S 2 stratégiapárosra f 1 (s 1, s 2 ) f 1 (t 1, t 2 ) f 2 (s 1, s 2 ) f 2 (t 1, t 2 ) Antagonisztikus játékokban a játékosok érdekei ellentétesek. A konstans összegű játékok (f 1 + f 2 = c) antagonisztikusak, de nem minden antagonisztikus játék konstans összegű. Tétel Minden antagonisztikus játék rendelkezik a felcserélhetőségi tulajdonsággal, és minden NEP-ben mindkét játékos kifizetőfüggvény értéke azonos. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 12 / 31
Nash halmaz, stratégiai ekvivalencia E. = G = {S 1,..., S n ; f 1,..., f n } NEP-jei. e f iff ha e és f E felcserélhetőek. A reláció reflexív, szimmetrikus de nem tranzitív. Definíció Az E egy olyan D részhalmazát, amelyre d 1, d 2 D esetén d 1 d 2 Nash-halmaznak nevezzük. Ha egy Nash-halmaz nem valódi részhalmaza egyetlen Nash-halmaznak sem, akkor maximális Nash-halmaznak hívjuk. Definíció Legyen G = {S 1,..., S n ; f 1,..., f n } G = {S 1,..., S n ; g 1,..., g n } G és H stratégiailag ekvivalens, ha NEP-jeik halmaza megegyezik. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 13 / 31
3 tétel Tétel G = {S 1,..., S n ; f 1,..., f n } játék esetén ha ϕ i : R R szig. mon. növő minden i-re, akkor a H = {S 1,..., S n ; ϕ 1 f 1,..., ϕ n f n } játék stratégiailag ekvivalens G-vel. Tétel A G = {S 1,..., S n ; f 1,..., f n } játék játékban a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen NEP-et sem vesztünk el. Tétel Ha a G = {S 1,..., S n ; f 1,..., f n } játék véges, és a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen s. stratégiaprofil marad, akkor s a G játék egyetlen NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 14 / 31
Egzisztencia I Érmepárosítás: ha megegyezik az oldal az 1. játékos nyer (és vica versa). Véges, 2 személyes, 0 összegű játék. ( ) 1 1 A = 1 1 Nincs NEP. G = {S 1,..., S n ; f 1,..., f n }, legyen most S i R k i Recall: NEP: f i (si, s i ) f i(s i, s i ) s i S i i = 1,..., n Definíció Az i játékos B i : S S i legjobbválasz-leképzése B i (s) = {t i S f i (t i, s i ) f i (r i, s i ), r i S i } B i (s) az i-ik játékos legjobb stratégiáit tartalmazza, ha a többi játékos az s i csonka stratégiaprofilban szereplő stratégiákat játsza. B i (s) üres is lehet. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 15 / 31
Egzisztencia II Definíció Az egész játékra vonatkozó B : S S vagyis t B iff t i B i (s) i = 1,..., n Tétel B(s) = B 1 (s)... B n (s) Legyen G = {S 1,..., S n ; f 1,..., f n } normál formában megadott játék, ahol a stratégiahalmazok véges dimenziós euklideszi terek nemüres, konvex, kompakt részhalmazai, és a kifizetőfüggvények folytonosak a stratégiaprofilok S halmazán. Ha a G játékra vonatkozó B legjobbválasz-leképzés egyértékű, akkor G-nek van legalább egy NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 16 / 31
Cournot-duopólium III f i (q 1, q 2 ) = q i p(q 1, q 2 ) c(q i ) p(q 1, q 2 ) = max{a b(q 1 + q 2 ), 0} Ha a második vállalat kibocsátása q (q 2 = q), az első vállalat legjobb válasza erre az f 1 (x) = x(a b(x + q)) cx kvadratikus kifizetésfüggvényt maximalizáló x = a c 2b q a c 2. A legjobb válasz az egyik játékos q kibocsátására max{ 2b q 2, 0} és a legjobbválasz-leképzés egyértelmű (vagyis egy függvény). Fixpont: q = a c 2b q 2 q = a c 3b a szimmetria miatt az egész iparág kibocsátása 2(a c) 3b monopolár: a+c 2, az ár pedig a+2c 3 Monopol kibocsátás (x =? ha q = 0): a c 2b, duopolár < monoplár, duopólium összkibocsátása > monopólium összkibocsátása Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 17 / 31
Mi a baj a NEP-el? Tragedy of the commons - közlegelők problémája Adott egy közlegelő amely 10 tehenet tud eltrartani úgy hogy ekkor mindegyik tehén 10 l tejet ad (egységnyi idő alatt). Az egyik gazda gondol egyet és kiküld még egy tehenet a legelőre egy-egy tehénnek már kevesebb fű jut, ezért mindegyik csak 9 l tejet ad. Viszont az a gazda amelyik 2 tehenet legeltet 2*9=18 l tejhez jut. Ezt észreveszi egy másik gazda is, ő is kiküld még egyet még kevesebb fű jut a teheneknek, egy tehén már csak 8 l tejet ad, de a 2 dezertőrnek 16 l teje lesz. Mikor már 8 gazda tart 2 tehenet, ők 2*(10-8)=4 l tejet kapnak, a 9-ik gazda nem nyer semmit a 2. tehénnel. Ha egy gazda úgy dönt hogy visszavonja az egyik tehenét, rosszabbul jár. Annyi Nash-egyensúly van, ahány féleképpen 10-ből el tudunk hagyni 2-őt = 10 alatt a 2=45. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 18 / 31
Unicitás Definíció A G = {S 1,..., S n ; f 1,..., f n } játék pontosan akkor konkáv ha az S = S 1,..., S n stratégiahalmazok kompaktak és konvexek, és az f i (s i, s i ) függvény konkáv s i -ben rögzített s i mellett i-re Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 19 / 31
Példa Cournot-duopólium. S i = [0, 1], c : [0, 1] R, c(x) = 1 2x, p : [0, 2] R p(y) = { 7 4 1 2 y ha 0 y 3 2 5 2 y egyébként A profitfüggvéynek: f i : [0, 1] 2 R, f i (x 1, x 2 ) = x i p(x 1 + x 2 ) 1 2 x i, i {1, 2} Elemi számolással igazolható hogy f i szigorúan konkáv fv-e x i -nek a [0, 1] intervallumon. Ugyancsak belátható hogy az X = {(x 1, x 2 ) 1 2 x 1 1, 1 2 x 2 1, x 1 + x 2 = 3 2 } halmaz minden eleme NEP. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 20 / 31
Unicitás II Tétel Legyen G = {S 1,..., S n ; f 1,..., f n } konkáv játék, és tegyük fel hogy a B legjobbválasz-leképzés egyértékű. Ha a B függvény kontrakció, akkor G-nek csak egy egyensúlypontja van. f a d távolságfüggvénnyel ellátott M metrikus téren kontrakció ha ( 0 k < 1)( (x, y) M)(d(f (x), f (y)) kd(x, y)) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 21 / 31
Kevert stratégiák Neumann János 1928 Adott valószínűséggel játszhatunk 1 adott stratégiát. i N egy kevert stratégiája q i Q ahol (s j S i ) q i (s j ) > 0 és s j S i q i (s j ) = 1 (q i (s i ) egy függvény ami az i-ik játékos minden lehetséges stratégiájához egy valószínűséget rendel - tiszta: q i (s i ) = 1) Kevert stratégia kombinációk kifizetőfüggvények (várható érték): q = (q 1,..., q n ) Q = Q 1... Q n f i (q) = sum s=(s1,...,s n) Sq 1 (s 1 ) q 2 (s 2 )... q n (s n )f i (s) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 22 / 31
Kevert Nash egyensúly q = (q 1,...q n) kevert NE ha ( i N)( q i Q i )f i (q i, q i) f i (q i, q i) Tétel Nash, 1951: Ha az n személyes játék tiszta stratégiahalmazai végesek, akkor a keveréssel létrejövő halmazok szorzatán defniált játéknak van legalább egy kevert egyensúlya. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 23 / 31
Kölcsönös tudás Az információ szerepe Aumann játék 3 hölgy ül egy asztal körül, a fejükön kalap. A kalapok lehetnek pirosak vagy feketék, de tfh hogy most mind piros. Mindgyik hölgy látja a másik 2 hölgy kalapját, de a sajátját nem. Egy külső szemlélő megkérdezi hogy tudják-e a kalapjuk színét. mindenki nem -el válaszol. Ezután a szemlélő kijelenti hogy legalább egyikükön piros kalap van, majd sorban újra felteszi az előző kérdést. Az 1-es válasza nem, a 2-esé is. De a 3-asé igen. A látszólag semmi újat nem jelentő legalább egy valakin piros kalap van információ közhírré tétele után a 3-as játékos a fenti esetben valóban, őszintén Igen -nel tud válaszolni. A 3-as így gondolkozhatott: Az 1-es azért mondta, hogy Nem, mert vagy rajtam, vagy a 2-esen (vagy mindkettőnkön) piros kalap van. Ezt persze a 2-es is tudja, de ő is Nem -mel válaszolt. Ha rajtam fekete kalap lenne (és ő ezt nyilván látná), akkor tudná, hogy rajta van piros (hiszen akkor miatta válaszolt Nem -mel az 1-es) - ekkor Igen -nel válaszolt volna. De nem ezt tette. A 2-es is Nem -mel válaszolt. Tehát rajtam biztosan nem fekete, hanem piros kalap van. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 24 / 31
Áruházlánc játék Játékok extenzív formában Egy város kiskereskedelmét egy nagy áruház (N) uralja. Egy vállalkozó (B) szeretne erre a piacra belépni és egy konkurens áruházat nyitni. Ha B belép a piacra, akkor N kétféleképpen reagálhat: vagy árháborút indít (h), vagy belenyugszik az új helyzetbe (b). A játékot a ábrán látható játékfával adhatjuk meg. Előbb B lép és dönt, hogy belép-e a piacra (l), vagy kívül marad (m). Ha belépett, akkor N dönt, hogy harcol, vagy belenyugszik az új helyzetbe. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 25 / 31
Információ Játékok extenzív formában Mind a sakkjátékban, mind az Áruházlánc játékban az egyes lépések jól definiált egymásra következése, és amiatt, mert a múlt (korábbi lépések) mindenki számára megfigyelhető, a játékosok tökéletesen informáltak. Ezen azt értjük, hogy minden játékos ismeri a játékot leíró fát, mindig tudja, hogy a játék éppen hol (melyik pontján a fának) tart, és emlékszik arra, hogy melyik ösvény mentén jutott oda. Nem mindig van azonban ez így. pl: (Egyszerűsített snóbli). Két játékos mindegyike 0 vagy 1 pénzérmét tesz a kezébe úgy, hogy ezt a másik nem látja. Ezután az 1. játékos megtippeli, hogy a két kézben összesen hány érme van. Utána a 2. játékos tippel, de nem mondhatja ugyanazt, mint az 1. játékos. A helyzet további egyszerűsítése céljából feltesszük, hogy a blöffölés nem megengedett, vagyis pl. senki sem tippelhet 0-át, miközben az ő kezében 1 van. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 26 / 31
Infromációs halmaz Játékok extenzív formában Ezt a játékot nem tudjuk úgy ábrázolni, mint pl. a sakkot, mert a játékosoknak nincs információjuk arról, hogy a másik hány érmét tett a kezébe, és így nem tudják pontosan, hogy éppen merre járnak a játékfában. Információs halmaz Definíció Jelöljük U i -vel a játékfa azon pontjainak halmazát, amelyekben az i játékos lép. Az U i egy Ui t részhalmazát az i játékos egy információs halmazának nevezzük, ha U t i minden pontjából ugyanannyi él indul ki, és az élek ugyanazokhoz a játékosokhoz tartozó pontok felé irányulnak bármely útnak legfeljebb egy közös pontja van Ui t -vel (nem megengedett pl., hogy Ui t két pontja éllel legyen összekötve). az U t i halmazok az U i egy partícióját adják Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 27 / 31
Infromációs halmaz II Játékok extenzív formában Vegyük észre, hogy az információs halmazok struktúrája nem következik a játék fájának szerkezetéből, tehát az információs halmazok a játék leírásához tartoznak, nem pedig abból vezethetőek le. Az információs halmazok definíciója mögötti intuíció a következő: az i játékos tudja, hogy az Ui t valamelyik pontjában van a játék, neki kell lépnie (választani az Ui t pontjaiból kiinduló azonos számú él közül) anélkül, hogy tudná, hogy az Ui t melyik pontjában van. Ehhez még arra is szükség van, hogy minden Ui t információs halmazhoz hozzárendeljünk egy Vi t indexhalmazt, amely azoknak a játékosoknak az indexeit tartalmazza (egyes játékosok többször is szerepelhetnek), akik Ui t pontjaiból egy éllel elérhetőek. Ezek szerint egy információs halmaz minden pontjából ugyanazok a játékosok (Vi t elemei) érhetőek el. Ha nem így lenne, akkor az adott információs halmazhoz tartozó játékos esetleg különbséget tudna tenni az információs halmaz pontjai között, amit persze nem engedhetünk meg. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 28 / 31
A snóbli információs halmazai Játékok extenzív formában Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 29 / 31
Játékok extenzív formában Tökéletes információs és tökéletes emlékezetű játékok Definíció Ha a játékban minden információs halmaz egyetlen pontból áll, akkor azt tökéletes információs játéknak hívjuk. Azokat a játékokat, ahol legalább egy információs halmaznak legalább két pontja van, nem tökéletes (imperfect) információs játék oknak nevezzük. Definíció Azokat a játékokat, amelyekben az információs halmazok összhangban vannak azzal a feltételezéssel, hogy minden játékos emlékszik korábbi lépéseire, tökéletes emlékezetű (perfect recall) játékoknak nevezzük. Ha ez a feltétel nem teljesül, akkor nem tökéletes emlékezetű (imperfect recall) játék okról beszélünk. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 30 / 31
Játékok extenzív formában Példa nem tökéletes emlékezetű játékra Az 1. játékos kétszer lép és mindkétszer J(obb) és B(al) közül választ, a 2. játékos egyszer választ J és B közül. Az egyetlen információs halmazban az 1. játékos nem tudja, hogy melyik pontban van a játék, hiszen elfelejtette, hogy elsőre J-t vagy B-t lépett. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 31 / 31