Játékelmélet és hálózati alkalmazásai 2. ea

Hasonló dokumentumok
Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 1 / 31

Döntési rendszerek I.

2015/ Szegedi Tudományegyetem Informatikai Intézet

Rasmusen, Eric: Games and Information (Third Edition, Blackwell, 2001)

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

Opkut deníciók és tételek

Piaci szerkezetek VK. Gyakorló feladatok a 4. anyagrészhez

Döntési rendszerek I.

JÁTÉKELMÉLETTEL KAPCSOLATOS FELADATOK

A stratégiák összes kombinációján (X) adjunk meg egy eloszlást (z) Az eloszlás (z) szerint egy megfigyelő választ egy x X-et, ami alapján mindkét

Nem-kooperatív játékok

Játékelmélet 1. Forgó Ferenc Pintér Miklós Simonovits András Solymosi Tamás. (elektronikus jegyzet)

Mátrixjátékok tiszta nyeregponttal

További forgalomirányítási és szervezési játékok. 1. Nematomi forgalomirányítási játék

Universität M Mis is k k olol ci c, F Eg a y kultä etem t, für Wi Gazda rts ságcha tudft o sw máis n s yen i scha Kar, ften,

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4. ea 1 / 21

11. Előadás. Megyesi László: Lineáris algebra, oldal. 11. előadás Kvadratikus alakok, Stratégiai viselkedés

Mikroökonómia I. B. ELTE TáTK Közgazdaságtudományi Tanszék. 12. hét STRATÉGIAI VISELKEDÉS ELEMZÉSE JÁTÉKELMÉLET

KOVÁCS BÉLA, MATEMATIKA I.

MIKROÖKONÓMIA - konzultáció - Termelés és piaci szerkezetek

Funkcionálanalízis. n=1. n=1. x n y n. n=1

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

2014. szeptember 24. és 26. Dr. Vincze Szilvia

4. Fuzzy relációk. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

Sarokba a bástyát! = nim

1. feladat Az egyensúly algoritmus viselkedése: Tekintsük a kétdimenziós Euklideszi teret, mint metrikus teret. A pontok

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelméleti bevezető, Cournot- és Bertrandoligopólium

Az előadásokat és a gyakorlatokat pénteken az M 316 tanteremben tartjuk. Az előadás időpontja: , a gyakorlat időpontja:

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelmélet, Cournot- és Bertrand-oligopólium

Közgazdaságtan I. 11. alkalom

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

MIKROÖKONÓMIA - konzultáció - Termelés és piaci szerkezetek

PIACI JÁTSZMÁK. Bevezető Közgazdaságtan Tanszék

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Diszkrét matematika I.

Klasszikus algebra előadás. Waldhauser Tamás április 28.

10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai

Játékelméleti alapvetés - I

KÖZGAZDASÁGTAN. Játékelmélet Szalai László

15. LINEÁRIS EGYENLETRENDSZEREK

PIACI SZERKEZETEK BMEGT30A hét, 1. óra: Differenciált termékes Bertrand-oligopólium

Közgazdaságtan. A vállalatok kínálata Szalai László

Alkuegyensúlyok és stabil halmazok

Leképezések. Leképezések tulajdonságai. Számosságok.

Piaci szerkezetek VK. Gyakorló feladatok a 3., az 5. és a 7. anyagrészhez

A fontosabb definíciók

A relációelmélet alapjai

BEVEZETÉS A JÁTÉKELMÉLETBE: VÁZLAT. MTA Közgazdaságtudományi Kutatóközpont Budapest, Budaörsi út 45, simonov@econ.core.hu május 6.

f B B 1 B 2 A A 2 0-1

Lineáris algebra gyakorlat

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit.

Agrárstratégiai irányok játékelméleti alapokon

Függvények határértéke, folytonossága FÜGGVÉNYEK TULAJDONSÁGAI, SZÉLSŐÉRTÉK FELADATOK MEGOLDÁSA

A lineáris programozás alapjai

3. előadás Stabilitás

A változó költségek azon folyó költségek, amelyek nagysága a termelés méretétől függ.

Mikro- és makroökonómia. Monopolisztikus verseny, Oligopóliumok Szalai László

0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles

Analízis II. Analízis II. Beugrók. Készítette: Szánthó József. kiezafiu kukac gmail.com. 2009/ félév

PIACI JÁTSZMÁK. Fiú. Színház. Színház (4 ; 2) (0 ; 0) A38 (0 ; 0) (2 ; 4) Lány

MIKROÖKONÓMIA II. B. Készítette: K hegyi Gergely. Szakmai felel s: K hegyi Gergely február

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

Formális nyelvek - 9.

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

Markov-láncok stacionárius eloszlása

A tiszta stratégiával a biztosan elérhető nyereség:

Konjugált gradiens módszer

Előadó: Dr. Kertész Krisztián

1/ gyakorlat. Lineáris Programozási feladatok megoldása szimplex módszerrel. Pécsi Tudományegyetem PTI

Operációkutatás vizsga

Metrikus terek, többváltozós függvények

GYAKORLÓ FELADATOK 4: KÖLTSÉGEK ÉS KÖLTSÉGFÜGGVÉNYEK

Struktúra nélküli adatszerkezetek

1. A k-szerver probléma

Numerikus módszerek 1.

Első zárthelyi dolgozat megoldásai biomatematikából * A verzió

Lineáris leképezések (előadásvázlat, szeptember 28.) Maróti Miklós, Kátai-Urbán Kamilla

Diszkrét matematika 2. estis képzés

Felügyelt önálló tanulás - Analízis III.

4. Fogyasztói preferenciák elmélete

Analízis I. beugró vizsgakérdések

Online migrációs ütemezési modellek

DiMat II Végtelen halmazok

A Cournot-féle duopólium

A Morra játék Módosított Morra Blöff és alullicitálás mint racionális stratégiák

MATEMATIKA 2. dolgozat megoldása (A csoport)

Játékelmélet. előadás jegyzet. Kátai-Urbán Kamilla. Tudnivalók Honlap: Vizsga: írásbeli.

Gy ur uk aprilis 11.

Diszkrét matematika I.

Lineáris egyenletrendszerek

Halmaz: alapfogalom, bizonyos elemek (matematikai objektumok) Egy halmaz akkor adott, ha minden objektumról eldönthető, hogy

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

Gépi tanulás a gyakorlatban. Lineáris regresszió

Matematikai statisztika 1.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

HALMAZELMÉLET feladatsor 1.

Átírás:

Játékelmélet és hálózati alkalmazásai 2. ea Csercsik Dávid ITK PPKE Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 1 / 37

1 Nevezetes normál formájú játékok Iteráció Szigorúan dominált stratégiák iteratív kiküszöbölése Dominancia Játékok tulajdonságai Egzisztencia és unicitás Kevert stratégiák Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2 / 37

Definíciók I Játékosok: N = {1,..,n} Stratégiahalmazok: S 1,...,S n (teljes) stratégiatér: ezek szorzata - S = S 1... S n kifizetőfüggvények: f i : S R, i = 1,..,n G = {S 1,...,S n ; f 1,...,f n } Olyan játékok ahol S i -k végesek: véges játékok 2 játékos esetén mindkét játékos kifizetőfüggvénye megadható egy n-dim mátrixal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 3 / 37

Fogolydilemma 1. fogoly 2. fogoly N V N (-2,-2) (-10,-1) V (-1,-10) (-5,-5) táblázat: Fogolydilemma kifizetési bimátrixa. V: vall, N: Nem vall Az 1. fogoly nem tudja mit fog csinálni a másik, de a V stratégia választásával mindkét esetben jobban jár. (A 2. ue.) "szigorúan dominált stratégiák kiküszöbölése" Itt egyértelmű Nash-egyensúly (NE) -ra vezet. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4 / 37

Nemek harca fiú lány Wellhello Blind Myself Wellhello (1,2) (0,0) Blind Myself (0,0) (2,1) táblázat: Nemek harca játék kifizetési bimátrixa Itt két NE is van, ha mindketten a Wellhellot vagy mindketten a Blind Myself-et választják. Tegyük most fel, hogy valójában a Wellhellot szeretik mindketten jobban, ez 2-2, a Blind Myself pedig 1-1 egység örömöt szerez. Ekkor is mindkét azonos választás Nash-egyensúlyban van, annak ellenére, hogy a Blind Myself a teljes haszon tekintetében egyértelműen rosszabb (Pareto-szuboptimális - akkor lenne Pareto optimális ha nem létezne olyan alternatíva ami az egyik játékos kifizetését javítja és a másikét nem rontja). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 5 / 37

Héja-galamb játék (hawk and dove game) A fogolydilemmához hasonló héja-galamb játék konfliktushelyzetek modellezését célozza (kocsmai verekedések, háborúk, biológiában különböző fajok vetélkedése stb.). Mindkét félnek két stratégiája van, a provokáló (héja) és a kompromisszumkereső (galamb). héja galamb héja (0,0) (4,1) galamb (1,4) (3,3) táblázat: Héja-galamb játék kifizetési bimátrixa A játék másik elnevezése a gyáva nyúl : amikor egy keskeny egyenes úton egymással szembe indul két autós. Amelyik előbb félrerántja a kormányt, az gyáva nyúl, gúny és megvetés tárgya. Ha viszont egyik sem rántja félre, akkor két bátor halottal lesz gazdagabb a helyi legendárium. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 6 / 37

Iterált fogolydilemma 1979-ben és 1982-ben is versenyt írtak ki az iterált Fogolydilemma kapcsán. Iterált stratégiát megvalósító programokat kellett beküldeni, és ezeket eresztették össze fix számú körben. A világ minden tájáról érkeztek különböző, akár igen nagy bonyolultságú megoldások, ámde mindegyiken felülkerekedett Anatol Rapoport szociológus Tit-for-Tat (TFT) stratégiája - Szemet-Szemért: az első körben kooperálunk, később pedig azt tesszük, amit ellenfelünk tett az előző körben. Később a versenyeket kiíró Robert Axelrod még további két analízissel igazolta a TFT stratégia hatékonyságát/ésszerűségét az iterált Fogolydilemma esetében: (1) végzett egy úgynevezett ökológiai analízist, ahol egy végtelen méretű populáció az eredeti versenyekben résztvevő programokból alkotott adott arányú részpopulációinak alakulását vizsgálta, feltéve, hogy ezek mérete (pontosabban a teljes populációhoz viszonyított arányuk) függ az átlagos hasznuktól, amit egy-egy körben nyernek. Itt is a TFT részpopuláció jött ki győztesként. A másik kísérlet, (2) evolúciós analízis címen vált ismertté. Itt Axelrod egy genetikus algoritmushoz hasonló környezetet konstruált, és azon belül evolvált bináris kromoszómák (génszekvenciák) által kódolt iterált stratégiákat. Ezeket vetette körről körre, generációról generációra össze, és a sikeresebbek örökítődhettek tovább. Ennél a kísérletnél is a TFT-hez igen hasonló tulajdonságokkal rendelkező iterált stratégiát kódoló génszekvencia jött ki eredményül. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 7 / 37

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 8 / 37

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Az 1. játékos egyik stratégiája sem dominálja szigorúan a másikat, de a 2. játékos K stratégiája szigorúan dominálja J-t elhagyjuk. A megmaradt mátrixban F szigorúan dominálja L-et, az így megmaradtban pedig K dominálja B-t. (F,K) "Szigorúan dominált stratégiák iteratív kiküszöbölése" Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 9 / 37

Nullösszegű játékok Minden A valós mátrix definiál egy játékot, ahol a sorjátékos az egyik sort, az oszlopjátékos az egyik oszlopot választja, és a sorjátékos nyereménye a választott sor és oszlop találkozásában levő a ij elem, míg az oszlopjátékosé a ij. A mátrix - kifizetési mátrix, A mátrix sorai/oszlopai - a sor/oszlop játékos tiszta stratégiái, pl (feltűntetve a minimális nyereséget és a maximális veszteséget): A = 0 1 0 3 3 2 1 2 1 3 0 1 3 3 1 3-1 0-1 0 3 1 3 2 1 2 0 1 3 0 1 Ha a sorjátékos a második sort választja, az oszlopjátékos pedig a harmadik oszlopot, akkor garantált, hogy a sor legalább 1-et nyer, de az is, hogy többet nem. Azaz ezek megjátszását optimális illetve egyensúlyi stratégiáknak tekinthetjük. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 10 / 37

Nullösszegű játékok II: A nyeregpont Jelentse m i az i-edik sor minimumát, M j pedig a j-edik oszlop maximumát, azaz m i = mina ij, M j = max j i a ij Legyen továbbá Ekkor m = maxm i és M = minm j i j m M (a minimumok maximuma a maximumok minimuma) Ha m = M akkor r,s hogy a rs = m = M (ez a mátrix nyeregpontja) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 11 / 37

Cournot-duopólium Egy folytonos példa Egy iparág, két meghatározó vállalat, melyek egy homogén terméket állítanak elő. Stratégiák: termelési volumenek. Adott az inverz keresleti függvény, amely az iparág össztermeléséhez rendeli hozzá azt a legmagasabb árat, amelyen a piac kiürül. Adott a vállalatok (azonos) költségfüggvénye. Definiáljuk azt a játékot ahol a kifizetőfüggvények a bruttó nyereségek (a költségekkel csökkentett árbevétel). Tfh: az inverz keresleti függvény és a költségfüggvény lineáris. Ha q 1 és q 2 jelölik a két vállalat (nemnegatív) termelési volumenét, akkor az i játékos kifizetőfüggvénye: f i (q 1,q 2 ) = q i p(q 1,q 2 ) C(q i ) p(q 1,q 2 ) = max{a b(q 1 +q 2 ), 0} C(q i ) = cq i, a,b,c > 0, a > c, i = 1, 2 c - termelési költség, q i - termelt mennyiség, p - a termék ára 0 termelési volumen 0 nyereség. Túl nagy termelési volumen veszteség, függetlenül attól, mekkora termelést választ a másik. NE-t lásd később. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 12 / 37

Dominancia S i : Azon stratégiaprofilok halmaza, amik nem tartalmazzák az i játékos stratégiáját. (csonka stratégiaprofilok) ha s i S i akkor s = (s i,s i ) az a stratégiaprofil ahol az i játékos az s i stratégiáját, míg a többiek s i -t játszák. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben s i és t i S i az i játékos két stratégiája. s i szigorúan dominálja t i -t ha gyengén dominálja ha f i (s i,s i ) > f i (t i,s i ) s i S i Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 13 / 37

Nash-egyensúly Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt Nash-egyensúlypontnak (NEP v NE) nevezünk, ha f i (s i,s i) f i (s i,s i) s i S i i = 1,...,n vegyük észre hogy egyszerre csak 1 játékos válthat stratégiát Definíció Az s S stratégiaprofilt domináns Nash-egyensúlypontnak (DNEP) nevezünk, ha f i (s i,s i ) f i (s i,s i ) s S i = 1,...,n "függetlenül attól hogy a másik mit játszik, én a DNEP-hez tartozó stratégiával járok jobban" - minden játékosra pl a fogolydilemmában a (V,V) DNEP, a nemek harcában a (W,W) nem DNEP. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 14 / 37

Erős Nash-egyensúly (N>2) esetén érdekes. Koalíció: játékosok egy halmaza. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt erős Nash-egyensúlypontnak (SNE) nevezünk, ha s NE, és C 2 N f i (s C,s C ) f i(s C,s C ) i C &( j C) (f j (s C,s C ) < f j(s C,s C )) Az erős Nash-egyensúly (SNE - Strong Nash Equilibrium) egy olyan NE, amire igaz hogy nem létezik olyan koalíció ami ha koordináltan változtatja meg a stratégiáját - a többiek változatlan döntése mellett - akkor azzal minden tagja jobban jár (és legalább egyikük szigorúan). Szemben a NE unilaterális deviációival, az SNE koalíciós elhajlást is megenged. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 15 / 37

Erős Nash-egyensúly: Ellenpélda Legyen S 1 = {F,L}, S 2 = {B,J}, S 1 = {E,H} P3 : S 3 = E P3 : S 3 = H P1 P2 B J F (2,2,2) (3,1,0) L (0,1,3) (1,2,3) P1 P2 B J F (1,4,1) (0,0,0) L (3,0,3) (2,1,-1) S=(F,B,E) NE (unilaterális deviációkra stabil), de C = {1, 3} hogy T=(L,B,H) esetén f i (T) > f i (S) i C Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 16 / 37

Felcserélhetőség Definíció Ha s = (s 1,...,s n ) és t = (t 1,...,t n ) a G = {S 1,...,S n ; f 1,...,f n } játék két NEP-je és u = (u 1,...,u n ) u i {s i,t i } i = 1,...,n szintén NEP akkor s és t felcserélhetőek. Ha G-nek csak egyetlen NEP-je van vagy 2 NEP-je felcserélhető, akkor G rendelkezik a felcserélhetőségi tulajdonsággal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 17 / 37

Antagonizmus Definíció A G = {S 1,S 2 ;f 1,f 2 } kétszemélyes játékot antagonisztikusnak nevezzük, ha s 1,t 1 S 1 és s 2,t 2 S 2 stratégiapárosra f 1 (s 1,s 2 ) f 1 (t 1,t 2 ) f 2 (s 1,s 2 ) f 2 (t 1,t 2 ) (ha átmegyünk t-ből s-be, az első játékos kifizetése pontosan akkor nő ha a másodiké csökken) Antagonisztikus játékokban a játékosok érdekei ellentétesek. A konstans összegű játékok (f 1 +f 2 = c) antagonisztikusak, de nem minden antagonisztikus játék konstans összegű. Tétel Minden antagonisztikus játék rendelkezik a felcserélhetőségi tulajdonsággal, és minden NEP-ben mindkét játékos kifizetőfüggvényének értéke azonos (nem a két játékosra, hanem a két NEP-ra vonatkozva). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 18 / 37

Nash halmaz, stratégiai ekvivalencia E. = G = {S 1,...,S n ; f 1,...,f n } NEP-jei. e f iff ha e és f E felcserélhetőek. A reláció reflexív, szimmetrikus de nem tranzitív. Definíció Az E egy olyan D részhalmazát, amelyre d 1,d 2 D esetén d 1 d 2 Nash-halmaznak nevezzük. Ha egy Nash-halmaz nem valódi részhalmaza egyetlen Nash-halmaznak sem, akkor maximális Nash-halmaznak hívjuk. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n } H = {S 1,...,S n ; g 1,...,g n } G és H stratégiailag ekvivalens, ha NEP-jaik halmaza megegyezik. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 19 / 37

3 tétel Tétel G = {S 1,...,S n ; f 1,...,f n } játék esetén ha ϕ i : R R szig. mon. növő minden i-re, akkor a H = {S 1,...,S n ; ϕ 1 f 1,...,ϕ n f n } játék stratégiailag ekvivalens G-vel. Tétel A G = {S 1,...,S n ; f 1,...,f n } játék játékban a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen NEP-et sem vesztünk el. Tétel Ha a G = {S 1,...,S n ; f 1,...,f n } játék véges, és a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen s stratégiaprofil marad, akkor s a G játék egyetlen NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 20 / 37

Egzisztencia I Érmepárosítás: ha megegyezik az oldal az 1. játékos nyer (és vica versa). Véges, 2 személyes, 0 összegű játék. játékos 2 Fej Írás játékos 1 Fej (1,-1) (-1,1) Írás (-1,1) (1,-1) táblázat: Érmepárosítási játék kifizetési bimátrixa Nincs NEP. G = {S 1,...,S n ; f 1,...,f n }, legyen most S i R ki (elég véges dimenzióra kimondani) Recall: NEP: f i (s i,s i ) f i(s i,s i ) s i S i i = 1,...,n Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 21 / 37

Best-response function Definíció Az i játékos B i : S 2 Si legjobbválasz-leképzése B i (s) = {t i S i f i (t i,s i ) f i (r i,s i ), r i S i } B i (s) az i-ik játékos legjobb stratégiáit tartalmazza, ha a többi játékos az s i csonka stratégiaprofilban szereplő stratégiákat játsza. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 22 / 37

Legjobbválasz-leképzés - példa Közlegelők problémája ("Tragedy of the commons"): 2 parasztnak van 3-3 tehene.. tehenek száma a legelőn liter tej/tehén 2 4 3 3 4 2 5 1 6 0 1. játékos 2. játékos 1 2 3 1 (4,4) (3,6) (2,6) 2 (6,3) (4,4) (2,3) 3 (6,2) (3,2) (0,0) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 23 / 37

Egzisztencia II Definíció Az egész játékra vonatkozó B : S 2 S B(s) = B 1 (s)... B n (s) vagyis t B iff t i B i (s) i = 1,...,n Az s S stratégiaprofil akkor és csak akkor NEP-ja a G játéknak, ha s fixpontja a B legjobbválasz-leképzésnek, vagyis ha s B(s ) Tétel Legyen G = {S 1,...,S n ; f 1,...,f n } normál formában megadott játék, ahol a stratégiahalmazok véges dimenziós euklideszi terek nemüres, konvex, kompakt részhalmazai, és a kifizetőfüggvények folytonosak a stratégiaprofilok S halmazán. Ha a G játékra vonatkozó B legjobbválasz-leképzés egyértékű, akkor G-nek van legalább egy NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 24 / 37

Cournot-duopólium III f i (q 1,q 2 ) = q i p(q 1,q 2 ) c(q i ) p(q 1,q 2 ) = max{a b(q 1 +q 2 ), 0} Ha a második vállalat kibocsátása q 2, az első vállalat legjobb válasza erre az f 1 (q 1 ) = q 1 (a b(q 1 +q 2 )) cq 1 = aq 1 bq 2 1 bq 1 q 2 cq 1 kvadratikus kifizetésfüggvényt maximalizáló q 1 : df 1 (q 1 ) dq 1 = a 2bq 1 bq 2 c = 0 q 1 = a c 2b q 2 2 A legjobb válasz az egyik játékos q i kibocsátására max{ a c legjobbválasz-leképzés egyértelmű (vagyis egy függvény). 2b qi 2, 0} és a Fixpont (duopólium): q 1 = q 2 = q = a c 2b q a c 2 q = 3b a szimmetria miatt az egész iparág kibocsátása qtot D = 2(a c) 3b, az ár pedig p D = a+2c 3 Monopol kibocsátás (q1 M = q 1 ha q 2 = 0): a c 2b, monopolár: pm = a+c 2 p D < p M, qtot D > qm TOT Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 25 / 37

Mi a baj a NEP-al? Tekintsük ismét a közlegelők problémáját: Adott egy közlegelő amely 10 tehenet tud eltrartani úgy hogy ekkor mindegyik tehén 10 l tejet ad (egységnyi idő alatt). Az egyik gazda gondol egyet és kiküld még egy tehenet a legelőre egy-egy tehénnek már kevesebb fű jut, ezért mindegyik csak 9 l tejet ad. Viszont az a gazda amelyik 2 tehenet legeltet 2*9=18 l tejhez jut. Ezt észreveszi egy másik gazda is, ő is kiküld még egyet még kevesebb fű jut a teheneknek, egy tehén már csak 8 l tejet ad, de a 2 dezertőrnek 16 l teje lesz. Mikor már 8 gazda tart 2 tehenet, ők 2*(10-8)=4 l tejet kapnak, a 9-ik gazda nem nyer semmit a 2. tehénnel. Ha egy gazda úgy dönt hogy visszavonja az egyik tehenét, rosszabbul jár. Annyi Nash-egyensúly van, ahány féleképpen 10-ből el tudunk hagyni 2-őt = 10 alatt a 2=45. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 26 / 37

Unicitás Definíció A G = {S 1,...,S n ; f 1,...,f n } játék pontosan akkor konkáv ha az S = S 1,...,S n stratégiahalmazok kompaktak és konvexek, és az f i (s i,s i ) függvény konkáv s i -ben rögzített s i mellett i-re Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 27 / 37

Példa Cournot-duopólium. S i = [0, 1], c : [0, 1] R, c(x) = 1 2x, p : [0, 2] R p(q TOT ) = { 7 4 1 2 q TOT ha 0 q TOT 3 2 5 2 q TOT egyébként A profitfüggvéynek: f i : [0, 1] 2 R, f i (x 1,x 2 ) = x i p(x 1 +x 2 ) 1 2 x i, i {1, 2} Elemi számolással igazolható hogy f i szigorúan konkáv fv-e x i -nek a [0, 1] intervallumon. Ugyancsak belátható hogy az X 1 = {(x 1,x 2 ) 2 x 1 1 1, 2 x 2 1, x 1 +x 2 = 3 2 } halmaz minden eleme NEP (hf). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 28 / 37

Unicitás II Tétel Legyen G = {S 1,...,S n ; f 1,...,f n } konkáv játék, és tegyük fel hogy a B legjobbválasz-leképzés egyértékű. Ha a B függvény kontrakció, akkor G-nek csak egy egyensúlypontja van. f a d távolságfüggvénnyel ellátott M metrikus téren kontrakció ha ( 0 k < 1)( (x,y) M)(d(f(x),f(y)) kd(x,y)) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 29 / 37

Kevert stratégiák Neumann János 1928 Adott valószínűséggel játszhatunk 1 adott stratégiát. i N egy kevert stratégiája q i Q ahol (s j S i ) q i (s j ) > 0 és s j S i q i (s j ) = 1 (q i (s j ) egy függvény ami az i-ik játékos minden lehetséges stratégiájához egy valószínűséget rendel - tiszta: q i (s j ) = 1 csak 1 j esetén, a többire 0) Kevert stratégia kombinációk kifizetőfüggvények várható értékek: q = (q 1,...,q n ) Q = Q 1... Q n Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 30 / 37

Kevert stratégiák - példa: nullösszegű játék p - annak a valsége hogy Peti Down the line -t szervál (CC - cross court) q - annak a valsége hogy Jani DL-re számítva helyezkedik Jani q-mix DL (q) CC (1 q) DL (p) (50,50) (80,20) 50q+80(1-q) Peti CC (1 p) (90,10) (20,80) 90q+20(1-q) p-mix 50p+10(1-p) 20p+80(1-p) Peti optimális p választása: válasszuk meg p-t úgy, hogy Jani ne preferálhassa egyik tiszta stratégiáját sem! 50p + 10(1 p) = 20p + 80(1 p) p=0.7 Jani sikerrátája = 50 0.7+10 0.3 = 20 0.7+80 0.3 = 38% Petié = 62% Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 31 / 37

Kevert stratégiák - példa: nullösszegű játék/2 Jani q-mix DL (q) CC (1 q) DL (p) (50,50) (80,20) 50q+80(1-q) Peti CC (1 p) (90,10) (20,80) 90q+20(1-q) p-mix 50p+10(1-p) 20p+80(1-p) Jani optimális q választása: válasszuk meg q-t úgy, hogy Peti ne preferálhassa egyik tiszta stratégiáját sem! 50q + 80(1 q) = 90q+20(1 q) q=0.6 Peti sikerrátája = 62% Janié = 38% Ha pl p = 0.7, q = 0.5, Jani kifzetése = 0.7 0.5 50+0.7 0.5 20+0.3 0.5 10+0.3 0.5 80 = 38 Mindegy! Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 32 / 37

Kevert stratégiák - példa: nullösszegű játék/3 Jani q-mix DL (q) CC (1 q) DL (p) (50,50) (80,20) 50q+80(1-q) Peti CC (1 p) (90,10) (20,80) 90q+20(1-q) p-mix 50p+10(1-p) 20p+80(1-p) p = 0.5, q = 0.5 Jani kifzetése = 0.5 0.5 50+0.5 0.5 20+0.5 0.5 10+0.5 0.5 80 = 40 p = 0.5, q = 0.7 Jani kifzetése = 0.5 0.7 50+0.5 0.3 20+0.5 0.7 10+0.5 0.3 80 = 36 p = 0.5, q = 0.3 Jani kifzetése = 0.5 0.3 50+0.5 0.7 20+0.5 0.3 10+0.5 0.7 80 = 44 Ha Peti p = 0.5-öt játszik p = 0.7 helyett, Jani-nak van értelme preferálnia a CC stratégiát. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 33 / 37

Kevert stratégiák - példa: nullösszegű játék/4 ábra: Legjobbválasz-függvények Jani és Peti esetében Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 34 / 37

Kevert stratégiák - példa: nullösszegű játék/5 1 0.6 q 0 0 p 0.7 1 Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 35 / 37

Kevert Nash egyensúly q = (q 1,...q n) kevert NE ha ( i N)( q i Q i )f i (q i,q i ) f i(q i,q i ) Tétel Nash, 1951: Ha az n személyes játék tiszta stratégiahalmazai végesek, akkor a keveréssel létrejövő halmazok szorzatán defniált játéknak van legalább egy kevert egyensúlya. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 36 / 37

Kevert stratégiák - nemek harca (nem nullösszegű) Tekintsük ismét a nemek harca játékot: fiú lány Welhello Blind Myself Wellhello (1,2) (0,0) Blind Myself (0,0) (2,1) táblázat: Nemek harca játék kifizetési bimátrixa A randomizált NE: Fiú: q(wellhello)= 2/3, q(blind Myself)= 1/3 Lány: q(wellhello)= 1/3, q(blind Myself)= 2/3. Várható kifizetés: (2/3, 2/3), ami igazságos, de alacsonyabb mint a determinisztikus NE esetén. (pl fiú: 1 2 3 3 1+ 2 1 3 3 2 = 2 9 1+ 2 9 2 = 6 9 = 2 3 ) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 37 / 37