Nem-kooperatív játékok

Hasonló dokumentumok
Rasmusen, Eric: Games and Information (Third Edition, Blackwell, 2001)

Döntési rendszerek I.

Universität M Mis is k k olol ci c, F Eg a y kultä etem t, für Wi Gazda rts ságcha tudft o sw máis n s yen i scha Kar, ften,

Mikroökonómia I. B. ELTE TáTK Közgazdaságtudományi Tanszék. 12. hét STRATÉGIAI VISELKEDÉS ELEMZÉSE JÁTÉKELMÉLET

Közgazdaságtan I. 11. alkalom

Játékelmélet. előadás jegyzet. Kátai-Urbán Kamilla. Tudnivalók Honlap: Vizsga: írásbeli.

2015/ Szegedi Tudományegyetem Informatikai Intézet

KÖZGAZDASÁGTAN. Játékelmélet Szalai László

JÁTÉKELMÉLETTEL KAPCSOLATOS FELADATOK

Kétszemélyes játékok

Döntési rendszerek I.

PIACI JÁTSZMÁK. Bevezető Közgazdaságtan Tanszék

PIACI JÁTSZMÁK. Fiú. Színház. Színház (4 ; 2) (0 ; 0) A38 (0 ; 0) (2 ; 4) Lány

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

Mátrixjátékok tiszta nyeregponttal

A stratégiák összes kombinációján (X) adjunk meg egy eloszlást (z) Az eloszlás (z) szerint egy megfigyelő választ egy x X-et, ami alapján mindkét

Mesterséges Intelligencia MI

Játékelmélet Elméleti segédlet

Döntéselmélet KONFLIKTUSELMÉLET

Játékelmélet és hálózati alkalmazásai 2. ea

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 1 / 31

PIACI JÁTSZMÁK. Bevezető Szalai László

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

V. Kétszemélyes játékok

11. Előadás. Megyesi László: Lineáris algebra, oldal. 11. előadás Kvadratikus alakok, Stratégiai viselkedés

Kiszorító magatartás

f B B 1 B 2 A A 2 0-1

TÁRGYMUTATÓ. Á állam (17, 19, 118, 123, 133, 152, 160, 181) állandó összegő játék/interakció (49, 94)

N-személyes játékok. Bársony Alex

Mesterséges Intelligencia MI

Debreceni Egyetem Informatikai Kar JÁTÉKELMÉLET

REKLÁMPSZICHOLÓGIA. 1/a. TÁRSTUDOMÁNYOK és ÚJ TUDOMÁNYÁGAK

Mesterséges Intelligencia alapjai

Játékelméleti alapvetés - I

Horváth Jenőné dr. * A RACIONALITÁS PROBLÉMÁJA ÉS A JÁTÉKELMÉLET LEGÚJABB EREDMÉNYEI

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Döntéselmélet II. ELŐADÁS DÖNTÉSI FOLYAMAT

A Morra játék Módosított Morra Blöff és alullicitálás mint racionális stratégiák

Nyerni jó évfolyam

Monoton Engedmény Protokoll N-M multilaterális tárgyalás

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Ismételt játékok: véges és végtelenszer. Kovács Norbert SZE GT. Példa. Kiindulás: Cournot-duopólium játék Inverz keresleti görbe: P=150-Q, ahol

Játékelmélet és stratégiai gondolkodás

Agrárstratégiai irányok játékelméleti alapokon

Mészáros József. Játékelmélet

Mesterséges intelligencia 3. laborgyakorlat

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4. ea 1 / 21

Matematikai érdekességek a mindennapokban

Az előadásokat és a gyakorlatokat pénteken az M 316 tanteremben tartjuk. Az előadás időpontja: , a gyakorlat időpontja:

Operációkutatás vizsga

Opkut deníciók és tételek

1. feladat Az egyensúly algoritmus viselkedése: Tekintsük a kétdimenziós Euklideszi teret, mint metrikus teret. A pontok

Bonyolult jelenség, aminek nincs jó modellje, sok empirikus adat, intelligens (ember)ágens képessége, hogy ilyen problémákkal mégis megbirkozzék.

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelméleti bevezető, Cournot- és Bertrandoligopólium

PIACI JÁTSZMÁK. Kereskedelempolitikai játszmák Vígh László

Gondolkodási módszerek 2.5 Versengés, vagy kooperáció Stratégiai játékok (csapdák, dilemmák)

Alkuegyensúlyok és stabil halmazok

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelmélet, Cournot- és Bertrand-oligopólium

Mikroökonómia II. ELTE TáTK Közgazdaságtudományi Tanszék. 8. hét PIACELMÉLET ÉS MARKETING, 2. rész

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Operációkutatás vizsga

1000 forintos adósságunkat, de csak 600 forintunk van. Egyetlen lehetőségünk, hogy a

További forgalomirányítási és szervezési játékok. 1. Nematomi forgalomirányítási játék

JÁTÉKELMÉLETI MAGYARÁZAT A KÖZJÓSZÁGOK LÉTREJÖTTÉNEK ELMARADÁSÁRA

Játékelmélet 1. Forgó Ferenc Pintér Miklós Simonovits András Solymosi Tamás. (elektronikus jegyzet)

Változatos Véletlen Árazási Problémák. Bihary Zsolt AtomCsill 2014

Mikro- és makroökonómia. Monopolisztikus verseny, Oligopóliumok Szalai László

Elméleti evolúcióbiológia. Kispál András (EYQ0NP) Fizika BSc. II. évfolyam

BEVEZETÉS A JÁTÉKELMÉLETBE: VÁZLAT. MTA Közgazdaságtudományi Kutatóközpont Budapest, Budaörsi út 45, simonov@econ.core.hu május 6.

A klasszikus közgazdaságtanon innen és túl, avagy az érem másik oldala

Intelligens ágensek. Mesterséges intelligencia február 28.

Diszkrét matematika 2.

MIKROÖKONÓMIA II. Készítette: K hegyi Gergely. Szakmai felel s: K hegyi Gergely február

Nagy Péter: Fortuna szekerén...

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

1. Előadás Lineáris programozás

ULTIMATE TIC TAC TOE. Serfőző Péter

Operációkutatás vizsga

Kooperáció és intelligencia kis HF-ok/ Kooperáció és intelligencia, Dobrowiecki T., BME-MIT 1

Tóth I. János Játékelmélet és történelem

GEOMATECH TANULMÁNYI VERSENYEK ÁPRILIS

A Borda-szavazás Nash-implementálható értelmezési tartományai

Magyar Tudomány. játékelmélet Vendégszerkesztő: Simonovits András. Gothard Jenő ( ) Madárevolúció Válság és rendszertudomány

Tanulás elosztott rendszerekben/3

Sarokba a bástyát! = nim

Számítógépes döntéstámogatás. Döntések fuzzy környezetben Közelítő következtetések

TASNÁDI ATTILA ADAGOLÁSI SZABÁLYOK ÉS BERTRAND-EDGEWORTH OLIGOPÓLIUMOK


Közgazdasági elméletek. Dr. Karajz Sándor Gazdaságelméleti Intézet

Döntési módszerek Tantárgyi útmutató

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

1. számú melléket: Módosítások 2011

A lineáris programozás alapjai

Mikroökonómia elıadás

Kvantitatív módszerek

GAZDASÁGSZOCIOLÓGIA I.

Működjünk együtt? Stratégiai helyzetek vizsgálata és tervezése

Döntési rendszerek I.

[Biomatematika 2] Orvosi biometria

Átírás:

Nem-kooperatív játékok

Versengő ágensek konfliktusai játékelmélet Cselekvéseivel mások cselekvéseinek hatását befolyásolják. Ettől a cselekvések (mind) várható haszna meg fog változni. A változás az én cselekvésem - de a te cselekvésed is a függvénye. Egy jó matematikai modell - megjósolhassuk, - megtervezhessük. 2011

Matematikai modellek A kölcsönös jólét és befolyásásának jellemzése: Normál alak (stratégiai alak) Játék Stratégiák és kombinációi Haszonfüggvények Payoff mátrix Γ N,{S },{u } S s i i N i i N N= { 1,2,,n} 1,s 2,,s n s 1 S 1,s 2 S 2,,s n S n i N re u i :S Extenzív alak (játékfa alak)

A1 Csökkenti A2 Nem Csökkenti R-F, R-F R-F-P, R-P Nem R-P, R-F-P R-2P, R-2P R = 100 F = 30 P = 20 P = 40 Csökkenti Nem Csökkenti 70, 70 50, 80 Nem 80, 50 60, 60 Csökkenti Nem Csökkenti 70, 70 30, 60 Nem 60, 30 20, 20 2011

Csökkenti Nem Csökkenti 70, 70 50, 80 Nem 80, 50 60, 60 Szimmetria S1 S2 Sn i N, s S, és permutáció esetén n 2, S 1 = S 2, s S- re u 1(s 1,s 2) u 2(s 2,s 1) Zérus-összeg s S-re u (s) 0 Racionális játékosok = önérdekű = magánzó = profit-orientált = Kölcsönös tudás 2011 u (s,s,,s ) u (s,s,,s ) i 1 2 n i 1 2 n i N i

Csökkenti Nem Csökkenti 70, 70 50, 80 Nem 80, 50 60, 60 Tiszta stratégia Stabil stratégia a változó körülmények miatt játékos ne akarjon stratégiát váltani Domináns stratégia s S i i N, s,s S, s s, ha * * i i i i i s (s,s,,s,s,...,s ) S S i 1 2 i 1 i 1 n i j j N, j i u (s,s ) u (s,s ) * i i i i i i s S, u (s,s )>u (s,s ) * -i -i i i -i i i -i 2011

q 2 (Csökkenti) Csökkenti q 2 (Nem) Nem Csökkenti 70, 70 50, 80 Nem 80, 50 60, 60 q 1 (Csökkenti) q 1 (Nem) Kevert stratégia (tiszta q (s ) 1 ) Kevert stratégia kombináció Haszonfüggvény 2011 i i i N, qi Q i (S i) s S, q (s ) 0, és q (s ) 1 i i i i i i s S q (q 1,q 2,,q n) Q Q1 Q2 Qn i N, u i :Q, q Q u i(q) q 1(s 1) q 2(s 2) q n(s n) u i(s) s (s,s, 1 2 n,s ) S i i

Mely stratégia(pár)? Mely megoldás? Maxmin stratégia (általánosságban nem stabil) q max min u(q,q ), q min max u(q,q ) 1 q Q q Q 1 2 2 q Q q Q 1 2 1 1 2 2 2 2 1 1 (Neumann, 1928) Ha egy 2-személyes zéró-összegű játékban teljesül a minimax-feltétel, akkor a játéknak van nyeregpontja (egyensúlya), és a játék értéke a minimax-feltétel két oldalán álló kifejezés közös értéke. * * * * min u(q,q ) u(q,q ) max u(q,q ) 1 2 1 2 1 2 q Q q Q 2 2 1 1 2011

Maxmin stratégia MAX MIN 2011

Mely stratégia(pár)? Mely megoldás? Domináns stratégia u (s,s ) u (s,s ) * i i i i i i Dominált stratégiák iterált eliminációja 1 2 x y z u (6, 3) (1, 5) (0, 6) v (1, 7) (2, 8) (2, 6) Általában nincs. Dominált stratégiák iterált eliminációja (u,v)(x,y,z) játékban y dominálja x-et, (u,v)(y,z) játékban v dominálja u-t, (v)(y,z) játékban y dominálja z-t, (v,y) domináló. 2011

Mely stratégia(pár)? Mely megoldás? Szociális jólét stratégia 2 x y z 1 s arg max u (s) s s i 2 x y z 1 u (6, 3) (1, 5) (0, 6) v (1, 7) (2, 8) (2, 6) Stabilitás? u (9) (6) (6) v (8) (10) (8) (és ha nem (2,8), hanem (-10,20)?) Pareto-optimális (hatékony) (u,x), (v,y) Több is lehet. Stabilitás? {s ( u (s') u (s) u (s) u (s'))}, s s i i i j i j j 2011

Mely stratégia(pár)? Mely megoldás? s (s,s,,s ) S * * * * 1 2 n 2 Megy Vár 1 Nash-egyensúly i N, s S, u (s,s ) u (s,s ) * * * i i i i -i i i -i q (q,q,,q ) Q * * * * 1 2 n Megy (0, 1) (3, 2) Általában több is lehet. Koordináció? 2011 Vár (2, 3) (2, 1) kevert Nash-egyensúly * * * * * * q (q,q,,q,q,...,q ) qi Qi i 1 2 i 1 i 1 n i N, q Q, u (q,q ) u (q,q ) * * * i i i i -i i i -i * * * * * * i arg max i 1 2 i 1 i i 1 n i, q u (q,q,,q,q,q,,q ) (Nash, 1951): Ha az n-személyes játék tiszta stratégiahalmazai végesek, akkor a játéknak van legalább egy kevert Nash egyensúlya. (tiszta stratégia is egy kevert stratégia!).

2 1 Megy Vár Megy (0, 1) (3, 2) Vár (2, 3) (2, 1) 2 1 Megy r Vár 1-r Megy p (0, 1) (3, 2) Vár 1-p (2, 3) (2, 1) Nash-egyensúly Minden oszlopban (a 2. minden stratégiájára) hol van az 1. hasznának a maximuma? Ha abban a sorban (1. stratégia) és oszlopban (2. stratégia) a 2. haszna sor-maximális = NE. Kevert Nash-egyensúly A q* stratégia-egyűttes akkor és csak akkor alkot kevert Nash-egyensúlyt, ha minden játékosnak maximális hasznot adnak a kevert stratégia pozitív valószínűséggel játszott tiszta stratégiái, azaz: u (s,q ) u (s,q ), s,s S (q ) i i i i i i i i i u (s,q ) u (s,q ), s S (q ), s S (q ) i i i i i i i i i i 0 r 3(1 r) 2r 2(1 r) r 1 3 p 3(1 p) 2p (1 p) p 2 3

Jellegzetes játéksémák Fogoly dilemma (Prisoner s dilemma) Egy súlyos bűntény kapcsán két gyanúsítottat tartóztat le a rendőrség. Mivel nem áll rendelkezésre elegendő bizonyíték a vádemeléshez, ezért elkülönítve előzetesbe helyezik őket, és mindkettejüknek ugyanazt a vádalkut kínálják. Amennyiben az egyik fogoly vall és társa hallgat, akkor az előbbinek elengedik a büntetését, míg a másik, aki hallgatott, 10 év börtönt kap. Ha az egyik tagadja meg a vallomást és a másik vall, akkor a másikat fogják elengedni és az egyik kap 10 évet. Ha egyikük sem vall, akkor egy kisebb bűntényért fejenként 1-1 évet kapnak, ha pedig mindketten vallanak, úgy fejenként 5 évet kapnak. 1 2 Vall Tagad Vall (-5,-5) (0, -10) Tagad (-10, 0) (-1, -1) Stratégiák: domináns (Vall) NE (Vall, Vall) Pareto (Tagad, Tagad) Jóléti (Tagad, Tagad) kne?? koordináció??

Jellegzetes játéksémák Gyáva nyúl (Chicken) Két autós száguld egymással szemben, és az veszít, aki előbb rántja el a kormányt. Nézzük a dolgot az ő szempontjukból: A legrosszabb eset nyilván az, ha (1) mindketten konfrontálunk, ekkor ugyanis összecsattanunk. Ennél jobb, ha (2) elrántom a kormányt, miközben a másik nem rántja el. Ekkor ugyanis életben maradok, habár a másik győz. Ennél még jobb, ha (3) a másik is elrántja a kormányt, hiszen akkor legalább nem arat győzelmet fölöttem. A legjobb eset pedig az, ha (4) a másik elrántja a kormányt, miközben én nem rántom el, és így én győzök. 1 2 Bátor Gyáva Bátor (0, 0) (3, 1) Gyáva (1, 3) (2, 2) Stratégiák: domináns?? NE (B,Gy)(Gy,B) Pareto (Gy,Gy) Jóléti (B,Gy)(Gy,B)(Gy,Gy) kne ((1/2,1/2), (1/2,1/2)) koordináció??

Jellegzetes játéksémák Nemek harca (Battle of sexes) Képzeljünk el egy házaspárt. A férj inkább focimeccsre, míg a feleség inkább operába szeretne menni, viszont inkább lennék együtt, mintsem külön. Sajnos már nincs idejük egyeztetni külön-külön kell dönteniük, hogy hová mennek: focimeccsre, vagy az operába. Mit tegyenek? 1 2 Vers. Koop. Vers. (1, 1) (3, 2) Koop. (2, 3) (0, 0) Stratégiák: domináns?? NE (K,V)(V,K) Pareto (K,V)(V,K) Jóléti (K,V)(V,K) kne ((3/4,1/4), (3/4,1/4)) koordináció??

Jellegzetes játéksémák Vezérürü (Leader) Adott egy egyirányú út, és rajta egy kereszteződés, ahol két autós áll egymással szemben, és épp arra készül, hogy felhajtson az egyirányú útra. Így gondolkoznak: Ha (1) mindketten elindulunk, akkor összeütközünk (ez a legrosszabb eset). Ennél azért egy fokkal jobb, ha (2) egyikőnk sem indul el, bár úgy időtlen időkig ebben a kereszteződésben rostokolnánk... Ha azonban (3) én várnék, és a másik indulna előbb, úgy legalább előbb-utóbb feljutnék az útra. A legjobb persze az volna, ha (4) én indulnék előbb, és a másik várna. 1 2 Megy Vár Megy (0, 0) (3, 2) Vár (2, 3) (1, 1) Stratégiák: domináns?? NE (V,M)(M,V) Pareto (V,M)(M,V) Jóléti (V,M)(M,V) kne ((1/2,1/2), (1/2,1/2)) koordináció??

Jellegzetes játéksémák Forintpárosítás (Matching pennies) Adott két játékos, akik mindketten rendelkeznek egy-egy forinttal. A forintjukat egymás elől elrejtve fejre, vagy írásra állítják, majd pedig egyszerre felmutatják. Ha mindkét forint paritása azonos (azaz fej-fej, vagy írás-írás), akkor az egyik játékos nyer, mindkét érme az övé lesz, egyébként a másik nyer. 1 2 Fej Írás Fej (1, -1) (-1, 1) Írás (-1, 1) (1, -1) Stratégiák: domináns?? NE?? Pareto (mindegyik?) Jóléti (mindegyik?) kne ((1/2,1/2), (1/2,1/2))

Jellegzetes játéksémák Kő-papír-olló (Rock-paper-scissors) r p 1-p-r q 1 2 Kő Papír Olló Kő (0, 0) (-1, 1) (1, -1) 1-q-z z Papír (1, -1) (0, 0) (-1, 1) Olló (-1, 1) (1, -1) (0, 0)

A valóság jobb modellezése ismételt játékok Iterált fogoly dilemma véges látóhatár (elvi elemzés) kis valószínűséggel a folyó kör az utolsó utolsó kör (Vall, Vall) de akkor az utolsó előttiben sem érdemes kooperálni utolsó előtti kör (Vall, Vall) első kör (Vall, Vall) egyűttműködő (Tagad, Tagad) egyensúly (Össznépi tétel) (Folk theorem) Ismételt játékokban bármely stratégia, ami nem Pareto-dominált és ahol mindegyik játékos a maxmin hasznosságánál több hasznot kap, egy elfogadható egyensúlyi stratégia.

A valóság jobb modellezése ismételt játékok Iterált fogoly dilemma Robert Axelrod első kísérletei 1979 (15 program) 1982 (62 program) Mindkettőt Anatol Rapoport nyeri a Tit-For-Tat (TFT) stratégiával Nem hagyja magát, megtorló Nem haragtartó Alapvetően együttműködő Gyorsan reagál

Dinamikus (szekvenciális) játékok extenzív formában (Racionális) játékosak véges halmaza (n) Játékfa (csúcsok játékosok, élek stratégiák címkékkel) Minden levélben a fizetések n-ese, minden játékosnak egy haszonérték Közbülső csúcsok döntési csúcsok Élek stratégiák

Dinamikus (szekvenciális) játékok extenzív formában Tökéletes információjú játékok a játék felépítése a közös tudás (common knowledge) reprezentációs eszköz: szingleton csúcsú játékfa Nem-tökéletes információjú játékok játékosok tudása más játékosokról teljes (kik azok, mik a stratégiáik, milyenek a haszonfüggvényeik), csak a konkrétan lépett stratégiájukról a tudása részleges reprezentációs eszköz: több csúcsot befogó információs halmazok Nem teljes információjú játék játékosok tudása más játékosokról nem teljes (viselkedési tipusuk, stratégiáik, haszonfüggvényeik, stb.) reprezentációs eszköz: véletlen hatása Természet játékossal és valószínűségi eloszlásával (un. Harsányi transzformáció)

Dinamikus (szekvenciális) játékok extenzív formában Opcionálisan egy fiktív játékos a Természet információs csúcshalmazok (egy-egy játékos számára)

Dinamikus (szekvenciális) játékok extenzív formában Ekvivalens megadás normál (stratégiai) alakban Extenzív forma információ többlete(!)

Dinamikus (szekvenciális) játékok extenzív formában Egyensúlyok és hiteles és hiteltelen fenyegetés

Dinamikus (szekvenciális) játékok extenzív formában Hiteles, hiteltelen fenyegetés (U,(L,L)), (D,(L,R)), (D, (R,R)) Nash-egyensúlyok nem egyformán komolyak : Ha a 2. játékos eléri a jobb információs halmazt, R-t kell játszania. Ha a 2. játékos eléri a bal információs halmazt, L-t kell játszania. A közös tudás miatt ez az 1. játékosnak ismert (várható), így neki D-t kell választania. 1. és 3. NE nem hiteles, alapjuk a 2. játékos üres fenyegetése, amit életbe bevezetni nem akar. Hátráló indukció (Zermelo, 1913): lényegében maxmin keresés kétszemélyes játékokban (MI)

Dinamikus (szekvenciális) játékok extenzív formában Hátráló indukció (Zermelo, 1913): lényegében maxmin keresés kétszemélyes játékokban (MI)

Dinamikus (szekvenciális) játékok extenzív formában Információs halmazok és rész(extenzív)játékok Részjáték-perfekt egyensúly NE hátráló terjesztése Perfekt információjú játékban mindig van tiszta részjáték-perfekt egyensúly.

Dinamikus (szekvenciális) játékok extenzív formában (6,1) (4,2) (4,2) (4,2) NE: (6,1) (1,1) (3,1)

Dinamikus (szekvenciális) játékok extenzív formában