Játékelmélet és hálózati alkalmazásai 2. ea

Hasonló dokumentumok
Játékelmélet és hálózati alkalmazásai 2. ea

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 1 / 31

Döntési rendszerek I.

2015/ Szegedi Tudományegyetem Informatikai Intézet

Rasmusen, Eric: Games and Information (Third Edition, Blackwell, 2001)

Döntési rendszerek I.

JÁTÉKELMÉLETTEL KAPCSOLATOS FELADATOK

Piaci szerkezetek VK. Gyakorló feladatok a 4. anyagrészhez

Opkut deníciók és tételek

Nem-kooperatív játékok

Mátrixjátékok tiszta nyeregponttal

Universität M Mis is k k olol ci c, F Eg a y kultä etem t, für Wi Gazda rts ságcha tudft o sw máis n s yen i scha Kar, ften,

A stratégiák összes kombinációján (X) adjunk meg egy eloszlást (z) Az eloszlás (z) szerint egy megfigyelő választ egy x X-et, ami alapján mindkét

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4. ea 1 / 21

11. Előadás. Megyesi László: Lineáris algebra, oldal. 11. előadás Kvadratikus alakok, Stratégiai viselkedés

További forgalomirányítási és szervezési játékok. 1. Nematomi forgalomirányítási játék

Mikroökonómia I. B. ELTE TáTK Közgazdaságtudományi Tanszék. 12. hét STRATÉGIAI VISELKEDÉS ELEMZÉSE JÁTÉKELMÉLET

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

PIACI JÁTSZMÁK. Bevezető Közgazdaságtan Tanszék

4. Fuzzy relációk. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

Diszkrét matematika I.

f B B 1 B 2 A A 2 0-1

Játékelmélet 1. Forgó Ferenc Pintér Miklós Simonovits András Solymosi Tamás. (elektronikus jegyzet)

Sarokba a bástyát! = nim

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Közgazdaságtan I. 11. alkalom

MIKROÖKONÓMIA - konzultáció - Termelés és piaci szerkezetek

KÖZGAZDASÁGTAN. Játékelmélet Szalai László

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelmélet, Cournot- és Bertrand-oligopólium

2014. szeptember 24. és 26. Dr. Vincze Szilvia

Agrárstratégiai irányok játékelméleti alapokon

PIACI JÁTSZMÁK. Fiú. Színház. Színház (4 ; 2) (0 ; 0) A38 (0 ; 0) (2 ; 4) Lány

PIACI SZERKEZETEK BMEGT30A hét, 1-2. óra: Játékelméleti bevezető, Cournot- és Bertrandoligopólium

1. feladat Az egyensúly algoritmus viselkedése: Tekintsük a kétdimenziós Euklideszi teret, mint metrikus teret. A pontok

MIKROÖKONÓMIA - konzultáció - Termelés és piaci szerkezetek

Játékelmélet. előadás jegyzet. Kátai-Urbán Kamilla. Tudnivalók Honlap: Vizsga: írásbeli.

A relációelmélet alapjai

Leképezések. Leképezések tulajdonságai. Számosságok.

Az előadásokat és a gyakorlatokat pénteken az M 316 tanteremben tartjuk. Az előadás időpontja: , a gyakorlat időpontja:

KOVÁCS BÉLA, MATEMATIKA I.

Közgazdaságtan. A vállalatok kínálata Szalai László

Konjugált gradiens módszer

1/ gyakorlat. Lineáris Programozási feladatok megoldása szimplex módszerrel. Pécsi Tudományegyetem PTI

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

Analízis I. beugró vizsgakérdések

Előadó: Dr. Kertész Krisztián

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

A Cournot-féle duopólium

Első zárthelyi dolgozat megoldásai biomatematikából * A verzió

Piaci szerkezetek VK. Gyakorló feladatok a 3., az 5. és a 7. anyagrészhez

A fontosabb definíciók

Operációkutatás vizsga

Mikro- és makroökonómia. Monopolisztikus verseny, Oligopóliumok Szalai László

Alkuegyensúlyok és stabil halmazok

Döntéselmélet KONFLIKTUSELMÉLET

10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai

Mészáros József. Játékelmélet

Analízis II. Analízis II. Beugrók. Készítette: Szánthó József. kiezafiu kukac gmail.com. 2009/ félév

Formális nyelvek - 9.

A változó költségek azon folyó költségek, amelyek nagysága a termelés méretétől függ.

Lineáris algebra gyakorlat

Játékelméleti alapvetés - I

TÁRGYMUTATÓ. Á állam (17, 19, 118, 123, 133, 152, 160, 181) állandó összegő játék/interakció (49, 94)

Struktúra nélküli adatszerkezetek

GYAKORLÓ FELADATOK 4: KÖLTSÉGEK ÉS KÖLTSÉGFÜGGVÉNYEK

Lineáris egyenletrendszerek

Diszkrét matematika 2.C szakirány

Klasszikus algebra előadás. Waldhauser Tamás április 28.

Online migrációs ütemezési modellek

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

Halmaz: alapfogalom, bizonyos elemek (matematikai objektumok) Egy halmaz akkor adott, ha minden objektumról eldönthető, hogy

PIACI JÁTSZMÁK. Bevezető Szalai László

Nagyordó, Omega, Theta, Kisordó

E-tananyag Matematika 9. évfolyam Függvények

A Morra játék Módosított Morra Blöff és alullicitálás mint racionális stratégiák

Nagy Gábor compalg.inf.elte.hu/ nagy

Ládapakolási játékok

0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

PIACI SZERKEZETEK BMEGT30A hét, 1. óra: Differenciált termékes Bertrand-oligopólium

Diszkrét matematika I.

A tiszta stratégiával a biztosan elérhető nyereség:

Tananyag: Kiss Béla - Krebsz Anna: Lineáris algebra, többváltozós függvények, valószínűségszámítás,

Diszkrét matematika I. gyakorlat

Lineáris algebra. (közgazdászoknak) T C T = ( 1 ) ; , D T D =

Diszkrét matematika 2.C szakirány

MIKROÖKONÓMIA II. B. Készítette: K hegyi Gergely. Szakmai felel s: K hegyi Gergely február

A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex

8. Előadás. Megyesi László: Lineáris algebra, , oldal. 8. előadás Mátrix rangja, Homogén lineáris egyenletrendszer

1/ gyakorlat. Lineáris Programozási feladatok megoldása szimplex módszerrel. Pécsi Tudományegyetem PTI

Debreceni Egyetem Informatikai Kar JÁTÉKELMÉLET

Kiszorító magatartás

Függvények határértéke, folytonossága FÜGGVÉNYEK TULAJDONSÁGAI, SZÉLSŐÉRTÉK FELADATOK MEGOLDÁSA

Funkcionálanalízis. n=1. n=1. x n y n. n=1

Hamilton rendszerek, Lyapunov függvények és Stabilitás. Hamilton rendszerek valós dinamikai rendszerek, konzerva3v mechanikai rendszerek

N-személyes játékok. Bársony Alex

1. Mondjon legalább három példát predikátumra. 4. Mikor van egy változó egy kvantor hatáskörében?

KOVÁCS BÉLA, MATEMATIKA I.

Itt és a továbbiakban a számhalmazokra az alábbi jelöléseket használjuk:

Átírás:

Játékelmélet és hálózati alkalmazásai 2. ea Csercsik Dávid ITK PPKE Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 1 / 20

1 Nevezetes normál formájú játékok Iteráció Szigorúan dominált stratégiák iteratív kiküszöbölése Dominancia Játékok tulajdonságai Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2 / 20

Definíciók I Játékosok: N = {1,..,n} Stratégiahalmazok: S 1,...,S n (teljes) stratégiatér: ezek szorzata - S = S 1... S n kifizetőfüggvények: f i : S R, i = 1,..,n G = {S 1,...,S n ; f 1,...,f n } Olyan játékok ahol S i -k végesek: véges játékok 2 játékos esetén mindkét játékos kifizetőfüggvénye megadható egy-egy mátrixal: A mátrix sorainak száma: S 1, a mátrix oszlopainak száma: S 2 Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 3 / 20

Fogolydilemma 1. fogoly 2. fogoly N V N (-2,-2) (-10,-1) V (-1,-10) (-5,-5) táblázat: Fogolydilemma kifizetési bimátrixa. V: vall, N: Nem vall Az 1. fogoly nem tudja mit fog csinálni a másik, de a V stratégia választásával mindkét esetben jobban jár. (A 2. ue.) "szigorúan dominált stratégiák kiküszöbölése" Itt egyértelmű Nash-egyensúly (NE) -ra vezet. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 4 / 20

Nemek harca fiú lány Wellhello Auróra Wellhello (1,2) (0,0) Auróra (0,0) (2,1) táblázat: Nemek harca játék kifizetési bimátrixa Itt két NE is van, ha mindketten a Wellhellot vagy mindketten a Aurórát választják. Tegyük most fel, hogy valójában a Wellhellot szeretik mindketten jobban, ez 2-2, a Auróra pedig 1-1 egység örömöt szerez. Ekkor is mindkét azonos választás Nash-egyensúlyban van, annak ellenére, hogy a Auróra a teljes haszon tekintetében egyértelműen rosszabb (Pareto-szuboptimális - akkor lenne Pareto optimális ha nem létezne olyan alternatíva ami az egyik játékos kifizetését javítja és a másikét nem rontja). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 5 / 20

Héja-galamb játék (hawk and dove game) A fogolydilemmához hasonló héja-galamb játék konfliktushelyzetek modellezését célozza (kocsmai verekedések, háborúk, biológiában különböző fajok vetélkedése stb.). Mindkét félnek két stratégiája van, a provokáló (héja) és a kompromisszumkereső (galamb). héja galamb héja (0,0) (4,1) galamb (1,4) (3,3) táblázat: Héja-galamb játék kifizetési bimátrixa A játék másik elnevezése a gyáva nyúl : amikor egy keskeny egyenes úton egymással szembe indul két autós. Amelyik előbb félrerántja a kormányt, az gyáva nyúl, gúny és megvetés tárgya. Ha viszont egyik sem rántja félre, akkor két bátor halottal lesz gazdagabb a helyi legendárium. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 6 / 20

Iterált fogolydilemma 1979-ben és 1982-ben is versenyt írtak ki az iterált Fogolydilemma kapcsán. Iterált stratégiát megvalósító programokat kellett beküldeni, és ezeket eresztették össze fix számú körben. A világ minden tájáról érkeztek különböző, akár igen nagy bonyolultságú megoldások, ámde mindegyiken felülkerekedett Anatol Rapoport szociológus Tit-for-Tat (TFT) stratégiája - Szemet-Szemért: az első körben kooperálunk, később pedig azt tesszük, amit ellenfelünk tett az előző körben. Később a versenyeket kiíró Robert Axelrod még további két analízissel igazolta a TFT stratégia hatékonyságát/ésszerűségét az iterált Fogolydilemma esetében: (1) végzett egy úgynevezett ökológiai analízist, ahol egy végtelen méretű populáció az eredeti versenyekben résztvevő programokból alkotott adott arányú részpopulációinak alakulását vizsgálta, feltéve, hogy ezek mérete (pontosabban a teljes populációhoz viszonyított arányuk) függ az átlagos hasznuktól, amit egy-egy körben nyernek. Itt is a TFT részpopuláció jött ki győztesként. A másik kísérlet, (2) evolúciós analízis címen vált ismertté. Itt Axelrod egy genetikus algoritmushoz hasonló környezetet konstruált, és azon belül evolvált bináris kromoszómák (génszekvenciák) által kódolt iterált stratégiákat. Ezeket vetette körről körre, generációról generációra össze, és a sikeresebbek örökítődhettek tovább. Ennél a kísérletnél is a TFT-hez igen hasonló tulajdonságokkal rendelkező iterált stratégiát kódoló génszekvencia jött ki eredményül. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 7 / 20

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 8 / 20

2. példa 1. játékos 2. játékos B K J F (1,0) (1,2) (0,1) L (0,3) (0,1) (2,0) Az 1. játékos egyik stratégiája sem dominálja szigorúan a másikat, de a 2. játékos K stratégiája szigorúan dominálja J-t elhagyjuk. A megmaradt mátrixban F szigorúan dominálja L-et, az így megmaradtban pedig K dominálja B-t. (F,K) "Szigorúan dominált stratégiák iteratív kiküszöbölése" Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 9 / 20

Nullösszegű játékok Minden A valós mátrix definiál egy játékot, ahol a sorjátékos az egyik sort, az oszlopjátékos az egyik oszlopot választja, és a sorjátékos nyereménye a választott sor és oszlop találkozásában levő a ij elem, míg az oszlopjátékosé a ij. A mátrix - kifizetési mátrix, A mátrix sorai/oszlopai - a sor/oszlop játékos tiszta stratégiái, pl (feltüntetve a minimális nyereséget és a maximális veszteséget): A = 0 1 0 3 3 2 1 2 1 3 0 1 3 3 1 3-1 0-1 0 3 1 3 2 1 2 0 1 3 0 1 Ha a sorjátékos a második sort választja, az oszlopjátékos pedig a harmadik oszlopot, akkor garantált, hogy a sor legalább 1-et nyer, de az is, hogy többet nem. Azaz ezek megjátszását optimális illetve egyensúlyi stratégiáknak tekinthetjük. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 10 / 20

Nullösszegű játékok II: A nyeregpont Jelentse m i az i-edik sor minimumát, M j pedig a j-edik oszlop maximumát, azaz Legyen továbbá Ekkor m i = mina ij, M j = max j i a ij m = maxm i és M = minm j i j m M (a minimumok maximuma a maximumok minimuma) Ha m = M akkor r,s hogy a rs = m = M (ez a mátrix nyeregpontja) Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 11 / 20

Cournot-duopólium Egy folytonos példa Egy iparág, két meghatározó vállalat, melyek egy homogén terméket állítanak elő. Stratégiák: termelési volumenek. Adott az inverz keresleti függvény, amely az iparág össztermeléséhez rendeli hozzá azt a legmagasabb árat, amelyen a piac kiürül. Adott a vállalatok (azonos) költségfüggvénye. Definiáljuk azt a játékot ahol a kifizetőfüggvények a bruttó nyereségek (a költségekkel csökkentett árbevétel). Tfh: az inverz keresleti függvény és a költségfüggvény lineáris. Ha q 1 és q 2 jelölik a két vállalat (nemnegatív) termelési volumenét, akkor az i játékos kifizetőfüggvénye: f i (q 1,q 2 ) = q i p(q 1,q 2 ) C(q i ) p(q 1,q 2 ) = max{a b(q 1 +q 2 ), 0} C(q i ) = cq i, a,b,c > 0, a > c, i = 1, 2 c - termelési költség, q i - termelt mennyiség, p - a termék ára 0 termelési volumen 0 nyereség. Túl nagy termelési volumen veszteség, függetlenül attól, mekkora termelést választ a másik. NE-t lásd később. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 12 / 20

Dominancia S i : Azon stratégiaprofilok halmaza, amik nem tartalmazzák az i játékos stratégiáját. (csonka stratégiaprofilok) ha s i S i akkor s = (s i,s i ) az a stratégiaprofil ahol az i játékos az s i stratégiáját, míg a többiek s i -t játszák. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben s i és t i S i az i játékos két stratégiája. s i szigorúan dominálja t i -t ha gyengén dominálja ha f i (s i,s i ) > f i (t i,s i ) s i S i Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 13 / 20

Nash-egyensúly Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt Nash-egyensúlypontnak (NEP v NE) nevezünk, ha f i (s i,s i) f i (s i,s i) s i S i i = 1,...,n vegyük észre hogy egyszerre csak 1 játékos válthat stratégiát Definíció Az s S stratégiaprofilt domináns Nash-egyensúlypontnak (DNEP) nevezünk, ha f i (s i,s i ) f i (s i,s i ) s S i = 1,...,n "függetlenül attól hogy a másik mit játszik, én a DNEP-hez tartozó stratégiával járok jobban" - minden játékosra pl a fogolydilemmában a (V,V) DNEP, a nemek harcában a (W,W) nem DNEP. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 14 / 20

Erős Nash-egyensúly (N>2) esetén érdekes. Koalíció: játékosok egy halmaza. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n }-ben egy n-személyes játék normál formában. Egy s stratégiaprofilt erős Nash-egyensúlypontnak (SNE) nevezünk, ha s NE, és C 2 N f i (s C,s C ) f i(s C,s C ) i C &( j C) (f j (s C,s C ) < f j(s C,s C )) (mindenki legalább olyan jól jár) (egyvalaki szigorúan jobban jár) Az erős Nash-egyensúly (SNE - Strong Nash Equilibrium) egy olyan NE, amire igaz hogy nem létezik olyan koalíció ami ha koordináltan változtatja meg a stratégiáját - a többiek változatlan döntése mellett - akkor azzal minden tagja jobban jár (és legalább egyikük szigorúan). Szemben a NE unilaterális deviációival, az SNE koalíciós elhajlást is megenged. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 15 / 20

Erős Nash-egyensúly: Ellenpélda Legyen S 1 = {F,L}, S 2 = {B,J}, S 3 = {E,H} P3 : S 3 = E P3 : S 3 = H P1 P2 B J F (2,2,2) (3,1,0) L (0,1,3) (1,2,3) P1 P2 B J F (1,4,1) (0,0,0) L (3,0,3) (2,1,-1) S=(F,B,E) NE (unilaterális deviációkra stabil), de C = {1, 3} hogy T=(L,B,H) esetén f i (T) > f i (S) i C Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 16 / 20

Felcserélhetőség Definíció Ha s = (s 1,...,s n ) és t = (t 1,...,t n ) a G = {S 1,...,S n ; f 1,...,f n } játék két NEP-je és u = (u 1,...,u n ) u i {s i,t i } i = 1,...,n szintén NEP akkor s és t felcserélhetőek. Ha G-nek csak egyetlen NEP-je van vagy 2 NEP-je felcserélhető, akkor G rendelkezik a felcserélhetőségi tulajdonsággal. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 17 / 20

Antagonizmus Definíció A G = {S 1,S 2 ;f 1,f 2 } kétszemélyes játékot antagonisztikusnak nevezzük, ha s 1,t 1 S 1 és s 2,t 2 S 2 stratégiapárosra f 1 (s 1,s 2 ) f 1 (t 1,t 2 ) f 2 (s 1,s 2 ) f 2 (t 1,t 2 ) (ha átmegyünk t-ből s-be, az első játékos kifizetése pontosan akkor nő ha a másodiké csökken) Antagonisztikus játékokban a játékosok érdekei ellentétesek. A konstans összegű játékok (f 1 +f 2 = c) antagonisztikusak, de nem minden antagonisztikus játék konstans összegű. Tétel Minden antagonisztikus játék rendelkezik a felcserélhetőségi tulajdonsággal, és minden NEP-ben mindkét játékos kifizetőfüggvényének értéke azonos (nem a két játékosra, hanem a két NEP-ra vonatkozva). Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 18 / 20

Nash halmaz, stratégiai ekvivalencia E. = G = {S 1,...,S n ; f 1,...,f n } NEP-jei. e f iff ha e és f E felcserélhetőek. A reláció reflexív, szimmetrikus de nem tranzitív. Definíció Az E egy olyan D részhalmazát, amelyre d 1,d 2 D esetén d 1 d 2 Nash-halmaznak nevezzük. Ha egy Nash-halmaz nem valódi részhalmaza egyetlen Nash-halmaznak sem, akkor maximális Nash-halmaznak hívjuk. Definíció Legyen G = {S 1,...,S n ; f 1,...,f n } H = {S 1,...,S n ; g 1,...,g n } G és H stratégiailag ekvivalens, ha NEP-jaik halmaza megegyezik. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 19 / 20

3 tétel Tétel G = {S 1,...,S n ; f 1,...,f n } játék esetén ha ϕ i : R R szig. mon. növő minden i-re, akkor a H = {S 1,...,S n ; ϕ 1 f 1,...,ϕ n f n } játék stratégiailag ekvivalens G-vel. Tétel A G = {S 1,...,S n ; f 1,...,f n } játék játékban a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen NEP-et sem vesztünk el. Tétel Ha a G = {S 1,...,S n ; f 1,...,f n } játék véges, és a szigorúan dominált sratégiák iteratív kiküszöbölésével egyetlen s stratégiaprofil marad, akkor s a G játék egyetlen NEP-je. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 20 / 20