2015/ Szegedi Tudományegyetem Informatikai Intézet

Hasonló dokumentumok
Döntési rendszerek I.

Döntési rendszerek I.

Rasmusen, Eric: Games and Information (Third Edition, Blackwell, 2001)

Mátrixjátékok tiszta nyeregponttal

Opkut deníciók és tételek

Mikroökonómia I. B. ELTE TáTK Közgazdaságtudományi Tanszék. 12. hét STRATÉGIAI VISELKEDÉS ELEMZÉSE JÁTÉKELMÉLET

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2017/ Szegedi Tudományegyetem Informatikai Intézet

Közgazdaságtan I. 11. alkalom

Nem-kooperatív játékok

Universität M Mis is k k olol ci c, F Eg a y kultä etem t, für Wi Gazda rts ságcha tudft o sw máis n s yen i scha Kar, ften,

Játékelmélet és hálózati alkalmazásai 2. ea

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

JÁTÉKELMÉLETTEL KAPCSOLATOS FELADATOK

f B B 1 B 2 A A 2 0-1

PIACI JÁTSZMÁK. Bevezető Közgazdaságtan Tanszék

Játékelmélet. előadás jegyzet. Kátai-Urbán Kamilla. Tudnivalók Honlap: Vizsga: írásbeli.

Agrárstratégiai irányok játékelméleti alapokon

A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2018/

A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2017/

További forgalomirányítási és szervezési játékok. 1. Nematomi forgalomirányítási játék

Döntési rendszerek I.

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

A Morra játék Módosított Morra Blöff és alullicitálás mint racionális stratégiák

PIACI JÁTSZMÁK. Fiú. Színház. Színház (4 ; 2) (0 ; 0) A38 (0 ; 0) (2 ; 4) Lány

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

TÁRGYMUTATÓ. Á állam (17, 19, 118, 123, 133, 152, 160, 181) állandó összegő játék/interakció (49, 94)

A stratégiák összes kombinációján (X) adjunk meg egy eloszlást (z) Az eloszlás (z) szerint egy megfigyelő választ egy x X-et, ami alapján mindkét

KÖZGAZDASÁGTAN. Játékelmélet Szalai László

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

Debreceni Egyetem Informatikai Kar JÁTÉKELMÉLET

1/ gyakorlat. Lineáris Programozási feladatok megoldása szimplex módszerrel. Pécsi Tudományegyetem PTI

Csercsik Dávid ITK PPKE. Csercsik Dávid (ITK PPKE) Játékelmélet és hálózati alkalmazásai 2. ea 1 / 31

11. Előadás. Megyesi László: Lineáris algebra, oldal. 11. előadás Kvadratikus alakok, Stratégiai viselkedés

Követelmények Motiváció Matematikai modellezés: példák A lineáris programozás alapfeladata 2017/ Szegedi Tudományegyetem Informatikai Intézet

Bevezetés a játékelméletbe Kétszemélyes zérusösszegű mátrixjáték, optimális stratégia

Branch-and-Bound. 1. Az egészértéketű programozás. a korlátozás és szétválasztás módszere Bevezető Definíció. 11.

Követelmények Motiváció Matematikai modellezés: példák A lineáris programozás alapfeladata 2017/ Szegedi Tudományegyetem Informatikai Intézet

Elméleti evolúcióbiológia. Kispál András (EYQ0NP) Fizika BSc. II. évfolyam

Döntési módszerek Tantárgyi útmutató

PIACI JÁTSZMÁK. Bevezető Szalai László

1/ gyakorlat. Lineáris Programozási feladatok megoldása szimplex módszerrel. Pécsi Tudományegyetem PTI

Operációkutatás vizsga

További programozási esetek Hiperbolikus, kvadratikus, integer, bináris, többcélú programozás

2017/ Szegedi Tudományegyetem Informatikai Intézet

A Markowitz modell: kvadratikus programozás

Operációkutatás II. Tantárgyi útmutató

Játékelméleti alapvetés - I

Operációkutatás. Vaik Zsuzsanna. ajánlott jegyzet: Szilágyi Péter: Operációkutatás

Operációkutatás II. Tantárgyi útmutató

Nem-lineáris programozási feladatok

Mészáros József. Játékelmélet

A szimplex algoritmus

Döntési módszerek Tantárgyi útmutató

A Markowitz modell: kvadratikus programozás

Operációkutatás. 4. konzultáció: Szállítási feladat. A feladat LP modellje

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

Mintafeladat az RSA algoritmus szemléltetésére

Áttekintés LP és geometria Többcélú LP LP és egy dinamikus modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Mesterséges Intelligencia MI

1. Előadás Lineáris programozás

Horváth Jenőné dr. * A RACIONALITÁS PROBLÉMÁJA ÉS A JÁTÉKELMÉLET LEGÚJABB EREDMÉNYEI

Operációkutatás vizsga

A Rabin-féle méltányossági egyensúly kritikája

Programozási módszertan. Mohó algoritmusok

Operációkutatás vizsga

LINEÁRIS PROGRAMOZÁSI FELADATOK MEGOLDÁSA SZIMPLEX MÓDSZERREL

Összefoglalás és gyakorlás

KÖZGAZDASÁGTAN I. Készítette: Bíró Anikó, K hegyi Gergely, Major Klára. Szakmai felel s: K hegyi Gergely június

Korlátozás és szétválasztás módszere Holló Csaba 2

Ismételt játékok: véges és végtelenszer. Kovács Norbert SZE GT. Példa. Kiindulás: Cournot-duopólium játék Inverz keresleti görbe: P=150-Q, ahol

Döntéselőkészítés. I. előadás. Döntéselőkészítés. Előadó: Dr. Égertné dr. Molnár Éva. Informatika Tanszék A 602 szoba

A klasszikus közgazdaságtanon innen és túl, avagy az érem másik oldala

1. feladat Az egyensúly algoritmus viselkedése: Tekintsük a kétdimenziós Euklideszi teret, mint metrikus teret. A pontok

Operációkutatás. Glashütter Andrea

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Bevezetés Standard 1 vállalatos feladatok Standard több vállalatos feladatok 2017/ Szegedi Tudományegyetem Informatikai Intézet

A tiszta stratégiával a biztosan elérhető nyereség:

Döntéselőkészítés. VII. előadás. Döntéselőkészítés. Egyszerű Kőnig-feladat (házasság feladat)

Döntéselmélet KONFLIKTUSELMÉLET

Szerencsejátékok. Elméleti háttér

Döntéselmélet II. ELŐADÁS DÖNTÉSI FOLYAMAT

1000 forintos adósságunkat, de csak 600 forintunk van. Egyetlen lehetőségünk, hogy a

Az előadásokat és a gyakorlatokat pénteken az M 316 tanteremben tartjuk. Az előadás időpontja: , a gyakorlat időpontja:

(folytatás) Piaci játszmák. Bánhidi Zoltán (Közgazdaságtan Tanszék)

Gondolkodási módszerek 2.5 Versengés, vagy kooperáció Stratégiai játékok (csapdák, dilemmák)

Mesterséges Intelligencia alapjai

A mediáció szerepe többszereplős rendszerek szabályozásában: játékelméleti megközelítés. Forgó Ferenc Budapesti Corvinus Egyetem

Játékelmélet 1. Forgó Ferenc Pintér Miklós Simonovits András Solymosi Tamás. (elektronikus jegyzet)

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2015/ Szegedi Tudományegyetem Informatikai Tanszékcsoport

AZ ELŐZŐ HÁROM FÉLÉVBEN ELÉRT KUTATÁSI EREDMÉNYEK ÖSSZEGZÉSE

Nemlineáris programozás 2.

JÁTÉKELMÉLETI MAGYARÁZAT A KÖZJÓSZÁGOK LÉTREJÖTTÉNEK ELMARADÁSÁRA

A JÁTÉK CÉLJA A játékosok célja megszabadulni az összes kockájuktól. A győztes az lesz, akinek ez elsőként sikerül.

Kétszemélyes játékok

Számítógép és programozás 2

Valasek Gábor

Alkuegyensúlyok és stabil halmazok

A szimplex tábla. p. 1

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

PIACI JÁTSZMÁK. Kereskedelempolitikai játszmák Vígh László

Átírás:

Operációkutatás I. 2015/2016-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 9. Előadás

Egy példa Adott két TV csatorna (N1, N2), melyek 100 millió nézőért versenyeznek. Tekintsük a szombat este 20-21 órás idősávot. Amikor a csatornák kihirdetik a műsorukat, nem ismerik a másik műsorát. A piackutatások alapján a különböző műsorok esetén N1 csatorna a következő nézőszámokra számíthat feltéve a N1 és N2 adását: N2 N1 Western Akciófilm Vígjáték Western 35 15 60 Akciófilm 45 58 50 Vígjáték 38 14 70 Például, ha N1 Western-t ad, N2 pedig Vígjátékot, akkor 60 millióan nézik N1-et, 100-60=40 millióan pedig N2-t. Kérdés: Mi legyen a két csatorna stratégiája, hogy maximalizálják a nézettségüket?

Egy példa Terminológia: N1: sorjátékos N2: oszlopjátékos A feĺırt mátrix: kifizetési mátrix {Western, Akciófilm, Vígjáték}: stratégiák halmaza Ez egy ún. konstans összegű játék: a két játékos nyereségének összege mindig 100 Na de hogyan oldjuk meg a feladatot? Nézzük meg a kifizetési mátrix szerkezetét!

Egy példa Ha N1 Western-t ad, akkor lehet 60 milliós nézettsége (ha N2 Vígjátékot ad), de lehet csak 15 millió is (ha N2 Akciófilmet ad)...azaz legrosszab esetben is garantált (várhatóan) 15 millió néző a Western-nel. De ha N1 vígjátékot ad, a helyzet rosszabb, mert csak 14 millió néző garantált. a legrosszabb esetek legjobbika, ha Akciófilmet ad: garantált 45 millió néző N2 adásától függetlenül Egyszerűen: megnézi a sorminimumokat és veszi a legnagyobbat. Analóg módón az oszlopjátékos N2 hasonlóan tesz: veszi az oszlopmaximumokat és veszi a legrosszabb esetet (legkisebbet)

Egy példa Nem nehéz látni, hogy max(sorminimumok) min(oszlopmaximumok) A példánkban N1 az Akciófilmet fogja választani, N2 pedig a Westernt, így 45 vs. 55 milló lesz a nézők megoszlása. Látjuk, hogy itt max(sorminimumok) = min(oszlopmaximumok) teljesül. Az egyenlsőget megvalósító stratégia párt nyeregpontnak hívjuk. A nyeregponthoz tartozó érték (a példában 45) a játék értéke.

Zérusösszegű játékok Teljes információs, véges, kétszemélyes, zérus (konstans) összegű játékok: Teljes információs: mindenki ismeri a játékszabályokat, ki mit léphet, mik a lépések eredményei Véges: véges számú játékos (most 2!), véges számú lehetséges lépéssel (a példában 3-3) Zérus összegű: pontosan annyit nyer az egyik játékos, mint amennyit a másik veszít Az ilyen játékok leírhatók egy mátrixszal, ezért röviden mátrix játékoknak nevezzük őket Mátrix játék kifizetési mátrix: olyan M mátrix, amelyben az m ij elemek a sor játékos nyereményei, amennyiben a sor játékos i-t, az oszlop játékos a j stratégiát játsza a játékban

Zérusösszegű játékok - tiszta és kevert stratégia Az előző játékban a játékosok (N1, N2) stratégiája determinisztikus volt: megvizsgálták a lehetséges kimeneteleket és választottak egy stratégiát (filmtípus) amit követnek. Ezt tiszta stratégiának hívjuk. Vannak játékok, ahol nincs nyeregpont egyetlen, tiszta stratégia követése nem mindig garantálja a legjobb kifizetést (ld. következő példa). Kevert stratégia adott n lehetséges lépés: (s 1,..., s n ) (stratégiahalmaz) s i stratégiát x i valószínűséggel játsszuk x i 0 és x 1 + + x n = 1 (eloszlás a stratégiahalmaz felett) az optimális stratégia: ami maximalizálja a várható kifizetést (kifizetés várható értékét maximalizáljuk)

Példa Betting game Van egy francia kártyacsomagunk, aminek egy színét kiválasztjuk és mind a 13 lapját kiterítjük lefordítva. Az első játékos (P1) felhúz egy lapot úgy, hogy a második játékos (P2) nem látja azt. P1-nek két lehetősége van: 1 Eldobja a lapot és fizet egy dollárt a második játékosnak (Pass) 2 Lefordítva leteszi a lapot az asztalra, átadva a döntést a második játékosnak (Bet) Amennyibben P1 nem dobott, azaz a játék folytatódik, akkor P2-nek szintén két lehetősége van: 1 Kiteríti P1 lapját (Call) 2 Passzol és fizet egy dollárt az első játékosnak (Fold)

Példa Betting game A lep terítésekor kétféle kimenetel lehetséges: 1 Ha a lap értéke magas (10, J, Q, K, A), P2 fizet 2$-t az P1-nek 2 Ha a lap értéke alacsony (2, 3, 4, 5, 6, 7, 8, 9), P1 fizet 2$-t P2-nek Mik lehetnek P1 startégiái? Lap értékétől függetlenül dob (PP) Dob, ha a lap értéke magas, tart, ha alacsony (PB) Dob, ha a lap alacsony, tart, ha magas (BP) Lap értékétől függetlenül tart (BB) P1 lehetséges stratégiái pedig: Call Fold

Példa Betting game Mi történik például, ha P1 BP-t játssza, míg P2 a Call-t? Várhatóan mennyit kereshet így az első játékos? Annak a valószínűsége, hogy magas lapot húz P1: 5/13 Annak a valószínűsége, hogy alacsony lapot húz P1: 8/13 P1 várható ( átlagos ) nyeresége ebben az esetben: 5/13 2$ + 8/13 ( 1$) = 2/13$ Mi történik például, ha P1 BP-t játssza, míg P2 Fold-ot? Ekkor az P1 várható nyeresége: 5/13 1$ + 8/13 ( 1$) = 3/13$

Példa Betting game A kifizetési mátrix a következő (hf. számoljuk végig) P2 P1 Call Fold sormin PP -1-1 -1 PB -21/13 3/13-21/13 BP 2/13-3/13-3/13 BB -6/13 1-6/13 oszlopmax 2/13 1 A játék zérusösszegű: a két játékos kifizetésének összege (minden stratégiapárra) 0. Azt is látjuk, hogy nincs nyeregpont.

Példa Betting game: dominancia Vegyük észre, hogy P1-nek a BP mindig jobb kifizetést ad, mind a PP P1-nek BB mindig jobb, mint PB Azt mondjuk, hogy BP dominálja P P -t és BB dominálja P B-t. Ha van dominált stratégia, azt eltávoĺıthatjuk a kifizetési mátrixból (hiszen biztosan nem fogjuk használni): P2 P1 Call Fold BP 2/13-3/13 BB -6/13 1 Határozzuk meg, mi lesz a legjobb kevert stratégia P1-nek.

Példa Betting game: kevert stratégia P1 válassza x 1 valószínűséggel BP-t és x 2 valószínűséggel BB-t. A kevert stratégia: (x 1, x 2 ); x 1 + x 2 = 1 Várható kifzetés, ha P2 Call-t játszik: 2 13 x 1 6 13 x 2 Várható kifzetés, ha P2 Fold-ot játszik: 3 13 x 1 + x 2 Legrosszabb esetben: min { 2 (x 1,x 2 ) 13 x 1 6 13 x 2, 3 13 x 1 + x 2 } Mivel x 1 + x 2 = 1, ezért egyszerűsítve: kimenetel = min x 1 { 8 13 x 1 6 13, 16 13 x 1 + 1}

Példa Betting game: kevert stratégia Ábrázolva a lehetséges kimeneteleket: A legjobb kevert stratégia az E ponthoz tartozó (x 1, x 2 ) = (19/24, 5/24) eloszlás. Ez garantál várható értékben 1/39$ nyereséget.

Példa Betting game: kevert stratégia Teljesen ugyanígy, P2 válassza y 1 valószínűséggel Call-t és y 2 -vel Fold-ot. A legrosszabb esetben P2 várható kifizetése (vesztesége) mivel y 1 + y 2 = 1, ezért max { 2 (y 1,y 2 ) 13 y 1 3 13 y 2, 6 13 y 1 + y 2 } kimenetel = min y1 { 5 13 y 1 3 13, 19 13 x 1 + 1}

Példa Betting game: kevert stratégia Ábrázolva a lehetséges kimeneteleket: A legjobb kevert stratégia az F ponthoz tartozó (y 1, y 2 ) = (2/3, 1/3) eloszlás. Ez garantál várható értékben 1/39$ veszteséget. A legjobb stratégia P2-nek, hogy 2/3 valószínűséggel Call-t, 1/3 valószínűséggel Fold-ot játszik.

Példa Betting game: lineáris programozás A (x 1, x 2 ), illetve (y 1, y 2 ) megkeresésének problémáját LP feladatként is megfogalmazhatjuk:

Példa Betting game: lineáris programozás A két LP egymás duálisai. Zérusösszegű játékoknál mindig ez a helyzet Erős dualitás a két LP célfüggvény értéke egyenlő: ez a játék értéke Az optimumok komplementárisan lazák a 2 megoldás egy egyensúlypontot ad: egyik játékos sem tud ennél jobbat ha eltér ettől a stratégiától: Nash-egyensúly Tétel. (Luce és Raiffa 1989) Bármely zérusösszegű játékhoz létezik egy LP feladat, amely megoldása a játék egyensúlya. Fordítva, minden LP feladathoz megadható egy zérusösszegű játék, amely egyensúlyi stratégiája az LP optimuma.

A fogolydilemma A valóságban a legtöbb szituációban a játékosok nyeresége/vesztesége nem konstans (vagy nem 0). lehetnek loose-loose és win-win helyzetek. például a kooperáló játékosok többet nyernek együtt, mint egymással versengve, külön-külön Prototípus feladat a híres fogolydilemma: 2 bankrablót (Bonnie és Clyde) elfognak egy kisebb bűncselekmény miatt, de a bankrablást nem tudják bizonyítani. Külön cellában helyezik el őket, es a kerületi ügyész hallgatja ki őket. 1 Ha mindkettő vall, akkor 5-5 év börtönt kapnak 2 Ha csak az egyik vall, a másik tagad, akkor a beismerő szabadul a tagadó 20 év börtönt kap 3 Ha mindkettő tagad, akkor 1-1 év börtönt kapnak

A fogolydilemma A kifizetési mátrix Clyde Bonnie Vall Tagad Vall (-5, -5) (0, 20) Tagad (-20, 0) (-1, -1) Nem (konstans) zérusösszegű: ha vallanak, 5 5 = 10 az összeg, míg ha tagadnak 1 1 = 2. Mi a legjobb, amit tehetnek? Egy egyensúlyi pont ha mindkettő vall: ha bármelyik játékos változat ezen, akkor 20 év börtönt kap. Nash egyensúly (equlibrium): olyan stratégia pár, amely esetén egyik játékos sem tudja stratégiája változtatásával növelni a nyereségét, amennyiben a másik játékos nem változtat stratégiát

A fogolydilemma De ha mindkettő meggondolja magát, es tagadnak: 1-1 évvel megússzák. Pareto optimum: Olyan stratégia pár, amit nem tudunk úgy megváltoztatni, hogy valamelyik játékos kifizetése jobb legyen úgy, hogy a másik játékosé nem lesz rosszabb. Ugyanakkor a fogolydilemmában a vall stratégia dominálja a tagad stratégiát az egyensúlyi stratégia (NE) egyértelmű (vall, vall). Tétel. (John F. Nash) Minden n-szereplős játéknak, melyben a stratégiák száma véges, van Nash-egyensúlya. kevert stratégiákat is figyelembe vesszük az egyértelműség nem garantált

Iterált fogolydilemma A valóságban egy játék gyakran nem egyetlen interakció Múltbéli események alapján választhatunk stratégiát Robert Axelrod The evolution of cooperation (1984): iterált fogolydilemma kísérlet Kutatók küldhettek be programot, mely iterált fogoly dilemmát játszik és körröl-körre frissíti a stratégiáját A programok egymás ellen játszanak Mik a legjobb evolúciós stratégiák? Győztes: Anatol Rapoport tit-for-tat ( jó tett helyébe jót várj ) stratégiája

A héja-galamb játék Nem zérus összegű játékokat az evolúció biológiában is használnak modellezésre. A fogolydilemma mellett fontos példa a héja-galamb játék: Adott egy faj A faj egyedei kitérhetnek egymás elől vagy harcba szállhatnak egymással Mindkét viselkedésnek megvannak a maga előnyei és hátrányai Egy egyed vagy mindig kitér ( galamb viselkedés), vagy mindig harcba száll ( héja viselkedés) Van-e evolúciósan stabil stratégia? Ajánlott olvasmány: Sir John Maynard Smith: Evolution and the Theory of Games (1982)

A héja-galamb játék Legyen az egyedek közötti interakciók fiktív kifizetési mátrixa a következő A egyed Galamb Héja B egyed Galamb (2, 2) (-1, 5) Héja (5, -1) (-9,-9) Bármelyik viselkedés elterjedése esetén a kialakult normától eltérő egyed előnyhöz jut Milyennek kell legyen a két viselkedés eloszlása egy populációban, hogy egyetlen egyednek se érje meg változtani? Mikor válik a populáció evolúciósan stabillá?

A héja-galamb játék Legyen a héják aránya a populációban x, a galamboké (1 x) A héják várható nyeresége 9x + 5(1 x) = 5 14x A galambok várható nyeresége 2(1 x) x = 2 3x Egyensúly esetén 5 14x = 2 3x azaz x = 3 11 A modellben... egy erőforrás értéke 3 az idő értéke 1 a sérülés értéke 8 Használták még többek közt Nukleáris fegyverek leszerelésének modellezése Kubai rakétaválság játékelméleti modellje Stanley Kubrick Dr. Strangelove c. filmjében is megjelenik (kölcsönösen biztosított megsemmisítés elve)