Bevezetés a játékelméletbe Kétszemélyes zérusösszegű mátrixjáték, optimális stratégia



Hasonló dokumentumok
Mátrixaritmetika. Tartalom:

1. Előadás Lineáris programozás Szállítási feladatok

KOVÁCS BÉLA, MATEMATIKA I.

Disztribúciós feladatok. Készítette: Dr. Ábrahám István

2. Halmazelmélet (megoldások)

KOVÁCS BÉLA, MATEMATIKA I.

5. Előadás. Megyesi László: Lineáris algebra, oldal. 5. előadás Lineáris függetlenség

Lineáris programozás. Modellalkotás Grafikus megoldás Feladattípusok Szimplex módszer

Egy egyszerű ütemezési probléma megoldásának tanulságai

Elektromágneses hullámok - Hullámoptika

8. előadás EGYÉNI KERESLET

Halmazelmélet. 2. fejezet 2-1

Tartalom. Matematikai alapok. Termékgyártási példafeladat. Keverési példafeladat Szállítási példafeladat Hátizsák feladat, egészértékű feladat

Online jegyzet az Egészérték Programozás I. és II. tárgyhoz

Bevezetés 2. Aggregált terv készítése (esettanulmány) 3. Megoldás 3. Aggregált termelési terv összeállítása 8. Érzékenységvizsgálat 12

Halmazok. Halmazelméleti lapfogalmak, hatványhalmaz, halmazm veletek, halmazm veletek azonosságai.

A.26. Hagyományos és korszerű tervezési eljárások

ÉS TESZTEK A DEFINITSÉG

Mátrixjátékok tiszta nyeregponttal

4. előadás. Vektorok

Matematikai logika Arisztotelész Organon logika feladata Leibniz Boole De Morgan Frege dedukció indukció kijelentésnek

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

HIDRAULIKAI SZÁMÍTÁSOK AZ ÉPÜLETGÉPÉSZETBEN ÉS AZ ENERGETIKÁBAN

Illeszkedésvizsgálat χ 2 -próbával

Számelméleti feladatok az általános iskolai versenyek tükrében dr. Pintér Ferenc, Nagykanizsa

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Analízis I. példatár. (kidolgozott megoldásokkal) elektronikus feladatgyűjtemény

5. gyakorlat. Lineáris leképezések. Tekintsük azt a valós függvényt, amely minden számhoz hozzárendeli az ötszörösét!

Szimplex módszer, szimplex tábla Példaként tekintsük a következ LP feladatot:

4. A GYÁRTÁS ÉS GYÁRTÓRENDSZER TERVEZÉSÉNEK ÁLTALÁNOS MODELLJE (Dudás Illés)

A 2011/2012. tanévi FIZIKA Országos Középiskolai Tanulmányi Verseny első fordulójának feladatai és megoldásai fizikából. I.

Forgásfelületek származtatása és ábrázolása

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2015/ Szegedi Tudományegyetem Informatikai Tanszékcsoport

Mesterséges intelligencia 1 előadások

Matematikai és matematikai statisztikai alapismeretek

Klasszikus alkalmazások

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Bánhalmi Árpád * Bakos Viktor ** MIÉRT BUKNAK MEG STATISZTIKÁBÓL A JÓ MATEKOSOK?

Tartalom. Descartes-koordináták. Geometriai értelmezés. Pont. Egyenes. Klár Gergely 2010/2011. tavaszi félév

1.1 Példa. Polinomok és egyenletek. Jaroslav Zhouf. Első rész. Lineáris egyenletek. 1 A lineáris egyenlet definíciója

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

A vezetői munka alapelemei - Döntéselmélet, döntéshozatal lehetséges útjai

Ady Endre Líceum Nagyvárad XII.C. Matematika Informatika szak ÉRINTVE A GÖRBÉT. Készítette: Szigeti Zsolt. Felkészítő tanár: Báthori Éva.

I. A légfékrendszer időszakos vizsgálatához alkalmazható mérő-adatgyűjtő berendezés műszaki

A lineáris programozás 1 A geometriai megoldás

Kétszemélyes négyes sor játék

KOVÁCS BÉLA, MATEMATIKA I.

Bevezetés. Párhuzamos vetítés és tulajdonságai

Vektorszámítás Fizika tanárszak I. évfolyam

Matematikai programozás gyakorlatok

Sztojka Miroszláv LINEÁRIS ALGEBRA Egyetemi jegyzet Ungvár 2013

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM GÉPÉSZMÉRNÖKI KAR Épületgépészeti és Gépészeti Eljárástechnika Tanszék VARJU EVELIN

Parciális differenciálegyenletek numerikus módszerei számítógépes alkalmazásokkal Karátson, János Horváth, Róbert Izsák, Ferenc

Topográfia 7. Topográfiai felmérési technológiák I. Mélykúti, Gábor

KOVÁCS BÉLA, MATEMATIKA I.

1996. évi CXIII. törvény. a lakástakarékpénztárakról. A törvény hatálya. Fogalmak

Everlink Parkoló rendszer Felhasználói és Üzemeltetési útmutató

Bevezetés a programozásba. 12. Előadás: 8 királynő

Az alapvető jogok biztosának és a jövő nemzedékek érdekeinek védelmét ellátó helyettesének Közös jelentése az AJB-383/2016.

Gráfokkal megoldható hétköznapi problémák

2.3. A rendez pályaudvarok és rendez állomások vonat-összeállítási tervének kidolgozása A vonatközlekedési terv modellje

Fejezetek a lineáris algebrából PTE-PMMK, Műszaki Informatika Bsc. Dr. Kersner Róbert

NYUGAT-MAGYARORSZÁGI EGYETEM Faipari Mérnöki Kar. Mőszaki Mechanika és Tartószerkezetek Intézet. Dr. Hajdu Endre egyetemi docens MECHANIKA I.

Fizikaverseny, Döntő, Elméleti forduló február 8.

S T A T I K A. Az összeállításban közremûködtek: Dr. Elter Pálné Dr. Kocsis Lászlo Dr. Ágoston György Molnár Zsolt

Valószín ségelmélet házi feladatok

LÁNG CSABÁNÉ SZÁMELMÉLET. Példák és feladatok. ELTE IK Budapest javított kiadás

A lineáris tér. Készítette: Dr. Ábrahám István

Bináris keres fák kiegyensúlyozásai. Egyed Boglárka

NeoSzámla Használati Útmutató. Verziószám: 2014/Q2 Kelt: neoszamla.hu

Modern piacelmélet. ELTE TáTK Közgazdaságtudományi Tanszék. Selei Adrienn

4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás Döntési fák [Concepts Chapter 11]

19/2015. (IX. 15.) önkormányzati rendelet. A taxiállomások létesítéséről, igénybevételének és használatának rendjéről

Az új szja törvénnyel kapcsolatos béralkalmazkodási lépések a kisés közepes vállalkozások körében

Megoldások augusztus 8.

TARTALOM. Ismétlő tesztek ÚTMUTATÁSOK ÉS EREDMÉNYEK...255

Bázistranszformáció és alkalmazásai 2.

Gondolkodási módszerek 2.5 Versengés, vagy kooperáció Stratégiai játékok (csapdák, dilemmák)

Lineáris algebra és mátrixok alkalmazása a numerikus analízisben

Közép-Tisza-vidéki Környezetvédelmi, Természetvédelmi és Vízügyi Felügyelőség

NUMERIKUS MÓDSZEREK FARAGÓ ISTVÁN HORVÁTH RÓBERT. Ismertető Tartalomjegyzék Pályázati támogatás Gondozó

Egy emelt szintű érettségi feladat kapcsán Ábrahám Gábor, Szeged

PILÓTA NÉLKÜLI REPÜLŐGÉPEK ÚTVONALTERVEZÉSE DIGITÁLIS DOMBORZAT MODELL ALKALMAZÁSÁVAL

A rádió* I. Elektromos rezgések és hullámok.

MATEMATIKA FELADATGYŰJTEMÉNY

Lineáris algebra gyakorlat

B E S Z E R E L É S I É S H A S Z N Á L A T I Ú T M U T A T Ó. Univerzális hangszórós tolatóradar 4 DB LÖKHÁRÍTÓBA SZERELHETŐ SZENZORRAL

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Analízis 1. (BSc) vizsgakérdések Programtervez informatikus szak tanév 2. félév

TÁMOP VIR alprojekt VIR felhasználói kézikönyv

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

19/2009. (I. 30.) Korm. rendelet. a földgázellátásról szóló évi XL. törvény rendelkezéseinek végrehajtásáról

Általános Szerződési és Regisztrációs Feltételek

HASZNOS TUDNIVALÓK. a január 1-től érvényes egyes fixösszegű ellátásokról, adó- és tb-törvények fontosabb változásairól

AZ EU KÖZÖS ÁRUSZÁLLÍTÁSI LOGISZTIKAI POLITIKÁJA

BUDAPESTI KÖZGAZDASÁGTUDOMÁNYI EGYETEM. Puskás Csaba, Szabó Imre, Tallos Péter LINEÁRIS ALGEBRA JEGYZET

0653. MODUL TÖRTEK. Szorzás törttel, osztás törttel KÉSZÍTETTE: BENCZÉDY LACZKA KRISZTINA, MALMOS KATALIN

KÖZGAZDASÁGI ALAPISMERETEK (ELMÉLETI GAZDASÁGTAN)

Analízisfeladat-gyűjtemény IV.

DÖNTÉSI MODELL KIALAKÍTÁSA KÖZBESZERZÉSI ELJÁRÁS SORÁN ELŐSZÓ

AZ ÉPÍTÉSI MUNKÁK IDŐTERVEZÉSE

Átírás:

Bevezetés a játékelméletbe Kétszemélyes zérusösszegű mátrixjáték, optimális stratégia Készítette: Dr. Ábrahám István

A játékelmélet a 2. század közepén alakult ki. (Neumann J., O. Morgenstern). Gyakran előfordul, hogy kettő vagy több ellentétes érdekeltségű döntéshozó egyidejűleg akar elérni bizonyos célokat. A folyamat modellezhető az ú.n. mátrixjátékkal. Kétszemélyes zérusösszegű mátrixjáték Példa: Adott egy P=[p ij ] valós számokból álló mátrix. Két játékos, A és B a következő játékot játsza: az A játékos kijelöli a mátrix i-edik sorát, a B tőle függetlenül kiválasztja a mátrix j-edik oszlopát és ekkor B fizet A-nak p ij pénzegységet. Legyen például: P= 5 3 2 A P mátrixot fizetési mátrixnak nevezzük. Ha például az A a második sort, a B a harmadik oszlopot jelöli ki, akkor B fizet a sorjátékosnak 2 pénzegységet. Ha egy másik esetben az A a negyedik sort jelöli ki, a B pedig az első oszlopot, akkor a sorjátékos - pénzt fizet az oszlopjátékosnak, azaz ekkor a B kap A-tól pénzt. Cél: a játékosok optimális stratégiájának meghatározása. 2

Megjegyzés: Előfordulhat, hogy valamelyik résztvevő nem természetes személy, hanem például egy árucikk iránti kereslet valószínűsége, vagy az időjárás eseményei. Mindegyik játékban az A nyeresége megegyezik a B veszteségével, így a két játékos nyereségének, illetve veszteségének összege nullával egyenlő. A játékosok a sorokat, illetve oszlopokat két alapelv szerint jelölik ki:.) Azokat a sorokat, illetve oszlopokat részesítik előnyben a kijelöléskor, azaz nagyobb valószínűséggel úgy választanak, amely alapján a nyereségük várható értéke a lehető legnagyobb. 2.) Az egyes sorokat, illetve oszlopokat véletlenszerűen, tehát nem valamilyen kiismerhető rendszer szerint kell kiválasztaniuk. A játékosok stratégiáját kifejezhetjük azokkal a valószínűségekkel, amelyekkel a sorokat, illetve oszlopokat kiválasztják. Az A játékos az egyes sorokat x, x 2,..., x m valószínűséggel, a B az oszlopokat y, y 2,, y n valószínűséggel választja ki. Vektor alakban: x=[ x, x 2,..., x m ]* y*=[ y, y 2,, y n ] Mind az A, mind a B a játékban biztosan választ, azaz az egyes valószínűségek összege mindkét 3 játékos esetén, tehát * x= és y* =.

A lehetséges stratégiák, a játék várható értéke Tiszta stratégia: Ha a játékos mindig ugyanazt a sort, vagy oszlopot választja: x=e i (i=, 2,...,m), vagy y*=e j * (j=, 2,...,n), Példa: Legyen a fizetési mátrix a következő: 4 4 9 2 3 P = 6 5 7 A sorok minimális értékei: 4,, 5. Ezek közül a legnagyobb a 3. sorban van, tehát ha a sorjátékos stratégiája x=[ ]*=e 3, akkor B bármely oszlopválasztásánál legalább 5 pénzegység lesz a nyereménye. Az oszlopok maximális értékei: 6, 5, 9. Közülük a legkisebb a 2. oszlopban található. Ha tehát az oszlopjátékos stratégiája: y*=[ ]=e 2 *, akkor az A bármely sorválasztásánál legfeljebb 5 pénzegység lesz a vesztesége. Elnevezés: Ha egy fizetési mátrixban a sorminimumok legnagyobb értéke megegyezik az oszlopmaximumok legkisebb értékével, akkor a játéknak nyeregpontja van. Definíció: Ha egy mátrixjátéknak nyeregpontja van, akkor a nyeregpont számértékét a játék értékének nevezzük. A példában adott játék értéke tehát 5. 4

Kevert stratégia: az x i és az y j értékei nemcsak és lehetnek. A játék várható értéke adott stratégiák esetén Particionáljuk az adott P fizetési mátrixot sorvektorokra, jelentse például a p i * sorvektor a mátrix i-edik sorát. Ha az A játékos ezt a sort választja, akkor az adott játszmában a nyereségének várható értéke: p i y +p i2 y 2 + +p in y n =p i * y, mert az oszlopokat a B játékos y j valószínűséggel választja. Az i-edik sort viszont az A játékos x i valószínűséggel választja ki, így az adott játék várható értéke: x p * y+x 2 p 2 * y+ +x m p m * y=(x p *+x 2 p 2 *+ +x m p m *) y=x* P y=m A fenti zárójelben lévő kifejezés az x* sorvektor és a P mátrix szorzata. A játék M várható értéke azt fejezi ki, hogy sok játék átlagában az A játékos mennyit nyer játékonként a B-től. Az M értéke a fizetési mátrix szerkezetének függvényében lehet negatív is, ekkor a B nyer pénz az A-tól. 5

Példa: Számoljuk ki a játék várható értékét, ha P = 5 3 2 és x=[/6 /3 /3 /6]*, y*=[/3 2/3]. Képletünk szerint: M=x* P y. A mátrixműveleteket végrehajtva: M=9/8. Eredményünk azt jelenti, hogy sok játék átlagában a fenti adatok mellett az A játékos nyeresége 9/8 pénzegység. Tétel: A játék várható értéke a P mátrix legkisebb és legnagyobb értékei között található, azaz: min p ij x* P y max p ij. A tétel igazának belátása nyilvánvaló, hiszen ha mindkét játékos rendre a legkisebb, illetve legnagyobb mátrixelemre játszik, akkor a játék értéke ezt a két értéket veszi fel, sem kisebb, sem nagyobb érték nem fordulhat elő. Például ha fenti P mátrixnál a sorjátékos stratégiája: x=[ ]*, az oszlopjátékosé: y*=[ ], ekkor minden játéknál a harmadik sor első eleme kerül kiválasztásra, ez a mátrix maximális eleme, tehát ekkor M=5.. Hasonlóan megfelelő stratégiákkal kiválasztható a játék minimális várható értéke: M = 6.

Az optimális stratégia Egy mátrixjátékot különféle stratégiákkal kellően sokszor eljátszva észrevehető, hogy létezik valamilyen egyensúlyi állapot, eljuthatunk optimális stratégiákhoz. Definíció: A P mátrix által meghatározott játék akkor megoldható, ha bármely lehetséges x és y* stratégia esetén létezik olyan x o és y o * stratégia, amire fennáll: x* P y o V x o * P y. A V számot a játék értékének nevezzük. A definícióból következik, hogy az x o stratégiát játszó A játékos nyeresége bármelyik játékban, B tetszőleges stratégiája esetén is legalább V-vel lesz egyenlő. Hasonlóan: B vesztesége az y o * stratégiát alkalmazva legfeljebb V értékű lehet. Az x o és y o * stratégiákat a két játékos optimális stratégiájának nevezzük. A definícióban lévő egyenlőtlenségnek akkor is fenn kell állnia, ha mindkét játékos a saját optimális stratégiáját követi, azaz: x o * P y o V x o * P y o. Következésképpen: ha a játék megoldható, akkor a játék értéke: V=x o * P y o. 7

Megjegyzés: mindig elérhető, hogy az optimális stratégiákat olyan fizetési mátrixra határozzuk meg, amelynek elemei között nincsenek negatív számok. Ugyanis arra a Q mátrixra, amely a P-ből úgy keletkezik, hogy a P minden eleméhez ugyanazt a k pozitív számot adjuk hozzá, az optimális stratégiák változatlanok maradnak. A Q által meghatározott játék értékét úgy kapjuk meg, hogy a P játék értékéhez a k számot hozzáadjuk. Tétel: Minden fizetési mátrix által meghatározott játéknak van megoldása. A játékelméletnek ezt az egyik legfontosabb állítását Neumann János bizonyította, a tételt Neumann tételnek is nevezik. Az állítás igazolását nem részletezzük. A kétszemélyes zérusösszegű mátrixjáték optimális megoldása A P fizetési mátrix által meghatározott játékban az A játékos optimális stratégiájára veszünk fel matematikai modellt. A modell megoldásával duál optimumként megkapjuk a B játékos optimális stratégiáját is. Az A játékos minden stratégiájára fennáll az induló feltétel: x, hiszen az x vektor elemei valószínűségek. A korlátozó feltételek között nyilvánvaló: x +x 2 + +x m =. Tudjuk, hogy az A játékos minden esetben valamelyik sort kiválasztja. 8

A játék megoldhatóságára felvett definíciónk jobboldala szerint: V x o * P y. Az összefüggés a B játékos minden lehetséges stratégiája esetén érvényes, így akkor is, ha y=e j (j=, 2,,n) Ilyenkor tehát az egységvektorok jelentik a B stratégiáját. V x o * P e V x o * P e 2.. V x o * P e n Az n egyenlőtlenség összevont alakban: V * x o * P (e, e 2,... e n ) A zárójelben egy egységmátrix oszlopvektorokra paticionált alakja van, így: V * x o * P A mátrixszorzásra vonatkozó szabályt ((A B)*=A* B*) felhasználva: V P* x o. Ez a korlátozó feltétel írható V P* x o alakban is. 9

A matematikai modell célfüggvényeként a V maximális értékét keressük: z=v max. A lineáris programozási modell az optimális stratégia kiszámolására: x x +x 2 + +x m = V P* x o, vagy más alakban: V P* x o z=v max. A P fizetési mátrixú kétszemélyes zérusösszegű mátrixban az optimális stratégiákat és a játék értékét a modell megoldásával kapjuk. A modell megoldása történhet a szokásos módon az Excel, vagy a Lingo felhasználásával. Példa: Adott a P fizetési mátrix, határozzuk meg az A sorjátékos és a B oszlopjátékos optimális stratégiáját és a játék értékét: 2 4 6 P = 3 5 A konkrét esetre felírjuk a a matematikai modellt:

Az induló feltétel: x, x 2 A korlátozó feltételek: x +x 2 = Az V P* x o relációnak megfelelő sorok: A célfüggvény: z=v max. V-2x -3x 2 V-4x - x 2 V-6x -5x 2 Excel induló tábla: F V x x2 <> Az induló táblázatban a V-t is természetesen változóként kezeljük. Az optimalizálást a Solverrel a szokásos módon végezzük el, az eredmény: F2 F3 F4 V -2-4 -6-3 - -5 <= <= <= Az A játékos optimális stratégiája: x=[.5,5]*, a játék értéke: V=2,5. Az oszlopjátékos (B) optimális stratégiája az Érzékenység jelentésből adódik (duál optimum): mo max y*=[,75,25 ] A Lingoval történő megoldáskor nem kötelező a matematikai modell klasszikus alakjának használata, tehát a korlátozó feltételeket felvehetjük az V P* x o formában is. A megoldás természetesen megegyezik az Excel eredményével. A fejezet tárgyalását befejeztük.