V. Játékok. Kétszemélyes, teljes információjú, véges és determinisztikus, zéró összegű, játékok. Állapottér-reprezentáció. Grundy mama játéka



Hasonló dokumentumok
V. Kétszemélyes játékok

V. Kétszemélyes játékok

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

Kereséssel történő problémamegoldás. Ormándi Róbert

Elemi adatszerkezetek

1. forduló. MEGOLDÁSOK Pontszerző Matematikaverseny 2015/2016-os tanév

Játékok (domináns stratégia, alkalmazása

A Hozzárendelési feladat megoldása Magyar-módszerrel

Előre is köszönjük munkádat és izgatottan várjuk válaszaidat! A Helleresek

Segítünk online ügyféllé válni Kisokos

Egyre nagyobb profitot generálnak a mobiltelefonnal végzett vásárlások, és egyre többet hezitálunk vásárlás előtt

Spiel der Türme TORNYOK JÁTÉKA

Fábián Zoltán Hálózatok elmélet

Vodafone ReadyPay. Használati útmutató

Jelek tanulmányozása

KOVÁCS BÉLA, MATEMATIKA I.

AWP TELEPÍTÉSE- WINDOWS7 64 OPERÁCIÓS RENDSZEREN

Párhuzamos programozás

ADATBÁZIS-KEZELÉS. Funkcionális függés, normál formák

Kombinatorika. 9. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Kombinatorika p. 1/

Kérjük, hogy mielőtt elkezdené használni a Csavarhat webáruházat, gondosan olvassa végig ezt a segédletet.

Többfelhasználós adatbázis környezetek, tranzakciók, internetes megoldások

Felhasználói kézikönyv ACR Rádiós ébresztőóra (Olvassa el használat előtt) Letölthető PDF formátum:

Prop-Tech. Vázmérő. Telepítési és eltávolítási útmutató

Analízis elo adások. Vajda István szeptember 24. Neumann János Informatika Kar Óbudai Egyetem. Vajda István (Óbudai Egyetem)

Dr. Schuster György február 21. Real-time operációs rendszerek RTOS

HENYIR felhasználói dokumentáció

Tanulmányi keretrendszer az APPI-ban

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

MIT VÁR EL A PSZICHOLÓGUS A JÓ KRESZTŐL? ARANYOS JUDIT közlekedés szakpszichológus

Útmutató az EPER-ben már regisztrált szervezetek elektori jelentkezéséhez

E-ADÓ RENSZER HASZNÁLATI ÚTMUTATÓ

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2006/2007

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Trigonometria

Az Európai Szabadalmi Egyezmény végrehajtási szabályainak április 1-étől hatályba lépő lényeges változásai

1. Mintapélda, amikor a fenék lekerekítési sugár (Rb) kicsi

Programozás I gyakorlat

SÜTIK TÖRLÉSE. Készült: Módosítva:

Beszámoló: a kompetenciamérés eredményének javítását célzó intézkedési tervben foglaltak megvalósításáról. Őcsény, november 20.

Fazekas Mihály Fővárosi Gyakorló Általános Iskola és Gimnázium

észbontó ördöglakat Megoldófüzet a szétszedéshez Egyszemélyes játék 8 éves kortól

Puskás Tivadar Távközlési Technikum

DLookup függvény 1. (5)

Keretszerződés költöztetési, szállítási feladatok ellátására a Pécsi Tudományegyetemen-2- AF módosítás

Conjoint-analízis példa (egyszerűsített)

Érettségi feladatok Algoritmusok egydimenziós tömbökkel (vektorokkal) 1/6. Alapműveletek

2011. március 9. Dr. Vincze Szilvia

Nemzeti Edzés Központ válogatott tenisz edzéseken való részvétel és egyéb időpontok igénybevétele a téli időszakban

Szakképzés - Meghatalmazás használata

Az abortusz a magyar közvéleményben

Fókuszban a formahibák. Konzultációs nap Minőségfejlesztési Iroda szeptember 18. Fekete Krisztina

Kérdések és feladatok

Reiz Beáta április

A környezettan tantárgy intelligencia fejlesztő lehetőségei

Árverés kezelés ECP WEBSHOP BEÉPÜLŐ MODUL ÁRVERÉS KEZELŐ KIEGÉSZÍTÉS. v ECP WEBSHOP V1.8 WEBÁRUHÁZ MODULHOZ

Jelentéskészítő TEK-IK () Válaszadók száma = 610

Szerb középszintű szóbeli vizsga értékelési útmutató

OmniTouch 8400 Instant Communications Suite 4980 Softphone

Minta programterv a 1. házi feladathoz

HWDEV-02A GSM TERMOSZTÁT

My Hipernet Home üzembehelyezési útmutató

FELVÉTELI TÁJÉKOZTATÓ

A döntő feladatai. valós számok!

Útmutató a vízumkérő lap kitöltéséhez

Algoritmuselmélet. Keresés, rendezés, buborék, beszúrásos, összefésüléses, kupacos, láda, radix. Katona Gyula Y.

Sikeres E-DETAILING KAMPÁNY receptje. GYÓGYKOMM KONFERENCIA Budapest, február 25. BALOGH JUDIT, PharmaPromo Kft.

A fiatalok pénzügyi kultúrája Számít-e a gazdasági oktatás?

SAP JAM. Felhasználói segédlet

INFORMATIKAI ALAPISMERETEK

Boldva és Vidéke Taka r ékszövetkezet

Boldva és Vidéke Taka r ékszövetkezet

MINTA. Fizetendô összeg: ,00 HUF. Telefonon: / ben: Interneten:

Kistarcsai Teljesítmény Túra

Disk Station DS209, DS209+II

Beszerzések, közbeszerzési eljárások; Összeférhetetlenség, szabálytalanság. Előadó: dr. Keszler Gábor NFFKÜ Zrt.

Egy El Classico tanulságai

Analízis elo adások. Vajda István október 3. Neumann János Informatika Kar Óbudai Egyetem. Vajda István (Óbudai Egyetem)

CAD-CAM

Belépési útmutató a MIAG weboldalra

A Felhasználónév és Jelszó mezőkbe írjuk be az adatainkat, majd kattintsunk a Bejelentkezés gombra, vagy üssük le az Enter billentyűt.

Az első lépések. A Start menüből válasszuk ki a Minden program parancsot. A megjelenő listában kattintsunk rá az indítandó program nevére.

xdsl Optika Kábelnet Mért érték (2012. II. félév): SL24: 79,12% SL72: 98,78%

Jelentés a kiértékelésről az előadóknak

BOLYAI MATEMATIKA CSAPATVERSENY FŐVÁROSI DÖNTŐ SZÓBELI (2005. NOVEMBER 26.) 5. osztály

KOVÁCS BÉLA, MATEMATIKA I.

Rendezési algoritmusok belső rendezés külső rendezés

Időzített rendszerek és az UPPAAL

MIKOR ÉLÜNK FIZIKAILAG AKTÍVAN?

Emelt szintű érettségi feladatsorok és megoldásaik Összeállította: Szászné Simon Judit; dátum: november. I. rész

Programozás. A programkészítés lépései. Program = egy feladat megoldására szolgáló, a számítógép számára értelmezhető utasítássorozat.

KLASSZIKUSOK 2 SZEMÉLYRE. 2 játékos részére, 10 éves kortól (+ egy szabály variáció 4 játékos esetére)

MEZŐGAZDASÁGI ALAPISMERETEK ÉRETTSÉGI VIZSGA II. A VIZSGA LEÍRÁSA

Operációkutatás. 2. konzultáció: Lineáris programozás (2. rész) Feladattípusok

X.6. NYERŐ PIROS. A feladatsor jellemzői

Keresőeljárások kétszemélyes játékokhoz

Épületvillamosság laboratórium. Villámvédelemi felfogó-rendszer hatásosságának vizsgálata

Hungarian Darts Open WDF III. Kategóriás, BDO C kategóriás Ranglista Verseny május

Áramlástechnikai gépek soros és párhuzamos üzeme, grafikus és numerikus megoldási módszerek (13. fejezet)

A mérgezett csoki játék új megközelítés

Mágneses szuszceptibilitás vizsgálata

Átírás:

Kétszemélyes, teljes információjú, véges és determinisztikus, zéró összegű, játékok V. Játékok Két játékos lép felváltva adott szabályok szerint, amíg a játszma véget nem ér. Mindkét játékos ismeri a maga és az ellenfele összes múltbeli és jövőbeli lépéseit és lépési lehetőségeit, és azok következményeit. Minden lépés véges számú lehetőség közül választható, és minden játszma véges lépésben véget ér. Egy lépés determinisztikus, a véletlennek nincs szerepe. mennyit a játszma végén az egyik játékos nyer, annyit veszít a másik. (Legegyszerűbb változatban: egyik nyer, másik veszít, esetleg lehet döntetlen is) 1 Állapottér-reprezentáció Grundy mama játéka állapot állás + soron következő játékos művelet lépés kezdő állapot kezdőállás + kezdő játékos végállapot végállás + játékos célfüggvény mindkét játékosnak van célfüggvénye p, p : végállapot R o Zéró összegű kétszemélyes játék esetén: p (t) + p (t) = 0 o Speciális zéró összegű kétszemélyes játék esetén: p (t) = +1 ha t állapotban az játékos nyer (célállapot, nyerő állás -nak) p (t) = 1 ha t állapotban az játékos veszít (vesztő állás -nak) p (t) = 0 ha t állás döntetlen 3 4 Grundy mama játékgráfja Grundy mama játékfája ;,1; 5, ; 4, 3 ; 5, 1, 1 ; 4,, 1 ; 3,, ; 3, 3, 1 ;, 1 5, 4, 3 5, 1, 1 4,, 1 4,, 1 3,, 4,, 1 3, 3, 1 4, 1, 1, 1 ; 3,, 1, 1 ;,,, 1 ; 3, 1, 1, 1, 1 ;,, 1, 1, 1 ; nyer, 1, 1, 1, 1, 1 ; nyer nyer 4, 1, 1, 1 3,, 1, 1 3,, 1, 1 3,, 1, 1,,, 1 3,, 1, 1 3,, 1, 1 3,1,1,1,1,,1,1,1,,1,1,1,,1,1,1,,1,1,1,,1,1,1,1,1,1,1,1 5 1

Játékfa Hogyan tud a játékos biztosan nyerni? csúcs állás (egy állás több csúcs is lehet) szint játékos (felváltva az és szintjei) él lépés (szintről szintre) gyökér kezdőállás (kezdő játékos) levél végállások ág játszma, 1 5, 4, 3 5, 1, 1 4,, 1 4,, 1 3,, 4,, 1 3, 3, 1 4, 1, 1, 1 3,, 1, 1 3,, 1, 1 3,, 1, 1,,, 1 3,, 1, 1 3,, 1, 1 3,1,1,1,1,1,1,1,1,1 győztes stratégia garantál egy győztes játszmát.,,1,1,1,,1,1,1,,1,1,1,,1,1,1,,1,1,1 Egy győztes játszmához az ellenfél játéka is kell. Nyerő stratégia Megjegyzés Egy játékos nyerő (vagy nem-vesztő) stratégiája egy olyan elv, amelyet betartva az ellenfél minden lépésére tud olyan választ adni, hogy megnyerje (ne veszítse el) a játékot. nyerő stratégia NEM egyetlen győztes játszma, hanem olyan győztes játszmák összessége, amelyek közül az egyiket biztos végig tudja játszani az a játékos, aki rendelkezik a nyerő stratégiával. nyerő (nem-vesztő) stratégia egy megfelelő ÉS/VGY fa részfájával ábrázolható. Ez a részfa az ÉS/VGY fa olyan hiper-útja, amely a kezdő állás csúcsából (startcsúcs, gyökércsúcs) vezet a nyerő (nem-vesztő) végállások csúcsaiba. nyerő stratégia keresése tehát egy ÉS/VGY gráfbeli hiper-út keresési probléma. 9 10 Nyerő stratégia keresése a játékos ÉS/VGY fájában Nyerő stratégia keresése az játékos ÉS/VGY fájában Nincs nyerő stratégia. Csak az egyik játékosnak lehet nyerő stratégiája. 11 1

Tétel Ha a döntetlen nem megengedett, akkor bármelyik kétszemélyes játékban az egyik játékos számára biztosan létezik nyerő stratégia. Döntetlen esetén pedig nem vesztő stratégia. 13 Részleges játékfa-kiértékelés nyerő stratégia megkeresése egy nagyobb játékfa esetében reménytelen. z optimális lépés helyett a soron következő jó lépést keressük. Legyen a bennünket képviselő játékos neve mostantól MX, az ellenfélé pedig. Ehhez az aktuális állapotból indulva kell a játékfa néhány szintjét felépíteni, ezen a részfa leveleinek számunkra való hasznosságát megbecsülni, majd ez alapján a soron következő lépést meghatározni. 14 Kiértékelő függvény Minden esetben szükségünk van egy olyan heurisztikára, amely a mi szempontunkból becsüli meg egy állás hasznosságát. Sokszor ez egy f : Állások [-1000.. 1000] függvény. Minimax algoritmus 1. játékfának az adott állás csúcsából leágazó részfáját felépítjük néhány szintig.. részfa leveleit kiértékeljük aszerint, hogy azok számunkra kedvező, vagy kedvezőtlen állások. 3. z értékeket felfuttatjuk a fában: saját (MX) szintek csúcsaihoz azok gyermekeinek maximumát, z ellenfél () csúcsaihoz azok gyermekeinek minimumát. 4. Soron következő lépésünk ahhoz az álláshoz vezet, ahonnan a gyökérhez felkerült a legnagyobb érték. 15 1 Megjegyzés MX z algoritmust minden alkalommal, valahányszor mi következünk, megismételjük, hiszen lehet, hogy az ellenfél nem az általunk várt legerősebb lépésekkel válaszol, mert: MX 3 - -4-1 - 5 1 3 10 eltérő mélységű részfával dolgozik, más kiértékelő függvényt használ, nem minimax eljárást alkalmaz, hibázik. 1 1 3

Átlagoló kiértékelés Váltakozó mélységű kiértékelés z (m,n) átlagolás célja a kiértékelő függvény esetleges tévedéseinek simítása. MX szintjeire a m darab legnagyobb, szintjeire az n legkisebb értékű gyerek átlaga kerül. MX MX m=,n=.5.5 9 4.5 9 4 0 5 4 4-1 9-1 - 19 9 Célja, hogy a kiértékelő függvény minden ágon reális értéket mutasson. Nem megbízható ez az érték abban a csúcsban (f(aktuális)), amelynek gyerekénél a kiértékelő függvény lényegesen eltérő értéket (f(gyerek)) mutat. Ezekben az esetekben a részfát tovább kell építeni ezen csúcsokból addig, amíg nem teljesül a nyugalmi teszt: f(aktuális) f(gyerek) K. Ha a nyugalmi teszt nem felel meg egy csúcs, de vannak olyan gyerekei, amelyekre f(aktuális) f(gyerek) < K, akkor ezekre a gyerekekre nem kell a nyugalmi tesztet megismételni, ezek levélcsúcsok lesznek. 0 Szelektív kiértékelés 9 9 3 10-4 4 3 1 0 MX MX Célja a memória-igény csökkentése. Elkülönítjük a lényeges és lényegtelen lépéseket, és csak a lényeges lépéseknek megfelelő részfát építjük fel. Ez a szétválasztás heurisztikus ismeretekre épül. min mélység= max mélység=5 nyugalmi teszt = 3-5 3 MX 1 Negamax algoritmus Negamax eljárást könnyebb implementálni. z ellenfél szintjén levő levelek értékének vesszük a ( 1)- szeresét, majd minden szinten szülő:= max( gyerek 1,..., gyerek n ) MX - - MX 3 - -4 5-3 - 1 3 10 - - 4-1 -3-10 -5 3 1 3 4 4

lfa-béta algoritmus Visszalépéses algoritmus segítségével járjuk be a részfát (mélységi bejárás). z aktuális úton fekvő csúcsokat ideiglenes értékekkel látjuk el: a mi szintünkön értékkel (ennél rosszabb értékű állásba innen már nem juthatunk), az ellenfelén értékkel(ennél jobb értékű állásba onnan már nem juthatunk) látjuk el. Lefelé haladva =-, és =+. Ezek visszalépéskor a felhozott értékre változnak, ha az nagyobb, mint az, illetve kisebb, mint a. Vágás: ha az úton van olyan és, hogy. - = = + + - 4 = - - -1 = + + + + + - 4-1 - 4-1 5 Elemzés Ugyanazt a kezdőlépést kapjuk eredményül, amit a minimax algoritmus talál. (Több egyforma kezdőirány esetén a baloldalit választjuk.) Memória igény: csak egy utat tárol. Futási idő: a vágások miatt sokkal jobb, mint a minimax módszeré. Átlagos eset: egy csúcs alatt, két belőle kiinduló ág megvizsgálása után már vághatunk. Optimális eset: egy d mélységű b elágazású fában kiértékelt levélcsúcsok száma: d b Jó eset: részfa megfelelő rendezésével érhető el. Kétszemélyes játékot játszó program Váltakozó mélységű, szelektív, (m,n) átlagoló, negamax alfa-béta kiértékelést végez. Keretprogram, amely váltakozva fogadja a felhasználó lépéseit, és generálja a számítógép lépéseit. Kiegészítő funkciók (beállítások, útmutató, segítség, korábbi lépések tárolása, mentés stb.) Felhasználói felület, grafika Heurisztika megválasztása (kiértékelő függvény, szelekció, kiértékelés sorrendje) 5