Keresőeljárások kétszemélyes játékokhoz



Hasonló dokumentumok
Mesterséges Intelligencia I. (I602, IB602)

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

Mesterséges Intelligencia I. előadásjegyzet (vázlat)

SZAKDOLGOZAT. Hucker Dávid

Előterjesztés. a Képviselő-testület február 28-i ülésére

Szakdolgozat. Pongor Gábor

Spike Trade napló_1.1 használati útmutató

Mesterséges intelligencia

Mesterséges intelligencia 3. laborgyakorlat

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Mesterséges Intelligencia I. gyakorlat

OPERÁCIÓKUTATÁS, AZ ELFELEDETT TUDOMÁNY A LOGISZTIKÁBAN (A LOGISZTIKAI CÉL ELÉRÉSÉNEK ÉRDEKÉBEN)

Intelligens Rendszerek I. Problémamegoldás kereséssel: informált kereső eljárások (Heurisztikus keresés)

A logisztikai rendszer tervezésének alapesetei

I. Katonai Hatósági Konferencia. ltozások az. dr. Bedő Katalin Belügyminiszt. gyminisztérium

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Vizsgakérdések az MI előadás anyagából A Russel féle négy cél MI rendszer 2. Megoldás keresés az állapottérben: hegymászó keresés, Hanoi

VWeidmüller megoldások és szolgáltatások. Tartalom. Weidmüller megoldások és szolgáltatások

Kiváló Építési Termék termék-specifikus követelményei Követlménylap I/VIII

Nemesfémek visszanyerése katalizátorokból. 1. rész Alapelvek

A PÁLYÁZAT LEFOLYÁSA, SZEMÉLYI, TARTALMI VÁLTOZÁSAI

Máté: Számítógépes grafika alapjai

AZ ADATKÖZPONT ÉS FELHŐ PIAC HELYZETÉRŐL MAGYARORSZÁGON ÉS A RÉGIÓBAN CZOCH ANDRÁS ADATKÖZPONT ÉS FELHŐ MUNKACSOPORT FEBRUÁR 4.

A megvásárolt eszközök a Körösi Csoma Sándor Kulturális Központ leltárába kerülnek. A

I S R G Gépi tanulás, neuronhálók

ALGORITMUSOK ÉS BONYOLULTSÁGELMÉLET Matematika MSc hallgatók számára. 3. Előadás

Többet látni... Többet nyújtani... testo 875 és testo 881

Dozimetrikus Dozimetrikus 2/42

DOMSZKY ZOLTÁN. Gondolkodj!

PROJEKT ADATLAP. a Társadalmi Infrastruktúra Operatív Program keretében meghirdetett

NEM-DETERMINISZTIKUS PROGRAMOK HELYESSÉGE. Szekvenciális programok kategóriái. Hoare-Dijkstra-Gries módszere

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2015/ Szegedi Tudományegyetem Informatikai Tanszékcsoport

Dr. Mikó Balázs

Pusztaottlaka Községi Önkormányzat

A DEMOGRÁFIÁI ÉS A SZOCIOLÓGIAI ÉLETRAJZ EGYESÍTÉSE A NŐI ÉLETÜT V IZSG ÁLATA ALAPJÁN DR. M O LNÁR LÁSZLÓ

Rövidtávú munkaerő-piaci prognózis 2012

1. AZ MI FOGALMA. I. Bevezetés. Tulajdonságok. Kezdet ELIZA. Első szakasz (60-as évek)

Mesterséges intelligencia 1 előadások

Munkáltatói kapcsolattartás, közvetítés. Kovács Nóra

A fenntartható társadalom elvárásai. Gyulai Iván november 21. Budapest

Minőségi munka vs Adózás

end function Az A vektorban elõforduló legnagyobb és legkisebb értékek indexeinek különbségét.. (1.5 pont) Ha üres a vektor, akkor 0-t..

II. PÁLYÁZATI ÚTMUTATÓ a Társadalmi Megújulás Operatív Program. A szak- és felnőttképzés struktúrájának átalakítása konstrukció keretében

Pál László. Sapientia EMTE, Csíkszereda, 2014/2015

E-420. Műszaki adatok. Típus. Kereső. Szenzor. Képprocesszor. Szűrő. Kivételesen egyszerű kezelhetőség

TÁRGYSOROZAT. 1) A szociális igazgatásról és szociális ellátásokról szóló rendelet felülvizsgálata, rendelet alkotása

A kétcsöves rendszerek kiegyensúlyozásának új módszerei

Intelligens Rendszerek Elmélete IRE 4/32/1

Mesterséges intelligencia feladatsor

Elektrohidraulikus berendezések hibadiagnosztizálása sajtológép példáján

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 2. MA3-2 modul. Eseményalgebra

Irodai VitaminGombóc. Új, professzionális borítékolási megoldás a közepes mennyiségű kimenő postázásban YOUR MAIL IS OUR BUSINESS

ELŐTERJESZTÉS. Tiszasas Község Önkormányzat Képviselő-testületének december 20. napján tartott nyílt testületi ülésére

Beatriz / Ogono / Doniene fogantyúk

A Veres Péter Gimnázium Pedagógiai programja

V. Kétszemélyes játékok

Mezőgazdasági vállalatok stratégiai menedzsmentje. /Elméleti jegyzet/

Kétszemélyes játékok

9. előadás Környezetfüggetlen nyelvek

/Egységes szerkezetben /

A foglalkoztatottság és a munkanélküliség szerkezetét befolyásoló társadalmi-területi tényezők

Mesterséges Intelligencia MI

Csalásfelderítés és előrejelzési megoldás május 20.

Z A T R E papíron-ceruzával-dobókockával

II. Szabályalapú következtetés

NEMZEDÉKEK TUDÁSA TANKÖNYVKIADÓ

Források összesen 6875,4

A Gravírozás még soha sem volt ilyen egyszerű!

Egy matematikai módszer tutajos feladatok

Algoritmusok vektorokkal keresések 1

BÉKÉSCSABA MEGYEJ JOGÚ V AR OS. Békéscsaba, Szent Jstván tér 7.

1 Rendszer alapok. 1.1 Alapfogalmak

A Tolna Megyei Kormányhivatal

30/1999.(X.26) számú rendelete A helyi építészeti értékek védelméről. (Egységes szerkezet)

Optimalizáld a működésed avagy Hogyan találd meg rejtett költségeidet? Előadó: Gleisz Gábor

Budapest XXI. kerület Csepel Önkormányzata Képviselő-testülete 53/2011. (XII. 15.) önkormányzati rendelete

Vatta Község Önkormányzat Képviselő-testületének december 17-én megtartott nyílt ülésének jegyzőkönyvéből: 17./2014./XII.23./ R e n d e l e t e

Óbudai Egyetem. Doktori (PhD) értekezés. Adatpárhuzamos sejtmagkeresési eljárás fejlesztése és paramétereinek optimalizálása Szénási Sándor

NEMZETI KÖZSZOLGÁLATI EGYETEM

KEZEK - Észak-Magyarország felsőoktatási intézményeinek együttműködése TÁMOP C-12/1/KONV. V. alprogram: Minőségirányítási rendszer fejlesztése

Cigánd Város Önkormányzat Képviselő-testületének 3/2009.(I.29.) számú rendelete a helyi építészeti értékek védelméről

A meteorológia az időjárás tudománya

Programozás I. Metódusok C#-ban Egyszerű programozási tételek. Sergyán Szabolcs

Pályázati űrlap kitöltési útmutató az EGT és Norvég Finanszírozási Mechanizmusok pályázati kiírásaihoz

MEGBÍZÁSIszERzönÉS. (a továbbiakban együttes említésük során: Felek) kötöttek egymással az alulírott napon és feltétel ekkel.

Hálózatsemlegesség - egységes internet szolgáltatás-leíró táblázat

Csuklós létrák 9 STABILO. TriMatic csuklós állólétra 52. o. Csuklós állólétra 53. o. MultiMatic univerzális csuklós létra 54. o.

A rögzített tengely körül forgó testek kiegyensúlyozottságáról kezdőknek

Klasszikus alkalmazások

- láda- vagy játékleírásból láda/játéklistába visszatérve nem a lista elejére ugrik, hanem ugyanoda, ahol voltunk a listában

Útmutató ismertető közzétételének engedélyezéséhez

Legrövidebb utat kereső algoritmusok. BFS (szélességi keresés)

8. Mohó algoritmusok Egy esemény-kiválasztási probléma. Az esemény-kiválasztási probléma optimális részproblémák szerkezete

Többtermékes folyamatos technológi

Problémamegoldás kereséssel. Mesterséges intelligencia március 7.

5. modul - Adatbázis-kezelés

KÖRNYEZET ÉS ENERGIA OPERATÍV PROGRAM Hatékony energia-felhasználás Akcióterv

Informatika E FAKT , = ±

Kutatási beszámoló. a KDOP-3.1.1/D2/13-k jelű, Szociális város-rehabilitáció Szárazréten elnevezésű projekt hatásának mérése

A HATÉKONYSÁG ELEMZÉSÉNEK NÉHÁNY KÉRDÉSE A MAGYAR AGRÁRGAZDASÁGBAN, KÜLÖNÖS TEKINTETTEL AZ EU- CSATLAKOZÁSRA

Átírás:

Keresőeljárások kétszemélyes játékokhoz Összeállította : Vályi Sándor Prof. Dr. Heiner Stuckenschmidt (Universität Mannheim) előadása nyomán http://www.google.hu/url?sa=t&source=web&ct=res&cd=5&ved=0cbcqfjae&url=http%3a%2f%2fki.informatik.uni-- mannheim.de%2ffileadmin%2fteaching%2fki%2f2009%2f6- Spielbaumsuche.ppt&rct=j&q=minimax+negamax+filetype %3Appt&ei=bn4FS7rpBp_cmgPWwMTICg&usg=AFQjCNFg9LosMFOWOrO3dA7XLNlGN-iTmg Letöltve: 2009. nov. 19.

Játéktípusok Determinisztikus Sztochasztikus Teljesen megfigyelhető Parciálisan megfigyelhető Sakk, Go Torpedó Backgammon, Monopoly Bridzs, Póker

Adatbázis-módosítható keresési eljárások ToDoListe := [Startzustand] LOOP IF ToDoLista üres THEN fail Csomópont := Select(ToDoLista) IF MEGOLDÁS(Csomópont) THEN succeed Rand := BESZÚR(KITERJESZT(Knoten), ToDoListe) Arad Timisoara Sibiu Zerind Lugoj Rimnicu Vilcea Fagaras Oradea Oradea Mehadia Craiova Pitesti Bucharest Zerind Sibiu Faragas Drobeta Drobeta Pitesti Bucharest Craiova Arad Rimnicu Vilcea Arad Bucharest

Játékok mint keresési problémák Formalizálás állapottérként Operátorok: lehetséges lépések Célállapot: nyerő, ill. vesztő állások Költség: Pontnyereség ill. -veszteség Keresési tér: Játék-fa Probléma: Az ellenfél lépései nem tervezhetők

Példa: Tic-tac-toe 2 játékos: o und x Determinisztikus Teljesen megfigyelhető Nullaösszegű játék

Játékok, mint ÉS/VAGY fák 1 Játék nyerve 0 Játék vesztve saját lépés ellenfél lépése 0 1 1 0 0 0 1 0 Nyerni fogunk?

Játékok, mint ÉS/VAGY fák 1 Játék nyerve 0 Játék vesztve saját lépés ellenfél lépése 0 1 1 0 0 0 1 0 Igen, ha helyes stratégiát választunk?

Gondok a játékfában való kereséssel Meghatározhatjuk, mely lépések vezetnek győzelemhez Gond: a keresési fa túl nagy ahhoz, hogy teljesen végigkeressük Megoldás: Mélységkorlátozott keresés olyan mélységig, amit meg tudunk valósítani Gond: Honnan tudhatjuk, hogy tényleg nyerünk egy bizonyos állásban? Megoldás: A köztes állapotokra értékelő heurisztikát alkotunk

Részleges játékfák????????

Részleges játékfák h(n) 2 5 9 3 1 4 7 8 Figyelem: h(n) a heurisztikát jelenti, nem a költséget!!

Részleges játékfák A legnagyobb várható haszont ígérő lépést tesszük meg max min Az ellenfél azt a lépést választja, amely számunkra a legkisebb hasznot hozza min max max max max h(n) 2 5 9 3 1 4 7 8

Részleges játékfák 5 max 5 min 4 min 5 9 max max 4 max 8 max h(n) 2 5 9 3 1 4 7 8

Részleges játékfák A többet ígérő ágat választjuk és ott majd újra végrehajtjuk a keresést. 5 max 5 min 4 min 5 max 9 max 4 max 8 max h(n) 2 5 9 3 1 4 7 8

Feltételezések Racionális magatartásból indultunk ki: Minden játékos a saját nyereségét próbálja maximalizálni Az ellenfél húzásai csökkenteni próbálják a saját játékos hasznát minmax(n) = h(n), ha n VÉGÁLLAPOT max{ minmax(h(s)) s n után jövő állás}, ha mi következünk min{minmax(h(s)) s n után jövő állás} ellenséges lépésnél

A Minimax algoritmus tulajdonságai Teljesség:: IGEN/NEM: teljes, véges játékfák esetén Optimalitás: IGEN/NEM: felttételezvez, hogy az ellenfél is optimálisan játszik Időbonyolultság: O(b n ): mint mélységkorlátozott keresés. Speicherkomplexitaet: O(b n ): mint mélységkorlátozott keresés.

Kompakt reprezentáció A Min és a Max csomópontok megkülönböztetése megnehezíti az implementációt Tiszta maximalizálási problémaként való megfogalmazása: Alap: min(a,b) = -max(-a,-b) A negatív nyereségi várakozás definíciója: negamax(n) = hasznosság(n), ha n maxim. mélységű max{-negamax(s) s n rákövetkezője} hasznosság(n) = h(n) saját lépésnél -h(n) ellenfél lépésénél

Negamax játékfák negamax(n) = max{-u(n)} 5 max -5 max -4 max 5 9 max max 4 max 8 max u(n) -2-5 -9-3 -1-4 -7-8

A NegaMax rekurzív kiszámítása int Negamax (Csomópont n) int value; succ = KITERJESZT(n); if (succ üres) return u(n) ; value := - ; foreach ( s in succ) value := max(value, -Negamax(s)); return value;

Használhatóság Az időbonyolultság nagy gond: A valódi játékok óriási játékfával bírnak: Dáma: 10 78, Sakk 10 120, Go 10 761 Sakk: Kb. 40 lépés minden állásban Azaz, kb 2 Mio csomópont, ha 2 lépést előre tervezünk Kezdők 3-4 lépést terveznek, Profik kb. 10-ig Megoldás: A keresési tér korlátozása (levágás, pruning) Ötlet: ágak, amelyek jobb megoldást nem tartalmazhatnak, kihagyjuk a keresésből A Branch&Bound (ág-és-korlát) algoritmus alkalmazása

Honnan jönnek a kiértékelő függvények? Nehéz játtékoknál nem a végigjátszásból Alternatíva: mélységkorlátozás és empirikus heurisztikus értékelések sakk: gyalog: 1, huszár és futó 3, bástya 5, királynő 9

Végállási adatbázisok Minden olyan pozíció esetén teljse stratégia tárolása, ahol pl. már csak N darab bábu van a táblán. Ha ilyen pozíciót érünk el a játékfában, akkor nem becslünk, hanem pontos hasznosságot tudunk számolni Fehér lép, matt 3 féllépésben

Lehet bonyolult is matt 262 lépésben!!

Probléma a végállás-adatbázissal Még az automatikus létrehozása is extrém módon erőforrás-igényes Persze az imént említett keresési módszereket használhatjuk A tárigény: 5 figurával: 7 GB 6 figurával: 1.2 TB 7 figurás végállásokat a közeli jövőben biztos nem lehet tárolni Gyorsabb lehet az állásra egy keresőt indítani Kivétel? Mint az utolsó fólián

Nem-Determinisztikus játékok Példa: Backgammon A lehetséges lépések koczkadobástól függnek Minimax-fát nem lehet építeni

Várhatóérték-minimax A kockadobásokat mint plusz csomópontokat bevonni a fába A Minimax-értékbe a különböző csomópontok értékei a kockadobás érintett kimenetének valószínűségével súlyozva, várható értékként kerül be.

Egy egyszerű példa Játék pénzfeldobással:

Backgammon:

Költségszámítás Várhatóérték-számítással