Mesterséges Intelligencia MI

Hasonló dokumentumok
Kétszemélyes játékok

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

V. Kétszemélyes játékok

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Mesterséges Intelligencia MI

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Mesterséges intelligencia 3. laborgyakorlat

Mesterséges Intelligencia MI

ULTIMATE TIC TAC TOE. Serfőző Péter

Nyerni jó évfolyam

Mesterséges Intelligencia MI

Megerősítéses tanulási módszerek és alkalmazásaik

Problémamegoldás kereséssel. Mesterséges intelligencia március 7.

GEOMATECH TANULMÁNYI VERSENYEK ÁPRILIS

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Mesterséges Intelligencia MI

SZOFTVERES SZEMLÉLTETÉS A MESTERSÉGES INTELLIGENCIA OKTATÁSÁBAN _ Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.

Bonyolult jelenség, aminek nincs jó modellje, sok empirikus adat, intelligens (ember)ágens képessége, hogy ilyen problémákkal mégis megbirkozzék.

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Döntési rendszerek I.

Az alábbi szabály-elemek különböző kombinációi számos dámaváltozatot eredményeznek.

Játékelmélet. előadás jegyzet. Kátai-Urbán Kamilla. Tudnivalók Honlap: Vizsga: írásbeli.

Nem-kooperatív játékok

KÉTSZEMÉLYES JÁTÉKOK

Garry Kasparov a Deep Blue ellen

Megerősítéses tanulás 2. előadás

Isola (1-1 db sötét és világos király-bábu és max. 45 db blokk-bábu) A lépések két fázisból állnak: (1.) bármelyik oldalszomszédos mezőre áttoljuk a

Mesterséges Intelligencia MI

Adatszerkezetek 7a. Dr. IványiPéter

Mesterséges Intelligencia MI

Mesterséges intelligencia 2. laborgyakorlat

Mesterséges Intelligencia MI

Megerősítéses tanulás 7. előadás

Mesterséges Intelligencia MI

Rasmusen, Eric: Games and Information (Third Edition, Blackwell, 2001)

Martinique Martiniqui

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

Vizsgafeladatok és gyakorló feladatok generálása

Kereső algoritmusok a diszkrét optimalizálás problémájához

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

Állapottér reprezentáció/level1

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Mesterséges Intelligencia MI

Megoldások 4. osztály

Adatszerkezetek 2. Dr. Iványi Péter

Intelligens Rendszerek Elmélete IRE 4/32/1

Kooperáció és intelligencia kis HF-ok/ Kooperáció és intelligencia, Dobrowiecki T., BME-MIT 1

A játék készlet tartalma: 40 bábu sógitábla játékszabályok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Informatikai Rendszerek Alapjai

Döntési rendszerek I.

Mesterséges Intelligencia I. kötelező program

A számítástudomány alapjai. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem

Kereső algoritmusok a diszkrét optimalizálás problémájához







N-személyes játékok. Bársony Alex

Mesterséges Intelligencia MI

Megerősítéses tanulás

Számítógép és programozás 2

Játékok és a számítógép

Debreceni Egyetem Informatikai Kar. Kétszemélyes logikai játékok

2. Visszalépéses keresés

JÁTÉKELMÉLETTEL KAPCSOLATOS FELADATOK

2015/ Szegedi Tudományegyetem Informatikai Intézet

Mesterséges Intelligencia 1

Mesterséges Intelligencia MI

Algoritmuselmélet 2. előadás

Rendezések. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar október 24.

f B B 1 B 2 A A 2 0-1

13. Egy x és egy y hosszúságú sorozat konvolúciójának hossza a. x-y-1 b. x-y c. x+y d. x+y+1 e. egyik sem

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Csapatjáték. felépítés

100% BIO Natur/Bio kozmetikumok és testápolás

Monoton Engedmény Protokoll N-M multilaterális tárgyalás

Rejtvény-változataikban: a legkevesebb lépésből álló (és/vagy visszalépés tiltása melletti) helycsere a feladat.

8 bivaly 2 tigris ellen

1000 forintos adósságunkat, de csak 600 forintunk van. Egyetlen lehetőségünk, hogy a

1. gyakorlat. Mesterséges Intelligencia 2.

Függvények növekedési korlátainak jellemzése

Megerősítéses tanulás

30. ERŐSEN ÜSSZEFÜGGŐ KOMPONENSEK

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

Mesterséges Intelligencia (MI)

A katonai rangfokozatok

6. EGYETEMI 24 ÓRÁS PROGRAMOZÓI VERSENY (PROGRAMOZÁS 1)

file:///d:/okt/ad/jegyzet/ad1/b+fa.html

FELÜGYELT ÉS MEGERŐSÍTÉSES TANULÓ RENDSZEREK FEJLESZTÉSE

Algoritmuselmélet. Mélységi keresés és alkalmazásai. Katona Gyula Y.

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Tanulás elosztott rendszerekben/3

A megerősítéses tanulás alkalmazása az Othello játékban

Evolúciós algoritmusok

Összefoglalás és gyakorlás

2. Visszalépéses stratégia

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Átírás:

Mesterséges Intelligencia MI Keresés ellenséges környezetben Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade

Ellenség elleni játékok, kétszemélyes játékok,... Probléma: nem csak mi lépünk, az ellenség is lép nem tudjuk, mit fog lépni mindenre fel kell készülni megfelelő válaszlépéssel, azaz stratégiával (l. korábban eshetőségi problématípus) zérus-összegű, vagy sem? keresés eredménye = stratégia = optimális/jó válasz az ellenség minden lépésére volt már(?): MDF, U(s), Q(s), optimális stratégia

Sakk: Játék állapottere: állások száma (10 47 ) Játék játékfája: játékok száma (10 123 ) (Átlagos) elágazás: (35)

Minimax gondolata Tulajdonságai Teljes? Igen, ha a fa véges. Optimális? Igen, egy optimálisan játszó ellenféllel szemben. Különben? Időkomplexitás? O(b m ) Tár? O(bm) (mélységi jelleg miatt) (sakk: b 35, m 80? O(10 123 )) (de szükséges minden ágat feltárni?)

Nim II-Nim 1. Bizonyos számú gyufakupac. 2. Egy lépésben egy játékosnak tetszőleges sz. gyufát szabad elvenni, de csakis egyetlen egy kupacról. 3. Aki az utolsó veszi el, veszít.

+1

+1 +1

+1 +1

+1 +1 +1

+1 +1 +1 +1

+1 +1 +1 +1

+1 +1 +1 +1

+1 +1 +1 +1

+1 +1 +1 +1

+1 +1 +1 +1 (A játék megoldása: Aki kezd, az veszít, ha az ellenfél optimálisan játszik)

Dámajáték megoldva, hibátlan játék döntetlenhez vezet! Dámajáték keresési tere kb. 5 x 10 20 pozició. Történelem 1950 - Arthur Samuel öntanuló programja 1963 1 győztes parti tehetséges emberjátékos ellen 1989 - Chinook projekt, legyőzni emberi világbajnokot 1990 - Chinook jogosult Világbajnokságban részt venni 1992 - Marion Tinsley világbajnok a világbajnoki címért folytatott mérkőzésen nehezen felül kerekedik 1994 visszavágó, Tinsley egészségi állapota miatt visszalép, rövidesen meghal 1996 - Chinook minden emberi játékosnál erősebb

A számítások története 1989 2007 1992 csúcs: több, mint 200 processzor 2006-2007 átlagosan 50 processzor A leghosszabb folyamatosan futtatott elosztott számítás ezidáig Számítások és az informatikai rendszerek megbízhatósága Nagy méretű adatfájlok gyakori mozgatása helyi diszkre, hálózaton más gépre hibák évente többször (duplikálás, ellenőrzés) Kiszámított kész adatbázisok periodikus ellenőrzése adatvesztés veszélye miatt ( bit rot ), másolatmentés, újraszámítás diszk gyártók jótállása 10 3 hibaarány számítások annál sokkal bonyolultabbak http://webdocs.cs.ualberta.ca/~chinook/

Minimax algoritmus Tegyük fel, hogy tudjuk, hogy a játék kimenetele csakis és 1. Spórolhatunk-e a számításokból? És ha valós? Jogos levágások (cut-off)

Minimax algoritmus

Minimax és alfa-béta nyesés MAX >=2 Játékfa generálása mélység először jelleggel, d mélységig. Ha lehetséges, a kiértékelő függvényértékek becsléseinek (alfa és béta értékek) visszaterjesztése. MIN MAX =2 A végleges döntést befolyásolni nem képes ágak nyesése. 2 7 1 Garantált minimax eredmény kevesebb ill. legalább ugyanannyi számítással. <=1?

Minimax és alfa-béta nyesés Nyesés a végeredményt nem befolyásolja. Jó lépésrendezés fokozza a nyesés hatékonyságát "Tökéletes rendezéssel" az időkomplexitás = O(b m/2 ) Átlagosan = O(b 3m/4 ) a keresés mélységét duplázza (sakknál O(b m/2 ) = O(( b) m ) effektív b az eredeti 35 helyett: b = 35 6) Ha m a Játékos számára jobb, mint n, akkor a játék során sosem fogunk elérni n-be.

http://inst.eecs.berkeley.edu/ ~cs61b/fa14/ta-materials/apps/ ab_tree_practice/

Kiértékelő függvények Állapot szám leképezés. Minél nagyobb a szám, annál értékesebb az állapot (pozíció).(ld. implicit állapotábrázolás a megerősítéses tanulásnál) Adott állapot minősítése egy bizonyos mélységű keresési fa bejárása, ahol a levelek nem a játék végállapotai, hanem a kiértékelő függvénnyel minősített közbülső állapotok. Játék elején (a célállapottól messze a kiértékelő függvény pontatlan, valamilyen mélységű kereséssel kell párosítani. Játék végén (a célállapothoz közel) a kiértékelő függvény olyan pontos is lehet, hogy az állapot jellemzésére akár közvetlenül is alkalmazható. Deep Blue I Deep Blue II, 6400 8000 jellegfüggvény (chess chip) http://www.sciencedirect.com/science/article/pii/s0004370201001291

Játékfa véletlen elemet tartalmazó teljes információjú játékoknál Játékosak döntésállapotai + a természet véletlen állapotai = esélycsomópontok (chance nodes), a problémára jellemző valószínűségekkel. Állapotértékelés = végleges várható értékeke.... Egyágenses problémák = speciális 2 ágenses játékproblémák a másik ágens a környezet: nem törődik semmivel (nem ellenséges) a nyeresége az ágens költsége (ellenséges)

Kis HF9 Játékszabályok: 1. Piros lép elsőnek. 2. Mindenki lépéskényszerben van. 3. Játékos léphet valamelyik szomszédos mezőre, ha az szabad, ill. átugarhatja az ellenfelét, ha az vele szomszédos és a mögötte lévő mező üres. 4. Az győz, aki elsőnek éri el az ellenfél kiinduló pozicióját. Feladatok/kérdések: 1. Rajzolja fel (kockás papír preferált) a játék játékfáját! (Ügyeljen arra, hogy a oda-vissza lépések miatt a játékfa végtelen ágakat is tartalmaz. Azokat a húrkok bevezetésével szüntesse meg!) 2. Érjen a piros győzelme +1, a fehér győzelme pontot. Minimax algoritmussal állapítsa meg a gyökér értékét (azaz ki a biztos győztes)! A számításnál ügyesen vegye figyelembe a húrkok létezését.