VIII. INDUKTÍV TANULÁS

Hasonló dokumentumok
TANULÁS. I. Logikai formulák tanulása. Tanulási módok. Miért m ködik jól az induktív tanulás? Induktív tanulás

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Programozási módszertan. A gépi tanulás alapmódszerei

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

2. A példahalmazban n = 3 negatív és p = 3 pozitív példa van, azaz a példahalmazt képviselő döntési fa információtartalma: I = I(1/2, 1/2) = 1 bit.

1. gyakorlat. Mesterséges Intelligencia 2.

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

ÍTÉLETKALKULUS (NULLADRENDŰ LOGIKA)

A logikai következmény

Mesterséges Intelligencia MI

Gráfok 2. Legrövidebb utak, feszítőfák. Szoftvertervezés és -fejlesztés II. előadás. Szénási Sándor

Számítógép és programozás 2

Mesterséges Intelligencia I. (I602, IB602)

Logika és informatikai alkalmazásai kiskérdések február Mikor mondjuk, hogy az F formula a G-nek részformulája?

5/1. tétel: Optimalis feszítőfák, Prim és Kruskal algorithmusa. Legrövidebb utak graphokban, negatív súlyú élek, Dijkstra és Bellman Ford algorithmus.

GRÁFELMÉLET. 7. előadás. Javító utak, javító utak keresése, Edmonds-algoritmus

Logika es sz am ıt aselm elet I. r esz Logika Negyedik el oad as 1/26

Ítéletkalkulus. 1. Bevezet. 2. Ítéletkalkulus

Deníciók és tételek a beugró vizsgára

Diszkrét matematika 2.C szakirány

Kétszemélyes játékok Gregorics Tibor Mesterséges intelligencia

Adatbázisok elmélete 12. előadás

Diszkrét matematika 2. estis képzés

definiálunk. Legyen egy konfiguráció, ahol és. A következő három esetet különböztetjük meg. 1. Ha, akkor 2. Ha, akkor, ahol, ha, és egyébként.

Logika es sz am ıt aselm elet I. r esz Logika 1/36

Matematika alapjai; Feladatok

Predikátumkalkulus. Predikátumkalkulus alapfogalmai, formalizálás, tagadás, logikailag igaz formulák. Vizsgáljuk meg a következ két kijelentést.

V. Kétszemélyes játékok

19. AZ ÖSSZEHASONLÍTÁSOS RENDEZÉSEK MŰVELETIGÉNYÉNEK ALSÓ KORLÁTJAI

Predikátumkalkulus. 1. Bevezet. 2. Predikátumkalkulus, formalizálás. Predikátumkalkulus alapfogalmai, formalizálás, tagadás, logikailag igaz formulák.

Modellellenőrzés. dr. Majzik István BME Méréstechnika és Információs Rendszerek Tanszék

17. A 2-3 fák és B-fák. 2-3 fák

Ítéletkalkulus. 1. Bevezet. 2. Ítéletkalkulus

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t

Diszkrét matematika 2.C szakirány

Intelligens orvosi műszerek VIMIA023

Logika és informatikai alkalmazásai

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Mintaillesztő algoritmusok. Ölvedi Tibor OLTQAAI.ELTE

Logika es sz am ıt aselm elet I. r esz Logika Hatodik el oad as 1/33

Gépi tanulás. Egyszerű döntés tanulása (döntési fák) (Részben Dobrowiecki Tadeusz fóliáinak átdolgozásával) Pataki Béla (Bolgár Bence)

30. ERŐSEN ÜSSZEFÜGGŐ KOMPONENSEK

Logika és informatikai alkalmazásai

Az informatika logikai alapjai

Bonyolultságelmélet. Monday 10 th October, 2016, 17:44

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

file:///d:/okt/ad/jegyzet/ad1/b+fa.html

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

AZ INFORMATIKA LOGIKAI ALAPJAI

Függvények Megoldások

? szimmetrikus antiszimmetrikus reflexív tranzitív egyik sem?

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Algoritmuselmélet. Legrövidebb utak, Bellmann-Ford, Dijkstra. Katona Gyula Y.

1. A matematikai logika alapfogalmai. 2. A matematikai logika műveletei

Logika es sz am ıt aselm elet I. r esz Logika M asodik el oad as 1/26

Ionogram releváns területeinek meghatározása és elemzésének automatikus megvalósítása

2. Visszalépéses stratégia

B-fa. Felépítés, alapvető műveletek. Programozás II. előadás. Szénási Sándor.

Keresések Gregorics Tibor Mesterséges intelligencia

2. Logika gyakorlat Függvények és a teljes indukció

Automaták mint elfogadók (akceptorok)

1. tétel - Gráfok alapfogalmai

Rekurzió. Dr. Iványi Péter

Bizonytalanságok melletti következtetés

Mesterséges Intelligencia MI

Algoritmusok helyességének bizonyítása. A Floyd-módszer

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

Elsőrendű logika. Mesterséges intelligencia március 28.

KÖZELÍTŐ INFERENCIA II.

Adatbázis rendszerek Ea: A rendes állapot. Normalizálás

Példa Hajtsuk végre az 1 pontból a Dijkstra algoritmust az alábbi gráfra. (A mátrixban a c i j érték az (i, j) él hossza, ha nincs él.

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

2. Visszalépéses keresés

R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský

Diszkrét matematika 2.C szakirány

Általános algoritmustervezési módszerek

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Függőségek felismerése és attribútum halmazok lezártja

Diszkrét matematika 2 (C) vizsgaanyag, 2012 tavasz

b) Ábrázolja ugyanabban a koordinátarendszerben a g függvényt! (2 pont) c) Oldja meg az ( x ) 2

Diszkrét matematika 1. estis képzés

Mesterséges intelligencia, szakértői rendszerek Ágensek, multi ágens rendszerek, tanuló ágensek p. 1/43

Diszkrét Matematika MSc hallgatók számára 7. Előadás Párosítási tételek Előadó: Hajnal Péter Jegyzetelő: Kovácsházi Anna

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Függvények

Algoritmuselmélet 2. előadás

Fourier-sorok. Lengyelné Dr. Szilágyi Szilvia április 7.

Csima Judit október 24.

Az optimális megoldást adó algoritmusok

Matematikai logika és halmazelmélet

Diszkrét matematika I. gyakorlat

Logika és számításelmélet. 10. előadás

Logika és informatikai alkalmazásai

KÖZELÍTŐ INFERENCIA II.

29. Visszalépéses keresés 1.

Diszkrét matematika 2.

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

Relációs adatbázisok tervezése ---2

Diszkrét matematika I. gyakorlat

0644. MODUL SZÁMELMÉLET. Közös osztók, közös többszörösök KÉSZÍTETTE: PINTÉR KLÁRA

Átírás:

Induktív tanulás VIII. INDUKTÍV TANULÁS Induktív tanulási modell Az f leképezést tanuljuk meg az (x i,f(x i )) példák (minták) alapján úgy, hogy előállítunk egy olyan h leképezést (hipotézist), amelyre h ~ f Adaptív (inkrementális) tanulás A korábban talált h hipotézist egy új minta esetén anélkül módosítjuk, hogy a korábbi mintákat újra megvizsgálnánk. 1 4 Logikai formulák tanulása 1. Döntési fák Speciális ismeretek speciális alakú logikai formulákkal jellemezhetők. Adott egy Q célpredikátum, amelynek csak néhány kiértékelését (példák) ismerjük. Keressük a Q-t helyettesítő hipotézist. Az összes hipotézisből áll a hipotézis tér (probléma tér). A tanulás a hipotézistérben folyó keresés, amely azt a hipotézist (hipotéziseket) keresi, amelyek a vizsgált példákra teljesülnek. Egy objektumnak vagy egy szituációnak szeretnénk megítélni egy adott tulajdonságát (ezt a továbbiakban kérdésnek nevezzük) annak alapján, hogy néhány más tulajdonságait (attribútumainak értékeit) ismerjük. Alkalmazzunk ehhez egy olyan irányított fát, amelynek minden -levél (belső) csúcsa egy attribútumot jelenít meg, az ebből kivezető élek pedig az attribútum lehetséges értékeit szimbolizálják. A fa levelei a kérdésre adható lehetséges válaszokat tartalmazzák. 7 8 Példa A példa egy döntési fája Elfogadjuk-e a megajánlott vizsgajegyet? Ha az ötös, akkor feltétlenül. Ha négyes és kevés vizsgánk van és értettük az előadást, akkor ; feltéve, hogy a tárgy az analízis. Ha hármas és az átlagot kell javítanunk, akkor. stb. as? négyes Kevés vizsgánk van? Kell átlagot javítani? Analízis? Értettük az előadást? 9 10 1

Döntési fák kifejező ereje Étterem probléma (Russel-Norvig) A döntési fa ágai (a példák) speciális szabályokat reprezentálnak: x Ajánlott_Jegy(x,négyes) Kevés_Vizsga(x,) Analízis(x,) Értettük(x,) Elfogadjuk(x) Ilyen x P 1 (x,v 1 ) P m (x,v m ) Q(x) formula kifejezhető egy p v1 p vm q ítéletkalkulusbeli formulával is. A döntési fa egy f:a 1 A m L logikai függvényt reprezentál; egy ág az f(v 1,...,v n ) esetet írja le, és fordítva: minden logikai függvényhez adható döntési fa. Pl. Más Bár P/Sz Éhes Ár Eső Fogl Fajt Idő Marad 1 I N N s I kevés drá N l I Fra 10 I 2 I N N I tele olcs N N Tha 60 N 3 N I N N kevés olcs N N Bur i 10 I 4 I N I I tele olcs N N Tha g 30 I 5 I N I N tele drá N I Fra i sok N 6 N I N I kevés köz I I Ol 10 I 7 N I N N senki olcs I N Bur 10 N 8 N N N I kevés köz I I Tha g 10 I 9 N I I N tele olcs I N Bur i sok N 10 I I I I tele drá N I Ol g 30 N 11 N N N N senki olcs N N Tha 10 N 12 I I I I tele olcs N N Bur i 60 I g 11 12 Döntési fa építésének első lépése Alternatív lépések +: 1,3,4,6,8,12 -: 2,5,7,9,10,11 +: +: 1,3,6,8 -: 7,11 -: Más, Bár, P/Sz, Éhes,, +: 4,12 -: 2,5,9,10 Más, Bár, P/Sz, Éhes, Más +: 1,4,12 -: 2,5, 10 +: 3, 5, 8 -: 7, 9,11 Burg +: 3,12 -: 7,9 Fajt +: +: 1,3,6,8 +: 4,12 -: 7,11 -: -: 2,5,9,10 Fra Ol Thai +: 1 +: 6 +: 4,8 -: 5 -: 10 -: 2,11 13 14 Heurisztika Arra kell törekedni, hogy a döntési fa minél tömörebb, egyegy ága minél rövidebb legyen, azaz a választott attribútum (a) a példákat olyan részhalmazokra vágja szét, amelyeken belül a példák minél kevésbé különböznek, más szavakkal a szétvágás információs előnye, azaz a szétvágás előtt példa-halmaz (P) információ tartalmának és az utána kapott példa-részhalmazok (P a=v ) információ tartalmának (számosságuk szerinti súlyozott) összege közti különbség legyen minél nagyobb. Információ tartalom A P-beli példák információtartalma (entrópiája): A P-beli példák információtartalma (entrópiája): E(P) = E(p +, p _ ) = _ p + log 2 p + _ p _ log 2 p _ ahol p + a P-beli pozitív, p _ a negatív példák aránya (p + +p _ =1) Példa: Ha P-ben 2 pozitív és 3 negatív példa van: E(P) = E(2/5, 3/5 ) = 0.97 Ha P-ben 0 pozitív és 3 negatív példa van: E(P) = E(0/3, 3/3 ) = 0 15 16 2

Információs előny számítása A második lépés előkészítése P a a A v 1 v 2 v 3 P a=v1 P a=v2 P a=v3 P C(P,a)= E(P) - a=v E(P a=v ) v Érték(a) P ahol P a szülő csúcs példái, a a választott attribútum, az Érték(a) az a attribútum által felvett értékek, és a P a=v ={ p P p.a=v } +: 4,12 -: 2,5,9,10 E({2,4,5,9,10,12}) = = E(2/6,4/6) = 0.92 Más, Bár, P/Sz, Éhes, Ha a Más attribútumot választjuk, akkor a példák 1:5 arányban ketté válnak: {9} (Más= hamis), és {2, 4, 5, 10, 12} (Más=igaz), E({9}) = E(0/1, 1/1) = 0 E({2,4,5,10,12}) = E(2/5, 3/5)= 0.97 Az információs előny: C({2,4,5,9,10,12}, Más)= E({2,4,5,9,10,12}) ( 1/6 E({9}) + 5/6 E({2,4,5,10,12}) ) = E(2/6,4/6) ( 1/6 E(0/1,1/1) + 5/6 E(2/5,3/5) ) = 0.92-0.81 = 0.11 17 18 A második lépés kiszámítása C({2,4,5,9,10,12},a)= 0.92 - Más: 1/6 E(0/1,1/1)+ 5/6 E(2/5,3/5)= 0.81 Bár: 3/6 E(1/3,2/3)+ 3/6 E(1/3,2/3))= 0.92 P/Sz: 1/6 E(0/1,1/1)+ 5/6 E(2/5,3/5)= 0.81 Éhes: 4/6 E(2/4,2/4)+ 2/6 E(0/2,2/2)= 0.67 Ár: 4/6 E(2/4,2/4)+ 0/6 E(0,0)+ 2/6 E(0/2,2/2)= 0.67 Eső: 5/6 E(2/5,3/5)+ 1/6 E(0/1,1/1)= 0.81 Fog: 4/6 E(2/4,2/4)+ 2/6 E(0/2,2/2)= 0.67 Fajt: 2/6 E(1/2,1/2)+ 1/6 E(0/1,1/1)+ 1/6 E(0/1,1/1)+ +2/6 E(1/2,1/2)= 0.67 Idő: 0/6 E(0,0 )+ 2/6 E(1/2,1/2)+2/6 E(1/2,1/2 ) + 2/6 E(0/2,2/2)= 0.67 A második lépés +: 4,12 Más, Bár, P/Sz, Éhes, -: 2,5,9,10 Más, Bár, P/Sz, Ár, Eső, Fogl, Fajt, Idő +: 4,12 -: 2,10 Más, Bár, P/Sz, Éhes,, Éhes +: -: 5,9 19 20 Étterem probléma döntési fája Éhes Fajt Fra Ol Thai Burg P/Sz Készítsünk algoritmust Egy épülő döntési fában vannak attribútumokkal vagy értékkel címkézett, illetve címkézetlen csúcsok. Minden csúcs rendelkezik a példák egy P részhalmazával, és a választható A attribútumokkal. Csak az attribútummal címkézett csúcsból vezetnek ki élek, és ezek az attribútum egy-egy lehetséges értékével van megcímkézve. 21 22 3

Algoritmus Algoritmus (folytatás) Kezdetben a fa egy címkézetlen (gyökér) csúcsból áll, amelyhez az összes példát és attribútumot rendeljük. Veszünk egy címkézetlen csúcsot: 1. Ha P=, akkor levélcsúcsot kaptunk, amelynek értékét a szülőcsúcs példáinak többségi szavazása alapján döntjük el. 2. Ha P csak pozitív (vagy csak negatív) példából áll, akkor egy (illetve ) levélcsúcsnál vagyunk. 3. Ha A=, akkor is levélcsúcsot kaptunk, és a csúcs pozitív és negatív példáinak többségi szavazása alapján döntjük el annak értékét. 4. Egyébként... 4. Egyébként a legnagyobb információs előnnyel járó, még választható a A attribútumot rendeljük az adott csúcshoz, majd generáljuk összes gyerekét: a) ezekhez az a lehetséges értékeivel címkézett élek vezetnek. b) Ha az a címkéjű csúcsból egy gyerekcsúcsába a v címkéjű él vezet, akkor az ahhoz rendelt példák: P a=v ={p P p.a=v } választható attribútumok: A= A-{a} c) Végül minden gyerekre ismételjük meg rekurzív módon az 1-4 pontokat. 23 24 Összefoglalás Megjegyzés Döntési fa létrehozása példák alapján induktív tanulással pozitív és negatív példák alapján egy t példa sorozathoz több, azt kifejező döntési fa is megadható a legkisebb döntési fa magadása egy megoldható probléma Döntési fa felhasználása a példákra tökéletes A példákhoz hasonló példákra többnyire jó Zaj: Két vagy több eltérő besorolású példának attribútumértékei megegyeznek. (lásd alg. 3.lépés) Megoldás többségi szavazással. Túlzott illeszkedés: Például a kocka dobásra annak színe és dátuma alapján értelmetlen szabályszerűségeket találunk. Megoldás a lényegtelen attribútumok (C(P,a)~0) félreállítása. Általánosítások: Hiányzó adatok problémája Sok-értékű attribútumok Folytonos értékű attribútumok 25 26 2. Pillanatnyilag legjobb hipotézis Étterem probléma Vegyünk (1. példa alapján) egy kiinduló hipotézist, majd ezt finomítsuk fokozatosan a többi példa segítségével. A vizsgált hipotézis szempontjából egy példa lehet igazoló, vagy cáfoló (hamis), ezen belül a cáfoló példa lehet cáfoló pozitív ~ a hipotézis igaznak tartja, pedig az cáfoló negatív ~ a hipotézis hamisnak látja, pedig az Amikor egy új példa ellentmond az adott hipotézisnek, cáfoló pozitív példa esetén szigorítjuk a hipotézist. cáfoló negatív példa esetén gyengítjük a hipotézist. 1.példa (Más=I,, =kevés) pozitív, mint például a Más attribútuma H 1 : Más(x) 2.példa (Más=I,, =tele) negatív, ami a H 1 -re nézve cáfoló pozitív. Az első két példa a attribútum értékében különbözik. Szigorítsuk az előző hipotézist úgy, hogy a attribútum tele értéke esetén ne legyen igaz. H 2 : Más(x) ((x,kevés) (x,senki)) 27 28 4

Étterem probléma folytatása Hátrány 3.példa (Más=N) pozitív, ami H 2 -re nézve (a Más feltétel miatt) cáfoló negatív. Gyengítsük a Más feltétel törlésével. H 3 : (x,kevés) (x,senki) 4.példa (=tele,,p/sz=i) pozitív, ami H 3 -ra nézve cáfoló negatív. gyengíthetjük törléssel, ezért H 4 : (x,kevés) (x,senki) ((x,tele) P/Sz(x) H 4 : Vár(x,60) Marad(x) H 4 : (x,kevés) (x,senki) ((x,tele) Vár(x,30)) A fenti -determinisztikus módszer egy nagy keresési térben zajlik. Amikor a hipotézis keresés zsákutcába jut, mert olyan hipotézishez jutunk, amelynek a módosítása egy újabb példánál már megoldható, akkor vissza kell lépnünk egy korábbi döntési ponthoz. Tehát a tanulás inkrementális: vissza kell nyúlni az előző példákhoz 29 30 3. Legkisebb megkötés elvű keresés Algoritmus Az adott pillanatig vizsgált példákkal konzisztens összes hipotézist nyilvántartjuk (verziótér). A verziótér egyértelműen megadható a legáltalánosabb (G) és a legszigorúbb (S) konzisztens hipotézisek segítségével. Az összes konzisztens hipotézis e két halmaz között helyezkedik el: gyengébb valamelyik S-beli, de szigorúbb valamelyik G-beli hipotézisnél. Kezdetben a verziótér a teljes hipotézistér, amelyből fokozatosan töröljük a példáknak ellentmondó hipotéziseket úgy, hogy az S és a G hipotéziseit módosítjuk, a két halmaz távolságát csökkentjük Kezdetben S a hamis állításból, G az igaz állításból áll. Leáll az algoritmus, ha S=G (a megoldás S), vagy S= illetve G = (ilyenkor nincs megoldás), vagy nincs több példa (a megoldás a verziótér hipotéziseinek diszjunkciója). Minden S i S-re és G i G-re amennyiben az újabb példa S i -re cáfoló pozitív, akkor S i -t töröljük az S-ből. S i -re cáfoló negatív, akkor S i -t helyettesítjük annak összes közvetlen általánosításával. G i -re cáfoló negatív, akkor G i -t töröljük az G-ből. G i -re cáfoló pozitív, akkor G i -t helyettesítjük annak összes közvetlen szigorításaival. 31 32 Verziótér szűkítése Egy hipotézis közvetlen általánosításakor (a pozitív) példa feltételrendszerét leíró formula diszjunktív normálformájából (C 1 C n ) származó duális klózokat külön-külön hozzávagyoljuk a cáfolt hipotézishez. S={, S i, } S={, S i C 1,, S i C n, } Egy hipotézis közvetlen szigorításakor (a negatív) példa feltételrendszerét leíró formula negáltjának konjunktív normálformájából (C 1 C n ) származó klózokat különkülön hozzáéseljük a cáfolt hipotézishez. G={, G i, } G={, G i C 1,, G i C n, } Kezdetben Egyszerűsített étterem probléma (kevesebb attribútum: Más, Bár, P/SZ, Fogl) S={ hamis } és G={ igaz } A példát leíró formula: Az 1.példa (I,N,N,I) pozitív egyetlen duális klóz S-beli hamis hipotézisre a példa cáfoló negatív ezért S={ Más(x) Bár(x) P/SZ(x) Fogl(x) } G rendben A példát leíró formula A 2.példa (I,N,N,N) negatív, ami negáltja: egyetlen klóz G-beli igaz hipotézisre a példa cáfoló pozitív: G={ Más(x) Bár(x) P/SZ(x) Fogl(x) } S rendben 33 34 5

Egyszerűsített étterem probléma (kevesebb attribútum: Más, Bár, P/SZ, Fogl) A 3.példa (N,I,N,N) pozitív, ami S-beli hipotézisre a példa cáfoló negatív : S={ (Más(x) Bár(x) P/SZ(x) Fogl(x) ) ( Más(x) Bár(x) P/SZ(x) Fogl(x) ) } G rendben A példát leíró formula: A 4.példa (I,N,I,I) pozitív, ami egyetlen duális klóz S-beli hipotézisre a példa cáfoló negatív : S={(Más(x) Bár(x) P/SZ(x) Fogl(x) ) ( Más(x) Bár(x) P/SZ(x) Fogl(x) ) (Más(x) Bár(x) P/SZ(x) Fogl(x) ) } G rendben Egyszerűsített étterem probléma (kevesebb attribútum: Más, Bár, P/SZ, Fogl) A 5.példa (I,N,I,I) negatív, ami S-beli hipotézisre a példa cáfoló pozitív, ezért S = {} G-beli hipotézisre a példa cáfoló pozitív, de ezt már érdemes módosítani. Itt tehát nincs megoldás. (Az 5. példa ugyanis ellentmond a 4. példának) 35 36 6