1. gyakorlat. Mesterséges Intelligencia 2.

Hasonló dokumentumok
Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Gépi tanulás a gyakorlatban. Bevezetés

Mesterséges Intelligencia I. ID3 futás

2. A példahalmazban n = 3 negatív és p = 3 pozitív példa van, azaz a példahalmazt képviselő döntési fa információtartalma: I = I(1/2, 1/2) = 1 bit.

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Adatszerkezetek 7a. Dr. IványiPéter

Diszkrét matematika 2.C szakirány

Programozási módszertan. A gépi tanulás alapmódszerei

VIII. INDUKTÍV TANULÁS

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Diszkrét matematika 2.C szakirány

Support Vector Machines

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Diszkrét matematika 2. estis képzés

TANULÁS. I. Logikai formulák tanulása. Tanulási módok. Miért m ködik jól az induktív tanulás? Induktív tanulás

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

7. BINÁRIS FÁK 7.1. A bináris fa absztrakt adattípus 7.2. A bináris fa absztrakt adatszerkezet

Bizonytalanságok melletti következtetés

Diszkrét matematika 2. estis képzés

Random Forests - Véletlen erdők

Intelligens orvosi műszerek VIMIA023

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

Mesterséges Intelligencia MI

Branch-and-Bound. 1. Az egészértéketű programozás. a korlátozás és szétválasztás módszere Bevezető Definíció. 11.

Diszkrét matematika 2. estis képzés

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

A félév során előkerülő témakörök

Általános algoritmustervezési módszerek

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Nagy HF u tmutato 2011/2012 II. fe le v

30. ERŐSEN ÜSSZEFÜGGŐ KOMPONENSEK

Közösség detektálás gráfokban

Adatszerkezetek 2. Dr. Iványi Péter

Mesterséges Intelligencia MI

Az adatbázis-alapú rendszerek tervezésének alapvető része az adatok modellezése. Ez legtöbbször két fázisban zajlik:

GRÁFELMÉLET. 7. előadás. Javító utak, javító utak keresése, Edmonds-algoritmus

[1000 ; 0] 7 [1000 ; 3000]

26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA

Algoritmizálás, adatmodellezés tanítása 7. előadás

Számítógép hálózatok, osztott rendszerek 2009

Mesterséges Intelligencia I. (I602, IB602)

Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2.

1. gyakorlat ( ), Bevezető analízis 1., ősz (Besenyei Ádám csoportja)

2. Logika gyakorlat Függvények és a teljes indukció

Gépi tanulás a gyakorlatban. Lineáris regresszió

Mesterséges intelligencia alapú regressziós tesztelés

Számláló rendezés. Példa

angolul: greedy algorithms, románul: algoritmi greedy

Analízis évfolyam. Szerkesztette: Surányi László július 5.

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Mohó algoritmusok. Példa:

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Problémamegoldás kereséssel. Mesterséges intelligencia március 7.

A valós számok halmaza

Edényrendezés. Futási idő: Tegyük fel, hogy m = n, ekkor: legjobb eset Θ(n), legrosszabb eset Θ(n 2 ), átlagos eset Θ(n).

BACKTRACKING Visszalépéses keresés

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

Diszkrét matematika 2.C szakirány

Mesterséges Intelligencia I. (I602, IB602)

Gráfalgoritmusok és hatékony adatszerkezetek szemléltetése

2. Visszalépéses keresés

Gyakori elemhalmazok

Diszkrét matematika 1. estis képzés

Mesterséges Intelligencia MI

Diszkrét matematika 2.C szakirány

Algoritmuselmélet. Legrövidebb utak, Bellmann-Ford, Dijkstra. Katona Gyula Y.

Minimális feszítőfák Legyen G = (V,E,c), c : E R + egy súlyozott irányítatlan gráf. Terjesszük ki a súlyfüggvényt a T E élhalmazokra:

Számítási intelligencia

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Diszkrét matematika 2.C szakirány

Diszkrét matematika I. gyakorlat

Deníciók és tételek a beugró vizsgára

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Boronkay György Műszaki Középiskola és Gimnázium

Feladatok, amelyek gráfokkal oldhatók meg 1) A königsbergi hidak problémája (Euler-féle probléma) a

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský

SZÁMÍTÁSTUDOMÁNY ALAPJAI

Hálózati folyamok. Tétel: A maximális folyam értéke megegyezik a minimális vágás értékével.

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

1/50. Teljes indukció 1. Back Close

Mintapélda1 Hányféleképpen állhatnak sorba egy bolt pénztáránál a vásárlók, ha 3-an, 4-en, 5-en, k-an vannak?

Fák Témakörök. Fa definíciója. Rekurzív típusok, fa adatszerkezet Bináris keresőfa, bejárások Bináris keresőfa, módosítás B-fa

NORMALIZÁLÁS. Funkcionális függés Redundancia 1NF, 2NF, 3NF

Megerősítéses tanulási módszerek és alkalmazásaik

Gépi tanulás a Rapidminer programmal. Stubendek Attila

Adatbázisok gyakorlat

Az áprilisi vizsga anyaga a fekete betűkkel írott szöveg! A zölddel írott rész az érettségi vizsgáig még megtanulandó anyag!

Kisérettségi feladatsorok matematikából

FÜGGVÉNYEK. A derékszögű koordináta-rendszer

Intelligens adatelemzés

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

Adatbázismodellek. 1. ábra Hierarchikus modell

A szemantikus elemzés elmélete. Szemantikus elemzés (attribútum fordítási grammatikák) A szemantikus elemzés elmélete. A szemantikus elemzés elmélete

Átírás:

1. gyakorlat Mesterséges Intelligencia. Elérhetőségek web: www.inf.u-szeged.hu/~gulyasg mail: gulyasg@inf.u-szeged.hu Követelmények (nem teljes) gyakorlat látogatása kötelező ZH írása a gyakorlaton elhangzott algoritmusokból kötelező program írása (valamely metaheurisztika alkalmazása egy adatbázison)

Gépi tanulás alapfogalmai (a leírás Tóth László - Gépi Tanulási Módszerek jegyzete alapján készült) A gépi tanulás célja A gépi tanulás célja olyan programok készítése, amelyek a működés során szerzett tapasztalatok alapján képesek javítani saját hatékonyságukon. Tanuló-algoritmusok Olyan algoritmusok, melyek képes összefüggések, szabályosságok megtanulására (hipotetizálására) egy példa-halmaz alapján. Induktív tanulás A tanítás során nem látott esetekre is szeretnénk általánosítani a megtanult összefüggéseket. Feltevés: A példák hűen reprezentálják a tanulandó összefüggést. Felügyelet nélküli tanulás Felügyelet nélküli tanulásnak nevezzük, ha a példákhoz nincs külső segítség. leggyakoribb feladat: klaszterezés: adatok automatikusan kialakított osztályokba sorolása valamilyen hasonlóság alapján. Felügyelt tanulás Felügyelt tanulásnak nevezzük, ha a tanítópéldákhoz a helyes válaszok is adottak leggyakoribb: f(x 1,...,x N ) függvény tanulása {(y 1,...,y N );f(y 1,...,y N )} (i), (i=1,...,m) alakú példák alapján általában élesen szétválik a tanulási és tesztelési (felhasználási) fázis pl.: emberek orvosi tesztjei, valamint diagnosztizált betegésük; a cél olyan modell alkotása (tanulás), amely alapján az adott betegséget hatékonyabban lehet felismerni pl.: molekulák adatbázisa (gráfokkal leírva), és bizonyos számú molekula esetén ki van mérve, hogy hogyan reagál az AIDS vírusra; kérdés, hogy a többi, ismeretlen molekuláról mit lehet ezek alapján mondani

Tanuló adatbázis Felügyelt tanulás esetén Példa Magasság Hajszín Szemszín Osztály 1 alacsony szőke kék + magas szőke barna - 3 magas vörös kék + 4 alacsony sötét kék - 5 magas sötét kék - 6 magas sötét barna - 7 alacsony szőke barna - Attribútum-halmaz: A={Magasság, Hajszín, Szemszín} Osztálycímkék halmaza: C={+,-} Példa: egy sor az adatbázisban (a valóság egy entitását írja le) Döntési fák: ID3-algoritmus Az előző példához tartozó döntési fa: hajszín sötét vörös szőke - + szem kék barna + - Osztályozás a fa alapján: egy új, eddig ismeretlen entitást ({M, H, SZ}) a fa gyökeréből kiindulva, a csúcsokban található attribútumoknak megfelelően haladunk valamely levél felé; a példához tartozó címkét a levél címkéje adja meg

Modellalkotás: tanulási folyamat Algoritmus ID3(S, C, A) S: példahalmaz, C: osztály-címkék, A: attribútum halmaz készítsünk gyökércsomópontot a fának ha S-ben minden példa pozitív, akkor a gyökér címkéje legyen +, és return gyökér ha S-ben minden példa negatív, akkor a gyökér címkéje legyen -, és return gyökér ha az A attribútum-halmaz üres, akkor a gyökér címkéje legyen az S-ben lévő leggyakoribb címke, és return gyökér különben o legyen At a legjobban vágó attribútum o a gyökér címkéje legyen At o At minden lehetséges v értékére a gyökér alá hozzunk létre új ágat, ami az At attribútum v értékét reprezenztálja legyen Sv azon példák halmaza S-ből, melyek At értéke v ha Sv üres, akkor az adott ághoz tartozó csúcs (levél) címkéje legyen az S- ben lévő leggyakoribb címke return gyökér ha Sv nem üres, akkor az ághoz csatoljuk be az ID3(Sv, C, A-{At}) által visszaadott csúcsot Legjobban vágó attribútum Legyenek p +, és p - az S-beli pozitív, és negatív példák aránya Entrópia: halmaz homogenitásának mértéke (rendezetlenség foka, információ..) E S = p pos log p pos p minus log p minus E(S) 1 0 0,5 1 p + Egy adott A attribútumhoz tartozó várható nyereség, az entrópia várható csökkenése Gain S, A =E S v A S v S E S v Tehát egy adott csúcsban a legnagyobb Gain(S, A)-val rendelkező A-t választjuk vágó attribútumnak.

Főbb tulajdonságok a módszer mohó módon minél kisebb méretű fát épít, ezzel próbál általánosítani a modell (a fán kívül) felfogható konjunciók diszjunkciójaként emberi szemmel értelmezhető, szemléletes nem érzékeny a zajokra (statisztikai alapon dönt) könnyen kiterjeszthető (folytonos attribútumokra, hiányzó értékek kezelésére,...) Példa Magasság Hajszín Szemszín Címke 1 alacsony szőke kék + magas szőke barna - 3 magas vörös kék + 4 alacsony sötét kék - 5 magas sötét kék - 6 magas sötét barna - 7 alacsony szőke barna - S={1,,3,4,5,6,7} (csak a sorszámokkal azonosítva a példákat, egyszerűsítve) A={Magasság, Hajszín, Szemszín} C=Címke={+,-} (mivel ez menetközben nem változik, ezért csak most írjuk ki) ID3(S, C, A) p pos = 7, p minus= 5 7 E S = p pos log p pos p minus log p minus = 7 log 7 5 7 log 5 7 =0.8631 Gain S, Magasság S alacsony ={1,4,7 }, S alacsony =3, E S alacsony = 1 3 log S magas ={,3,5,6 }, S magas =4, E S magas = 1 4 log 1 3 3 log 1 4 3 4 log 3 =0.9183 3 4 =0.8113 Gain S, Magasság =E S S alacsony E S S alacsony S magas S E S magas = =0.8631 3 7 0.9183 4 7 0.8113=0.0059 Gain S, Hajszín S szőke ={1,,7}, S szőke =3, E S szőke = 1 3 log 1 3 3 log 3 =0.9183 S vörös ={3 }, S vörös =1, E S vörös =0 definíció alapján,mivel p pos =1

S sötét ={4,5,6 }, S sötét =3, E S sötét =0 definíció alapján, mivel p pos =0 Gain S, Hajszín =E S S szőke S E S szőke S vörös S E S vörös S sötét S E S sötét = =0.8631 3 7 0.9183 1 7 0 3 7 0=0.4696 Gain S, Szemszín S kék ={1,3,4,5 }, S kék =4, E S kék = 4 log 4 4 log 4 =1 S barna ={1,4,7}, S barna =3, E S barna = definíció alapján, p pos =0 =0 Gain S, Szemszín =E S S kék S E S kék S barna S E S barna = =0.8631 4 7 1 3 7 0=0.4345 Legjobban vág: Hajszín felosztás: S szőke ={1,,7 }, S vörös ={3}, S sötét ={4,5,6 } a vörös, és a sötét esetek egyszerűek: az elsőben csak +, a másodikban csak negatív példák vannak így rekurzív hívás csak a szőke esetre szükséges ami eddig megvan tehát: hajszín sötét vörös szőke - +? ID3(S szőke, C, A-{Hajszín}) Magasság Hajszín Szemszín Címke 1 alacsony szőke kék + magas szőke barna - 7 alacsony szőke barna - p pos = 1 3, p minus= 3 E S = 1 3 log 1 3 3 log 3 =0.9183

Gain S, Magasság S alacsony ={1,7 }, S alacsony =, E S alacsony = 1 log 1 1 log 1 =1 S magas ={,3,5,6 }, S magas =4, E S magas =0 definíció szerint Gain S, Magasság =0.9183 3 1 1 3 0=0.516 Gain S,Szemszín S kék ={1 }, S kék =1, E S kék =0 definíció szerint S barna ={,7 }, S barna =, E S barna =0 definíció szerint Gain S, Szemszín =0.9183 1 3 0 3 0=0.9183 Legjobban vág: Szemszín és ezzel kész is, hiszen a kék színhez csak pozitív, a barnához csak negatív példák tartoznak visszakapjuk a fentebb bemutatott fát