[1000 ; 0] 7 [1000 ; 3000]

Hasonló dokumentumok
Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

Mesterséges Intelligencia MI

Gépi tanulás. Egyszerű döntés tanulása (döntési fák) (Részben Dobrowiecki Tadeusz fóliáinak átdolgozásával) Pataki Béla (Bolgár Bence)

Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok, megoldással (2016 ősz)

E x μ x μ K I. és 1. osztály. pontokként), valamint a bayesi döntést megvalósító szeparáló görbét (kék egyenes)

Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok a vizsgára 2015 Nem pontosan ezek lesznek a vizsgafeladatok, csak jellegükre hasonlók!

Intelligens orvosi műszerek VIMIA023

Mesterséges Intelligencia MI

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Intelligens orvosi műszerek VIMIA023

Neurális hálózatok.... a gyakorlatban

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

end function Az A vektorban elõforduló legnagyobb és legkisebb értékek indexeinek különbségét.. (1.5 pont) Ha üres a vektor, akkor 0-t..

A félév során előkerülő témakörök

I. LABOR -Mesterséges neuron

1. gyakorlat. Mesterséges Intelligencia 2.

Mesterséges Intelligencia MI

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

1. Egy lineáris hálózatot mikor nevezhetünk rezisztív hálózatnak és mikor dinamikus hálózatnak?

2. A példahalmazban n = 3 negatív és p = 3 pozitív példa van, azaz a példahalmazt képviselő döntési fa információtartalma: I = I(1/2, 1/2) = 1 bit.

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Adatbányászati szemelvények MapReduce környezetben

Tanulás az idegrendszerben. Structure Dynamics Implementation Algorithm Computation - Function

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Mesterséges Intelligencia MI

Robotok inverz geometriája

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

A digitális analóg és az analóg digitális átalakító áramkör

függvény grafikonja milyen transzformációkkal származtatható az f0 : R R, f0(

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Matematika III előadás

A RADARJELEK DETEKTÁLÁSA NEURÁLIS HÁLÓZAT ALKALMAZÁSÁVAL

A függvény kód szekvenciáját kapcsos zárójelek közt definiáljuk, a { } -ek közti részt a Bash héj kód blokknak (code block) nevezi.

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Az egyszerűsítés utáni alak:

Térinformatikai algoritmusok Elemi algoritmusok

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Mesterséges neurális hálózatok II. - A felügyelt tanítás paraméterei, gyorsító megoldásai - Versengéses tanulás

PRÓBAÉRETTSÉGI MATEMATIKA május-június EMELT SZINT. Vizsgafejlesztő Központ

SCILAB programcsomag segítségével

Másodfokú egyenletek, egyenlőtlenségek

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Megoldások a mintavizsga kérdések a VIMIAC04 tárgy ellenőrzési technikák részéhez kapcsolódóan (2017. május)

KOVÁCS BÉLA, MATEMATIKA I.

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Növényvédő szerek A B C D

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Térinformatikai algoritmusok Elemi algoritmusok

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Random Forests - Véletlen erdők

A maximum likelihood becslésről

Függvények Megoldások

Áramkörök elmélete és számítása Elektromos és biológiai áramkörök. 3. heti gyakorlat anyaga. Összeállította:

Lineáris algebra. (közgazdászoknak)

Trigonometria Megoldások. 1) Igazolja, hogy ha egy háromszög szögeire érvényes az alábbi összefüggés: sin : sin = cos + : cos +, ( ) ( )

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Amortizációs költségelemzés

3. Előadás. Megyesi László: Lineáris algebra, oldal. 3. előadás Lineáris egyenletrendszerek

Dinamikus modellek szerkezete, SDG modellek

b) Ábrázolja ugyanabban a koordinátarendszerben a g függvényt! (2 pont) c) Oldja meg az ( x ) 2

Másodfokú egyenletek, egyenlőtlenségek

Kísérlettervezés alapfogalmak

II. LABOR Tanulás, Perceptron, Adaline

11. gyakorlat Sturktúrák használata. 1. Definiáljon dátum típust. Olvasson be két dátumot, és határozza meg melyik a régebbi.

Normális eloszlás tesztje

Gépi tanulás a gyakorlatban. Lineáris regresszió

5. KOMBINÁCIÓS HÁLÓZATOK LEÍRÁSÁNAK SZABÁLYAI

Egyenletek, egyenletrendszerek, egyenlőtlenségek Megoldások

Emelt szintű érettségi feladatsorok és megoldásaik Összeállította: Pataki János; dátum: november. I. rész

Matematika kisérettségi I. rész 45 perc NÉV:...

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Gépi tanulás a Rapidminer programmal. Stubendek Attila

Numerikus matematika. Irodalom: Stoyan Gisbert, Numerikus matematika mérnököknek és programozóknak, Typotex, Lebegőpontos számok

1. tétel. 1. Egy derékszögű háromszög egyik szöge 50, a szög melletti befogója 7 cm. Mekkora a háromszög átfogója? (4 pont)

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

DIGITÁLIS TECHNIKA feladatgyűjtemény

Fordítás Kódoptimalizálás

I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE

2) Írja fel az alábbi lineáris függvény grafikonjának egyenletét! (3pont)

Érettségi feladatok: Függvények 1/9

Minimum követelmények matematika tantárgyból 11. évfolyamon

Feladatok MATEMATIKÁBÓL II.

Struktúra nélküli adatszerkezetek

1. Ábrázolja az f(x)= x-4 függvényt a [ 2;10 ] intervallumon! (2 pont) 2. Írja fel az alábbi lineáris függvény grafikonjának egyenletét!

2. Elméleti összefoglaló

1. Számológép és táblázat használata nélkül számítsd ki a következő számokat, majd. ; 8. (7 pont) függvényt! (9 pont)

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Irányításelmélet és technika II.

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

Digitális technika házi feladat III. Megoldások

Support Vector Machines

Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével. MAJF21 Eisenberger András május 22. Konzulens: Dr.

MATEMATIKA ÉRETTSÉGI május 8. KÖZÉPSZINT

Átírás:

Gépi tanulás (vimim36) Gyakorló feladatok 04 tavaszi félév Ahol lehet, ott konkrét számértékeket várok nem puszta egyenleteket. (Azok egy részét amúgyis megadom.). Egy bináris osztályozási feladatra tanított döntési fa építése során a 7-es csomópontba eljutott mintáink: 3 tartozik az C osztályba és 3785 a C osztályba. A teszt elvégzése után keletkező három csomópontba a következő minták jutottak: 7/A csomópont C: 403 C: 05 7/B csomópont C: 396 C: 537 7/C csomópont C: X C: Y Úgy döntöttünk, hogy ha a teszt valószínűleg (legalább 80% valószínűséggel) irreleváns, akkor bezárjuk a csomópontot, azaz a tesztet már nem végezzük el. A khi-négyzet szignifikancia teszt alapján mit fogunk csinálni? táblázat: SzF P 0,5 P 0, P 0, P 0,05 P 0,0 P 0,005 P 0,00 0,46,64,7 3,84 6,64 7,88 0,83,39 3, 4,6 5,99 9, 0,60 3,8 3,37 4,64 6,5 7,8,35,84 6,7 4 3,36 5,99 7,78 9,49 3,8 4,86 8,47 5 4,35 7,9 9,4,07 5,09 6,75 0,5 6 5,35 8,56 0,65,59 6,8 8,55,46 7 6,35 9,80,0 4,07 8,48 0,8 4,3 8 7,34,03 3,36 5,5 0,09,96 6, 9 8,34,4 4,68 6,9,67 3,59 7,88 0 9,34 3,44 5,99 8,3 3, 5,9 9,59. A következő bináris döntést végző döntési fát tanítottuk egy mintahalmaz alapján. A minták az A, illetve a B osztályba tartoznak, eredetileg 5000-5000 tanítóminta volt mindkét osztályból. Az egyes csomópontok mellett (jobbra) található két szám azt mutatja, hogy abba a csomópontba hány A, illetve B osztálybeli tanítóminta jutott el. A javaslat az, hogy vagy a -es vagy a 3-as csomópontot zárjuk be (az innen kiinduló részfát vágjuk le). Elvégezve a hibaarány-komplexitás metszési eljárás vizsgálatot a kettő közül melyik csomópontból kiinduló részfa metszése a jobb? (Természetesen válaszát számítással támassza alá!) [5000 ; 5000] [3000 ; 000] 3 [000 ; 3000] 4 [500 ; 00] 5 6 [500 ; 800] [000 ; 0] 7 [000 ; 3000] 8 [400 ; 00] 9 [00 ; 600] 0 [400 ; 0] [600 ; 3000] [00 ; 300] 3 [0 ; 300]

3. Kétosztályos (bináris) osztályozási feladatot oldunk meg. 0 paramétert mértünk minden mintán, és a véletlen módon kiválasztott, mért és minősített (ismert osztályba sorolású) 7.000 minta alapján egy egyszerű perceptront tanítottunk, amelynél van eltolás is. (Az egyszerű perceptron lineáris elválasztó felületet képes megtanulni, az eltolás miatt nem csak nem csak az origón átmenő hipersíkokat képes megtanulni.) Implementációs okokból a használt perceptronok mindegyik súlya vagy nulla vagy egy max. 3 biten ábrázolt kettő hatvány (magyarán 0,,, 4). A tanítás végén 00%-os pontosságot értünk el. Kollegánk azt állította, hogy a kapott perceptron az új mintákon is legalább 95%-os pontosságot fog elérni, ebben ő legalább 90%-ban biztos. Jogos-e a véleménye, ha a mintaszám korlátot elfogadjuk jó becslésként (bár rendszerint nem az)? 4. Milyen lehetőségeket ismer annak a problémának a megoldására, ha a tanulórendszerünk tanító mintáinak egy részénél hiányzik a 0 leíró paraméter (attribútum) közül néhánynak az értéke? (Legfeljebb paraméter érték hiányzik, ennél soha nem több, persze lehet, hogy kevesebb, vagy egyáltalán nem hiányzik egy sem.) Még a hiányos mintáinkat se akarjuk eldobni, mert kevés a hibátlanul regisztrált minta. 5. Egy tanulási folyamat során a rendelkezésre álló ismert kívánt válasszal rendelkező mintáink közül 370-et tanításra, 349-et tesztelésre használunk. Amikor az 370 tanítómintával egyenként végrehajtjuk a tanítási lépést, utána lemérjük az eszköznek a tanítóhalmazon és a teszthalmazon mutatott átlagos hibáját: ezt így együtt nevezzük egy-egy tanítási epochnak. Majd újrakezdjük a folyamatot (második epoch, harmadik epoch) és így tovább. A következőt tapasztaltuk: eddigi epochok száma átl. hiba a tanítómintán 00 00 300 400 500 600 700 800 900 0,5 0,4 0,38 0,9 0, 0,7 0,4 0, 0,09 átl. hiba a tesztmintán 0,55 0,4 0,36 0,33 0,35 0,37 0,36 0,4 0,4 5.A A táblázat alapján hány epoch után tapasztalunk túltanulást? 5.B Azt javasolták, hogy a tanítás leállításakor vizsgáljuk meg a nagy hibájú mintákat, és a nagy hibájú tesztminták tulajdonságai alapján módosítsuk az eszközt, majd ezzel a módosított eszközzel tanítsunk újra ugyanezzel a módszerrel. Jó-e ez a javaslat? 6. 6.A Egy 3-dimenziós (bemeneti paraméterek: x, x, x3) háromosztályos osztályozási feladatot úgy oldottunk meg, hogy kétosztályos részfeladatokat tanítunk, és a részproblémák megoldásait integráljuk. Rajzolja fel a szakértőkből álló moduláris megoldást, a végső eredményt adó rendszerintegráló blokkokkal együtt! 6.B. Adja meg, hogy a harmadik (C 3 ) osztályba eső minta esetén a moduláris megoldás egyes blokkjainak kimenetein milyen értéket vár! 7. Van egy minták alapján tanítható eszközünk, amelyet kipróbáltunk egy adott kétosztályos osztályozási probléma esetén, és a nagyon nagy tanítóminta halmazon 0,47 hibaarányt értünk el. Van-e módszer rá, hogy ennek az eszköznek, és ennek a tanítóminta halmaznak a felhasználásával olyan összetett rendszert alakítsunk ki, amely 0,05 hibaarány elérésére képes ezen a tanítóhalmazon? 8. Kétbemenetű lineáris eszközünk három paraméterrel rendelkezik (van eltolás), és a paraméterek csak a -,0 és + értékeket vehetik fel. Igaz-e, hogy ennek az eszköznek a VC dimenziója legalább 3? (t eszt ) (t eszt ) 9. Egy osztályozási feladatnál a P( y d ) valószínűség mit jelent? (Az eszköz pontossága, általánosító képessége, hibája stb.)

0. A döntési fa tanulás pszeudókódja: function DÖNTÉSI-FA-TANULÁS(példák,attribútumok,alapérték) returns egy döntési fa inputs példák, a példák halmaza attribútumok, az attribútumok halmaza alapérték, a célpredikátum alapértéke if példák üres then return alapérték elseif példák minden elemének azonos a besorolása return közös besorolás elseif attribútumok üres halmaz return TÖBBSÉGI-ÉRTÉK(példák) else endif legjobb Attribútum-Választás(attribútumok, példák) fa egy új döntési fa, a gyökér a legjobb attribútum tesztje m TÖBBSÉGI-ÉRTÉK(példák) for each legjobb tesztjének minden v i lehetséges értékére do példák i {a példák azon elemei, amelyre a legjobb attribútum értéke =v i } részfa DÖNTÉSI-FA-TANULÁS(példák i,attribútumok-legjobb,m) a fa dötési fához adjunk egy v i címkéjű ágat és a részfa részfát endfor return fa % A % B % C % D Az következő ábrán egy 3500 minta alapján tanítással előállított döntési fa látható. A mintákat 4 attribútum jellemzi X, X, X3 és X4; az első három bináris, a negyedik 3 értékű diszkrét. A csomópontok mellett jobbra található annak az attribútumnak a neve, amelyet az adott csomópontban tesztelünk, és bekeretezve, szögletes zárójelben látható két szám, ez az adott csomóponthoz érkező, C, illetve C osztályba tartozó tanítóminták száma. X [405,095] levél: besor. ; kijárat X [40,780] 3 X3 [985,35] 4:... ; 6:... ; 4 [0,47] 5 X4 [40,533] 6 [87,0] 7 X [68, 35] 8:... ; 9:... ; 8 [0,533] 9 [40,0] 0 [0,0] [0, 3] X4 [68, 003] 0:.. ; :.. ; 3:.. ; 4:.. ; 3 [0, 0] 4 [68, 9] 5 [0, 994] 5:.. ; 0.A Adja meg, hogy melyik levéltől való visszatéréskor a pszeudókód melyik kijáratánál (A, B, C vagyd) léptünk ki, és melyik levélhez milyen besorolás tartozik (az odaérő ismeretlen mintákra mit fog mondani a megtanított döntési fa)! (9 levél van: az ábra mellett jobbra felsorolva. Ennél az alkérdésnél nem kérek indoklást!) 0.B A gyökér () csomópontban hányszor fog meghívódni ez a DÖNTÉSI-FA-TANULÁS függvény? 0.C. Összesen hányszor fog meghívódni ez a függvény, mire előáll a felrajzolt döntési fa? 3

0.D. A gyökér () csomópontból melyik kijáraton tér vissza a függvény? 0.E. Más döntési fát alakított volna ki ez a tanuló függvény (DÖNTÉSI-FA-TANULÁS), ha a 8-as csomópontba jutó minták eloszlása [0,53], a 9-esbe jutóké [40,0] lett volna, és mindegyik másik csomópontba az ábrán látható számú minta jutott volna mindkét osztályból? (Ha mást, akkor mi lenne a különbség, ha nem mást, akkor miért ugyanez lenne?). Kétosztályos osztályozási feladatunknál (C és C osztályok) a mintákat 8 paraméter jellemzi: az x,,x7 paraméterek binárisak, az x8 valós, értékkészlete [-0,0]. Nagyszámú ismert besorolású mintánk van a tanítóhalmazban, a fele az egyik osztályba tartozik, a fele a másikba. Azt tapasztaljuk, hogy a C-be tartozó minták felére x8<75, a C-be jutók felére az igaz, hogy x8>75 (pontosan 75 értéket egyik halmaz egyet-len mintájánál se találtunk). Mennyi lesz a tanítóminta halmazon az x8<75 teszt információ nyeresége?. Két szakértőből felépített MOE struktúrát használunk, a paramétereket egy tanító mintahalmaz segítségével az előadáson tanult módszerrel állítottuk elő. A mintákat attribútum jellemzi (x, x). A i e kapuzó hálózat a gi e k T v x T vk x i=, összefüggést valósítja meg a v i, i=, paramétervektorok megtanítása után. Lineáris-e a két szakértő dominanciáját jellemző területeket elválasztó határvonal? 3. Két eszközünk van, egy lineáris és egy nemlineáris. A lineáris eszköznek 3 szabad paramétere van, a nemlineáris eszköznek 5. A lineáris eszköz paramétereit 4 biten ábrázoljuk (6 féle értéket vehetnek fel), a nemlineáris eszközét biten (4-féle érték). Melyiket tekintjük nagyobb komplexitásúnak, ha anemlinearitás jellege kötött, nemlineáris esetben is csak a paraméterek változhatnak? 4. Két döntési fa készült ugyanazon problémára. A két fa különböző sorrendben teszteli az attribútumokat. Lehet-e a két fa konzisztens ugyanazzal a mintahalmazzal? 5. A mintatér egyforma méretű részekre bontása is segíthet egy bonyolult probléma egyszerűbb részfeladatokra való dekomponálásánál? 6. MOE struktúrát használunk, a MOE paramétereit egy tanító mintahalmaz segítségével az előadáson tanult módszerrel állítjuk elő. Milyen szerepet játszik a megtanított rendszer ismeretlen, új mintákra való alkalmazásánál az asszociált zaj? 4

7. A következő a minták két osztályba sorolását végző döntési fát egy mintahalmaz alapján tanítottuk. A minták az A és B osztályba tartoznak, eredetileg 7000-7000 tanítóminta volt mindkét osztályból. Az egyes csomópontok mellett (jobbra) található két szám azt mutatja, hogy abba a csomópontba hány A, illetve B osztálybeli tanítóminta jutott el. Mekkora az információnyereség a -es csomópontból kiinduló részfa tesztjeinek eredményeképp? (Figyelem: nem a hibaarányt kérdezem, mint a metszésnél, hanem az információnyereséget, és a teljes részfára!) A részfát nem rajzoltam be az ábrába, gyökere a -es csomópont, levelei az X, Y, Z, W, Q, ZS csomópontok.) [7000 ; 7000] [5000 ; 500] 3 [000 ; 5500] ZS [500 ; 0] 6 [0; 500] 7 [000 ; 5000] 0 [500 ; 700] [500 ; 0 ; 4300] Y [80 ; 0] W [00 ; 800] 6 7 [00 ; 600] X [00 ; 400] Z [4000 ; 00] Q [0 ; 00] 8. Egy bemenetű kimenetű MOE struktúrában nemlineáris kapuzó hálózatot és két lineáris szakértőt használunk. A szakértők paraméterei rendre =[0-0,3 0,] T, =[0. -0. -0.] T. A harmadik paraméter tartozik az eltoláshoz. A kapuzó hálózat megfelelő paramétervektorai v=[ 0 0] T, v=[ ] T, itt is a harmadik paraméter tartozik az eltoláshoz. Az egyik kapuzó kimenet (g) előállítása nem közvetlenül történik -ből (a szokásos exponenciális T összefüggéssel), hanem az f ( ) ( vx ) nemlinearitáson keresztül. Az első szakértő kimenetéhez egységnyi szórású Gauss zajt asszociálunk, de a második szakértőhöz nem Gauss zajt asszociálunk, hanem a következő sűrűségfüggvénnyel rendelkező zajt: 0.9375*(y - ) P ( y ) 4.8750(y - ) 0.9375 0 különben ha - (y - ) A. Adja meg a MOE struktúra kimeneti jelét, ha a bemeneti vektor x = [+ -] T! B. Adja meg annak a görbének az egyenletét, illetve rajzolja is fel az x -x síkon a görbét, amely elválasztja azt a térfelet, amelyiken az első szakértő kap nagyobb súlyt, attól, amelyiken a második szakértő (jelölje be, hogy melyik térrészben melyik dominál)! ( ) C. Adja meg a második szakértő paramétervektorának új értékét, miután egy lépésben tanítottunk az y 0 ( ) x T mintával! (A tanítás során a bátorsági faktor 0,). 5