Gépi tanulás. Bagging, Boosting Adaboost

Hasonló dokumentumok
ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK

GAZDASÁGI ÉS ÜZLETI STATISZTIKA jegyzet ÜZLETI ELŐREJELZÉSI MÓDSZEREK

Adatbányászat: Rendellenesség keresés. 10. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba

ELEKTRONIKAI ALAPISMERETEK







ELEKTRONIKAI ALAPISMERETEK

ÉLETTARTAM KOCKÁZAT A nyugdíjrendszerre nehezedő egyik teher

Mesterséges Intelligencia MI

Síkalapok vizsgálata - az EC-7 bevezetése

ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK

Szinkron sorrendi hálózatok tervezése

Összegezés az ajánlatok elbírálásáról

ELOSZLÁS, ELOSZLÁSFÜGGVÉNY, SŰRŰSÉGFÜGGVÉNY

HF1. Határozza meg az f t 5 2 ugyanabban a koordinátarendszerben. Mi a lehetséges legbővebb értelmezési tartománya és



TARTÓSSÁG A KÖNNYŰ. Joined to last. 1

Tiszta és kevert stratégiák

Mesterséges Intelligencia MI

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

é ĺ é é é ü é ľ ü é ľ ó ö é é źą é ĺ ü é é é ü é ö é é ľ ü é é ó ź ľ ó ó ó é ö é ł é ö é é ľó ó ó é ĺ é é é ó ó é é ó í ó ó é ö ó ó í ó é ó í ó ó í ó

ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK


Egy uttes m odszerek Isp any M arton es Jeszenszky P eter okt ober 18.

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak

Gyakorló feladatok Az alábbiakon kívül a nappalis gyakorlatokon szereplő feladatokból is lehet készülni.

Kollégáimmal arra az elhatározásra jutottunk, hogy kicsit átfabrikáljuk, napra késszé tesszük cégünk magazinjának első számát.


A maximum likelihood becslésről

Kommunikációs hálózatok 2 Analóg és digitális beszédátvitel

Gépi tanulás. A szükséges mintaszám korlát elemzése. Pataki Béla (Bolgár Bence)

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

Kommunikációs hálózatok 2 Analóg és digitális beszédátvitel

Makroökonómiai modellépítés monetáris politika

A sztochasztikus idősorelemzés alapjai

A BIZOTTSÁG MUNKADOKUMENTUMA

Anyag- és gyártásismeret II - LBt /

ü ű í ú ű í É í Ö í ü Ö É í í Ö í É ú ú Ú í

5. Differenciálegyenlet rendszerek

JELEK ALAPSÁVI LEÍRÁSA. MODULÁCIÓK. A CSATORNA LEÍRÁSA, TULAJDONSÁGAI.

ELEKTRONIKAI ALAPISMERETEK



Opkut 2. zh tematika

Szempontok a járműkarbantartási rendszerek felülvizsgálatához


FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ó Ó ü ú ú

MATEMATIKA ÉRETTSÉGI május 8. EMELT SZINT

Biomatematika 2 Orvosi biometria


13 Wiener folyamat és az Itô lemma. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

Csima Judit április 9.

ELEKTRONIKAI ALAPISMERETEK

ű ű Ö Ü

ő Ú ú Ü ú

Ó

7. KÜLÖNLEGES ÁRAMLÁSMÉRİK

Ó Ü

FIZIKA FELVÉTELI MINTA

ű ű ű Ú Ü Ü Ú ű Ó Ó ű

ű ű Ó

Ú ű Ö ű ű Ü Ú ű Ü ű ű ű ű ű Ö ű

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ű ű ű Ú ű ű Ó ű Ó Ö

ú ú ú ű ú Ó ú ű Ö Ö ű ű ű ú ú ű ű ű ű ú ű Ö ú ú ű Ó ű ű

Ú Ö ű Ö

é öí é ú ľ ľ ĺ ú éĺ ľ ő é ľ é ő ü é ő ĺí ó é ó ó ó ö ľ ľ Ę é ő ü ú ľ ľ é őł ü ó ť í ö é é ö ó ľ ó ľ ó é ő í éľ é é ó é é ó ő Íé é őł ĺ é ľ ü é ű ľ ő é

Dinamikus optimalizálás és a Leontief-modell

Aggregált termeléstervezés

Ó ű ű ű ű ű


ű ű ű Ú ű ű ű ű Ó

Fluoreszkáló festék fénykibocsátásának vizsgálata, a kibocsátott fény időfüggésének megállapítása


Í ú ü ü ú Ó É ü Í É ü Í ü ü Íü


Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

6. szemináriumi. Gyakorló feladatok. Tőkekínálat. Tőkekereslet. Várható vs váratlan esemény tőkepiaci hatása. feladatok

Digitális multiméter az elektrosztatika tanításában

Primitív függvény. (határozatlan integrál)

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

17. előadás: Vektorok a térben

ű ű ű ű ű ű ű ű

Ö Ö Ú

EKOP-1.A.1-08/C Az Európai Unió és a Magyar Állam által nyújtott támogatás összege: Ft

M{ZD{ mx Maz_MX5_12R2_V2_Cover.indd 1 01/08/ :05

Erőmű-beruházások értékelése a liberalizált piacon

valós számot tartalmaz, mert az ilyen részhalmazon nem azonosság.

8. előadás Ultrarövid impulzusok mérése - autokorreláció

Átírás:

Gépi anulás Bagging, Boosing Adaboos Paaki Béla BME I.E. 414, 463-26-79 paaki@mi.bme.hu, hp://www.mi.bme.hu/general/saff/paaki

Ponos, de különböző együműködő megoldások 1 y M d( x) y y 1 2 y M h ( x) h ( x ) 1 2 h ( x ) M x A különbözőség bizosíásának egyik eszköze lehe, hogy különböző aníómina-halmazoka használunk a különböző szakérőknél. De ha széoszuk a minahalmaz M szakérő köz, akkor az eredei N mina helye N/M u egyre kevés lehe a aníáshoz.

Bagging (Boosrap Aggregaing): az eredei N-elemű aníóminából mind az M szakérőnek egy-egy N-elemű minahalmaz generálunk visszaevéses minavéelezéssel. Mivel a már kive mináka visszaesszük a kövekező minavéel elő, ezér lesznek olyan minák, amelyeke öbbször is beeszünk a célhalmazba. Nagy N-re kb. 1 1 63,2% lesz olyan mina, amelyik csak e egyszer fordul elő a célhalmazban, a öbbi kb. 37% készeres vagy öbbszörös előfordulású mina. Persze minden célhalmazban mások lesznek a öbbszörösek, ez bizosía a különbözősége.

Boosing alapöle #1 Baggingnél: az egyes szakérőknél használ aníómina-halmazoka logikailag párhuzamosan alakíouk ki (a sorrend mindegy vol, az egyik halmaz összeéele nem hao a másikra sb.) vélelenszerű vol, hogy melyik mina kerül öbbször az egyik vagy másik aníó-halmazba. Boosing: a szakérők aníása legyen soros: vegyük figyelembe, hogy a már anío szakérők hol elesíenek rosszul, és oda képezzük ki az ú szakember azoka mináka súlyozzuk a kövekező minahalmazba, amike az előző szakérő rosszul oszályozo

A legöbb problémánál: Boosing alapöle #2 álalában nehéz kifinomul, ponos megoldás adni ugyanakkor sokszor könnyű nem úl ponos ökölszabályoka felállíani (pl. ha a hallgaó bizonyalanul nézege szanaszé a vizsgára való felkészülés során, akkor kevese ud ) ehá próbálunk egyszerű eszközökből ponos összee eszköz lérehozni Az egyszerű eszközöke gyengén anuló (Weak Learner, WL) eszközöknek nevezzük. Annyi várunk el őlük, hogy 50%-nál kisebb hibával oszályozzanak (bináris, IGAZ/HAMIS probléma. (50% a vélelen alálgaás eredménye lenne).

folyamaábra áblára

A -dik oszályozó megkeresi az opimális vágás, figyelembe véve az egyes minákhoz rendel súlyoka. h (ST(x ))=-1 LegobbLimi A dik oszályozó hibaaránya a aníóminákon: h ( x ) y D ( ) T 1 1 ht ( x) sign( h ( x)) ln 1 2 D ( ) e ha h ( ) y x D 1( ) D ( ) e D ( ) e ha h ( x ) y D D(x 7 ) y 7 =+1 1 D(x 1 ) y 1 =-1 legobb limi D(x 3 ) y 3 =-1 D ( ) ( ) D ( ) D(x 19 ) y 19 =+1 h (STx ))=+1 D(x 5 ) y 5 =+1 arg min( D ( x )) L h ( ST ( x )) y 1 D(x 283 ) y 283 =-1 D(x 2 ) y 2 =+1 Normáluk, hogy a súlyok összege 1 legyen. skaláruladonság: ST(x) h ( x ) y Gyakran a P paraméerből álló összee leírás uladonságokra bonuk, és az egyes részoszályozók ezeke vizsgálák. (Legegyszerűbb, ha skalár a uladonság.) x x x x 1 2 P (Skalár) Tuladonság 1 pl. x 3 (Skalár) Tuladonság 2 pl. log(x 1 x 13 ) (Skalár) Tuladonság K Az eredő összee oszályozó T lépés uán. Növelük a rosszul oszályozo, csökkenük a ól oszályozo minák súlyá.

Felső korlá az eredő eszköz VC-dimenzióára T h( x) sign( ( h ( x) b) :, b, h H 1 ahol d=vcdim(h). Az adaboos megoldás VC-dimenzióára adhaó korlá: d 2 ( d 1) ( T 1) log (( T 1) e) VC 2

Túlanulás? A nagy komplexiás arra ual, hogy könnyen halamos lehe a úlanulásra. Ez előfordul, de a gyakorla legöbbször nem igazola vissza: Még akkor is avul, amikor már 100%-os a aníóminán! On he Margin Explanaion of Boosing Algorihms (Wang, e al., COLT 2008)

Az egyes minaponok oszályozási margóa m( x, y ) y h( x ) Ha mindegyik részoszályozó ól oszályoza a -dik miná, akkor m( x, y) 1, ha mindegyik rosszul, akkor m( x, y ) 1 (small dash, large dash,solid) lines equal (5, 100, 1000) rounds of boosing Adaboos wih C4.5 rees [Freund & Schapire, 1998]

Korlá a aníási minákon elérheő hibára 1 0 2 Pr( h( x) y) [2 (1 ) ] 1 4 e Ha minden -re 0 Pr( h( x) d) e 2T 2 2 2 2

Korlá a eszminákon elérheő hibára TdVC P( h( xesz ) y) P( h( xaníó) y) O( ) N N a aníóminák száma, T az Adaboos ierációk száma d VC a kialakuló VC-dimenzió. Másik korlá a aníás során léreö oszályozó minaponokra ado margóin alapul. dvc P( h( xesz ) yesz ) P( m( xaníó, yaníó) ) O( ) N 2

Demófelada: 5 dimenziós mináka sorolunk 2 oszályba, olyan oszályozórendszer használunk, amelynek VC dimenzióa 8. Turbózás során 6 részoszályozó aníounk, a 100 elemű aníómina-halmazon elér ponosságuk rendre 0,95 0,93 0,96 0,9.0,8.0,95. Milyen ponosságo vállalhaunk nagy valószínűséggel az eszközre, ha a 100 ponos mina ól reprezenála a problémá? (A felsőkorlá-becsléseke ponos képlekén felfogva ami amúgy ordíó módon nem igaz.) Az eredő oszályozó mind a 100 aníópono ól oszályoza, a kövekező 3 vol a legkevésbé bizosan oszályozo pon, a öbbieknél a margó 0,95-nél nagyobbra adódo: y k +1-1 -1 h (x k ) h 1 (x k ) 0,05 1,4722 1-1 -1 h 2 (x k ) 0,07 1,2933-1 -1 1 h 3 (x k ) 0,04 1,5890 1 1-1 h 4 (x k ) 0,1 1,0986 1-1 -1 h 5 (x k ) 0,2 0,6931 1 1 1 h 6 (x k ) 0,05 1,4722 1-1 -1 m(x k ) 0,6605 0,4009 0,4785