IDA ELŐADÁS I. Bolgár Bence október 17.

Hasonló dokumentumok
4 2 lapultsági együttható =

Support Vector Machines

Egy negyedrendű rekurzív sorozatcsaládról

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Regresszió. Fő cél: jóslás Történhet:

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

A sokaság/minta eloszlásának jellemzése

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Kernel gépek vizsgálata

BUDAPESTI MŰ SZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM KÖZLEKEDÉSMÉRNÖKI ÉS JÁRMŰMÉRNÖKI KAR VASÚTI JÁRMŰVEK ÉS JÁRMŰRENDSZERANALÍZIS TANSZÉK

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak

Mesterséges Intelligencia MI

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

A DÖNTÉSELMÉLET ALAPJAI

Hely és elmozdulás - meghatározás távolságméréssel

Numerikus módszerek 1.

Gonda János VÉGES TESTEK

Összeállította: dr. Leitold Adrien egyetemi docens

Osztályozó algoritmusok vizsgálata

Méréselmélet: 5. előadás,

Az entrópia statisztikus értelmezése

Biostatisztika e-book Dr. Dinya Elek

1. Absztrakt terek 1. (x, y) x + y X és (λ, x) λx X. műveletek értelmezve vannak, és amelyekre teljesülnek a következő axiómák:

7. Regisztráció. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

Frank András MATROIDELMÉLET május 20.

Intelligens elosztott rendszerek

A Bevezetés a matematikába című tárgy 3. félévével kapcsolatos tudnivalók

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán):

Indirekt térfogat-vizualizáció. Fourier térfogat-vizualizáció. Tomográfiás rekonstrukció. Radon-transzformáció. A Fourier vetítő sík tétel

Dr. Jelasity Márk Mesterséges Intelligencia I. (I602, IB602)

METROLÓGIA ÉS HIBASZÁMíTÁS

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

Orosz Gyula: Markov-láncok. 4. Statisztikus golyójátékok

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

GAMMA-SPEKTRUMOK KIÉRTÉKELÉSÉNEK MATEMATIKAI MÓDSZEREI II. REGULARIZÁCIÓS MÓDSZEREK

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Az elektromos kölcsönhatás

Töréskép optimalizálás Elmélet, megvalósítás, alkalmazás

A bankközi jutalék (MIF) elő- és utóélete a bankkártyapiacon. A bankközi jutalék létező és nem létező versenyhatásai a Visa és a Mastercard ügyek

Általános esetben az atomok (vagy molekulák) nem függetlenek, közöttük erős

17. előadás: Vektorok a térben

A KroneckerCapelli-tételb l következik, hogy egy Bx = 0 homogén lineáris egyenletrendszernek

Mechanizmus-tervezés: szociális jóléti függvény nem kooperatív (versengő) ágensek. A megegyezés keresése és elérése: Tárgyalás (Negotiation)

KLASSZIKUS TERMODINAMIKA

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

Adatelemzés és adatbányászat MSc

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

ADATREDUKCIÓ I. Középértékek

A kvantum-információelmélet alapjai

,...,q 3N és 3N impulzuskoordinátával: p 1,

A korlátozás programozás alapjai

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Bels pontos módszer geometriai programozási feladatra

A MOLEKULADINAMIKAI MÓDSZEREK SZISZTEMATIKUS TÁRGYALÁSA: KLASSZIKUS DINAMIKA A POSTERIORI KORREKCIÓJA

Elemi szelekciós elmélet

8. Programozási tételek felsoroló típusokra

VIK A2 Matematika - BOSCH, Hatvan, 3. Gyakorlati anyag. Mátrix rangja

Kísérlettervezési alapfogalmak:

Vektorok, mátrixok, lineáris egyenletrendszerek

Lineáris regresszió. Statisztika I., 4. alkalom

EM-ALGORITMUS HIÁNYOS ADATRENDSZEREKRE

Műszaki folyamatok közgazdasági elemzése. Kevert stratégiák és evolúciós játékok

10. Alakzatok és minták detektálása

Vadas Norbert Robotkarok problémája

3. Évközi ellenőrzés módja: 2 zárhelyi dolgozat íratása. 4. A tárgy előírt külső szakmai gyakorlatai: -

Laboratóriumi kontrollkártya használata Tananyag. Készítette: Muránszky Géza vegyészmérnök Oktató: Lőrinc Anna minőségirányítási előadó

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Periodikus figyelésű készletezési modell megoldása általános feltételek mellett

Szimmetriák, pontcsoportok, Bravais-rácsok

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Matematika (mesterképzés)

Elosztott rendszerek játékelméleti elemzése: tervezés és öszönzés. Toka László

Kvadratikus alakok és euklideszi terek (előadásvázlat, október 5.) Maróti Miklós, Kátai-Urbán Kamilla

IMPRESSA C5 Használati útmutató

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

Trigonometria Megoldások. 1) Igazolja, hogy ha egy háromszög szögeire érvényes az alábbi összefüggés: sin : sin = cos + : cos +, ( ) ( )

ADATREDUKCIÓ I. Középértékek

Gépi tanulás a gyakorlatban SVM

A neurális hálózatok alapjai

ADATREDUKCIÓ I. Középértékek

3515, Miskolc-Egyetemváros

Elektrokémia 03. Cellareakció potenciálja, elektródreakció potenciálja, Nernst-egyenlet. Láng Győző

3D-s számítógépes geometria

Statisztika feladatok

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

Szárítás során kialakuló hővezetés számítása Excel VBA makróval

Trigonometria Megoldások. 1) Oldja meg a következő egyenletet a valós számok halmazán! (12 pont) Megoldás:

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

differenciálegyenletek

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI EMELT SZINT Trigonometria

Matematikai geodéziai számítások 10.

Kvantum-tömörítés II.

FFT. Második nekifutás. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék október 2.

Átírás:

IDA ELŐADÁS I. Bolgár Bence 2014. október 17. I. Generatív és dszkrmnatív modellek Korábban megsmerkedtünk a felügyelt tanulással (supervsed learnng). Legyen adott a D = {, y } P =1 tanító halmaz, ahol rendszernt X R d, d az adatok dmenzója, y Y-ra pedg pl. Y = {+1, 1} (klasszfkácó) vagy Y = R (regresszó). Célunk, hogy bármely új mntára y-t predktáljuk. I.A. Generatív modellek Az ún. generatív modellek esetében p(, y)-t keressük (nnen a generatív kfejezés s: a p(, y) együttes eloszlás smeretében akár új mntákat s tudunk generáln). Innen p(y ) = p(,y) p(), azaz adott esetén a y jósolható. Mért jobb nekünk p(y ) smerete, mnt egy egyszerű pontbecslés? Konfdenca-értékek származtatása. Bár adott -re mndkét esetben ugyanazt az értéket jósoljuk, mégs, az egyk esetben bztosabbak lehetünk az eredmény helyességében: p(y ) Mnták eldobása. Bzonytalanság esetén adott esetben egy-egy mnta akár el s dobható. Kegyensúlyozatlan osztályozás kompenzácója. Tegyük fel, hogy a feladat egy rtka betegség dagnosztzálása; jelölje C b a beteg osztályt: p(c b ) p( C b )p(c b ). Mvel az egészséges emberek sokkal nagyobb arányban fordulnak elő, a modellünk majdnem tökéletes eredményt fog elérn akkor s, ha mnden pácenst egészségesnek nylvánít. Ennek kküszöbölésére tanítsuk a modellt egy mesterségesen kegyensúlyozott adathalmazon. A fent képlet alapján a kapott posteror arányos a prorral, így nncs más dolgunk, mnt a kapott poszterort leosztan a mesterséges prorral (azaz a kegyensúlyozás után az adott osztályba eső mnták arányával), majd vsszaszorozn az eredet populácóra jellemző prorral. Modellek kombnácója. Éljünk az alább nav feltételezéssel: p( A, B C b ) = p( A C b )p( B C b ), azaz pl. a betegség dagnosztzálására két teszt s rendelkezésre áll, amelyek eredménye feltételesen (!) független egymástól. Ekkor p(c b A, B ) p( A, B C b )p(c b ) p( A C b )p( B C b )p(c b ) p(c b A )p(c b B ) p(c b ) A generatív modellek tovább előnye közé tartozk a margnálsok smerete. A p() eloszlás például felhasználható az ún. outlerek (kugró, rendellenes mnták) detekcójára. A generatív modellek hátránya, hogy rendszernt sok mntát és nagy számítás teljesítményt gényelnek (mntakompletás, számítás kompletás). y

I.B. Dszkrmnatív modellek A dszkrmnatív modelleknél közvetlenül p(y )-et becsüljük. Ekkor az együttes eloszlást, lletve p()-et elveszítjük, ám a fent előnyök nagy része továbbra s megmarad. Az alább ábra smét egy osztályozás feladatot mutat: p( C 1 ) p( C 2 ) p(c 2 ) p(c 1 ) Látható, hogy p( C 1 ) baloldal módusza egyáltalán nem befolyásolja a poszterort az együttes eloszlás smerete tehát nncs khatással a predkcóra. I.C. Dszkrmnatív függvények Itt olyan f : X Y, f F függvényt keresünk, amelyre f() = y, azaz a p(y ) eloszlást s elveszítjük (annak mnden előnyével együtt), y-ra csak pontbecslést kapunk. Előny vszont, hogy általában hatékonyan számítható és jó predktív teljesítménnyel bíró eljárásokhoz jutunk (pl. SVM). Felmerül a kérdés, hogy hogyan válasszuk meg f-et? f() f() f() Az ábra bal oldalán a hat adatpontunkra egy ötödfokú polnomot llesztettünk. Ez a függvény hat szabad paraméterrel bír, így r = 0 hbával rálleszhető a tanítómntákra. Megmutatható, hogy ennek ellenére a modell általánosítóképessége rossz f gyakorlatlag nem tett mást, mnt megjegyezte a tanítómntákra adandó válaszokat. Lényegesen jobb általánosítóképesség érhető el, ha F-et megszorítjuk, pl. a legfeljebb n-edfokú polnomokra (az ábra közepén n = 1, azaz lneárs regresszót végeztünk) így a szabad paraméterek számát, más szóval a modell kompletását csökkentjük (tt gondolhatunk például az Occam borotvája elvre). A modell kompletásának csökkentésére másk megközelítés az f függvény regularzácója. Az ábra jobb oldalán szntén ötödfokú polnomot llesztettünk, ám korlátoztuk az együtthatók nagyságát. A regularzált rzkómnmalzálás (RRM) során a hba mnmalzálása mellett a függvény kompletásának mnmalzálására törekszünk, amelyet például mérhetünk a függény valamlyen f normájával. A következő szakasz egy olyan keretet tárgyal, amely magába foglalja a regularzácó kérdését, a korábban már megsmert kernel módszereket, valamnt elmélet garancákat s szolgáltat.

II. Reproducng Kernel Hlbert Space (RKHS) Tekntsük a H := {f f = α k(, )} teret, ahol k(, ) : X X R egy kernel függvény (azaz szmmetrkus és poztív defnt). Ekkor a k(, ) : X R függvények bázst alkotnak a H térben. Tudjuk, f regularzácójához szükségünk lesz egy normára, valamnt a legtöbb kernel gép gényel egy belső szorzatot. Defnáljunk tehát egy belső szorzatot a fent téren a következőképpen: 1. Defnícó. Legyen f, g H, f = α k(, ), g = j β jk(, j ). Ekkor f, g := α β j k(, j ). j 1. Következmény. A fent választással f, g = α β j k(, j ) = j 2. Következmény. Szntén azonnal látható, hogy α g( ) = j β j f( j ). f, k(, ) = α k(, ) = f(). Ez a reprodukáló tulajdonság (reproducng property). Ahhoz, hogy H vektortér legyen (és így az algortmusok működjenek), be kell látnunk, hogy a fent defnált belső szorzat eleget tesz a követelményeknek. 1. Állítás., valóban belső szorzat a H téren. Bzonyítás. Az alább tulajdonságokat kell belátn: Szmmetrkus: k szmmetrájának közvetlen következménye. Blneárs: pl. f + f, g = j β j(f + f )( j ) = j β jf( j ) + j β jf ( j ) = f, g + f, g. A λf, g = λ f, g eset hasonlóképpen látható; a blneartás a szmmetra felhasználásával következk. f, f 0. Tudjuk, hogy f, f = j α α j k(, j ) = α T Kα, ahonnan az állítás következk K poztív defnt volta matt. f, f = 0 f = 0. Az egyk rány következk az f() 2 = f, k(, ) 2 k(, ) f, f egyenlőtlenségből, ahol a Cauchy-Schwarz-Bunyakovszkj egyenlőtlenséget használtuk. A másk rány trváls. Emlékezzünk vssza, hogy számos algortmus nemlnearzálásának alapötlete az volt, hogy az mntákat egy másk (gyakran magasabb dmenzójú) térbe képeztük, majd ebben futtattuk az eredet (lneárs) algortmusunkat. A kernel trükk alkalmazása során pedg a leképezés eplct megadása helyett mntegy lecseréltük az eukldesz belső szorzatot a k kernel függvényre:, j φ( ), φ( j ) = k(, j ). A reprodukáló tulajdonságból mmár azt s tudjuk, hogyan írható fel ez a leképezés, ugyans k(, j ) = k(, ), k(, j ), így látjuk, hogy a φ leképezés nem más, mnt φ : k(, ). Hogyan néz k φ a gyakorlatban?

1. Példa. Legyen a k : X X R kernel függvény a következő: k(, j ) =, 2. Az egyszerűség kedvéért kétdmenzós esetet tekntünk, azaz legyen =, j =. Ekkor φ ( ), φ ( ) = k (, = (a 1 b 1 + ) 2 ) =, 2 = a 1 b 1 a 1 b 1 + a 1 b 1 + a 1 b 1 + = a 1 a 1 b 1 b 1 + a 1 b 1 + a 1 b 1 + a 1 a 1 b 1 b 1 = a 1 a 1, b 1 b 1. ( ) a 1 a 1 Következk, hogy φ = a 1 a 1, azaz k rögzítésével megkaptuk a φ leképezést s. A fent k a polnomáls kernelek specáls esete: k(, j ) = (, j + a) d, ahol d a kernel foka, a pedg a homogén/nhomogén tulajdonságért felel. Látjuk, hogy a másodfokú homogén polnomáls kernel (d = 2, a = 0) a feature-párok terébe képez ez hasznos pl. képfeldolgozásnál, ahol az éldetekcó történhet pel-párok alapján. Magasabb fokú kernelek a feature-n-esek terébe képeznek, a 0 esetén pedg nhomogén kereszt-tagok s megjelennek a reprezentácóban (azaz feature 1-esek + feature 2-esek +... + feature-n-esek). A fent példa jól mutatja a kernel trükk lényegét: míg nagy d esetén a φ() reprezentácók belső szorzata a nagy dmenzó matt közvetlenül már nem kszámítható, a k függvény segítségével mégscsak gyorsan megkaphatjuk. Térjünk most vssza f regularzácójára és az f normára. 1. Tétel. (Kmeldorf Wahba reprezenter tétel). Legyen adott Ω : R + R szgorúan monoton növő függvény, L : (X R R) P R általános veszteségfüggvény. Ekkor a L (( 1, y 1, f( 1 )),..., (( P, y P, f( P ))) + Ω ( f ) regularzált rzkó mnden mnmalzátora a következő alakban írható: f() = α k(, ). 2. Példa. Kétosztályos SVM. L (( 1, y 1, f( 1 )),..., (( P, y P, f( P ))) = 1 P Ω ( f ) = λ 2 f 2 Ez a felírás ekvvalens a következővel: ma (0, 1 y f ( )) mn 1 2 f 2 + C ξ s.t. y f( ) 1 ξ, ξ 0,

am a kétosztályos SVM prmálja, ha fgyelembe vesszük, hogy f() = w T + b (ezt nem bzonyítjuk; a Resz reprezentácós tétel következménye). A Kmeldorf Wahba tétel garantálja, hogy a megoldás s a kívánt alakot vesz fel. Fgyeljük meg, hogy mvel f = α k(, ), f 2 mnmalzálása ekvvalens az α együtthatók korlátozásával (nagyon hasonlóan az előző szakaszban látott polnom-llesztéshez). Korábban azt s láttuk, hogy a kétosztályos SVM duál feladata a következő: 1 mn α α j y y j k(, j ) α 2 j s.t. 0 α C, ahol a kényszerfeltétel szntén az α együtthatók korlátozását jelent. Magas C esetén a korlát magasabb, am gyengébb regularzácót jelent kompleebb modelleket és esetlegesen túllleszkedést eredményezve. α