Intelligens adatelemzés

Hasonló dokumentumok
Valószín ségi döntéstámogató rendszerek

Intelligens adatelemzés

A projekt keretében elkészült tananyagok:

Budapesti Műszaki és Gazdaságtudományi Egyetem Vegyészmérnöki és Biomérnöki Kar Szervetlen és Analitikai Kémia Tanszék

ÁLTALÁNOS KÉMIAI LABORATÓRIUMI GYAKORLATOK

Molekuláris biológiai technikák

Intelligens adatelemzés

A könyv. meglétét. sgálat

Budapesti Műszaki és Gazdaságtudományi Egyetem Vegyészmérnöki és Biomérnöki Kar Szerves Kémia és Technológia Tanszék

A projekt keretében elkészült tananyagok:

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

FOLYAMATIRÁNYÍTÁSI RENDSZEREK

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Klinikai kémia. Laboratóriumi diagnosztika. Szerkesztette: Szarka András. Írta: Budapesti Műszaki és Gazdaságtudományi Egyetem Semmelweis Egyetem

INTELLIGENS ADATELEMZÉS

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

A projekt keretében elkészült tananyagok:

Budapesti Műszaki és Gazdaságtudományi Egyetem Vegyészmérnöki és Biomérnöki Kar Szervetlen és Analitikai Kémia Tanszék

Tóth János - Simon L. Péter - Csikja Rudolf. Differenciálegyenletek feladatgyűjtemény

TÁMOP /2/A/KMR Jegyzetek és példatárak a matematika egyetemi oktatásához

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

ATOMENERGETIKA ÉS NUKLEÁRIS TECHNOLÓGIA

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

SZERVES KÉMIAI PRAKTIKUM

Összeállította Horváth László egyetemi tanár

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

VARIÁLHATÓ PÉLDATÁR Matematika2 (A2)

Operációkutatási modellek

Gépi tanulás a gyakorlatban. Bevezetés

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Bizonytalanságok melletti következtetés

A projekt címe: Egységesített Jármű- és mobilgépek képzés- és tananyagfejlesztés

Kutatás-fejlesztési eredmények a Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszéken. Dombi József

Több valószínűségi változó együttes eloszlása, korreláció

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

LINEÁRIS ALGEBRA PÉLDATÁR MÉRNÖK INFORMATIKUSOKNAK

Nagy méretű adathalmazok vizualizációja

Neurális hálózatok bemutató

Vizuális adatelemzés

VEGYIPARI MŰVELETEK II. Anyagátadó műveletek és kémiai reaktorok

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Mesterséges Intelligencia MI

KÖZELÍTŐ INFERENCIA II.

PROK ISTVÁN SZILÁGYI BRIGITTA ÁBRÁZOLÓ GEOMETRIA. Ábrázoló geometria példákon keresztül

Tartalomjegyzék. Tartalomjegyzék... 3 Előszó... 9

Exact inference in general Bayesian networks

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Termék modell. Definíció:

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar

KÖZELÍTŐ INFERENCIA II.

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Adatbányászati szemelvények MapReduce környezetben

Eredmények kiértékelése

A távérzékelt felvételek tematikus kiértékelésének lépései

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

Tartalomjegyzék. Typotex Kiadó, 2010

MATEMATIKA TANMENET SZAKKÖZÉPISKOLA. 9. Nyelvi előkészítő osztály

A Kecskeméti Református Általános Iskola évi országos kompetenciamérés eredményének értékelése. 1. táblázat

FELÜGYELT ÉS MEGERŐSÍTÉSES TANULÓ RENDSZEREK FEJLESZTÉSE

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

EÖTVÖS LORÁND TUDOMÁNYEGYETEM MATEMATIKAI INTÉZET ALKALMAZOTT MATEMATIKUS MESTERKÉPZÉS SZAKLEÍRÁS

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

IV.7 MÓDSZER KIDOLGOZÁSA FELHASZNÁLÓI ADATOK VÉDELMÉRE MOBIL ALKALMAZÁSOK ESETÉN

Az Országos kompetenciamérés (OKM) tartalmi kerete. a 20/2012. (VIII. 31.) EMMI rendelet 3. melléklete alapján

Matematikai geodéziai számítások 6.

Csoport-struktúrált generátorrendszerek online tanulása

Tanulás az idegrendszerben. Structure Dynamics Implementation Algorithm Computation - Function

A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Tanmenet a évf. fakultációs csoport MATEMATIKA tantárgyának tanításához

Kovács Ernő 1, Füvesi Viktor 2

Méréselmélet MI BSc 1

IBM SPSS Modeler 18.2 Újdonságok

(Diszkrét idejű Markov-láncok állapotainak

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Vizuális adatelemzés - Gyakorlat. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

1/8. Iskolai jelentés. 10.évfolyam matematika

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Mesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.

Parametrikus tervezés

BACCALAUREUS SCIENTIÆ TANKÖNYVEK

1. gyakorlat. Mesterséges Intelligencia 2.

CAD Rendszerek I. Sajátosság alapú tervezés - Szinkron modellezés

Mesterséges Intelligencia Elektronikus Almanach

A Dél-Alföldi régió innovációs képessége

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

TANMENET 2015/16. Készítette: KOVÁCS ILONA, Felhasználja: Juhász Orsolya

1/8. Iskolai jelentés. 10.évfolyam matematika

Átírás:

Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az adatelemzés folyamata szerint ismertetünk intelligens megközelítéseket, amelyekben az intelligencia a felhasznált háttértudás, a számítási erőforrások vagy a modellek komplex volta miatt is jelenik meg. Budapesti Műszaki és Gazdaságtudományi Egyetem Semmelweis Egyetem Typotex Kiadó 2014

Copyright: 2014 2019, Kocsis Imre, Horváth Gábor, Hullám Gábor, Millinghoffer András, Antal Péter, Marx Péter, Antos András, Salánki Ágnes, Pataricza András, Budapesti Műszaki és Gazdaságtudományi Egyetem, Semmelweis Egyetem Creative Commons NonCommercial-NoDerivs 3.0 (CC BY-NC-ND 3.0) A szerző nevének feltüntetése mellett nem kereskedelmi céllal szabadon másolható, terjeszthető, megjelentethető és előadható, de nem módosítható. Lektorálta: Takács Gábor Készült a Typotex Kiadó gondozásában Felelős vezető: Votisky Zsuzsa ISBN 978-963-279-171-5 Készült a TÁMOP-4.1.2/A/1-11/1-2011-0079 számú, Konzorcium a biotechnológia és bioinformatika aktív tanulásáért című projekt keretében.

Tartalomjegyzék 1. Aktív tanulás 1 1.1. Bevezetés: becslés, döntés, felügyelt (passzív) tanulás............ 1 1.1.1. Bayes-döntés.............................. 2 1.1.2. Bayes-döntés közelítése......................... 3 1.1.3. Bayes-becslés.............................. 4 1.1.4. Regressziós becslés; négyzetes középhiba minimalizálás....... 5 1.2. Aktív tanulás fogalma............................. 5 1.3. Véges sok középérték aktív tanulása...................... 6 1.3.1. Megvalósítási lehetőségek........................ 8 1.3.2. GAFS algoritmus............................ 9 2. Dimenzióredukció 11 2.1. Absztrakt.................................... 11 2.1.1. Kulcsszavak:............................... 11 2.2. Bevezetés.................................... 11 2.3. A dimenzió átka................................. 12 2.4. A dimenzióredukció alkalmazási területei................... 12 2.5. Főkomponens-analízis (PCA, KLT)...................... 15 2.5.1. Főkomponens- és altér-meghatározó eljárások............ 18 2.6. Nemlineáris dimenzióredukciós eljárások................... 21 2.6.1. Kernel PCA.............................. 23 2.6.2. Nemlineáris altér algoritmusok..................... 27 2.7. Irodalom..................................... 28 3. Ritka események detektálása 30 3.1. Anomáliák és ritka események......................... 31 3.2. Detektálási megközelítések........................... 34 3.2.1. Távolság alapú módszerek....................... 34 3.2.2. Sűrűség alapú módszerek........................ 42 4. Hiányos adatok 48 4.1. Bevezetés.................................... 48 4.2. A hiányzás típusai............................... 49

Tartalomjegyzék 4 4.3. Hiányos adatok kezelése............................ 51 4.3.1. Teljes eset módszer........................... 51 4.3.2. Ad-hoc módszerek........................... 51 4.3.3. Súlyozás................................. 52 4.3.4. Pótlás.................................. 52 4.3.5. Többszörös pótlás............................ 56 5. Vizuális analízis 58 5.1. Felderítés, megerősítés és szemléltetés..................... 59 5.2. Egydimenziós diagramok............................ 60 5.2.1. A doboz-ábra.............................. 60 5.2.2. Hisztogram............................... 61 5.3. Kétdimenziós diagramok............................ 62 5.4. n-dimenziós diagramok............................. 62 5.4.1. Mozaik és fluktuációs diagram..................... 62 5.4.2. A párhuzamos koordináta ábra.................... 63 5.4.3. Eszköztámogatás............................ 66 5.5. Interaktív statisztikai grafika.......................... 66 5.5.1. Lekérdezések.............................. 67 5.5.2. Helyi interakciók............................ 67 5.5.3. Kiválasztás és csatolt kijelölés..................... 67 5.5.4. Csatolt analízis............................. 69 5.6. Összefoglalás.................................. 69 6. Monte-Carlo-módszerek, Bayesi modellátlagolás, Bayesi predikció 70 6.1. Monte-Carlo-integrálás............................. 71 6.1.1. Közvetlen mintavételezés........................ 71 6.1.2. Elutasító mintavételezés........................ 72 6.1.3. Fontossági mintavételezés....................... 73 6.2. Markov-láncok.................................. 73 6.3. Metropolis Hastings-algoritmus........................ 76 6.4. A Metropolis Hastings-algoritmus alesetei.................. 78 6.4.1. Gibbs-mintavételezés.......................... 78 6.4.2. Többláncos MCMC........................... 79 6.4.3. Reversible jump MCMC........................ 80 6.5. Konvergencia.................................. 80 6.5.1. Konvergencia tényének vizsgálata................... 81 6.5.2. Mintavételezés hatékonysága...................... 82 6.6. Alkalmazás Bayes-hálókban.......................... 83 7. Bootstrap-módszerek 86 7.1. Ensemble-módszerek áttekintése........................ 87 7.2. A bootstrap alapjai............................... 88

Tartalomjegyzék 0 7.3. További aspektusok............................... 89 7.3.1. Adatmodell............................... 89 7.4. Konfidencia becslések.............................. 90 7.5. Permutációs teszt és hipotézistesztelés.................... 91 8. Kernel technikák az intelligens adatelemzésben 93 8.1. Bevezetés.................................... 93 8.2. Kernelek konstrukciója............................. 94 8.2.1. Leggyakrabban használt kernel függvények.............. 94 8.2.2. Műveletek kernelekkel......................... 94 8.3. Prior információ hozzáadása.......................... 95 8.3.1. Tanító halmaz bővítése......................... 95 8.3.2. Prior információ kernelbe ágyazása.................. 97 8.4. Kernelek gráfokra................................ 99 8.4.1. Diffúziós kernelek............................ 100 8.5. Adatbázisok................................... 100 Jelölések 102 9. Valószínűségi Bayes-hálók tanulása 105 9.1. Paramétertanulás Rejtett Markov Modellekben................ 105 9.1.1. Paramétertanulás RMM-ekben ismert állapotszekvenciák esetében. 106 9.1.2. E-M alapú paramétertanulás RMM-ekben ismeretlen állapotszekvenciák esetében............................ 107 9.2. Naiv Bayes-hálók tanulása........................... 109 9.2.1. A bayesi feltételes modellezés..................... 109 9.2.2. Bayes-hálók tanulása feltételes modellként.............. 111 9.2.3. Naiv Bayes-hálók teljesítménye osztályozásban és regresszióban... 112 9.2.4. Naiv Bayes-hálók kiterjesztései.................... 113 9.2.5. Teljes modellátlagolás NBN-ek felett................. 114 9.3. Egy információelméleti pontszám Bayes-háló tanulásához.......... 115 10.Oksági Bayes-hálók tanulása 117 10.1. Bayesi következtés és tanulás rögzített oksági struktúra esetén....... 117 10.2. A prekvenciális modellkiértékelés....................... 120 10.2.1. Általános és valószínűségi előrejelző rendszerek vizsgálata...... 121 10.2.2. Bayes-hálók prekvenciális vizsgálata................. 122 10.3. Oksági struktúrák tanulása.......................... 123 10.3.1. Kényszer alapú struktúratanulás.................... 123 10.3.2. Pontszámok oksági struktúrák tanulására............... 124 10.3.3. Az optimalizálás nehézsége struktúratanulásban........... 126