Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Hasonló dokumentumok
Gépi tanulás a gyakorlatban. Bevezetés

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

Képfeldolgozás Szegmentálás Osztályozás Képfelismerés Térbeli rekonstrukció

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Intelligens adatelemzés

Modellkiválasztás és struktúrák tanulása

Visszacsatolt (mély) neurális hálózatok

1. gyakorlat. Mesterséges Intelligencia 2.

Objektumorientált paradigma és a programfejlesztés

Mesterséges neurális hálózatok II. - A felügyelt tanítás paraméterei, gyorsító megoldásai - Versengéses tanulás

Grafikonok automatikus elemzése

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Az alállomási kezelést támogató szakértői funkciók

Minták automatikus osztályba sorolása a mintát leíró jellemzők alapján. Típusok: felügyelt és felügyelet nélküli tanuló eljárások

Mély neuronhálók alkalmazása és optimalizálása

Példák jellemzőkre: - minden pixelérték egy jellemző pl. neurális hálózat esetében csak kis képekre, nem invariáns sem a megvilágításra, sem a geom.

ANTAL Margit. Sapientia - Erdélyi Magyar Tudományegyetem. Jelfeldolgozás. ANTAL Margit. Adminisztratív. Bevezetés. Matematikai alapismeretek.

Gépi tanulás és Mintafelismerés

Távérzékelés a precíziós gazdálkodás szolgálatában : látvány vagy tudomány. Verőné Dr. Wojtaszek Malgorzata

Hadházi Dániel.

A távérzékelt felvételek tematikus kiértékelésének lépései

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék

Kvalitatív elemzésen alapuló reakciómechanizmus meghatározás

Kódverifikáció gépi tanulással

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

IBM SPSS Modeler 18.2 Újdonságok

Gyors sikerek adatbányászati módszerekkel

MULTIPARAMETRIKUS MR VIZSGÁLATOK SZEGMENTÁLÁSA NYAKI RÉGIÓBAN

Városi környezet vizsgálata távérzékelési adatok osztályozásával

Gépi tanulás a gyakorlatban SVM

Az Országos kompetenciamérés (OKM) tartalmi kerete. a 20/2012. (VIII. 31.) EMMI rendelet 3. melléklete alapján

Mesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.

Lineáris regressziós modellek 1

Jogosultság-monitorozó rendszer kialakítása

Miről lesz szó? Videó tartalom elemzés (VCA) leegyszerűsített működése Kültéri védelem Közúthálózat megfigyelés Emberszámlálás

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Képfeldolgozás. 1. el adás. A képfeldolgozás alapfogalmai. Mechatronikai mérnök szak BME, 2008

8. Pontmegfeleltetések

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Panorámakép készítése

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Az informatika kulcsfogalmai

Geoinformatikai rendszerek

Multimédiás adatbázisok

Méréselmélet MI BSc 1

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Köszönetnyilványítás. Digitális képelemzés alapvető algoritmusai. A kurzus témái. Képelemzés és képszűrés alapfogalmai. Csetverikov Dmitrij

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével. MAJF21 Eisenberger András május 22. Konzulens: Dr.

Struktúra nélküli adatszerkezetek

Wavelet transzformáció

IV.7 MÓDSZER KIDOLGOZÁSA FELHASZNÁLÓI ADATOK VÉDELMÉRE MOBIL ALKALMAZÁSOK ESETÉN

S atisztika 1. előadás

KONVOLÚCIÓS NEURONHÁLÓK. A tananyag az EFOP pályázat támogatásával készült.

Gépi tanulás a gyakorlatban. Lineáris regresszió

Fuzzy rendszerek és neurális hálózatok alkalmazása a diagnosztikában

Felügyelt önálló tanulás - Analízis III.

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

A digitális korszak kihívásai és módszerei az egyetemi oktatásban

FELÜGYELT ÉS MEGERŐSÍTÉSES TANULÓ RENDSZEREK FEJLESZTÉSE

Big Data az adattárházban

Csima Judit április 9.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Tudomány és művészetek tehetséggondozó műhely záró foglalkozás és kiállítás

Objektumorientált paradigma és programfejlesztés Bevezető

Korszerű elektronikus fuvarbörze felépítése, folyamata

Informatika. Magyar-angol két tanítási nyelvű osztály tanterve. 9. évfolyam

11. modul: LINEÁRIS FÜGGVÉNYEK

Robotika. Kinematika. Magyar Attila

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Döntéstámogatás terepi gyakorlatokon

MA1143v A. csoport Név: december 4. Gyak.vez:. Gyak. kódja: Neptun kód:.

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Emerald: Integrált jogi modellező keretrendszer

Mérés és modellezés Méréstechnika VM, GM, MM 1

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

EEE Kutatólaboratórium MTA-SZTAKI Magyar Tudományos Akadémia

Mesterséges intelligencia alkalmazása az elosztóhálózati üzemzavarok felismerésében és az üzemhelyreállításban. MEE Vándorgyűlés 2018

PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK

IIR Internal Audit 2011 Hogyan segítheti az IT háttér a hatékony kockázatkezelést?

ROBOT IRÁNYÍTÁS INFRAVÖRÖS LED TÖMBBEL

Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

Képrekonstrukció 3. előadás

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Számítógépes döntéstámogatás. Bevezetés és tematika

Bevezetés az SPSS program használatába

A szoftverfejlesztés eszközei

TANMENET 2015/16. Készítette: KOVÁCS ILONA, Felhasználja: Juhász Orsolya

Neurális hálózatok bemutató

Összeállította Horváth László egyetemi tanár

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Témaválasztás, kutatási kérdések, kutatásmódszertan

Billentyűzési ritmus alapú azonosítás és hitelesítés érintőképernyős mobileszközökön

DIGITÁLIS KÉPFELDOLGOZÁS. Előadó: Póth Miklós

Átírás:

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Varga Domonkos (I.évf. PhD hallgató) 2014 május

A prezentáció felépítése 1) Alapfogalmak 2) A gépi tanulás, mintafelismerés alkalmazási területei 3) A gépi tanulás és a mintafelismerés módszertana 4) Egyszerű példa: kézzel írott számok felismerése 5) Bonyolultabb példa: kézjelabc felismerése videofolyamban 6) A gépi tanulásnál és mintafelismerésnél alkalmazott statisztikai eljárások

1) Alapfogalmak mit értünk gépi tanuláson, mintafelismerésen? (elnézést azoktól akiknek ez nyilvánvaló, de több szakmának szól az előadás)

Alapvető fogalmak hozzávetőleges definíciója Gépi tanulás: a mesterséges intelligenciának az az ága mely olyan algoritmusok tervezésére, fejlesztésére és tanulmányozására koncentrál, melyek tanulni tudnak az adatokból. A minta ellentéte a káosznak, olyan gyengén definiált entitások, melyekhez nevet lehet rendelni. A minta egy absztrakt objektum, mérések egy olyan halmaza, mely egy fizikai objetumot ír le.

A mintafelismerésben és a gépi tanulásban nem az a nehézség, hogy kiválasszuk azokat a módszereket, ahol a statisztikát alkalmazzuk, hanem az ellentéte; azoknak az eljárásoknak a megmutatása, ahol nem alkalmazzuk a statisztikai módszereket. Jelen prezentációban nem választom szét a gépi tanulás és a mintafelismerés fogalmát

2) A gépi tanulás, mintafelismerés alkalmazási területei

A mintafelismerés jellegzetes alkalmazásai Alkalmazási terület Jellegzetesség bioinformatika DNA, genetikai minták adatbányászat értelmes minták keresése dokumentumok osztályozása internet keresés, szemantikus kategóriák(pl. sport, politika...) ipari automatizálás nyomtatott áramkörök, selejtes darabok kiszűrése stb. biometrikus felismerés arc, ujjlenyomat, jogosultság beszéd felismerés hanghullámok analizálása távérzékelés multispektrumos képfeldolgozás, mezőgazdaság, űrkutatás multimédia adatbázis keresés akciók, mozdulatok, tevékenységek orvosi diagnosztika Röntgen felvételek átvizsgálása (pl.: rákos elváltozások felderítése...)

Beszédfelismerés? hanghullámok analizálása

Biológia/Genetika/Orvostudomány betegségek, Röntgenfelvételek géntérképezés génmanipuláció öröklődéstan

Bionikus azonosítás írisz ujjlenyomat arc jellegzetességei...

3) A gépi tanulás és a mintafelismerés módszertana

A gépi tanulás felosztása

Nem felügyelt tanulás (egyszerűsített) vázlata Feladat: rejtett struktúra megkeresése nem cimkézett adatok között (nincs előre adott hiba vagy jutalom egy-egy potenciális megoldáshoz) Pédául: minták keresése sokdimenziós genetikai adatokban, dimenzióredukálás vagy képek szegmentálása orvosi diagnosztikához

Felügyelt tanulás (egyszerűsített) lépései ismert adat 1) modell modell felállítása, betanítása ismert válasz(osztály) (teszt) adat 2) modell modell tesztelése (teszt) válasz(osztály) modell 3) megjósolt válasz(osztály) új adadatok modell használata

A statisztikai mintafelismerés módszere (tanulás, tesztelés, alkalmazás) új minta előfeldolgozás jellegzetesség mérése osztályozás jellegzetesség kinyerés/ kiválasztás tanulás alkalmazás tanulás/ tesztelés előfeldolgozás betanulási/teszt minta válasz(osztály) ismert

A statisztikai mintafelismerés modellje x Feladat: kézjel felismerése y Modell: m d << F n F=m x n

4) Egyszerű példa a példa célja az elméleti módszertanban ismertetett fogalmak gyakorlati bemutatása Feladat: kézzel írt számok felismerése Jel: az ideális szám Zaj: kézzel írva, pixeles kép

Szám jellemző vektorának kiválasztása a) Hu nyomatékos jellemzés, 9 dimenzió (hasonló a tehetetlenségi nyomatékokhoz) b) Kontúr mint komplex számok Fourier transzformált kb. 60 dimenzió feature vector... vagy egyszerű kétdimenziós vektor lényeg; mire hasonlít? =

Szám jellemző vektorának generálása 0 0 1 2 3 szükséges jelek 5 6 7 8 9 0 0 0 0

Döntési fa felépítése (statisztikai!) n i n i 3 i 5 n i n... i 2 n 7 i... n...

5) Bonyolultabb példa: kézjelabc felismerése videofolyamban a példa célja az elméleti módszertanban ismertetett fogalmak mélyebb bemutatása kézjelabc

A programfejlesztés környezete képkockák kiemelése/feldolgozása/visszahelyezése Fejlesztés: (Rapid Application Development) Matlab Matlab Pattern Recognition Open Tools Matlab Data Analysis R statisztikai software túlnyomóan statisztika software Alkalmazás: (moduláris, robusztus, gyors) C++ OpenComputerVision CUDA(NVidia), OpenCL R statisztikai software OpenPatterRecognition Open Multiple View Geometry Open Neural Network etc. mind a fejlesztésnél, mind az alkalmazásnál csak nyílt forráskódú rendszerek

A betanítás/alkalmazás lépései Betanítás folyamata: több emberrel a kézjelek bevitele Fourier leírók generálása osztályok hozzárendelése Az alkalmazás folyamata: videofolyam figyelése bőrdetektálás, időbeli szegmentálás képkeret kivétele a videofolyamból térbeli szegmentálás kontúr kinyerése kontúr ábrázolása komplex koordináta rendszerben Fourier leírók kinyerése osztályozás SVM módszerrel (fejlesztés során; a leírók olyan jók, hogy egyszerűbb osztályozással is működik a rendszer) most nem tárgyaljuk

Fourier leírók alkalmazása képi kontúrkinyerés Fourier transzformáció inverz Fourier transzformáció koordinátarendszer alakzat reprezentációja P~60 dimenzióban

A magasabb dimenziók átka naív megközelítés; hamar korlátokba ütközünk magasabb dimenziós gömb tulajdonsága térfogatarány D=dimenziószám epsilon

A Support Vector Machine elve SVM; magasabb dimenzóba transzformálás margin fogalma input tér jellemző (feature) tér

SVM transzformálás, gyakori kerneltípusok transzformálás lineárisan szétválaszthatóvá gyakori kerneltípusok

6) A gépi tanulásnál és mintafelismerésnél alkalmazott statisztikai eljárások három alapvető területen: jellegzetes vektorok kinyerése nem felügyelt tanítás felügyelt tanítás

A jellemző vektor kinyerésének módszerei

Nem felügyelt tanítási módszerek(clustering):

Felügyelt tanulási módszerek (osztályozás):

Gépi tanulás tárgyalása statisztika nélkül nem lehetséges gépi tanulás/ mintafelismerés regresszió felügyelt tanulás/ osztályozás nem felügyelt tanulás/ clustering

Hasta la vista... Köszönöm a figyelmet.