Gépi tanulás és Mintafelismerés

Hasonló dokumentumok
Gépi tanulás a gyakorlatban. Lineáris regresszió

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Matematikai geodéziai számítások 5.

Mérési struktúrák

Érdekes informatika feladatok

Matematikai geodéziai számítások 5.

NGB_IN040_1 SZIMULÁCIÓS TECHNIKÁK dr. Pozna Claudio Radu, Horváth Ernő

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Matematikai geodéziai számítások 9.

17. előadás: Vektorok a térben

Matematikai geodéziai számítások 9.

Intelligens képtömörítés 2.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Bevezetés az elméleti zikába

Valószín ségszámítás és statisztika

Statisztikai módszerek a skálafüggetlen hálózatok

Számelméleti alapfogalmak

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Függvények növekedési korlátainak jellemzése

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

URN használata hálózati dokumentumok azonosításában Országos Széchényi Könyvtár Könyvtár-informatikai M hely Budapest, június 12.

9. Laboratóriumi gyakorlat NYOMÁSÉRZÉKELŐK

Számítógép és programozás 2

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

BIOMATEMATIKA ELŐADÁS

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján

Kvantitatív módszerek

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

GYERMEKEK FIZIKAI FEJLŐDÉSE. Százalékos adatok és görbék. Fiúk Lányok Fiúk Lányok ,8 10,5 12,6 8,1 9,7 11,6

Digitális hangszintmérő

Diszkrét matematika I.

Végeselem analízis. 1. el adás

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Kétszemélyes játékok

MÉRÉSTECHNIKA. BME Energetikai Gépek és Rendszerek Tanszék Fazekas Miklós (1) márc. 1

Branch-and-Bound. 1. Az egészértéketű programozás. a korlátozás és szétválasztás módszere Bevezető Definíció. 11.

Matematikai geodéziai számítások 6.

TERMÉSZETISMERET Tantárgyi célok, feladatok:

MATEMATIKA. Tildy Zoltán Általános Iskola és Alapfokú Művészeti Iskola Helyi tanterv 1-4. évfolyam 2013.

Matematikai geodéziai számítások 6.

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

19. AZ ÖSSZEHASONLÍTÁSOS RENDEZÉSEK MŰVELETIGÉNYÉNEK ALSÓ KORLÁTJAI

Számítási intelligencia

Problémamegoldás kereséssel. Mesterséges intelligencia március 7.

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Irányításelmélet és technika II.

Matematikai geodéziai számítások 8.

óra C

Lineáris algebra gyakorlat

XII. LABOR - Fuzzy logika

METEOROLÓGIAI MÉRÉSEK és MEGFIGYELÉSEK

SZERKEZETFÖLDTANI OKTATÓPROGRAM, VETŐMENTI ELMOZDULÁSOK MODELLEZÉSÉRE. Kaczur Sándor Fintor Krisztián

MIKROÖKONÓMIA II. B. Készítette: K hegyi Gergely. Szakmai felel s: K hegyi Gergely február

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás


Bevezetés a vonalkódok elméletébe. Melis Zoltán BCS Hungary (C)

Matematikai geodéziai számítások 8.

Biomatematika 2 Orvosi biometria

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

46/2010. (IV. 27.) FVM rendelet. az állami alapadatok felhasználásával végzett sajátos célú földmérési és térképészeti tevékenységről

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Diszkrét matematika I. gyakorlat

Algoritmusok Tervezése. Fuzzy rendszerek Dr. Bécsi Tamás

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.

Függvények 1. oldal Készítette: Ernyei Kitti. Függvények

Matematika évfolyam. tantárgy 2013.

Diszkrét matematika 2.C szakirány

Gépi tanulás a gyakorlatban. Bevezetés

MATEMATIKA I. RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNY A) KOMPETENCIÁK

Pénzügyi matematika. Vizsgadolgozat I. RÉSZ. 1. Deniálja pontosan, mit értünk amerikai vételi opció alatt!

MÁSODIK IDEGEN NYELV - ANGOL

Szöveges feladatok és Egyenletek

Geometriai és hullámoptika. Utolsó módosítás: május 10..

STATISZTIKAI PROBLÉMÁK A

Ipari kemencék PID irányítása

Folyadékszcintillációs spektroszkópia jegyz könyv

Döntéselőkészítés. I. előadás. Döntéselőkészítés. Előadó: Dr. Égertné dr. Molnár Éva. Informatika Tanszék A 602 szoba

Vérnyomásmérés, elektrokardiográfia. A testhelyzet, a légzés, a munkavégzés hatása a keringési rendszerre. A mérési adatok elemzése és értékelése

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

Széladatok homogenizálása és korrekciója

Matematika III előadás

Matematika (mesterképzés)

"Flat" rendszerek. definíciók, példák, alkalmazások

4. Laplace transzformáció és alkalmazása

1. A k-szerver probléma

I. LABOR -Mesterséges neuron

Tárgy. Forgóasztal. Lézer. Kamera 3D REKONSTRUKCIÓ LÉZERES LETAPOGATÁSSAL

Julia halmazok, Mandelbrot halmaz

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Ipari mintavételes PID szabályozóstruktúra megvalósítása

Átírás:

Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20

2

1. fejezet Bevezet A mesterséges intelligencia azon módszereit, melyeket numerikus vagy enyhén strukturált 1 adatokra tudunk alkalmazni, gépi tanulásos módszereknek nevezzük. A gépi tanulás e meghatározás alapján egy szerteágazó tudományág, melynek a keretén belül sok módszerr l és ennek megfelel en sok alkalmazási területr l beszélhetünk. A módszerek közös jellemz je, hogy olyan algoritmusokat fejlesztenek ki, melyek egy bejöv nagy 2 adathalmazból a hasznos információkat tudják kinyerni. A fenti megfogalmazás kell en általános. Az adat jelenthet: mérési eredményeket egy rendszer ki- és bemenetér l. Ez a klasszikusnak is mondható regressziós feladat, ahol a cél egy berendezés melyr l mérési adatokat rögzítünk m ködési paramétereinek a becslése. égitestek jellemz it, ahol a cél egy automata osztályozó felépítése. mikrofonok által rögzített akusztikus jeleket. Ebben az esetben az információ az adatokban lev szöveg beszélt szöveg esetén vagy a hangmagasságok és ritmus zene feldolgozásánál. (referencia) egy DNS-spirálban az aminosavak egymásutánját. Ez a típusú adathalmaz a modern biológiában és a gyógyszerészettudományokban, az orvosi illetve bioinformatikában nagyon gyakori. A feldolgozás célja olyan aminosav-szekvenciák keresése, melyek géneket alkotnak, illetve azon vegyi anyagok meghatározása, melyek egy adott génszekvencia m ködését befolyásolják (segítik vagy gátolják). referencia. m holdas meggyeléseket. A tengerek felszínér l visszaver d napfény mérése információkat szolgáltat a felszínen keletkez mikro-hullámokról, ezek a hullámok pedig segítenek a szél becslésénél. Ez inverziós feladat ahol ismerjük a jelenségek zikai modelljét. Ki tudjuk számítani tehát a szél ismeretében a m hold által mért értékeket, azonban a fordított irányú következtetés sokkal nehezebb. referencia. 1 Enyhén strukturált (nagyon felületesen): az adatok komponensei (dimenziók) közötti kapcsolat nem túl bonyolult 2 Nagy adathalmaz pl. az internet azaz az interneten megtalálható összes dokumentum. Ebben a halmazban történ böngészés illetve az azt megel z lépések jó példák a gépi tanulás alkalmazásaira. 3

4 1. FEJEZET. BEVEZETŽ cm 190 180 170 160 4 14 3 69 5 12 18 13 10 17 16 2 7 15 11 150 140 8 1 50 60 70 80 90 100 110 kg 1.1. ábra. A testsúly és a magasság kapcsolata 18 bejegyzés alapján. Az X tengelyen a meggyelt súlyok, az Y tengelyen a magasság; a szaggatott vonal a súly-magasság kapcsolat becslése. Az adatok sokféleségéhez hasonlóan a módszer azaz az algoritmus is sokféle lehet. Jelenthet: osztályozó rendszert, ahol minden bemen adathoz címkét rendelünk, azaz besoroljuk egy kategóriába. Klasszikus példa a postai rendszerek által használt felismer, ahol a kézzel írott számjegyeknek kell meghatározzuk a tartalmát. referencia approximátort, mely bemeneti értékekhez tartozó folytonos értékeket rendel. Ekképp meg tudjuk becsülni korábbi betegek adatainak feldolgozása alapján például azt, hogy egy páciens milyen eséllyel fog egy nehéz szívm tétet túlélni. referencia prediktort, mely múltbeli meggyelések alapján képes egy becslést adni a meggyelt folyamat jöv beli alakulásáról. referencia 1. Példa. Testsúly és magasság kapcsolatát szeretnénk vizsgálni orvosi adatok alapján. Tegyük fel, hogy rendelkezésünkre áll 18 meggyelés, ahogyan azt a 1.1 ábrán látható. A cél, hogy a magasság és súly között egy lineáris kapcsolatot deniáljunk, azaz meghatározzuk az ^m i = α + βs i egyenlet optimális (α, β) paramétereit: mindegyik meggyelt adatra az m i magasság közel van az egyenlet alapján számított értékhez. A fenti feladatok amint láttuk feltételezik, hogy adatokat gy jtsünk és feltételezzünk egy modellt ami az adatokat generálta. Ezen fogalmakat tisztázzuk a következ kben. Jelen jegyzet nem önálló kutatás, a terjedelmes irodalomnak egy rövid összefoglalója, a teljesség igénye nélkül. 1.1. Deníciók, meghatározások Tegyük fel, hogy az adatokat tároltuk a D = {z 1,..., z N } halmazba. Az z i adatok lehetnek bármilyen típusúak. A korábbi példák esetéhez hasonlóan minden adatot tovább bontunk egy bemeneti és egy kimeneti értékre: z i = (x i, t i )

1.1. DEFINÍCIÓK, MEGHATÁROZÁSOK 5 ahol az x i R d a rendszer bemenete, a t i R a rendszer kimenete, d pedig a bemeneti adatok dimenziója. Feltételeztük tehát, hogy a bemeneti és a kimeneti adatok típusa valós. Továbbá feltételezzük, hogy létezik egy függvény, mely a kimen adatokat generálja, legyen ez a függvény f : R d R. A feltételezés fontos, merthogy a A következ kben feltételezzük, hogy