Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Hasonló dokumentumok
Csoport-struktúrált generátorrendszerek online tanulása

Mátrixhatvány-vektor szorzatok hatékony számítása

Nem-paraméteres predikció, Lasso közelítés

Principal Component Analysis


Compressed Sensing. Sipos Roland Adatbányászat szeminárium Május 22.

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

Intelligens adatelemzés

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

Sajátértékek és sajátvektorok. mf1n1a06- mf1n2a06 Csabai István

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

Szepesvári Csaba ápr. 11

Numerikus módszerek 1.

A többváltozós lineáris regresszió III. Főkomponens-analízis

Gépi tanulás a gyakorlatban. Bevezetés

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

1. Bázistranszformáció

Szemidenit optimalizálás és az S-lemma

Lineáris regressziós modellek 1

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Adatbányászati szemelvények MapReduce környezetben

Modellek és Algoritmusok - 2.ZH Elmélet

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Gépi tanulás és Mintafelismerés

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Lineáris algebra numerikus módszerei

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

9. Előadás. (9. előadás) Lineáris egyr.(3.), Sajátérték április / 35

Nem teljesen kitöltött páros összehasonlítás mátrixok sajátérték optimalizálása Newton-módszerrel p. 1/29. Ábele-Nagy Kristóf BCE, ELTE

Mátrixok 2017 Mátrixok

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak

Nagy-György Judit. Szegedi Tudományegyetem, Bolyai Intézet

Rendszámfelismerő rendszerek

Gépi tanulás a gyakorlatban. Lineáris regresszió

Vektorok, mátrixok, lineáris egyenletrendszerek

Lineáris leképezések (előadásvázlat, szeptember 28.) Maróti Miklós, Kátai-Urbán Kamilla

Numerikus módszerek II. zárthelyi dolgozat, megoldások, 2014/15. I. félév, A. csoport. x 2. c = 3 5, s = 4

Felügyelt önálló tanulás - Analízis III.

Optimális mérési elrendezés hidraulikus hálózatokon

Numerikus módszerek 1.

Kvalitatív elemzésen alapuló reakciómechanizmus meghatározás

3. Fuzzy aritmetika. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Az impulzusnyomatékok általános elmélete

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Lagrange egyenletek. Úgy a virtuális munka mint a D Alembert-elv gyakorlati alkalmazását

= e i1 e ik e j 1. tenzorok. A k = l = 0 speciális esetben e az R egységeleme. A. e q 1...q s. = e j 1...j l q 1...q s

Egy hirtelen ötlet december 30. felmerült egy kérdés: Vajon mi jellemző a magyar fiatalok közösségi média használatára?

1. Példa. A gamma függvény és a Fubini-tétel.

Gyakorló feladatok I.

Hidden Markov Model. March 12, 2013

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

A térképen ábrázolt vonal: - sík felület egyenese? - sík felület görbéje? - görbült felület egyenese ( geodetikus )? - görbült felület görbéje?

A térképen ábrázolt vonal: - sík felület egyenese? - sík felület görbéje? - görbült felület egyenese ( geodetikus )? - görbült felület görbéje?

Lineáris algebra gyakorlat

5. előadás - Regressziószámítás

BKIK VIII. Országos Tanácsadói Konferencia

Lineáris algebra és a rang fogalma (el adásvázlat, szeptember 29.) Maróti Miklós

3D számítógépes geometria és alakzatrekonstrukció

Kamerakalibráció és pozícióbecslés érzékenységi analízissel, sík mintázatokból. Dabóczi Tamás (BME MIT), Fazekas Zoltán (MTA SZTAKI)

Saj at ert ek-probl em ak febru ar 26.

Legkisebb négyzetek módszere, Spline interpoláció

Saj at ert ek-probl em ak febru ar 22.

Többváltozós lineáris regresszió 3.

A Borda-szavazás Nash-implementálható értelmezési tartományai

Szalai Péter. April 17, Szalai Péter April 17, / 36

Optimalizálási eljárások GYAKORLAT, MSc hallgatók számára. Analízis R d -ben

Modellkiválasztás és struktúrák tanulása

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

11. Előadás. 1. Lineáris egyenlőség feltételek melletti minimalizálás

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

Idősorok elemzése. Salánki Ágnes

Lagrange és Hamilton mechanika

Bevezetés az algebrába 2 Vektor- és mátrixnorma

LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei

1.1. Vektorok és operátorok mátrix formában

Gráfelmélet/Diszkrét Matematika MSc hallgatók számára. 13. Előadás

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Fuzzy halmazok jellemzői

Összefonódottság detektálása tanúoperátorokkal

A TANTÁRGY ADATLAPJA

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

ACM Snake. Orvosi képdiagnosztika 11. előadás első fele

A Fermat-Torricelli pont

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Alkalmazott algebra - SVD

Lőre Vendel- Csigó Györbiró Alpár Üzleti szimulációk az oktatásban

Hallgatói tájékoztató

Számítógép és programozás 2

10. Előadás. Megyesi László: Lineáris algebra, oldal. 10. előadás Sajátérték, Kvadaratikus alak

Matematika I. Vektorok, egyenesek, síkok

Lineáris egyenletrendszerek

Bevezetés az állapottér-elméletbe Dinamikus rendszerek állapottér reprezentációi

Vektortér fogalma vektortér lineáris tér x, y x, y x, y, z x, y x + y) y; 7.)

12. előadás. Egyenletrendszerek, mátrixok. Dr. Szörényi Miklós, Dr. Kallós Gábor

Átírás:

Strukturált Generátorrendszerek Online Tanulása és Alkalmazásai Problémamegoldó Szeminárium 2010. nov. 5

Tartalomjegyzék Motiváció, példák Regressziós feladatok (generátorrendszer fix) Legkisebb négyzetes becslés Lasso feladat (ritkaság) Group lasso feladat (csoportok) Általános csoportok és nem-konvex regularizáció Generátorrendszerek tanulása: Főkomponens analízis (PCA) Nem-negatív mátrix faktorizáció (NMF) Batch vs online tanulás Hiányos megfigyeltség

Példák: fényképezőgép Látható színek: RGB értékekből tevődik össze, de szenzor minden pontban csak az R/G/B értékek egyikét méri Kérdések: képpontban a hiányos mérések kitöltése. mik a kitöltéshez jó képi jellemzők? ezek kialakíthatók (tanítóhalmaz)?

Példák: dokumentumok Adottak: szövegek (pl egy adott konferencián megjelent cikkek / Wiki dokumentumok) Kérdések: Mennyire jól tömöríthető ez az adatbázis? Mik a dokumentumhalmaz tömörítéséhez jó témák? Meg tudjuk ezeket a teljes Wiki memóriába való betöltése nélkül becsülni? Ha hiányoznak szavak, ki tudnánk tölteni a dokumentumokat?

Regressziós feladatok: legkisebb négyzetes becslés Adott: x R dx, D R dx dα. Feladat: f(α) = x Dα 2 2 min α R dα. (1) Megoldás (Moore-Penroose inverzből): ˆα = D + x. (2) Ez optimális, abban az értelemben, hogy a x Dα 2 2 -t minimalizálók közül minimális 2-es normájú. Gond : túl sok/akár D oszlopot használhat. Pl: x dokumentum, D(ictionary) oszlopai témák. ritkaság.

Regressziós feladatok: ritkaság Lasso és csoportok A ritkasági kényszer megragadható regularizációval: Lasso feladat [ 1 ritkaság indukáló norma]: f(α) = x Dα 2 2 + λ α 1 min α R dα. (3) Group-lasso: csoportok dokumentumokra gondolva a témák közt lehet összefüggés. f(α) = x Dα 2 2 + K i=1 λ i αgi 2 min α R dα, (4) ahol {G i } K i=1 a {1,...,d α} halmaz egy partíciója.

Regressziós feladatok: átfedő csoportok, nem-konvex regularizáció Group lasso kiterjesztések, átfedő csoportok: f(α) = x Dα 2 2 + K f(α) = x Dα 2 2 i=1 λ i αgi 2 min α R dα, avagy (5) + Ω(α) min α R dα, (6) ahol G = {G i } K i=1 nem feltétlenül partíció és Ω(α) = ( ) λ αgi 2 K i (0 < η < 1). (7) i=1 η Sikeres egyéb alkalmazás példák: génmintázatok elemzése, arckifejezés felismerés, képekhez kulcsszavak rendelése (annotálása; keresőmotorok)

Generátorrendszerek tanulása PCA Adott: x t R dx, t = 1,...,T mintapontok. Feladat (főkomponens analízis): keressük azt a d α -dimenziós alteret (D R dx dα ), [ f(d) = E x proj D (x) 2] (8) minimális. Megoldás: cov(x) d α db domináns sajátvektora =: D.

Főkomponens analízis: példa (A) (B) (C) (D) (E) (F) (A): eredeti kép, (B)-(F):1, 2, 5, 10, 20%-ra tömörítés.

Generátorrendszerek tanulása NMF (nem-negativitási kényszer) Adott: x t 0 R dx, t = 1,..., T mintapontok (X). Feladat (nem-negatív mátrix faktorizáció): keressük azt a D R dx dα + mátrixot és hozzá tartozó A = [α 1,...,α T ] 0 reprezentációt, amire minimális. f(d, A) = X DA 2 F (9)

NMF-demo Adatbázis: arcképek (19 19; x t ) Generátorrendszer (D):

Generátorrendszerek tanulása NMF ++ Mixture-of-topic modell (x t szógyakoriságok): D-re (=témákra) kényszer: d i 0 oszlopok és l 1 -gömbbeliek ( j d ij 1), α-ra megkötés: α 0, G: hierarchikus felépítés, G i az i-edik nódus a gyerekeivel.

Generátorrendszerek tanulása batch vs online, hiányos megfigyelések Batch vs online D becslés: Batch: Becslés módja: X = {x 1,..., x T } D. Hátrány: x t nagydimenziós lehet (pl Wiki-nél) nem fér be a memóriába. Online: t = 0: D 0. t = 1: D 0,x 1 D 1. t = 2: D 1,x 2 D 2.... Hiányos megfigyelések: minden egyes x t -ből csak bizonyos koordináták mérhetők.

Generátorrendszerek tanulása: általános feladat Felmerült természetes kényszerek: csoport ritkaság és nem-konvex regularizáció ({G i } K i=1,ω), D és α-ra: kényszerek lehetősége (pl korlátosság, nem-negativitás) online tanítás, hiányos megfigyelések.

Példa Szereposztás: xt mintapontok: természetes képek képrészletei α tóruszon realizálva: a {Gi }Ki=1 szomszédságok környezetek, η = 0.5 (Ω)

Példa folyt. Kialakuló generátorrendszer (D): ritka reprezentáció (G i = {i}) vs másodszomszédokkal

Igény Olyan emberek jelentkezését várom ( 2 fő), akik megfelelő harci kedvet éreznek a témában a legfrissebb irodalmi eredmények elsajátításához és Matlab-os numerikus kísérletekhez a megközelítés 1-1 alkalmazásban való kipróbálására.

Köszönöm a figyelmet! Kontakt: E-mail: szzoli@cs.elte.hu URL: http://nipg.inf.elte.hu/szzoli