Csoport-struktúrált generátorrendszerek online tanulása

Hasonló dokumentumok
Strukturált Generátorrendszerek Online Tanulása és Alk-ai

3. Fuzzy aritmetika. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

Nem-paraméteres predikció, Lasso közelítés

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

Szemidenit optimalizálás és az S-lemma

Lineáris regressziós modellek 1

Principal Component Analysis

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

A lineáris programozás alapjai

1.1. Vektorok és operátorok mátrix formában

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

Bevezetés az algebrába 2

Vektorok, mátrixok, lineáris egyenletrendszerek

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

Hidden Markov Model. March 12, 2013

Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához

Mátrixok 2017 Mátrixok

A szimplex algoritmus

Numerikus módszerek I. zárthelyi dolgozat (2017/18. I., A. csoport) Megoldások

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

Kvadratikus alakok és euklideszi terek (előadásvázlat, október 5.) Maróti Miklós, Kátai-Urbán Kamilla

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak

Analízis. 1. fejezet Normált-, Banach- és Hilbert-terek. 1. Definíció. (K n,, ) vektortér, ha X, Y, Z K n és a, b K esetén

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

Mátrixhatvány-vektor szorzatok hatékony számítása

1. feladatsor Komplex számok

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Geometriai vagy kinematikai természetű feltételek: kötések vagy. kényszerek. 1. Egy apró korong egy mozdulatlan lejtőn vagy egy gömb belső

Diszkrét Matematika. zöld könyv ): XIII. fejezet: 1583, 1587, 1588, 1590, Matematikai feladatgyűjtemény II. (

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

1. Példa. A gamma függvény és a Fubini-tétel.

Lineáris leképezések (előadásvázlat, szeptember 28.) Maróti Miklós, Kátai-Urbán Kamilla

= e i1 e ik e j 1. tenzorok. A k = l = 0 speciális esetben e az R egységeleme. A. e q 1...q s. = e j 1...j l q 1...q s

Adatbányászati szemelvények MapReduce környezetben

Diszkrét matematika gyakorlat 1. ZH október 10. α csoport

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

Robotika. Kinematika. Magyar Attila

A többváltozós lineáris regresszió III. Főkomponens-analízis

Diszkrét matematika II., 8. előadás. Vektorterek

Alkalmazott algebra - SVD

Optimalizálási eljárások GYAKORLAT, MSc hallgatók számára. Analízis R d -ben

January 16, ψ( r, t) ψ( r, t) = 1 (1) ( ψ ( r,

Numerikus módszerek 1.

Hajder Levente 2017/2018. II. félév

Nemkonvex kvadratikus egyenlőtlenségrendszerek pontos dualitással

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Gyakorló feladatok az II. konzultáció anyagához

1. Mit jelent az, hogy egy W R n részhalmaz altér?

Itô-formula. A sztochasztikus folyamatok egyik legfontosabb formulája. Medvegyev Péter Matematika tanszék

Saj at ert ek-probl em ak febru ar 26.

Molnár Bence. 1.Tétel: Intervallumon értelmezett folytonos függvény értékkészlete intervallum. 0,ami ellentmondás uis. f (x n ) f (y n ) ε > 0

Lineáris algebra 2. Filip Ferdinánd december 7. siva.banki.hu/jegyzetek

Lineáris algebra numerikus módszerei

VEKTORTEREK I. VEKTORTÉR, ALTÉR, GENERÁTORRENDSZER október 15. Irodalom. További ajánlott feladatok

9. gyakorlat Lineáris egyenletrendszerek megoldási módszerei folyt. Néhány kiegészítés a Gauss- és a Gauss Jordan-eliminációhoz

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

1 A kvantummechanika posztulátumai

A szimplex tábla. p. 1

A MATEMATIKA NÉHÁNY KIHÍVÁSA

Lagrange és Hamilton mechanika

Sajátértékek és sajátvektorok. mf1n1a06- mf1n2a06 Csabai István

Vektorterek. Több esetben találkozhattunk olyan struktúrával, ahol az. szabadvektorok esetében, vagy a függvények körében, vagy a. vektortér fogalma.

Intelligens adatelemzés

Bevezetés az algebrába 2 Differencia- és differenciálegyenlet-rendszerek

LINEÁRIS ALGEBRA. matematika alapszak. Euklideszi terek. SZTE Bolyai Intézet, őszi félév. Euklideszi terek LINEÁRIS ALGEBRA 1 / 40

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

Modellek és Algoritmusok - 2.ZH Elmélet

Lineáris algebra és a rang fogalma (el adásvázlat, szeptember 29.) Maróti Miklós

1. Bázistranszformáció

A Borda-szavazás Nash-implementálható értelmezési tartományai

LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei

2. Reprezentáció-függvények, Erdős-Fuchs tétel

Felületi feszültség: cseppfolyós-gáz határfelületen a vonzerő kiegyensúlyozatlan: rugalmas hártyaként viselkedik.

Az állítást nem bizonyítjuk, de a létezést a Paley-féle konstrukció mutatja: legyen H a

Többváltozós lineáris regresszió 3.

Rekurzív sorozatok. SZTE Bolyai Intézet nemeth. Rekurzív sorozatok p.1/26

Matematika (mesterképzés)

Line aris f uggv enyilleszt es m arcius 19.

Szepesvári Csaba ápr. 11

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Gépi tanulás a gyakorlatban. Lineáris regresszió

10. Előadás. Megyesi László: Lineáris algebra, oldal. 10. előadás Sajátérték, Kvadaratikus alak

1 Lebegőpontos számábrázolás

Nem teljesen kitöltött páros összehasonlítás mátrixok sajátérték optimalizálása Newton-módszerrel p. 1/29. Ábele-Nagy Kristóf BCE, ELTE

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Kvantumszimmetriák. Böhm Gabriella. Szeged. Wigner Fizikai Kutatóközpont, Budapest november 16.

T obbv altoz os f uggv enyek integr alja. 3. r esz aprilis 19.

Gyakorló feladatok. Agbeko Kwami Nutefe és Nagy Noémi

Felügyelt önálló tanulás - Analízis III.

Nemlineáris modellek

Az ellipszoid algoritmus

Bevezetés az algebrába 2 Vektor- és mátrixnorma

9. Előadás. (9. előadás) Lineáris egyr.(3.), Sajátérték április / 35

Kronecker-modulusok kombinatorikája és alkalmazások

Átírás:

Csoport-struktúrált generátorrendszerek online tanulása ELTE, Informatikai Kar TÁMOP Kutatószeminárium 2011. jan. 28

Tartalomjegyzék Motiváció Regressziós feladatok (generátorrendszer fix) Legkisebb négyzetes becslés Lasso feladat (ritkaság) Group-Lasso feladat (csoportok) Általános csoportok és nem-konvex regularizáció Generátorrendszerek tanulása: Főkomponens analízis (PCA) Nem-negatív mátrix faktorizáció (NMF) Batch vs online tanulás Hiányos megfigyeltség

Motiváció Ajánlórendszerek, Netflix verseny: adottak bizonyos felhasználói értékelések filmekre (X), feladat: X nem-mért értékeinek kitöltése (ajánlás), motiváció: $1M (-2009 szept), fontos tanulság: mátrix faktorizációs megoldások X DA (1) előnyösnek mutatkoznak kitöltés szempontjából. Dokumentumok (pl Wiki) elemzése, Pénzügyi idősorok előrejelzése: mik a kitöltéshez jó jellemzők,...

Regressziós feladatok: legkisebb négyzetes becslés Adott: x R dx, D R dx dα. Feladat: f(α) = x Dα 2 2 min α R dα. (2) Megoldás (Moore-Penroose inverzből): ˆα = D + x. (3) Ez optimális, abban az értelemben, hogy a x Dα 2 2 -t minimalizálók közül minimális 2-es normájú. Gond : túl sok/akár D oszlopot használhat. Pl: x dokumentum, D(ictionary) oszlopai témák. ritkaság.

Regressziós feladatok: ritkaság Lasso és csoportok A ritkasági kényszer megragadható regularizációval: Lasso feladat [ 1 ritkaság indukáló norma]: f(α) = x Dα 2 2 + λ α 1 (λ > 0) min α R dα. (4) Group-Lasso: csoportok dokumentumokra gondolva a témák közt lehet összefüggés. K f(α) = x Dα 2 2 + λ αgi 2 i i=1 (λ i > 0, i) min α R dα, ahol {G i } K i=1 a {1,...,d α} halmaz egy partíciója. (5)

Regressziós feladatok: átfedő csoportok, nem-konvex regularizáció Group-Lasso kiterjesztések, átfedő csoportok: f(α) = x Dα 2 2 + K f(α) = x Dα 2 2 i=1 λ i αgi 2 min α R dα, avagy (6) + Ω(α) min α R dα, (7) ahol G = {G i } K i=1 nem feltétlenül partíció és Ω(α) = ( ) λ αgi 2 K i (0 < η < 1). (8) i=1 η Sikeres egyéb alkalmazás példák: génmintázatok elemzése, arckifejezés felismerés, képekhez kulcsszavak rendelése (annotálása; keresőmotorok)

Generátorrendszerek tanulása PCA Adott: x t R dx, t = 1,...,T mintapontok. Feladat (főkomponens analízis): keressük azt a d α -dimenziós alteret (D R dx dα ), [ f(d) = E x proj D (x) 2] (9) minimális. Megoldás: cov(x) d α db domináns sajátvektora =: D.

Generátorrendszerek tanulása NMF (nem-negativitási kényszer) Adott: x t 0 R dx, t = 1,..., T mintapontok (X). Feladat (nem-negatív mátrix faktorizáció): keressük azt a D R dx dα + mátrixot és hozzá tartozó A = [α 1,...,α T ] 0 reprezentációt, amire minimális. f(d, A) = X DA 2 F (10)

Generátorrendszerek tanulása NMF ++ Mixture-of-topic modell (x t szógyakoriságok): D-re (=témákra) kényszer: d i 0 oszlopok és l 1 -gömbbeliek ( j d ij 1), α-ra megkötés: α 0, G: hierarchikus felépítés, G i az i-edik nódus a gyerekeivel.

Generátorrendszerek tanulása batch vs online, hiányos megfigyelések Batch vs online D becslés: Batch: Becslés módja: X = {x 1,..., x T } D. Hátrány: x t nagydimenziós lehet (pl Wiki-nél) nem fér be a memóriába. Online: t = 0: D 0. t = 1: D 0,x 1 D 1. t = 2: D 1,x 2 D 2.... Hiányos megfigyelések: minden egyes x t -ből csak bizonyos koordináták mérhetők.

Generátorrendszerek tanulása: általános feladat Felmerült természetes kényszerek: csoport ritkaság és nem-konvex regularizáció ({G i } K i=1,ω), D és α-ra: kényszerek lehetősége (pl korlátosság, nem-negativitás) online tanítás, hiányos megfigyelések.

Az általános feladat teljesen megfigyelhető eset Adott: x i R dx (i = 1, 2,...) megfigyelések, dictionary kényszer (D D): D = dα i=1 D i R korlátos, konvex, zárt, reprezentáció kényszer (α A R dα ): A: konvex, zárt, struktúrális kényszerek (G): G G G = {1,...,d α }, d G R dα, 0, G tartójú súlyvektorok, dx dα

Az általános feladat teljesen megfigyelhető eset (folyt.) Legyen fix D és x-re, az x-hez tartozó α reprezentáció: [ ] 1 l(x, D) = min α A 2 x Dα 2 2 + κω(α) (κ > 0) (11) minimum helye, ahol Feladat (OSDL): Ω(y) = ( d G y 2 ) G G η (η (0, 1]). (12) f t (D) = 1 t j=1 (j/t)ρ t i=1 ahol ρ 0 felejtési ráta. Speciálisan (ρ = 0): f t (D) = 1 t ( ) i ρ l(x i, D) min t, (13) D D t l(x i, D). (14) i=1

Az általános feladat hiányosan megfigyelt eset Az i-edik időpillanatban az O i {1,...,d x } koordinátákat látjuk x i -ből: x Oi. l(x i, D) helyett az (x, D)-hez tartozó α legyen: [ 1 l(x, D, i) = min xoi D α A 2 Oi α ] 2 2 + κω(α), (15) minimum helye. Feladat: f t (D) = 1 t j=1 (j/t)ρ t i=1 ( ) i ρ l(x i, D, i) min t. (16) D D

Fontos speciális esetek O i = {1,...,d x } ( i): teljesen megfigyelhető eset. Speciális esetek G-re: G = d α és G = {{1}, {2},..., {d α }}: α i -k közt nincs kapcsolat (klasszikus ritka dictionary). Ezen belül, ha D adott, ρ = 0, η = 1, d i = e i : Lasso feladat. G = d α, α i egy fa nódusai, G = {gyerek 1,...,gyerek dα }: fa-struktúrált, hierarchikus reprezentáció G = d α, α i egy rácson, G = {NN 1,...,NN dα }, NN i i-edik pont r-sugarú környezete: rács reprezentáció. G = {P 1,..., P K }, {P k } K k=1 a {1,...,d α} halmaz egy partíciója: non-overlapping csoport struktúra.

Fontos speciális esetek (folyt.) Speciális esetek D, A-ra: D i = L 2 -gömb ( i), A = R dα : D oszlopaira d i 2 1 korlát, D i = nem-negatív L 2 -gömb ( i), A = R dα + : struktúrált NMF, D i = nem-negatív L 1 -gömb ( i), A = R dα + : struktúrált mixture-of-topics modell. Speciális eset d G -re: d G = χ G ( G G), ahol χ a karakterisztikus fg: nem alkalmazunk extra súlyozást.

Optimalizáció Az OSDL feladat ekvivalens a D dictionary és az {α i } t i=1 együtthatók együttes optimalizációjával: ahol f t = 1 t j=1 (j/t)ρ f t (D, {α i } t i=1 ) t i=1 min, (17) D D,{α i A} t i=1 ( ) i ρ [ ] 1 x t 2 Oi D Oi α i 2 2 + κω(α i). (18)

Optimalizáció (folyt.) D online optimalizációja: Az aktuális x Ot -re és D t 1 -re α t -t az [ 1 α t = argmin x α A 2 Ot (D t 1 ) Ot α ] 2 2 + κω(α) (19) feladat mo-jaként becsüljük. Az eddigi {α i } t i=1 -ket használva D t a ˆft (D t ) = min D D f t(d, {α i } t i=1 ) (20) kvadratikus probléma megoldásaként kapjuk.

α becslés Kihasználva, hogy y R d és η (0, 2) esetén 1 y η = min z R d 2 + ahol β = η 2 η, és minhely z i 2Ω(α) = d i=1 min z=[(z G ) G G ] R G + = min z R G + ahol ζ = ζ(z) R dα, és y 2 j z j + 1 2 z β, (21) = y i 2 η y η 1 η kapjuk: d G α 2 2 z G + z β G G ] [α T diag(ζ)α + z β, (22) ζ j = G G,G j ( d G j ) 2 z G. (23)

α becslés (folyt.) Beírva az előző alakot az optimalizációs feladat: J(α, z) min α A,z R G +, (24) ahol J(α, z) = 1 x 2 Ot (D t 1 ) Ot α ) (α 2 2 + κ1 T diag(ζ)α + z 2 β. (25) Optimalizáció iterálva: Fix z-re: A = R dα -re (A = R dα + -re) least squares (nem-negatív). Ált. esetben is: kvadratikus költség, konvex felt-el standard megoldók. Fix α-ra: z G = d G α 2 η 2 ( d G α 2 ) G G η 1 η, G G. (26)

D becslés BCD optimalizációval (d j -re, a többi d i (i j)-t addig fixálva). ˆft kvadratikus d j -ben, így ˆf t d j (u j ) = 0 (27) megoldását vetítjük a feltételi D j halmazra: d j Π Dj (u j ). Belátható: u j eleget tesz az C j,t u j = b j,t e j,t + C j,t d j, (28) diag-os ehómtx-ú lineáris egyenletrendszernek, ahol

D becslés (folyt.) C j,t = B t = e j,t = t i=1 t i=1 t i=1 ( ) i ρ i α 2 i,j R dx dx,(j = 1,...,d α ) (29) t ( ) i ρ i x i α T i = [b 1,t,..., b dα,t] R dx dα, (30) t ( ) i ρ i Dα i α i,j R dα,(j = 1,...,d α ), (31) t ahol i = mtx-os formában O i. Itt mind C j,t -k, mind B t típusú mtx sorozatok. t i=1 ( ) i ρ N i (32) t

D becslés (folyt.) Felejtést leíró rekurziók (teljes indukcióval belátható): N t R L 1 L 2 (t = 1, 2,...) adott mtxsorozat. Legyen Ekkor M t = γ t M t 1 + N t R L 1 L 2 (t = 1, 2,...), (33) t ( ) i ρ M t = N i R L 1 L 2 (t = 1, 2,...). (34) t i=1 ρ = 0-ra: M t = M 0 + M t ( t 1), ρ > 0-ra: M t = M t ( t 1).

D becslés (folyt.) Emiatt a C j,t, B t statisztikák online frissíthetők a C j,t = γ t C j,t 1 + t α 2 tj, (35) B t = γ t B t 1 + t x t α T t, (36) módon (i) ρ = 0-ra: C j,0 = 0, B 0 = 0, (ii) ρ > 0 tetszőleges indítással, ahol γ t = ( 1 1 ) ρ. t e j,t = t i=1 ( ) i ρ i Dα i α i,j (37) t -ből általános esetben ( i I) nem emelhető ki D, de e j,t -re egy numerikusan jó online közelítése az aktuálisan becsült D t -vel. e j,t = γ t e j,t 1 + t D t α t α t,j (38)

OSDL: alkalmazás kitöltésre D optimalizáció: x O1,...,x OT D. (39) Kitöltés: új, kitöltendő mintapont: x O, α optimalizáció: (x O, D O ) α. (40) x becslés: ˆx = Dα. (41)

Illusztráció: természetes képek kitöltése Hiányosan megfigyelt képrészleteken tanult D, teljes képkitöltési feladaton, Tesztkép (eddig semmilyen formában nem látott): PSNR (peak signal-to-noise ratio): nagy a jó, wireless kommunikációban (kép-, videó tömörítésben) elfogadható 20 25 db (30 db).

Illusztráció - folyt. p tr = 0.5, p val test = 0.3

Illusztráció - folyt. p tr = 0.5, ptest val = 0.3 (PSNR = 36 db):

Illusztráció - folyt. p tr = 0.5, p val test = 0.7

Illusztráció - folyt. p tr = 0.5, ptest val = 0.7 (PSNR = 29 db):

Köszönöm a figyelmet!