Nem-paraméteres predikció, Lasso közelítés

Hasonló dokumentumok
A maximum likelihood becslésről

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Lineáris regressziós modellek 1

Csoport-struktúrált generátorrendszerek online tanulása

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

Gyakorló feladatok I.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Függetlenaltér-analízis

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

"Flat" rendszerek. definíciók, példák, alkalmazások

Least Squares becslés

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

Principal Component Analysis

Többváltozós lineáris regressziós modell feltételeinek

Lin.Alg.Zh.1 feladatok

Gazdasági Információs Rendszerek

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Lineáris leképezések (előadásvázlat, szeptember 28.) Maróti Miklós, Kátai-Urbán Kamilla

(Independence, dependence, random variables)

Gazdasági matematika II. tanmenet

Segítség az outputok értelmezéséhez

5. elıadás március 22. Portfólió-optimalizálás

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

A valószínűségszámítás elemei

Valószínűségszámítás összefoglaló

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

OPCIÓS PIACOK VIZSGA MINTASOR

Statisztika elméleti összefoglaló

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Bevezetés az állapottér elméletbe: Állapottér reprezentációk

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Modellek és Algoritmusok - 2.ZH Elmélet

: az i -ik esélyhányados, i = 2, 3,..I

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

IBNR számítási módszerek áttekintése

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Elliptikus eloszlások, kopuláik. 7. előadás, március 25. Elliptikusság tesztelése. Arkhimédeszi kopulák

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

Blind Source Separation. Kiváltott agyi jelek informatikai feldolgozása

Lineáris algebra numerikus módszerei

9. Előadás. (9. előadás) Lineáris egyr.(3.), Sajátérték április / 35

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Számítógépes döntéstámogatás. Statisztikai elemzés

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Lin.Alg.Zh.1 feladatok

A Statisztika alapjai

A valószínűségszámítás elemei

Likelihood, deviancia, Akaike-féle információs kritérium

15. LINEÁRIS EGYENLETRENDSZEREK

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Diagnosztika és előrejelzés

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

MI MOZGATJA A HATÁRIDŐS DEVIZAPOZÍCIÓKAT? A magyar piac elemzése

Biostatisztika VIII. Mátyus László. 19 October

Adatok statisztikai értékelésének főbb lehetőségei

Stippinger Marcell: Tőzsdei modellezés (Szeminárium 2. előadás)

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Abszolút folytonos valószín ségi változó (4. el adás)

[Biomatematika 2] Orvosi biometria

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

Boros Zoltán február

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Gazdasági matematika II. vizsgadolgozat, megoldással,


Normális eloszlás tesztje

Regresszió számítás az SPSSben

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Gauss elimináció, LU felbontás

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Blind Source Separation. Kiváltott agyi jelek informatikai feldolgozása

Bevezetés az algebrába 2 Differencia- és differenciálegyenlet-rendszerek

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

1. Példa. A gamma függvény és a Fubini-tétel.

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Átírás:

Problémamegoldó Szeminárium 2009. nov. 12

Motiváció Pénzügyi idősorok elemzése (Morgan-Stanley): Fedezési eljárások optimalizációja Lasso, Opció árazás: nem-paraméteres úton kernel regresszió. Funkcionális AR folyamat analízis ( koktél parti probléma) identifikáció: kernel regresszió, Nadaraya-Watson becslő.

Lasso: motiváció Befektetési bankok (pl. MS) központi célja: állományuk folyamatos fedezése (hedge-elése), azaz illiquid termékeik értékének becslése, piacon elérhető (liquid) termékekhez való lekötése, a folyamatosan fennálló kockázatok ellenére (incomplete piac). a hozzájuk befutó ügyfél faramuci termék kívánságainak kielégítése: Cél: olyan portfolio kialakítása, ami a kívánt termékkel azonos kifizetést ad.

Lasso: regularizáció, ritkaság Gyakorlatban a közelítő idősorok erősen kollineáris rendszert alkotnak rosszul kondícionált rendszerek, instabil megoldás. Ötlet: regularizációs technikák alkalmazása: simaságot/egyértelműséget biztosít. ritka reprezentáció: tranzakciós költség által is motivált, stabil Markowitz portfoliok elmélete.

Lasso: modell Lasso modell (lineáris egyenletrendszer ritkasági kényszerekkel): J 1 (x) = Ax b 2 + λ x 1 (λ > 0) min x, (1) ahol: A: közelítő termékek (portfolio), b: közelített termék, λ x 1 : regularizációs tag, tranzakciós költség (λ: bid-ask spread),

Lasso: portfolio újraalakítás Portfolio újra alakításakor: kevés fedező változó (súlyát) szeretnénk változtatni, Lasso megfogalmazásban: ahol J 2 ( x) = A (x + x) b 2 + λ x 1 min x, (2) A, b : új időszakhoz tartozó értékek, x = x + x: módosított súlyok.

Nem-paraméteres módszerek: Motiváció Regressziós megfogalmazás: x R d 1 y R d 2 (3) közt fennálló relációt szeretnénk megtanulni {(x i, y i )} i=1,...,n minták alapján. Példák: Különböző típusú házak mennyit érnek: (NO 2, bűnözési ráta, szobák száma,... ) érték. (4) műhold képek (spektrális sűrűségfüggvény integrálja kül. sávokban) egységnyi területre eső búza/kukorica termés, opció árazás, koktél parti feladatok.

Nem-paraméteres módszerek: Opció árazás Call (put) opció: jog arra, hogy T idő múlva K áron vehetek (eladhatok) adott terméket. Kérdés: mennyit ér ez az opció? Azaz C(t, T,S t, K, r t,t, d t,t ) =?, (5) ahol S t : a mögöttes termék aktuális ára, r t,t : kockázatmentes hozam, d t,t : osztalék.

Nem-paraméteres módszerek: Black-Scholes Speciális paraméteres modell feltevések esetén: C explicite számolható, pl Black-Scholes esetben C BS ( ) = S t e d t,t(t t) φ(b 1 ) Ke r t,t(t t) φ(b 2 ), (6) b 1 = ln(s t/k) + (r t,t d t,t + σ 2 /2)(T t) σ, (7) T t b 2 = b 1 σ T t, (8) ahol φ a standard normális eloszlás eloszlásfüggvénye. Gond: amennyiben nem teljesül a modell feltevésük, erősen félreáraznak. Motivált: Ĉ nem-parametrikus becslése/közelítése.

Nem-paraméteres módszerek: ISA szemlélet Koktél parti probléma: Szereplők: beszélők (rejtett források) független csoportokba tömörülhetnek, mikrofonok (szenzorok). Feladat (ISA, Independent Subspace Analysis): kevert jelekből az eredeti források becslése.

Nem-paraméteres módszerek: ISA modell ISA modell: x t = Ae t, (9) ahol e = [e 1 ;... ; e M ] forrás: e m R dm komponensei nem-gaussok és időben i.i.d.-k, függetlenek: I(e 1,..., e M ) = 0. az A R D D keverőmátrix invertálható. Cél: x-ből W = A 1 becslése, ê. Alkalmazások: orvosi adatok (EEG, fmri, ECG) elemzése, arcirány felismerés, gén analízis,

Nem-paraméteres módszerek: AR-ISA, far-isa Valóságosabb modell: s forrásnak van dinamikája, pl AR: x t = As t, (10) s t = L s ahol e mint ISA-ban. Spec.: L s = 0-ra ISA. i=1 F is t i + e t, (11) Kiterjesztés (dinamika családja is ismeretlen), funkcionális AR-ISA (far-isa): x t = As t, (12) s t = f(s t 1 ) + e t, (13) ahol f: ismeretlen függvény; e = [e 1 ;... ; e M ], mint ISA-ban. Cél: x-ből W = A 1 becslése, ŝ, ê.

Nem-paraméteres módszerek: far-isa megoldás Megoldási stratégia: s t funkcionális AR, x t = As t x t is funkcionális AR x t = Af(A 1 x t 1 ) + Ae t, (14) Ae meghajtó zajjal és f( ) Af(A 1 ). d-függő CHT Ae közelítőleg Gauss, e komponenseinek fgtlenek, így egy far fittelő adta Ae-becslésen ISA-zással kész lennénk. Kerestetik: far becslő.

Nem-paraméteres módszerek: far becslő Előző diáról: x funkcionális AR x t = Af(A 1 x t 1 ) + Ae t. (15) Ötlet: tanuljuk meg ezt az x t 1 x t összefüggést nem-parametrikus regresszióval, azaz ahol y i = g(x i ) + n i (i = 1,...,T), g( ) =?, (16) y/x/n: válasz-/magyarázó változó; zaj g: ismeretlen feltételes várható érték fg, {(x i, y i )} T i=1 : mintapontok.

Nem-paraméteres módszerek: kernel regresszió Nem-paraméteres regresszió kernelekkel = kernel regresszió, pl Nadaraya-Watson becslő: Ötlet: az g(x) = E[Y X] ismeretlen várható érték fg-t a (x, y), x eloszlások kernel sűrűségfg becsléséből közelítjük. Az adódó formula T i=1 ĝ(x) = y ik ( x x ) i h T i=1 K ( x x ), (17) i h ahol K : kernel (=sűrűségfg; pl Gauss), h: szélesség paraméter.

Nem-paraméteres módszerek: rekurzív NW Ismert: A rekurzív Nadaraya-Watson technika (igen általános feltételek mellett) erősen konzisztens becslést szolgáltat funkcionális AR folyamatokra Ref.: Nadine Hilgert, Bruno Portier: Strong uniform consistency and asymptotic normality of a kernel based error density estimator in functional autoregressive models, arxiv, 2009. Megoldási út: 1 Funkcionális-AR fit (Nadaraya-Watson) a x t = g(x t 1 ) + Ae t (18) megfigyelési folyamatra. 2 Majd ISA x becsült innovációján ê, Ŵ ŝ.

Jóságmérce ISA egyértelműségek szerint a rejtett forráskomponensek permutáció, és és altéren belüli lineáris transzformáció erejéig állíthatóak vissza. Ideális esetben: ŝ = Ŵx-ben G = ŴA blokk-permutációs mtx Blokk-permutációsságra mérce: Amari-index r(g) [0, 1]; 0 tökéletes becslés. Statisztikák ábrázolása boxplot-ok: kvartilisek: Q 1, Q 2, Q 3, kiugró értékek: [Q 1 1.5IQR, Q 3 + 1.5IQR], IQR := Q 3 Q 1.

Illusztráció-1 e [ d m = dim(e m ) = 2; D = dim(e) 12]: Funkcionális AR becslő (rekurzív Nadaraya-Watson), x R D, β (0, 1/D): T 1 t=1 ĝ T (x) = tβd K[t β (X t x)]x t+1 T 1 (19) t=1 tβd K[t β (X t x)] Kernel: Gauss, szélesség (β = 1/Dβ c ): β c = 1./[2, 4, 8, 16, 32, 64]. f(u) = tanh(fu) : F = [F ij ] = [U(0, 1)], tanh i ( ):

Illusztráció-2 Megfigyelés (x): Szabó Zoltán, Lo rincz András

Illusztráció-2 Megfigyelés (x): Becslés (e ): Szabó Zoltán, Lo rincz András

Illusztráció-2 Megfigyelés (x): Becslés (e ): Hinton-diagram (G = W A): Szabó Zoltán, Lo rincz András

Illusztráció-3: M = 3 (6-dimenziós feladat) Amari index (r) 10 0 β c =1/2 β =1/4 c β c =1/8 10 1 β =1/16 c β c =1/32 10 2 1 2 5 10 20 50 100 Mintaszám (T/1000)

Illusztráció-4: M = 6 (12-dimenziós feladat) 10 0 Amari index (r) 10 1 β c =1/8 β =1/16 c β c =1/32 β =1/64 c 10 2 1 2 5 10 20 50 100 Mintaszám (T/1000)

Köszönöm a figyelmet!