További sajátértékek 10. előadás, 2017. május 3. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Keressük azt az alacsonyabb dimenziós alteret, ami a variabilitás jelentős részéért felelős Ha k dimenziós az altér, akkor a k legnagyobb sajátértékhez tartozó sajátvektor lesz a bázisa A további sajátértékek helyett pedig vegyük az átlagukat. Az új kovarianciamátrix tehát σ ij = k l=1 λ l v (l) i v (l) j + λ N l=k+1 v (l) i v (l) j ahol λ 1 λ 2 λ N a sajátértékek, v (1),..., v (N) pedig a hozzátartozó sajátvektorok Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 1 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 2 / 35 Megjegyzések A szűrés hatása a portfólió optimalizálásra Az eredeti és a szűrt kovarianciamátrix főátlója (azaz a szórásnégyzetek) azonosak, a szűrés csak a kovarianciákra vonatkozik A legkisebb sajátértékek nagyobbak lettek Gyakran célszerű a főkomponensanalízist a korrelációs mátrixra elvégezni (a kovarianciamátrix helyett) A főkomponensek számát nem mindig lehet egyértelműen meghatározni. Ekkor érdemes lehet a zajra a Wishart eloszlást illeszteni, és azt a komponenst már a főkomponensek közé sorolni, ahol már nem fogadható el az illeszkedés A feladat T < N esetén is megoldható lesz, hiszen a 0 sajátértékeket pozitívakkal helyettesítettük Megszűnik a divergencia az N/T = 1 pontban, nem lesz túl nagy a q 0 értéke akkor sem, ha N/T kicsi. De a portfólió-súlyok nagy ingadozása nem csökken számottevően Más módszerek is vannak, hasonló eredményekkel Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 3 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 4 / 35
Portfólió optimalizálás és regresszió LASSO módszer A szokásos N-1 változós regresszió, ahol a legkisebb négyzetes hibát adó együtthatóvektort keressük, éppen megfelel a portfólió-optimalizálás feladatának (azért N-1 változós, mert az N-edik súly nem választható meg szabadon a súlyösszegre vonatkozó feltétel miatt) A regressziós feladatra kidolgozott módszertan átvihető a portfólió optimalizálásra LASSO=least absolute shrinkage and selection operator L 1 -regularizációs módszer: az együttható vektor (portfólió súlyok) L1 normájára vonatkozó feltétel mellett optimalizál. Tipikus megvalósítás: λ N i=1 w i hozzáadása a célfüggvényhez λ szabályozza a regularizáció erősségét, megválasztása nem triviális Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 5 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 6 / 35 Az eredmények Véletlen mátrixok A súlyok tipikusan kevésbé ingadoznak Sok 0 értékű súly is megjelenik Kérdés, hogy ezzel nem csak elfedődik-e a bizonytalanság (ha például hol itt, hol ott 0 a súly) Vannak további regularizációs lehetőségek is Faktormodellek is használhatóak Láttuk a portfólió-optimalizálásnál, hogy a megoldás első lépésében becsülnünk kell a kovariancia-mátrixot Ez a becslés: véletlen N N-es mátrix Precízebben: X : Ω M N N mérhető leképezés (a mátrixokat euklideszi térként elképzelve) Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 7 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 8 / 35
Kérdésfeltevés Határérték N nagy, tehát az N határérték érdekes Legyen X ij szimmetrikus (X ij = X ji ) független normális eloszlású (Wigner mátrix) X T X/T (X most N T -es): Wishart mátrix: ez felel meg a kovarianciamátrix becslésének Sajátértékek is valószínűségi változók. Külön külön nem könnyű őket követni, egyszerűbb a spektrumot (a sajátértékek összessége) vizsgálni Legyen X N N-es szimmetrikus mátrix független standard normális eloszlású elemekkel (Wigner mátrix). X spektruma N elemű: λ i (i = 1,..., N). Legyen ρ N (λ) = 1 N N δ(λ λ i ) A Wigner mátrixra a spektrum határértéke: Wigner (félkör) eloszlás (Wigner, 1950) ( ) λ lim ρ N N 2 = 2 1 λ N π 2 i=1 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 9 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 10 / 35 A bizonyítás ötlete Carleman feltétel Legyen ν N = 1 N N i=1 λ i 2 N, Y Nk = valószínűségi változó (ν N véletlen mérték) x k dν N Belátható, hogy E(Y Nk ) x k dν ahol ν a Wigner-eloszlás és D 2 (Y Nk ) c k N 2 A Borel Cantelli lemma miatt ( P Y Nk E(Y Nk ) > 1 végtelen sokszor N1/4 ) = 0 Emiatt a ν N feszes, bármely részsorozata határértékének a momentumai egyértelműek Ha k=1 1 µ 1/2k k = akkor legfeljebb egy valószínűségi változó létezik, amelynek a momentumai éppen a µ k értékek. Biz.: ekkor a karakterisztikus függvényt előállítja a Taylor sorfejtés A Wigner eloszlásra teljesül a feltétel Általánosítások A bizonyítás átvihető nem normális eloszlású mátrixelemekre is, elég, hogy iid-k és E(X ij ) = 0 és E(Xij 2 ) = 1 (i j), és szimmetrikus a mátrix Ha a mátrix elemei nem véges szórású stabilis eloszlások, akkor a spektrum határeloszlása nem korlátos (hatványrendben cseng le) Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 11 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 12 / 35
Wishart mátrix Elfajuló határeloszlás Legyen X N T -es mátrix, elemei független, azonos eloszlásúak 0 várható értékkel és 1 szórásnégyzettel κ = E(X 4 ij ) Ekkor W = X T X/T esetén E(W ij ) = 0, ha i j és 1, ha i = j (jel.: δ ij ) D 2 (W ij ) = (1 + (κ 2)δ ij )/T D 2 (W ij ) 0, ha N fix, T és így W ij I. Ez akkor is igaz marad, ha T és N úgy, hogy N/T 0 Ha T < N, W ij elfajuló, a 0 sajátértékek súlya (N T )/N. Ha tehát N úgy, hogy T konstans, akkor a spektrum a 0-hoz tart (elég: N/T ). Nem triviális határeloszlás tehát csak az N/T c esetben várható Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 13 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 14 / 35 Marchenko-Pastur tétel (1967) Tulajdonságok Tétel: Legyen X N T -es (T > N) független, azonos eloszlású, 1 szórású, 0 várható értékű elemekből álló véletlen mátrix, W = X T X/T pedig a hozzátartozó Wishart-mátrix. Ekkor W spektrálsűrűsége ρ N;T (λ) N és N/T = r < 1 konstans esetén 1 N ρ N;T (λ) 1 (λ+ λ)(λ λ ) I π rλ {λ <λ<λ +} ahol λ ± = (1 ± r) 2. Ez a Marchenko-Pastur eloszlás A Wigner-mátrixokhoz hasonlóan tehát a Wishart mátrixok spektruma is egy determinisztikus függvényhez tart. A sűrűség tartója a [λ, λ + ] korlátos intervallum r 0 esetén λ ± = (1 ± r) 2 1 tehát az 1-ben elfajult eloszláshoz tart (a korábbiakkal összhangban). 0 < r < 1 esetén pedig a határeloszlás a 0-ban elfajult és a fenti tétel szerinti eloszlás keveréke r 1 (T N + 0) esetén λ = (1 r) 2 0 hiszen az N > T esetben a mátrix nem teljes rangú, így zérus sajátértékek jelennek meg. Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 15 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 16 / 35
Alkalmazás a kovariancia becslésére Gyakorlati alkalmazás A becslés: jelöléssel Z it = X it 1 T ˆσ ij = 1 T 1 T t=1 X it T Z it Z jt Erre is alkalmazható a Marchenko- Pastur tétel aszimptotikája t=1 De a gyakorlatban a mátrix elemei nem függetlenek! Tapasztalati spektrum a S&P 500 index 406 részvényére és az MP eloszlás illesztése Külön ábrán látható a legnagyobb sajátérték A közepes (szektorális hatásokat leíró) sajátértékek eltávolítása után is marad szisztematikus eltérés az MP eloszlástól Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 17 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 18 / 35 Kapcsolat a portfólió optimalizálással Tulajdonságok A portfólió valódi szórásnégyzete (R 0 ) N N ˆσ 2 (w) = w i w j σ ij i=1 j=1 A becsült portfólió valódi szórásnégyzete (R 1 ) N N ˆσ 2 (w) = ŵ i ŵ j σ ij i=1 j=1 A portfólió "előrejelzett" szórásnégyzete (R 2 ) R 2 < R 1 Aszimptotikusan, a M-P sűrűségből: R 1 (1 N/T ) 1/2 és R 2 (1 N/T ) 1/2 Csak N/T 0 mellett fog 1-hez közelíteni a hányadosuk! A gyakorlatban még nagyobb az eltérés, mert a heteroszkedasztikusság rontja a becsléseket N N ˆσ 2 (w) = ŵ i ŵ j ˆσ ij Mérőszámok: (i = 1, 2) R i / R 0 i=1 j=1 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 19 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 20 / 35
Faktormodell Látens faktor-modell Mivel az adatokra a spektrum nem követi az elméleti modellt, módosítás kell Egy lehetőség: megfigyelhető, közös faktorok felhasználása: X it = µ i + β i1 Z 1t + + β ik Z kt + ε it Itt a Z j faktorok lehetnek például: Infláció Kamatláb CDS felár stb A kovariancia mátrix ebben a modellben: Σ = βω Z β T + Ω ε Formailag hasonló az előzőhöz, de a faktorok itt nem ismertek és így a modell nem határozható meg egyértelműen De normalizálás után már igen, ezért itt feltételezhető, hogy Ω Z = I, azaz Σ = ΛΛ T + Ω ε Maximum likelihood becslés vagy a főkomponens analízis is alkalmazható A faktormodell esetén a legnagyobb sajátérték végtelenhez tart, ez összhangban van a tapasztalattal itt Ω Z a faktorok kovariancia mátrixa, β N k-as együtthatómátrix, Ω ε pedig diagonális. Ezek könnyebben becsülhetőek Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 21 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 22 / 35 A szűrés fontossága A becslés ritkítása Markovitz-optimalizálás határportfóliói a kockázat-hozam síkon A két szélső görbe: Bal oldali: elméleti modell Jobb oldali: tapasztalati kovariancia mátrix alapján kapott becslés viselkedése a következő időszakban Két középső görbe: ugyanez, de szűrt kovariancia mátrixra A legegyszerűbb eszköz: levágás. Csak azokat az elemeket tekintjük nem 0-nak, amelyek becslése meghalad egy adott küszöböt. Az együtthatókat a szokásos legkisebb négyzetes módszerrel becsülve: ˆε it = x it ˆβ i Z t A becsült kovarianciamátrix: Σ ε = 1 T T ˆε t ˆε t t=1 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 23 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 24 / 35
Küszöbválasztás Küszöbválasztás Adaptív módszer a kovarianciamátrix elemeinek ritkítására: ( ) ˆσ ij τ = ˆσ ij I ˆσ ij ˆθ ij ω T ahol ˆθ ij = 1 T T (ˆε hˆε t ˆσ ij ) 2 t=1 ω T m T = o(1) (m T a soronkénti nem 0 elemek max. száma) és a sajátértékekre vonatkozó feltételek esetén a módosított becslés is konzisztens, a konvergencia sebessége is megadható Kalibráció: 1 valódi részvény-adatokra 3 faktoros modellt illesztünk, megbecsüljük β értékét és a kovariancia-mátrixát. 2 Ebből ritka mátrixot készítünk 3 A faktorok értékét VektorAR folyamatból szimuláljuk Szimuláció: 1 3D normális eloszlású β vektor a fenti paraméterekkel megadott eloszlásból 2 Z és ε szimulálása a modell szerint 3 A kovariancia mátrixot a fenti ritkításos eljárással becsüljük 4 N változik 20-600 között Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 25 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 26 / 35 Eredmények Időfüggés A ritka mátrix jobb becslést ad, mint a hagyományos Mostanáig nem vettük figyelembe az egymás utáni megfigyelések lehetséges összefüggését (kivéve a POT módszernél a declusterezést) Vannak rutinszerűen alkalmazható idősoros modellek Ezek tanulmányozása nem tartozik a tárgyunk témái közé, mi csak az összefüggőség hatását vizsgáljuk Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 27 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 28 / 35
Extrémumok stacionárius sorozatokra Tulajdonságok Ha csak gyenge összefüggőség áll fenn, a maximumok határeloszlása továbbra is GEV Ehhez elég az alábbi feltétel (D(u n )): ( P max X ) ( i < u n P max X ) ( i < u n P max X ) i < u n α(n, l) {i A 1 A 2 } {i A 1 } {i A 2 } ahol A 1 = {i 1,..., i p } és A 2 = {j 1,..., j q }, 1 i 1 < i p < j 1 < < j q és j 1 i p > l,α(n, l) 0, ha n megfelelő l = l n = o(n) sorozatra. Független azonos eloszlású sorozatra minden u n -re teljesül a D(u n ) feltétel Ha normális eloszlású a sorozat, akkor elég az autokorrelációkra a ρ n log(n) 0 feltétel Ez gyengébb, mint az általában szokásos gyenge keverés Ha teljesül u n = a n z + b n -re, akkor a normalizált maximumok határeloszlása szintén GEV (Leadbetter, 1974) De: a paraméterek eltérhetnek a független azonos eloszlású esetre adódótól Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 29 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 30 / 35 Hogyan ellenőrizzük a D feltételt? Alkalmazás: vízállás-adatok Legyen p = 1 és q = 1 a D(u) definíciójában és válasszunk egy magas u küszöböt Számoljuk ki a d(l) = 1 n l I{max(X i, X i+l ) < u} ( 1 n l n i=1 értéket l = 1,..., 1000 -re n I{X i < u} ) 2 Ábrázoljuk d(l) -et l függvényében és hasonlítsuk össze ismert sorozatokra adódó d(l) értékekkel i=1 Folytonos vonal: becslések Szaggatott vonal: 95%-os konf. int Kék: iid N(0;1) Piros: AR(1) Az adatok (fekete vonal) a konfidencia intervallumon belül vannak Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 31 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 32 / 35
Az extremális index Becslés Ha az eredeti X 1, X 2,..., X n sorozathoz képezzük az X 1, X 2,..., X n független, azonos eloszlású sorozatot és feltesszük, hogy [max(x 1, X 2,..., X n ) a n ]/b n [max(x 1, X 2,..., X n ) a n ]/b n G 1 és [max(x 1, X 2,..., X n ) a n ]/b n G 2 akkor a D(u n ) feltétel esetén G θ 1 = G 2 Tulajdonságok: 0 < θ 1 Az alakparaméter ugyanaz a két esetben Független sorozatra θ = 1, de a megfordítás nem igaz θ becsülhető például abból a tulajdonságból, hogy θ az átlagos (küszöb feletti) klaszterméret reciproka Másik lehetőség: futam-módszer De nem könnyű a becslés: különböző küszöbökre és becslési módszerekre igencsak eltérő értékek adódhatnak Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 33 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 34 / 35 Blokkmódszer Hivatkozások Legyen n megfigyelésünk Osszuk fel k n csoportra, mindegyik r n nagyságú N n a küszöböt meghaladó megfigyelések száma Z n azon blokkok száma, amelyekben van küszöb fölötti megfigyelés Becslések: Innen: F(u n ) N n n, F r n (u n ) Z n k n F r (u) F θr (u) és így ˆθ = log( 1 Zn k n ) r n log ( 1 Nn n ) M. Potters, J.-P. Bouchaud, and L. Laloux. Financial applications of random matrix theory: old laces and new pieces. 2005. Pafka, Sz. Kondor, I.: Noisy covariance matrices and portfolio optimization. 2003 J. Fan, Y. Liao, and M. Mincheva: High dimensional covariance matrix estimation in approximate factor models (2011). J.P. Bouchaud, M. Potters: Financial Applications of Random Matrix Theory, a short review (2009) Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 35 / 35 Zempléni András (ELTE) 10. előadás, 2017. május 3. Áringadozások előadás 36 / 35