Gyakorlati tapasztalatok magas dimenzióban 9. előadás, 2017. április 26. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás A becslések többnyire a pszeudo-likelihoodon alapulnak (ekkor a peremeket nemparaméteresen becsüljük) Ezek sem nem függetlenek sem nem tekinthetőek egyenletes eloszlású mintának A becslések hibája (egyparaméteres Arkhimédeszi kopulákra) csökken, ha a dimenzió nő (legalábbis az ismert peremeloszlású esetben, máskor inkább konstans) A következő oldalon a likelihood-hányadoson alapuló konfidencia intervallumokat vizsgáljuk Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 1 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 2 / 35 Konfidencia intervallumok vizsgálata Becslési módszer magas dimenzióban: páronkénti likelihood Definíció: n 1 n i=1 j=i+1 f 2 (x i, x j ; ϑ) Tehát csak a páronkénti összefüggés szerepel a modellben Egyszerűbb számolni (lényeges, ha igazán magas a dimenzió) Példa: térbeli modell (pontfolyamat) A kopula paraméter lefedési valószínűsége a dimenzió függvényében. Ismert peremeloszlásokra rendben van, de ismeretlen peremek esetén magas dimenzióra nagyon lecsökken Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 3 / 35 ˆϑ = argmax T max k t=1 k s s 1 =1 s 2 =1 s log f 2 (z s1,t, z s2,t; ϑ) ahol z a megfigyelt érték, s a helyek, t az idő, K pedig adott indexhalmaz (például 0,1,2,4,8,..) Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 4 / 35
Kopulák magas dimenzióban: vine kopulák A pár-kopulákon alapuló konstrukció 3 dimenzióban: Sokdimenzióban is használható struktúrák Kétdimenziós kopulákon alapulnak, a további struktúrát gráf határozza meg A rendelkezésre álló mintaelemszám/struktúra függvényében rugalmasan konfigurálhatóak Kopula sűrűségfüggvény: c 12 (x, y) = 2 C(x,y) x y Ebből az eredeti eloszlás sűrűségfüggvénye: c 12 (F 1 (x), F 2 (y))f 1 (x)f 2 (y) Feltételes sűrűségfüggvény: f (x y) = c 12 (F 1 (x), F 2 (y))f 1 (x) f (x 1, x 2, x 3 ) = f 1 23 (x 1 x 2, x 3 )f 2 3 (x 2 x 3 )f 3 (x 3 ) = c 12 3 (F 1 3 (x 1 x 3 ), F 2 3 (x 2 x 3 ))c 13 (F(x 1 ), F(x 3 )) c 23 (F (x 2 ), F(x 3 ))f 1 (x 1 )f 2 (x 2 )f 3 (x 3 ) A felbontás nem egyértelmű; 3 dimenzióban 3 felbontás van; De 5 dimenzióban már 240; Egyszerűsítés: elhagyjuk a feltételes kopuláktól való függést a feltételben: f (x 1, x 2, x 3 ) = f 1 23 (x 1 x 2, x 3 )f 2 3 (x 2 x 3 )f 3 (x 3 ) = c 12 3 (F 1 (x 1 ), F 2 (x 2 ))c 13 (F(x 1 ), F (x 3 )) c 23 (F(x 2 ), F(x 3 ))f 1 (x 1 )f 2 (x 2 )f 3 (x 3 ) Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 5 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 6 / 35 Reguláris vine kopulák Vine kopulák típusai és gyakorlati alkalmazásuk d 1 fagráffal adhatók meg T 1 egy fa az 1,..., d csúcsokon A T j fának d + 1 j csúcsa és d j éle van A T j élei csúcsok lesznek a T j+1 -ben A T j+1 két csúcsa között csak akkor haladhat él, ha a T j megfelelő éleinek van közös csúcsa C-vine: a gráfok csillag-alakúak D-vine: a gráfok utak Első lépés a kopula családok kiválasztása (illeszkedésvizsgálattal) Paraméterbecslés a gyakorlatban például a Kendall-féle τ alapján, vagy ML módszerrel: a legfontosabb párokat külön-külön becsüljük, a többit pedig együttesen (univerzálisan, ugyanazzal a kopulával - ez az úgynevezett egyszerűsítés) Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 7 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 8 / 35
Statisztikai módszerek Gyakorlati alkalmazások Paraméterbecslés: iteratívan a gráf szintjeire: Először az első szint kopuláira Ezután ugyanezt elvégezhetjük a következő szintre (az adatokat transzformálva, azaz kiszámítva a feltételes eloszlásokat) Az iteráció addig megy, amíg nem tudjuk a további szinteket egyszerűsíteni Milyenek legyenek a pár-kopulák? Tesztekkel vizsgálható az illeszkedés Adott vine-kopulából a kétdimenziós feltételes eloszlások segítségével lehet mintát szimulálni 16 dimenziós adatsorra kivitelezhető volt a teljes modell illesztése Az első lépésben azt a feszítőfát keressük, amelyre az éleken a Kendall-féle τ értékek összege maximális Levágás: egy bizonyos szint felett minden pár-kopulát függetlennek tételezünk fel Egyszerűsítés: egy bizonyos szint felett minden pár-kopulát azonosnak tekintünk Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 9 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 10 / 35 Megjegyzések További illeszkedésvizsgálati lehetőségek Ha a kétdimenziós kopulák t-kopulák, akkor a vine-kopula a teljes d-dimenziós t-kopula részmodellje Az egymásba ágyazott modellek között a loglikelihood értékeken alapulhat a választás Ha a modellek nem egymásba ágyazottak, akkor alkalmazható az úgynevezett Vuong teszt statisztika, ami szintén a loglikelihood függvényen alapul és információelméleti háttere van (R csomag: CDVine) Információs mátrix-hányados tesztek White féle téves specifikációs teszt A korábban látott tesztek (K-függvényes, Rosenblatt transzformációs) általánosíthatóak kritikus érték számításhoz a súlyozott bootstrap módszer kell; a Cramér-von Mises típusúak itt is az erősebbek Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 11 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 12 / 35
Portfólió-optimalizálás Kockázati mértékek Cél: minél nagyobb várható hozam elérése De: közben a kockázat legyen minél kisebb Kompromisszum: elvárt hozamot érje el a várható érték Közelítések: egy adott értékpapírból tetszőleges valós (általában nemnegatív) számú lehet Az árakat nem befolyásolja a kereskedésünk (likvid piac) Nincsenek tranzakciós költségek Lehetséges mérőszámok: D (szórás, esetleg csak a veszteségre) VaR (a veszteség magas kvantilise mi az, amennyinél többet pl. várhatóan legfeljebb egy évben egyszer vesztünk) cvar (várható veszteség, ha a VaR feletti veszteség ér bennünket) Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 13 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 14 / 35 Koherens kockázati mérték tulajdonságai Koherens kockázati mérték tulajdonságai Additivitás: R(X + c) = R(X) + c Homogenitás: R(aX) = ar(x) Monotonitás: X Y esetén R(X) R(Y ) Szubadditivitás (konvexitás): R(wX + (1 w)y ) wr(x) + (1 w)r(y ) Azaz a diverzifikáció előnyös! Szabályozói oldalról: nem ösztönöz részekre bontásra. Ezt a VaR nem teljesíti. Példa: F Z (1) = 0, 91, F Z (90) = 0, 95, F Z (100) = 0, 96, Z = X + Y : X = {Z : Z < 100}, Y = {Z : Z > 100} VaR(X) = 1, VaR(Y ) = 0, de VaR(Z ) = 90 Ha elliptikus a veszteség-eloszlás, akkor már konvex a VaR Becsülhető: a VaR esetén több nemparaméteres módszer is alkalmazható Empirikus kvantilissel (nem stabil) Kvantilisek súlyozott átlagával Lényeges: fogadja el a felügyelet a módszert Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 15 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 16 / 35
CVaR A modellek összehasonlítása Precíz definíció több is lehet: C α = E(X X VaR α ) C α+ = E(X X > VaR α ) Folytonos esetben ezek egybeesnek. Tulajdonságok: C α = 1 1 α 1 α { 1 VaR β dβ = min C C + 1 } E(X C)+ α A CVaR tulajdonságai Koherens kockázati mérték Zárt: X n X és R(X n ) 0 esetén R(X) 0 Viszont nem könnyű a becslése, ha nincs megalapozott paraméteres modellünk A becsült kockázati mérték függ a választott modelltől Példa: részvények napi loghozama, az érték 10,000; évi 20% a volatilitás (normális vs t 4 -ez vastag szélű eloszlás) α 0,9 0,95 0,975 0,99 0,995 VaR α (norm.elo.) 162,1 208,1 247,9 294,3 325,8 VaR α (t 4.elo.) 137,1 190,7 248,3 335,1 411,8 ES α (norm.elo.) 222,0 260,9 295,7 337,2 365,8 ES α (t 4.elo.) 223,4 286,3 356,7 465,8 563,5 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 17 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 18 / 35 Portfólió optimalizálás Gyakorlati problémák Tegyük fel, hogy a portfólió szórásnégyzetének minimumát keressük: N σ ij w i w j A feltétel: i=1 w i = 1 A megoldás: min w R n w i = i=1 j=1 j=1 σ 1 ij j=1 k=1 σ 1 jk A Markowitz-féle feladat: Az adott hozamszinthez tartozó hatékony portfóliót keressük: min w Π R(w) A feltételek: i=1 E(w iy i ) = µ, i=1 w i = 1 Nem ismert a hozamok eloszlása, de még az eloszlás paraméterei (várható érték, szórás) sem A paraméterbecslések eltérnek az elméleti értéküktől, így a kapott optimum is eltér a valóditól A súlyok véletlen hibával terheltek A kockázat magasabb lesz a valódi optimum kockázatánál Kérdés: mekkora ez az eltérés? Ha van elképzelésünk az eloszlásokról, akkor szimulálhatunk adatokat Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 19 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 20 / 35
Szimuláció q 0 tulajdonságai T hosszú adatsort generáltunk A szimulációból becsült portfólió: ŵ. (A valódi optimum: w.) Mérőszám: Legyen N/T konstans és N. Ekkor D(q 0 ) 0, q 0 E(q 0 ). q 0 = N i=1 j=1 ŵiŵjσ ij N i=1 j=1 w iw j σ ij a becsült és a tényleges optimum gyökének hányadosa q 0 1, megmutatja, hogy mekkora a kockázatnövekedés a becslési hiba miatt. q 0 is valószínűségi változó, tehát a jellemzői (várható érték, szórás) a legfontosabbak ábra: q 0 eloszlása különböző N értékekre. N/T = 0, 5 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 21 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 22 / 35 q 0 tulajdonságai q 0 tulajdonságai Ha N konstans és T csökken, akkor q 0 várható értéke és szórása is nő Ha N/T > 1, a feladat nem oldható meg, mert a kovarianciamátrix nem invertálható Ha N < T, a feladat megoldható, de N/T 1 esetén q 0 Ha N konstans és T, akkor q 0 (1 N/T ) 1/2, függetlenül a várható értékektől és szórásoktól ábra: q 0 N/T függvényében, N = 100 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 23 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 24 / 35
Gyakorlati alkalmazás Korlátok Ha tehát N elég nagy (általában N > 100 már elég), akkor a hiba becsülhető q (1 N/T ) 1/2 Ebből kiszámolható az adott hibához tartozó szükséges mintaelemszám: T = N/(1 1/q 2 0 ) Például N = 100, q 0 = 1, 2 esetén T = 328, N-ben lineárisan nő De kisebb hibatűrés, több részvény esetén jóval hosszabb adatsor kellhet Viszont ilyen időtávon a stacionaritás biztosan nem teljesül Tehát a portfólióválasztási probléma megoldása még az alkalmazott idealizált feltevések mellett is jelentős instabilitást mutat Ha nem csak a kockázatot, hanem magukat a súlyokat tekintjük, a helyzet még rosszabb, az ingadozás tipikusan több száz százalék. Tehát ez a feladat szinte reménytelen Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 25 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 26 / 35 Gyakorlati megfigyelések További sajátértékek A hozamok empirikus kovarianciamátrixának tipikusan egy nagy sajátértéke van Az ehhez tartozó bázisportfólió döntően pozitív elemekből áll Azaz ez a kollektív ingadozás Elméleti háttér: Frobenius-Perron tétel. Eszerint pozitív elemekből álló pozitív definit mátrix esetén a legnagyobb sajátérték egyszeres és a megfelelő sajátvektor elemei pozitívak Bár az empirikus kovarianciamátrix nem minden eleme feltétlenül pozitív, döntő többségük az, és a tétel ekkor is érvényben marad A teljes szórásnégyzet 90-95%-át alkotó közepes sajátértékek a szektorális hatásoknak felelnek meg Lényeges információt hordoznak Nem könnyű belőlük a szektorok konkrét előállítása A maradék (tipikusan a sajátértékek 90-95%-a) a zaj, ez már alig hordoz információt A szűrések lényege, hogy ezt a zajt elnyomják, különös tekintettel arra, hogy az inverz mátrix sajátértékei az eredetinek a reciprokai Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 27 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 28 / 35
További sajátértékek Megjegyzések Keressük azt az alacsonyabb dimenziós alteret, ami a variabilitás jelentős részéért felelős Ha k dimenziós az altér, akkor a k legnagyobb sajátértékhez tartozó sajátvektor lesz a bázisa A további sajátértékek helyett pedig vegyük az átlagukat. Az új kovarianciamátrix tehát σ ij = k l=1 λ l v (l) i v (l) j + λ N l=k+1 v (l) i v (l) j ahol λ 1 λ 2 λ N a sajátértékek, v (1),..., v (N) pedig a hozzátartozó sajátvektorok Az eredeti és a szűrt kovarianciamátrix főátlója (azaz a szórásnégyzetek) azonosak, a szűrés csak a kovarianciákra vonatkozik A legkisebb sajátértékek nagyobbak lettek Gyakran célszerű a főkomponensanalízist a korrelációs mátrixra elvégezni (a kovarianciamátrix helyett) A főkomponensek számát nem mindig lehet egyértelműen meghatározni. Ekkor érdemes lehet a zajra a Wishart eloszlást illeszteni, és azt a komponenst már a főkomponensek közé sorolni, ahol már nem fogadható el az illeszkedés Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 29 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 30 / 35 A szűrés hatása a portfólió optimalizálásra Portfólió optimalizálás és regresszió A feladat T < N esetén is megoldható lesz, hiszen a 0 sajátértékeket pozitívakkal helyettesítettük Megszűnik a divergencia az N/T = 1 pontban, nem lesz túl nagy a q 0 értéke akkor sem, ha N/T kicsi. De a portfólió-súlyok nagy ingadozása nem csökken számottevően Más módszerek is vannak, hasonló eredményekkel A szokásos N-1 változós regresszió, ahol a legkisebb négyzetes hibát adó együtthatóvektort keressük, éppen megfelel a portfólió-optimalizálás feladatának (azért N-1 változós, mert az N-edik súly nem választható meg szabadon a súlyösszegre vonatkozó feltétel miatt) A regressziós feladatra kidolgozott módszertan átvihető a portfólió optimalizálásra Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 31 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 32 / 35
LASSO módszer Az eredmények LASSO=least absolute shrinkage and selection operator L 1 -regularizációs módszer: az együttható vektor (portfólió súlyok) L1 normájára vonatkozó feltétel mellett optimalizál. Tipikus megvalósítás: λ i=1 w i hozzáadása a célfüggvényhez λ szabályozza a regularizáció erősségét, megválasztása nem triviális A súlyok tipikusan kevésbé ingadoznak Sok 0 értékű súly is megjelenik Kérdés, hogy ezzel nem csak elfedődik-e a bizonytalanság (ha például hol itt, hol ott 0 a súly) Vannak további regularizációs lehetőségek is Faktormodellek is használhatóak Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 33 / 35 Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 34 / 35 Hivatkozások Embrechts-Hofer: Statistical inference for copulas in high dimension: a simulation study (2013) Varin-Reid-Firth: An overview of composite likelihood methods (2011) J. Dißmann, E. C. Brechmann, C. Czado, D. Kurowicka: Selecting and estimating regular vine copulae and application to financial returns. 2012. Schepsmeier: Efficient goodness-of-fit tests in multi-dimensional vine copula models (2013). A.J. McNeil, R. Frey and P. Embrechts: Quantitative Risk Management: Concepts, Techniques and Tools, 2005. Dowd, K.-Blake, D.: After VaR. The theory and estimation of quantile-based risk measures, 2006. A. Kempf and C. Memmel. On the estimation of the global minimum variance portfolio, 2003. Varga-Haszonits I.: Kockázati Mértékek Instabilitása (PhD értekezés, ELTE, 2009) Zempléni András (ELTE) 9. előadás, 2017. április 26. Áringadozások előadás 35 / 35