Gyakorlati kérdések 2. előadás, 2017. február 22. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Paraméterbecslés: elvileg a maximum likelihood a leghatásosabb (konfidencia intervallum is konstruálható), de nagyon lassú Illeszkedésvizsgálat Sűrűségfv. becslésből: paraméteres vs. nemparaméteres ("középen" jó) PP plot QQ plot (általában előnyösebb, mert az eloszlás széleit is mutatja, de ezek itt eltúlzottak lehetnek) Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 1 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 2 / 30 Michael-féle szórásstabilizált P-P plot Szimuláció (Chambers, 1976) A PP plotnál a szélső pontok szórása kicsi (a QQ plotnál általában a középsőké) S = 2 arcsin(u 1/2 )/π : sűrűségfüggvénye sin(πx)- szel arányos, a rendezett minta elemeinek szórása aszimptotikusan azonos. Az ábrázolandó pontok: r i = (2/π) arcsin[(i 0.5)/n 1/2 ] s i = (2/π) arcsin[f 1/2 (y i m)/s] Tesztstatisztika is számolható: max r i s i Legyen U egyenletes [0, π], W pedig exponenciális eloszlású λ = 1 paraméterrel és függetlenek. Ekkor Z = sin(αu) cos U 1/α { cos((α 1)U) (α,0) paraméterű szimmetrikus stabilis eloszlású. Legyen U 0 = arctan(β tan(πα/2))/α és Z = sin(α(u 0 + U)) (cos(αu 0 ) cos U) 1/α W } (1 α)/α { cos(αu0 + α 1)U) W } (1 α)/α pedig (α,β) paraméterű stabilis eloszlású (ha α 1). Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 3 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 4 / 30
Illusztráció: részvény-idősorok Havi aggregálás Daily log returns of a stock (%) Monthly aggregation of daily log returns of a stock (%) Frequency 0 200 400 600 Frequency 0 5 10 15 20 60 40 20 0 20 300 200 100 0 100 200 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 5 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 6 / 30 Becslés kvantilis módszerrel Legyen x p, a p-kvantilise a becsülendő eloszlásnak, ˆx p pedig a mintáé. Legyen ν α = x 0.95 x 0.05 x 0.75 x 0.25, ez független γ-tól és δ-tól és szigorúan csökkenő α függvényében. Ennek megfelelően ˆν α = ˆx 0.95 ˆx 0.05 ˆx 0.75 ˆx 0.25 konzisztens becslése lesz ν α -nak Legyen ν β = x 0.95 + x 0.05 2x 0.5 x 0.75 x 0.25 és ˆν β tapasztalati érték az előzőek szerint ν β becslése, mely szintén független γ-tól és δ-tól, és szigorúan monoton növő β-ban. A ν α és ν β függvények α és β függvényei, invertálva α és β becsléseit adják. Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 7 / 30 Becslés kvantilis módszerrel/2 Az inverz függvények zárt alakban nem adhatóak meg. Bizonyos pontokban kiszámoljuk az értékeiket, és a köztes értékeket interpolációval kaphatjuk meg. A γ és δ paraméterek becslése: Lemma Legyen X S(α, β, γ, δ) és Z S(α, β) és legyen x p és z p rendre X és Z p-kvantilise. Ekkor bármely 0 < p 1, p 2 < 1-re, ahol p 1 p 2 teljesül, hogy Ezek alapján a konzisztens becslések γ = x p 2 x p1 z p2 z p1 és δ = x p1 γz p1. (1) ˆγ = ˆx 0.75 ˆx 0.25 ẑ 0.75 ẑ 0.25, ˆδ = ˆx0.5 ˆγẑ 0.5, Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 8 / 30
Klasszikus tétel többdimenzióban Többdimenziós stabilis eloszlások A klasszikus esetben (X 1, X 2,..., X n,... iid, véges szórású) többdimenziós normális eloszlás a standardizált összeg határeloszlása: n i=1 X i µ n N(0, Σ) ahol µ = E(X) és Σ = cov(x). Segédeszköz: többdimenziós karakterisztikus függvény φ X (t) := E(e itt X ) Egy d dimenziós stabilis eloszlás karakterisztikus függvénye: ahol φ(t) = exp{ I(t) + it T µ} I(t) = ψ(t T s)γ(ds). S d S d a d-dimenziós egységgömb felszíne, Γ véges mérték S d -n, µ d-dimenziós vektor és { u ψ(u) = α (1 isign(u) tan{πα/2}) : α 1 u(1 2isign(u) ln(u)/π : α = 1 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 9 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 10 / 30 Tulajdonságok Kapcsolat az eloszlással 1 dimenziós vetületek (u T X) eloszlása stabilis eloszlás, ugyanazzal az α paraméterrel. Ezek meghatározzák a d-dimenziós eloszlást X µ- re már µ = 0, tehát ez feltehető Független komponensű esetben Γ = γ 1 δ(s 1 ) + + γ d δ(s d ) ( ) (u T X) skálája u függvényében γ(u) = S ut d s α dγ(s) az ún. skálafüggvény a többi paraméter-függvény is meghatározható Legyen C(A) az A által generált kúp: Ekkor C(A) = {ra : r > 0, a A}, A S d P(X C(A), X > r) lim = Γ(A) r P( X > r) Γ(S d ) Azaz aszimptotikusan az r-nél nagyobb megfigyelések A irányba esésének valószínűsége megegyezik az irány Γ-szerinti valószínűségével Konkrét számítások az inverziós formulával végezhetőek Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 11 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 12 / 30
Szimuláció Nemparaméteres becslés Véges sok pontra koncentrált spektrálmértéknél egydimenziós stabilisokból. Nagyon sok megfigyelés kell a jó illeszkedéshez! 10 6 megfigyelésből a sűrűségfv kontúrjai: Magas dimenzióban egyelőre túl nagy a számításigény - és nem elég az adatok mennyisége (a tipikus pénzügyi alkalmazásoknál) Kétdimenzióban: A kúpok valószínűségéből becsülhető Γ(A) Empirikus karakterisztikus fv-ből I becsülhető, ezután (a véges tartójú esetre) a lineáris egyenletrendszer megoldásából kapjuk a becslést Γ-ra. Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 13 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 14 / 30 Paraméteres családok Modellezés a gyakorlatban Elliptikus stabilis eloszlások: a skálafüggvényük γ(u) = {uru T } α/2, ahol R pozitív definit d d mátrix. Másik karakterizáció: X S 1/2 Z, ahol S (α/2, 1, γ, 0) stabilis, Z N(0, R). Előnyük: 2 + d(d + 1)/2 paraméterrel megadhatók Γ = γ i is lehet jó modell, ahol γ i paraméteres eloszlás S-en Egydimenziós vetületekre stabilis eloszlások illesztése Ha elfogadható az illeszkedés, akkor a következő lépés a a paramétereik vizsgálata Feltétel: α azonos kell, hogy legyen minden irányban Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 15 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 16 / 30
Határeloszlástétel a maximumokra Tétel (Fisher és Tippet, 1928) Legyen X 1, X 2,..., X n,... független, azonos eloszlású, M n = max(x 1, X 2,..., X n ). Ha vannak {a n } és {b n } > 0 sorozatok, hogy ( Mn a n P b n ) z G(z) ha n valamilyen nem-elfajuló G eloszlással, akkor ez a G szükségképpen max-stabilis (vagy más néven extrém-érték eloszlás) { } ( G(x) = exp 1 + ξ x µ ) 1 ξ, σ ahol 1 + ξ x µ σ > 0 ha ξ 0. ξ = 0 esetén G(x) = exp( exp( x)). A max-stabilitás: minden n-hez létezik a n, b n, hogy F (n) (x) = F(a n x + b n ). Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 17 / 30 Típusok A normalizált maximumok lehetséges határeloszlásainak az eloszlásfüggvényei: Frechet: Φ α (x) = exp( x α ) (x>0) α pozitív paraméter. Weibull: Ψ α (x) = exp( ( x) α ) (x<0) Gumbel: Λ(x) = exp( exp( x)) Kapcsolat az eloszlások között: X Φ α ln X α Λ X 1 Ψ α A normáló tényezők (legyen X max-stabilis): Frechet: M n n 1/α X Weibull: M n n 1/α X Gumbel: M n X + ln n. Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 18 / 30 A bizonyítás vázlata Egy kis történelem [max(x 1, X 2,..., X n ) a n ]/b n eloszlásfve: F n (b n x + a n ) F n (b n x + a n ) G(x) pontosan akkor, ha n log(f(b n x + a n )) log(g(x)) Ebből differenciálegyenlet Megoldás visszahelyettesítése Eredeti tétel a max-stabilis eloszlásokról: Fisher-Tippet (1928) Általánosított extrém-érték eloszlás: Jenkinson (1953): { ( G(x) = exp 1 + γ x a ) } 1/γ, b ha ( 1 + γ x a ) b > 0. Frechet(α) (Φ α ) megfelelője: GEV(1/γ) Vonzási tartományok karakterizációja: Gnedenko (1943) 1 F(x) x γ L(x) a GEV(1/γ) vonzási tartományába tartozik Megjegyzés: ha a minimumok eloszlására vagyunk kiváncsiak, akkor tekintsük az ellentettek maximumát Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 19 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 20 / 30
Megjegyzések A normálhatóság feltétele Az eredmények hasonlóak a stabilis eloszlások karakterisztikus függvényeihez. Érdekes kérdés: adott F eloszlásfügvény esetén melyik határeloszláshoz konvergál az F eloszlású minta normalizált maximuma? Nem minden esetben lehet normálni: Diszkrét eloszlásokra oszcillálhat a maximum eloszlása. Folytonos eloszlásra ellenpélda: F(x) = exp x sinx Folytonos eloszlásokra az eloszlásfüggvény reguláris viselkedése szükséges a felső végpont közelében (teljesül minden fontos eloszlásra): F a γ paraméterű Fréchet eloszlás max-vonzási tartományához tartozik (F MDA(F γ )), akkor és csak akkor, ha 1 F( x) x γ L(x) (L lassú változású függvény: L(cx)/L(x) 1 ha x ). Példa: Cauchy F MDA(W α ), akkor és csak akkor, ha x F < és 1 F(x F 1/x) x α L(x). Példa: U[0; 1] A Gumbel MDA jellemzése bonyolultabb, lényegében az exponenciális lecsengésű eloszlások tartoznak ide (példa: exponenciális, normális). Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 21 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 22 / 30 Néhány példa VaR, visszatérési szint GEV p-kvantilise: z p = { µ σ 1 y γ p, γ 0 µ σ log(y p ), γ = 0 ahol y p = log(1 p), G(z p ) = 1 p az az érték, amelyet átlagosan 1/p megfigyelésenként egyszer halad meg az adatsor. Annak valószínűsége, hogy 1/p -nél előbb megjelenik, nagyobb 1/2-nél! Ha γ < 0, akkor az eloszlás becsült felső végpontja µ σ/γ. ábra: GEV eloszlások sűrűségfüggvénye Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 23 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 24 / 30
Paraméterbecslés Illusztráció: árvíz-idősorok Maximum likelihood: Nincs explicit megoldása A szokásos aszimptotikus tulajdonságokkal (optimalitás, normalitás) rendelkezik, ha γ > 0, 5. γ < 1 esetén nincs lokális maximuma a sűrűségfüggvénynek, a maximális mintaelem a globális maximum - ez konzisztens. Alternatív módszerek: probability-weighted-moments Rendezett mintán alapuló eljárások Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 25 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 26 / 30 Konfidencia tartomány Profil likelihood A (számunkra érdekes) reguláris esetekben aszimptotikusan jó a normális határeloszlás alkalmazása De: a konvergencia általában nem túl gyors - különösen a legfontosabb, VaR esetén általában nem pontos Ezért célszerű alternatív módszerek alkalmazása Kis mintákra sokkal jobb tulajdonságú lehet a klasszikus, normalitáson alapuló módszernél A háttér itt is aszimptotikus eredmény: a reguláris esetben {ϑ : 2(l( ˆϑ) l(ϑ)) h 1 α,k } aszimptotikusan 1 α megbízhatóságú konfidencia intervallum. h 1 α,k a k szabadságfokú chi-négyzet eloszlás kvantilise, k pedig a vizsgált paraméterek száma (tipikusan k = 1). Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 27 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 28 / 30
Alkalmazás: árvíz-idősorok Hivatkozások Michael, P.: The stabilized probability plot (1983) Nolan, J. P.: Modeling financial data with stable distributions (2005) Nolan, J.P.: An overview of multivariate stable distributions(2008) Rachev, S.T.(ed): Handbook of Heavy Tailed Distributions (2003) Embrechts, Klüppelberg, Mikosch: Modelling Extremal Events. for Insurance and Finance (2000) Smith. R.L.: Maximum likelihood in a class of nonregular cases. Biometrika (1985). Profil likelihood: http://www.unc.edu/courses/2010fall/ecol/563/ 001/docs/lectures/lecture11.htm#marginal Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 29 / 30 Zempléni András (ELTE) 2. előadás, 2017. február 22. Áringadozások előadás 30 / 30