Pontfolyamatok definíciója 5. előadás, 2016. március 10. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Hasznos eszköz, könnyű a modellek általánosítása a segítségükkel A minta véletlen térbeli pontok (X 1,..., X n ) sorozata, össz-mérték ekkor n N(A): az A Borel halmazba eső megfigyelések száma Formálisan: Legyen E az állapottér (X értékkészlete) - tipikusan R d része, esetleg lehetnek végtelen nagy koordináták. B(E) a Borel-halmazok E-n. A pontfolyamat egy mérhető leképezés: (Ω, F, P) (M p (E), M p (E)) ahol M p (E) a pontmértékek (olyan számlálómérték, melyre m(k ) véges, ha K kompakt) halmaza, M p (E) pedig M p (E) részhalmazainak egy σ-algebrája Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 1 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 2 / 22 Példák pontfolyamatokra Pontfolyamatok gyenge konvergenciája A meghaladások pontfolyamata: N n (.) = n ε i/n (.)I(X i > u) i=1 Az extrémumok érdekelnek, ezért az (u, )-be eső megfigyelésekkel foglalkozunk Poisson pontfolyamat: Az egydimenziós Poisson folyamat általánosítása. Tulajdonságok: Tetszőleges diszjunkt A, B halmazokra N(A) és N(B) független λ 0 adott mérték a Borel halmazokon (intenzitás), ezzel N(B) éppen λ(b) paraméterű Poisson eloszlású Homogén a folyamat, ha λ a Lebesgue mérték (ekkor a korlátos B halmazokon nézzük) Legyenek N, N 1,..., N n pontfolyamatok E R d -ben. N n N gyengén, ha a véges dimenziós eloszlások konvergálnak minden olyan A i -re, amelynek a határára N( A i ) = 0. Legyen X 1,..., X n független,azonos eloszlású. Tudjuk, hogy P(max(X 1,..., X n ) < u n ) exp{ τ} pontosan akkor, ha nf(u n ) = E n I {Xi >u n} τ. Ekkor a meghaladások N n pontfolyamata gyengén konvergál a (0, 1]-en a τ intenzitású homogén Poisson pontfolyamathoz. i=1 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 3 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 4 / 22
Max-stabilis folyamatok Smith (1990) konstrukciója Legyen T R d egy Borel-halmaz. {Y t : t T } pontosan akkor max-stabilis folyamat, ha előáll folytonos trajektóriájú folyamatok koordinátánkénti (standardizált) extrémumaiként. Ezekre definíció szerint teljesül a max-stabilitás Példa: (r i, s i ) Poisson pontfolyamat (0, )xs halmazon, intenzitásmértéke dr r 2 dh(ω). S tetszőleges Borel halmaz, H mérték S-en. Legyen f olyan, hogy S f (s, t)dh(s) = 1 minden t-re, és Y t = max{r i f (s i, t)}, t T i r i az i-edik vihar erőssége, s i pedig a helye. { { } } f (si, t) P(Y t < y t t T ) = exp max H(ds). S t y t Ebből: Y peremeloszlása standard Frechet Y max-stabilis Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 5 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 6 / 22 Példák Példa: szimulált Smith-féle extremális folyamatok T = 1: egydimenziós max-stabilis eloszlás T = {1, 2}, S = [0, 1], H: Lebesgue mérték, { (1 α)s f (s, t) = α, ha t = 1 (1 α)(1 s) α, ha t = 2 éppen a 2 dimenziós logisztikus modell Gauss extrém-érték folyamat (Smith): f (s, t) t-ben az s várható értékű, Σ kovariancia-mátrixú normális eloszlás sűrűségfüggvénye y y x x Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 7 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 8 / 22
Modell-illesztés Többdimenziós POT modellek 1 dimenziós peremek becslése 2 dimenziós összefüggőség becslése (extremális összefüggőségi függvény): ϑ(z 1 z 2 ), ahol P(Y (z 1 ) < y, Y (z 2 ) < y) = P(Y (z 1 ) < y) ϑ(z 1 z 2 ). Paraméteres (pl. Gauss) modellre közelítő (páronkénti) maximum likelihood számolható. Később még visszatérünk rá Jó lenne több adatot használni Valódi megfigyelések Klasszikus modell: minden koordinátában haladja meg a magas küszöböt. Tulajdonságok: Peremek: GPD Paraméteres modellek egy része átvihető EVD csomag használható De: valójában kevés az adat Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 9 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 10 / 22 Alternatív definíció (MGPD II) Minden megfigyelést figyelembe vesz, ami legalább egy koordinátában meghaladja a küszöböt Formálisan: Y = (Y 1,..., Y d ) vektorváltozó, u = (u 1,..., u d ) megfelelően magas küszöb X = Y u = (Y 1 u 1,..., Y d u d ) a meghaladások. A többdimenziós általánosított Pareto eloszlás (MGPD): H(x 1,..., x d ) = 1 log G ( 0,..., 0 ) log ahol G MGEV eloszlású Standard Fréchet marginálisokat kapunk a t i = t i (x i ) = ( ) G x1,..., x d G ( x 1 0,..., x d 0 ), 1 log G ξi,µ i,σ i (x i ) = (1 + ξ i(x i µ i )/σ i ) 1/ξ i, transzformációval, ahol 1 + ξ i (x i µ i )/σ i > 0 és σ i > 0, i = 1,..., d. Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 11 / 22 Alternatív definíció (MGPD II) Az MGPD sűrűségfüggvénye (ha létezik) h(x) = = H (x) = x 1... x d d i=1 t i (x i) ( V t 1 (0),..., t d (0) Nem lesznek a peremek GPD-k ( 1 x 1 x d ) Kevés a jól használható, identifikálható modell log G(x) ) log G(0) V ( t 1 (x 1 ),..., t d (x d ) t 1 t d Becslés R-ben: mgpd csomaggal, de kettőnél több dimenzióban nem könnyű Összehasonlítás: több adat alapján valóban megbízhatóbb becslések adódnak Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 12 / 22 ).
Szimmetrikus és aszimmetrikus modellek összehasonlítása Kétfajta 2D modell összehasonlítása BGPD I BGPD II Logistic Psi logistic A(Ψ(t)) = A(t + f (t)), például f ψ1,ψ 2 (t) = ψ 1 (t(1 t)) ψ 2, ha t [0, 1], ahol ψ 1 R és ψ 2 1 aszimmetria paraméterek Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 13 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 14 / 22 Bootstrap (Efron, 1979) Bootstrap módszer - bevezetés Újramintavételezési eljárás, a becsléseink szórásának vizsgálatára, modell-illeszkedés ellenőrzésére Számtalan változatát dolgozták ki azóta, az egyik leggyorsabban fejlődő részterülete a statisztikának Előnye: rugalmas a minta (a statisztika) eloszlására vonatkozó feltételek változására X = {X 1,..., X m} visszatevéses mintavétellel az eredeti mintából általában m = n Nehézségek a gyakorlatban: 1 x = ˆP minden modellnél más és más 2 ˆP x a sok ismétlés megterheli a számítógépet Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 15 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 16 / 22
Az i.i.d. bootstrap Az i.i.d. bootstrap korlátai Legyenek X 1, X 2,... i.i.d. valószínűségi változók, F (ismeretlen) közös eloszlással T n = t n (X n ; F) minket érdeklő val.változó, az eloszlása: G n Cél: G n eloszlásának becslése Bootstrap módszer: Adott X -re, visszatevéssel m elemű mintát veszünk: Xm = {X1,..., X m} az X i -ok közös eloszlása: F n = n 1 T m,n = t m (X m; F n ) Ismétlések Ĝm,n n δ Xi i=1 számításigényes bizonyos esetekben a becslés nem lesz konzisztens Példa (Singh, 1981) Def: {X n }n 1 m-függő valamely m 0 számra, ha {X 1,..., X k } és { X k+m+1,... } függetlenek minden k 0-ra. Jel. σm 2 = Var(X 1 ) + 2 m 1 i=1 Cov(X 1, X 1+i ) Legyen a becsülendő statisztika: T n = n(x n µ) Ennek bootstrap megfelelője: Tn,n = n(x n X n ) Tétel Legyen {X n }n 1 stacionárius m-függő v.v. sorozat, EX 1 = µ, σ 2 = Var(X 1 ) (0, ), m n=1 Cov(X 1, X 1+i ) 0 és σ 2 m 0 Ekkor lim sup P (T n n,n x) P(T n x) 0 m.m. x Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 17 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 18 / 22 Alkalmazása az összefüggő esetre Blokkméret kiválasztása (Politis & White) Circular blokk bootstrap (CBB) 1 Y t = X tmod(n) azaz periodikusan kiterjesztjük a mintát 2 Legyen i 1, i 2,... i m minta az {1,..., N} halmazon egyenletes eloszlásból 3 Adott b blokkméretre készítsünk N =mb (N N) pszeudo-megfigyelést: Y (k 1)b+j = Y im+j 1 ahol j = 1,..., b; k = 1,..., m 4 A minket érdeklő statisztika kiszámítása a pszeudo-megfigyelésekből: Y N = (N ) 1 (Y 1 +... + Y N ) Jel. F 0 = {X n : n 0}, Fk = {X n : n k} Def.: {X t : t Z } erősen keverő, ha α X (k) 0 (k ), ahol α X (k) = sup{ P(A B) P(A)P(B) : A F 0, B F k } Tétel : Tegyük fel, hogy E X t 6+δ <, k=1 k 2 (α X (k)) δ 6+δ < valamely δ>0-ra Legyen b = o(n 1/2 ), N esetén b. Ekkor MSE(σ 2 ) = G2 + D b b,x b 2 n + o(b 2 ) + o( b n ) ahol D= 4 3 g2 (0) és G = k R(k) k= g( ): spektrális sűrűségfüggvény R( ): autokovariancia függvény Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 19 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 20 / 22
Blokkméret kiválasztása (Politis & White) Hivatkozások Optimális blokkméret: b opt = [( 2G2 D )n1/3 ] Kérdés: hogyan becsüljük G-t és D-t ˆD = 4 3ĝ2 (0) Ĝ = M k= M λ( k M ) k ˆR(k) ahol ˆR(k) N k = N 1 (X i X N )(X i+ k X N ) k=1 1 ha t [1, 1/2] λ(t) = 2(1 t ) ha t [1/2, 1] 0 különben M = 2 ˆm, ahol ˆm: ahonnan a korrelogram "lényegében" 0 J.Beirlant, G. Mathys (2000) Quantile estimation for heavy-tailed data R.L. Smith (1990) Max-Stable Processes and Spatial Extremes. www.stat.unc.edu/postscript/rs/spatex.pdf Schlather, M. and Tawn, J. (2003) A dependence measure for multivariate and spatial extreme values: Properties and inference. Rootzén, H. and Tajvidi, N. (2006) The multivariate generalized Pareto distribution. Bernoulli 12, p.917-930. Rakonczai, P.: Multivariate Threshold Models with Applications to Wind Speed Data (Ph.D. dolgozat, 2012) Lahiri, S.N.: Resampling methods for dependent data (Springer, 2003) Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 21 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 22 / 22