Max-stabls folyamatok 6. előadás, 2017. márcus 29. Zemplén András Valószínűségelmélet és Statsztka Tanszék Természettudomány Kar Eötvös Loránd Tudományegyetem Árngadozások előadás Legyen T R d egy Borel-halmaz. {Y t : t T } pontosan akkor max-stabls folyamat, ha előáll folytonos trajektórájú folyamatok koordnátánként (standardzált) extrémumaként. Ezekre defnícó szernt teljesül a max-stabltás Példa: (r, s ) Posson pontfolyamat (0, )xs halmazon, ntenztásmértéke dr r 2 dh(ω). S tetszőleges Borel halmaz, H mérték S-en. Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 1 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 2 / 28 Smth (1990) konstrukcója Példák Legyen f olyan, hogy S f (s, t)dh(s) = 1 mnden t-re, és Y t = max{r f (s, t)}, t T r az -edk vhar erőssége, s pedg a helye. { { } } f (s, t) P(Y t < y t t T ) = exp max H(ds). S t y t Ebből: Y peremeloszlása standard Frechet Y max-stabls T = 1: egydmenzós max-stabls eloszlás T = {1, 2}, S = [0, 1], H: Lebesgue mérték, { (1 α)s f (s, t) = α, hat = 1 (1 α)(1 s) α, hat = 2 éppen a 2 dmenzós logsztkus modell Gauss folyamat: f (s, t) t-ben az s várható értékű, Σ kovaranca-mátrxú normáls eloszlás sűrűségfüggvénye Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 3 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 4 / 28
Példa: szmulált Smth-féle extremáls folyamatok Modell-llesztés y y 1 dmenzós peremek becslése 2 dmenzós összefüggőség becslése (extremáls összefüggőség függvény): ϑ(z 1 z 2 ), ahol P(Y (z 1 ) < y, Y (z 2 ) < y) = P(Y (z 1 ) < y) ϑ(z 1 z 2 ). Paraméteres (pl. Gauss) modellre közelítő (páronként) maxmum lkelhood számolható. Később még vsszatérünk rá x x Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 5 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 6 / 28 Bootstrap (Efron, 1979) Bootstrap módszer - bevezetés Újramntavételezés eljárás, a becslésenk szórásának vzsgálatára, modell-lleszkedés ellenőrzésére Számtalan változatát dolgozták k azóta, az egyk leggyorsabban fejlődő részterülete a statsztkának Előnye: rugalmas a mnta (a statsztka) eloszlására vonatkozó feltételek változására X = {X 1,..., X m} vsszatevéses mntavétellel az eredet mntából általában m = n Nehézségek a gyakorlatban: 1 x = ˆP mnden modellnél más és más 2 ˆP x a sok smétlés megterhel a számítógépet Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 7 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 8 / 28
Az..d. bootstrap Megjegyzések Legyenek X 1, X 2,.....d. valószínűség változók, F (smeretlen) közös eloszlással T n = t n (X n ; F) mnket érdeklő val.változó, az eloszlása: G n Cél: G n eloszlásának becslése Bootstrap módszer: Adott X -re, vsszatevéssel m elemű mntát veszünk: Xm = {X1,..., X m} az X -ok közös eloszlása: F n = n 1 T m,n = t m (X m; F n ) Ismétlések Ĝm,n n δ X =1 Az ötlet a módszer mögött nagyon egyszerű: jó lenne, ha sok mntánk lenne a populácóból, de csak egy van. Ezért vegyünk mntát a becsléséből: ez a tapasztalat eloszlás. Az smétlések száma legyen elég nagy ahhoz, hogy a mntavétel hba elhanyagolható legyen (legalább 500, de 10000 s elképzelhető) A naív "középső 95%" konfdenca ntervallum túl szűk kcs mnták esetén (például a várható érték becslésénél: a tapasztalat eloszlás szórásnégyzete (n 1)/n-szerese a ténylegesnek, ez öröklődk a bootstrap mntákra Nagyon könnyű a programozása (vannak R-es csomagok, de általában nncs s szükség a használatukra) Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 9 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 10 / 28 Korrekcó a konfdenca ntervallumoknál A BC-formula motvácója és alkalmazása Az emprkus kvantlseket fnomítan kell. A BC (bas-correcton torzítás korrgáló) módszer a határok megállapítására: ( ˆF {Φ 1 z α )} + z 0 z 0 + 1 a(z α + z 0 ) ahol ˆF 1 az emprkus kvantlsfüggvénye a bootstrap statsztkának z α a szokásos emprkus kvantls z 0 s a torzítás korrekcós tag a a szórásnégyzet növekedésének gyorsulását korrgálja Ha a = 0 és z 0 = 0 és ˆF a normáls eloszlás, az érték éppen z α Ha monoton transzformácót: m(ϑ) alkalmazunk a becslésünkre, az eredmény normáls eloszlású: m( ˆϑ) N (m(ϑ) z 0 (1 + am(ϑ)), 1 + am(ϑ)). Innen, a monotontás matt P( ˆϑ < ϑ) = Φ(z 0 ), z 0 könnyen becsülhető Az a becslését a loglkelhood függvény derváltjának ferdeségéből kaphatjuk Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 11 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 12 / 28
Példa: konfdenca ntervallum a korrelácóra Az (m, n) bootstrap A standard ntervallum (az emprkus korrelácós együttható aszmptotkus normaltásán alapul) szmmetrkus nem mndg reáls ks mnták esetén A boostrap lehet aszmmetrkus, a lefedés valószínűsége beállítható Kérdés: vajon a paraméteres vagy a nemparametéteres bootstrap a jobb (a paraméteres általában szélesebb konzervatívabb ntervallumot ad) Ha a "szokásos" bootstrap nem működk, általában segít, ha m < n elemű mntákat veszünk ekkor a vsszatevés nélkül mntavétel (részmnta) s lehetséges, gyakran jobb tulajdonságú Bckel és Sakov (2008) ckke algortmust ad az optmáls m megválasztására - ez az "gaz" (vsszatevéses) bootstrap-re vonatkozk, és az eredmény m n, ha az n elemű mnta s jó. Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 13 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 14 / 28 Példa Példa/2 Legyen X..d.µ várható értékkel és σ szórással A µ = 0 hpotézst teszteljük a nx n statsztkával Jó bootstrap algortmus: mntavétel az X X n "rezduálsokból" Ha n X n bootstrap eloszlását nézzük, ennek kvantlse nem konzsztensek rögzített m-re n esetén m X m határeloszlása m-től függ (csak a normáls eloszlás esetén ugyanaz mnden m-re) m(x m X n ) N(0, σ) ha n, m Tehát m X m N( m X n, σ) ha m m Xn = m/n n X n N(0, λσ) ahol λ = lm m/n A jó eredményt m/n 0 esetén kapjuk Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 15 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 16 / 28
Az m kválasztása Az..d. bootstrap korláta Az előzőek szernt a jó tartományban a bootstrap eloszlás nem változk lényegesen Ha m túl nagy, vagy túl kcs, akkor a bootstrap eloszlások különbözőek Tehát az algortmus: 1 Legyen m j = [ q j n ] (0 < q < 1) 2 Mnden m j -re határozzuk meg a T mj,n eloszlását (szmulácóval) 3 Válasszuk azt az m-et, amre ˆm = ρ(t mj,n, T mj+1,n) (ahol ρ az eloszlásbel konvergencával konzsztens metrka - pl. Kolmogorov-Szmrnov távolság) számításgényes bzonyos esetekben a becslés nem lesz konzsztens Példa (Sngh, 1981) Def: {X n }n 1 m-függő valamely m 0 számra, ha {X 1,..., X k } és { X k+m+1,... } függetlenek mnden k 0-ra. Jel. σ 2 m = Var(X 1 ) + 2 m 1 =1 Cov(X 1, X 1+ ) Legyen a becsülendő statsztka: T n = n(x n µ) Ennek bootstrap megfelelője: Tn,n = n(x n X n ) Tétel: Legyen {X n }n 1 staconárus m-függő v.v. sorozat, EX 1 = µ, σ 2 = Var(X 1 ) (0, ), m n=1 Cov(X 1, X 1+ ) 0 és σm 2 0 Ekkor lm sup P (T n n,n x) P(T n x) 0 m.m. x Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 17 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 18 / 28 Alkalmazása az összefüggő esetre Blokkméret kválasztása (Polts & Whte) Crcular blokk bootstrap (CBB) 1 Y t = X tmod(n) azaz perodkusan kterjesztjük a mntát 2 Legyen 1, 2,... m mnta az {1,..., N} halmazon egyenletes eloszlásból 3 Adott b blokkméretre készítsünk N =mb (N N) pszeudo-megfgyelést: Y (k 1)b+j = Y m+j 1 ahol j = 1,..., b; k = 1,..., m 4 A mnket érdeklő statsztka kszámítása a pszeudo-megfgyelésekből: Y N = (N ) 1 (Y 1 +... + Y N ) Jel. F 0 = σ{x n : n 0}, F k = σ{x n : n k} Def.: {X t : t Z } erősen keverő, ha α X (k) 0 (k ), ahol α X (k) = sup{ P(A B) P(A)P(B) : A F 0, B F k } Tétel : Tegyük fel, hogy E X t 6+δ <, k=1 δ>0-ra. Legyen b = o(n 1/2 ), N esetén b. Ekkor MSE(σ 2 ) = G2 + D b b,x b 2 n + o(b 2 ) + o( b n ) ahol D= 4 3 g2 (0) és G = k R(k) k= g( ): spektráls sűrűségfüggvény R( ): autokovaranca függvény k 2 (α X (k)) δ 6+δ < valamely Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 19 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 20 / 28
Blokkméret kválasztása (Polts & Whte) Paraméteres bootstrap Optmáls blokkméret: b opt = [( 2G2 D )n1/3 ] Kérdés: hogyan becsüljük G-t és D-t ˆD = 4 3ĝ2 (0) Ĝ = M k= M λ( k ) k ˆR(k) M ahol ˆR(k) N k = N 1 (X X N )(X + k X N ) k=1 1 ha t [0, 1/2] λ(t) = 2(1 t ) ha t [1/2, 1] 0 különben M = 2 ˆm, ahol ˆm: ahonnan a korrelogram "lényegében" 0 Eddg semmlyen modellt nem használtunk Ha van jó modellünk, akkor azt érdemes a bootstrapnél s alkalmazn A legegyszerűbb esetben egyszerűen a becsült modellből vesszük a mntát Regresszós modelleknél mnta a rezduálsokból, majd ezt adjuk hozzá az llesztett értékhez Választás a vzsgálat célja alapján: Modell kválasztás: nemparaméteres bootstrap Modell megbízhatóság: paraméteres bootstrap Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 21 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 22 / 28 Egyszerű példa a paraméteres bootstrapra Kérdés: lehet-e 1 az alakparametere az llesztett gamma eloszlásnak? Bootstrap mntákat veszünk az exponencáls eloszlásbó (ez a Γ(1, λ) eloszlás). Statsztka: ezekre a mntákra az alakparaméter ML becslése Bootstrap p-érték: azon esetek aránya, ahol távolabb vagyunk 1-től, mnt a megfgyelt eset becslése Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 23 / 28 AR-seve bootstrap Feltétel: a folyamat staconárus és jól becsülhető AR(p) modellel: p X t µ X = φ j (X t j µ X ) + ε t, t Z j=1 ahol µ X = EX t (ε t ) t Z..d., E(ε t )=0 és ε t független { X s ; s < t }-től Paraméterek és hbák becslése: ˆp=? AIC ˆµ X = n 1 n t=1 X t ˆφ 1,..., ˆφˆp =? Yule-Walker módszer R t = X t ˆp ˆφ j=1 j X t j, ahol t = ˆp + 1,..., n ebből pedg ˆε t = R t R t, ahol t = ˆp + 1,..., n Bootstrap mnta konstruálásának lépése: ε t : véletlen elem { ˆεˆp+1,..., ˆε n } halmazból Nagy u-ra (X u,..., X u+ˆp 1 ) = (ˆµ X,..., ˆµ X ) (a folyamat ndítása) p Xt = µ X + φ j (Xt j µ X ) + ε t t Z j=1 Ebből a bootstrap mnta: { X 1,..., X n } Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 24 / 28
Súlyozott (vad) bootstrap Bootstrap az extrém-érték modellekben Itt már nem bootstrap mntát veszünk, hanem súlyozunk (például a lkelhood függvényt) Formálsan: Z (k) súlyok, E(Z (k) ) = 0 és D 2 (Z (k) ) = 1 ahol = 1,..., n, k = 1,..., N (N a boostrap smétlések száma). A klasszkus esetben Z polnomáls eloszlású Az első alkalmazás a regresszónál: ŷ = ŷ + Z ε Heteroszkedasztkus esetben érdemes használn Tovább alkalmazás lehetőség: kopulák lleszkedésvzsgálata A nemparaméteres bootstrap ks mntákra tpkusan túl szűk konfdencantervallumokat ad Aszmptotkusan s érdemes m << n elemű bootstrap mntákat venn és ezzel párhuzamosan a feladatot kevésbé extrém kvantlsek becslésére vsszavezetn Fnomhangoln paraméterek (s, t) segítségével lehet Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 25 / 28 Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 26 / 28 Hall és Wessman módszere } A cél: D 1 (t, n, x) := E {(Fˆθ(t) (x) F(x))2 mn t Ha az 1 p-kvantlst becsüljük, akkor átírható: } D 2 (t, n, x) := D 1 (t, n, F 1 (p)) = E {(Fˆθ(t) (F 1 (p)) p) 2 mn t { ( A bootstrap becslések ˆD ) } 2 1 (t, m, y) = E Fˆθ (t)(y) ˆF(y) és { ( ) ) } ˆD 2 (t, m, q) = E 1 2 Fˆθ (t) (ˆF (q) q. Arra kell ügyeln, hogy a transzformácónál a log(x)/ log(n) hányados legalábbs aszmptotkusan ne változon, mkor áttérünk (n, x) helyett az (m, y) párra. Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 27 / 28 Hvatkozások J.Berlant, G. Mathys (2000) Quantle estmaton for heavy-taled data Coles, S. and Tawn, J. (1991) Modellng extreme multvarate events. Journal of the Royal Statstcal Socety, Seres B, 53, p.377-392. R.L. Smth (1990) Max-Stable Processes and Spatal Extremes. www.stat.unc.edu/postscrpt/rs/spatex.pdf Schlather, M. and Tawn, J. (2003) A dependence measure for multvarate and spatal extreme values: Propertes and nference. Rootzén, H. and Tajvd, N. (2006) The multvarate generalzed Pareto dstrbuton. Bernoull 12, p.917-930. Rakoncza, P.: Multvarate Threshold Models wth Applcatons to Wnd Speed Data (Ph.D. thess, 2012) Hall, P. and Wessman, I.: On the estmaton of extreme tal probabltes (1997) Efron, B. and Tbshran, R.J.: An Introducton to the Bootstrap (1993) Lahr, S.N.: Resamplng methods for dependent data (Sprnger, 2003) Bckel, P.J. and Sakov, A.: On the Choce of m n the m Out of n Bootstrap and ts Applcaton to Confdence Bounds for Extrema (2008) Polts, D. N. and Whte, H.: Automatc Block-Length Selecton for the Dependent Bootstrap (2004) Zemplén András (ELTE) 6. előadás, 2017. márcus 29. Árngadozások előadás 28 / 28