Pontfolyamatok definíciója. 5. előadás, március 10. Példák pontfolyamatokra. Pontfolyamatok gyenge konvergenciája

Hasonló dokumentumok
Max-stabilis folyamatok. 6. előadás, március 29. Smith (1990) konstrukciója. Példák

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Határeloszlástétel a maximumokra. 3. előadás, március 1. A bizonyítás vázlata. Típusok. Tétel (Fisher és Tippet, 1928)

Modern szimulációs módszerek

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Sztochasztikus folyamatok alapfogalmak

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Készítette: Fegyverneki Sándor

Valószínűségi változók. Várható érték és szórás

Elliptikus eloszlások, kopuláik. 7. előadás, március 25. Elliptikusság tesztelése. Arkhimédeszi kopulák

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Valószínűségelmélet. Pap Gyula. Szegedi Tudományegyetem. Szeged, 2016/2017 tanév, I. félév

A maximum likelihood becslésről

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Gyakorlati kérdések. 2. előadás, február 22. Szimuláció (Chambers, 1976) Michael-féle szórásstabilizált P-P plot

előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Bevezetés. Valószínűségszámítás 2 előadás III. alk. matematikus szak. Irodalom. Egyéb info., számonkérés. Cél. Alapfogalmak (ismétlés)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

(Independence, dependence, random variables)

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Funkcionálanalízis. n=1. n=1. x n y n. n=1

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

4. előadás. Kiegyenlítő számítások MSc 2018/19 1 / 41

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

Loss Distribution Approach

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Centrális határeloszlás-tétel

CHT& NSZT Hoeffding NET mom. stabilis november 9.

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Abszolút folytonos valószín ségi változó (4. el adás)

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Normális eloszlás tesztje

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

9-10. elıadás április 26. Problémák magas dimenzióban Az idıbeni összefüggıség és a nemstacionaritás szerepe

[Biomatematika 2] Orvosi biometria

Boros Zoltán február

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

1/1. Házi feladat. 1. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy

BIOMATEMATIKA ELŐADÁS

Barczy Mátyás és Pap Gyula

Bemenet modellezése (III.), forgalommodellezés

1 Y t = X tmod(n) azaz periodikusan kiterjesztjük a mintát. 3 Adott b blokkméretre készítsünk N =mb (N N)

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Matematikai statisztika szorgalmi feladatok

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

További sajátértékek. 10. előadás, május 3. Megjegyzések. A szűrés hatása a portfólió optimalizálásra

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Principal Component Analysis

Statisztikai becslés

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

Dr. Karácsony Zsolt. Miskolci Egyetem november

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

Statisztika elméleti összefoglaló

Kísérlettervezés alapfogalmak

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

A valószínűségszámítás elemei

Valószín ségszámítás és statisztika

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztikai módszerek a skálafüggetlen hálózatok

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

Metrikus terek, többváltozós függvények

Alapfogalmak, valós számok Sorozatok, határérték Függvények határértéke, folytonosság A differenciálszámítás Függvénydiszkusszió Otthoni munka

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Backhausz Ágnes 1. Bevezetés A valószínűség elemi tulajdonságai... 5

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Markov-láncok stacionárius eloszlása

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

Nemparaméteres próbák

Matematikai statisztika c. tárgy oktatásának célja és tematikája

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyak. vez.: Palincza Richárd ( Gyakorlatok ideje/helye: CS , QBF10

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

Kalkulus II. Beugró kérdések és válaszok 2012/2013 as tanév II. félév

Biomatematika 2 Orvosi biometria

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

Valószín ségszámítás és statisztika

[Biomatematika 2] Orvosi biometria

Integr alsz am ıt as. 1. r esz aprilis 12.

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

1. Példa. A gamma függvény és a Fubini-tétel.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Numerikus módszerek 1.

Sorozatok. 5. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Sorozatok p. 1/2

Átírás:

Pontfolyamatok definíciója 5. előadás, 2016. március 10. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Hasznos eszköz, könnyű a modellek általánosítása a segítségükkel A minta véletlen térbeli pontok (X 1,..., X n ) sorozata, össz-mérték ekkor n N(A): az A Borel halmazba eső megfigyelések száma Formálisan: Legyen E az állapottér (X értékkészlete) - tipikusan R d része, esetleg lehetnek végtelen nagy koordináták. B(E) a Borel-halmazok E-n. A pontfolyamat egy mérhető leképezés: (Ω, F, P) (M p (E), M p (E)) ahol M p (E) a pontmértékek (olyan számlálómérték, melyre m(k ) véges, ha K kompakt) halmaza, M p (E) pedig M p (E) részhalmazainak egy σ-algebrája Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 1 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 2 / 22 Példák pontfolyamatokra Pontfolyamatok gyenge konvergenciája A meghaladások pontfolyamata: N n (.) = n ε i/n (.)I(X i > u) i=1 Az extrémumok érdekelnek, ezért az (u, )-be eső megfigyelésekkel foglalkozunk Poisson pontfolyamat: Az egydimenziós Poisson folyamat általánosítása. Tulajdonságok: Tetszőleges diszjunkt A, B halmazokra N(A) és N(B) független λ 0 adott mérték a Borel halmazokon (intenzitás), ezzel N(B) éppen λ(b) paraméterű Poisson eloszlású Homogén a folyamat, ha λ a Lebesgue mérték (ekkor a korlátos B halmazokon nézzük) Legyenek N, N 1,..., N n pontfolyamatok E R d -ben. N n N gyengén, ha a véges dimenziós eloszlások konvergálnak minden olyan A i -re, amelynek a határára N( A i ) = 0. Legyen X 1,..., X n független,azonos eloszlású. Tudjuk, hogy P(max(X 1,..., X n ) < u n ) exp{ τ} pontosan akkor, ha nf(u n ) = E n I {Xi >u n} τ. Ekkor a meghaladások N n pontfolyamata gyengén konvergál a (0, 1]-en a τ intenzitású homogén Poisson pontfolyamathoz. i=1 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 3 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 4 / 22

Max-stabilis folyamatok Smith (1990) konstrukciója Legyen T R d egy Borel-halmaz. {Y t : t T } pontosan akkor max-stabilis folyamat, ha előáll folytonos trajektóriájú folyamatok koordinátánkénti (standardizált) extrémumaiként. Ezekre definíció szerint teljesül a max-stabilitás Példa: (r i, s i ) Poisson pontfolyamat (0, )xs halmazon, intenzitásmértéke dr r 2 dh(ω). S tetszőleges Borel halmaz, H mérték S-en. Legyen f olyan, hogy S f (s, t)dh(s) = 1 minden t-re, és Y t = max{r i f (s i, t)}, t T i r i az i-edik vihar erőssége, s i pedig a helye. { { } } f (si, t) P(Y t < y t t T ) = exp max H(ds). S t y t Ebből: Y peremeloszlása standard Frechet Y max-stabilis Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 5 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 6 / 22 Példák Példa: szimulált Smith-féle extremális folyamatok T = 1: egydimenziós max-stabilis eloszlás T = {1, 2}, S = [0, 1], H: Lebesgue mérték, { (1 α)s f (s, t) = α, ha t = 1 (1 α)(1 s) α, ha t = 2 éppen a 2 dimenziós logisztikus modell Gauss extrém-érték folyamat (Smith): f (s, t) t-ben az s várható értékű, Σ kovariancia-mátrixú normális eloszlás sűrűségfüggvénye y y x x Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 7 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 8 / 22

Modell-illesztés Többdimenziós POT modellek 1 dimenziós peremek becslése 2 dimenziós összefüggőség becslése (extremális összefüggőségi függvény): ϑ(z 1 z 2 ), ahol P(Y (z 1 ) < y, Y (z 2 ) < y) = P(Y (z 1 ) < y) ϑ(z 1 z 2 ). Paraméteres (pl. Gauss) modellre közelítő (páronkénti) maximum likelihood számolható. Később még visszatérünk rá Jó lenne több adatot használni Valódi megfigyelések Klasszikus modell: minden koordinátában haladja meg a magas küszöböt. Tulajdonságok: Peremek: GPD Paraméteres modellek egy része átvihető EVD csomag használható De: valójában kevés az adat Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 9 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 10 / 22 Alternatív definíció (MGPD II) Minden megfigyelést figyelembe vesz, ami legalább egy koordinátában meghaladja a küszöböt Formálisan: Y = (Y 1,..., Y d ) vektorváltozó, u = (u 1,..., u d ) megfelelően magas küszöb X = Y u = (Y 1 u 1,..., Y d u d ) a meghaladások. A többdimenziós általánosított Pareto eloszlás (MGPD): H(x 1,..., x d ) = 1 log G ( 0,..., 0 ) log ahol G MGEV eloszlású Standard Fréchet marginálisokat kapunk a t i = t i (x i ) = ( ) G x1,..., x d G ( x 1 0,..., x d 0 ), 1 log G ξi,µ i,σ i (x i ) = (1 + ξ i(x i µ i )/σ i ) 1/ξ i, transzformációval, ahol 1 + ξ i (x i µ i )/σ i > 0 és σ i > 0, i = 1,..., d. Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 11 / 22 Alternatív definíció (MGPD II) Az MGPD sűrűségfüggvénye (ha létezik) h(x) = = H (x) = x 1... x d d i=1 t i (x i) ( V t 1 (0),..., t d (0) Nem lesznek a peremek GPD-k ( 1 x 1 x d ) Kevés a jól használható, identifikálható modell log G(x) ) log G(0) V ( t 1 (x 1 ),..., t d (x d ) t 1 t d Becslés R-ben: mgpd csomaggal, de kettőnél több dimenzióban nem könnyű Összehasonlítás: több adat alapján valóban megbízhatóbb becslések adódnak Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 12 / 22 ).

Szimmetrikus és aszimmetrikus modellek összehasonlítása Kétfajta 2D modell összehasonlítása BGPD I BGPD II Logistic Psi logistic A(Ψ(t)) = A(t + f (t)), például f ψ1,ψ 2 (t) = ψ 1 (t(1 t)) ψ 2, ha t [0, 1], ahol ψ 1 R és ψ 2 1 aszimmetria paraméterek Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 13 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 14 / 22 Bootstrap (Efron, 1979) Bootstrap módszer - bevezetés Újramintavételezési eljárás, a becsléseink szórásának vizsgálatára, modell-illeszkedés ellenőrzésére Számtalan változatát dolgozták ki azóta, az egyik leggyorsabban fejlődő részterülete a statisztikának Előnye: rugalmas a minta (a statisztika) eloszlására vonatkozó feltételek változására X = {X 1,..., X m} visszatevéses mintavétellel az eredeti mintából általában m = n Nehézségek a gyakorlatban: 1 x = ˆP minden modellnél más és más 2 ˆP x a sok ismétlés megterheli a számítógépet Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 15 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 16 / 22

Az i.i.d. bootstrap Az i.i.d. bootstrap korlátai Legyenek X 1, X 2,... i.i.d. valószínűségi változók, F (ismeretlen) közös eloszlással T n = t n (X n ; F) minket érdeklő val.változó, az eloszlása: G n Cél: G n eloszlásának becslése Bootstrap módszer: Adott X -re, visszatevéssel m elemű mintát veszünk: Xm = {X1,..., X m} az X i -ok közös eloszlása: F n = n 1 T m,n = t m (X m; F n ) Ismétlések Ĝm,n n δ Xi i=1 számításigényes bizonyos esetekben a becslés nem lesz konzisztens Példa (Singh, 1981) Def: {X n }n 1 m-függő valamely m 0 számra, ha {X 1,..., X k } és { X k+m+1,... } függetlenek minden k 0-ra. Jel. σm 2 = Var(X 1 ) + 2 m 1 i=1 Cov(X 1, X 1+i ) Legyen a becsülendő statisztika: T n = n(x n µ) Ennek bootstrap megfelelője: Tn,n = n(x n X n ) Tétel Legyen {X n }n 1 stacionárius m-függő v.v. sorozat, EX 1 = µ, σ 2 = Var(X 1 ) (0, ), m n=1 Cov(X 1, X 1+i ) 0 és σ 2 m 0 Ekkor lim sup P (T n n,n x) P(T n x) 0 m.m. x Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 17 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 18 / 22 Alkalmazása az összefüggő esetre Blokkméret kiválasztása (Politis & White) Circular blokk bootstrap (CBB) 1 Y t = X tmod(n) azaz periodikusan kiterjesztjük a mintát 2 Legyen i 1, i 2,... i m minta az {1,..., N} halmazon egyenletes eloszlásból 3 Adott b blokkméretre készítsünk N =mb (N N) pszeudo-megfigyelést: Y (k 1)b+j = Y im+j 1 ahol j = 1,..., b; k = 1,..., m 4 A minket érdeklő statisztika kiszámítása a pszeudo-megfigyelésekből: Y N = (N ) 1 (Y 1 +... + Y N ) Jel. F 0 = {X n : n 0}, Fk = {X n : n k} Def.: {X t : t Z } erősen keverő, ha α X (k) 0 (k ), ahol α X (k) = sup{ P(A B) P(A)P(B) : A F 0, B F k } Tétel : Tegyük fel, hogy E X t 6+δ <, k=1 k 2 (α X (k)) δ 6+δ < valamely δ>0-ra Legyen b = o(n 1/2 ), N esetén b. Ekkor MSE(σ 2 ) = G2 + D b b,x b 2 n + o(b 2 ) + o( b n ) ahol D= 4 3 g2 (0) és G = k R(k) k= g( ): spektrális sűrűségfüggvény R( ): autokovariancia függvény Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 19 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 20 / 22

Blokkméret kiválasztása (Politis & White) Hivatkozások Optimális blokkméret: b opt = [( 2G2 D )n1/3 ] Kérdés: hogyan becsüljük G-t és D-t ˆD = 4 3ĝ2 (0) Ĝ = M k= M λ( k M ) k ˆR(k) ahol ˆR(k) N k = N 1 (X i X N )(X i+ k X N ) k=1 1 ha t [1, 1/2] λ(t) = 2(1 t ) ha t [1/2, 1] 0 különben M = 2 ˆm, ahol ˆm: ahonnan a korrelogram "lényegében" 0 J.Beirlant, G. Mathys (2000) Quantile estimation for heavy-tailed data R.L. Smith (1990) Max-Stable Processes and Spatial Extremes. www.stat.unc.edu/postscript/rs/spatex.pdf Schlather, M. and Tawn, J. (2003) A dependence measure for multivariate and spatial extreme values: Properties and inference. Rootzén, H. and Tajvidi, N. (2006) The multivariate generalized Pareto distribution. Bernoulli 12, p.917-930. Rakonczai, P.: Multivariate Threshold Models with Applications to Wind Speed Data (Ph.D. dolgozat, 2012) Lahiri, S.N.: Resampling methods for dependent data (Springer, 2003) Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 21 / 22 Zempléni András (ELTE) 5. előadás, 2016. március 10 Áringadozások előadás 22 / 22