Matematikai statisztika. elıadás, 9.5.. Továbblépés Ha nem fogadható el a reziduálisok korrelálatlansága: Lehetnek fel nem tárt periódusok De más kapcsolat is fennmaradhat az egymáshoz közeli megfigyelések között (pl. idıjárási adatok, eltérés a sokévi átlagtól). -....... Kapcsolat van x_t és x_(t+) között 5 5 Általános, lineáris modell Autoregressziós folyamatok (AR) X t = a X t- +a X t- + a X t- + + a p X t-p +ε t Stacionárius, ha az -(a s+a s + + a p s p )= egyenlet gyökei az egységkörön kívül helyezkednek el Mozgóátlag folyamatok (MA) X t = b ε t + b ε t- +b ε t- + b ε t- + + b q ε t-q Mindig stacionárius Kombináció: ARMA folyamatok Példák Fehérzaj-folyamat: korrelálatlan, azonos eloszlású valószínőségi változók Spec.: Gauss-fehér zaj: független, azonos, normális eloszlású változók Állítás. A végtelen mozgóátlag folyamatnál, ha a b +b +b + + b q +... sor abszolút konvergens és D (ε t )<, akkor X t valószínőséggel véges. Tétel. Ha ε t fehérzaj, és az A(s)= -a s-a s -...- a p s p polinom gyökei az egységkörön kívül helyezkednek el, akkor van X t = a X t- +a X t- + a X t- + + a p X t-p +ε t stacionárius folyamat. szimulált adatok:ar,.,. szimulált adatok:ma,.,. Jellemzık Autokovariancia: cov(x t,x t+k ). Parciális autokovariancia cov(x t,x t+k X t+,,x t+k- ). Ezek pozitív definit függvények! Autokorreláció: r k Például MA() folyamatra: r = b b / (b +b ), r k =, ha k>. AR() folyamatra: r k = a k, ρ k = (parciális autokorreláció) MA() folyamatra ρ...... -....... 5 5 5 szimulált adatok:arma(),.,............. 5 5 5 szimulált adatok:arma(),.,.,.,. 5 5 5 5 5 5
. -............ szimulált adatok:ar,.,. 5 5 5 szimulált adatok:arma(),.,. 5 5 5............ szimulált adatok:ma,.,. 5 5 5 szimulált adatok:arma(),.,.,.,. 5 5 5 - Példa Line Plot (PALMER.STA 5v*c) Adatsor: meteorológiai aszály-index havi adatai (PBudapest) -99 pontos mozgóátlag-simítás Plot of variable: pt.mov.aver. Cases: through 9 pontos mozgóátlag-simítás Plot of variable: pt.mov.aver. Cases: 7 through - - - - - 5 7 9-5 7 9 9 pontos mozgóátlag-simítás Plot of variable: 9 pt.mov.aver. Cases: 9 through 7 A trend kiszőrése Plot of variable: x-.+.9*t Cases: through - - - - - - - - 5 7 9-5 7 9
Autokorrelációk Autocorrelation Function (Standard errors are white-noise estimates) Corr. S.E. Q p +.9.75.. +.55.75.. +.75.75 9.. +.7.75.. 5 +..75 9.. +.5.7 9.. 7 +.5.7 59.. +.5.7 5.. 9 +..7 579.. +..7 5.. +.5.7 5.. +..7 7.. +.9.7.. +.5.7.. 5 +..7 97... -. -.5..5 Parciális autokorrelációk Partial Autocorrelation Function (Standard errors assume AR order of k-) Corr. S.E. +.9.75 -..75 -..75 +.7.75 5 +.9.75 +..75 7 -.5.75 +..75 9 +..75 +..75 -..75 +..75 +..75 -..75 5 -..75 -. -.5..5. A folyamat paramétereinek becslése Várható érték: mintaátlaggal Autokovariancia: korrigált tapasztalati autokovarianciával AR együtthatók: Yule-Walker egyenletrendszerbıl Vizsgálandó az illesztett folyamat rendje is. A várható érték-becslés tulajdonságai Torzítatlan Konzisztenciához az autokorrelációk kellıen gyors lecsengése kell. Modell-illesztés. modell: AR(). paraméter fontos. paraméter nem szign. modell: MA nem ad stacionér megoldást Azaz: AR() a megfelelı Param. Std.Err. p().975.75 p()-..759 Param. Std.Err. p().99. Extrém-érték elemzés Klasszikus módszerek: évi maximumon alapulnak Küszöb feletti értékek elemzése: adott szintet meghaladó minden árvízbıl használ adatot. Többdimenziós módszerek: a közeli mérıállomások összefüggıségét is vizsgálja (extrémumok együttes viselkedése)
Extrém-érték eloszlások Legyenek X, X,,X n független, azonos eloszlású valószínőségi változók. Ha vannak a n, b n normáló konstansok, hogy [max(x, X,, X n )-a n ]/ b n nemelfajuló határeloszláshoz közelít, akkor ez a határeloszlás szükségképpen max-stabilis vagy úgynevezett extrém-érték eloszlás. Extrém-érték eloszlások karakterizációja Normalizált maximumok lehetséges határeloszlásai: α Frechet: Fα ( x) = exp( x ) (x>) α pozitív parameter. α Weibull: F ( x) = exp( ( x) ) (x<) α Gumbel: F( x) = exp( exp( x)) Megjegyzések Bizonyítás technikai, az eloszlásfüggvény és a maximum mővelet kapcsolatán alapul. Az adódó függvényegyenletnek ez a megoldása van. Az eredmények hasonlóak a stabilis eloszlások karakterisztikus függvényeihez. Érdekes kérdés: adott F eloszlásfügvény esetén melyik határeloszláshoz konvergál az F eloszlású minta normalizált maximuma? Nem minden esetben lehet normálni: diszkrét eloszlásokra oszcillálhat a maximum eloszlása. A normálhatóság feltétele Folytonos eloszlásokra az eloszlásfüggvény reguláris viselkedése szükséges a felsı végpont közelében (teljesül minden fontos eloszlásra): F az α paraméterő Fréchet eloszlás max-vonzási tartományához tartozik (F MDA(F α )), akkor és csak akkor, ha -F~x -α L(x) (L lassú változású függvény: L(tx)/L(x) ha x ) F MDA(W α )), akkor és csak akkor, ha x F < és -F(x F /x) ~x -α L(x) A Gumbel MDA jellemzése bonyolultabb, lényegében az exponenciális lecsengéső eloszlások tartoznak ide (példa: exponenciális, normális). Általánosított extrém-érték (GEV) eloszlás ha G z µ ( z) = exp + σ µ, σ, µ + z >. σ / (Lokációs és skála paramétert is tartalmazó modell.) Visszatérési szintek σ GEV p-kvantilise: z p = µ ( yp ), ha µ σ log y p, ha =, ahol y p = log( p), G ( z p) =. ẑ p az az árvíznagyság, amelyet átlagosan /p évente egyszer halad meg az éves maximális árvíz. Annak valószínősége, hogy /p évnél elıbb megjelenik, nagyobb ½-nél! Ha µ, σ, p ˆ<, akkor az eloszlás becsült felsı végpontja z =µ σ ˆ ˆ / ˆ. ˆ
Az idıszak elején érvényes GEV eloszlás sőrőségf üggv ény e Az idıszak végén érvényes GEV eloszlás sőrőségf üggv ény e Visszatérési szint-görbe z p t ábrázoljuk log(-p) vel szemben, logaritmikus skálán. Lineáris, ha =, σ konvex, határértéke µ ha < konkáv, ha > Folytonos: =. pontozott: = -. return level 5 5 Illeszkedésvizsgálat Klasszikus tesztek Kolmogorov-Szmirnov Chi-négyzet A mi céljainknak jobban megfelelı: Anderson-Darling teszt ( Fn ( x) F( x)) A = df( x) F( x)( F( x)) ahol F az illesztett eloszlás, F n pedig a tapasztalati eloszlásfügvény. Kiszámítása: A = n n i= (i )(log z + log( z n+ i ahol z i =F(X i (n) ); X i (n) a rendezett minta i-edik eleme. i )) / n 5 5 5 r e tu r n p e r i o d (y e a r s ) Eloszlás illesztésének grafikus vizsgálata Normális eloszlás illesztése QQ plot Alkalmazás: vízhozam adatainak elemzése...... Megfigyelt értékek Tapasztalati eloszlás m/s GEV eloszlás skála: 7.5 eltolás: 7.7 alak: -. paraméterekkel QQ-plot relatív gyakoriság e+ e e Hisztogram 5.5 5.5 5 5 5 5 Megfigyelt értékek Normális elo. Illesztett eloszlás m/s Megfigyelések m/s QQ plot: az illesztett és a megfigyelt eloszlás kvantiliseinek ábrázolása k ( n) G, X k : k =,,..., n n+ Visszatérési szintek Idıben lineárisan változó skálaparaméter A visszatérési szintek grafikonja Idıfüggı hisztogram Visszatérési szint (m/s) 5 relatív gyakoriság e+ e e e 5 5 5 Visszatérési idı (év) Megfigyelések (m/s) A skálaparaméter idıfüggése nem volt szignifikáns 5