Id sorelemzés gyakorlat Biztosítási és pénzügyi matematika mesterszak Alkalmazott matematikus mesterszak 017/018 tavaszi félév Játékszabályok A gyakorlatokról maximum 3-szor lehet hiányozni. Aki többször hiányzik, nem kap gyakjegyet. 100 + x pontot lehet szerezni a félév során: 0 pont: számolós beadandó feladatok (4 pont 5) 30 pont: számítógépes/szimulációs beadandó feladatok (15 pont ) 50 pont: ZH: V.15., É 0.79 Jánossy Lajos terem x pont: szorgalmi feladatok A ZH-n minimálisan teljesíteni kell 30 %-ot. Ha a ZH sikertelen, nem írod meg, vagy javítani szeretnél, akkor vizsgaid szak els hetén lesz lehet ség a pótzh megírására vagy a javításra. A jobbik eredményt veszem gyelembe, azaz nem lehet rontani. Két sikertelen vagy meg nem írt ZH esetén gyakuvt kell írnod, a beadandókért kapott pontok megmaradnak. GyakUV írása esetén legfeljebb -est lehet szerezni. A ZH-kon használható: számológép és egy legfeljebb A4-es méret lapra KÉZZEL írott "puska". Számolós beadandók: Mindegyik maximálisan 4 pontot ér, a legjobb 5-öt veszem gyelembe. A beadandóknál több feladatot is kihirdetek, amik közül ízlés szerint válogathattok. A beadandók célja, hogy folyamatosan tanuljatok, gyakoroljatok, ezért x határid ig lehet ket benyújtani. Számítógépes/szimulációs beadandók: kett t hirdetek ki x határid vel, mindegyikkel maximálisan 15 pontot lehet szerezni. A beadandóknál nem tilos, s t, bizonyos fokig még kívánatos is a közös munka/konzultáció hallgatótársaiddal az viszont elvárás, hogy a gondolataidat önállóan írd le! Amennyiben nyilvánvaló másolás gyanúja merül fel, az érintettek 0 pontban részesülnek. elégtelen (1) 0 34,99 elégséges () 35 49,99 Osztályozás: közepes (3) 50 64,99 jó (4) 65 79,99 jeles (5) 80 3 Infók a gyakvezet r l Név Varga László, óraadó Munkahely Morgan Stanley, Risk Management Tanszék Valószín ségelméleti és Statisztika Tanszék (ELTE TTK) E-mail vargal4@cs.elte.hu Honlap vargal4.elte.hu Ajánlott irodalom Shumway-Stoer: Time series analysis and its applications, with R examples Egy lebutított verziója ingyenesen letölthet : http://www.stat.pitt.edu/ stoffer/tsa4/tsaez.pdf Brockwell-Davis: Introduction to time series and forecasting Szimulációkhoz használt szoftver/programnyelv: R Statisztikai modellezésre, adatok elemzésére kiválóan alkalmas programnyelv Nyílt forráskódú, ma már alig van probléma, feladat, aminek a megoldására ne lenne valamilyen package akár több is Jelenleg a legelterjedtebb matematikai célú programnyelv Letöltési helye: https://cran.r-project.org/ Szövegszerkesztésre ajánlott szoftver: RStudio; letöltési helye: https://www.rstudio.com/products/rstudio/download3/ 1.) Keressük meg "kézzel" és R segítségével a legjobb (legkisebb négyzetes) becslést (a, b és c paraméterek)! Ábrázoljuk az adatpontokat és az illesztett görbét! Adatok Modell a.) x -1 1 y 1-1 y = ax + b b.) x -1 0 1 y 8 8 4 16 y = ax + bx + c c.) 1 x 0 1 y 1 3 7 y = a cos(πx) + b sin(πx) d.) x 0-1 1 1 y 1 0-1 1 a (x + y ) + b (x + y) = 1.) Olvassuk be a kerdoiv.txt fájlt, ami egy 017-es hallgató kérd íves felmérés adatait tartalmazza. A következ kre válaszoltak: nem, testmagasság (cm), súly (kg), cip méret, hányast szerzett valszámból a 017-es vizsgán, hány percet utazik az egyetemre, szorgalmi id szakban átlagosan hány órát tanul egy héten. a.) Nézzük meg pontdiagrammal néhány adatpár közti összefüggést (pl. magasság és súly, nem és cip méret, stb.)! b.) A továbbiakban célunk a testmagasság modellezése/magyarázása a többi változó segítségével. Tekintsük az alábbi regressziós modelleket: I.) Testmagasság = Testsúly + Hiba, ami a Testmagasság = a 0 + a 1 Testsúly + Hiba modell rövidített változata II.) Testsúly = Testmagasság + Hiba III.) Testmagasság = Testsúly + Lábméret + Hiba IV.) Testmagasság = Nem + Hiba Vizsgáljuk meg a korrelációs mátrixot! Keressük meg a legjobban illeszked 1
modellt! c.) Adjunk el rejelzést a legjobbnak t n modell(ek) alapján egy olyan ú hallgató testmagasságára, aki 70 kg-os, 45-ös a cip mérete, 5-öse volt valszámból, 5 percet utazik az egyetemre és heti 1 órát tanul! SZ1.) Ha sok magyarázóváltozónk van, akkor a "legjobb" lineáris regressziós modell megtalálása rendszerint nehéz feladat. Ennek automatizálására több eljárást kidolgoztak, ezek egyike található a szláv mitológia erd - és vadászistenér l elnevezett Boruta package-ben. Használd a package Boruta függvényét a kerdoiv.txt fájlban található hallgatói kérd ív adatbázis esetén a legjobb lineáris modell megtalálására dolgozd fel a következ weblap példáját: https://www.analyticsvidhya. com/blog/016/03/select-important-variables-boruta-package. Miért egy erd istenr l nevezték el a package-et? A futtatásaid reprodukálásához szükséges fájlokat küldd el az E-mail címemre! (p) SZ.) A Crime.xlsx fájl amerikai nagyvárosokra vonatkozóan tartalmaz b - nözési adatokat, az oszlopok fejléce (a változók pontos megnevezése) pedig a CrimeHeader.txt fájlban található. Olvasd be az adatokat valamilyen alkalmas módszerrel, majd az xlsx fájl 1. oszlopára (1 millió f re jutó összes jelentett b nesetek száma) próbálj meg minél jobb regressziós modellt meghatározni a többi változó segítségével! A beolvasáshoz követhet módszerek például: csv kiterjesztés fájlt csinálsz az xlsx-b l, majd használod a read.csv parancsot; letöltesz egy olyan package-et, amiben van xlsx beolvasására alkalmas parancs. A futtatásaid reprodukálásához szükséges fájlokat küldd el az E-mail címemre! Kommentekben vagy az E-mail szövegében értékeld a modellt józan paraszti ész alapján ezt vártad-e; mennyire jó a modell; van-e még olyan kimaradt változó, amit magyarázóváltozóként gyelembe kellene venni? (p) Mostantól amennyiben az adott feladat nem jelzi külön, t mindig az egész számok halmazát futja be, azaz t Z. 3.) Legyen X t véletlen bolyongás drift-tel: X t = δ + X t 1 + ε t (t = 1,,...), ahol δ valós paraméter, P (X 0 = 0) = 1 és ε t W N(0, σ ). a.) Fejezzük ki X t -t a fehér zaj folyamat segítségével! b.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! c.) Szimuláljunk egy ilyen folyamatot normális innovációk, δ = 1, 0, 1, valamint σ = 1, 5, 10 esetén, majd ábrázoljuk X t -t, a trendet és az autokorreláció függvényét! d.) Van-e olyan ϕ(x t, X t 1,...) transzformáció, amivel származtatott folyamat már stacionárius? e.) Tegyük fel, hogy a ε t fehér zaj folyamat normális eloszlású. Határozd meg a δ paraméter és a fehér zaj σ szórásnégyzet paraméterének ML-becslését az els n meggyelés, mint n elem minta alapján! Torzítatlan, illetve konzisztens a δ-ra adott becslés? 4.) Legyen X t = 1 4 ε t 1 + 1 ε t + 1 4 ε t+1 (t = 1,,...), ahol ε t fehér zaj. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Szimuláljunk egy fehér zajt, készítsük el hozzá X t -t, majd ábrázoljuk a két id sort közös diagramban! Értelmezzük a látottakat! 5.) Legyen X t = α + βt + ε t (t = 1,,...), ahol α, β valós paraméterek és ε t fehér zaj. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Van-e olyan ϕ(x t, X t 1,...) transzformáció, amivel származtatott folyamat már stacionárius? 6.) Legyen (X t ) t R = U sin(παt) + V cos(παt), ahol α valós paraméter, U és V egymástól független, 0 várható érték és τ szórású val. változók. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Legyen Y t = X t + ε t, ahol ε t fehér zaj. Szimuláljunk egy fehér zajt Dε t = 1,, 4, 8 esetén, készítsük el hozzá Y t -t, ha τ = és α = 1, majd ábrázoljuk X t és Y t id sorokat! Értelmezzük a látottakat! 7.) Legyen X t = sin(πut) (t = 1,,...), ahol U E(0; 1). Mutassuk meg, hogy X t folyamat gyengén stacionárius, de er sen nem stacionárius! Útmutatás az( er s stacionaritás vizsgálatához: számoljuk ki a következ két valószín séget: P X 1 < 3, X < ) ( 3 és P X < 3, X 3 < ) 3! B1.) [III.6.] Tekintsük a következ (X t ),,... folyamatot: X t = ae Xt 1 + ε t, ahol a valós paraméter, ε t normális eloszlású fehér zaj 0 várható értékkel és ismeretlen σ szórással, X 0 = x 0 R. Vezesd le az ismeretlen a paraméter ML-becslését! B.) [III.6.] Tekintsük a következ (X t ) t Z folyamatot: X t = ε t η t, ahol ε t és η t egymástól és id ben is független folyamatok, ε t fehér zaj 0 várható értékkel és σ szórással, P (η t = 0) = P (η t = ) = 1 t-re. Gyengén stacionárius az X t folyamat? Határozd meg az autokovariancia és autokorreláció függvényét! SZ3.) Legyen (X t ) t R stacionárius Gauss-folyamat (azaz minden k Z + -ra és t 1,..., t k R-re (X t1,..., X tk ) együttesen normális eloszlású) és Y t = e Xt. a.) Határozd meg az X t folyamat momentumgeneráló függvényét, azaz M Xt (s) = E(e sxt )-t! b.) Mutasd meg, hogy az Y t folyamat gyengén stacionárius! (1+1= p) SZ4.) Legyen X t = at + W t (0 t R), ahol a ismeretlen valós paraméter, W t Wiener-folyamat. Határozd meg az a paraméter ML-becslését egy azonos id közönként rendelkezésünkre álló n elem minta alapján, azaz legyen δ > 0 x, t i t i 1 = δ (i = 1,,..., n), t 0 = 0; a tapasztalati mintánk pedig x t1, x t,..., x tn
azonos id közönként "nézünk rá" a folyamatra. (p) Útmutatás: Könnyen látható, hogy X tj = X tj 1 +aδ+w tj W tj 1 (j = 1,,..., n), ebb l pedig már megállapítható az X tj X tj 1 feltételes eloszlás. 8.) Legyenek X t és Y t egymással korrelálatlan stacionárius folyamatok R X és R Y autokovariancia függvénnyel, valamint F X és F Y spektrális eloszlásfüggvénnyel. Mutassuk meg, hogy ekkor a Z t = X t + Y t folyamat autokovariancia függvényére R Z (h) = R X (h) + R Y (h) és spektrális eloszlásfüggvényére F Z (x) = F X (x) + F Y (x) teljesül minden h Z és x R esetén. 9.) Határozzuk meg a következ folyamatok spektrális s r ségfüggvényét, ha pedig nincsen, akkor a spektrális eloszlásfüggvényét: a.) fehér zaj folyamat σ szórással; b.) AR(1) folyamat: X t = αx t 1 + ε t, ahol α < 1 valós paraméter, ε t fehér zaj σ szórással; c.) MA(1) folyamat: X t = ε t + αε t 1, ahol α valós paraméter, ε t fehér zaj σ szórással; d.) X t = U sin(αt)+v cos(αt), ahol α valós paraméter, U és V egymástól független, 0 várható érték és τ szórású valószín ségi változók; e.) X t = S t + αs t D + N t, ahol S t és N t stacionárius és egymástól független folyamatok 0 várható értékkel és f S, valamint f N spektrális s r ségfüggvényekkel; D ismert pozitív egész szám; α ismeretlen valós paraméter. Tanuljunk meg ábrákról olvasni - szimuláljunk az egyes folyamatokból különböz paraméterértékek esetén, ábrázoljuk a mintát, az autokorreláció függvényt, valamint a spektrális s r ségfüggvényt (eloszlásfüggvényt)! 10.) Legyen X t = U sin ( π 3 t) + V cos ( π 3 t), ahol U és V egymástól független, 0 várható érték és τ szórású valószín ségi változók; Y t = ε t +, 5ε t 1, ahol ε t fehér zaj σ szórással; továbbá legyen Z t = X t + Y t. Határozd meg a Z t folyamat autokovariancia függvényét és a spektrális eloszlásfüggvényét! 11.) Döntsük el, hogy az alábbi egész számokon értelmezett függvények lehetnek-e egy stacionárius folyamat autokovariancia függvényei: a.) R(h) = I(h = 0); b.) R(h) = I(h = 0) 0, 5 I( h = ) 0, 5 I( h = 3); 1.) Legyen egy stacionárius folyamat spektrális s r ségfüggvénye f(x) = 1 π e x, x [ π; π]. Határozd meg a folyamat autokovariancia és autokorreláció függvényét! Útmutatás: integráljuk parciálisan az autokovariancia függvény deriváltját, majd oldjuk meg az így adódó R (h) = hr(h) dierenciálegyenletet! B3.) [III.0.] Legyen X t = N a i cos(ω i t + U i ), ahol minden i = 1,,..., N esetén ω i 0 és a i valós konstansok, U i E(0; π) függetlenek. Határozd meg az X t folyamat spektrális eloszlásfüggvényét/s r ségfüggvényét! SZ5.) Az egész számokon értelmezett R(h) = I(h = 0) + ci( h = 1) függvény a c valós paraméter mely értékei esetén lehet egy stacionárius folyamat autokovariancia függvénye? (1p) SZ6.) Legyenek X t és Y t stacionárius, egymástól független, 0 várható érték folyamatok f X és f Y spektrális s r ségfüggvényekkel, továbbá legyen Z t = X t Y t. Mutasd meg, hogy a Z t folyamat spektrális s r ségfüggvénye a következ képp számolható: f Z (x) = f X (x y)f Y (y) dy. π (p) π SZ7.) Egy stacionárius X t folyamat spektrális s r ségfüggvénye a következ : f(x) = 100 I ( π 6 0, 01 < x < π 6 + 0, 01) + 100 I ( π 6 0, 01 < x < π 6 + 0, 01). Határozd meg a folyamat lag 1 (egylépéses késleltetés ) autokorrelációját, azaz az r(1) = cor(x t, X t+1 ) mennyiséget! (p) 13.) Vizsgáljuk meg a különbség-el jel próbát! Legyen X 1,..., X n minta egy folyamatból, és legyen Z n annak a száma, ahányszor a folyamat értéke növekszik, azaz Z n = n Y i, ahol Y i = I(X i > X i 1 ), i =, 3,..., n. i= a.) Az összefügg valószín ségi változó sorozatokra vonatkozó CHT segítségével d mutassuk meg, hogy N(0; 1)! n Zn n 1 n 1 1 b.) Generálj i.i.d. sorozatot n = 10, 50, 100, 00, 500, 1000, 000 mintanagyságok esetén, majd szimulációk alapján becsüld meg az els fajú hiba valószín ségét! c.) Generálj AR(1) folyamatból; driftes véletlen bolyongásból mintákat n = 10, 50, 100, 00, 500, 1000, 000 mintanagyságok esetén, majd szimulációk alapján becsüld meg a különbség-el jel próba erejét! 14.) Tegyük fel, hogy ε t független érték zaj 0 várható értékkel és σ ε = 1 szórással. Bizonyítsuk be, hogy az alábbi folyamatoknak van stacionárius M A( ) reprezentációjuk, továbbá, hogy invertálhatók (azaz létezik AR( ) reprezentációjuk)! a.) X t = + 0, 9X t 1 + ε t b.) X t = 0, X t 1 + 0, 35X t + ε t c.) X t = 0, 5X t 1 0, 5X t + ε t d.) X t = X t 1 0, 5X t + ε t e.) X t = ε t + 0, 5ε t 1 f.) X t = 0, 5X t 1 + ε t 0, 5ε t 1. g.) X t = 0, 9X t 1 + ε t + 0, 5ε t 1. Határozzuk meg a következ ket: a stacionárius megoldás várható értéke, szórása, autokorreláció-függvénye és parciális autokorreláció-függvénye; a folyamat M A( ) reprezentációja; a folyamat spektrális s r ségfüggvénye. 3
Szimuláljunk ilyen folyamatokat R-rel! Határozzuk meg R függvények segítségével is az autokorrelációkat, parciális autokorrelációkat és ábrázoljuk a spektrális s r ségfüggvényt! 15.) Legyen X t = α 1 X t 1 + α X t + ε t, ahol ε t véges szórású i.i.d. zaj. Bizonyítsuk be, hogy a folyamatnak akkor és csak akkor van stacionárius megoldása, ha α 1 + α < 1, α α 1 < 1 és α < 1 teljesül! 16.) Egy ARMA folyamat spektrális s r ségfüggvénye a következ : f(x) = + cos x π(1,565,5 cos x+cos x). Határozd meg a folyamat rendjét és paramétereit! 17.) Generáljunk egy zérus várható érték, α 1 = 0, 5 és α = 0, 3 paraméter AR() folyamatból n = 00 elem mintákat. a.) Becsüljük vissza a minták paramétereit, majd végezzünk modelldiagnosztikát vizsgáljuk meg, mennyire jó a becslés, illetve mennyire jó a modell! b.) Játsszunk el azzal, hogy más modelleket illesztünk (például AR(1), AR(3), ARMA(1,1)), honnan vesszük észre, hogy ezek nem lesznek jók ha egyáltalán észrevesszük. c.) Vizsgáljuk meg szimulációval, hogy miként teljesít az AIC és a BIC információs kritérium a helyes rend kiválasztásában! Összehasonlításként nézzük meg az AIC/BIC értékeket, ha AR(1), AR(3), AR(4), ARMA(1,1) modelleket illesztünk a fenti AR()-b l generált mintákra! Mi történik, ha növeljük a mintaelemszámot? 18.) Elemezzük és illesszünk alkalmas ARMA modellt a 'gnp96.txt' fájlban található id sorra, ami az USA negyedéves, szezonális hatásoktól megszabadított reál (1996- os árakon számított) GNP adatait tartalmazza 1947 és 00 között. a.) Ábrázoljuk az id sort, és nézzük meg az ACF és PACF függvényét! Stacionáriusnak t nik az id sor? b.) Alkalmas transzformációval (logdierenciák képzése) és/vagy regressziós modell illesztésével próbáljuk meg stacionáriussá tenni az id sort! c.) A transzformált id sor ACF és PACF ábráinak szemrevételezése után próbáljunk meg alkalmas ARMA modellt illeszteni! AIC/BIC kritériumok alapján válasszuk ki a legjobbnak t n ARMA modellt, majd végezzünk modelldiagnosztikát (szignikánsak-e a becsült paraméterek, a reziduálisok származhatnak-e fehér zaj folyamatból)! 19.) Az el z példához hasonlóan elemezzük és illesszünk alkalmas ARMA modellt az 'astsa' package-ben lév 'gtemp' id sorra, ami 1880 és 009 között a Föld átlagh mérsékletét tartalmazza. B4.) [III.7.] Legyen X t = 0, 3X t 1 + 0, 04X t + ε t, ahol ε t fehér zaj 0 várható értékkel és σ ε szórással, 0 < µ R, t Z. a.) Van a folyamatnak stacionárius M A( ) reprezentációja? b.) Invertálható a folyamat (azaz létezik AR( ) reprezentációja)? c.) Állítsd el a folyamat M A( ) reprezentációját! (1+1+= 4p) B5.) [III.7] Egy oksági AR() folyamat esetén el fordulhat, hogy az autokorrelációk az r(1) = 1/; r() = 1/6; r(3) = 1/1 értékeket veszik fel? SZ8.) Bizonyítsd be, hogy a fordulópont próba (turning point test) próbastatisztikája eloszlásban a standard normális eloszlásoz tart, amennyiben a minta i.i.d. fehér zajból származik, azaz teljesül a nullhipotézis! (p) SZ9.) Legyen X t = 0, 4X t 1 + 0, 45X t + ε t + ε t 1 + 0, 5ε t, ahol ε t fehér zaj. Van stacionárius "megoldása" (MA reprezentációja) a folyamatnak? Ha van, akkor állítsd el! (p) SZ10.) Mutasd meg, hogy az X t = ε t + βε t 1 MA(1) folyamat parciális autokorreláció függvénye ρ k = ( β)k. (p) 1+β +...+β k SZ11.) Legyen X 1,..., X n fehér zajból származó minta. Mutasd meg, hogy a.) a Bartlett-tételben (lásd elméleti összefoglaló) szerepl W mátrix egységmátrix! b.) Készíts kondenciaintervallumot a ˆr(h), h Z empirikus autokorrelációra! (1+1= p) 0.) Legyen X 1, X,..., X n minta egy stacionárius folyamatból. n X i a.) Torzítatlan becslése a folyamat várható értékének a X n = n b.) Határozzuk meg a mintaátlag standard hibáját, azaz D(X n )-t! c.) Legyen R(h) <. Hova tart n D (X n ), ha n? h= mintaátlag? 1.) Legyen (X n ) n Z stacionárius folyamat µ várható értékkel és R(h) autokovariancia függvénnyel. Adjunk 0 < h Z lépéses legkisebb négyzetes lineáris el rejelzést X n segítségével, azaz határozzuk meg azon a és b értékeket, amikre az MSE(a, b) := E([X n+h (a + bx n )] ) minimális! Határozzuk meg az így adódó ˆX n+h = â + ˆbX n becslés szórását!.) Legyen (X n ) n Z stacionárius folyamat µ várható értékkel és R(h) autokovariancia függvénnyel. Célunk h lépéses legkisebb négyzetes lineáris el rejelzés meghatározása az els n meggyelés, X n,..., X 1 segítségével. Jelölje a legjobb lineáris el rejelzést P n X n+h := a 0 + a 1 X n +... + a n X 1. Mutassuk meg, hogy a.) a legjobb lineáris el rejelzés együtthatói kielégítik a következ egyenleteket: E(X n+h P n X n+h ) = 0 E [(X n+h P n X n+h )X n+1 j ] = 0 j = 1,..., n b.) a legjobb lineáris el rejelzés együtthatói kielégítik a következ egyenletrendszert: Γ n a n = R n (h), ahol Γ n = [R(i j)] n i,j=1 a n = (a 1,..., a n ) T R n (h) = (R(h), R(h + 1),..., R(h + n 1)) T c.) az el rejelzés P n X n+h = µ + n a i (X n+1 i µ) alakba írható, így a feladatok elején µ = 0 feltehet, majd ezzel a képlettel megkapható az el rejelzés; d.) az el rejelzés legkisebb négyzetes hibája R(0) a T n R n (h). 4
3.) Legyen X t stacionárius AR(1) folyamat 0 várható értékkel és σ szórású innovációkkal. a.) Határozzuk meg a folyamat egylépéses, majd h lépéses legkisebb négyzetes el rejelzését és adjuk meg az el rejelzés hibáját! Vessük össze a kapottakat a 1.) feladat eredményével! b.) Tegyük fel, hogy ismerjük a folyamat 1. és 3. meggyelését, de a. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X -re X 1 és X 3 segítségével, és határozzuk meg a becslés hibáját! 4.) Legyen X t stacionárius MA(1) folyamat 0 várható értékkel és σ szórású innovációkkal. Tegyük fel, hogy ismerjük a folyamat 1. és. meggyelését, de az 3. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X 3 -ra X 1 és X segítségével, és határozzuk meg a becslés hibáját! 5.) Legyen X t stacionárius AR(p) folyamat 0 várható értékkel és σ szórású innovációkkal. Határozzuk meg a folyamat egylépéses, legkisebb négyzetes el rejelzését! 6.) Legyen X t stacionárius AR(1) folyamat µ várható értékkel és σ szórású innovációkkal. Az el rejelzési operátorok tulajdonságait felhasználva, határozzuk meg a folyamat h lépéses, legkisebb négyzetes el rejelzését! 7.) A el rejelzést a 'gnp96.txt' fájlban található id sor következ 10 értékére a legjobbnak bizonyult ARMA modell alapján a.) a beépített predict függvény segítségével; b.) az el rejelzési operátorról tanultak alapján! Adjunk intervallumbecslést is az el rejelzésre! Ábrázoljuk az id sort az el rejelzésekkel együtt! 8.) Legyen X t = ε t ε t 1 MA(1) folyamat σ szórású innovációkkal. Generáljunk egy 100 elem mintát, majd adjunk legkisebb négyzetes becslést a minta 1., 13. és 14. elemére a többi mintaelem segítségével (tekintsünk úgy rájuk, mintha ezek hibásak lennének, ezért becsülni kell ket)! B6.) [IV.4] Legyen X 1, X,..., X n minta az X t = π + ε t + ε t 1 ε t 3 folyamatból, ahol ε t fehér zaj folyamat σ szórással. a.) Adj a minta els két eleme, X 1 és X segítségével h lépéses legkisebb négyzetes el rejelzést h = 1,,... esetén! Számold ki az el rejelzés hibáját! b.) Tegyük fel, hogy n = 1000. Adj a minta els két eleme és utolsó két eleme segítségével becslést X 100 -ra! (,5+1,5= 4p) SZ1.) Legyen X t AR(1) folyamat α paraméterrel és 1 szórású innovációval. Mutasd meg, hogy ekkor D (X n ) = σ n (1 α ) SZ13.) n nα α+α n+1 (1 α). (1 pont) Legyen X t stacionárius MA(1) folyamat 0 várható értékkel és σ szórású innovációkkal. Tegyük fel, hogy ismerjük a folyamat 1.,., 4. és 5. meggyelését, de a 3. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X 3 -ra X 1, X, X 4 és X 5 segítségével, és határozzuk meg a becslés hibáját! (1 pont) 9.) Legyen X t (t = 1,,...) ARCH(1) folyamat, azaz X t = σ t ε t, ahol σ t = α 0 + α 1 Xt 1 és ε t gauss-i fehér zaj. a.) Határozd meg az X t F t 1 feltételes eloszlást, ahol F t = σ(x s : s t)! b.) Számold ki X t várható értékét! c.) Határozd meg a cov(x t+h, X t ) mennyiséget, ha h > 0! d.) Mutasd meg, hogy Xt AR(1) folyamat! e.) Határozzuk meg X t szórásnégyzetét és 4. momentumát! Milyen paraméterértékek esetén léteznek ezek a mennyiségek? f.) Határozzuk meg a paraméterek momentum becslését! g.) Határozzuk meg a paraméterek ML-becslését az X 1 kezdeti érték mellett! Szimuláljunk ARCH(1) folyamatokat R-rel és az egyes feladatrészek eredményeit is vizsgáljuk meg! B7.) [V.8] Stacionárius ARCH(1) folyamat esetén számold ki a folyamat lapultságát, azaz a kurtosis=kurtosis t = E(Xt EXt)4 D 4 X t 3 mennyiséget! A paraméterek mely értéke esetén lesz a folyamat csúcsosabb a normális eloszlás csúcsosságához képest? 30.) Illesszünk megfelel GARCH modellt a(z) a.) NYSE; b.) GBP-CHF; id sorra! Vizsgáljuk meg, mennyire jó a modell! Készítsünk 99%-os kondencia intervallumot az id sor egy szakaszára! 31.) Az általános lineáris modell paraméterének legkisebb négyzetes becslését felhasználva mutasd meg, hogy az y i = ax i + b, i = 1,,..., n egyváltozós lineáris regressziós modell esetén az együtthatók legkisebb négyzetes becslése â = ( n n (x i x)(y i y) x iy i ) n x y n = ( n (x i x) x i ) n x és ˆb = y âx. 3.) Egy fagylaltárus negyedéves forgalmának alakulása (ezer gombóc): Év I. negyedév II. negyedév III. negyedév IV. negyedév 015 95 15 55 118 016 10 146 48 14 017 97 156 45 1 Jelölje az id sor elemeit (x t ),,...,1. Néhány számítási eredmény: 1 x t = 1860 1 t x t = 134 1 t = 78 1 t = 650 a.) Határozd meg a lineáris trend egyenletét és értelmezd a paramétereket! b.) Határozd meg a szezonális eltéréseket és értelmezd ket! c.) Adj pont- és intervallumbecslést a 018. évi eladási mennyiségekre (mind a 4 negyedévre)! 33.) Szabadítsuk meg az astsa package-ben lév jj (Johnson&Jonhson) 1960 és 1980 közötti negyedéves adatsort a trendt l és a szezonális hatásoktól 5
a.) hagyományos id sor-dekompozícióval; b.) az R nyelv stl parancsa (seasonal decomposition of time series by LOESS regression) segítségével. Illesszünk alkalmas ARMA modellt a reziduálisokra, majd adjunk el rejelzést az 1981-es év mind a 4 negyedévére! 34.) Legyen Y t stacionárius folyamat 0 várható értékkel és legyenek a és b valós konstansok. Ha X t = a + bt + s t + Y t, ahol s t szezonális komponens 4 periódussal, akkor mutassuk meg, hogy 4 X t = (1 B)(1 B 4 )X t folyamat stacionárius, és fejezzük ki az autokovariancia függvényét Y t folyamat R Y (h) autokovariancia függvényével! 35.) Tekintsük azt a lineáris sz r t, melynek együtthatói a i = 1 1+q, ha q i q és a i = 0, ha i > q. a.) Mutassuk meg, hogy ez a sz r torzítás nélkül átengedi az m t = c 0 +c 1 t lineáris trendet. b.) Amennyiben Z t, t Z független, 0 várható érték és σ szórású valószín ségi változók, akkor számoljuk ki az U t = 1 q+1 q i= q Z t i lineárisan megsz rt folyamat várható értékét és szórását! Mire következtethetünk ebb l nagy q esetén? 36.) Mutassuk meg, hogy az (a, a 1, a 0, a 1, a ) T = 1 9 ( 1, 4, 3, 4, 1)T együtthatókkal számolt lineáris sz r torzítás nélkül átenged minden harmadfokú polinomot, továbbá eliminálja a 3 periódusú szezonális komponenseket! B8.) [V.15] Legyen Y t = 6 + ε t 6ε t 1, ahol ε t fehér zaj 0 várható értékkel és szórással, valamint legyenek a és b valós konstansok. Ha X t = (a + bt)s t + Y t, ahol s t szezonális komponens 1 periódussal, akkor mutasd meg, hogy 1X t folyamat stacionárius, és határozd meg az autokovariancia függvényét! B9.) [V.15] Határozd meg azt az 1 + αb + βb + γb 3 alakú lineáris sz r t azaz keresd meg az alkalmas α, β, γ valós együtthatókat, amely torzítás nélkül átenged bármely lineáris trendet és minden periódusú szezonális komponenst eliminál! SZ14.) Legyen m t = p c i t i polinomiális trend, ahol 0 c i R. Számítsd ki a i=0 p m t és p+1 m t értékeket! Mire lehet ebb l következtetni? (1 pont) SZ15.) Bizonyítsd be, hogy az {a i } i Z együtthatókkal számolt lineáris sz r akkor és csak akkor enged át torzítás nélkül egy tetsz leges k fokú polinomot, ha a i = 1 és minden r = 1,,..., k esetén i r a i = 0! ( pont) i= i= 6