Id sorelemzés gyakorlat Biztosítási és pénzügyi matematika mesterszak Alkalmazott matematikus mesterszak 2017/2018 tavaszi félév

Hasonló dokumentumok
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Diagnosztika és előrejelzés

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Id sorok és többdimenziós statisztika gyakorlat Matematika alapszak, matematikai elemz szakirány 2018/2019 szi félév

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Matematikai statisztika szorgalmi feladatok

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Autoregresszív és mozgóátlag folyamatok

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Gyakorló feladatok I.

Abszolút folytonos valószín ségi változó (4. el adás)

Statisztika elméleti összefoglaló

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

DIFFERENCIAEGYENLETEK

5. előadás - Regressziószámítás

Számítógépes döntéstámogatás. Statisztikai elemzés

1. Példa. A gamma függvény és a Fubini-tétel.

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Normális eloszlás paramétereire vonatkozó próbák

KÖVETKEZTETŐ STATISZTIKA

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

GVMST22GNC Statisztika II.

Korreláció és lineáris regresszió

Többváltozós lineáris regressziós modell feltételeinek

Valószínűségszámítás összefoglaló

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Gyakorló feladatok. Agbeko Kwami Nutefe és Nagy Noémi

Leíró és matematikai statisztika gyakorlat Matematikai elemz szakirány 2015/2016 tavaszi félév

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Alkalmazott statisztika feladatok

A maximum likelihood becslésről

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

VEKTORTEREK I. VEKTORTÉR, ALTÉR, GENERÁTORRENDSZER október 15. Irodalom. További ajánlott feladatok

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Leíró és matematikai statisztika gyakorlat Matematikai elemz szakirány 2016/2017 tavaszi félév

előadás Idősorok elemzése

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Gazdasági matematika II. tanmenet

Biostatisztika VIII. Mátyus László. 19 October

1/1. Házi feladat. 1. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy

Matematika A2 vizsga mgeoldása június 4.

A mérési eredmény megadása

Diszkrét Matematika. zöld könyv ): XIII. fejezet: 1583, 1587, 1588, 1590, Matematikai feladatgyűjtemény II. (

Adatok statisztikai értékelésének főbb lehetőségei

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Bevezetés a hipotézisvizsgálatokba

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Taylor-polinomok. 1. Alapfeladatok április Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Valószínűségi változók. Várható érték és szórás

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

1.1. Feladatok. x 0 pontban! b) f(x) = 2x + 5, x 0 = 2. d) f(x) = 1 3x+4 = 1. e) f(x) = x 1. f) x 2 4x + 4 sin(x 2), x 0 = 2. általános pontban!

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószín ségszámítás és statisztika

Dr. Karácsony Zsolt. Miskolci Egyetem november

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Numerikus módszerek II. zárthelyi dolgozat, megoldások, 2014/15. I. félév, A. csoport. x 2. c = 3 5, s = 4

Mérési adatok illesztése, korreláció, regresszió

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Matematikai statisztika feladatsor

3. fejezet. Lineáris folyamatok Zaj folyamatok. 1. Az ε(t) folyamat független érték zaj, ha a várható értéke 0 és

Gazdasági matematika II. vizsgadolgozat, megoldással,

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Valószín ségszámítás és statisztika

Lineáris algebra Gyakorló feladatok

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

A Lee-Carter módszer magyarországi

Vektorok, mátrixok, lineáris egyenletrendszerek

1. Oldja meg a z 3 (5 + 3j) (8 + 2j) 2. Adottak az A(1,4,3), B(3,1, 1), C( 5,2,4) pontok a térben.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Lineáris algebra. (közgazdászoknak)

egyetemi jegyzet Meskó Balázs

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

3. Lineáris differenciálegyenletek

Matematikai statisztika gyakorlat Programtervez informatikus alapszak, A szakirány 2018/2019 tavaszi félév

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

λx f 1 (x) e λx f 2 (x) λe λx f 2 (x) + e λx f 2(x) e λx f 2 (x) Hasonlóan általában is elérhető sorműveletekkel, hogy csak f (j)

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Normális eloszlás tesztje

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Határozott integrál és alkalmazásai

Átírás:

Id sorelemzés gyakorlat Biztosítási és pénzügyi matematika mesterszak Alkalmazott matematikus mesterszak 017/018 tavaszi félév Játékszabályok A gyakorlatokról maximum 3-szor lehet hiányozni. Aki többször hiányzik, nem kap gyakjegyet. 100 + x pontot lehet szerezni a félév során: 0 pont: számolós beadandó feladatok (4 pont 5) 30 pont: számítógépes/szimulációs beadandó feladatok (15 pont ) 50 pont: ZH: V.15., É 0.79 Jánossy Lajos terem x pont: szorgalmi feladatok A ZH-n minimálisan teljesíteni kell 30 %-ot. Ha a ZH sikertelen, nem írod meg, vagy javítani szeretnél, akkor vizsgaid szak els hetén lesz lehet ség a pótzh megírására vagy a javításra. A jobbik eredményt veszem gyelembe, azaz nem lehet rontani. Két sikertelen vagy meg nem írt ZH esetén gyakuvt kell írnod, a beadandókért kapott pontok megmaradnak. GyakUV írása esetén legfeljebb -est lehet szerezni. A ZH-kon használható: számológép és egy legfeljebb A4-es méret lapra KÉZZEL írott "puska". Számolós beadandók: Mindegyik maximálisan 4 pontot ér, a legjobb 5-öt veszem gyelembe. A beadandóknál több feladatot is kihirdetek, amik közül ízlés szerint válogathattok. A beadandók célja, hogy folyamatosan tanuljatok, gyakoroljatok, ezért x határid ig lehet ket benyújtani. Számítógépes/szimulációs beadandók: kett t hirdetek ki x határid vel, mindegyikkel maximálisan 15 pontot lehet szerezni. A beadandóknál nem tilos, s t, bizonyos fokig még kívánatos is a közös munka/konzultáció hallgatótársaiddal az viszont elvárás, hogy a gondolataidat önállóan írd le! Amennyiben nyilvánvaló másolás gyanúja merül fel, az érintettek 0 pontban részesülnek. elégtelen (1) 0 34,99 elégséges () 35 49,99 Osztályozás: közepes (3) 50 64,99 jó (4) 65 79,99 jeles (5) 80 3 Infók a gyakvezet r l Név Varga László, óraadó Munkahely Morgan Stanley, Risk Management Tanszék Valószín ségelméleti és Statisztika Tanszék (ELTE TTK) E-mail vargal4@cs.elte.hu Honlap vargal4.elte.hu Ajánlott irodalom Shumway-Stoer: Time series analysis and its applications, with R examples Egy lebutított verziója ingyenesen letölthet : http://www.stat.pitt.edu/ stoffer/tsa4/tsaez.pdf Brockwell-Davis: Introduction to time series and forecasting Szimulációkhoz használt szoftver/programnyelv: R Statisztikai modellezésre, adatok elemzésére kiválóan alkalmas programnyelv Nyílt forráskódú, ma már alig van probléma, feladat, aminek a megoldására ne lenne valamilyen package akár több is Jelenleg a legelterjedtebb matematikai célú programnyelv Letöltési helye: https://cran.r-project.org/ Szövegszerkesztésre ajánlott szoftver: RStudio; letöltési helye: https://www.rstudio.com/products/rstudio/download3/ 1.) Keressük meg "kézzel" és R segítségével a legjobb (legkisebb négyzetes) becslést (a, b és c paraméterek)! Ábrázoljuk az adatpontokat és az illesztett görbét! Adatok Modell a.) x -1 1 y 1-1 y = ax + b b.) x -1 0 1 y 8 8 4 16 y = ax + bx + c c.) 1 x 0 1 y 1 3 7 y = a cos(πx) + b sin(πx) d.) x 0-1 1 1 y 1 0-1 1 a (x + y ) + b (x + y) = 1.) Olvassuk be a kerdoiv.txt fájlt, ami egy 017-es hallgató kérd íves felmérés adatait tartalmazza. A következ kre válaszoltak: nem, testmagasság (cm), súly (kg), cip méret, hányast szerzett valszámból a 017-es vizsgán, hány percet utazik az egyetemre, szorgalmi id szakban átlagosan hány órát tanul egy héten. a.) Nézzük meg pontdiagrammal néhány adatpár közti összefüggést (pl. magasság és súly, nem és cip méret, stb.)! b.) A továbbiakban célunk a testmagasság modellezése/magyarázása a többi változó segítségével. Tekintsük az alábbi regressziós modelleket: I.) Testmagasság = Testsúly + Hiba, ami a Testmagasság = a 0 + a 1 Testsúly + Hiba modell rövidített változata II.) Testsúly = Testmagasság + Hiba III.) Testmagasság = Testsúly + Lábméret + Hiba IV.) Testmagasság = Nem + Hiba Vizsgáljuk meg a korrelációs mátrixot! Keressük meg a legjobban illeszked 1

modellt! c.) Adjunk el rejelzést a legjobbnak t n modell(ek) alapján egy olyan ú hallgató testmagasságára, aki 70 kg-os, 45-ös a cip mérete, 5-öse volt valszámból, 5 percet utazik az egyetemre és heti 1 órát tanul! SZ1.) Ha sok magyarázóváltozónk van, akkor a "legjobb" lineáris regressziós modell megtalálása rendszerint nehéz feladat. Ennek automatizálására több eljárást kidolgoztak, ezek egyike található a szláv mitológia erd - és vadászistenér l elnevezett Boruta package-ben. Használd a package Boruta függvényét a kerdoiv.txt fájlban található hallgatói kérd ív adatbázis esetén a legjobb lineáris modell megtalálására dolgozd fel a következ weblap példáját: https://www.analyticsvidhya. com/blog/016/03/select-important-variables-boruta-package. Miért egy erd istenr l nevezték el a package-et? A futtatásaid reprodukálásához szükséges fájlokat küldd el az E-mail címemre! (p) SZ.) A Crime.xlsx fájl amerikai nagyvárosokra vonatkozóan tartalmaz b - nözési adatokat, az oszlopok fejléce (a változók pontos megnevezése) pedig a CrimeHeader.txt fájlban található. Olvasd be az adatokat valamilyen alkalmas módszerrel, majd az xlsx fájl 1. oszlopára (1 millió f re jutó összes jelentett b nesetek száma) próbálj meg minél jobb regressziós modellt meghatározni a többi változó segítségével! A beolvasáshoz követhet módszerek például: csv kiterjesztés fájlt csinálsz az xlsx-b l, majd használod a read.csv parancsot; letöltesz egy olyan package-et, amiben van xlsx beolvasására alkalmas parancs. A futtatásaid reprodukálásához szükséges fájlokat küldd el az E-mail címemre! Kommentekben vagy az E-mail szövegében értékeld a modellt józan paraszti ész alapján ezt vártad-e; mennyire jó a modell; van-e még olyan kimaradt változó, amit magyarázóváltozóként gyelembe kellene venni? (p) Mostantól amennyiben az adott feladat nem jelzi külön, t mindig az egész számok halmazát futja be, azaz t Z. 3.) Legyen X t véletlen bolyongás drift-tel: X t = δ + X t 1 + ε t (t = 1,,...), ahol δ valós paraméter, P (X 0 = 0) = 1 és ε t W N(0, σ ). a.) Fejezzük ki X t -t a fehér zaj folyamat segítségével! b.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! c.) Szimuláljunk egy ilyen folyamatot normális innovációk, δ = 1, 0, 1, valamint σ = 1, 5, 10 esetén, majd ábrázoljuk X t -t, a trendet és az autokorreláció függvényét! d.) Van-e olyan ϕ(x t, X t 1,...) transzformáció, amivel származtatott folyamat már stacionárius? e.) Tegyük fel, hogy a ε t fehér zaj folyamat normális eloszlású. Határozd meg a δ paraméter és a fehér zaj σ szórásnégyzet paraméterének ML-becslését az els n meggyelés, mint n elem minta alapján! Torzítatlan, illetve konzisztens a δ-ra adott becslés? 4.) Legyen X t = 1 4 ε t 1 + 1 ε t + 1 4 ε t+1 (t = 1,,...), ahol ε t fehér zaj. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Szimuláljunk egy fehér zajt, készítsük el hozzá X t -t, majd ábrázoljuk a két id sort közös diagramban! Értelmezzük a látottakat! 5.) Legyen X t = α + βt + ε t (t = 1,,...), ahol α, β valós paraméterek és ε t fehér zaj. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Van-e olyan ϕ(x t, X t 1,...) transzformáció, amivel származtatott folyamat már stacionárius? 6.) Legyen (X t ) t R = U sin(παt) + V cos(παt), ahol α valós paraméter, U és V egymástól független, 0 várható érték és τ szórású val. változók. a.) Határozzuk meg X t várható érték, autokovariancia és autokorreláció függvényét! b.) Legyen Y t = X t + ε t, ahol ε t fehér zaj. Szimuláljunk egy fehér zajt Dε t = 1,, 4, 8 esetén, készítsük el hozzá Y t -t, ha τ = és α = 1, majd ábrázoljuk X t és Y t id sorokat! Értelmezzük a látottakat! 7.) Legyen X t = sin(πut) (t = 1,,...), ahol U E(0; 1). Mutassuk meg, hogy X t folyamat gyengén stacionárius, de er sen nem stacionárius! Útmutatás az( er s stacionaritás vizsgálatához: számoljuk ki a következ két valószín séget: P X 1 < 3, X < ) ( 3 és P X < 3, X 3 < ) 3! B1.) [III.6.] Tekintsük a következ (X t ),,... folyamatot: X t = ae Xt 1 + ε t, ahol a valós paraméter, ε t normális eloszlású fehér zaj 0 várható értékkel és ismeretlen σ szórással, X 0 = x 0 R. Vezesd le az ismeretlen a paraméter ML-becslését! B.) [III.6.] Tekintsük a következ (X t ) t Z folyamatot: X t = ε t η t, ahol ε t és η t egymástól és id ben is független folyamatok, ε t fehér zaj 0 várható értékkel és σ szórással, P (η t = 0) = P (η t = ) = 1 t-re. Gyengén stacionárius az X t folyamat? Határozd meg az autokovariancia és autokorreláció függvényét! SZ3.) Legyen (X t ) t R stacionárius Gauss-folyamat (azaz minden k Z + -ra és t 1,..., t k R-re (X t1,..., X tk ) együttesen normális eloszlású) és Y t = e Xt. a.) Határozd meg az X t folyamat momentumgeneráló függvényét, azaz M Xt (s) = E(e sxt )-t! b.) Mutasd meg, hogy az Y t folyamat gyengén stacionárius! (1+1= p) SZ4.) Legyen X t = at + W t (0 t R), ahol a ismeretlen valós paraméter, W t Wiener-folyamat. Határozd meg az a paraméter ML-becslését egy azonos id közönként rendelkezésünkre álló n elem minta alapján, azaz legyen δ > 0 x, t i t i 1 = δ (i = 1,,..., n), t 0 = 0; a tapasztalati mintánk pedig x t1, x t,..., x tn

azonos id közönként "nézünk rá" a folyamatra. (p) Útmutatás: Könnyen látható, hogy X tj = X tj 1 +aδ+w tj W tj 1 (j = 1,,..., n), ebb l pedig már megállapítható az X tj X tj 1 feltételes eloszlás. 8.) Legyenek X t és Y t egymással korrelálatlan stacionárius folyamatok R X és R Y autokovariancia függvénnyel, valamint F X és F Y spektrális eloszlásfüggvénnyel. Mutassuk meg, hogy ekkor a Z t = X t + Y t folyamat autokovariancia függvényére R Z (h) = R X (h) + R Y (h) és spektrális eloszlásfüggvényére F Z (x) = F X (x) + F Y (x) teljesül minden h Z és x R esetén. 9.) Határozzuk meg a következ folyamatok spektrális s r ségfüggvényét, ha pedig nincsen, akkor a spektrális eloszlásfüggvényét: a.) fehér zaj folyamat σ szórással; b.) AR(1) folyamat: X t = αx t 1 + ε t, ahol α < 1 valós paraméter, ε t fehér zaj σ szórással; c.) MA(1) folyamat: X t = ε t + αε t 1, ahol α valós paraméter, ε t fehér zaj σ szórással; d.) X t = U sin(αt)+v cos(αt), ahol α valós paraméter, U és V egymástól független, 0 várható érték és τ szórású valószín ségi változók; e.) X t = S t + αs t D + N t, ahol S t és N t stacionárius és egymástól független folyamatok 0 várható értékkel és f S, valamint f N spektrális s r ségfüggvényekkel; D ismert pozitív egész szám; α ismeretlen valós paraméter. Tanuljunk meg ábrákról olvasni - szimuláljunk az egyes folyamatokból különböz paraméterértékek esetén, ábrázoljuk a mintát, az autokorreláció függvényt, valamint a spektrális s r ségfüggvényt (eloszlásfüggvényt)! 10.) Legyen X t = U sin ( π 3 t) + V cos ( π 3 t), ahol U és V egymástól független, 0 várható érték és τ szórású valószín ségi változók; Y t = ε t +, 5ε t 1, ahol ε t fehér zaj σ szórással; továbbá legyen Z t = X t + Y t. Határozd meg a Z t folyamat autokovariancia függvényét és a spektrális eloszlásfüggvényét! 11.) Döntsük el, hogy az alábbi egész számokon értelmezett függvények lehetnek-e egy stacionárius folyamat autokovariancia függvényei: a.) R(h) = I(h = 0); b.) R(h) = I(h = 0) 0, 5 I( h = ) 0, 5 I( h = 3); 1.) Legyen egy stacionárius folyamat spektrális s r ségfüggvénye f(x) = 1 π e x, x [ π; π]. Határozd meg a folyamat autokovariancia és autokorreláció függvényét! Útmutatás: integráljuk parciálisan az autokovariancia függvény deriváltját, majd oldjuk meg az így adódó R (h) = hr(h) dierenciálegyenletet! B3.) [III.0.] Legyen X t = N a i cos(ω i t + U i ), ahol minden i = 1,,..., N esetén ω i 0 és a i valós konstansok, U i E(0; π) függetlenek. Határozd meg az X t folyamat spektrális eloszlásfüggvényét/s r ségfüggvényét! SZ5.) Az egész számokon értelmezett R(h) = I(h = 0) + ci( h = 1) függvény a c valós paraméter mely értékei esetén lehet egy stacionárius folyamat autokovariancia függvénye? (1p) SZ6.) Legyenek X t és Y t stacionárius, egymástól független, 0 várható érték folyamatok f X és f Y spektrális s r ségfüggvényekkel, továbbá legyen Z t = X t Y t. Mutasd meg, hogy a Z t folyamat spektrális s r ségfüggvénye a következ képp számolható: f Z (x) = f X (x y)f Y (y) dy. π (p) π SZ7.) Egy stacionárius X t folyamat spektrális s r ségfüggvénye a következ : f(x) = 100 I ( π 6 0, 01 < x < π 6 + 0, 01) + 100 I ( π 6 0, 01 < x < π 6 + 0, 01). Határozd meg a folyamat lag 1 (egylépéses késleltetés ) autokorrelációját, azaz az r(1) = cor(x t, X t+1 ) mennyiséget! (p) 13.) Vizsgáljuk meg a különbség-el jel próbát! Legyen X 1,..., X n minta egy folyamatból, és legyen Z n annak a száma, ahányszor a folyamat értéke növekszik, azaz Z n = n Y i, ahol Y i = I(X i > X i 1 ), i =, 3,..., n. i= a.) Az összefügg valószín ségi változó sorozatokra vonatkozó CHT segítségével d mutassuk meg, hogy N(0; 1)! n Zn n 1 n 1 1 b.) Generálj i.i.d. sorozatot n = 10, 50, 100, 00, 500, 1000, 000 mintanagyságok esetén, majd szimulációk alapján becsüld meg az els fajú hiba valószín ségét! c.) Generálj AR(1) folyamatból; driftes véletlen bolyongásból mintákat n = 10, 50, 100, 00, 500, 1000, 000 mintanagyságok esetén, majd szimulációk alapján becsüld meg a különbség-el jel próba erejét! 14.) Tegyük fel, hogy ε t független érték zaj 0 várható értékkel és σ ε = 1 szórással. Bizonyítsuk be, hogy az alábbi folyamatoknak van stacionárius M A( ) reprezentációjuk, továbbá, hogy invertálhatók (azaz létezik AR( ) reprezentációjuk)! a.) X t = + 0, 9X t 1 + ε t b.) X t = 0, X t 1 + 0, 35X t + ε t c.) X t = 0, 5X t 1 0, 5X t + ε t d.) X t = X t 1 0, 5X t + ε t e.) X t = ε t + 0, 5ε t 1 f.) X t = 0, 5X t 1 + ε t 0, 5ε t 1. g.) X t = 0, 9X t 1 + ε t + 0, 5ε t 1. Határozzuk meg a következ ket: a stacionárius megoldás várható értéke, szórása, autokorreláció-függvénye és parciális autokorreláció-függvénye; a folyamat M A( ) reprezentációja; a folyamat spektrális s r ségfüggvénye. 3

Szimuláljunk ilyen folyamatokat R-rel! Határozzuk meg R függvények segítségével is az autokorrelációkat, parciális autokorrelációkat és ábrázoljuk a spektrális s r ségfüggvényt! 15.) Legyen X t = α 1 X t 1 + α X t + ε t, ahol ε t véges szórású i.i.d. zaj. Bizonyítsuk be, hogy a folyamatnak akkor és csak akkor van stacionárius megoldása, ha α 1 + α < 1, α α 1 < 1 és α < 1 teljesül! 16.) Egy ARMA folyamat spektrális s r ségfüggvénye a következ : f(x) = + cos x π(1,565,5 cos x+cos x). Határozd meg a folyamat rendjét és paramétereit! 17.) Generáljunk egy zérus várható érték, α 1 = 0, 5 és α = 0, 3 paraméter AR() folyamatból n = 00 elem mintákat. a.) Becsüljük vissza a minták paramétereit, majd végezzünk modelldiagnosztikát vizsgáljuk meg, mennyire jó a becslés, illetve mennyire jó a modell! b.) Játsszunk el azzal, hogy más modelleket illesztünk (például AR(1), AR(3), ARMA(1,1)), honnan vesszük észre, hogy ezek nem lesznek jók ha egyáltalán észrevesszük. c.) Vizsgáljuk meg szimulációval, hogy miként teljesít az AIC és a BIC információs kritérium a helyes rend kiválasztásában! Összehasonlításként nézzük meg az AIC/BIC értékeket, ha AR(1), AR(3), AR(4), ARMA(1,1) modelleket illesztünk a fenti AR()-b l generált mintákra! Mi történik, ha növeljük a mintaelemszámot? 18.) Elemezzük és illesszünk alkalmas ARMA modellt a 'gnp96.txt' fájlban található id sorra, ami az USA negyedéves, szezonális hatásoktól megszabadított reál (1996- os árakon számított) GNP adatait tartalmazza 1947 és 00 között. a.) Ábrázoljuk az id sort, és nézzük meg az ACF és PACF függvényét! Stacionáriusnak t nik az id sor? b.) Alkalmas transzformációval (logdierenciák képzése) és/vagy regressziós modell illesztésével próbáljuk meg stacionáriussá tenni az id sort! c.) A transzformált id sor ACF és PACF ábráinak szemrevételezése után próbáljunk meg alkalmas ARMA modellt illeszteni! AIC/BIC kritériumok alapján válasszuk ki a legjobbnak t n ARMA modellt, majd végezzünk modelldiagnosztikát (szignikánsak-e a becsült paraméterek, a reziduálisok származhatnak-e fehér zaj folyamatból)! 19.) Az el z példához hasonlóan elemezzük és illesszünk alkalmas ARMA modellt az 'astsa' package-ben lév 'gtemp' id sorra, ami 1880 és 009 között a Föld átlagh mérsékletét tartalmazza. B4.) [III.7.] Legyen X t = 0, 3X t 1 + 0, 04X t + ε t, ahol ε t fehér zaj 0 várható értékkel és σ ε szórással, 0 < µ R, t Z. a.) Van a folyamatnak stacionárius M A( ) reprezentációja? b.) Invertálható a folyamat (azaz létezik AR( ) reprezentációja)? c.) Állítsd el a folyamat M A( ) reprezentációját! (1+1+= 4p) B5.) [III.7] Egy oksági AR() folyamat esetén el fordulhat, hogy az autokorrelációk az r(1) = 1/; r() = 1/6; r(3) = 1/1 értékeket veszik fel? SZ8.) Bizonyítsd be, hogy a fordulópont próba (turning point test) próbastatisztikája eloszlásban a standard normális eloszlásoz tart, amennyiben a minta i.i.d. fehér zajból származik, azaz teljesül a nullhipotézis! (p) SZ9.) Legyen X t = 0, 4X t 1 + 0, 45X t + ε t + ε t 1 + 0, 5ε t, ahol ε t fehér zaj. Van stacionárius "megoldása" (MA reprezentációja) a folyamatnak? Ha van, akkor állítsd el! (p) SZ10.) Mutasd meg, hogy az X t = ε t + βε t 1 MA(1) folyamat parciális autokorreláció függvénye ρ k = ( β)k. (p) 1+β +...+β k SZ11.) Legyen X 1,..., X n fehér zajból származó minta. Mutasd meg, hogy a.) a Bartlett-tételben (lásd elméleti összefoglaló) szerepl W mátrix egységmátrix! b.) Készíts kondenciaintervallumot a ˆr(h), h Z empirikus autokorrelációra! (1+1= p) 0.) Legyen X 1, X,..., X n minta egy stacionárius folyamatból. n X i a.) Torzítatlan becslése a folyamat várható értékének a X n = n b.) Határozzuk meg a mintaátlag standard hibáját, azaz D(X n )-t! c.) Legyen R(h) <. Hova tart n D (X n ), ha n? h= mintaátlag? 1.) Legyen (X n ) n Z stacionárius folyamat µ várható értékkel és R(h) autokovariancia függvénnyel. Adjunk 0 < h Z lépéses legkisebb négyzetes lineáris el rejelzést X n segítségével, azaz határozzuk meg azon a és b értékeket, amikre az MSE(a, b) := E([X n+h (a + bx n )] ) minimális! Határozzuk meg az így adódó ˆX n+h = â + ˆbX n becslés szórását!.) Legyen (X n ) n Z stacionárius folyamat µ várható értékkel és R(h) autokovariancia függvénnyel. Célunk h lépéses legkisebb négyzetes lineáris el rejelzés meghatározása az els n meggyelés, X n,..., X 1 segítségével. Jelölje a legjobb lineáris el rejelzést P n X n+h := a 0 + a 1 X n +... + a n X 1. Mutassuk meg, hogy a.) a legjobb lineáris el rejelzés együtthatói kielégítik a következ egyenleteket: E(X n+h P n X n+h ) = 0 E [(X n+h P n X n+h )X n+1 j ] = 0 j = 1,..., n b.) a legjobb lineáris el rejelzés együtthatói kielégítik a következ egyenletrendszert: Γ n a n = R n (h), ahol Γ n = [R(i j)] n i,j=1 a n = (a 1,..., a n ) T R n (h) = (R(h), R(h + 1),..., R(h + n 1)) T c.) az el rejelzés P n X n+h = µ + n a i (X n+1 i µ) alakba írható, így a feladatok elején µ = 0 feltehet, majd ezzel a képlettel megkapható az el rejelzés; d.) az el rejelzés legkisebb négyzetes hibája R(0) a T n R n (h). 4

3.) Legyen X t stacionárius AR(1) folyamat 0 várható értékkel és σ szórású innovációkkal. a.) Határozzuk meg a folyamat egylépéses, majd h lépéses legkisebb négyzetes el rejelzését és adjuk meg az el rejelzés hibáját! Vessük össze a kapottakat a 1.) feladat eredményével! b.) Tegyük fel, hogy ismerjük a folyamat 1. és 3. meggyelését, de a. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X -re X 1 és X 3 segítségével, és határozzuk meg a becslés hibáját! 4.) Legyen X t stacionárius MA(1) folyamat 0 várható értékkel és σ szórású innovációkkal. Tegyük fel, hogy ismerjük a folyamat 1. és. meggyelését, de az 3. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X 3 -ra X 1 és X segítségével, és határozzuk meg a becslés hibáját! 5.) Legyen X t stacionárius AR(p) folyamat 0 várható értékkel és σ szórású innovációkkal. Határozzuk meg a folyamat egylépéses, legkisebb négyzetes el rejelzését! 6.) Legyen X t stacionárius AR(1) folyamat µ várható értékkel és σ szórású innovációkkal. Az el rejelzési operátorok tulajdonságait felhasználva, határozzuk meg a folyamat h lépéses, legkisebb négyzetes el rejelzését! 7.) A el rejelzést a 'gnp96.txt' fájlban található id sor következ 10 értékére a legjobbnak bizonyult ARMA modell alapján a.) a beépített predict függvény segítségével; b.) az el rejelzési operátorról tanultak alapján! Adjunk intervallumbecslést is az el rejelzésre! Ábrázoljuk az id sort az el rejelzésekkel együtt! 8.) Legyen X t = ε t ε t 1 MA(1) folyamat σ szórású innovációkkal. Generáljunk egy 100 elem mintát, majd adjunk legkisebb négyzetes becslést a minta 1., 13. és 14. elemére a többi mintaelem segítségével (tekintsünk úgy rájuk, mintha ezek hibásak lennének, ezért becsülni kell ket)! B6.) [IV.4] Legyen X 1, X,..., X n minta az X t = π + ε t + ε t 1 ε t 3 folyamatból, ahol ε t fehér zaj folyamat σ szórással. a.) Adj a minta els két eleme, X 1 és X segítségével h lépéses legkisebb négyzetes el rejelzést h = 1,,... esetén! Számold ki az el rejelzés hibáját! b.) Tegyük fel, hogy n = 1000. Adj a minta els két eleme és utolsó két eleme segítségével becslést X 100 -ra! (,5+1,5= 4p) SZ1.) Legyen X t AR(1) folyamat α paraméterrel és 1 szórású innovációval. Mutasd meg, hogy ekkor D (X n ) = σ n (1 α ) SZ13.) n nα α+α n+1 (1 α). (1 pont) Legyen X t stacionárius MA(1) folyamat 0 várható értékkel és σ szórású innovációkkal. Tegyük fel, hogy ismerjük a folyamat 1.,., 4. és 5. meggyelését, de a 3. meggyelés hiányzik. Adjunk legkisebb négyzetes lineáris becslést X 3 -ra X 1, X, X 4 és X 5 segítségével, és határozzuk meg a becslés hibáját! (1 pont) 9.) Legyen X t (t = 1,,...) ARCH(1) folyamat, azaz X t = σ t ε t, ahol σ t = α 0 + α 1 Xt 1 és ε t gauss-i fehér zaj. a.) Határozd meg az X t F t 1 feltételes eloszlást, ahol F t = σ(x s : s t)! b.) Számold ki X t várható értékét! c.) Határozd meg a cov(x t+h, X t ) mennyiséget, ha h > 0! d.) Mutasd meg, hogy Xt AR(1) folyamat! e.) Határozzuk meg X t szórásnégyzetét és 4. momentumát! Milyen paraméterértékek esetén léteznek ezek a mennyiségek? f.) Határozzuk meg a paraméterek momentum becslését! g.) Határozzuk meg a paraméterek ML-becslését az X 1 kezdeti érték mellett! Szimuláljunk ARCH(1) folyamatokat R-rel és az egyes feladatrészek eredményeit is vizsgáljuk meg! B7.) [V.8] Stacionárius ARCH(1) folyamat esetén számold ki a folyamat lapultságát, azaz a kurtosis=kurtosis t = E(Xt EXt)4 D 4 X t 3 mennyiséget! A paraméterek mely értéke esetén lesz a folyamat csúcsosabb a normális eloszlás csúcsosságához képest? 30.) Illesszünk megfelel GARCH modellt a(z) a.) NYSE; b.) GBP-CHF; id sorra! Vizsgáljuk meg, mennyire jó a modell! Készítsünk 99%-os kondencia intervallumot az id sor egy szakaszára! 31.) Az általános lineáris modell paraméterének legkisebb négyzetes becslését felhasználva mutasd meg, hogy az y i = ax i + b, i = 1,,..., n egyváltozós lineáris regressziós modell esetén az együtthatók legkisebb négyzetes becslése â = ( n n (x i x)(y i y) x iy i ) n x y n = ( n (x i x) x i ) n x és ˆb = y âx. 3.) Egy fagylaltárus negyedéves forgalmának alakulása (ezer gombóc): Év I. negyedév II. negyedév III. negyedév IV. negyedév 015 95 15 55 118 016 10 146 48 14 017 97 156 45 1 Jelölje az id sor elemeit (x t ),,...,1. Néhány számítási eredmény: 1 x t = 1860 1 t x t = 134 1 t = 78 1 t = 650 a.) Határozd meg a lineáris trend egyenletét és értelmezd a paramétereket! b.) Határozd meg a szezonális eltéréseket és értelmezd ket! c.) Adj pont- és intervallumbecslést a 018. évi eladási mennyiségekre (mind a 4 negyedévre)! 33.) Szabadítsuk meg az astsa package-ben lév jj (Johnson&Jonhson) 1960 és 1980 közötti negyedéves adatsort a trendt l és a szezonális hatásoktól 5

a.) hagyományos id sor-dekompozícióval; b.) az R nyelv stl parancsa (seasonal decomposition of time series by LOESS regression) segítségével. Illesszünk alkalmas ARMA modellt a reziduálisokra, majd adjunk el rejelzést az 1981-es év mind a 4 negyedévére! 34.) Legyen Y t stacionárius folyamat 0 várható értékkel és legyenek a és b valós konstansok. Ha X t = a + bt + s t + Y t, ahol s t szezonális komponens 4 periódussal, akkor mutassuk meg, hogy 4 X t = (1 B)(1 B 4 )X t folyamat stacionárius, és fejezzük ki az autokovariancia függvényét Y t folyamat R Y (h) autokovariancia függvényével! 35.) Tekintsük azt a lineáris sz r t, melynek együtthatói a i = 1 1+q, ha q i q és a i = 0, ha i > q. a.) Mutassuk meg, hogy ez a sz r torzítás nélkül átengedi az m t = c 0 +c 1 t lineáris trendet. b.) Amennyiben Z t, t Z független, 0 várható érték és σ szórású valószín ségi változók, akkor számoljuk ki az U t = 1 q+1 q i= q Z t i lineárisan megsz rt folyamat várható értékét és szórását! Mire következtethetünk ebb l nagy q esetén? 36.) Mutassuk meg, hogy az (a, a 1, a 0, a 1, a ) T = 1 9 ( 1, 4, 3, 4, 1)T együtthatókkal számolt lineáris sz r torzítás nélkül átenged minden harmadfokú polinomot, továbbá eliminálja a 3 periódusú szezonális komponenseket! B8.) [V.15] Legyen Y t = 6 + ε t 6ε t 1, ahol ε t fehér zaj 0 várható értékkel és szórással, valamint legyenek a és b valós konstansok. Ha X t = (a + bt)s t + Y t, ahol s t szezonális komponens 1 periódussal, akkor mutasd meg, hogy 1X t folyamat stacionárius, és határozd meg az autokovariancia függvényét! B9.) [V.15] Határozd meg azt az 1 + αb + βb + γb 3 alakú lineáris sz r t azaz keresd meg az alkalmas α, β, γ valós együtthatókat, amely torzítás nélkül átenged bármely lineáris trendet és minden periódusú szezonális komponenst eliminál! SZ14.) Legyen m t = p c i t i polinomiális trend, ahol 0 c i R. Számítsd ki a i=0 p m t és p+1 m t értékeket! Mire lehet ebb l következtetni? (1 pont) SZ15.) Bizonyítsd be, hogy az {a i } i Z együtthatókkal számolt lineáris sz r akkor és csak akkor enged át torzítás nélkül egy tetsz leges k fokú polinomot, ha a i = 1 és minden r = 1,,..., k esetén i r a i = 0! ( pont) i= i= 6