Ökonometria gyakorló feladatok - idősorok elemzése

Hasonló dokumentumok
Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Idősoros elemzés. Ferenci Tamás, január 7.

Idősoros elemzés minta

Diagnosztika és előrejelzés

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Vizsgafeladatok. 1. feladat (3+8+6=17 pont) (2014. január 7.)

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Ökonometria BSc Gyakorló feladatok a kétváltozós regresszióhoz

Ökonometria gyakorló feladatok 1.

Bevezetés az ökonometriába

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Regresszió számítás az SPSSben

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Bevezetés az ökonometriába

Ökonometria gyakorló feladatok Többváltozós regresszió

Szezonális ingadozás. (Stacionárius idősoroknál, ahol nem beszélhetünk trendről, csak a véletlen hatást kell kiszűrni. Ezzel nem foglalkozunk)

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

Statisztika II. feladatok

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Bevezetés az ökonometriába

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Idősorok elemzése előadás. Előadó: Dr. Balogh Péter

Bevezetés a Korreláció &

előadás Idősorok elemzése

Egy fertőző gyermekbetegség alakulásának modellezése és elemzése

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A többváltozós lineáris regresszió 1.

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Lineáris regressziószámítás 1. - kétváltozós eset

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika elméleti összefoglaló

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika I. 13. előadás Idősorok elemzése. Előadó: Dr. Ertsey Imre

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Esetelemzések az SPSS használatával

1.1: Egy felmérés során a BGF-ről frissen kikerült diplomások jövedelmét vizsgálták.

Ökonometriai modellek paraméterei: számítás és értelmezés

Többváltozós Regresszió-számítás

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

Logisztikus regresszió október 27.

Dr. Kalló Noémi. Termelés- és szolgáltatásmenedzsment. egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék. Dr.

Lineáris regresszió vizsgálata resampling eljárással

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

1. Ismétlés Utóbbi előadások áttekintése IV. esettanulmány Uniós országok munkanélkülisége... 1

Korreláció és lineáris regresszió

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

A modellezés sajátosságai anomáliákkal terhelt idősorok esetén

FIZIKAI KÉMIA II. házi dolgozat. Reakciókinetikai adatsor kiértékelése (numerikus mechanizmusvizsgálat)

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

AZ EURÓÁRFOLYAM VÁLTOZÁSÁNAK HATÁSA NYUGAT- MAGYARORSZÁG KERESKEDELMI SZÁLLÁSHELYEINEK SZÁLLÁSDÍJ-BEVÉTELEIRE, VENDÉGFORGALMÁRA 2000 ÉS 2010 KÖZÖTT


Egyenletek, egyenletrendszerek, egyenlőtlenségek Megoldások

6. Függvények. 1. Az alábbi függvények közül melyik szigorúan monoton növekvő a 0;1 intervallumban?

Kabos Sándor. Térben autokorrelált adatrendszerek

DIFFERENCIAEGYENLETEK

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Szezonális kiigazítás az NFSZ regisztrált álláskeresők idősorain. Készítette: Multiráció Kft.

Statisztikai módszerek a skálafüggetlen hálózatok

Correlation & Linear Regression in SPSS

Hipotézis vizsgálatok

Correlation & Linear Regression in SPSS

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Sztochasztikus kapcsolatok

függvény grafikonja milyen transzformációkkal származtatható az f0 : R R, f0(

Bevezetés a hipotézisvizsgálatokba

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Normális eloszlás tesztje

Kalkulus I. gyakorlat Fizika BSc I/1.

Feladatok MATEMATIKÁBÓL

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Matematikai statisztikai elemzések 7.

Biometria gyakorló feladatok BsC hallgatók számára

Statisztika példatár

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

illetve a n 3 illetve a 2n 5

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

A Lee-Carter módszer magyarországi

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

Termelés- és szolgáltatásmenedzsment

Likelihood, deviancia, Akaike-féle információs kritérium

Adatok statisztikai értékelésének főbb lehetőségei

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Diszkrét Matematika. zöld könyv ): XIII. fejezet: 1583, 1587, 1588, 1590, Matematikai feladatgyűjtemény II. (

1. Oldja meg a z 3 (5 + 3j) (8 + 2j) 2. Adottak az A(1,4,3), B(3,1, 1), C( 5,2,4) pontok a térben.

Átírás:

Ökonometria gyakorló feladatok - idősorok elemzése 2019. május 7. 1. Egy gazdálkodó szervezetben az átlagos készletérték alakulása negyedéves periódusokban mérve a következő: évek negyedévek 1 2 3 4 2007 308 268 257 298 2008 344 305 287 332 2009 388 342 323 372 2010 407 352 338 398 a.) Készítsen ábrát! Ennek alapján döntse el milyen módon írja föl az idősort (additív vagy multiplikatív módon)! b.) Írja föl a 2007-es és 2008-as évek 4. negyedéveihez tartozó trend értékeit mozgó átlag segítségével! c.) Analitikus trendszámítást alkalmazva arra az eredményre jutottunk, hogy a készletérték alapirányzatát erre az időszakra az y = 272, 525 + 7, 049 t lineáris trend írja le. Értelmezze a fenti függvény paraméterértékeinek jelentését! d.) Jellemezze a szezonális ingadozást, majd értelmezze a 3. negyedévi szezonális hatást! e.) Bontsa föl a 2010-es év 3. negyedévi adatot az összetevőire, és értelmezze az eredményt! f.) Készítsen előrejelzést a forgalom 2011. év 2. negyedévi értékére! 2. Egy hipermarket hálózat 1,5 literes palackos üdítőitalok forgalmát (ezer darabos egységben mérve) negyedévenkénti bontásban vizsgálták 2012. III. negyedéve és 2017. II. negyedéve között. Az alábbi tábla a IV. negyedévre vonatkozó termelési adatokat tartalmazza: Időszak forgalom (ezer darabos egységben) 2012. IV. 134,625 2013. IV. 127,65 2014. IV. 121,875 2015. IV. 115,8 2016. IV. 110,325 Analitikus trendszámítást alkalmazva arra az eredményre jutottunk, hogy a forgalom alapirányzatát erre az időszakra az y = 150, 375 0, 76875 t lineáris trend írja le. Multiplikatív modellt feltételezve határozza meg a IV. negyedéveket jellemző szezonális index becslését! 1

3. Egy multinacionális nagyvállalat magyarországi sörtermelésének (1000 hl) negyedévenkénti alakulását vizsgálták 2012. IV. negyedéve és 2017. II. negyedéve között. Az alábbi tábla a IV. negyedévre vonatkozó termelési adatokat tartalmazza: Időszak sörtermelés (1000 hl) számítási részeredmények 2012. IV. 179,5 Yt = 4010 2013. IV. 170,2 t Yt = 2726, 5 2014. IV. 162,5 t 2 = 2660 2015. IV. 154,4 t = 0 2016. IV. 147,1 Lineáris trendfüggvényt feltételezve becsülje meg a trendfüggvény együtthatóit, majd multiplikatív modellt feltételezve határozza meg a IV. negyedéveket jellemző szezonális index becslését! 4. Egy áruház forgalmának alakulása 1995 és 1998 között (millió Ft): évek negyedévek 1 2 3 4 1995 60 80 100 160 1996 70 85 95 170 1997 80 100 105 165 1998 90 105 110 180 A forgalom alapirányzatát erre az időszakra az ŷ t = 89, 4 + 1, 7 t lineáris trend írja le. Additív modellt feltételezve határozza meg és értelmezze az első negyedévre vonatkozó szezonális eltérést, majd becsülje meg az 1999. év első negyedévére, valamint az 1999-es egész évre a forgalom nagyságát! 5. A Standard and Poor 500 tőzsdeindex alakulásának napi idősorát vizsgáljuk. Első lépésként az idősort logaritmáltuk, majd a logaritmált idősorra ADF-tesztet alkalmazunk konstanssal és trenddel (1. lépés). Utána a logaritmált idősort differenciázzuk, és a differenciázott idősort is ADF teszttel vizsgáljuk, de most csak konstanssal végrehajtva a tesztet (2. lépés). Az eredmények a következők: t-statisztika p-érték 1. lépés - ADF teszt -2,267508 0.4510 Kritikus értékek 1% szig. szint -3,964618 5% szig. szint -3,413026 10% szig. szint -3,128515 2. lépés - ADF teszt -38,34108 0.0000 Kritikus értékek 1% szig. szint -3,434818 5% szig. szint -2,863401 10% szig. szint -2,567809 Írja fel a fenti tesztek alapjául szolgáló folyamatok általános alakját, a tesztek null- és ellenhipotéziseit, valamint ismertesse következtetéseit a tesztek eredményei alapján! Mit tud mondani a logaritmált idősor stacionaritásáról? 2

6. Az alábbi táblázat a lakossági fogyasztás alakulását leíró idősorra készített Dickey-Fuller próba eredményét mutatja. A tesztet konstans és trend használatával végeztük. t-statisztika p-érték ADF teszt -17,32541 0,0000 Kritikus értékek 1% szig. szint -3,970302 5% szig. szint -3,415803 10% szig. szint -3,130160 Írja fel a fenti teszt alapjául szolgáló folyamat általános alakját, a teszt null- és ellenhipotéziseit, valamint ismertesse következtetését a teszt eredménye alapján! Mit tud mondani a folyamat stacionaritásáról? 7. Az USA dollár-euro váltási árfolyamára az Y t = 1 + 0, 6 Y t 1 0, 45 Y t 2 0, 45 u t 1, t N folyamatot becsültük. A tény és becsült adatok az alábbiak szerint alakultak: Időpont tényadat becsült adat t 1,139 1,133 t 1 1,140 1,134 t 2 1,141 1,136 A modell alapján készítsen statikus előrejelzést a (t + 1)-dik időpontra! 8. A hazai postai csomagforgalom 1972-2013 közötti éves bontású Y idősorára az Y t = 2, 44 + 0, 78 Ŷt 1 + 0, 63 ˆε t 1, t = 1,..., 42 ARMA(1, 1) modellt illesztettük. Végezzen statikus előrejelzést a 2014. évi csomagforgalomra, ha a 2013. évi tényadat és becsült adat rendre 9,4 és 11,2 millió csomag! 9. A hazai postai csomagforgalom 1972-2014 közötti éves bontású Y idősorára az Y t = 2 + 0, 8 Ŷt 1 + 0, 7 ˆε t 1, t = 1,..., 43 ARMA(1, 1) modellt illesztettük. Végezzen dinamikus előrejelzést a 2016. évi csomagforgalomra, ha a 2014. évi tényadat és becsült adat rendre 7 és 8 millió csomag! 10. Tegyük fel, hogy a német márka napi árfolyamának alakulását 1986 és 1995 között az Y t = 0, 05 0, 37 Ŷt 1 0, 97 Ŷt 2 + 0, 36 ˆε t 1 + 0, 98 ˆε t 2 becsült modell írja le. Végezzen dinamikus előrejelzést 1990.07.11. pénteki árfolyamra, ha az 1990.07.09. szerdai napra a tényadat és a becsült adat rendre 9,47 és 9,07! 11. Készítsünk ex post (in sample) előrejelzést két periódusra - azaz a (t + 1) és (t + 2) időpontokra - az y t = 3 0.27 y t 1 + 0.05 y t 2 0.67 u t + 0.05 u t 1 modell alapján, ha y t = 2, 55, y t+1 = 2, 38, y t+2 = 2, 49, majd számítsuk ki az előrejelzés átlagos négyzetes hibáját (MSE) valamint átlagos abszolút százalékos hibáját (MAPE)! 3

12. Tekintsük a következő, az Egyesült Államokra vonatkozó, 1963 és 1985 közötti éves megfigyeléseket tartalmazó, legkisebb négyzetes módszerrel becsült regressziós modellt: LH = 1.4 + 3.8 LG 4.0LR, R 2 = 0.386, n = 23, DW d = 0.794, ( 4.759) (1.873) (1.229) ahol LH az új házépítések számának logaritmusa, LG a GNP logaritmusa, LR pedig a jelzálogkölcsön kamatlábának logaritmusa. A zárójelben lévő értékek a t-statisztikák. a.) Tesztelje a Durbin-Watson statisztika d értéke segítségével az elsőrendű autokorreláció jelenlétét! (Fogalmazza meg a null- és ellenhipotézist, írja fel a tesztstatisztika eloszlásának kritikus értékeit, és ismertesse döntését.) b.) Írja le lépésről lépésre, hogy hogyan alkalmazná elsőrendű-, illetve másodrendű autokorreláció jelenlétének tesztelésére a Breusch-Godfrey-tesztet! Válasza a modellre vonatkozzon! 13. Egy bizonyos sörmárka eladási adatait elemezzük havi bontásban, 2010 első és 2014 utolsó hónapja közt. Összesen 52 megfigyelés áll rendelkezésünkre. a.) Az alábbi grafikon az adatok idősorát, valamint a hosszú távú viselkedésüket leíró trendfüggvényt mutatják. Döntse el, hogy additív vagy multiplikatív modellt használna-e az idősor modellezésére! Válaszát indokolja! b.) Az alábbi két grafikon az eredeti adatsor korrelogramját és periodogramját ábrázolja. A periodogramhoz tartozó eredmények első néhány sora az alábbi táblázatban olvashatók: 4

Periodogram - beer sales - 52 obs. frequency periods spectral dens. 1 52 1.0452e+07 2 26 3.7964e+06 3 17.33 2.6682e+06 4 13 5.8674e+07 5 10.40 1.0553e+06 6 8.67 5.6627e+05 Milyen következtetéseket vonhatunk le az idősorról az ábrák és az adatok alapján? c.) Az alábbi táblázat az idősorra futtatott ADF teszt eredményét foglalja össze. Milyen következtetést vonhatunk le a futási eredményből? Augmented Dickey-Fuller test for beer_sales testing down from 10 lags, criterion AIC sample size 45 unit-root null hypothesis: a = 1 with constant and trend including 6 lags of (1-L)beer_sales model: (1 L)y = b 0 + b 1 t + (a 1) y( 1) +... + e estimated value of (a - 1): -1.67401 test statistic: τ = -7.49174 asymptotic p-value 8.326e-11 1st-order autocorrelation coeff. for e: -0.126 lagged differences: F(6, 36) = 11.086 [0.0000] d.) Legyenek { 1, ha az i. hónapban vagyunk D i = 0, egyébként i = 1,..., 12 a hónapoknak megfelelő dummy változók. A dummy változók segítségével az alábbi regressziót becsültük a trendtől megtisztított adatokra: Model: OLS, using observations 2010:01 2014:04 (T = 52) Dependent variable: detrended Coefficient Std. Error t-ratio p-value dm1 2495.04 1135.51 2.197 0.0339 dm2 3594.52 1135.51 3.166 0.0030 dm3 3945.40 1135.51 3.475 0.0012 dm4 3668.89 1135.51 3.231 0.0025 dm5 1744.57 1269.54 1.374 0.1770 dm6 867.747 1269.54 0.6835 0.4982 dm7 3093.56 1269.54 2.437 0.0194 dm8 5536.88 1269.54 4.361 0.0001 dm9 4915.70 1269.54 3.872 0.0004 dm10 2718.51 1269.54 2.141 0.0384 dm11 1126.58 1269.54 0.8874 0.3802 dm12 615.396 1269.54 0.4847 0.6305 5

Sum squared resid 2.58e+08 S.E. of regression 2539.083 R 2 0.680704 Adjusted R 2 0.592898 F (11, 40) 7.752335 P-value(F ) 5.77e 07 Milyen információkat lehet leolvasni a fenti táblázatból? Miért nem tartalmaz a fenti OLS becslés konstans tagot? e.) Az alábbi táblázat a trendtől és szezonális komponenstől megtisztított idősor ADF tesztjét mutatja. Milyen következtetést lehet leolvasni az adatokból? Augmented Dickey-Fuller test for X t testing down from 10 lags, criterion AIC sample size 45 unit-root null hypothesis: a = 1 test without constant including 6 lags of (1 L)X t model: (1 L)y = (a 1) y( 1) +... + e estimated value of (a 1): -1.35412 test statistic: τ = 5.35943 asymptotic p-value 1.283e-07 1st-order autocorrelation coeff. for e: 0.001 lagged differences: F(6, 38) = 2.878 [0.0207] f.) Az eredeti idősort a fenti eredmények függvényében determinisztikus trend és szezonális komponensek segítségével modelleztük. Az eredmények az alábbiak: Model: OLS, using observations 2010:01 2014:04 (T = 52) Dependent variable: beer_sales Coefficient Std. Error t-ratio p-value const 23566.2 1472.85 16.00 0.0000 time 147.734 23.9558 6.167 0.0000 dm1 3120.18 1728.97 1.805 0.0789 dm2 4217.71 1727.48 2.442 0.0193 dm3 4566.65 1726.32 2.645 0.0117 dm4 4288.18 1725.49 2.485 0.0173 dm5 2373.61 1825.84 1.300 0.2012 dm6 240.656 1823.79 0.1320 0.8957 dm7 2468.42 1822.06 1.355 0.1833 dm8 4913.69 1820.64 2.699 0.0102 dm9 4294.45 1819.54 2.360 0.0234 dm10 2099.22 1818.75 1.154 0.2554 dm11 509.234 1818.28 0.2801 0.7809 Sum squared resid 2.58e+08 S.E. of regression 2571.211 R 2 0.759051 Adjusted R 2 0.684913 F (12, 39) 10.23833 P-value(F ) 1.15e 08 Log-likelihood 474.6160 Akaike criterion 975.2319 Schwarz criterion 1000.598 Hannan Quinn 984.9567 ˆρ 0.601183 Durbin Watson 0.783868 6

Az adatokra a Breusch-Godfrey teszt statisztikájának számított értéke egy késleltetés esetén (T 1)R 2 2 = 51 0.361336 = 18.428. A teszt kritikus értéke χ 2 (1) = 3.84146. Milyen következtetést vonhatunk le a fenti adatokból? g.) Utolsó lépésként a Gretl segítségével felépítettük az idősor teljes becsült modelljét. A futási eredmények az alábbiak: Model: ARMAX, using observations 2010:01 2014:04 (T = 52) Dependent variable: beer_sales Coefficient Std. Error z p-value const 23141.7 1390.08 16.65 0.0000 φ 1 0.600577 0.110222 5.449 0.0000 time 152.994 36.3526 4.209 0.0000 dm1 2828.75 964.854 2.932 0.0034 dm2 3931.72 1185.82 3.316 0.0009 dm3 4286.57 1295.00 3.310 0.0009 dm4 4014.67 1353.82 2.965 0.0030 dm5 2141.10 1432.08 1.495 0.1349 dm6 488.347 1455.80 0.3354 0.7373 dm7 2717.84 1450.02 1.874 0.0609 dm8 5153.24 1419.20 3.631 0.0003 dm9 4511.32 1354.43 3.331 0.0009 dm10 2275.96 1230.64 1.849 0.0644 dm11 619.138 979.830 0.6319 0.5275 Log-likelihood 462.9171 Akaike criterion 955.8342 Schwarz criterion 985.1029 Hannan Quinn 967.0551 AR Real Imaginary Modulus Frequency Root 1 1.6651 0.0000 1.6651 0.0000 Írja fel a teljes modellt, és értelmezze a paraméterek becsült értékeit! h.) A fenti modell segítségével in sample előrejelzést készítettünk a modell eredményességének vizsgálata érdekében. Az alábbi grafion és futási eredmények segítségével jellemezze a becsült modell eredményességét! 7

Forecast evaluation statistics Mean Error 538.96 Mean Squared Error 2772.7 Root Mean Squared Error 52.656 Mean Absolute Error 2090.1 Mean Percentage Error 1.1161 Mean Absolute Percentage Error 6.7027 14. Egy bizonyos férfi ruhamárka eladási adatait elemezzük havi bontásban, 1999 januárja és 2008 decembere közt. Összesen 120 megfigyelés áll rendelkezésünkre. a.) Az alábbi grafikon az adatok idősorát, valamint a hosszú távú viselkedésüket leíró trendfüggvényt mutatják. Döntse el, hogy additív vagy multiplikatív modellt használna-e az idősor modellezésére! Válaszát indokolja! b.) Az alábbi két grafikon az eredeti adatsor korrelogramját és periodogramját ábrázolja. A periodogramhoz tartozó eredmények első néhány sora az alábbi táblázatban olvashatók: 8

Periodogram - ruha men - 120 obs. frequency periods spectral dens. 8 15.00 6.6896e+06 9 13.33 1.4941e+06 10 12.00 7.1360e+07 11 10.91 4.9685e+06 12 10.00 8.1727e+05 Milyen következtetéseket vonhatunk le az idősorról az ábrák és az adatok alapján? c.) Az alábbi táblázat az idősorra futtatott ADF teszt eredményét foglalja össze. Milyen következtetést vonhatunk le a futási eredményből? Augmented Dickey-Fuller test for men testing down from 10 lags, criterion AIC sample size 111 unit-root null hypothesis: a = 1 with constant and trend including 8 lags of (1-L)men model: (1 L)y = b 0 + b 1 t + (a 1)y( 1) +... + e estimated value of (a - 1): -2.34152 test statistic: τ = -6.16176 asymptotic p-value 4.615e-07 1st-order autocorrelation coeff. for e: -0.031 lagged differences: F(8, 100) = 2.684 [0.0103] d.) A trend és szezonális komponens becslése és eltávolítása után maradt reziduális idősor ADF tesztjének eredménye az alábbi: Augmented Dickey-Fuller test for random testing down from 10 lags, criterion AIC sample size 119 unit-root null hypothesis: a = 1 test with constant including 0 lags of (1-L)random model: (1 L)y = b 0 + (a 1)y( 1) + e estimated value of (a - 1): -0.942797 test statistic: τ = -10.2352 p-value 7.775e-15 1st-order autocorrelation coeff. for e: -0.002 Milyen következtetést vonhatunk le a futási eredményből? e.) A reziduálisok idősorára számított Durbin-Watson statisztika eredménye d = 1.764591. A teszt kritikus értékei: d L = 1.47 és d U = 1.9461. A reziduálisok idősorára számított Breusch-Godfrey teszt statisztikájának számított értéke egy késleltetés esetén (T 1)R 2 2 = 9

119 0.012387 = 1.486439. A teszt kritikus értéke χ 2 (1) = 3.84146. Milyen következtetést vonhatunk le ezen eredményekből? 15. A Ramanathan könyv DATA10-3 adatbázisa havi adatokat tartalmaz a német márka-amerikai dollár átváltási árfolyamára vonatkozóan (157 megfigyelés). a.) Az alábbi ábrákon az idősor grafikonja, valamint periodogram függvénye látható. Milyen következtetések vonhatók le ezekről? b.) Az alábbi táblázat az adatokra futtatott különböző ADF tesztek eredményeit tartalmazza. Melyik tesztet alkalmaztuk helyesen a folyamatra, és hogyan értelmezi ennek eredményét? test with constant test statistic: τ = -2.04199 asymptotic p-value 0.2689 Augmented Dickey-Fuller test for exchrate testing down from 10 lags, criterion AIC sample size 155, unit-root null hypothesis: a = 1 with constant and trend test statistic: τ = -2.21365 asymptotic p-value 0.4814 with constant, linear and quadratic trend test statistic: τ = -1.82673 asymptotic p-value 0.8758 c.) Az első differencia-sorozatra alkalmazott ADF teszt eredménye során egy regressziós becslést is kapunk a Gretl által. A kapott eredmények az alábbiak: Augmented Dickey-Fuller test for d_exchrate testing down from 10 lags, criterion AIC sample size 155 unit-root null hypothesis: a = 1 test without constant including 0 lags of (1-L)d_exchrate model: (1 L)y = (a 1) y( 1) + e estimated value of (a - 1): -0.702571 test statistic: τ = -9.3149 p-value 4.713e-34 10

Dickey-Fuller regression OLS, using observations 1973:03-1986:01 (T = 155) Dependent variable: d_d_exchrate coefficient std. error t-ratio p-value d_exchrate_1-0.702571 0.0754244-9.315 4.71e-34 A regressziós eredmények alapján írja fel a kapott modellt mind a differencia-folyamatok, mind az eredeti exchrate folyamat esetére! d.) Az előző pontban felállított modell segítségével in sample előrejelzést készítettünk az idősorra. Az előrejelzés értékelésére szolgáló mutatók értékei az alábbiak: Forecast evaluation statistics Mean Error -0.026583 Root Mean Squared Error 0.10246 Mean Absolute Error 0.084824 Mean Percentage Error -1.0401 Mean Absolute Percentage Error 2.9366 Ezen eredmények segítségével jellemezze a becsült modell eredményességét! 11

Megoldások, végeredmények 1. a.) Pozitív trend mentén a szezonális hullámzás amplitudója állandónak tekinthető, ezért célszerű additív modellt alkalmazni. b.) 0.5 268 + 257 + 298 + 344 + 0.5 305 2007.IV. : cma(4) = = 296.375 4 0.5 305 + 287 + 332 + 388 + 0.5 342 2008.IV. : cma(4) = = 332.625 4 c.) 272.525 a tengelymetszet, innen indul az idősor trendje 2007 első negyedévében, és minden negyedévben 7.049 egységgel nő a készletérték átlagos trendje. d.) Először meg kell tisztítani a trendtől az adatokat, ami additív modell esetén azt jelenti, hogy az eredeti megfigyelésekből ki kell vonni a trend becsült értékeit. Az eredmények: e.) évek negyedévek 1 2 3 4 2007 28.426-18.623-36.672-2.721 2008 36.23-9.819-34.868 3.083 2009 52.034-1.015-27.064 14.887 2010 42.838-19.211-40.26 12.691 Innen a harmadik negyedévi szezonális hatás becslése: 36.672 34.868 27.064 40.26 4 = 34.716 Ennyivel térnek el átlagos a trendtől a harmadik negyedévi adatok. 338 = } 272.525 + {{ 7.049 15 } + ( 34.716) +e }{{} t = 343.544 + e t trend szezon f.) 2011. második negyedéves adat előrejelzése: 272.525 + 7.049 18 12.167 = 387.24 2. A becsült trend értékei a megadott egyelet alapján: 148.84, 145.76, 142.69, 139.61, 136.54. A trendtől megtisztított adatok (Y/T ): 0.905, 0.876, 0.854, 0.829, 0.808. Innen a szezonbecslés átlagolással adódik: 0.854. 3. A trend becslése a kétváltozós regresszió speciális esete. 19 adatunk van, ahol a t = 0 azt jelenti, hogy a t = 0 érték az idősor középső, 10. adatához van rendelve, azaz az időtartományunk most t = 9,..., 9. A paraméterbecslések: β = α = Y β t = Y = 4010 19 = 211 t Yt 19 0 211 = 2726.5 = 1.025 t2 19 0 2660 Multiplikatív modellt használva az eredeti adatok, a becsült trend, valamint a trendtől megtisztított adatok (Y/T): 12

Időszak sörtermelés (1000 hl) trend trendmentes adat 2012. IV. 179,5 220.225 0.815 2013. IV. 170,2 216.125 0.788 2014. IV. 162,5 212.025 0.766 2015. IV. 154,4 207.925 0.743 2016. IV. 147,1 203.825 0.722 Innen a szezonális index becslése a fenti adatok átlagolásával 0.767. 4. A becsült trend (a feladatban megadott egyenletet használva), a trendmentes adat, és az 1999-es év trendbecslése: évek trend trendmentes adat 1 2 3 4 1 2 3 4 1995 91.1 92.8 94.5 96.2-31.1-12.8 5.5 63.8 1996 97.9 99.6 101.3 103-27.9-14.6-6.3 67 1997 104.7 106.4 108.1 109.8-24.7-6.4-3.1 55.2 1998 111.5 113.2 114.9 116.6-21.5-8.2-4.9 63.4 szezonális eltérések becslése -26.3-10.5-2.2 62.35 1999 118.3 120 121.7 123.4 Az 1999-es év első negyedévének becslése: 118.3 26.3 = 92. A teljes 1999-es év becslése a négy negyedév becsléseinek összegéből adódik, azaz (118.3 26.3)+(120 10.5)+(121.7 2.2)+(123.4+52.35) = 92+109.5+119.5+185.75 = 506.75. 5. 1. teszt: a konstanssal és trenddel végzett teszt feltételezése az, hogy a logaritmált idősor (y t ) lineáris trend mentén mozog, azaz általános alakja: y t = ρ + λt + αy t 1 + m a s y t s + ε t A teszt nullhipotézise az, hogy a logaritmált idősor (y t ) egységgyököt tartalmaz, azaz ρ = 1, ellenhipotézise pedig nyilván az, hogy nem tartalmaz a fenti folyamat egységgyököt. Mivel a p-érték magas (0.451), így a nullhipotézist elfogadjuk, a folyamat tehát egységgyökös. 2. teszt: a csak konstanssal végzett teszt feltételezése az, hogy a logaritmált idősor első differenciázottja ( y t ) konstans mentén fluktuál, nincs már benne trend, azaz általános alakja: y t = ρ + α y t 1 + s=1 m a s 2 y t s + ε t A teszt nullhipotézise az, hogy a logaritmált idősor első differenciázottja ( y t ) egységgyököt tartalmaz, azaz ρ = 1, ellenhipotézise pedig nyilván az, hogy nem tartalmaz a fenti folyamat egységgyököt. Mivel a p-érték alacsony (0.0000), így a nullhipotézist elutasítjuk, a folyamat tehát már stacionáriusnak tekinthető. s=1 13

6. A konstanssal és trenddel végzett teszt feltételezése az, hogy az idősor (y t ) lineáris trend mentén mozog, azaz általános alakja: y t = ρ + λt + αy t 1 + m a s y t s + ε t A teszt nullhipotézise az, hogy az idősor (y t ) egységgyököt tartalmaz, azaz ρ = 1, ellenhipotézise pedig nyilván az, hogy nem tartalmaz a fenti folyamat egységgyököt. Mivel a p-érték alacsony (0.0000), így a nullhipotézist elutasítjuk, a folyamat tehát nem egységgyökös, a benne lévő trend determinisztikus trend, azaz trendstacionárius folyamatunk van. A trend determinisztikus módon történő eltávolítása után várhatóan stacionárius folyamatunk marad (a szezonhatástól eltekintve). s=1 7. 8. 9. ŷ t+1 t = 1 + 0.6 1.139 0.45 1.14 0.45 (1.139 1.133) = 1.1677 ŷ t+1 t = 2.44 + 0.78 9.4 + 0.63 (9.4 11.2) = 8.638 ŷ t+1 t = 2 + 0.8 7 + 0.7 (7 8) = 6.9 ŷ t+2 t = 2 + 0.8 6.9 + 0.7 0 = 7.52 10. A csütörtöki napra vonatkozó becslés: ŷ t+1 t = 0.05 0.37 9.47 0.97 0 + 0.36 (9.47 9.07) + 0.98 0 = 3.3099 A pénteki napra vonatkozó becslés: ŷ t+2 t = 0.05 0.37 ( 3.3099) 0.97 9.47 + 0.36 0 + 0.98 0.4 = 7.5193 11. ŷ t+1 t = 3 0.27 2.55 + 0.05 0 0.67 0 + 0.05 0 = 2.3115 ŷ t+2 t = 3 0.27 2.3115 + 0.05 2.55 0.67 0 + 0.05 0 = 2.5034 Az előrejelzés átlagos négyzetes hibája: MSE = 0.5 [(2.3115 2.38) 2 + (2.5034 2.49) 2 ] =... Az előrejelzés átlagos abszolút százalékos hibája: [ 2.3115 2.38 MAP E = 100 0.5 + 2.38 ] 2.5034 2.49 =... 2.49 12. a.) H 0 : ρ = 0, azaz a reziduumok folyamata fehérzaj, míg H 1 : a reziduumok elsőrendben autokorreláltak, azaz e t = ρe t 1 + u t, ρ 0. A Gretl segítségével kikereshetőek a kritikus értékek. Ez 23 adat esetén d L = 1.1682 és d U = 1.5435. A számított statisztika értéke meg van adva a feladatban: d = 0.794, ami kisebb, mint d L, azaz H 0 elutasítva, a reziduumok sorozata elsőrendben autokorrelált. b.) Ld. az előadás anyagban. 14

13. a.) A grafion alapján elsősorban additív modellt javaslunk, mert a ciklusok amplitudója a trend növekedésével nem változnak. b.) Mindkettő ciklicitást mutat az idősorban. A periodogram alapján a ciklus 12 lépéses, azaz éves periódusunk van. Ez persze látszott is az idősor grafikonján szabad szemmel is, ezt a tényt igazolja a periodogram. c.) Az idősor determinisztikus trendet tartalmaz. (Nem egységgyök folyamat, mert a teszt nullhipotézisét elutasítottuk.) d.) A dummy változók a szezonalitás kezelésére szolgálnak. A bevezetett dummy változók segítségével modellünk az alábbi alakú lesz: beer_sales t = α + βt + γ }{{} 1 D 1,t +... + γ 12 D 12,t +X }{{} t trend ciklikus komponens A ciklikus komponens 12 tagja a 12 hónap egy-egy ún. azonosító változója. Pl. januári adat esetén D 1 = 1, a többi dummy értéke nulla, így γ 1 becsült értéke a januári szezonális kompnens becslését jelenti. Azaz γ 1 = 2495.04 azt jelenti, hogy a januári hónapokban az eladások ennyivel térnek el átlagosan a trend értékétől. Minden egyes γ i ezt a szezonális becslést jelöli az adott i. hónapra. Konstans azért nem kellett az OLS becslésbe, mert trendmentes adatra futtattuk a becslést, ezért speciálisan a konstans biztosan nulla, és csak így kaphattuk meg mind a 12 hónap szezonális eltérésének becslését. Ha az eredeti idősorra (beersales) akarunk egyszerre (azaz egyetlen lépésben) determinisztikus trendet és szezonális eltéréseket is becsülni, akkor már a trenden keresztül tartalmaz a modell konstans tagot, így a szezonális dummyk közül csak 11-et vehetünk be a modellbe a dummy változó csapda elkerülése végett. Hogy melyik 11- et, azaz melyik (kimaradó) hónap legyen a kontroll hónap, tetszőleges, bármelyik hónap választható erre a szerepre. e.) A tisztított adatsor már stacionáriusnak tekinthető. f.) A regresszió eredményeképpen megjelent a táblázat alján a Durbin-Watson statisztika számított értéke. Ez a trendtől és szezonális komponensetől megtisztított reziduális idősor fehérzaj voltát teszteli. Ugyanezt teszteli a feladatrész második felében megadott Breusch-Godfrey teszt is. A DW teszt eredményének értelmezéséhez szükségünk van a statisztika kritikus értékeire. Ezeket a Gretl segítségével kikereshetjük: d L = 1.003 és d U = 2.2011. Mivel d = 0.783868 < d L, így a teszt ellenhipotézise áll fenn, azaz a reziduális idősor nem fehérzaj, legalább elsőrendben autokorrelált. Ezt az állítást támasztja alá a Breusch-Godfrey próba eredménye, ahol ugyancsak azt kapjuk, hogy a számított statisztika értéke 18.428 nagyobb, mint a próba kritikus értéke 3.84146, azaz elutasítjuk a nullhipotézist, tehát a reziduálisok elsőrendben autokorreláltak. g.) ahol beer_sales t = α + βt + γ }{{} 1 D 1,t +... + γ 12 D 12,t +X }{{} t, trend ciklikus komponens X t = φ 1 X t 1 + ε t. A becsült értékek behelyettesítését és értelmezését az olvasóra bízzuk. 15

h.) A becslés szépen követi a trend és a szezonalitás által adott jellegét az idősornak. Az autoregressziós rész felel a fluktuációkért, ez is látható a grafikonon. A táblázat eredményei alapján azt mondhatjuk, hogy a becslés jól sikerült, hiszen pl. a MAPE (mean absolute percentage error) 6.7%-os információvesztést becsül, ami jónak mondható ilyen kevés rendelkezésre álló adat esetén. A négyzetes és abszolút hiba nagységrendje 10% körüli, ez is elfogadható. 14. a.) A grafion alapján elsősorban multiplikatív modellt javaslunk, mert a ciklusok amplitudója a trend növekedésével növekvő tendenciát mutatnak. b.) Mindkettő ciklicitást mutat az idősorban. A periodogram alapján a ciklus 12 lépéses, azaz éves periódusunk van. c.) Az idősor determinisztikus trendet tartalmaz. (Nem egységgyök folyamat, mert a teszt nullhipotézisét elutasítottuk.) d.) A reziduális idősor stacionáriusnak tekinthető. e.) A DW statisztika számított értéke éppen abba a tartományba esik, ahol nem tudunk dönteni a teszt alapján, így ennek eredménye alapján nem tudunk dönteni a maradékok fehérzaj voltáról. A BG teszt eredménye azonban azt mondja, hogy a reziduálisok fehérzaj folyamatot alkotnak. 15. a.) Nem stacionárius az idősor, mert hosszú távú trend jelenléte látszik az adatokon. A periodogram viszont azt mutatja, hogy nincs az idősorban ciklikus komponens. b.) Az első és a harmadik teszt alkalmazása mellett lehet érvelni. Az első esetén a nem nulla várható érték körüli fluktuációval magyarázható a teszt használata, bár ez az indoklás elég gyenge lábakon áll. A második teszt nem jó, hiszen az idősorban szemmel láthatóan nincs lineáris trend. A harmadik teszt használata a leginkább indokolt, az adatokban jól látható a kvadratikus trend jelenléte. Mind az első, mind a harmadik esetén a magas p-érték azt jelenti, hogy elfogadjuk a nullhipotézist, azaz folyamatunk egységgyököt tartalmaz. c.) Elsőként a második differencia sorozatra vonatkozó modellt tudjuk felírni, mert erről nyilatkozik a regresszió táblázata. Ennek alapján a második differencia sorozat modellje 2 y t = y t y t 1 = 0.7 y t 1 + ε t alakú. Innen az első differencia sorozat modellje y t = 0.3 y t 1 + ε t lakú, ahonnan felhasználva a y t = y t y t 1 összefüggést az y t = 1.3 y t 1 0.3 y t 2 + ε t modell adódik az eredeti exchange rate idősorra. d.) A táblázat eredményei alapján azt mondhatjuk, hogy a becslés jól sikerült, hiszen pl. MAPE (mean absolute percentage error) 2.9%-os információvesztést becsül. a 16