2018. november 28.
A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának tesztelése, előrejelzés a mintán belül és kívül, majd ezek elemzése, értékelése.
Modellszelekciós kritériumok az ARMA modellekben......avagy az illeszkedés jóságának a tesztelése. A leggyakrabban használt kritériumok: Akaike-féle információs kritérium AIC = n log ESS n p + 2p Bayes-i (Schwartz-féle) információs kritérium BIC = n log ESS + p log n, n p ahol n a mintanagyság, p a becsült paraméterek száma, ESS pedig a szokásos becslési hibákból származó négyzetösszeg. Több ARMA modell közül azt választjuk, melyre a fenti kritériumok a legkisebbek. Kontrollálnak arra, hogy több paraméterrel "látszólag" jobb illeszkedést kapjunk.
REZIDUUMOK VIZSGÁLATA
Diagnosztika - reziduumok vizsgálata Modellünk akkor tekinthető jónak, - legyen az regressziós vagy idősoros modell, - ha a becslések és illesztések után a maradéktagok sorozata már fehérzajnak tekinthető. Ugyanis ha ez nem teljesül, akkor maradt még olyan információ a folyamatban, amit kinyerhettünk volna, tehát modellünk nem jól írja le az adatgeneráló folyamatot. Emlékezzünk arra, mi is pontosan a fehérzaj folyamat definíciója. Definíció 1. Az (ε t ), t Z v.v-sorozatot fehérzajnak nevezzük, ha E(ε t ) = 0, D 2 (ε t ) = σ 2 t, és Cov(ε t, ε s ) = 0, ha t s. Azaz korrelálatlan, azonos eloszlásból származó sorozat nulla várható értékkel és konstans (véges) szórással.
Diagnosztika - fehérzaj Normális eloszlású fehérzaj folyamat - trendmentes, időfüggetlen, stacionárius sorozat
Diagnosztika - fehérzaj Ljung-Box Q-statisztika értéke Q = 0, 00929, (p = 0, 923), azaz elfogadjuk azt a hipotézist, hogy a folyamat fehérzaj.
Diagnosztika - fehérzaj Véletlen szóródás, nincs periodikus komponens benne.
Diagnosztika - hibatag autokorrelációjának tesztelése Fehérzaj vs. AR(1)
Diagnosztika - hibatag autokorrelációjának tesztelése Fehérzaj ACF és PACF függvénye
Diagnosztika - hibatag autokorrelációjának tesztelése AR(1) ACF és PACF függvénye
Durbin-Watson próba Az elsőrendű autokorreláció tesztelésére szolgáló próba. Tegyük fel, hogy az (u t ) eltérésváltozó elsőrendben autokorrelált, azaz u t = ρu t 1 + ε t, ρ < 1. Ekkor a Durbin-Watson statisztika nt=2 (û t û t 1 ) 2 d = nt=1 ût 2 [0, 4]. Megmutatható, hogy ha d = 2 ρ = 0, azaz a folyamat fehérzaj 0 < d < 2 ρ > 0, azaz a folyamat pozitívan autokorrelált, 2 < d < 4 ρ < 0, azaz a folyamat negatívan autokorrelált.
Durbin-Watson próba A teszt hipotézisei: H 0 : ρ = 0, H 1 : ρ > 0 Vigyázat, a teszt egyoldali, ráadásul két kritikus értéke van, d L és d U, mert a tesztstatisztika eloszlása függ a magyarázó változók számától. A döntési mechanizmus: H 0 elfogadva, ha d U < d < 4 d U, H 0 elutasítva, ha 0 < d < d L vagy 4 d L < d < 4 a maradék két esetben (d L < d < d U és 4 d U < d < 4 d L esetén) nem tudunk dönteni a statisztika alapján.
Durbin-Watson próba A regresszió esetén jól működik ez a próba. Az idősoroknál azonban gond van vele, mert itt a magyarázó változók az eredményváltozó késleltetett értékei, és emiatt a próba érvényét veszti. (Hasonlóan, mint ahogyan ilyen esetben az OLS becslés is inkonzisztenssé válik.) Ráadásul regresszió esetén is csak AR(1) hibatagra működik, így használata erősen korlátozott.
Breusch-Godfrey próba - AR(p) modell a hibatagra Nagymintás próba (n > k + 2p a regresszió esetén) A teszt szerint a modell hibatagja AR(p) folyamatot követ, azaz u t = ρ 1 u t 1 + ρ 2 u t 2 +... + ρ p u t p + e t A nullhipotézis: H 0 : ρ 1 = ρ 2 =... = ρ p = 0 Először megbecsüljük a modell paramétereit OLS becsléssel, majd a kapott reziduumokat becsüljük OLS módon az eredeti modell magyarázóváltozói és a reziduumok késleltetett értékei segítségével. Ezt hívják segédregressziónak. Tesztstatisztika: (n p) R 2 2 χ 2 p(α), ahol R 2 2 a segédregresszió R2 mutatója, a próba pedig egyoldali, azaz elutasítunk, ha a számított érték nagyobb a kritikus értéknél.
ELŐREJELZÉS
Előrejelzés fehérzajként viselkedő reziduálisok esetén Az előrejelzés módszertana kétség kívül az ökonometria tárgya. Ám többnyire nemszeretem tárgya... A tankönyvek nagy része sem foglalkozik behatóbban az előrejelzés témájával, általában ezek a legrövidebb fejezetek. Vigyázni kell, mert az előrejelzés mindig feltételes állítás. Miért? Mert...... szükség van benne az exogén változók jövőbeli értékére, hiszen az endogén változók ezek függvényeként állnak elő; a modell leírja ugyan az endogén változók alakulását, az exogének alakulására nincs hatással, hiszen ők a modellen kívülről jönnek. Ezért az előrejelzések készítésekor célszerű különböző forgatókönyveket felírni a külső tényezők alakulására,és ezek függvényében végezni az előrejelzéseket. Nyilván ezek is csak feltételezések, így az előrejelzéseket is ezeknek megfelelően kell kezelni!
Előrejelzés fehérzajként viselkedő reziduálisok esetén Ráadásul az ökonometriai modellek statisztikai módszereket használnak, melyekkel azt lehet eredményesen vizsgálni, ami rendszeresen, visszatérően előfordul. Például, ha a modell információs bázisában (múltjában) nem volt egyetlen komoly recesszió sem, akor nyilván nehéz lesz vele recessziót modellezni. Összefoglalva tehát "a közgazdászok nem azért jeleznek előre, mert tudják, hanem mert erre kérik őket. Az ökonométerek is." (Kőrösi Gábor, Közgazdasági Szemle, 2016 június) Ennek ellenére az ex post előrejelzés a diagnosztikai ellenőrzés egyik legfontosabb eszköze. (Ex post, azaz a minta egy már meglévő részére jelzünk előre, és a becsült értékeket az igaziakkal hasonlítva értékeljük a modellt.)
Tényleges előrejelzések kiszámítása és elemzése Nézzünk meg először néhány egyszerű speciális esetet: 1. Determinisztikus trend: y t = α + δt + ε t, (ε t ) fehérzaj folyamat. Ekkor tetszőleges s > 0 esetén y t+s = α + δ(t + s) + ε t+s, azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = α + δ(t + s), hiszen az (ε t ) fehérzaj folyamat nem becsülhető (jelezhető előre).
Tényleges előrejelzések kiszámítása és elemzése 2. Sztochasztikus trend (avagy eltolásos véletlen bolyongás): y t = δ + y t 1 + ε t, (ε t ) fehérzaj folyamat. Ekkor tetszőleges s > 0 esetén s y t+s = δ + y t+s 1 + ε t+s =... = δs + y t + ε t+k, k=1 azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = δs + y t, hiszen az (ε t ) fehérzaj folyamat most sem becsülhető.
Tényleges előrejelzések kiszámítása és elemzése Azaz mindkét előrejelzés egy δ meredekségű egyeneshez tart, a különbség az előrejelzések között az egyenesek elhelyezkedésében van. A determinisztikus trend esetén ŷ t+s t = α + δ(t + s), azaz az egyenes helyzete állandó, míg a sztochasztikus trend esetén ŷ t+s t = δs + y t, azaz az egyenes helyzete mindig az aktuális y t értéktől függ.
Példa - TS vs. DS
Az előrejelzési hibák és összevetésük Az előrejelzési hibát leggyakrabban az előrejelzés átlagos négyzetes hibájával (mean square error - MSE) mérik. Ez a determinisztikus trend esetén E[(y t+s ŷ t+s t ) 2 ] = E[(y t+s α + δ(t + s)) 2 ] = E[ε 2 t+s] = σ 2 alakú, míg a sztochasztikus trend esetén E[(y t+s ŷ t+s t ) 2 ] = E[(y t+s y t δs) 2 ] = = E[(ε t+1 + ε t+2 +... + ε t+s ) 2 ] = sσ 2 alakú, azaz az MSE mutató az előrejelzési periódus hosszával lineárisan nő. Azaz az adott szignifikancia szinthez tartozó konfidencia intervallum is szélesedik s növelésével.
Példa - TS
Tényleges előrejelzések kiszámítása és elemzése 3. Trendstacionárius folyamatok: y t = α + δt + u t, ahol u t = ε t + Ψ 1 ε t 1 + Ψ 2 ε t 2 +..., (u t ) stacionárius ARMA folyamat. Ekkor tetszőleges s > 0 esetén y t+s = α + δ(t + s) + u t+s = = α+δ(t +s)+ε t+s +Ψ 1 ε t+s 1 +...+Ψ s ε t +Ψ s+1 ε t 1 +..., azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = α + δ(t + s) + Ψ s ε t + Ψ s+1 ε t 1 +..., hiszen az (ε t ) fehérzaj folyamat jövője nem becsülhető (jelezhető előre), de a múltbeli (t időpont előtti) értékek becslése a reziduumok által adott.
Tényleges előrejelzések kiszámítása és elemzése 4. Differencia stacionárius folyamatok: y t = δ + y t 1 + u t, ahol u t = ε t + Ψ 1 ε t 1 + Ψ 2 ε t 2 +..., stacionárius ARMA folyamat. Ekkor tetszőleges s > 0 esetén y t+s = δs + y t + s u t+k, k=1 azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = δs + y t + s s+1 Ψ k ε t + Ψ k ε t 1 +..., k=1 k=2 hiszen az (ε t ) fehérzaj folyamat most sem becsülhető (jelezhető előre), de a múltbeli (t időpont előtti) értékek becslése a reziduumok által adott.
Tényleges előrejelzések értékelése: a hiba Ha a 3. és 4. esetben is az átlagos négyzetes hibával (MSE) mérjük az előrejelzés hibáját, akkor a következők adódnak: Trendstacionárius esetben E[(y t+s ŷ t+s t ) 2 ] = (1 + Ψ 2 1 + Ψ 2 2 +... + Ψ 2 s 1)σ 2 konstanshoz tart, míg differencia stacionárius esetben E[(y t+s ŷ t+s t ) 2 ] = [1+(1+Ψ 2 1)+...+(1+Ψ 2 1+Ψ 2 2+...+Ψ 2 s 1)]σ 2, ami s növelésével párhuzamosan növekszik, és nem egy véges határértékhez tart, hanem s lineáris függvénye lesz.
Egyéb mutatók az előrejelzések értékelésére Mean error (torzítás): ME = 1 n (y t ŷ t ) = 1 n e t n n t=1 t=1 Mean percentage error (MPE) MPE = 1 n 100 et n y t=1 t Mean absolute error (átlagos hiba) MAE = 1 n e t n t=1 Mean absolute percentage error (információvesztés) MAPE = 1 n 100 e t n y t=1 t Ebben a jelölésrendszerben a korábbi MSE = 1 n nt=1 e 2 t.