Diagnosztika és előrejelzés

Hasonló dokumentumok
Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

Statisztika elméleti összefoglaló

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ökonometria gyakorló feladatok - idősorok elemzése

Lineáris regressziószámítás 1. - kétváltozós eset

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

5. előadás - Regressziószámítás

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Bevezetés az ökonometriába

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Többváltozós Regresszió-számítás

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Bevezetés a hipotézisvizsgálatokba

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Idősoros elemzés minta

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Idősoros elemzés. Ferenci Tamás, január 7.

y ij = µ + α i + e ij

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

A többváltozós lineáris regresszió 1.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

A standard modellfeltevések, modelldiagnosztika

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

[Biomatematika 2] Orvosi biometria

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Korreláció és lineáris regresszió

Normális eloszlás tesztje

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

6. előadás - Regressziószámítás II.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Regresszió számítás az SPSSben

Bevezetés a Korreláció &

előadás Idősorok elemzése

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotézis vizsgálatok

Kísérlettervezés alapfogalmak

DIFFERENCIAEGYENLETEK

Ökonometria gyakorló feladatok 1.

GVMST22GNC Statisztika II.

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Egy fertőző gyermekbetegség alakulásának modellezése és elemzése

Statisztika Elıadások letölthetık a címrıl

Excel segédlet Üzleti statisztika tantárgyhoz

Mérési hibák

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Bevezetés az ökonometriába

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Nemparaméteres próbák

A többváltozós lineáris regresszió III. Főkomponens-analízis

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

LINEÁRIS MODELLBEN május. 1. Lineáris modell, legkisebb négyzetek elve

KOVÁCS BÉLA, MATEMATIKA II.

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

A Lee-Carter módszer magyarországi

Matematikai geodéziai számítások 6.

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Likelihood, deviancia, Akaike-féle információs kritérium

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Matematikai statisztikai elemzések 6.

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Matematikai geodéziai számítások 6.

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

6. Előadás. Vereb György, DE OEC BSI, október 12.

Többváltozós lineáris regresszió 3.

Adatok statisztikai értékelésének főbb lehetőségei

IBNR számítási módszerek áttekintése

A mérési eredmény megadása

egyetemi jegyzet Meskó Balázs

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Kettőnél több csoport vizsgálata. Makara B. Gábor

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Átírás:

2018. november 28.

A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának tesztelése, előrejelzés a mintán belül és kívül, majd ezek elemzése, értékelése.

Modellszelekciós kritériumok az ARMA modellekben......avagy az illeszkedés jóságának a tesztelése. A leggyakrabban használt kritériumok: Akaike-féle információs kritérium AIC = n log ESS n p + 2p Bayes-i (Schwartz-féle) információs kritérium BIC = n log ESS + p log n, n p ahol n a mintanagyság, p a becsült paraméterek száma, ESS pedig a szokásos becslési hibákból származó négyzetösszeg. Több ARMA modell közül azt választjuk, melyre a fenti kritériumok a legkisebbek. Kontrollálnak arra, hogy több paraméterrel "látszólag" jobb illeszkedést kapjunk.

REZIDUUMOK VIZSGÁLATA

Diagnosztika - reziduumok vizsgálata Modellünk akkor tekinthető jónak, - legyen az regressziós vagy idősoros modell, - ha a becslések és illesztések után a maradéktagok sorozata már fehérzajnak tekinthető. Ugyanis ha ez nem teljesül, akkor maradt még olyan információ a folyamatban, amit kinyerhettünk volna, tehát modellünk nem jól írja le az adatgeneráló folyamatot. Emlékezzünk arra, mi is pontosan a fehérzaj folyamat definíciója. Definíció 1. Az (ε t ), t Z v.v-sorozatot fehérzajnak nevezzük, ha E(ε t ) = 0, D 2 (ε t ) = σ 2 t, és Cov(ε t, ε s ) = 0, ha t s. Azaz korrelálatlan, azonos eloszlásból származó sorozat nulla várható értékkel és konstans (véges) szórással.

Diagnosztika - fehérzaj Normális eloszlású fehérzaj folyamat - trendmentes, időfüggetlen, stacionárius sorozat

Diagnosztika - fehérzaj Ljung-Box Q-statisztika értéke Q = 0, 00929, (p = 0, 923), azaz elfogadjuk azt a hipotézist, hogy a folyamat fehérzaj.

Diagnosztika - fehérzaj Véletlen szóródás, nincs periodikus komponens benne.

Diagnosztika - hibatag autokorrelációjának tesztelése Fehérzaj vs. AR(1)

Diagnosztika - hibatag autokorrelációjának tesztelése Fehérzaj ACF és PACF függvénye

Diagnosztika - hibatag autokorrelációjának tesztelése AR(1) ACF és PACF függvénye

Durbin-Watson próba Az elsőrendű autokorreláció tesztelésére szolgáló próba. Tegyük fel, hogy az (u t ) eltérésváltozó elsőrendben autokorrelált, azaz u t = ρu t 1 + ε t, ρ < 1. Ekkor a Durbin-Watson statisztika nt=2 (û t û t 1 ) 2 d = nt=1 ût 2 [0, 4]. Megmutatható, hogy ha d = 2 ρ = 0, azaz a folyamat fehérzaj 0 < d < 2 ρ > 0, azaz a folyamat pozitívan autokorrelált, 2 < d < 4 ρ < 0, azaz a folyamat negatívan autokorrelált.

Durbin-Watson próba A teszt hipotézisei: H 0 : ρ = 0, H 1 : ρ > 0 Vigyázat, a teszt egyoldali, ráadásul két kritikus értéke van, d L és d U, mert a tesztstatisztika eloszlása függ a magyarázó változók számától. A döntési mechanizmus: H 0 elfogadva, ha d U < d < 4 d U, H 0 elutasítva, ha 0 < d < d L vagy 4 d L < d < 4 a maradék két esetben (d L < d < d U és 4 d U < d < 4 d L esetén) nem tudunk dönteni a statisztika alapján.

Durbin-Watson próba A regresszió esetén jól működik ez a próba. Az idősoroknál azonban gond van vele, mert itt a magyarázó változók az eredményváltozó késleltetett értékei, és emiatt a próba érvényét veszti. (Hasonlóan, mint ahogyan ilyen esetben az OLS becslés is inkonzisztenssé válik.) Ráadásul regresszió esetén is csak AR(1) hibatagra működik, így használata erősen korlátozott.

Breusch-Godfrey próba - AR(p) modell a hibatagra Nagymintás próba (n > k + 2p a regresszió esetén) A teszt szerint a modell hibatagja AR(p) folyamatot követ, azaz u t = ρ 1 u t 1 + ρ 2 u t 2 +... + ρ p u t p + e t A nullhipotézis: H 0 : ρ 1 = ρ 2 =... = ρ p = 0 Először megbecsüljük a modell paramétereit OLS becsléssel, majd a kapott reziduumokat becsüljük OLS módon az eredeti modell magyarázóváltozói és a reziduumok késleltetett értékei segítségével. Ezt hívják segédregressziónak. Tesztstatisztika: (n p) R 2 2 χ 2 p(α), ahol R 2 2 a segédregresszió R2 mutatója, a próba pedig egyoldali, azaz elutasítunk, ha a számított érték nagyobb a kritikus értéknél.

ELŐREJELZÉS

Előrejelzés fehérzajként viselkedő reziduálisok esetén Az előrejelzés módszertana kétség kívül az ökonometria tárgya. Ám többnyire nemszeretem tárgya... A tankönyvek nagy része sem foglalkozik behatóbban az előrejelzés témájával, általában ezek a legrövidebb fejezetek. Vigyázni kell, mert az előrejelzés mindig feltételes állítás. Miért? Mert...... szükség van benne az exogén változók jövőbeli értékére, hiszen az endogén változók ezek függvényeként állnak elő; a modell leírja ugyan az endogén változók alakulását, az exogének alakulására nincs hatással, hiszen ők a modellen kívülről jönnek. Ezért az előrejelzések készítésekor célszerű különböző forgatókönyveket felírni a külső tényezők alakulására,és ezek függvényében végezni az előrejelzéseket. Nyilván ezek is csak feltételezések, így az előrejelzéseket is ezeknek megfelelően kell kezelni!

Előrejelzés fehérzajként viselkedő reziduálisok esetén Ráadásul az ökonometriai modellek statisztikai módszereket használnak, melyekkel azt lehet eredményesen vizsgálni, ami rendszeresen, visszatérően előfordul. Például, ha a modell információs bázisában (múltjában) nem volt egyetlen komoly recesszió sem, akor nyilván nehéz lesz vele recessziót modellezni. Összefoglalva tehát "a közgazdászok nem azért jeleznek előre, mert tudják, hanem mert erre kérik őket. Az ökonométerek is." (Kőrösi Gábor, Közgazdasági Szemle, 2016 június) Ennek ellenére az ex post előrejelzés a diagnosztikai ellenőrzés egyik legfontosabb eszköze. (Ex post, azaz a minta egy már meglévő részére jelzünk előre, és a becsült értékeket az igaziakkal hasonlítva értékeljük a modellt.)

Tényleges előrejelzések kiszámítása és elemzése Nézzünk meg először néhány egyszerű speciális esetet: 1. Determinisztikus trend: y t = α + δt + ε t, (ε t ) fehérzaj folyamat. Ekkor tetszőleges s > 0 esetén y t+s = α + δ(t + s) + ε t+s, azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = α + δ(t + s), hiszen az (ε t ) fehérzaj folyamat nem becsülhető (jelezhető előre).

Tényleges előrejelzések kiszámítása és elemzése 2. Sztochasztikus trend (avagy eltolásos véletlen bolyongás): y t = δ + y t 1 + ε t, (ε t ) fehérzaj folyamat. Ekkor tetszőleges s > 0 esetén s y t+s = δ + y t+s 1 + ε t+s =... = δs + y t + ε t+k, k=1 azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = δs + y t, hiszen az (ε t ) fehérzaj folyamat most sem becsülhető.

Tényleges előrejelzések kiszámítása és elemzése Azaz mindkét előrejelzés egy δ meredekségű egyeneshez tart, a különbség az előrejelzések között az egyenesek elhelyezkedésében van. A determinisztikus trend esetén ŷ t+s t = α + δ(t + s), azaz az egyenes helyzete állandó, míg a sztochasztikus trend esetén ŷ t+s t = δs + y t, azaz az egyenes helyzete mindig az aktuális y t értéktől függ.

Példa - TS vs. DS

Az előrejelzési hibák és összevetésük Az előrejelzési hibát leggyakrabban az előrejelzés átlagos négyzetes hibájával (mean square error - MSE) mérik. Ez a determinisztikus trend esetén E[(y t+s ŷ t+s t ) 2 ] = E[(y t+s α + δ(t + s)) 2 ] = E[ε 2 t+s] = σ 2 alakú, míg a sztochasztikus trend esetén E[(y t+s ŷ t+s t ) 2 ] = E[(y t+s y t δs) 2 ] = = E[(ε t+1 + ε t+2 +... + ε t+s ) 2 ] = sσ 2 alakú, azaz az MSE mutató az előrejelzési periódus hosszával lineárisan nő. Azaz az adott szignifikancia szinthez tartozó konfidencia intervallum is szélesedik s növelésével.

Példa - TS

Tényleges előrejelzések kiszámítása és elemzése 3. Trendstacionárius folyamatok: y t = α + δt + u t, ahol u t = ε t + Ψ 1 ε t 1 + Ψ 2 ε t 2 +..., (u t ) stacionárius ARMA folyamat. Ekkor tetszőleges s > 0 esetén y t+s = α + δ(t + s) + u t+s = = α+δ(t +s)+ε t+s +Ψ 1 ε t+s 1 +...+Ψ s ε t +Ψ s+1 ε t 1 +..., azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = α + δ(t + s) + Ψ s ε t + Ψ s+1 ε t 1 +..., hiszen az (ε t ) fehérzaj folyamat jövője nem becsülhető (jelezhető előre), de a múltbeli (t időpont előtti) értékek becslése a reziduumok által adott.

Tényleges előrejelzések kiszámítása és elemzése 4. Differencia stacionárius folyamatok: y t = δ + y t 1 + u t, ahol u t = ε t + Ψ 1 ε t 1 + Ψ 2 ε t 2 +..., stacionárius ARMA folyamat. Ekkor tetszőleges s > 0 esetén y t+s = δs + y t + s u t+k, k=1 azaz a folyamat t. időpontban tett s lépéses előrejelzése ŷ t+s t = δs + y t + s s+1 Ψ k ε t + Ψ k ε t 1 +..., k=1 k=2 hiszen az (ε t ) fehérzaj folyamat most sem becsülhető (jelezhető előre), de a múltbeli (t időpont előtti) értékek becslése a reziduumok által adott.

Tényleges előrejelzések értékelése: a hiba Ha a 3. és 4. esetben is az átlagos négyzetes hibával (MSE) mérjük az előrejelzés hibáját, akkor a következők adódnak: Trendstacionárius esetben E[(y t+s ŷ t+s t ) 2 ] = (1 + Ψ 2 1 + Ψ 2 2 +... + Ψ 2 s 1)σ 2 konstanshoz tart, míg differencia stacionárius esetben E[(y t+s ŷ t+s t ) 2 ] = [1+(1+Ψ 2 1)+...+(1+Ψ 2 1+Ψ 2 2+...+Ψ 2 s 1)]σ 2, ami s növelésével párhuzamosan növekszik, és nem egy véges határértékhez tart, hanem s lineáris függvénye lesz.

Egyéb mutatók az előrejelzések értékelésére Mean error (torzítás): ME = 1 n (y t ŷ t ) = 1 n e t n n t=1 t=1 Mean percentage error (MPE) MPE = 1 n 100 et n y t=1 t Mean absolute error (átlagos hiba) MAE = 1 n e t n t=1 Mean absolute percentage error (információvesztés) MAPE = 1 n 100 e t n y t=1 t Ebben a jelölésrendszerben a korábbi MSE = 1 n nt=1 e 2 t.