Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

Hasonló dokumentumok
Diagnosztika és előrejelzés

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49

IDŐSOROK SZTOCHASZTIKUS MODELLJEI

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

előadás Idősorok elemzése

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Többváltozós lineáris regressziós modell feltételeinek

DIFFERENCIAEGYENLETEK

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Hatványsorok, Fourier sorok

Számsorok. 1. Definíció. Legyen adott valós számoknak egy (a n ) n=1 = (a 1, a 2,..., a n,...) végtelen sorozata. Az. a n

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Markov-láncok stacionárius eloszlása

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

Bevezetés a hipotézisvizsgálatokba

Funkcionálanalízis. n=1. n=1. x n y n. n=1

Idősoros elemzés minta

Bevezetés az ökonometriába

Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik

Bevezetés az algebrába 2 Differencia- és differenciálegyenlet-rendszerek

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Matematika A2 vizsga mgeoldása június 4.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Idősoros elemzés. Ferenci Tamás, január 7.

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

Mátrix-exponens, Laplace transzformáció

Ido sorok oszta lyoza sa

Fourier transzformáció

Valószínűségi változók. Várható érték és szórás

előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Komplex számok. Wettl Ferenc előadása alapján Wettl Ferenc előadása alapján Komplex számok / 18

1. Számsorok, hatványsorok, Taylor-sor, Fourier-sor

A fontosabb definíciók

A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex

Adatok statisztikai értékelésének főbb lehetőségei

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

GPK M1 (BME) Interpoláció / 16

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 5. A JELFELDOLGOZÁS ALAPJAI: JELEK

Valószínűségszámítás összefoglaló

Kísérlettervezés alapfogalmak

Metrikus terek, többváltozós függvények

Fourier sorok február 19.

Mérés és adatgyűjtés

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ökonometria gyakorló feladatok - idősorok elemzése

4. Laplace transzformáció és alkalmazása

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

First Prev Next Last Go Back Full Screen Close Quit

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján

Felügyelt önálló tanulás - Analízis III.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

3. Lineáris differenciálegyenletek

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

2. Fourier-elmélet Komplex trigonometrikus Fourier-sorok. 18 VEMIMAM244A előadásjegyzet, 2010/2011

AZ ENERGIA GAZDASÁGI SZEREPÉNEK MAKROSZINTŰ ÉRTÉKELÉSE KELET- KÖZÉP-EURÓPÁBAN, 1990 ÉS 2009 KÖZÖTT

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Gyakorló feladatok I.

Egy fertőző gyermekbetegség alakulásának modellezése és elemzése

5. előadás - Regressziószámítás

Lineáris algebra numerikus módszerei

Kalkulus S af ar Orsolya F uggv enyek S af ar Orsolya Kalkulus

Centrális határeloszlás-tétel

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biostatisztika VIII. Mátyus László. 19 October

2010. október 12. Dr. Vincze Szilvia

MNB Füzetek 1999/4 AZ IDÕSORMODELLEKEN ALAPULÓ INFLÁCIÓS ELÕREJELZÉSEK: Lieli Róbert: április EGYVÁLTOZÓS MÓDSZEREK

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

Készítette: Fegyverneki Sándor

Frakciona l differencia lt folyamatok e s kointegra cio

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Modellek és Algoritmusok - 2.ZH Elmélet

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Többváltozós Regresszió-számítás

Folytonos görbék Hausdorff-metrika Mégegyszer a sztringtérről FRAKTÁLGEOMETRIA. Metrikus terek, Hausdorff-mérték. Czirbusz Sándor

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

4. SOROK. a n. a k (n N) a n = s, azaz. a n := lim

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

A modellezés sajátosságai anomáliákkal terhelt idősorok esetén

CSAPADÉK ÉS TALAJVÍZSZINT ÉRTÉKEK SPEKTRÁLIS ELEMZÉSE A MEZŐKERESZTES-I ADATOK ALAPJÁN*

Bevezetés az algebrába 2

Átírás:

Spektrálelemzés, DF és ADF tesztek 2017. november 14.

SPEKTRÁL-ELEMZÉS

Példa - BKV villamosenergia-terhelési görbéje Figure: BKV villamosenergia-terhelési görbéje, negyedóránkénti mérések (2 hét adatai, ezer kw-ban mérve) Az idősor alakja sugallja a napi periodicitás jelenlétét.

Példa - Fogyasztói árindexek Figure: Fogyasztói árindexek

Spektrál-elemzés A Wold-tételben meghatároztuk annak feltételét, hogy egy adott (c 0,..., c q ) sorozat mikor lehet egy q-adrendű MA folyamat autokovariancia függvénye. Ezt most megpróbáljuk általánosítani tetszőleges stacionárius folyamatra. Tétel 1 (Herglotz tétel). Legyen (c k ) egy valós számsorozat. Ekkor létezik olyan (x t ) stacionárius folyamat, melyre c k = E(x t x t+k ) pontosan akkor, ha c k előáll c k = π π e ikλ F (dλ) alakban, ahol i = 1 és F (dλ) szimmetrikus mérték a [ π, π] intervallumon. A tételben szereplő F mértéket spektrális mértéknek nevezzük.

Spektrál-elemzés Az F (dλ) szimmetrikus mérték azt jelenti, hogy minden A [ π, π] mérhető halmazhoz tartozik egy véges F (A) 0 szám, melyre F (A B) = F (A) + F (B), ha A B, F (A) = F ( A). Ekkor az integrált közelítő összegekkel definiáljuk az π π e ikλ F (dλ) = lim n max(δ j ) 0 n e ikλ j F ([λ j 1, λ j ]) j=1 formában, ahol π = λ 0 < λ 1 <... < λ n = π az intervallum felosztása, δ j = λ j λ j 1 pedig a j-dik részintervallum nagysága.

Spektrál-elemzés 1. eset: F abszolút folytonos a Lebesgue mértékre. Ekkor tetszőleges A [ π, π] mérhető halmaz esetén létezik egy f (λ) integrálható függvény olyan, melyre F (A) = A f (λ)dλ. Ezt hívjuk spektrális sűrűségfüggvénynek. Ekkor c k = π π e ikλ f (λ)dλ, ami éppen f Fourier-transzformáltja (konstanstól eltekintve). Ha egy idősor autokovarianciái a fenti alakban előállíthatók, akkor azt mondjuk, hogy folytonos spektruma van.

Spektrál-elemzés Visszafelé elvégezve a transzformációt adódik, hogy f (λ) = 1 2π k= c k e ikλ, ahonnan a c k = c k és e ikλ = cos(kλ) + i sin(kλ) tulajdonságok alapján f (λ) = 1 ( ) c 0 + 2 c k cos(kλ). 2π Példák: k=1 ha (ε t ) fehérzaj, akkor f (λ) = σ2 2π ha (x t ) MA(1) folyamat, akkor f (λ) = 1 2π β 0 + β 1 e iλ 2 ha (x t ) AR(1) folyamat, akkor f (λ) = c 0 2π 1 2 1 αe iλ

Spektrál-elemzés 2. eset: F csak néhány pontra koncentrált mérték. Legyenek ezek a pontok a λ j [ π, π], λ j = λ j, j N pontok, a σj 2 súlyokkal. Ekkor F (A) = σj 2. λ j A Ekkor azt mondjuk, hogy az idősornak diszkrét spektruma van. Ezt felhasználva a (c k ) sorozatra azt kapjuk, hogy c k = σj 2 e ikλ j = σ0 2 + 2 σj 2 cos(kλ j ) j= j=1 az F mérték szimmetria tulajdonsága miatt.

Spektrál-elemzés Természetesen felmerül a kérdés, hogy van-e olyan folyamat, melynek a fenti alakú diszkrét spektruma van. Tétel 2. Ha idősorunk előáll az x t = A 0 + (A j cos(λ j t) + B j sin(λ j t)) j=1 alakban, ahol (A j, B j ) független, 0 várható értékű és σ j 2 szórású v.v-k, akkor (x t ) autokovariancia függvénye éppen a fenti alakú. Azaz a diszkrét spektrum azt jelenti, hogy idősorunk véletlen periódusok összegeként áll elő.

Spektrál-elemzés Egyszerűsítsük tovább a modellt: tegyük, fel hogy m x t = a 0 + (a j cos(λ j t) + b j sin(λ j t)) + e t j=1 alakú, ahol a k, b k, λ k konstansok, (e t ) pedig fehérzaj. Ezek az ún. rejtett periódusú idősorok λ 1,..., λ m rejtett periódusokkal. Legyen a fenti idősor egy véges megfigyelése (x 1,..., x N ), és tegyük fel, hogy m és λ 1,..., λ m ismertek. Feladatunk az ismeretlen (a k, b k ) együtthatók becslése a minta alapján. LS-becslés: min a k,b k ( N ) (x t a k cos(λ k t) b k sin(λ k t)) 2 t=1 k = 1,..., m.

Spektrál-elemzés Egyszerű számolással adódik, hogy â j = 2 N x t cos(λ j t) és ˆb j = 2 N x t sin(λ j t) N N t=1 t=1 Probléma: a fenti λ j frekvenciák általában nem ismertek! Definíció 1. Minden λ [ π, π] értékre legyen az I N (λ) = (a(λ)) 2 + (b(λ)) 2 függvény az ún. periodogram függvény, ahol 2 N 2 N a(λ) = x t cos(λt) és b(λ) = x t sin(λt). Azaz N N t=1 t=1 I N (λ) = 2 N x N t e itλ. t=1

Spektrál-elemzés Tétel 3. Tetszőleges λ [ π, π] esetén teljesül, hogy N 1 I N (λ) = 2 ĉ k cos(λk), k=0 ahol ĉ k = 1 N N k t=1 x t x t+k. Ha a periodogramot éppen a rejtett periódushoz tartozó pontban számoljuk ki, akkor A(λ k ) = N 2 âk, N és B(λ k ) = 2 ˆb k adódik.

Spektrál-elemzés Tétel 4. Tegyük fel, hogy a mintabeli megfigyelések száma végtelen tart. Ekkor a periodogram határértékére lim I N(λ) = N { 0, λ λk k = 1,..., m +, λ = λ k valamilyen k-ra adódik. A fenti konvergencia sztochasztikus értelemben értendő. Numerikus számításoknál a periodogramot a λ = 0, 2π N, 4π N,... ún. Fourier-frekvenciákon értékelik ki. Nagy mintaelemszám esetén a periodogram kiugró értékei nagy valószínűséggel rejtett frekvenciákat jelentenek. Ezek tesztelesére számos próba áll rendelkezésre (pl. Fisher-féle g-próba, Whittle-féle módosított g-próba).

Példa - BKV adatok spektruma A numerikus adatok alapján megállapítható, hogy a becsült sűrűségfüggvény a 96-os periódusnál (periódus= 2π/λ k ) veszi fel a maximumát, ami a negyedórás megfigyelések miatt egy napos ciklusnak felel meg (24 4 = 96).

Példa - BKV villamosenergia-terhelési görbéje Figure: BKV villamosenergia-terhelési görbéje, negyedóránkénti mérések (2 hét adatai, ezer kw-ban mérve)

Példa - fogyasztói árindexek spektruma A maximumot a 42, 5 hosszú perióduson veszi fel, ami kb. 3, 5 éves ciklusnak felel meg.

Példa - Fogyasztói árindexek Figure: Fogyasztói árindexek

STACIONARITÁSI TESZTEK

Stacionaritási tesztek Nem stacionárius folyamatok két alapesete: determinisztikus trendet tartalmazó idősorok (trend-stac.) egységgyök (unit root) folyamatok (differencia-stacionárius) 160 140 Y S Y D 120 100 values 80 60 40 20 0 0 50 100 150 time

Példa Figure: Francia frank napi árfolyama 1986 és 1993 között, 2459 megfigyelés

Stacionaritási tesztek Tekintsük az alábbi modellt: ahol u t ARMA folyamat, azaz y t = α + δt + u t, (1 α 1 z... α p z p ) u t = (1 + β 1 z +... + β q z q ) ε t. }{{}}{{} A(Z) B(z) Tegyük fel, hogy B invertálható, és legyen A(z) = (1 λ 1 z)(1 λ 2 z)... (1 λ p z). Ekkor, ha λ 1,..., λ p az egységkörön belül helyezkednek el, akkor u t = B(z) A(z) ε t = Ψ(z)ε t jóldefiniált, és Ψ(z) gyökei az egységkörön kívülre esnek. Azaz y t trend-stacionárius folyamat lesz.

Stacionaritási tesztek Tegyük fel, hogy λ 1 = 1. Ekkor azaz A(z)u t = (1 z)(1 λ 2 z)... (1 λ p z)u t = B(z)ε t, (1 z)u t = B(z) (1 λ 2 z)... (1 λ p z) ε t = Ψ (z)ε t, ahol Ψ gyökei az egységkörön kívülre esnek. Ekkor y t y t 1 = (1 z)y t = (1 z)α + δt δ(t 1) + (1 z)u t = = 0 + δ + Ψ (z)ε t ún. egységgyök folyamatot kapunk.

Stacionaritási tesztek Tehát ha A(z)-nek van 1 darab egységgyöke, a többi gyök pedig az egységkörön kívül van, akkor egységgyök folyamatunk lesz, ha minden gyöke az egységkörön kívülre esik, akkor trend-stacionárius folyamatunk van. Több egységgyök esetén a fenti gondolatmenetet ismételni kell az egységgyökök multiplicitásának megfelelően. Ezek lesznek az ún. ARIMA(p, d, q) folyamatok, ahol d az egységgyökök számát jelöli. Az ilyen folyamatok d-edrendbeli differenciázása vezet stacionárius folyamathoz.

Stacionaritási tesztek Hogyan kell ezeknél a folyamatoknál a trendet eltávolítani? Trend-stacionárius esetben egy egyszerű kivonás (osztás) megoldja a problémát Egységgyök folyamat esetén ez nem jó megoldás (ld. például az eltolásos véletlen bolyongást), mert ekkor a kivonás/osztás nem szünteti meg a reziduumok szórásának időbeli változását. Emiatt használjuk ezekben az esetekben a differenciázást. Trend-stacionárius esetben viszont a differenciázás nem jó megoldás, mert ekkor egységgyök kerülne az MA részbe!

Stacionaritási tesztek Tehát minden egyes idősornál alapvetően fontos kérdés, hogy vajon a vizsgált folyamat tartalmaz-e egységgyököt vagy sem. Viszont, az egységgyök tesztek tárgyalása előtt figyelembe kell vennünk az alábbiakat: véges minták állnak csak rendelkezésünkre, így nem lehet megállapítani, hogy a folyamat tényleg a fenti, precízen definiált, általános egységgyök folyamat, vagy pedig egy stacionárius folyamat; csak azt lehet tesztelni, hogy előre meghatározott rendű autoregresszív folyamatok tartalmaznak-e egységgyököt, vagy sem; azaz tesztelésre alkalmas hipotézis akkor fogalmazható meg, ha előre korlátozott rendű autoregresszív folyamatok alkotják a vizsgálat tárgyát.

Stacionaritási tesztek Dickey-Fuller teszt: autokorrelálatlan reziduumok esetén alkalmazható csak. A becsült regresszió y t = α + ρy t 1 + δt + ε t alakú, ahol ε t N(0, σ) i.i.d. folyamat. A kérdés az, hogy ρ értéke 1 lesz-e, azaz egységgyök folyamatunk van-e, vagy sem. Tehát H 0 : ρ = 1. α és δ értékének függvényében időtrendet tartalmazó ill. nem tartalmazó, eltolásos vagy eltolás nélküli véletlen bolyongás folyamatokat kapunk H 0 teljesülése esetén.

Stacionaritási tesztek Autokorrelált reziduumok esetén: a Phillips-Perron (DF teszt korrigált változata) teszt, valamint a kibővített DF-teszt (ADF) alkalmazható, de most eltolás nélküli vagy eltolásos egységgyök folyamatokat keresünk úgy, hogy y t késleltett értékei is megjelennek a modellben, de ezek már csak stacionárius formában. KPSS teszt: trend-stacionaritás vs. stacionaritás tesztelésére LMC teszt: AR(p) vs. ARIMA(p, 1, 1) tesztelésére

Példa Figure: Francia frank napi árfolyama 1986 és 1993 között, 2459 megfigyelés Biztos, hogy nem stacionárius az idősor, hiszen egyértelmű lineáris trendet tartalmaz.

Példa A nem-stacionárius viselkedés innen is egyértelműen leolvasható.

Példa Kivétel nélkül minden késleltetésen szignifikáns az autokorreláció és alig csökkennek az értékek, azaz idősorunk egyértelműen nem stacionáriusnak tűnik.

Példa Lineáris trendet illesztve az adatokra jól látszik, hogy idősorunkat a lineáris trendtől megtisztítva kellene stacionarizálni. De hogyan? Determinisztikus avagy sztochasztikus ez a trend?

Példa A fenti kérdés eldöntésére a kibővített Dickey-Fuller (ADF) teszt ad választ.

Példa Ha az ereseti idősor csak konstanssal integrált, de a konstans és trend körül stacioner, akkor determinisztikus a trend: Ha az idősor konstans és trend körül sem stacioner, akkor differenciázni kell: Mindkét esetben tartható a nullhipotézis, azaz nem stacioner a folyamat. Ezért differenciázni fogunk!

Példa Figure: Az idősor első differenciázottja

Példa Most már a korrelogram-on is látszik a stacionaritás, a Ljung-Box Q-statisztikák sem szignifikánsak.

Példa Ennek teljesen formális igazolásához újra segítségül hívjuk az ADF-tesztet. A nullhipotéziseket elvetjük, azaz a transzformált idősor már stacionárius, nem tartalmaz egységgyököt.