A modellezés sajátosságai anomáliákkal terhelt idősorok esetén

Hasonló dokumentumok
Bírálat Rappai Gábor. MTA doktori művéről

VÁLASZ AZ OPPONENSI VÉLEMÉNYEKRE

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

Árfolyamtábla jelentés

<C15. lista> Árfolyam lista. Nem archivált idıszak: lap. TKSZ technikai központ Idıpont: :56:54

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Opponensi vélemény. Rappai Gábor: A modellezés sajátosságai idősori anomáliák esetén. c. MTA doktori értekezéséről

2009. évi árfolyamok.txt

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Loss Distribution Approach

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

DIFFERENCIAEGYENLETEK

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

Heckman modell. Szelekciós modellek alkalmazásai.

ELTE TáTK Közgazdaságtudományi Tanszék MAKROÖKONÓMIA. Készítette: Horváth Áron, Pete Péter. Szakmai felelős: Pete Péter

Többváltozós lineáris regressziós modell feltételeinek

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Korreláció és lineáris regresszió

AZ INFLÁCIÓ A GAZDASÁGPOLITIKA SZOLGÁLATÁBAN

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban

[Biomatematika 2] Orvosi biometria

Kísérlettervezés alapfogalmak

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

AZ ENERGIA GAZDASÁGI SZEREPÉNEK MAKROSZINTŰ ÉRTÉKELÉSE KELET- KÖZÉP-EURÓPÁBAN, 1990 ÉS 2009 KÖZÖTT

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika I. 13. előadás Idősorok elemzése. Előadó: Dr. Ertsey Imre

Matematikai statisztika c. tárgy oktatásának célja és tematikája


Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Adatok statisztikai értékelésének főbb lehetőségei

Egységgyöktesztek alkalmazása strukturális törések mellett a hazai benzinár példáján

STATISZTIKAI PROBLÉMÁK A

Fertő Imre. Lehet-e a mezőgazdaság a gazdasági növekedés motorja? A közép-kelet európai országok tapasztalatai

Kvantitatív módszerek

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Idősoros elemzés minta

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

Normális eloszlás tesztje

Digitális Domborzat Modellek (DTM)

Szezonális kiigazítás az NFSZ regisztrált álláskeresők idősorain. Készítette: Multiráció Kft.

Kísérlettervezés alapfogalmak

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Hipotézis vizsgálatok

6. Előadás. Vereb György, DE OEC BSI, október 12.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Az új mértékadó árvízszintek meghatározásának módszertani összegzése

Rendszertelen idôsorok modellezése spline-interpolációval

Diagnosztika és előrejelzés

A Statisztika alapjai

Idősoros elemzés. Ferenci Tamás, január 7.

Idősorok elemzése előadás. Előadó: Dr. Balogh Péter

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

A fizetési mérleg alakulása a májusi adatok alapján

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság

Dr. Kalló Noémi. Termelés- és szolgáltatásmenedzsment. egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék. Dr.

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

Hidraulikus hálózatok robusztusságának növelése

A fizetési mérleg alakulása a IV. negyedéves adatok alapján

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

TÁJÉKOZTATÓ végén lassult a lakásárak negyedéves dinamikája

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Idősorok elemzése. Salánki Ágnes

Területi statisztikai elemzések

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Mesterséges Intelligencia MI

Bevezetés, tudnivalók, ökonometriai alapok

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

társadalomtudományokban

Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.

A NOMINÁLIS ÁRFOLYAMOK HOSSZÚ TÁVÚ

Statisztika elméleti összefoglaló

Átírás:

A modellezés sajátosságai anomáliákkal terhelt idősorok esetén MÓDSZERTANI DILEMMÁK A STATISZTIKÁBAN 4 ÉVE ALAKULT A JÖVŐKUTATÁSI BIZOTTSÁG SJTB Tudományos ülés, 216. november 18. 1

Idősor-modellezés alapkérdései Vizsgált jelenség stacioner vagy trendet tartalmaz? Kiterjesztett Dickey-Fuller-próba 1,6 32 Létezik-e ok-okozati összefüggés két jelenség között? 1,2 8 DEF_AH_EUR_VALT 3 Klasszikus Granger okság (VAR-modell) Wald-féle F-próba Közös trendet tartalmaz (EC-modell) 26 kointegráltság Johansen-próbája 9, 4 24 8, 22 7, 2-4 6, 18 5, -8 16 1996 1998 2 22 24 4, 26 28 21 212 214 1996 1998 2 22 24 26 28 21 212 214 3, 2, 1, 28 Ft/ 1996 1998 2 22 24 26 28 21 212 214 EXPORT IMPORT 2/14

Tankönyv és gyakorlat különbözősége Ekvidisztáns Tankönyv (elvárások) Gyakorlat (empirikus idősorok) Rendszertelen Egy adatgeneráló folyamat Outlierek találhatók Törésmentes Strukturális törést tartalmaz Elemi megfigyelések Időben aggregált megfigyelések 3/14

Anomáliák hatásvizsgálatának módszertana 1. Probléma és következményeinek rövid bemutatása 2. Kimutatásának, kiszűrésének, illetve kezelésének módszertana 3. Adatgeneráló folyamatok (DGP) előállítása ismert tulajdonságokkal bíró (AR1, VAR, RW, EC) (előbbi) ismert tulajdonságokkal bíró, de a vizsgált anomáliával terhelt 4. Monte Carlo szimulációval elemezni milyen arányban fordul elő első-, illetve másodfajú hiba, ha az anomáliát figyelmen kívül hagyjuk az eredeti idősoron feleslegesen végzünk anomália-kezelést 12 8 4 1 8 6 4 2-4 -2-4 -8 1 2 3 4 5 6 7 8 9 1-6 1 2 3 4 5 6 7 8 9 1 Y_AR1 Y_AR1_IRREG5 4/14

Rendszertelen idősorok Nemekvidisztáns lehet, mert hiányzó adat valódi rendszertelenség Kezelése (lineáris, log-lineáris, vagy spline) interpolációval kiegészítés folytonos idejű autoregresszív (CAR) modellek Tézisek 1. Egyváltozós esetben a stacionaritás, vagy trend meglétének felismerését nem veszélyezteti az interpoláció, általában már a lineáris interpoláció is kielégítő. 2. Eredetileg Granger-okságban levő idősoroknál, ha az ok sokkal ritkábban megfigyelt, mint az okozat, akkor gyakran elfedődhet az okság (fals negatív eset). 3. Kointegrált idősorok esetén az interpoláció elfedheti a közös trendet (kifejezetten veszélyes a nem azonos gyakoriságú, hosszabb szakaszon kiegészített idősorok együttmozgásának vizsgálata). 5/14

Illusztratív példa nem azonos frekvencián megfigyelt idősorok közötti okság Magyarország export (havi bontás) és GDP (negyedéves bontás) változása az előző év azonos időszakának százalékában (1997-213) 1 6 8 4 6 2 4 2-2 -4-2 -6-4 1998 2 22 24 26 28 21 212-8 1998 2 22 24 26 28 21 212 Wald-próba (Granger-okság: export ok, interpolációval kiegészített GDP okozat) Interpoláció módszere F-érték p-érték kiegészítés 1,91,371 lineáris interpoláció,89,558 Catmul-Rom spline,865,584 harmadfokú, másodrendű spline 1,896,38 6/14

Outlierek Outlier (kiugró érték, vélhetően más DGP-ből származik) gross error (adatrögzítés, stb.) true (várakozásoknak ellentmondó) Kiszűrése modell független technikák (SD-, z-score, Mahalanobis-, stb.) modellalapú (LR, érzékenységvizsgálat, saját) Kezelése elhagyás ( nemekvidisztáns idősorok) helyettesítés (csonkolás) becslési módszer változtatás Tézisek 1. Stacionaritás helyett trendet ritkán lehet találni, de a trend gyakran elfedődik (fals negatív eset). 2. Okság esetén (akár stacionárius változókról, akár kointegrációról van szó) az outlierek elfedhetik az ok-okozati összefüggést (fals negatív eset). Az okban megjelenő outlier veszélyesebb. 3. Felesleges winsorizálás elfedheti a sztochasztikus trendet, vagy a közös trendet. 7/14

Illusztratív példa kiugró értékeket tartalmazó tőzsdei adatokra BUX és /Ft-árfolyam (1997-214) nem kointegráltak 3, 25, 2, 32 28 24 15, 1, 5, 2 16 97 98 99 1 2 3 4 5 6 7 8 9 1 11 12 13 14 FT_EUR BUX Ugyanez a winsorizált differenciák-kumulálásával kointegráltak 35, 3, 25, 2, 15, 28 26 1, 5, 24 22 2 18 97 98 99 1 2 3 4 5 6 7 8 9 1 11 12 13 14 FT_EUR_N BUX_N 8/14

Strukturális törés az idősorokban Az adatgeneráló folyamat paramétereinek megváltozása a vizsgált időhorizonton (a priori ismert, vagy ismeretlen helyen) Kiszűrése Chow-próba (egy törés ismert hely) Quandt-Andrews (egy törés ismeretlen hely) Bai, Bai-Perron, Banerjee (több törés, különböző paraméterekben, ismeretlen helyen) Johansen (több törés VAR-modellben) Kezelése: modellspecifikáció megváltoztatása (alkalmas dummy változók modellbe építése) Tézisek 1. ADF-próba nagyon érzékeny a strukturális törésre, főképpen a szinteltolásra. 2. Ha több törés van, de végül visszatérünk az eredeti DGP-re, akkor a Quandt-Andrews szinte használhatatlan. 3. Közös trendet nagy valószínűséggel elfedi az egyik idősorban bekövetkezett törés, még akkor is, ha a másik viszonylag kis idő múlva követi. 9/14

Illusztratív példa a magyar külkereskedelem idősorain Export Import (folyó áron -ban, 1997-214) nincs közös trend 8, 7, 6, 5, 4, 3, 2, 1, 97 98 99 1 2 3 4 5 6 7 8 9 1 11 12 13 14 EXPORT IMPORT Strukturális törés feltételezésével - kointegráltak 1 xt 1 y x x x y y y t 1 xt 11 12 x t 1 11 12 13 14 t π π µ µ µ µ γ11 γ12 γ13 γ11 γ12 γ13 = + + x x x x t 2 + y ε1t y y y t 2 y t π21 π 22 y t 1 µ 21 µ 22 µ 23 µ 24 D1 t γ 21 γ22 γ23 γ21 γ22 γ + 23 x ε 2t t 3 yt 3 D 2t 1/14

Típusai stock (szisztematikus mintavétel) flow (összegzés, esetleg átlagolás) Analitikusan belátható összefügések ARMA(p,q) ARMA(p,r) ( p+ 1)( k 1) + q r = int k RW ~ ARIMA(,1,) ARIMA(,1,1) okság módosul kointegráltság nem Tézisek 1. Trend, illetve stacionaritás felismerését nem zavarja. Időbeli aggregálás és következményei A t = j t j = ( ) t j = y w y W L y 2. Gyakran előfordul, hogy az aggregált idősorokban nem megfigyelhető okság, magasabb frekvencián kimutatható. 3. Ok-okozati viszonyok elfedésének valószínűsége az aggregálás rendjével párhuzamos növekszik (haviról évesre, illetve munkanapiról havira áttérésnél már zavaró mértékű). 11/14

Devizaárfolyamok (havi záró, illetve havi átlag közötti kointegráció tesztelése) Euro ( ) és néhány további fontos árfolyam közötti Johansen-teszt eredménye (2-29 havi bontás) p-értékek Deviza Havi záró Havi átlag CHF,26,72 GBP,56,521 JPY,18,73 USD,14,81 12/14

Tanácsok az etikus modellezéshez A modell specifikációja során mindig törekedjünk a vizsgálandó jelenséget a lehető legjobban leíró, pontosan definiált idősorok használatára! Az empirikus idősor legyen a lehető leghosszabb és a lehető legnagyobb, még értelmezhető frekvenciájú, ugyanakkor igyekezzünk homogén (törésmenetes) időszakot vizsgálni! Csak indokolt adat-transzformációkat használjunk, ezeket pontosan írjuk le a specifikáció során, és semmiképpen se modellezzünk olyan idősorokat, melyek a transzformációk következtében elveszítik értelmezhetőségüket! Sohase feledkezzünk meg arról, hogy a modell a valóság egyszerűsített változata, ahol az operacionalizálhatóság oltárán mindig feláldozunk valamennyit a valósághűségből! Körültekintően hívjuk fel erre a felhasználók figyelmét, jelezzük a mintából történő következtések korlátait, ismertessük a ceteris paribus elv következményeit! 13/14

Köszönöm a figyelmet! 14/14