A sztochasztikus idősorelemzés alapjai

Átírás

1 A sztochasztikus idősorelemzés alapjai Ferenci Tamás BCE, Statisztika Tanszék november 29.

2 2

3 Tartalomjegyzék 1. Az idősorelemzés fogalma, megközelítései Az idősor fogalma Idősorok nevezetes jellemzői Determinisztikus és sztochasztikus idősorelemzés Determinisztikus idősorelemzés Sztochasztikus idősorelemzés Determinisztikus és a sztochasztikus trend Stacionaritás A stacionaritás fogalmának szükségessége Erős és gyenge stacionaritás Erős stacionaritás Gyenge stacionaritás Stacionárius idősorok jellemzőinek becslése mintából A stacionaritás ellenőrzése Az idősor grafikus vizsgálata A korrelogram lecsengésének vizsgálata Statisztikai tesztek a stacionaritás vizsgálatára Stacionarizálás, trend- és differenciastacioner idősorok Trendstacioner idősorok (TSP) Differenciastacioner idősorok (DSP) Nevezetes idősormodellek A Box Jenkins-eljárás ARIMA-modellek haladó megfogalmazása ARIMA-modellek becslése 41 3

4 4 TARTALOMJEGYZÉK

5 1. fejezet Az idősorelemzés fogalma, megközelítései Ebben a fejezetben elsőként definiáljuk az idősor fogalmát (1.1. pont), majd későbbi jelentősége miatt külön beszélünk az időrosok néhány nevezetes jellemzőjéről (1.2. pont). Ezt követően bemutatjuk az idősorok elemzésével foglalkozó két alapvető megközelítési módot (1.3. pont), amire az 1.4. pontban példát is mutatunk Az idősor fogalma Az idősor fogalmát megragadhatjuk sokasági (elméleti idősor) és minta (empirikus idősor) szemléletben. Sokasági értelemben idősornak nevezzük valószínűségi változók egy indexelt {Y t, t N} családját 1, ahol a t indexet idő -nek fogjuk nevezni. (Az indexelés, amire az egyes valószínűségi változóknál az alsó index utal, a valószínűségi változók között egy sorrendet állít fel: Y 1 előbb van, Y 2 később.) Ilyen értelemben ez tehát lényegében valószínűségi változók egy sorbarendezett halmaza. Jelentheti például Y t a t nap végi OTP záróárfolyamot, a t nap végi HUF/EUR árfolyamot, a t évbeli magyarországi gabonatermelést stb. Néha az is hasznos lesz, ha úgy gondolunk erre, mint egy többdimenziós valószínűségi változóra, melynek Y t -k a komponensei (csak épp, szemben a szokásos többdimenziós eloszlásokkal, a sorrendjünk nem indifferens). N a lehetséges időpontok halmaza; ez a közgazdasági gyakorlatban legtöbbször diszkrét, nagyon gyakran egy véges halmaz, például N = {1, 2,..., T }. Ekkor tehát T számú időpontunk van, melyeket 1-től T -ig indexeltünk; a valószínűségi változóink így tehát: Y 1, Y 2,..., Y T. (Műszaki és természettudományos gyakorlatban előfordulnak folytonos indexhalmazok is, pl. lehet N = R +. Mi ilyen, ún. folytonos idejű idősorokkal a továbbiakban nem foglalkozunk, csak diszkrét idejűekkel, és az egyszerűség kedvéért azon belül is az N = {1, 2,..., T } esettel.) Lehet például az indexelés 1 Pontosan ugyanezt a fogalmat a valószínűségszámításban sztochasztikus folyamatnak szokás nevezni. 5

6 6 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI jelentése az, hogy t = 1 a jövő hétfői OTP záróárfolyam, t = 2 a jövő keddi stb., és T = 5 (azaz a jövő hét öt munkanapjára vonatkozó OTP záróárfolyam az idősorunk). Minta megközelítésben idősornak azt a y 1, y 2,..., y T statisztikai adatsort (adatbázist) nevezzük, amelynek az megfigyelési egységei sorbarendezettek, valamilyen időponthoz kötöttek. (Itt már láthatóan alkalmaztuk azt a konvenciót, hogy az időpontjaink az {1, 2,..., T } halmaz elemei.) Míg tehát az előbbiekben valószínűségi változók (sorbarendezett) sorozatával van dolgunk, itt már konkrét számok (sorbarendezett) sorozatával. Nyilvánvaló, hogy ez utóbbi az előbbi egy realizációja. (Pontosan ugyanúgy, ahogy az 1406 eladásra kínált lakás is egy-egy, összesen 1406 realizáció a kínálati ár, alapterület stb. változók (ismeretlen) együttes eloszlásából.) Ez utóbbi megjegyzés rögtön mutatja az idősorelemzés legnagyobb problémáját (és egyben persze kihívását): azt, hogy a gyakorlati feladatokban az egyes időpontokhoz tartozó valószínűségi változónkra csak egy realizációnk lesz! Nem hogy 1406 mintát nem vehetünk a valószínűségi változóból, de kettőt sem. (Aligha lehet a holnapi OTP-záróárfolyam, mint valószínűségi változóból két mintát venni... ) Szokás ezt, nagyon találóan, a reprodukálhatatlanság problémájának is nevezni. Mindezeket példázza az 1.1. ábra 2, mely az OTP 2010 évi záróárait ábrázolja ben összesen 254 kereskedési nap volt a BÉT-en, ez tehát egy T = 254 elemű idősor; január 4- től (az első kereskedési naptól) 1-gyel kezdve, minden kereskedési napon egyesével növekvően indexelhetjük. A fentiek fényében világos, hogy az OTP záróárfolyamainak alakulását elvileg egy 254-dimenziós valószínűségi változó írja le; az ábrán ennek egyetlen realizációja látható... ami egyúttal bizonyosan az egyetlen létező realizáció is erre az idősorra. Ennek megfelelően tehát soha ne felejtsük el, hogy az empirikus idősor, hiába is áll 254 számból, valójában egyetlen realizáció csak épp egy 254-dimenziós valószínűségi változóból. (Ahogy például a kínálati ár, alapterület, szobaszám együttes eloszlásából vett egyetlen realizáció is három számból áll.) A fenti ábrázolás azt juttatja kifejezésre, hogy az idősoros adatok specialitása (szemben a lakásos példával), hogy a valószínűségi változó komponensei között (és így persze a realizált komponensei között is) sorrendezés van: az ábrázolásnak csak úgy van értelme, ha erre tekintettel vagyunk; nyilván az ábra is e sorbarendezés figyelembevételével készült. A fentiek mind ún. egyváltozós idősorok voltak, hiszen skalárértékű valószínűségi változókat, ill. realizáltjaikat vizsgáltuk. Természetesen semmi akadálya annak, hogy ehelyett vektorértékű valószínűségi változókra térjünk át (pl. OTP árfolyam és HUF/EUR árfolyam együttes vizsgálata), ilyen többváltozós idősorról szokás beszélni. Ez egy még izgalmasabb, és persze bonyolultabb matematikai formalizmusú terület, hiszen ilyenkor nem csak a különböző időpontok közötti, hanem a különböző változók közötti kapcsolat kérdését is kezelni kell. Mi most egyváltozós idősorokkal fogunk foglalkozni. 2 Az ábrázolás elvileg nem teljesen korrekt, hiszen ez az idősor ugyebár diszkrét, ezért az egyes pontokat nem köthetnénk össze, ám itt olyan sok időpontunk van, hogy ez lényeges hibát nem jelent (amúgyis szabad szemmel szinte megkülönböztethetetlenül közel lennének a pontok).

7 1.2. IDŐSOROK NEVEZETES JELLEMZŐI Az OTP záróárai (BÉT), Záróár [Ft] febr. márc. ápr. máj. jún. júl. aug. szept. okt. nov. dec. Dátum 1.1. ábra. Az OTP évi záróárai a BÉT-en 1.2. Idősorok nevezetes jellemzői Egy idősor teljes sokasági leírását az adja, ha ismerjük az összes t N-re vett együttes eloszlását. Ennek ismeretében mindent tudunk az idősorról (természetesen sztochasztikus értelemben). Ezzel a kérdéssel, illetve ennek nehézségeivel a 2. fejezetben fogunk foglalkozni; de addig is hasonlóan a keresztmetszeti esethez itt is definiáljuk az idősor néhány, ennél egyszerűbb jellemzőjét. Olyan értelemben lesznek ezek egyszerűbbek, hogy az összes időpont együttes eloszlása helyett csak egy, legfeljebb két időpont együttes eloszlására vonatkoznak, illetve a teljes eloszlás megadása helyett csak egy, legfeljebb két momentumot adnak meg. (Teljes analógiában a keresztmetszeti esettel: ott is nagyon gyakori, hogy egy változó eloszlását csak várható értékével és esetleg szórásnégyzetével adjuk meg, illetve, hogy két változó eloszlását csak kovarianciájukkal/korrelációjukkal írjuk le.) Mivel Y t egy valószínűségi változó minden t N-re, így kiszámíthatjuk az EY t várhatóértékét. Ez már egyszerűen egy valós szám lesz, mégpedig t-től függő valós szám. Azaz: egy függvényt kaptunk, mely t időponthoz hozzárendeli, az akkori várható értékét az idősornak, EY t -t. Ezt

8 8 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI hívják precízen várható érték függvénynek, jele µ (µ : N R): µ t := EY t. Teljesen hasonlóan definiálható a σ 2 szórásnégyzet függvény (σ 2 : N R + ): σ 2 t := D2 Y t = E (Y t EY t ) 2 = E (Y t µ t ) 2 = EY 2 t µ 2 t. Értelemszerűen a σ szórás függvény ennek a négyzetgyöke: σ t := σ 2 t. Ezeken felül szokás definiálni az autokovariancia függvényt is, mint két időpont közti (azaz a két időponthoz tartozó valószínűségi változók közti) kovarianciát. (Az auto arra utal, hogy az idősor szintjén önmagával vett kovarianciáról van szó.) Mivel ehhez mindkét időpontot meg kell adni, ez már egy kétváltozós függvény lesz, jele γ (γ : N N R): γ t,s := cov (Y t, Y s ) = E [ (Y t EY t ) (Y s EY s ) ] = E [ (Y t µ t ) (Y s µ s ) ] = E (Y t Y s ) µ t µ s. Az autokovariancia-függvény hátránya (a keresztmetszeti esethez hasonlóan), hogy a számértéke önmagában nem sokat mond. Ezért itt is szokás ehelyett inkább az autokorreláció függvényt használni, melynek jele ρ (ρ : N N [ 1, 1]): ρ t,s := corr (Y t, Y s ) = γ t,s σ t σ s Determinisztikus és sztochasztikus idősorelemzési megközelítések Az idősorok elemzésének két alapvető megközelítése, módszertana alakult ki: a determisztikus ( alpont) és a sztochasztikus ( alpont) idősorelemzés. Megjegyezzük, hogy valójában mindkettő az ún. időtartományon történő elemzés kategóriájába esik (mivel azon alapulnak, hogy az idősor külöböző időpontokhoz tartozó értékei között teremtenek kapcsolatot). Tágabban szemlélve, az idősorelemzés másik nagy kategóriája a frekvenciatartományon történő elemzés, ezzel azonban nem fogunk részleteiben foglalkozni. A frekvenciatartományon történő elemzés lényege (némiképp leegyszerűsítve), hogy az idősort Fouriertranszformációval szinuszhullámok összegére bontja. Belátható, hogy idősorok egy széles csoportja ekvivalensen reprezentálható úgy, hogy megadjuk, hogy az egyes frekvenciájú szinuszhullámokat milyen súllyal kell kombinálni, hogy megkapjuk az idősort. (Az ekvivalens reprezentáció alatt azt értjük, hogy oda-vissza át lehet térni a két leírás között.) Ez utóbbira szokták azt mondani, hogy időtartomány helyett frekvenciatartományon írtuk fel az idősort; ebből is sok hasznos és érdekes következtetést lehet levonni. Ezt a módszertant szokták spektrális elemzésnek is nevezni.

9 1.3. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS IDŐSORELEMZÉS Determinisztikus idősorelemzés Az ún. determinisztikus idősorelemzés azon a feltevésen nyugszik, hogy az idősort alakító tényezők, elvileg legalábbis, teljeskörűen számbavehetőek, és ez alapján az idősor alakulása, elvileg legalábbis, tökéletes pontossággal felírható lenne. A véletlennek csak annyiban jut szerep, hogy valami átkozott pech folytán a gyakorlati esetekben ez a teljeskörű felírás soha nem valósul meg (korlátozottak a mérési lehetőségek, korlátozott a tudásunk, hibával tudunk csak mérni stb.), emiatt a valóság mindig eltér a modell szerinti becslésünktől. (Vegyük észre, hogy ez az eltérés teljesen analóg a keresztmetszeti regresszió eltérésváltozójával, amiben szintén a fenti okok miatti hibát sűrítettük.) Azonban, és ez nagyon fontos, ebben a modellezési filozófiában a véletlen szerepe itt véget is ért: kialakítja az adott időszakbeli pontos értéket (eltérve valamennyivel a becslésünktől), ám ennyi, a későbbi időszakokra ennek már nincs hatása! (Természetesen a későbbi időpontokban is lesz eltérés, tehát ott is szerepet kap a véletlen, ám ez már az előző(ek)től függetlenül alakul mintha minden időpillanatban pénzfeldobásszerűen döntenénk a tényleges érték becsülttől való eltérítéséről.) Ez a filozófia a dekompozíciós idősormodellek felé mutat, melyek különböző, eltérő tartalmú komponensekre próbálják bontani az idősort (melyektől az idősor valamilyen függvényszerű módon függ). A legnépszerűbb modellben szokás beszélni pl. trendről (hosszú távú alapirányzat), ciklusról (éven túli ingadozás a trend körül) és szezonalitásról (évszakról-évszakra ingadozó, tehát éven belüli eltérés a trend és ciklus szerinti értéktől). Amennyiben feltesszük, hogy ezek additíve tevődnek össze, úgy az idősormodellünk a következőképp néz ki: Y t = R t + C t + S t + u t, ahol R t, C t és S t a trend, a ciklus és a szezonalitás t-edik időszakbeli értéke rendre, u t pedig a már említett eltérésváltozó. Ezek a komponensek klasszikus statisztikai (jellegében deskriptív statisztikai) módszerekkel (pl. analitikus trendszámítás) becsülhetőek. A determinisztikus idősorelemzéssel (mellyel elsősorban hosszútávú előrejelzések adása a cél), a továbbiakban nem foglalkozunk Sztochasztikus idősorelemzés A sztochasztikus idősorelemzés alapvető filozófiai eltérése, hogy bár ez a modell is adni fog egy becsült értéket az idősor adott időpontbeli értékére, és feltételezi, hogy a valós érték ettől véletlen módon eltér, ám abból indul ki, hogy ennek a véletlen eltérésnek később is hatása van: az idősor későbbi alakulását is befolyásolja. Úgy is szokták mondani, hogy az idősor fejlődésében öngeneráló hatások érvényesülnek: egy adott időpillanatbeli (véletlen) eltérés befolyásolja a későbbi értékeket is, tehát a véletlennek folyamatépítő szerepe van. E megközelítést nagy sikerrel alkalmazták különböző közgazdasági (kiemelten: pénzügyi) idősorok modellezésére; elsősorban rövid távra.

10 10 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI 1.4. Egy példa a két filozófiára: a determinisztikus és a sztochasztikus trend Most megnézünk egy egyszerű példát, mely közvetlenül a két modellezési iskola feltevéseit szemlélteti, ám a későbbiek szempontjából is nagyon jól fog jönni. Vegyük a következő két idősor-specifikációt: Y (D) t = αt + u t, Y (S) t = α + Y (S) t 1 + u t, Y 0 = 0. (Látható, hogy mindkét idősort a sokaságban 3 specifikáltuk.) Az egyszerűség kedvéért feltételezzük, hogy u t N ( 0, σ 2), mégpedig különböző t-kre függetlenül. Első ránézésre több hasonlóság is felfedezhető a két specifikáció között. Mindkét idősor a 0- ból indul (a 0 időpillanatban) és érezhető, hogy mindkettőre igaz, hogy egy időszakkal később várhatóan α-val nagyobb értéket vesznek fel. (Az α természetesen lehet negatív is.) Hogy ezt az állítást precízebben is megfogalmazzuk, vegyük észre, hogy az Y (S) t definíciójába rekurzíve behelyettesíthetünk (hiszen ha Y (S) t Y (S) t = α + Y (S) t 1 + u t = α + = α + = α + Y (S) t 1 + u t, akkor nyilván Y (S) t 1 = α + Y (S) t 2 + u t 1 stb.): ( ) α + Y (S) t 2 + u t 1 + u t = [ ( ) ] α + α + Y (S) t 3 + u t 2 + u t 1 + u t =... = αt + t u i. Az intuitív észrevételünket ( tehát úgy fogalmazhatjuk meg most már precízen, hogy EY (D) t = E (αt + u t ) = αt és EY (S) t = E αt + ) t i=1 u i = αt, tehát várható értékben minden időpillanatban ugyanaz a két idősor értéke. (Kihasználtuk, hogy összeg várható értéke a várható értékek összege, illetve, hogy konstans várható értéke saját maga és Eu i = 0.) Ez egy nagyon komoly megállapítás, ám van különbség is a két idősor fejlődése között. Ez rögtön világos lesz, ha felírjuk ( a szórásnégyzetet egy általános időpontra: D 2 Y (D) t = D 2 (αt + u t ) = σ 2 és D 2 Y (S) t = D 2 αt + ) t i=1 u i = tσ 2. (Kihasználtuk, hogy konstans minden valószínűségi változótól független (és szórásnégyzete nulla), és hogy független valószínűségi változók összegének szórásnégyzete a szórásnégyzetek összege.) A két idősor tehát várható értékban ugyan azonos, ám Y (S) t egyre nagyobb kilengésekkel ingadozik ezen várható érték körül, míg Y (D) t állandóakkal. Megjegyezzük, hogy mivel nyilván mind Y (D) t, mind Y (S) t normális eloszlású (hiszen a normális eloszláscsalád zárt a konvolúcióra és a konstanssal eltolásra), így a fenti két megállapítással teljesen le is írtuk az idősorokat. (Hiszen egy normális eloszlást egyértelműen meghatároz várható értéke és varianciája.) A fentieket számítógépes szimulációval szemléltethetjük: véletlenszám-generátorral előállítunk 3 Pontosan innen látszik az is, hogy az Y 0 = 0 természetesen nem azt jelenti, hogy az Y 0 az a 0 (mint valós szám), hiszen az Y t-k valószínűségi változók, ez tehát úgy értendő, hogy az Y 0 az az elfajult valószínűségi változó, mely 1 valószínűséggel a 0 értéket veszi fel. i=1

11 1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND 11 u t N ( 0, σ 2) számokat, majd így lejátszhatjuk egy lehetséges lefutását az idősornak. (Mind Y (D) t -t, mind Y (S) t -t szimulálhatjuk ilyen módon.) E megközelítés előnye, hogy míg valós szituációban nem ismerjük a sokasági eloszlást (épp ennek meghatározása lesz a feladat), csak egy realizáltat (sőt, idősorelemzésnél biztosan legfeljebb egy realizáltját láthatjuk az ismeretlen sokasági eloszlásnak), addig ebben az esetben ismerjük, sőt, mi határozzuk meg (a véletlenszámgenerátor beállításával) a sokasági eloszlást. Ennek megfelelően természetesen ebben az esetben vehetünk akárhány realizáltat a sokasági eloszlából (egyszerűen újra lefuttatjuk a szimulációt). Ezt szemlélteti az 1.2. ábra, melyen 9-9 realizáltat ábrázoltunk a Y (D) t (kékkel) és Y (S) t (pirossal) idősorokból α = 1, σ 2 = 9 paraméterek mellett. (A jobb áttekinthetőség végett csak 3-3 realizáltat ábrázoltunk egy grafikonon.) Megjegyezzük, hogy ezeket a lefutásokat szokás trajektóriának is nevezni. Az ábra tanulságosan igazolja vissza mindazt, amit eddig elméleti úton levezettünk. Egyrészt jól látszik, hogy várható értékben tényleg egyezik a két idősor (már ennyi ábrából is érezhető, hogy az y = x egyenes körül ingadoznak); és az is tökéletesen látszik, hogy míg Y (D) t állandó szórással ingadozik ezen egyenes körül, addig Y (S) t egyre nagyobb szórással ( legyezőszerűen kitágul ezen egyenes körül). Most már elárulhatjuk, hogy Y (D) t -t szokás determinisztikus trendnek, Y (S) t -et pedig sztochasztikus trendnek nevezni. (A trend elnevezés jogosságát épp a várható értékek alakulásáról tett megállapításunk indokolja.) Már a specifikációkból is látható, hogy a determinisztikus trend alakulása a determinisztikus idősorelemzési iskola premisszáit teljesíti, a sztochasztikus trend a sztochasztikus idősorelemzésiét. És ebből egy újabb fontos, tartalmi következtetést vonhatunk le az idősorok fejlődésének jellegzetességeire vonatkozóan. A determinisztikus trend alakulását úgy lehet elképzelni, hogy a t-edik időpontban fellépünk az αt pontba, majd egy N ( 0, σ 2) véletlenszám szerint perturbáljuk a pozíciónkat. A sztochasztikus trend esetén az előző pozícióból fellépünk α-t és utána térítjük el a pozíciónkat egy N ( 0, σ 2) véletlenszám szerint. (Mindezek a most ismert sokasági specifikációból világosak.) Hogy mi a különbség? Ha a véletlengenerátor pont egy nagyon nagy, vagy nagyon kicsi értéket dob ki, az ugyan kiugró pozíciót fog eredményezni, ám ennek determinisztikus trendnél semmilyen jelentősége nincs a későbbiek szempontjából (ettől függetlenül αt-be lépünk és generálunk újra véletlenszámot a következő időpontban), addig sztochasztikus trend esetén nagyon is van: az egész folyamat a kiugró pozíciótól folytatódik tovább! Ez legjobban talán a legalsó részábra legfelső trajektóriáján látszik: miután a 25. időpillanatban egy nagy pozitív véletlenszámot kaptunk, a nagy kiugrás nem egyszeri volt (ahogy determinisztikus trend esetén lett volna), hanem lényegében eltolódott az idősor, és onnan folytatódott az épülése. Mindez a specifikációból következik, természetesen. Azt is mondhatnánk, hogy a sztochasztikus trend esetén az idősorba beépülnek a sokkok, míg a determinisztikus trendbe nem. Ez a példa jól szemlélteti, hogy mit kell az alatt érteni, hogy egy idősorban a véletlennek folyamatépítő szerepe van, hogy öngeneráló hatások érvényesülnek. Megjegyezzük, hogy az Y t = Y t 1 +u t specifikációt szokás véletlen bolyongásnak (RW, random

12 12 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI ábra. Y (D) t (kék) és Y (S) t (piros) szimulált lefutása 100 időegységre walk) is nevezni, hiszen Y t felfogható úgy is, mint egy objektum ( a bolyongó ) térbeli helyzete. Azaz: a bolyongó kezdetben az origóban áll, minden időpillanatban előveszi a véletlenszámgenerátorát, és annyit lép felfelé, amennyit a véletlenszám-generátor mutat. (Ez természetesen negatív is lehet.) Ez tehát egy ún. egydimenziós bolyongás. Az Y t = α + Y t 1 + u t típusú folyamat neve eltolásos véletlen bolyongás (RWD, random walk with drift), hiszen ilyenkor a bolyongó

13 1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND 13 először determinisztikusan felfelé lép α-t (eltolás, sodródás ) és utána nézi meg a véletlenszámgenerátorát. RWD-folyamatokra a fentiekben már láttunk példákat, az 1.3. ábrán pedig 5 szimulált RW-folyamat trajektóriáját láthatjuk. Érdemes ellenőrizni a megbeszélt tulajdonságok teljesülését! Ezen folyamatoknak a valószínűségszámításban van nagy jelentőségük ábra. Véletlen bolyongás (RW) szimulált trajektóriái

14 14 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI

15 2. fejezet Stacionaritás A stacionaritás az idősorelemzés egyik alapvető fogalma; lényegében egy megkötést jelent az idősor valószínűségi struktúrájára nézve. E megkötés azért szükséges, hogy az idősor statisztikai eszközökkel kézbentartható legyen. (És mert épp emiatt a későbbi ismertetendő módszertan is stacionárius idősorokat fog igényelni.) A 2.1. pontban megindokoljuk, hogy miért szükséges ez a fogalom, mi a bevezetésének a logikája. Ezt követően, a 2.2. pontban precízen is bevezetjük a két, gyakran használt stacionaritás fogalmat, majd a 2.3. pontban megmutatjuk pár nevezetes jellemzőjét a stacionárius idősoroknak. Ez már csak azért is fontos, mert a későbbiekben szinte kizárólag ilyen idősorokkal fogunk dolgozni. A 2.4. pontban megmutatjuk, hogy az idősorok stacionaritását hogyan tudjuk megvizsgálni. Ez azért különösen fontos, mert a későbbiekben, amint már utaltunk is rá, stacioner idősorokra lesz szükségünk a modellépítéshez. Emiatt itt tárgyaljuk azt a másik nagyon fontos kérdést is, hogy mi a teendő nem-stacioner idősorok esetén, hogyan tudjuk őket stacioner idősorrá transzformálni ( stacionarizálás ) A stacionaritás fogalmának szükségessége Hasonlóan a keresztmetszeti adatelemzéshez, idősoros esetben is az lehet a célunk, hogy a minta alapján rekonstruáljuk az ismeretlen háttéreloszlást, amiből a minta származik. Ahogy már említettük is, egy idősor teljes leírását az adja, ha megadjuk a komponenseinek, tehát az egyes t N időponthoz tartozó valószínűségi változóknak az együttes eloszlását. Jegyezzük meg, hogy az egyes időpontok önmagában vett eloszlása nyilván kevés, hiszen ezekből semmit nem tudunk az időpontok közötti kapcsolatokról. Gondoljunk akár csak a legegyszerűbb esetre: T = 2 és az idősor eloszlása kétdimenziós normális. A 2.1. ábra két ilyen esetet szemléltet, a kétdimenziós sűrűségfüggvényt szintvonalakkal megjelenítve. A két eset jellegzetessége, hogy mindkét vetületi eloszlásuk (tehát: mindkét időpontban az adott időpontra 15

16 16 2. FEJEZET. STACIONARITÁS önmagában vett eloszlás) pontosan ugyanaz (ezt szemléltetendő az ábrán szintén feltüntettük ezeket a vetületi eloszlásokat, mégpedig pont úgy, ahogy a kétdimenziós eloszlást le kéne vetíteni ), mégis a két idősor tartalma drámaian eltérő: nagyon nem mindegy, hogy ha a részvény adott napi árfolyama az átlagánál magasabb, akkor a következő napi várhatóan átlagánál alacsonyabb, vagy pont hogy magasabb lesz... Kicsit precízebb valószínűségszámítási terminológiával megfogalmazva: a két eloszlás várhatérték-vektora és szórásnégyzetei teljesen azonosak, ami eltér, az a kovariancia (és így persze a korreláció is). Az is világos mellesleg valószínűségszámításból, hogy kizárólag akkor mondhatjuk, hogy a vetületi eloszlások elégségesek, ha az egyes időpontok függetlenek (hiszen ekkor az együttes sűrűségfüggvény 1 előállítható a vetületi sűrűségfüggvényekből, egyszerű szorzással). Ez nyilván irreális feltevés a legtöbb gyakorlati esetben. Minden információt általánosságban csak az együttes eloszlás hordoz y y x 2 y x y x x 2.1. ábra. Két kétdimenziós normális eloszlás sűrűségfüggvénye (szintvonalakkal) és vetületi eloszlásaik (szemléletesen ott, ahová tényleg vetíteni lehetne a kétdimenziós felületet); úgy, hogy az eloszlások mindkét vetületi eloszlása pontosan egyezik, mégis drámaian eltérőek tartalmilag Az 1. fejezetben mondottak szerint azonban az együttes eloszlás meghatározására szemben a keresztmetszeti esettel semmilyen reményünk nincs: míg 1406 minta alapján a 7 változónk együttes eloszlása jól rekonstruálható, addig itt, egyetlen minta lévén, lényegében semmit nem tudunk mondani az együttes eloszlásról. Sőt, nem csak az együttes eloszlásról nem tudunk érdemben nyilatkozni, de még a vetületi eloszlásokról (itt: az idősornak az egyes időpontokban önmagában vett eloszlásairól) sem: egyetlen realizációból értelmesen még várható értéket sem tudunk mondani, nemhogy eloszlást rekonstruálni. 1 Mi most csak olyan idősorokkal foglalkozunk, melyeknél a valószínűségi változó eloszlása folytonos, és így létezik sűrűségfüggvény.

17 2.2. ERŐS ÉS GYENGE STACIONARITÁS 17 Ebből tehát világos, hogy az idősorelemzéssel csak úgy tudunk érdemben továbbhaladni, ha az együttes eloszlásra bizonyos megkötéseket teszünk. Ez fog elvezetni minket a stacionaritás fogalmához. Először egy rávezető problémával kezdünk. Tegyük fel, hogy valaki megkér minket, hogy adjuk meg a január 4-i OTP záróárfolyam várható értékét. (Ez az Y 1 az 1.1. ábra példáján.) Ahogy már mondtuk, további megkötés nélkül ez a feladat reménytelen, hiszen arra a valószínűségi változóra egyetlen mintánk van (y 1 = 5492), amiből, értelmesen legalábbis, nem lehet várható értéket becsülni. (Mint ahogy semmi mást sem.) Itt jön elő a reprodukálhatatlanság, az egyetlen realizáció problémája: nem lenne gond egy ilyen becsléssel, ha vehetnék több mint a január 4-i OTP záróárfolyamból... de nem vehetünk, ez sajnos elvileg lehetetlen. Tegyük fel azonban, hogy valaki megsúgja, hogy az együttes eloszlás olyan, hogy minden vetületi eloszlásnak (tehát minden nap záróárának) ugyanaz a várható értéke. Ekkor már drasztikusan más a helyzet! Ha ugyanis ez a feltevés igaz, akkor természetesen a második (vagy bármelyik más) időpontbeli realizáció is ugyanúgy használható a várható érték becslésére, mint az első napi; azaz: a különböző naphoz tartozó értékeket összeönthetjük a várható érték becsléséhez. Márpedig 254 értékből nagyon is lehet várható értéket becsülni! E feltevés híján azonban a külöböző időpontbeli értékeket nem használhattuk volna fel együtt. Ez a példa rámutat arra, hogy ha bizonyos megszorításokat teszünk (a példában: hogy minden vetületi eloszlás várható értéke ugyanaz), akkor a kezdetben reménytelen feladatot kezelhetővé tesszük (legalábbis bizonyos szempontok szerint). E kikötések teljesülését persze valahogy ellenőrizni kell, de erre majd később, a 2.4. pontban térünk vissza Erős és gyenge stacionaritás Most bevezetjük, a fentiek által motiválva, idősorok stacionaritásának fogalmát. (Jobban mondva fogalmait, mert több stacionaritási fogalmat is definiálni fogunk.) Előtte még emlékeztetünk arra, hogy egy többdimenziós eloszlás vetületének néhány kiválasztott komponensének együttes eloszlását nevezzük. Például az X, Y, Z, V valószínűségi változókból (mint komponensekből) álló többdimenziós (négydimenziós) valószínűségi változónak 4 darab egydimenziós vetületi eloszlása van (az X, az Y, a Z és a V változók (önmagában vett) eloszlása), 6 darab kétdimenziós vetületi eloszlása van (az X, Y, X, Z, X, V, Y, Z, Y, V és Z, V párok együttes eloszlása) és így tovább. (Természetesen, mint azt ez a példa is mutatja, a vetületi eloszlás is lehet többdimenziós, azaz egy együttes eloszlás vetületi eloszlása is jelenthet együttes eloszlást.) Erős stacionaritás Kezdjük egy nagyon erős megkötéssel. Egy idősort erős értelemben stacionáriusnak (vagy: erős értelemben stacionernek) nevezünk, ha minden véges dimenziós vetületének együttes eloszlása (tehát: akárhány elemű vetületről van szó, és ezeket az elemeket akárhogy választjuk ki az idősor komponensei (azaz időpontjai) közül) eltolásinvariáns, minden értelmes eltolásra. Például

18 18 2. FEJEZET. STACIONARITÁS mondjuk azt, hogy háromdimenziós vetületek együttes eloszlására vagyunk kíváncsiak; egy ilyen lehetséges vetület például az Y 1, Y 3 és Y 7 együttes eloszlása. Ha az erős stacionaritás fennáll, akkor e három együttes eloszlásának ugyanannak kell lennie, mint Y 2, Y 4 és Y 8 együttes eloszlásának, vagy épp Y 12, Y 14 és Y 18 együttes eloszlásának, vagy épp Y 212, Y 214 és Y 218 együttes eloszlásának, és egyáltalán: minden más, eltolással kijelölt időpont együttes eloszlásának. (Eltolással kijelölés itt olyan, mintha egy ablakot mereven végigtolnánk az idősoron, tehát az egyes időpontok közti különbségeknek ugyanannyinak kell lenniük.) És ennek természetesen nem csak a háromdimenziós vetületekre kell teljesülnie, hanem az egydimenziósokra, a kétdimenziósokra,... és az n 1 dimenziósokra is. (Azért kellett úgy fogalmaznunk, hogy minden értelmes eltolásra, mert nem véges idősoroknál ezt az ablakot nyilván nem tolhatjuk ki az idősoron túlra.) Precízen megfogalmazva: k 1 esetén t 1, t 2,..., t k -ra Y t1, Y t2,..., Y tk együttes eloszlása megegyezik Y t1+h, Y t2+h,..., Y tk +h együttes eloszlásával, h-ra (ha az itt szereplő komponensek mind az idősor részei). Ez a feltétel (már a kvantorok számából is érezhetően... ) rendkívül sokat követel meg. Vegyük észre például, hogy ennek része az előző pont végének példa-megkötése: a definíciót k = 1- gyel alkalmazva azt kapjuk, hogy erős stacionaritás esetén minden egyes időpontban pontosan ugyanannak kell lennie az idősor adott időpontbeli (vetületi) eloszlásának. (Így nyilván a várható értékének, és egyáltalán, minden momentumának is ugyanannak kell lennie, minden időpontban.) Ennek megfelelően, ha egy idősor erősen stacioner, az rendkívüli módon megkönnyíti az elemzését. Nem csak a várható értékének becsléséhez használható fel együtt az összes időpontbeli érték (tehát y 1, y 2,..., y T ), de a szórásnégyzetének, ferdeségének stb., tehát általában, bármilyen momentumának becsléséhez, sőt: a definíció k = 2-re alkalmazásából látszik, hogy az egymást követő időpontok kétdimenziós eloszlása is ugyanaz, tehát minden időpont és a rákövetkező időpont közti korreláció is ugyanaz kell legyen (függetlenül attól, hogy melyik ez a két időpont, csak az számít, hogy egymás utániak legyenek), és ennek becsléséhez felhasználhatjuk az (y 1, y 2 ), (y 2, y 3 ),..., (y T 1, y T ) értékeket. Sőt, a kettő különbségű időpontok eloszlása is azonos, függetlenül attól, hogy melyek a konkrét időpontok (csak az számít, hogy időkülönbségük kettő legyen), így korrelációjuk is azonos, és emiatt e korreláció (szokták úgy is hívni: a kettő késleltetéshez tartozó korreláció) becsléséhez felhasználhatóak az (y 1, y 3 ), (y 2, y 4 ),...,(y T 2, y T ) párok értékei, és így tovább. (Tehát például minden háromdimenziós (stb.) vetületi eloszlás is azonos lesz, eltolástól függetlenül, csak ezek nem bírnak olyan nagy gyakorlati jelentőséggel, nincs is olyan közismert leírójuk, mint kétdimenziósoknál a korreláció.) Gyenge stacionaritás Az látható, hogy a felvázolt problémát az erős stacionaritás elfogadása megoldja, csak épp ezzel bizonyos értelemben átesünk a ló túloldalára : az erős stacionaritás olyan komplex követelményrendszer, hogy ellenőrzése lényegében reménytelen mintából. Éppen emiatt, a gyakorlati alkalmazásokban ehelyett inkább egy gyengített változatát szokás használni. A gyengítés motivációja, hogy csak azokat a követelményeket hagyjuk meg az erős

19 2.2. ERŐS ÉS GYENGE STACIONARITÁS 19 stacionaritásból, amelyek kézzelfogható statisztikai jellemzőkhöz kapcsolódnak: például a kétdimenziós eloszlásoknak van gyakorlati jelentőségük (fontos leírójuk kovariancia/korreláció), ám a három (és több) dimenziós eloszlásoknak nincs ilyen jellemzőjük, ezért kettőnél nagyobb dimenziójú vetületekre egyáltalán nem teszünk kikötést. Sőt, az egy- és kétdimenziós eloszlásoknál is enyhítünk a feltételeken: nem az eloszlások teljes egyezőségét követeljük meg, csak az első és második momentumban történő egyezést. (Kétdimenziós esetben az első momentumnak nincs értelme, a második momentum pedig a kovariancia lesz.) Mindezeket összefoglalva, és precízzé téve: egy idősort gyenge értelemben stacionáriusnak (vagy gyenge értelemben stacionernek) nevezünk, ha a következő három feltétel teljesül rá: 1. Minden időpontban ugyanaz az idősor várható értéke, tehát létezik a közös µ EY t várható érték (azaz µ t µ minden t-re). 2. Minden időpontban ugyanaz az idősor szórásnégyzete, tehát létezik a közös σ 2 D 2 Y t szórásnégyzet (azaz σ 2 t σ 2 minden t-re). 3. Két időpont közti kovariancia kizárólag a két időpont külöbségétől (a késleltetéstől) függ, tehát cov (Y t, Y s ) = cov (Y t+h, Y s+h ) minden értelmes h eltolásra (azaz a kétváltozós γ t,s függvény felírható egy egyváltozós függvényként úgy, hogy γ t,s = γ t s ). Azonnal látható, hogy egy az egyben az erős stacionaritás követelményeit ismételtük meg, csak épp mindössze egy- és kétdimenziós vetületekre, és mindössze első két momentumban történő egyezésre. (Szokás a gyenge stacionaritást kovariancia-stacionaritásnak is nevezni.) Észrevehető mellesleg, hogy ez a gyengítés pontosan összhangban van azzal, amit akkor tennénk, ha tudnánk, hogy az idősor többdimenziós normális eloszlású (és így persze minden vetületi eloszlása is (többdimenziós) normális). Ekkor ugyanis egyrészt az első két momentum teljesen meghatározza az eloszlást, másrészt pl. négy időpont együttes eloszlása teljesen determinált, ha ismerjük a belőlük kiválasztható összes pár eloszlását. (Hiszen az egyes időpontok várható értékén túl csak a kovarianciamátrixra van szükségünk (e kettő teljeskörűen leír egy többdimenziós normális eloszlást), márpedig az páronként számolható.) Magyarán: többdimenziós normális eloszlásnál semmilyen pluszt nem jelent a kettőnél több elemű vetületek, illetve a kettőnél nagyobb momentumok ismerete. A fentiekből tehát világos, hogy az erős stacionaritás fogalma valóban erősebb: az erősebb stacionaritás implikálja a gyengét 2. A fordított irány általában nem áll fenn (tehát a két fogalom nem ekvivalens), de az előző bekezdés fényében világos, hogy speciálisan többdimenziós normális eloszlású idősorra (ún. Gauss-folyamat) igen, ott tehát e két fogalom egybeesik. érteni. A továbbiakban, ha nem mondunk mást, stacionaritás alatt gyenge stacionaritást fogunk 2 Ez alól az egyetlen kivételt az jelenti, ha az idősor eloszlása az egyes időpontokban olyan, hogy annak nem létezik első vagy második momentuma. (Például: Cauchy-eloszlású.) Az erős stacionaritás definíciója ebben az esetben is teljesen változatlanul alkalmazható, viszont a gyenge stacionaritás definíciója értelmetlenné válik, hiszen a nem is létező momentumokra fog hivatkozni.

20 20 2. FEJEZET. STACIONARITÁS A 2.2. ábra példát mutat egy stacioner idősorra: adott, biztosan stacioner sokasági specifikációból 3 szimulációval generáltunk három trajektóriát. Érdemes megfigyelni a stacionaritási követelmények ránézésre történő teljesülését: nem úgy tűnik, mintha a trajektóriáknak lenne trendjük és szintén nem tűnik úgy, mintha a szórás változna. (Az autokorrelációk időfüggését nyilván kevésbé lehet szabad szemmel megítélni.) ábra. Példa stacionárius idősorra: három szimulált trajektória az Y t = 0,5+0,7 Y t 1 +u t, u t N (0, 3), beláthatóan stacionárius specifikációból 2.3. Stacionárius idősorok nevezetes jellemzőinek mintából történő becslése Ezen a ponton már világosan látható, hogy az 1.2. pontban bevezetett nevezetes jellemzőket (várható érték függvény, autokorreláció függvény stb.) miért csak a sokaságban definiáltuk: általános esetben a mintából történő becslésük reménytelen feladat (hiszen például m t becsléséhez egyetlen megfigyelésünk lenne... ). És itt válik érthetővé, hogy a stacionaritás miért volt fontos: ha ugyanis ezt elfogadjuk, akkor ezek a jellemzők máris becsülhetővé válnak! Ebben a pontban ezt a kérdéskört fogjuk áttekinteni. Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös 3 Ez a specifikáció egy ún. AR(1) folyamat, melyet később fogunk tárgyalni, itt most csak annyi fontos, hogy bizonyosan stacioner. Konkrét specifikációja: Y t = 0,5 + 0,7 Y t 1 + u t, u t N (0, 3).

21 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 21 µ EY t várható értékéről. Ennek becslése minta alapján nyilván: µ = 1 T T y t. t=1 Érdemes megfigyelni, ahogy kihasználjuk a stacionaritást! Ha az idősor nem lenne stacioner, akkor a különböző időpontokhoz tartozó értékek nem lennének felhasználhatóak közös becsléshez (különösen, hogy közös várható érték nem is létezne), viszont ha a közös várható érték létezését a priori tudjuk, akkor annak megbecsléséhez ugyanúgy jó az első időpont értéke, a második időpont értéke és így tovább. Egyszerűbben szólva, e feltételezés fényében ezek ugyanúgy használhatóak várható érték becslésére, mint egy keresztmetszeti esetben az idősor, ebből a szempontból, összetolható, a különböző időponthoz tartozó megfigyelések összeönthetőek (legalábbis a várható érték becsléséhez!). Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös σ 2 D 2 Y t szórásnégyzetéről is. Ennek becslése minta alapján nyilván: σ 2 = 1 T T (y t µ). t=1 (Itt már kihasználtuk, hogy a gyenge stacionaritás miatt létezik közös várható érték.) Megjegyezzük, hogy ez a képlet csak akkor adna torzítatlan becslést σ 2 -re, ha a várható érték helyett annak µ sokasági értékét, és nem µ mintából becsült értékét szerepeltettük volna. A fenti formában ez torzított becslést fog adni, igaz a torzítás az idősor hosszának növekedtével egyre kisebb lesz (teljesen analóg módon a keresztmetszeti szórásnégyzet-becsléssel), továbbá a becslő konzisztens is. Izgalmasabb a kovariancia/korreláció kérdése. Már utaltunk rá, hogy a különböző időpontok (mint az idősor egyes komponens valószínűségi változói) közötti kovarianciát autokovarianciának szokás nevezni. A gyenge stacionaritás tehát azt köti ki, hogy az Y t és Y s közötti autokovariancia kizárólag a k = s t különbségtől (a késleltetéstől) függ, t-től és s-től konkrétan nem. Az várható érték és a szórásnégyzet jellemző általában egy egyváltozós függvény volt, de speciálisan stacioner esetben nulla változóssá (azaz: konstans számmá) alakulnak azáltal, hogy eltűnik az időfüggés. Az autokovariancia ezzel szemben általában kétváltozós függvény volt, így stacioner esetben is függvény lesz, igaz már csak egyváltozós. Erről szól a következő definíció: egy idősor (empirikus) autokovariancia függvényének nevezzük a γ k = cov (Y 1, Y 1+k ) kifejezést, mely láthatóan k függvénye. Megismételjük, hogy ez a definíció gyenge stacionaritás esetén jogos, hiszen ekkor cov (Y 1, Y 1+k ) = cov (Y 2, Y 2+k ) =... = cov (Y T k, Y T ), így ezt joggal definálhatjuk a k késleltetéshez tartozó autokovarianciának. Az autokovariancia függvény becslése mintából: γ k = 1 T k (y t µ) (y t+k µ). T k t=1

22 22 2. FEJEZET. STACIONARITÁS (A gyenge stacionaritás feltételezése miatt természetesen támaszkodhattunk arra, hogy létezik közös várható érték.) Itt is elmondható, hogy ez a képlet a fenti formában torzított becslés γ k -ra (akkor lenne torzítatlan, ha µ helyett a sokasági érték, µ szerepelne), viszont konzisztens; de ezekkel a kérdésekkel nem foglalkozunk tovább. Itt is kihasználtuk a stacionaritást: ez tette lehetővé, hogy például az 1 késleltetéshez tartozó autokorreláció becsléséhez ugyanúgy használjuk az első és második időpontbeli értékekből képezett párt, a második és harmadik időpontbeli értékekből képezett párt, és így tovább, egészen az utolsó előtti és utolsó időpontbeli értékekből képezett párig. Látható, hogy minél nagyobb késleltetésre vagyunk kíváncsiak, annál kevesebb párból kell becsülnünk ez logikus is, 1 késleltetéshez az idősor hosszánál mindössze eggyel kevesebb pár található (első és másodiktól az utolsó előtti és utolsóig), T 1 késleltetéshez viszont már csak egyetlen egy (a legelső és a legutolsó). Az autokovarianciának ugyanaz a baja, mint keresztmetszeti esetnél a kovarianciának: a számértéke önmagában keveset mond. Emiatt, szintén a keresztmetszeti esethez hasonlóan, be szokás vezetni az autokorreláció fogalmát, ami gyenge stacionaritás esetén nyilván ρ k = γ k σ (kihasználtuk, hogy a szórás, épp a stacionaritás miatt, minden időpontban σ); mintából becsült 2 értéke előállítható az eddigiek felhasználásával: ρ k = γ k σ 2. Ezt a függvényt szokás (empirikus) autokorreláció-függvénynek (ACF, autocorrelation function) nevezni. (Emiatt néha ρ k helyett az AC k megnevezést is használják.) Az ACF kézenfekvően ábrázolható grafikusan, ha a vízszintes tengelyen k lehetséges értékeit, a függőleges tengelyen pedig az e késleltetésekhez tartozó autokorrelációt ábrázoljuk. (ρ 0 = 1 nyilván, ezért ezt nem szokás külön feltüntetni.) Ezt az ábrát, mely természetesen diszkrét függvény lesz, és így oszlopdiagrammal vagy hasonló módon jeleníthető meg, korrelogramnak szokás nevezni. A 2.3. ábra a 2.2. ábra kék színnel jelölt idősorának korrelogramját mutatja. Bár ábrázolni nem szokták, de általában az ACF-et negatív késleltetésekre is értelmezik. Először a stacionaritást, aztán a korreláció szimmetriáját használva adódik, hogy corr (Y t, Y t+k ) = corr (Y t k, Y t ) = corr (Y t, Y t k ), azaz azt kaptuk, hogy ρ k = ρ k. (Szebben megfogalmazva: az ACF egy páros függvény.) Szintén szoktak beszélni egy idősor parciális autokorrelációs függvényéről (PACF, partial autocorrelation function). Emlékezhetünk rá, hogy a parciális autokorrelációt nem két változó, hanem két változó és változók egy halmaza között értelmezzük; tartalma: a két változó közti kapcsolat erőssége és iránya ha köztük a megadott változókon keresztül terjedő hatásokat kiszűrjük. (Ezúttal sem fontos, hogy ezt pontosan hogyan valósíthatjuk meg, mindenesetre megvalósíthatjuk. Itt természetesen csak lineáris hatásokról beszélünk.) A PACF-függvényt is két időpont

23 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 23 ACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0,4 +- 1,96/T^0,5 0,2 0-0,2-0, lag 2.3. ábra. A 2.2. ábra kék PACF színű for Y_t idősorának = 0,5 + 0,7 * korrelogramja Y_{t-1} + u_t (ACF-függvénye) 0,4 +- 1,96/T^0,5 között számoljuk, a kérdés már csak az, hogy mik a kiszűrt változók. A válasz kézenfekvő: a két 0,2 0 0,4 időpont közötti időpontok (mint valószínűségi változók). Ennek megfelelően a 0 és 1 késleltetéshez tartozó PACF szükségképp ugyanaz, mint a megfelelő ACF (azaz 1 és ρ 1 rendre) hiszen -0,2 0,2 ilyenkor nincs mit kiszűrni. A PACF az ACF-hez hasonlóan becsülhető mintából, ezzel most -0,4 0 nem foglalkozunk. ACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0-0, lag -0,4 A 2.4. ábra mutat egy parciális autokorrelációs (PACF) függvényt, ezúttal is a 2.2. ábra kék idősorának példáján. (Tehát ez, és az előző korrelogram összevethető, olyan értelemben, hogy ugyanahhoz az idősorhoz tartoznak.) Érdemes ellenőrizni előbbi megjegyzésünket arról, hogy az késleltetéshez tartozó ACF és PACF megegyezik. lag +- 1,96/T^0,5 PACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0,4 +- 1,96/T^0,5 0,2 0-0,2-0, lag 2.4. ábra. A 2.2. ábra kék színű idősorának parciális autokorrelációs (PACF) függvénye Végül még egy fontos kérdéskörről kell beszélnünk: az egyes korrelációk szignifikanciájáról. Mintából számolt értékek esetén (mint amilyen az empirikus autokorreláció és parciális autokorreláció) ugyanis soha nem tudhatjuk, hogy mi a valós (értsd: sokasági) értéke a jellemzőnek. A mintából számolt értékeket terheli a mintavételi ingadozás, azaz az a jelenség, hogy a mintából számolt jellemző értéke nem csak a sokasági jellemző értékétől függ, hanem attól is, hogy pont milyen mintát sikerült vennünk (még akkor is, ha a mintavétel tökéletes volt).

24 24 2. FEJEZET. STACIONARITÁS Hiába látjuk tehát például a 2.3. ábrán, hogy az idősor 1 késleltetéshez tartozó autokorrelációja mintegy ρ k = 0,4, nem tudhatjuk, hogy az valójában (értsd: a sokaságban, a valószínűségi változókkal megadott elméleti idősorban) mennyi (a ρ k ). Lehet, hogy 0,3, csak mi pont olyan mintát vettünk, amiben kicsit jobban korreláltak voltak az egymást követő elemek, lehet, hogy 0,5, csak mi pont olyan mintát vettünk, amiben kicsit kevésbé voltak korreláltak az egymást követő elemek, és persze az is lehet, hogy véletlenül épp 0,4. Erről nem tudunk biztos döntést hozni, csak valószínűségit: statisztikai próbát kell alkalmaznunk. A gyakorlatban legfontosabb kérdés, hogy elképzelhető-e, hogy egy adott késleltetéshez tartozó autokorreláció valódi (sokasági) értéke épp nulla (tehát, hogy nincs is azon a késleltetésen autokorreláció). A H 0 : ρ k = 0 H 1 : ρ k 0 hipotézispárra lehetséges statisztikai tesztet szerkeszteni. Egy közelítő (de nem túl kis mintaméretnél azaz idősor-hosszúságnál már elfogadható) megoldás a normális approximáció használata: az az észrevétel, hogy ha egy adott autokorreláció sokasági értéke ρ k, akkor egy sokaságból vett mintán kiszámolt ρ k eloszlása közelítőleg normális lesz ρ k várható értékkel és 1 T szórásnégyzettel (azaz ρ k N ( ρ k, 1/T ) a mintavételi eloszlás), így ρ k ρ k 1/ N (0, 1). Ez alapján a T tesztstatisztika és nulleloszlása (emlékezzünk rá, hogy a nullhipotézis feltételezése, hogy ρ k = 0): ρ k 1/ T N (0, 1). Ha tehát α szignifikanciaszinten [ szeretnénk ] dönteni, akkor azt kell megvizsgálnunk, hogy a ρ k 1/ benne van-e a z T 1 α/2, +z 1 α/2 intervallumban, avagy kívül esik ±z 1 α/2 -n. Ugyanez [ ] 1 másképp megfogalmazva: ρ k benne van-e a z 1 α/2 1 T, +z 1 α/2 T intervallumban, avagy 1 kívül esik ±z 1 α/2 T -n. Ez utóbbi megfogalmazás előnye, hogy segíti az összehasonlíthatóságot: a korrelogramon min- 1 den további nélkül feltüntethetőek a ±z 1 α/2 T határok, és mivel azokat a korrelogramon ábrázolt ρ k -kal kell összevetni, így a hipotézis vizuálisan is megvizsgálható: ha egy oszlop kilóg 1 a ±z 1 α/2 T sávból, akkor az szignifikáns (értve ez alatt azt, hogy adott szignifikanciaszinten elvethető a nullhipotézis, miszerint az autokorreláció sokasági értéke nulla: akkora a mintából számolt érték eltérése a nullától, hogy nem hihető, hogy az csak a mintavételi ingadozásnak lenne betudható, arra kell gondolnunk, hogy a sokasági érték sem nulla), ha benne van ebben a sávban, akkor inszignifikáns (elfogadható adott szignifikanciaszinten, hogy az autokorreláció sokasági értéke nulla, és csak a mintavételi ingadozás miatt nem nullát kaptunk a mintából számolva). Nem túl meglepő módon pontosan ezek azok a sávok, amik a 2.3. és a 2.4. ábrákon kékkel behúzva láthatóak, amint a jobb felső sarokban lévő felirat is mutatja. (Ebből az is kiderül, hogy itt z 1 α/2 = 1,96, tehát 5 %-os szignifikanciaszintre vonatkoznak.)

25 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 25 Egy további fontos kérdés van, amit ennek kapcsán meg kell beszélni. A fent vázolt módszer rendkívüli módon csábít arra, hogy végignézzük az oszlopokat, és ha bárhol kilógót látunk, akkor megörüljünk, hogy találtunk egy szignifikáns autokorrelációt. Ez azonban rendkívül félrevezető lehet, ugyanis tipikus példa a többszörös összehasonlítások helyzetére (multiple comparisons). Amikor ugyanis végignézünk az ábrán, akkor valójában mi bár szinte tudattalan módon, implicite, de hipotézisvizsgálatok sokaságát hajtjuk végre (egész pontosan annyit, ahány késleltetésre készült a korrelogram, a fenti példákban tehát 20-at). Ilyen esetben azonban nem tehetjük meg, hogy megnézzük, hogy van-e szignifikáns különbség, és ha igen, akkor kijelentjük, hogy találtunk szignifikáns autokorrelációt! Ennek az oka abban keresendő, hogy minden egyes hipotézisvizsgálatnak (külön-külön) van elsőfajú hibája. Ha például 5 %-on végeztük a hipotézisvizsgálatot, akkor az egyúttal azt is jelenti, hogy minden egyes teszt (külön-külön) 5 % valószínűséggel akkor is szignifikáns autokorrelációt jelez, ha az valójában nincsen. Ha két tesztet végzünk (például két késleltetést vizsgálunk meg), akkor annak a valószínűsége, hogy legalább az egyik szignifikáns autokorrelációt fog jelezni annak ellenére, hogy egyik késleltetésen sincs autokorreláció 1 (1 0,05) 2 = 0,0975, tehát 10 % kishíján az eredeti szignifikanciaszint duplája! (Az egyszerűség kedvéért most feltételeztük, hogy a tesztek függetlenek.) Ez a jelenség az ún. α-infláció. 20 tesztnél ez a valószínűség már 64 %, tehát az lenne a meglepőbb, ha nem találnák egyetlen szignifikáns eredményt sem (miközben ugye azt feltételeztük, hogy valójában nincs ilyen!). Másként megfogalmazva azt is mondhatnánk, hogy 5 %-os szignifikanciaszinten döntve 20 tesztből várhatóan épp 1 a fals jelzések száma (tehát várhatóan 1 teszt fog még akkor is szignifikanciát jelezni, ha valójában mind a 20 esetben a nullhipotézis áll fenn). Emiatt nem tehetjük meg, hogy kiragadunk egy eredményt ha 20 késleltetésből 1 szignifikáns, azt nem feltétlenül nevezhetjük találatnak, hiszen vegyük észre, hogy ez pont megfelel annak, amit akkor várhatunk, ha egyetlen késleltetésen sincs autokorreláció! (Persze éppenséggel ettől még lehet történetesen valódi szignifikancia is, ezt ne felejtsük el.) Éppen ezért, ha a kérdésfeltevésünk az, hogy az autokorreláció késleltetések egy egész csoportjára együttesen is nulla-e (tipikusan ez a csoport az első valahány autokorreláció, tehát azon ρ t autokorrelációk melyre 1 t M), akkor ennek eldöntésére nem az a helyes mód, ha a fenti tesztet minden késleltetésre megismételjük. Ehelyett külön tesztet kell szerkeszteni a H 0 : ρ 1 = ρ 2 =... = ρ M = 0 nullhipotézis ellenőrzésére. A legnépszerűbb erre 4 az ún. Ljung Box-teszt (vagy Ljung Box Q); tesztstatisztikája és nulleloszlása: Q = T (T + 2) M k=1 2 ρ k H 0 χ 2 T k M 4 E teszt elődje a Box Pierce-teszt volt, melynek tesztstatisztikája és nulleloszlása: Q = T M k=1 ρ k 2 H 0 χ 2 M. Jobb kismintás tulajdonságai miatt ezt szinte teljesen felváltotta a Ljung Box-teszt.

Több megjelenítése