STATISZTIKAI MÓDSZERTANI FÜZETEK, 43 SZEZONÁLIS KIIGAZÍTÁS BUDAPEST, 2005
KÖZPONTI STATISZTIKAI HIVATAL, 2005 ISSN 0324-5985 ISBN 963 215 827 X Készül: a KSH Saiszikai kuaási és okaási főoszályának Minavéeli és módszerani oszályán Főoszályvezeő: dr. Szép Kaalin Összeállíoa: Bauer Péer Földesi Erika Közreműködö: Berki Naália Fábián László Lekorála: dr. Sugár András Másodlagos publikálás csak a forrás megjelölésével örénhe! A kiadvány kialakíása egyedi, annak ördelési, grafikai, elrendezési és megjelenési megoldásai a KSH ulajdoná képezik. Ezek ávéele, alkalmazása eseén a KSH engedélyé kell kérni. E mail: markeing.ksh@office.ksh.hu Információszolgála Telefon : (36 1) 345 6789; Fax: (36 1) 345 6788 Inerne: hp://www.ksh.hu 2
TARTALOMJEGYZÉK 1. Bevezeés...5 2. Szezonális kiigazíási módszerek...6 2.1. A szezonális kiigazíás módszereinek fejlődése rövid örénei áekinés...6 2.2. A szezonális kiigazíás alapjai...9 2.3. Az X szezonális kiigazíási módszer-család röviden...15 2.4. A TRAMO/SEATS módszerről röviden...16 2.5. Bevezeés a szochaszikus módszerekhez...18 2.6. Az X11-ARIMA...22 2.7. X12-ARIMA...31 2.8. A modellalapú megközelíés...36 2.9. Auomaikus modellidenifikáció és paraméerbecslés (TRAMO)...38 2.10. A SEATS...53 2.11. A TRAMO/SEATS diagnoszikái...61 3. Nemzeközi elvárások, gyakorla...64 3.1. A szezonális kiigazíás szabályozása...64 3.2. Szezonális kiigazíás az Eurosanál...67 4. Módszerani válás a KSH-ban...70 5. A KSH szezonális kiigazíási gyakorlaa 2002-ől...78 Irodalomjegyzék...89 A KSH módszerani kiadványsorozaaiban eddig megjelen köeek...92 Conens...96 3
4
1. BEVEZETÉS A gazdasági vagy ársadalmi folyamaok vizsgálaához gyakran idősoroka használnak, amelyek a folyamaok időbeli alakulásá írják le. Az idősorok viselkedésé nagymérékben befolyásolhaják olyan ényezők, amelyek különböző évek azonos időszakaiban (például hónap vagy negyedév) azonos irányban és közel azonos mérékben hanak az idősor alakulására. Ilyen ényezők lehenek az időjárás, a különféle adminiszraív haások vagy a ársadalmi hagyományok. Ezeke a ényezőke együesen szezonális haásnak nevezzük. Az elemzők gyakran a folyamaok olyan jellemzőire kíváncsiak, amelyeke a nagymérékű szezonális haás elfed, ezér szükség van ennek elávolíására. A szezonaliás kiszűrésé szezonális kiigazíásnak nevezzük. Ebben a kiadványban arra vállalkozunk, hogy a szezonális kiigazíás módszeranával kapcsolaos fő kérdésekről, a használ módszerekről és a KSH szezonális kiigazíási gyakorlaáról áfogó, ugyanakkor részlees ismereés adjunk, amely mindazok számára jól használhaó, akik a KSH álal publikál szezonálisan vagy munkanappal kiigazío adaoka igényesen, az adaok előállíásánál alkalmazo módszerek ismereében kívánják felhasználni. Jelenleg a ké legelerjedebb szezonális kiigazíó módszer az X12-ARIMA és a TRAMO/SEATS. A kiadványban részleesen ismerejük mindké módszer, valamin a korábbi, helyenkén még használaos X11-ARIMA módszer is. Beszámolunk a folyamaról, melynek során a TRAMO/SEATS módszer válaszouk a KSH hivaalos szezonális kiigazíó módszerének, és a válaszás befolyásoló ényezőkről, szemponokról, így a szezonális kiigazíással kapcsolaos nemzeközi elvárásokról és gyakorlaról is. Végül bemuajuk a KSH szezonális kiigazíási gyakorlaá, és annak kialakíásánál felmerülő válaszási leheőségeke, a válaszások indokai. A második fejeze egyes részei (2.5 és 2.8-2.11-ig) a szochaszikus idősorelemzésben járaosak számára ajánloak, a öbbi fejeze alapfokú saiszikai ismereekkel is megérheő. 5
2. SZEZONÁLIS KIIGAZÍTÁSI MÓDSZEREK Ebben a fejezeben a örénei áekinés uán röviden ismerejük az idősorelemzés alapveő fogalmai. Először a dekompozíciós idősormodellek segíségével bemuajuk az idősorok komponensei, azok meghaározásának módszerei, majd ezen úlmuava, röviden ismerejük a későbbiekben árgyalásra kerülő X11-ARIMA, X12-ARIMA és TRAMO/SEATS eljárásoka, amelyek azonban már a szochaszikus elemzéshez aroznak. A kövekező fejezeekből pedig részleesen megismerhejük a szochaszikus folyamaok és a módszerek jellemzői. 2.1. A szezonális kiigazíás módszereinek fejlődése rövid örénei áekinés 1 (A fejezeben használ szakkifejezések magyarázaára a kövekező részekben kerül sor.) A 19. század végén Angliában, a csillagásza és a meeorológia erüleén evékenykedő kuaók fogalmazák meg először, hogy egy megfigyel idősor öbb, meg nem figyelheő ényező összhaásának az eredménye. A korabeli kuaók úgy gondolák, hogy a ké válozó közöi hamis" korreláció a rend okozza, amelye ezér előbb ki kell szűrni az idősorból. Poyning (1884) és Hooker (1901) a rende és a szezonális haásoka az árak öbb évre örénő álagolásával próbála kiszűrni. Spencer (1904) és Andersen (1914) muaa be magasabb fokú polinomok alkalmazásá a rend leválaszására. A közgazdaságan erüleén evékenykedő kuaók a gazdasági ciklus kimuaása érdekében válaszoák le a szezonális haásoka és a rende. Az 1920-as és 1930-as években kezdődö meg az igazán akív kuaás a szezonális kiigazíás erüleén Person (1919) munkája kövekezében, amelyben felíra a híres képlee, ami szerin (muliplikaív modell 1 Fischer (1995) alapján. 6
feléelezve) egy idősor kifejezheő a kövekező formában: X = S T C R ahol S a szezonális ingadozás leíró komponens; T a hosszúávú rend; C a középávú ciklus; R a vélelen ényező. Person módszere állandó szezonális ényezőke használ, annak ellenére, hogy a kor saiszikai irodalmában öbb publikáció szól arról, hogy a fix szezonaliás feléelezése sok eseben nem helyálló. Sydensicker és Brien (1922) vezeék be formális szezonális kiigazíó modellben a válozó szezonális ényezőke. Crum 1925-ben módosíoa Person módszeré, hogy alkalmassá váljon a válozó szezonaliás kezelésére. A első áfogó szezonális kiigazió rendszer Macauley (1931) dolgoza ki. A módszer három alaplépésből áll: havi adaoka feléelezve 12 agú cenrírozo mozgóálag leválaszása és ezek álagolása uán fix szezonális ényezők előállíása; a rend becslése lineárisan vagy magasabb fokszámú polinom illeszésével; a mozgóálagok oszása a rend becsül érékével a ciklikus komponens érékének becslésé adja. Ez a módszer nevezik ma klasszikus dekompozíciónak, amely sok modern szezonkiigazíó eljárásnak képezi alapjá, így a legelerjedebb X11-nek is. Az 1950-es évek során ké fonos újíás örén. Az első az exponenciális simíó eljárások elerjedése vol, amelyekkel az addigi számíások mennyiségé jelenősen csökkeneni lehee, legalább ugyanolyan jó eredmények melle, min a korábban használ módszerekkel. A másik fonos fejlődés a számíógépek megjelenése jelenee, ami szinén a számíások gyorsaságának növekedésé segíee elő. Arra, amire korábban 7
öbb nap kelle, mos pár másodperc is elég vol. A kuaók így sokkal bonyolulabb modelleke dolgozhaak ki, hiszen az új verzióka könnyen eszelheék nagy számú idősoron is. A Census I. módszer 1954-ben jelen meg; ez annyival lépe úl a Macauley-féle eljáráson, hogy az idősor egyszerű exrapolálással előrehára meghosszabbíoa, hogy póolja a mozgóálagolás során elvesze elemeke. Ennek ovábbfejlesze válozaa a Census II. (1955), amely az akkor használaos echnikák elekronikus verziója vol kidolgozásában Julius Shishkin jászo úörő szerepe. A Census II- öbb kriika is ére, mégpedig azzal kapcsolaban, hogy a módszer sok ekineben ad hoc jellegű eljárásokra épül, amelyeke nem ámasz alá semmilyen saiszikai elméle a szezonális ingadozásoknak csak a kiugró részei szűri ki, a öbbi benne hagyja sb. A modell folyamaos felülvizsgálaá köveően alakul ki 1965-re az X11-es váloza, amely a közelmúlig a legelerjedebb szezonális kiigazíó eljárás vol. Ennek legfőbb újdonsága a munkanapényező regressziós módszerrel örénő kezelése. Ezen kívül az új válozaban a felhasználó válaszha az addiív és a muliplikaív modell közö és meghaározhaja, hogy milyen mozgóálago kíván használni. Box és Jenkins az auoregresszív mozgóálagolásra irányuló, 1970-es években folyao kuaásainak haására fejlődö ki 1980-ra a kanadai saiszikai hivaalnál az X11-ARIMA váloza, ami abban különbözö elődeiől, hogy az idősor előre és hára örénő meghosszabbíásá az ARIMA-modellezés segíségével végeze el. Ez a becslés minőségé javíoa. Az újabb X11-ARIMA/88 és X11-ARIMA/2000 verziók főleg diagnoszikákkal bővíeék az addigi módszeran. Az 1990-es évek közepén jelen meg az X12-ARIMA program, amely új alapokra helyeze a munkanapok, ünnepnapok és oulierek haásának elemzésé és a hiányzó adaok pólásá; valamin ovább bővíee a diagnoszikák köré. A mozgóálagolású echnikák amelyekről udjuk, hogy erősen ad hoc jellegűek melle kifejlődek modellszemléleű megközelíések is, amelyek közö érdemes megkülönbözeni a deerminiszikus és szochaszikus jellegű modelleke. A deerminiszikus modellek a rende és a szezonaliás egy előre elrendel pályának ekinik; amelyre a vélelen csak olyan módon gyakorol haás, hogy eléríi az idősor ényleges éréké eől a pályáól. A deerminiszikus jellegű modellek a regressziószámíásra épülnek, amely a rende és a szezonaliás valamilyen deerminiszikus módon megado 8
függvényekkel kezeli. Ebbe a modellcsaládba aroznak a DAINTIES és a BV4 programok. A szochaszikus módszerek a vélelennek jelenős haás ulajdoníanak, ez a modellezésben fonos szerepe jászik. Ezek örénee Yule auoregresszív (1927), illeve Slusky mozgóálagolású modelljéig (1937) nyúlik vissza. Wold alkalmaza először a mozgóálagolású modell valós adaokra, illeve ő dolgoza ki a vegyes ARMA-modellek használaá (1954). Azonban a számíások nehézkessége mia az ARMA-modelleke csak nagyon kevesen használák, egészen a számíógépek széles körű elerjedéséig, illeve amíg Box és Jenkins meg nem fogalmaza azoka a kriériumoka, amelyekkel minden idősorra meghaározhaó egy konkré ípusú és fokú ARIMAmodell. Ennek álalános képlee szezonális idősorra: s d D s φ p ( B) Φ P ( B ) s z = θ q ( B) ΘQ ( B ) ε, ahol B a késleleési operáor ( Bz = z 1 ), így z = ( 1 B) z, ovábbá s s φ p ( B), Φ P ( B ), θ q ( B), ΘQ ( B ) a nemszezonális és szezonális auoregresszív és mozgóálag polinomok, ε pedig fehér zaj folyama. A log (0,1,1)(0,1,1) modell (az ún. Airline-modell, ami arról kapa a nevé, hogy egy légiársaság adaai használák a módszer bemuaására), viszonylag kevés paraméerrel jól illeszheő sok idősorra. A modell első gyakorlai megvalósíása az Angol Nemzei Bankban örén a '80-as években. Ez fejleszeék ovább a Spanyol Nemzei Bankban Augusin Maravall irányíása ala, ennek eredménye a TRAMO-SEATS program. Annak ellenére, hogy a program egy eljesen új megközelíés alkalmaz, az uóbbi években nagyon széles körben elerjed. 2.2. A szezonális kiigazíás alapjai Az idősorelemzés alapfogalmairól a Hunyadi-Mundruczó-Via (1996) könyvben olvasha részleesebben. 9
Az idősorelemzés ípusai Az idősorelemzés során olyan időponra vagy időszakra vonakozó adaok sorozaá vizsgáljuk, amelyek szabályos időközönkén (havona, negyedévene) állnak rendelkezésünkre. Ezek az adaok lehenek alapadaok, vagy az alapadaokból képze indexek is. Az idősorok vizsgálaánál különbsége kell ennünk a deerminiszikus és a szochaszikus elemzés közö. A deerminiszikus modell abból indul ki, hogy az idősorok egy előre meghaározhaó (deerminál) pályá kövenek, amely hosszú ávon nem válozik Ezek a modellek a vélelen ényező léé elfogadják, de igyekeznek haásá kiszűrni. Ezzel szemben a szochaszikus elemzés a vélelen ényező a folyama alapveő részének ekini. A rövid ávú haásoka vizsgálja és valószínűségi válozóka alkalmaz a folyama modellezéséhez. Az idősorok komponensei és kapcsolódási leheőségei A megfigyel idősoroknak négy fő komponensé különbözehejük meg: Trend (ŷ): a hosszú ávú alapirányzao muaja. A rende meghaározhajuk az analiikus rendszámíás segíségével, amikor a arós irányzao függvényszerűen írjuk le, vagy mozgóálagok segíségével. Mindké esee később részleesen megvizsgáljuk. Szezonális komponens (s, s*): a rendől való elérés, a rövid ávú (éven belüli), szabályos ingadozás méréke. Ciklikus komponens (c,c*): a szabályalan hosszabb ávú ingadozás muaja. Vélelen ényező (ε,ν): előre nem jelezheő haások, vélelen válozók, amelyről feléelezzük, hogy várhaó érékük 0 vagy 1. Az egyes komponensek öbbféleképpen kapcsolódhanak egymáshoz. Összegszerű kapcsolódás eseén addiív modellről beszélünk: y = ŷ + s + c + ε Ez a modell abból indul ki, hogy a rend és az eredei adaok különbsége az azonos időszakokban (hónapokban, negyedévekben) közel állandó, 10
függelenül aól, hogy a rend milyen endenciá mua, azaz a szezonális elérés méréke nagyjából megegyezik. Muliplikaív modellnek nevezzük a dekompozíció, amikor szorzaszerűen kapcsolódnak egymáshoz a ényezők: y = ŷ s* c* ν A szorzaszerű összekapcsolódásnál abból indulunk ki, hogy a rend és az eredei adaok elérésének nem a méréke, hanem a rendhez viszonyío aránya ekinheő állandónak, azaz a szezonindexek nagysága lesz közel állandó. Ilyenkor növekvő rend eseén a kilengések is egyre nagyobbak, míg csökkenő rend eseén ezek méréke is csökkenő. Logaddiív modellről beszélheünk, ha az idősor logarimusára írunk fel addiív modell. Muliplikaív módon dekomponál idősor logarimusá felírhajuk a komponensek logarimusainak összegekén. Ily módon a muliplikaív modell visszavezeheő a logaddiív modell eseére, ezér ez a ké uóbbi modellípus gyakran nem különbözeik meg. Az angol saiszikai hivaalban fejleszeék ki a pszeudoaddiív modellípus, amely akkor használaos, amikor a felbonás alapveően muliplikaív, de az idősor zéró vagy zéróhoz közeli érékeke is felvehe: y= ŷ (s + ν 1) A modellípus csak az X családba arozó szezonális kiigazíási módszerek ámogaják, a TRAMO-SEATS nem. A ciklikus komponens számíásával a ovábbiakban részleesen nem foglalkozunk, hiszen ez csak nagyon hosszú idősorok eseén érdemes külön vizsgálni. A ovábbiakban az álalános gyakorlanak megfelelően a rendbe a ciklikus komponens is beleérjük, mind a deerminiszikus, mind a szochaszikus elemzésnél. Trendípusok az analiikus rendszámíásban Az analiikus rendszámíás során leggyakrabban lineáris rendfüggvény alkalmaznak az alapirányza meghaározására, mer rövid időszakokra jól illeszkedik, és ennek kiszámíása, érelmezése a legegyszerűbb. Ebben az eseben az adaok állandó mérékű válozásá feléelezzük. A lineáris rend melle nemlineáris összefüggés is feléelezheünk az idősorról. Ebben az eseben számolhaunk exponenciális rende, ha az 11
alapadaok válozásának állandó üemé feléelezzük, vagy polinomiális rende, illeve ennek speciális eseé a parabolikus rende is. Mozgóálagolású rend A mozgóálagolású rendszámíás lényegében ámenee képez a deerminiszikus, függvények segíségével meghaározo rend és a szochaszikus, valószínűségeken alapuló rendszámíás közö. Mozgóálagolás eseén a rende nem egy képleel meghaározo függvény jeleni, hanem az eredei adaok álagolásával kapjuk meg a rend érékei. Ugyanakkor ebben az eseben a szochaszikus elemzéssel szemben a rend és a öbbi komponens meghaározása nem kapcsolódik szorosan össze, nem egyszerre, hanem egymás uán örénik kiszámíásuk. A. időszak rendéréké a. érék és a környezeében lévő elemek álagakén számíjuk ki. Az álagolással egyrész simíjuk az idősor, azaz csökkenjük a vélelen ag szerepé, másrész a érékének válozaásával az alapendenciá próbáljuk köveni. A mozgóálag agszámának meghaározásánál figyelembe kell vennünk az idősor éven belüli szezonaliásának alakulásá. Ha az éven belül periodiciás figyelheő meg, akkor ennek megfelelően kell megválaszani a agszámo. Azaz például szezonaliás aralmazó negyedéves adaok eseében 4 agú mozgóálago, havi adaok eseében 12 agú mozgóálago célszerű válaszani. Amennyiben az idősor semmilyen periodiciás nem aralmaz, akkor szabadon haározhajuk meg a agszámo. A szezonális komponens A deerminiszikus idősorelemzésnél a szezonaliás haásá állandónak ekinjük, azaz az idősor eljes hosszán az azonos időszakokban ugyanakkora a szezonaliás nagysága. Az állandó szezonaliás feléele a szochaszikus elemzésnél már nem eljesül, o az ún. mozgó szezonaliás is figyelembe veszik a módszerek. A szezonális komponens számíási módjánál alapveő kérdés annak eldönése, hogy az idősorelemzés addiív vagy muliplikaív modellel végezzük. Szerencsés eseben az idősor adaaiból is láhaó, hogy melyik modell írja le jobban az idősor viselkedésé. Amennyiben az idősor elemei közö addiív kapcsolódás van, akkor a szezonális haás számszerűsíő 12
komponens szezonális elérésnek nevezzük. Muliplikaív modell eseén pedig szezonindexe számolhaunk. A szezonálisan kiigazío idősor A meghaározo komponensek segíségével számíhaó ki az úgy neveze szezonálisan kiigazío idősor. Ebben az eseben az eredei adaoka iszíjuk meg a szezonális haásól, azaz minden egyes érékből kivonjuk az ado időszakhoz (hónaphoz, negyedévhez) arozó szezonális elérés éréké, vagy oszunk a szezonindex érékével. Az így kapo idősor ehá a rende és a vélelen ényező aralmazza. Az oulierek Ouliernek (kiugró éréknek) az olyan adao ekinjük, amely nem illeszkedik a megfigyel idősor endenciájába, kívül esik a rend és a szezonális ényező álalános minája alapján várhaó érékhaárokon. Az ouliernek ekine érék háerében álalában valamilyen egyszeri gazdasági, vagy ársadalmi esemény áll, amelynek haására az idősor adaai hosszabb vagy rövidebb időre elérnek a korábbi endenciáól. Ilyen esemény lehe például az ipari ermelés eseén, egy iparágon belül egy meghaározó üzem bezárása, amelynek haására a ermelés színvonala visszaesik, hiszen a ovábbiakban az ada csak a megmarad üzemek ermelésé muaja. Hasonló haású lehe például egy új jogszabály megjelenése, egy új ámogaási forma, vagy adó bevezeése. Az előzőekben bemuao deerminiszikus módszerek nem veszik figyelembe az ouliereke, a szochaszikus módszereken alapuló szezonális kiigazíó módszerek azonban igen. 2 Ugyanakkor ha a kiigazíás során nem vesszük figyelembe a kilógó érékeke, akkor mind a rendre, mind pedig a szezonális ényezőre orz becslés kapunk. Az oulierek öbb fajájá különbözejük meg, de ezek közül a három leggyakrabban alkalmazo: (1. ábra) 2 A meghaározás az X11-ARIMA program eseén igaz. Az X12-ARIMA és a TRAMO/SEATS program eseében az oulierek meghaározása a komponensekre bonás elő örénik. O az eredei idősorra illesze modellől jelenősen elérő érékek ekinheőek ouliernek. 13
Addiív oulier (AO): a haás csak egy megfigyelés éréké befolyásolja. Csillapodó jellegű örés (Temporary change, TC): egy megfigyelés éréke kiugró, majd a kövekező megfigyeléseknél fokozaosan (exponenciálisan) csökken a kiugrás méréke, míg végül az idősor visszaáll az eredei szinre. Szinelolódás (Level Shif, LS): egy időszakól kezdve az összes megfigyelés éréke ugyanannyival ugrik ki a korábbi érékekhez képes, azaz az idősor szinje arósan megválozik. 1. ábra: A kiugró érékek ípusai Addiív kiugró érék Csillapodó jellegű örés Szinelolódás A szezonálisan kiigazío adasor mindhárom oulierípus aralmazhaja, a rendbe azonban csak a szinelolódás kerül bele, mer ennek haása hosszú ávon érvényesül. Munkanaphaás Az idősor alakulására az is haással lehe, hogy egy-egy időszakban (például hónapban) mennyi a munkanapok száma. A problémá az okozza, hogy a munkanapok száma nemcsak időszakról időszakra válozha, hanem még a különböző évek azonos időszakaiban is különbözhe, így közönséges szezonális haáskén nem kezelheő. 14
A munkanapok számá az ado időszakban lévő, nem hévégére eső ünnepek száma is befolyásolja. Mivel az egyes országokban a nemzei ünnepek elérően alakulnak, ezér mindenhol az ado ország ünnepnapjai célszerű figyelembe venni. A munkanapok száma nem befolyásolja minden idősor adaá. Például egy olyan iparágban, ahol az üzemek folyamaosan ermelnek függelenül aól, hogy munkanap vagy szabadnap van, o a munkanapok száma nincs haással a megfigyel érékekre. A húsvé haásának kiemel kezelésére is szükség lehe bizonyos idősoroknál (például kiskereskedelmi forgalom), mer a húsvé mozgó ünnep: lehe márciusban vagy áprilisban is, és haása befolyásolhaja a húsvéo megelőző egy hees időszako is. Ha a megfigyel idősor érékeiből csak a munkanapok és a húsvé haásá szűrjük ki, de a szezonaliás nem, akkor a munkanappal kiigazío adasor kapjuk. 2.3. Az X szezonális kiigazíási módszer-család röviden Az X család legrégebbi még ma is használ agja az X11 módszer. A komponensekre bonás isméel mozgóálagolásokkal valósíja meg. Ez a dekompozíciós rész gyakorlailag válozalan a család legújabb agjánál, az X12-ARIMA-nál is. Az eljárás képes kezelni a komponensek addiív, muliplikaív, logaddiív és pszeudo-addiív összekapcsolódásá is. A dekompozíció lényege az, hogy először egy mozgóálagolás segíségével egy kezdei rendbecslés állíunk elő, a rend leválaszása uán a szezonaliás is mozgóálagolással becsüljük, és így kapunk egy kezdei szezonálisan kiigazío idősor. A második lépésben ebből az idősorból kiindulva egy ún. Henderson-rendszűrő segíségével (ami egy speciális mozgóálagolású szűrő) nyerjük a rend második becslésé, majd újra megbecsüljük a szezonaliás, és megkapjuk a szezonálisan kiigazío idősor második, és egyben végső becslésé. A harmadik lépésben a rende még egyszer megbecsüljük a végső szezonálisan kiigazío idősorból Henderson-szűrő segíségével. A leír eljárás problémája, hogy az idősorok elején és végén a mozgóálagoláshoz olyan érékekre is szükség van, amik nem állnak (még) 15
rendelkezésre. Az X11-ARIMA és X12-ARIMA eljárásoknál a hiányzó adaoka úgy póolják, hogy ARIMA-modell segíségével előrejelzik, illeve visszajelzik az idősor. Az oulierek kezelése az X11-módszer eseében megleheősen ad hoc jellegű, a becsül irreguláris komponens alapján örénik. Az X12-ARIMA az ún. regarima-módszer (regresszió ARIMA-hibaaggal) használja az oulierek becslésére. A módszer az idősorra egy ARIMA-hibaaggal rendelkező lineáris regresszió becsül, ahol a magyarázó válozók a megfelelő ouliereke leíró válozók. Az oulierek auomaikus keresése bonyolul ierációs eljárással örénik. Az X12-ARIMA eseében a munkanaphaás, húsvéhaás, szökőnaphaás és egyéb felhasználó álal definiál haások kezelése is a regarima módszerrel örénik, a haás leíró válozó magyarázóválozókén a regresszióban szerepel. Az X család, különösen az X12-ARIMA számos diagnosziká bocsá a felhasználó rendelkezésére. A legfonosabbak: a szezonaliás szignifikanciájának vizsgálaa varianciaanalízis segíségével; az M-saiszikák, amelyek a szezonális és irreguláris komponensre vonakozó sabiliási muaók; a Q-saiszika, amely az M-saiszikák lineáris kombinációja; és a Sliding spans és Revision Analysis, amelyek a szezonális kiigazíás eredményeinek sabiliásá vizsgálják. 2.4. A TRAMO/SEATS módszerről röviden A TRAMO és a SEATS programo a Spanyol Nemzei Bankban fejleszeék ki. A TRAMO (Time Series Regression wih ARIMA Noise, Missing Observaions and Ouliers Idősorregresszió ARIMA-zajjal, hiányzó megfigyelésekkel és oulierekkel /kiugró érékekkel/) és a SEATS (Signal Exracion in ARIMA Time Series Jelkinyerés ARIMA idősorokban) programo együ használhajuk idősorok szezonális kiigazíására. A TRAMO álal végze előkészíés és a SEATS álal végze felbonás is eljes mérékben modell alapú, szemben például az X12-ARIMA eljárással. A TRAMO egy olyan regressziós modell illesz az idősorra, ahol a hiba ag egy ARIMA folyama, és auomaikusan azonosíhaó a modell és 16
becsülheők a paraméerei. A regressziós válozóka megadhaja a felhasználó, vagy a program generálja. A program álal generál válozók lehenek például a munkanaphaás, húsvéhaás válozók, illeve az ouliereke leíró válozók. A TRAMO eszeli a munkanaphaás és a húsvéhaás megléé, és ennek megfelelően kiigazíja az idősor. Meghaározza az oulierek helyé, ípusuka (addiív, szinelolódás, vagy csillapodó jellegű örés) és megiszíja haásukól az idősor. Amennyiben az ARIMA-modell auomaikusan haározzuk meg, akkor az oulierek deekálása és az ARIMA-modell és paraméereinek becslése párhuzamosan, ieraív módon örénik. A TRAMO a hiányzó megfigyelésekhez kísérlei (nagyon nagy vagy nagyon kicsi) éréke rendel és addiív oulierkén kezeli. Az így megiszío (linearizál) idősor kapja meg a SEATS, amely ARIMA-modell alapú módszer alkalmaz az idősor nem megfigyel komponensekre bonásához. Ezek a komponensek a rend, a ciklikus, a szezonális és az irreguláris komponens. Feléelezi, hogy a komponensek is ARIMA-modell kövenek. A komponensekre való felbonás frekvencia arományban örénik: a modell spekrumá felbonja a különböző komponensek spekrumainak összegére. Ezzel meghaározza a komponensekre az ARIMA-modelleke, majd megbecsli a komponensek érékei. Végül bevonja a TRAMO álal kiszűr ouliereke és napári haásoka (munkanap- és húsvéhaás) a különféle komponensekbe, és így kapja az úgyneveze végső komponenseke a kövekezőképpen. Az addiív és csillapodó jellegű örés ouliereke az irreguláris komponensbe, a szinelolódás ouliereke a rend komponensbe illeszi, a napári haások a szezonális komponensbe kerülnek. Így a szezonálisan kiigazío idősorban (ami a rend komponens és az irreguláris komponens összege, ha a modell addiív, illeve szorzaa, ha muliplikaív) benne lesznek az oulierek is. Lényeges megéreni, hogy milyen sok függ a TRAMO álal kiválaszo (vagy álalunk megado) ARIMA-modellől. Eől függnek az oulierek, a munkanaphaás, illeve az idősor komponensekre bonása is. Az ARIMA-modell, illeve paraméereinek megválozaásán kívül nincs mód a komponensekre bonás befolyásolni, ellenében például az X12-ARIMAval, ahol a komponensekre bonáshoz kiválaszhajuk a megfelelő szűrő. 17
2.5. Bevezeés a szochaszikus módszerekhez A deerminiszikus idősorelemzés azér nevezik deerminiszikusnak, mer az idősornak a vizsgála szemponjából lényeges komponensei deerminiszikusak, azaz a múlbeli érékek alapján a jövőbeli érékek ponosan megjósolhaók. Ilyenkor a vélelen haásá egy külön összeevőbe ömöríjük és leheőleg minél jobban elimináljuk a becslések, illeve az előrejelzések során. Ez a komponens fogja képezni a becslések maradéká a reziduumoka és egyben a becslések hibájá is a deerminiszikus modellben. A szochaszikus idősorelemzésnél viszon a vizsgála szemponjából lényeges komponensekben is figyelembe vesszük a vélelen haásá, a komponenseke egy-egy szochaszikus folyama realizációinak ekinjük. Az alábbiakban ismereendő X11-ARIMA és X12-ARIMA, de főképpen a TRAMO/SEATS elszakad a deerminiszikus idősorelemzésől és már szochaszikus módszereke használ. Míg az X család ad hoc jellegű dekompozíciós módszere viszonylag könnyen megérheő mélyebb szochaszikus idősorelemzési ismereek nélkül is, addig a TRAMO/SEATS erősen ámaszkodik az ARIMA-modellekkel kapcsolaos ismereekre. A kövekezőkben felsoroljuk a kövekező részek megéréséhez szükséges alapfogalmaka, alapismereeke, feléelezve, hogy ezeke az olvasó ismeri, vagy uánanéz a gyakorlailag kizárólag angol nyelven hozzáférheő szakirodalomban. Irodalomkén javasoljuk Brockwell és Davis (1996), illeve Hamilon (1994) könyvé. Magyarul Tusnády és Ziermann (1986) könyve (ARIMA-modellek nem, csak ARMA-modellek szerepelnek), valamin néhány egyeemi jegyze elérheő. A KSH módszerani füzeek (nemzeközi módszerani füzeek, ill. ökonomeriai füzeek) sorozaban is megjelen néhány idősorokkal, illeve szezonális kiigazíással foglalkozó köe. Halabuk és mások (1964) kifejezeen a szezonális kiigazíás korszerű módszereivel (Census II) foglalkozak. Hrubos és mások (1968) különféle szezonális kiigazíási eljárásoka hasonlíoak össze. Hulyák (1977) a szezonális kiigazíás melle ARIMA-modellekről és előrejelzésről is ír. Freschl és mások (1982) idősorelemzéssel és szezonális kiigazíással is foglalkozak. 18
Szükséges fogalmak: Szochaszikus folyama, sacionárius folyama. Auokovariancia függvény, auokorreláció függvény, ezek becslései. Fehérzaj, auoregresszív (AR) folyama, mozgóálag (MA) folyama. Auoregresszív-mozgóálag (ARMA) folyama. Auoregresszív inegrál mozgóálag (ARIMA) folyama. Néhány jelölésbeli konvenció, ami köveünk: a visszaolás (avagy visszalépeés, backshif, késleleés, lag) operáor B beűvel jelöljük (a másik elerjed jelölés az L beű). Az idősor jelölésben nem különbözejük meg a szochaszikus folyamaól, amelyből realizálódo: álalában x -vel vagy y -vel jelöljük. Az innovációka (vagy sokkoka) a -vel jelöljük. Szükséges udnivaló még a szezonális ARIMA-modellek fogalmának ismeree, mivel ez a fogalom a későbbiek folyamán gyakran előfordul, ezér mos i definiáljuk. Amennyiben a vizsgál idősor szezonális, akkor a szezonális késleleésekhez (12 megfigyelés havi adaoknál) arozó auokorreláció szignifikánsan elér nulláól. Közönséges ARIMA-modellekkel az ilyen idősorok nem jellemezheők jól, mer ezeknek az auokorrelációknak a figyelembevéeléhez úl magas (12 vagy öbb) auoregresszív, illeve mozgóálag rendű modell kellene becsülni. A megoldás az ún. szezonális auoregresszív inegrál mozgóálag (szezonális ARIMA vagy SARIMA) modell jeleni. Valójában egy speciális ARIMA-modellről van szó, ahol bizonyos együhaók zérusok, más együhaókra pedig a felírásból eredő feléelek eljesülnek. Álalánosíás az jelen, hogy leheséges a szezonális differenciálás is (azaz 1-B s operáor alkalmazása). Ké ípusuk az addiív illeve a muliplikaív SARIMA-modell. Az addiív ípussal i nem foglalkozunk. A muliplikaív SARIMA(p, d, q)(p, D, Q) modellípus álalános képlee a kövekező: ahol S d D S φ B) Φ ( B ) y = θ ( B) Θ ( B ) a, (11) p ( P s q Q 19
φ ( B) Φ p P ( B S ) = (1 + φ B + φ B 1 2 2 +... + φ B az ún. auoregresszív operáorpolinom, ill. θ ( B) Θ q Q ( B S ) = (1 + θ B + θ B az ún. mozgóálag operáorpolinom, és 1 d 2 a differenciaképzés operáora. 2 D s p +... + θ B q = ( 1 p q )(1 + Φ B 1 )(1 + Θ B 1 d s D B ) (1 B ) S S + Φ + Θ 2 2 B B 2S 2S +... + Φ +... + Θ P Q B B PS QS ) ) A TRAMO/SEATS-módszer dekompozíciós eljárása a spekrum felbonására épül, ezér a spekrál analízis (vagy frekvenciaarománybeli elemzés) lényegé röviden összefoglaljuk: Régóa alkalmazo függvényvizsgálai echnika a Fourier-analízis, amelynél egy periodikus függvény különböző frekvenciájú és ampliúdójú szinuszok és koszinuszok végelen összegére bonunk fel, ahol a frekvenciák előre adoak, és a függvény a megfelelő frekvenciához arozó ampliúdókkal jellemezzük. Ez a felírás hívják Fourier-sornak. A kérdéses ampliúdók az ún. Fourier-együhaók. Az eljárás álalánosíhaó nem periodikus függvények és sorozaok vizsgálaára is. A Fourier-analízis minájára vezeék be az idősorok vizsgálaára a spekrál analízis. A spekrál analízis az a megközelíés alkalmazza, hogy egy sacionárius idősor auokovariancia függvényének érékei írja fel egy ún. spekrális sűrűségfüggvény Fourier-együhaóikén. A spekrális sűrűségfüggvény röviden spekrumnak szokás nevezni, és a [-π, π] inervallumon érelmeze szimmerikus, nemnegaív függvényről van szó. Spekrális sűrűségfüggvény nem minden sacionárius idősorhoz léezik, de a léezéshez elégséges, hogy az auokovarianciák abszolúérékeinek összege véges legyen. Ez a legöbb gyakorlaban előforduló idősornál feleheő. 3 3 Megj.: például az ún. hosszú memóriájú (vagy hosszú ávon összefüggő) folyamaokra a feléel nem igaz. Az ilyen folyamaoknál az auokovariancia függvény lassan cseng le, ezér az auokovarianciák abszolú összege végelen. Ennek ellenére ezeknek a folyamaoknak is van spekrális sűrűségfüggvényük. 20
Ilyenkor a spekrum egyszerűen felírhaó a kövekezőképpen: 1 ihλ f ( λ) = e γ ( h), 2π h= ahol γ az auokovariancia függvény. Ennek az összefüggésnek a segíségével bizonyos folyamaok spekruma 2 σ egyszerűen számolhaó, például egy σ szórású fehérzaj spekruma, azaz 2π konsans. A spekrumban megjelenő csúcsok az ado frekvenciához arozó periodikus viselkedés jelzik az idősorban. A spekrum vizsgálaa segísége jelen akkor is, amikor úgyneveze időinvariáns lineáris szűrők haásá vizsgáljuk. Például az ARMA-folyama is érelmezheő egy speciális időinvariáns lineáris szűrő oupujakén, ami a fehérzajra, min inpura alkalmaznak. Ilyen eseben az inpu folyama spekrumának és a szűrő ún. négyzees erősíésének (squared gain) 4 szorzaakén áll elő az oupu spekruma. Az X család és a TRAMO/SEATS szezonális kiigazíásának eredménye is érelmezheő az eredei idősorra ve valamilyen időinvariáns lineáris szűrő oupujakén, ezér a spekrális megközelíés hasznosnak bizonyul a szezonális kiigazíás különféle módszereinek összehasonlíásánál is. A spekrum előállíásánál az elmélei auokovariancia függvényből indulunk ki, ehá elmélei spekrumról van szó, amelye az idősor ényleges realizációja alapján becsülni kell. A becslésre alapveően ké mód kínálkozik. Az egyik az ún. periodogrammal (illeve simío periodogrammal) való becslés, amelynél lényegében az auokovariancia függvény becslésének segíségével örénik a spekrum becslése. A másik leheőség, hogy az idősorra valamilyen modell (például ARMA) becslünk, és a modell elmélei spekrumának ismereében kiszámíjuk az idősor spekrumá. Ez uóbbi megközelíés alkalmazza a TRAMO/SEATS módszer a spekrum becslésére. A spekrumo a feniekben sacionárius idősorokra érelmezük, de leheőség van bizonyos nemsacionárius idősorokra a spekrumhoz hasonló ún. pszeudo-spekrumo érelmezni. A (szezonális) ARIMA-modell pszeudo- 4 Más szóhasználaal: eljesímény ávieli függvény (power ransfer funcion). 21
spekrumá úgy kapjuk meg, hogy egy olyan ARMA-modell spekrumá írjuk fel, ahol a differenciaképzés beleérjük az auoregresszív részbe, azaz egységgyököke is megengedünk az auoregresszív polinomban. Ilyen módon a spekrumnak bizonyos helyeken pólusai lesznek, azaz a reguláris (azaz sima) differenciálásnak megfelelő zérus, illeve a szezonális differenciálásnak megfelelő szezonális frekvenciáknál a spekrum éréke végelen. Képleel: ha x egy szezonális ARIMA-folyama, és φ ( B ) x = θ ( B) a, ahol φ az auoregresszív polinom, amely a differenciálás is aralmazza, θ a mozgóálag polinom, a pedig szórású fehérzaj, akkor az x folyama pszeudospekruma: 2 iλ σ θ ( e ) f x ( λ) =. 2 2π iλ φ( e ) 2 2.6. Az X11-ARIMA Min az a korábbi részben emlíeük, az idősorok összeevői öbb módon is kapcsolódhanak egymáshoz: leggyakrabban összegszerűen, illeve szorzaszerűen. Az előbbi addiív, az uóbbi muliplikaív modellhez veze. Mivel a gazdasági idősorok öbbsége muliplikaív összekapcsolódás feléelez, ezér a program ismereésénél használ példák is erre a modellípusra fognak vonakozni. Muliplikaív modell eseén az idősor felbonása: Y = T S I D E ahol T a rend, S a szezonális komponens, I a vélelen haás, D a munkanaphaás, E a húsvéhaás. Az X11-ARIMA program fő lépései a kövekezők: 1. ELŐZETES KORREKCIÓK a) Az idősor előzees korrekciója b) A munkanaphaás ( D ) becslése és elávolíása 22
c) A húsvéhaás ( E ) becslése és elávolíása Y = Y / D E 1 d) ARIMA-modell segíségével az idősor előrejelzése és kiegészíése 2. A TREND, A SZEZONÁLIS TÉNYEZŐK ÉS A VÉLETLEN HATÁS ELŐZETES BECSLÉSE M[ Y Y 2 M[ Y Y 3 M[ Y 1 = Y 2 = Y 3 ] = T 1 ] = S 1 / T / S ] = T előz előz előz előz 1 = S I = T I 3. A KILÓGÓ ÉRTÉKEK BECSLÉSE ÉS HELYETTESÍTÉSE UTÁN A 1 2. SZAKASZ LÉPÉSEINEK MEGISMÉTLÉSE ( T -e használjuk a rend előzees becslésekén az első lépésben) 4. A KOMPONENSEK VÉGSŐ BECSLÉSE A szezonálisan kiigazío idősor becslése: Y = Y. szez.kiigazío 1 vég vég vég vég vég / S D H = T I Mos nézzük az egyes lépéseke részleesebben. 1. a) Az idősor előzees korrekciója Mielő a program megkezdi a kiigazíás, a felhasználónak leheősége van arra, hogy az idősorra vonakozó előzees információi rögzíse, és a szezonális kiigazíás megkezdése elő megválozassa mindazoka az adaoka, amelyek az idősor álalános minájába nem illeszkednek. Megadhaunk korrekciós ényezőke az egyes hónapokra, ha például figyelembe akarjuk venni bizonyos mozgó" ünnepek ilyen például a húsvé vagy a pünkösd haásá az álalunk megfigyel folyamara. Az 23
előzees igazíáshoz arozik az is, amikor rögzíjük az éves frissíés során nyer napi súlyoka, illeve a mozgóálag, vagy az idősor meghosszabbíására használ ARIMA-modell ípusá. Év közben ezeke a ényezőke nem válozajuk, a szükségelen revíziók elkerülése érdekében. A program az előzees kiigazíás ényezői rögzíi és alkalmazza az idősorra, az eredmény a felhasználó ellenőrizhei. A ovábbi kiigazíásoka az így nyer érékekkel hajja végre. 1. b) A munkanaphaás ( D ) becslése és elávolíása A munkanapényezőbe csak a nem éves ciklusban jelenkező haások aroznak bele, mivel az évenkén rendszeresen ismélődő haásoka (pl. a december végi öbb napos leállások) a szezonális ényező már kimuaja. A napi súlyoka regresszió segíségével a kövekezőképpen becsüljük (muliplikaív modell): I D 1 = X 1 B 1 + X 2 B 2 + L + X N 7 B 7 + ε, ahol j X j az ado nap előfordulásának gyakorisága az ado hónapban, 7 B a 7 napi súly, B = 7, 1 j N pedig 31, 30 vagy 28,25 aól függően, hogy a hónap 31, 30 napos vagy február. A súlyoka a legkisebb négyzeek módszerével becsüljük, majd előállíjuk a kombinál napi súlyoka úgy, hogy minden napra összeadjuk a regressziós becslés álal nyer éréke és az előzees igazíás során megado napi súly éréké (csak muliplikaív modell eseén van leheőségünk előzees súlyok megadására). Ha az előzees igazíás során nem adunk meg napi súlyoka, akkor 1-hez adjuk hozzá a regressziós együhaóka. A kövekező lépésben -próbával eszeljük, hogy a kombinál súlyok szignifikánsan különbözneke muliplikaív modell eseén az előzees súlyokól vagy 1-ől, addiív modellnél pedig 0-ól. A munkanaphaás pedig F-próbával eszeljük. 24
A kövekező lépésben kiszámíjuk a munkanapényező az egyes hónapokra: D = X 1 ( b1 + 1) + X 2 ( b2 + 1) + L + X 7 ( b7 + (a jelölések megegyeznek az előző képleével, b j pedig a napi súlyoknak a legkisebb négyzeek módszerével kapo becslése). A modell frissíésénél a munkanapregresszió segíségével meghaározzuk a napi súlyoka, és eszeljük, hogy szignifikáns-e a haásuk. Ha igen, a PDW parancs segíségével rögzíjük őke a parancsfájlban, és év közben válozalan napi súlyokkal fuajuk a programo. Az eredei idősor az így kapo munkanapényezőkkel oszva kapjuk a munkanaphaásól iszío idősor. N 1) 1. c) A húsvéhaás ( E ) becslése és elávolíása A felhasználó az idősorra vonakozó előzees információi alapján eldönhei, hogy ulajdoní-e jelenősége az elhúzódó haásnak. Alapbeállíásnál a program F-eszel ellenőrzi, hogy a húsvé haása szignifikáns-e ha legalább 10%-os szinen szignifikáns, akkor alkalmazza a húsvékorrekció. Az így kapo húsvéfakoroka rögzíjük, és az év során húsvéregresszió nélkül fuajuk a programo. Amikor a húsvé áprilisban van, a húsvé haásá a szezonális ényező aralmazza. Amikor a húsvé márciusra, vagy április elejére esik, ovábbi korrekcióra van szűkségünk (az április elejére eső húsvé eseén az elhúzódó haás mia, ami befolyásolja a márciusi adaoka is), hiszen ebben az eseben a szezonális ényező nem fogja aralmazni a húsvé haásá. Ez regresszió segíségével eszi meg a program. Ennek során becsli a húsvéényezőke azokra a hónapokra, amikor a húsvé márciusra esik, illeve külön-külön aól függően, hogy melyik napra esik azokra a hónapokra, amikor a húsvéo április első napjaiban ünnepeljük. 1. d) Az idősor előrejelzése és kiegészíése ARIMA-modell segíségével Az ARIMA-modell az aszimmerikus mozgóálagolás elkerülése érdekében, az idősor előre illeve hára örénő meghosszabbíására 25
használjuk. Az ARIMA-modellezés (inegrál auoregresszív mozgóálagolás) lényege, hogy az idősorok leírására kidolgozo auoregressziós (amelyek az becslik, hogy a megfigyelés mosani, z éréke hogyan függ az előző időszakok z 1, z 2, z 3, K, z1 érékeiől) és mozgóálagoláson alapuló eljárásoka (amelyek pedig az muaják, hogyan függ a megfigyelés mosani éréke az előző időszakok vélelen ényezőiől) egy közös modellbe épíjük be. Egy (p,d,q) paraméerekkel jellemezheő ARIMA-modell aralmaz egy q-ad rendű mozgóálagolású és egy p-ed rendű auoregresszív modell, amelyeke az idősor eredei elemeiből képze d-ed fokú differenciákra írunk fel. Szezonális modellre a paraméerek kibővülnek (p,d,q) (P,Q,D) 12 -re, ahol a nagybeűs paraméerek a szezonális ényező jellemzik, a 12 az indexben pedig az muaja, hogy havi idősorral van dolgunk. Az álalános képle muliplikaív modellre: φ s d D s p ( B) Φ P ( B ) s z = θ q ( B) ΘQ ( B ) ε, ahol B a késleleési operáor 5 ( Bz z 1 ); z = ( 1 B) z ; = s s φ p ( B), Φ P ( B ), θ q ( B), ΘQ ( B ) a nemszezonális és szezonális auoregresszív és mozgóálag polinomok és ε fehér zaj folyama. A log (0,1,1)(0,1,1) 12 modellre (Airline-modell) a legegyszerűbb, de nagyon sok idősorra jól illeszheő modell ugyanez felírva: vagy: z z z 12 12 z = ( 1 θb)(1 ΘB ) ε, + z = ε θε Θε + θθε 1 12 13 1 12 13. Auomaikus fuaás eseén a program az ö előre beépíe ARIMA-modellből válaszja ki az idősorhoz illeszkedő, a modellek eszelésé a legegyszerűbbel (0,1,1)(0,1,1) 12 kezdi, és fokozaosan halad a bonyolulabbak felé. A vizsgál modell a program nem fogadja el, ha a modell alapján az uolsó 3 évre számío és a ényleges adaok elérése 5 Angol elnevezése backshif operáor. A szakirodalomban előfordul még a L (lag operáor) jelölés is. 26
2 meghaladja a 15%-o, vagy a reziduumok vélelenszerűségé ellenőrző χ - próba eredménye nem éri el az 5%-o. Amennyiben a program alál egy megfelelő modell, a öbbi már nem ellenőrzi. Évene egyszer, a modell felülvizsgálaánál auomaikus modellilleszés végzünk, ez a modell a parancsfájlban rögzíjük, és a öbbi hónapban ezzel fuajuk a programo. 2. a) A rend leválaszása A rend előzees becslésére a program egy alapbeállíásban 12 (vagy a felhasználó álal kérheő 24) agú középre igazío mozgóálago illesz az eredei (vagy előzeesen igazío) idősorra: előz 1 1 1 T = Y 6 + ( Y 5 + Y 4 + L + Y + 4 + Y + 5 ) + Y + 6 24 12 24 Ha az idősorból leválaszjuk a rende, a szezonaliás és a vélelen ényező együes haására kapunk előzees becslés (SI-idősor). A leválaszás addiív modell eseén SI = Y T, muliplikaív modellre: SI = Y / T. A rend végleges becslésére a szezonálisan kiigazío idősorra a program újból mozgóálagolású rende illesz, de a súlyrendszer i más: 9, 13 vagy 23 agú Henderson-féle álagolás használ. A agszám aól függ, hogy hogyan viszonyul egymáshoz a rendkomponens és a vélelen ényező válozásának álagos éréke ez a program I/C muaója jelzi. Erősebb irreguláris haás eseén a rend nagyobb inervallumra kierjedő mozgóálagolással becsülheő. Minél nagyobb az I/C hányados éréke, annál nagyobb agszámú mozgóálago illesz a program. I / C 9 1 I / C < 3,5 13 agú mozgóálag 3,5 I / C 23 A Henderson-féle mozgóálagolás szimmerikus, ahol a súlyok összege egyenlő 1-gyel. 2k+1 agszámú Henderson-súlyoka használva a rend képlee a kövekező lesz: T = k j= k h j SI + j 27
A szimmerikus mozgóálagoláshoz a program az idősor mindké végén az ARIMA-exrapolációval kiszámío érékekkel számol. 2. b) Szezonális kiigazíás A szezonális ényezők meghaározásához is mozgóálagoka számí a program, de i az azonos hónapra vonakozó SI-érékeke álagoljuk, hogy a szezonális és vélelen haás széválasszuk. Erre a célra a program öbbszörös mozgóálagolás (3x3, 3x5 vagy 3x9-es) alkalmaz, ami az jeleni, hogy az egyszerű mozgóálagokból képez újabb mozgóálagoka. Például a 3x3 mozgóálag eseében az azonos hónapokra egy háromagú, majd még egyszer egy háromagú mozgóálago illeszünk: S 1 9 = SI 1 3 24 1 ( SI 3 + 2 9 24 SI 12 + SI + 12 3 9 SI + SI + 2 9 ) + SI 1 ( 3 + 12 SI + 12 1 9 28 SI + SI + 24 + SI + 12 ) + 1 ( 3 SI + SI + 12 + SI Az előzees igazíáshoz a program 3x3-as mozgóálago illesz. A végleges szezonális ényezők megállapíásához a program vizsgálja a szezonaliás sabiliásá. Ehhez minden hónapra kiszámíja a szezonális és irreguláris ényező évenkéni álagos válozásá, valamin a ké ényező arányá ez az I/S hányados. Auomaikus fuaás eseén a mozgóálagok elemszáma az I/S hányados érékéől függ. I / S < 2,5 3,5 I / S < 5,5 6,5 I / S 3 3 3 5 agú mozgóálag 3 9 Ha az I/S éréke 2,5 és 3,5, valamin 5,5 és 6,5 közé esik, az X 11 ARIMA újraszámolja az a leguolsó eljes év elhagyásával, és az így kapo érék alapján dön. Ha a kapo érék ovábbra is bizonyalan, akkor a 3x5-ös mozgóálagolás válaszja. Évene, a modell frissíésénél auomaikus fuaással kiválaszjuk a megfelelő mozgóálago; ez a parancsfájlban rögzíjük, és a kővekező frissíésig ez használjuk. Mivel az I/S arány hónaponkén elérő lehe, leheőség van havonkén különböző elemszámoka előírni. Ez akkor hasznos, ha csak néhány hónap szezonális ényezője űnik sabilnak, és el + 24 ) =
akarjuk kerülni, hogy a öbbi hónaphoz arozó nagyobb vagy kisebb elemszámú mozgóálagok ronsák az ado hónapra vonakozó becsléseke. Az SI idősorból leválaszva a szezonális ényezőke kapjuk a vélelen ényező éréké. Addiív modellre I = SI S, muliplikaív modell eseén I = SI / S. 3) Oulierek kezelése Az X11-ARIMA program képes felismerni és az idősor minájához jobban illeszkedő érékekkel helyeesíeni az addiív ouliereke. A szinelolódás és az ámenei szinválás kezelésére nincs beépíe opció. Egy leheséges megoldás nyúj az idősorban bekövekeze örés elői rész elhagyása, ha a maradék rész elég hosszú, legalább 5 év. Ha ez nem eljesül, az előzees igazíások során a felhasználó ranszformálhaja az idősor úgy, hogy az megarsa a szezonaliás jellegé, de a örés okoza szinválás kiszűrje belőle. Az addiív oulierek felismeréséhez és érékeik korrigálásához a program a vélelen ényező idősorának minden 5 év hosszúságú szakaszára kiszámíja a szórás. A szakaszok középső évének minden érékéhez hozzárendel egy súly a kövekező módszerrel: Ha egy bizonyos hónap érékének az álagól ve elérése nagyobb, min az 5 éves szakasz szórásának 2,5-szerese, akkor a súly 0. Ha az érék álagól ve elérése kisebb, min az 5 éves szakasz szórásának 1,5-szerese, akkor a súly 100 (ezek az adaok jól illeszkednek). Az 1,5 és 2,5 közé eső érékekre a súly lineárisan csökken 100-ól 0-ig. A 100-ná1 kisebb súlyú adaoknál az SI éréke az adapon súlyával beszorzo SI érékének és az az megelőző, illeve köveő ké legközelebbi, 100 súlyú adapon érékének álagával helyeesíi. Az első ké évre a harmadik év szórásával számol, az uolsó keőnél az az megelőző uolsóval. Az oulierek korrekciójához az ada súlyozo SI érékének és a 4 legközelebbi 100 súlyú éréknek az álagá használjuk Ha valamely hónaphoz vagy évhez úl sok oulier arozik, akkor az arra az időszakra vonakozó szezonálisan kiigazío adaok nem lesznek megbízhaóak. Gyakori ese, hogy a márciusi és áprilisi adaok közö 29
szerepel sok oulier, ami a húsvéényező nem megfelelő kezelésre ual. A gyakorlaban, amennyiben nyilvánvalóan kiugró adaal alálkozunk, célszerű az már az előzees igazíás során elávolíani. Ha az oulier oka ismer és az egy valós esemény idéze elő, akkor az ideiglenes igazíás alkalmazandó, mivel így az oulier meg fog jelenni a szezonálisan kiigazío idősorban, de a szomszédos érékekre nem lesz haással. Amennyiben az idősor elemzésekor nem alálunk nyilvánvaló oulier, célszerű a programra bízni az oulierek auomaikus kezelésé. A kiigazíás minőségének ellenőrzése A szezonális kiigazíás eredményének érékelésé a program számos diagnoszikai áblával segíi. Fuása során az X11 ARIMA auomaikusan elkészíi a diagnoszikai ábláka; amelyek az elemzés során felmerül problémák megoldásá is segíik. Az E áblákban az eredei és a szezonálisan kiigazío idősor egy hónap alai válozásai köveheők nyomon. Az E5 áblában (eredei adaok) az ado hónaphoz arozó érékek előjele az évek során nem válozik. Ha ebben a minában válozás észlelünk, akkor a szezonális ényező megörése valószínűsíheő. Az oulierek a áblában kiugróan magas vagy alacsony érékkén jelennek meg, amelye a kövekező hónapban ellenées irányú kiugró ada köve. Ha az E6 ábla vizsgálaa során (kiigazío adaok) bizonyos hónapokban ismélődő válozásokra bukkanunk, akkor feleheően az idősorban még jelen van maradék szezonaliás, vagy pedig a program úligazíoa az idősor. Az F áblák közül az F3 áblára érdemes részleesebben kiérni, amely összegző adaoka aralmaz a kiigazíás eredményéről. A ábla segíségével gyors képe kaphaunk a kiigazíás sikerességéről. Az M1-M11-gyel jelöl összegző saiszikák eredménye minden eseben 0 és 3 közöi szám. Az M1-M6 saiszikák a vélelen ényezőhöz, az M7-M11 saiszikák a szezonális ényezőhöz kapcsolódnak. A kiigazíás sikeresnek ekinhejük, ha valamennyi M-saiszika éréke 0 és 1 közé esik. Álalában, minél kisebb éréke kapunk valamely M-saiszikára, annál jobbnak ekinheő a szezonális kiigazíás. Az M-saiszikák a kövekezők: Ml: az eredei idősor 3 havi válozásából az irreguláris ényező részaránya; 30
M2: a rend kiszűrésével nyer idősor szórásából az irreguláris komponens részaránya; M3: a vélelen ényező álagos egyhavi válozása összehasonlíva a rend álagos egyhavi válozásával; M4: az irreguláris ényező auokorrelációjának méréké fejezi ki, vagyis az, hogy felismerheő-e valamilyen mina az irreguláris ényezőben; M5: hány hónap ala haladja meg a rend válozása az irreguláris komponens válozásá; M6: a vélelen ényező egyévi válozása a szezonális ényező egyévi válozásához viszonyíva; M7: a válozó és állandó szezonaliás aránya; M8: a szezonális ényező éves álagos ingadozásának nagysága; M9: a szezonális ényező álagos lineáris jellegű válozása; M10: az M8 muaó, az idősor uolsó néhány évének adaára; Ml l: az M9 muaó, az idősor uolsó néhány évének adaára; Az F3 ábla uán a program egy globális érékelési kriériummal jelzi a kiigazíás minőségé. Ez az M1-M11 muaók súlyozo álaga. A dekompozíció eredménye akkor ekinheő elfogadhaónak, ha éréke 1-nél kisebb. 2.7. X12-ARIMA 6 Az X12-ARIMA módszer dekompozíciós része lényegében megegyezik az X11-ARIMA azonos lépéseivel. Amiben a ké program elér, az a munkanaphaás és az oulierek kezelése. Az X11-ARIMA eseében először végrehajjuk a szezonális dekompozíció, azaz leválaszjuk a rende és a szezonális komponens, majd megvizsgáljuk, hogy a maradékényezőben maradak-e oulierek, és, hogy a munkanaphaás és a húsvéhaás kimuahaó-e szignifikánsan a vélelen haásban. Ha igen, akkor az előzees korrekcióka ez alapján módosíjuk. 6 Sugár (1999a) alapján. 31
Az X12-nél ugyanakkor az eredei idősorból kiindulva állapíjuk meg, hogy van-e szignifikáns munkanap-, húsvé- vagy oulierhaás. Ha ezen haások bármelyike szignifikáns, akkor először igazíjuk az idősor, majd a korrigál idősorra hajjuk végre a dekompozíció. Az X11-ARIMA-hoz hasonlóan a mozgóálag-echnika alkalmazása mia az X12-ARIMA eseén is szükség van arra, hogy az idősor meghosszabbísuk előre és hára egyarán. Az X12-nél a meghosszabbíáshoz használ ARIMA-modell paraméereinek becslésével egyidőben örénik a napári haások, oulierek regressziós válozóinak meghaározása is. Így a dekompozíció elő az X12 egy regarima-modell illesz az idősorra: Y = δ i X i + z, ahol z egy szezonális ARIMA-folyama: (p,d,q)(p,d,q) s. Az egyenlee kifejezve z -re és ez behelyeesíve az ARIMA modell egyenleébe, a kövekező formá kapjuk: s d s D s φ p ( B) p ( B )(1 B) (1 B ) ( Y δ i X i ) = θ q ( B) ΘQ ( B ) Φ ε, ahol az előző fejezeben használ jelöléseknek megfelelően B a késleleési s s operáor, φ p (B), Φ p ( B ), θ q (B), Θ Q( B ) a nemszezonális és szezonális auoregresszív és mozgó álag polinomok, ε fehérzaj. Kiválaszjuk a megfelelő regressziós válozóka, megbecsüljük az együhaóka, képezzük az Y δ i X i válozó. Ennek képezzük a megfelelő differenciái, és becsüljük a szezonális ARIMA-modell. Ez uóbbi, az X11-ARIMA módszerhez hasonlóan arra szolgál, hogy előrehára meghosszabbísuk az idősor. Az X12 regarima részében különböző regressziós válozók alkalmazhaók, például rendkonsans, fix szezonális válozó, munkanaphaás, a hónap hosszának kezelése, a szökőév kezelése, a húsvéhaás, oulierek. Munkanaphaás Az X11-ARIMA-ól elérően a munkanapoka nem hé, hanem ha válozóval kezeli. A válozók éréke: az ado nap száma vasárnapok száma. Leheőség van olyan opció válaszására is, hogy a munkanapoka egy regressziós válozóval kezelje a program. Ebben az eseben minden 32