Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság problémája Egyváltozós, többváltozós idősorok Az idősorelemzés célja 1. A jelenség leírása, alakító tényezők megismerése 2. ELŐREJELZÉS Az idősorok elemzésének módszertana Determinisztikus (főként hosszú távú előrejelzés) Sztochasztikus (főként rövid távú előrejelzés) Determinisztikus idősorelemzés Az idősort alakító tényezők elvileg teljes körűen számba vehetőek A fentiek alapján az idősor alakulása pontosan leírható Véletlen hatás: Nincs teljes körű számbavétel Korlátozottak a mérési lehetőségeink Méréseink hibával terheltek Sztochasztikus idősorelemzés A véletlennek folyamatépítő szerepe van a modellben, öngeneráló hatások A véletlen az idősor későbbi alakulását is befolyásolja. beépülnek a sokkok Alkalmazási területe: elsősorban rövid távra 1
A determinisztikus idősor komponensei Trend (alapirányzat) Ciklus (éven túli ingadozás a trend körül) Szezonalitás (éven belüli ingadozás) Hiba (véletlen ingadozás) Additív jelenség Y t =T t +S t +e t Dekompozíciós idősormodellek. Additív Multiplikatív Feltételek (additív) Multiplikatív jelenség Y t =T t S t e t Feltételek (multiplikatív) A trend becslésének módszerei Mozgó átlagolás (szimmetrikus vagy egyoldali) Analitikus trendfüggvény megadása 2
Mozgóátlag, szimmetrikus X t-1 X t X t+1 k= mozgóátlag tagszáma l= részsorozat sorszáma l+(k+1)/2 2 3 4 5 6 7 8 9 5 6 5 6 4 2 5 6 3 8 7 9 5 6 3 6 Mozgóátlagolás Minél nagyobb a tagszám, annál jobban kiszűrjük a véletlen hatásokat. Általában szimmetrikus ablak egyenlő súlyokkal A leggyakoribb: 3, 5, 7, 9, 15 és 21 pontos Hátránya: Az idősor lerövidül Nincs matematikailag elemezhető trendvonal A mozgóátlagok fajtái Előrejelző mozgóátlag: csak a múlt adatai alapján, a trend megváltozását késve jelzi Előrejelző mozgóátlag (5 tagú, csak múltbeli adatokból) Exponenciális mozgóátlag (simítás): súly α és 1-α, frissebb adat nagyobb súllyal Súlyozott mozgóátlag: frissebb adatok nagyobb súllyal Mozgóátlag szezonalitás esetén A mozgóátlag tagszámát úgy kell megválasztani, hogy tartalmazza az összes szezonalitást. Centrírozott mozgóátlagolás A mozgóátlagot páratlan k esetén a részsorozat középső elemének tekintjük, l+(k+1)/2-edik elem. Pl. havi adatok esetén 12 tagú átlagolás vagy egész számú többszöröse Pl. negyedéves adatok esetén 4 tagú átlagolás vagy egész számú többszöröse Ha k páros, akkor l+(k+1)/2 nem egész. Ezért az így kapott átlagokból kéttagú mozgóátlagolással kapjuk az egész indexű értékeket. Ezt nevezik centrírozásnak vagy középre igazításnak. 3
Centrírozott mozgóátlagok $trend Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2016 NA NA NA NA NA NA 13.5 14.5 15.5 16.5 17.5 18.5 2017 19.5 20.5 21.5 22.5 23.5 24.5 25.5 26.5 27.5 28.5 29.5 30.5 2018 31.5 32.5 33.5 34.5 35.5 36.5 37.5 38.5 39.5 40.5 41.5 42.5 2019 43.5 44.5 45.5 46.5 47.5 48.5 49.5 50.5 51.5 52.5 53.5 54.5 2020 55.5 56.5 57.5 58.5 59.5 60.5 61.5 62.5 63.5 64.5 65.5 66.5 2021 67.5 68.5 69.5 70.5 71.5 72.5 NA NA NA NA NA NA Trend mozgó átlagolással (12 tagú) Trend mozgó átlagolással (8 tagú) Trend mozgó átlagolással (16 tagú) Analitikus trendfüggvény A legkisebb négyzetek módszerével becsüljük. Gyakori függvénytípusok: Lineáris Exponenciális Másodfokú parabola Logisztikus 4
Lineáris trend Az egyenes meredeksége az időbeli változás abszolút mértékét mutatja. Exponenciális trend A jelenség egyenletesen gyorsulva vagy lassulva változik A változás üteme állandó A logaritmus transzformáció nem ad pontos becslést! Exponenciális függvény (pozitív hatványkitevő) Exponenciális függvény (negatív hatványkitevő) Parabolikus trend Parabolikus függvény (konvex) Globális minimummal vagy maximummal rendelkező jelenségeknél. 5
Parabolikus függvény (konkáv) Logisztikus trend Szakaszai: Lassú növekedés Gyors növekedés Lassuló növekedés Telítettség Logisztikus függvény Szezonális ingadozás Rendszeresen ismétlődő, azonos hullámhosszú, szabályos amplitúdójú ingadozások. Leggyakrabban havi vagy negyedéves ingadozások. A szezonális hatások egy perióduson belül kiegyenlítik egymást, azaz összegük nulla vagy egy. Szezonális eltérés (additív modell) Szezonindex (multiplikatív modell) Szezonális eltérés számítása 1. A megfigyelt idősorból levonjuk a trendértékeket. 2. Szezononként átlagoljuk az adatokat 3. Nyers szezonális eltérés 4. Korrigált szezonális eltérés Detrendelt adatok Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2016 NA NA NA NA NA NA 5,5 4,0 2,8 0,5-1,8-2,7 2017-5,7-4,0-2,8-0,9 1,4 3,8 6,7 3,9 2,3 0,9-1,4-3,7 2018-6,1-4,6-2,6-0,5 2,4 3,4 4,9 4,9 2,6 0,5-1,0-4,7 2019-5,6-4,4-2,1-0,5 1,1 3,8 5,6 4,7 3,3 0,4-2,0-4,1 2020-5,9-5,1-2,4 0,6 1,6 3,9 4,9 4,3 2,7 0,2-1,2-3,2 2021-5,9-4,9-1,3-0,6 1,5 3,5 NA NA NA NA NA NA Átlagok: -5,9-4,6-2,2-0,4 1,6 3,7 5,5 4,4 2,7 0,5-1,5-3,7 Átlaga: 0 i= sorok száma j= oszlopok száma, szezon 6
Nyers szezonális eltérés Additív szezonális hatás A megfigyelt idősor a j-edik szezonban átlagosan mennyivel tér el a trendértéktől. Korrigált szezonális eltérés: a nyers szezonális eltérésekből levonjuk az átlagukat. A véletlen hatás Szezonindex számítása 1. A megfigyelt idősort osztjuk a trendértékekkel. 2. Szezononként átlagoljuk az adatokat (számtani átlag) 3. Nyers szezonindexek 4. Korrigált szezonindexek: nyers szezonindexek osztva az átlagukkal Detrendelt adatok (multiplikatív) Qtr1 Qtr2 Qtr3 Qtr4 2010 NA NA 0,7 1,4 2011 1,5 0,4 0,8 1,6 2012 1,0 0,7 0,9 1,4 2013 1,1 0,5 0,8 2,0 2014 0,6 0,6 1,3 1,3 2015 0,9 0,6 NA NA Nyers szezonindex A j-edik szezonban a megfigyelt idősor átlagosan hányszorosa a trendértéknek. Korrigált szezonindex: nyers szezonindex osztva a számtani átlagával Átlagok: (nyers szezonindexek) 1,0172 0,5637 0,8770 1,5344 Korrigált szezonindexek: 1,0191 0,5648 0,8787 1,5374 7
Multiplikatív szezonális hatás A véletlen hatás (multiplikatív) Előrejelzés (extrapoláció) Előrejelzés Y t =T t +S t vagy Y t =T t S t Korábban tanult módszerek az idősorelemzésben Az idősor elemzése átlagokkal A jelenség átlagos nagysága Milyen átlagot kell meghatározni? Abszolút változások átlaga Relatív változások átlaga 8
Idősorok Tartam idősor (flow): mozgó sokaságok jellemzői, egy időtartamra vonatkoztatjuk. Pl. termelés napra, hónapra, évre. Állapot idősor (stock): állományi típusú, egy időpontra vonatkoznak. Pl. raktárkészlet Átlagok Tartam idősor (flow): egyszerű számtani átlag Állapot idősor (stock): kronológikus átlag A növekedés átlagos mértéke Derivált sor meghatározása (különbségképzés) A különbségek egyszerű számtani átlaga A növekedés átlagos üteme Láncviszonyszámok meghatározása Láncviszonyszámok mértani átlaga A forgalom változásának mértéke a 2000. évhez viszonyítva A forgalom változásának üteme 9