Saiszika II. Saiszika II. előadás és gyakorla 1. rész T.Nagy Judi Ajánlo irodalom: Ilyésné Molnár Emese Lovasné Avaó Judi: Saiszika II. Feladagyűjemény, Perfek, 2006. Korpás Ailáné (szerk.): Álalános Saiszika II., Nemzei Tankönyvkiadó, 1997. Molnár Máéné Tóh Máronné: Álalános Saiszika Példaár II., Nemzei Tankönyvkiadó, 2001. T.Nagy Judi 1
Saiszika II. Bevezeés Saiszika I. (Leíró saiszika): Teljes sokaság vizsgálaa eseén alkalmazhaó módszerek. Saiszika II. (Kövekezeő saiszika): A sokaságnak csak egy részé (egy miná) vizsgálunk, és ez alapján vonunk le a eljes sokaságra vonakozó kövekezeéseke. Főbb émakörei: Regressziószámíás, idősorok elemzése, saiszikai becslések, hipoézisvizsgála. T.Nagy Judi 2
Saiszika II. I. Kéválozós lineáris korreláció és regressziószámíás A szochaszikus kapcsola fajáival már megismerkedünk (Saiszika 1.) Szochaszikus kapcsola ípusai o Asszociációs mindké ismérv minőségi vagy erülei o Vegyes egyik minőségi v. erülei, másik mennyiségi o Korrelációs mindké ismérv mennyiségi o Rangkorrelációs mindké ismérv sorrendi A korreláció ehá mennyiségi ismérvek közöi szochaszikus kapcsola. (ami nemcsak keő, hanem öbb ismérv eseén is érelmezünk). I. 1. MINTAPÉLDA: Egy vendégláóhely a napi álaghőmérsékle melle vizsgála a vendégek napi sörfogyaszásá. A megfigyel 10 nap adaai: Napi álaghőmérsékle ( C) Sörfogyaszás (l) 18 250 20 310 25 390 24 320 22 330 26 430 24 390 19 320 16 290 16 270 Ké kérdésre keresünk válasz: Van-e kapcsola az ismérvek közö, ha van, milyen irányú és milyen erősségű? A kapcsola milyen maemaikai összefüggéssel írhaó le? T.Nagy Judi 3
Saiszika II. A korreláció kimuaása és szorossága (van-e kapcsola?, milyen irányú?, milyen szoros?) 1. Az adaok ábrázolása pondiagramon (a kapcsola meglée és iránya) napi sörfogyaszás (l) 500 450 400 350 300 250 200 150 100 50 0 15 17 19 21 23 25 27 napi álaghőmérsékle ( C) 1.1. ábra Kövekezeés: poziív korreláció van az álaghőmérsékle és a sörfogyaszás közö. Példák: Y 120 100 80 60 40 20 0 0 50 100 150 200 X Korrelálalanság Y 250 200 150 100 50 0 0 50 100 150 200 X Poziív korreláció Y 300 250 200 150 100 50 0 0 50 100 150 200 X Negaív korreláció 2. Kovariancia kiszámíása (a kapcsola meglée, iránya) C = (d n X d Y ) d d X Y = X X = Y Y i i T.Nagy Judi 4
Saiszika II. A számoláshoz szükséges munkaábláza: X Y d X d Y d X d Y 18 250-3,00-80 240 20 310-1,00-20 20 25 390 4,00 60 240 24 320 3,00-10 -30 22 330 1,00 0 0 26 430 5,00 100 500 24 390 3,00 60 180 19 320-2,00-10 20 16 290-5,00-40 200 16 270-5,00-60 300 Összesen: 210 3300 0 0 1670 Álag: 21,00 330 Érelmezés: C = 1670/10 =167 Poziív irányú kapcsola van a ké ismérv közö. C>0 poziív irányú kapcsola C<0 negaív irányú kapcsola C=0 a kapcsola eljes hiánya 3. a. Lineáris korrelációs együhaó (a kapcsola meglée, iránya és szorossága) r = d ( d d ) X 2 X Y d 2 Y T.Nagy Judi 5
Saiszika II. A számoláshoz szükséges munkaábláza: X Y d X d Y d X d Y d 2 X d 2 Y 18 250-3,00-80 240 9 6400 20 310-1,00-20 20 1 400 25 390 4,00 60 240 16 3600 24 320 3,00-10 -30 9 100 22 330 1,00 0 0 1 0 26 430 5,00 100 500 25 10000 24 390 3,00 60 180 9 3600 19 320-2,00-10 20 4 100 16 290-5,00-40 200 25 1600 16 270-5,00-60 300 25 3600 Összesen: 210 3300 0 0 1670 124 29400 Álag: 21,00 330 Érelmezés: r = 1670/1909,35 = 0,8747 Viszonylag szoros, poziív irányú lineáris kapcsola van a ké ismérv közö. -1 r 1 Előjele a kapcsola irányá muaja meg. A kapcsola annál szorosabb, minél közelebb van r az 1-hez. r = 0 a kapcsola eljes hiánya, korrelálalanság 3. b. Deerminációs együhaó r 2 =0,8747 2 =0,765=76,5% Érelmezés: A sörfogyaszás ingadozásá 76,5%-ban magyarázza a hőmérsékle. Az eredményválozó (Y) (ingadozásá) varianciájá hány %-ban magyarázza a magyarázóválozó (X). T.Nagy Judi 6
Saiszika II. 4. Regressziószámíás Keressük az X Y adapárokhoz legjobban illeszkedő függvény. A függvényípus megválaszása: szakmai ismere alapján pondiagram segíségével A saiszikai gyakorlaban használaos függvényípusok: Lineáris regresszió Haványkievős regresszió Exponenciális regresszió Parabolikus regresszió Nemlineáris regresszió Hiperbolikus regresszió 250 200 150 Y 100 50 0 0 50 100 150 200 X lineáris kapcsola feléelezése (poziív irányú) nemlineáris kapcsola feléelezése (poziív irányú) 6 5 4 Y 3 2 1 lineáris kapcsola feléelezése (negaív irányú) 0 0 2 4 6 8 10 12 14 X nemlineáris kapcsola feléelezése (negaív irányú) T.Nagy Judi 7
Saiszika II. Kéválozós lineáris regressziószámíás I. 1. MINTAPÉLDA Y 500 450 400 350 300 250 200 150 100 50 0 15 17 19 21 23 25 27 X 1.2. ábra Az előzees vizsgála szerin: A pondiagram lineáris kapcsolara ual. r is aláámaszja a lineáris kapcsola megléé és muaja szorosságá A lineáris kapcsolao leíró függvény: f(x) = b 1 x + b 0 A regressziós egyenes Ŷ = b X + alakban keressük. Az adasorra legjobban illeszkedő egyenes, melynek a ponokól mér álagos ávolsága a legkisebb. (A legkisebb négyzeek módszerével, a ( Y Ŷ) 2 1 b 0 min szélsőérék felada megoldására a kövekezőke kapjuk:) A paraméerek kiszámíása: d d b = Y b X X Y 1 = 2 d X b0 1 b 1 =1670/124=13,4677 b 0 =330-13,4677 21=47,1783 A kerese regressziós egyenes egyenlee: Y ˆ = 13,47X+ 47,18 T.Nagy Judi 8
Saiszika II. Y: napi sörfogyaszás (l) 500 450 400 350 300 250 200 150 100 50 0 15 17 19 21 23 25 27 X: napi álaghőmérsékle ( C) 1.3. ábra A paraméerek érelmezése: b 0 =47,18: 0 C napi álaghőmérsékle eseén álagosan 47,18 l sörfogyaszásra számíhaunk. b 1 =13,47: 1 C-kal magasabb hőmérsékle álagosan 13,47 l-es fogyaszásnövekedés okoz. b 0 : X=0 eseén Y mekkora érékére számíhaunk álagosan. b 1 : A magyarázó válozó (X) ado érékének egy egységnyi válozása álagosan mekkora válozás okoz az eredményválozóban (Y), a vizsgál arományban. A válozók kölcsönhaása eseén: X egységnyi válozása álagosan mekkora Y válozással jár együ. Előrejelzés I. 1. MINTAPÉLDA Becsüljük meg a regressziófüggvény segíségével, hogy 23 C-os álaghőmérsékle eseén mennyi lesz az álagos napi sörfogyaszás! Ŷ = 13,47X.+ 47,18 X=23 eseén: Ŷ = 13,47 23 + 47,18 = 356,99 23 C-os álaghőmérsékle eseén várhaóan 357 l lesz a napi sörfogyaszás. T.Nagy Judi 9
Saiszika II. Elasziciási (rugalmassági) együhaó Jelenése X válozó ado érékének egységnyi relaív (1%-os) válozása az Y válozó mekkora relaív (hány %-os) válozásával jár együ. Lineáris függvény eseén: Ponrugalmasság: E(Ŷ,X) = b 1 Álagponban mér rugalmasság: X Ŷ E(Ŷ, X) = b 1 X Y I. 1. MINTAPÉLDA Haározzuk meg a sörfogyaszás elasziciásá az X=17 ponban valamin álagponban: X=17 eseén Ŷ = 13,47 17 + 47,18= 276,17 Érelmezés E(Ŷ,17) 17 = 13,47 = 0,8291 276,17 Ha az álaghőmérsékle 17 C-ról 1%-kal emelkedik, az 0,831%-os sörfogyaszás-növekedés okoz. Álagponban, azaz X = 21 eseén, Y = 330 Érelmezés E(Ŷ,21) 21 = 13,47 = 0,8572 330 Ha az álaghőmérsékle 21 C-ról 1%-kal való emelkedése 0,86%-os sörfogyaszás-növekedés okoz. Mivel a muaó kisebb, min 1(%), az mondhajuk, hogy a sörfogyaszás rugalmalanul reagál a hőmérséklere. Az E muaó abszolú nagysága szerin a kövekező eseeke különbözejük meg: Ha E <1, akkor Y rugalmalan az X válozásával szemben. T.Nagy Judi 10
Saiszika II. Ha E =1, akkor Y válozásával arányosan válozik X. Ha E >1, akkor Y rugalmas az X válozásával szemben. A regressziós becslés hibája Számísuk ki a minában szereplő összes X i érékhez a regressziófüggvénnyel becsül Ŷ i éréke (azaz helyeesísük az Ŷ = 13,47X+ 47,18 becslőfüggvénybe a minabeli X-eke). Az abszolú hiba (reziduális szórás) megmuaja, hogy a regressziós becslések ( mennyivel érnek el az eredményválozó (Yi) megfigyel érékeiől. Ŷ i ) álagosan s e 2 ei = n 2 ahol ei = Yi Ŷi (maradékag) A relaív hiba (relaív reziduális szórás) megmuaja, hogy a regressziós becslések ( Ŷ i ) álagosan hány %-kal érnek el az eredményválozó (Yi) megfigyel érékeiől. V e = s e Y A számoláshoz szükséges munkaábláza: 2 X Y Ŷ ( Y Ŷ) 18 250 289,64 1571,3296 20 310 316,58 43,2964 25 390 383,93 36,8449 24 320 370,46 2546,2116 22 330 343,52 182,7904 26 430 397,40 1062,7600 24 390 370,46 381,8116 19 320 303,11 285,2721 16 290 262,70 745,2900 16 270 262,70 53,2900 Összesen: 210 3300 3300 6908,8966 s e = 6908,8966 8 =29,3873 lier T.Nagy Judi 11
Saiszika II. Érelmezés 29,3873 V e = =0,0891=8,91% 330 Tehá a regressziós becslések álagosan 29,39 lierrel, azaz 8,91%-kal érnek el a megfigyel érékekől. A regressziófüggvény megbízhaóságá a relaív hibával mérjük. A gyakorlaban 10% alai relaív hibájú regressziós becslés minősíünk jónak és arunk alkalmasnak arra, hogy előrejelzés készísünk vele. T.Nagy Judi 12
Saiszika II. Összefoglalás Kapcsolavizsgála Korrelációszámíás: Ké (vagy öbb) mennyiségi ismérv közöi kapcsola irányá, szorosságá/inenziásá jellemezi A korreláció kimuaása: o Pondiagrammal o Mérőszámmal: kovariancia, korrelációs együhaó, deerminációs együhaó Regresszió számíás: A kapcsolaban lévő endenciá (ha van) függvénnyel írja le. (Több válozó eseén öbbválozós regressziószámíásról beszélünk.) A becslőfüggvény ípusának megállapíása pondiagram vagy szakmai ismere alapján örénhe. Lehe: o Lineáris o Nemlineáris A kéválozós lineáris regressziószámíás menee 1. Vizsgáljuk, hogy van-e elég szoros (b), lineáris (a) kapcsola: (a) pondiagram, (b) lineáris korrelációs együhaó (r) segíségével. Ha van, akkor 2. Meghaározzuk a regressziós egyenes egyenleé b 1, b 0 paraméer meghaározása a regressziófüggvény felírása Ŷ = b1 X + b0 T.Nagy Judi 13
Saiszika II. Gyakorló Feladaok 1. Ha hallgaó megkérdezve előző féléves Gazdasági maemaika és Makroökonómia jegyükről, a kövekező adaoka adódak: Gazd. Makro. Ma. 1 1 2 1 3 2 4 2 3 2 5 4 Felada Vizsgálja meg, regressziószámíás segíségével, hogy milyen kapcsola van az oszályzaok közö. Érelmezze a kiszámol muaóka és paraméereke. Becsülje meg, a regressziófüggvény segíségével, egy gazdasági maemaikából négyesre levizsgázo hallgaó makroökonómia jegyé. 2. 15 elemű mina alapján vizsgálák ado ípusú új és használ gépkocsik élekora és eladási ára valamin élekora és fuo kiloméere közöi kapcsolao. Élekor Eladási ár Fuo év MF ekm 0 5,2 0 1 2,8 59 1 3,2 40 2 2,5 79 2 2,4 92 3 2,2 81 3 1,9 92 4 1,6 105 5 1,5 97 6 1,4 120 7 1,2 140 9 1,0 157 11 0,9 220 12 1,3 210 12 0,7 250 Felada Jellemezze lineáris regressziófüggvénnyel az arra alkalmasabb kapcsolao. Ábrázolja a regressziófüggvény, majd érelmezze paraméerei. T.Nagy Judi 14
Saiszika II. Becsülje meg, a regressziófüggvény segíségével, egy 8 éves, ugyanilyen ípusú gépkocsi eladási árá/fuo kiloméeré! 3. Egy budapesi ingalanügynök 2007. márciusában vizsgála a körzeében eladó 63 m 2 -es lakások adaai: Kínálai ár Emele (millió F) 0 15,8 1 17,6 1 19,5 1 25,9 2 19,2 2 20,0 2 22,6 2 23,9 2 25,5 3 21,3 3 21,5 4 23,5 4 28,0 4 21,5 5 21,0 5 21,9 5 26,7 6 26,7 6 33,9 2 d Xd Y = 86,4526 dx = 58, 9474 d 2 Y = 316,3074 Felada Vizsgálja meg regressziószámíással, hogy milyen kapcsola van a lakás emelee és a kínálai ára közö. Érelmezze a kiszámol muaóka és paraméereke. T.Nagy Judi 15
Saiszika II. Az idősorok összeevői II. Idősorok vizsgálaa Egy jelenség időbeli alakulásának vizsgálaánál, a saiszikai elemzés szemponjából három ényező szokunk elkülöníeni: Alapirányza (rend) ŷ - hosszú ávon arósan érvényesülő endencia (lehe lineáris vagy nemlineáris) 35 30 300 250 25 200 y 20 15 y 150 100 10 50 5 0 0 1 2 3 4 5 6 7 0 0 1 2 3 4 5 6 7 8 9 Periodikus ingadozás (szezonhaás) s rövid időszakon belül ciklikusan ismélődő, periodikus hullámzás az alapirányza körül 12,0 10,0 8,0 y 6,0 4,0 2,0 0,0 0 2 4 6 8 10 12 14 Vélelen ingadozás (vélelen haás) v a rendre gyakorol egyéb befolyásoló haások 14,0 12,0 10,0 8,0 6,0 4,0 2,0 0,0 0 2 4 6 8 10 12 14 y A feni összeevők összekapcsolódása: 1. Addiív modell eseén y = ŷ + s + v 2. Muliplikaív modell eseén y = ŷ s v T.Nagy Judi 16
Saiszika II. A kapcsolódási mód ábrázolás úján dönheő el: Ha a szezonális ingadozások abszolú nagysága állandó addiív modell, 12,0 10,0 8,0 y 6,0 4,0 2,0 0,0 0 2 4 6 8 10 12 14 y 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10 12 14 ha a relaív nagyság állandó muliplikaív modell használunk. 2 500 2 000 1 500 y 1 000 500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 y 30,0 25,0 20,0 15,0 10,0 5,0 0,0 0 2 4 6 8 10 12 14 T.Nagy Judi 17
Saiszika II. Az alapirányza (rend) meghaározása analiikus rendszámíással A rendszámíás célja az alapveő endencia meghaározása, a öbbi ényező kiszűrése, azaz az idősor kisimíása. Az analiikus rendszámíásnál az alapirányzao regressziófüggvénnyel közelíjük (a magyarázó válozó az idő: ) II. 1. MINTAPÉLDA: Magyarország lakáscélú, devizaalapú hielállományának alakulásá muaja az alábbi ábláza, 2002. és 2007. közö. (KSH) Év Tárgyidőszak végén fennálló állomány összege, 100 milliárd F 2002. 6 2003. 14 2004. 19 2005. 22 2006. 27 2007. 31 Ábrázoljuk az idősor adaai: 35 30 Fennálló hiellállomány (100 Mrd F) 25 20 15 10 5 0 2001 2002 2003 2004 2005 2006 2007 2008 Év 2.1. ábra Kövekezeés: lineáris kapcsola (poziív irányú), nincs szezonaliás. Mivel az ábra lineáris kapcsolara ual, az adaoka lineáris rendfüggvénnyel közelíjük. Azaz keressük az ŷ = b1 + b0 becslőfüggvény b 1 és b 0 paraméerei. (A legkisebb négyzeek módszeré alkalmazva, a kövekezőke kapjuk:) A paraméerek kiszámíása: ( y ŷ ) min szélsőérék probléma megoldásakén a T.Nagy Judi 18
Saiszika II. y n y b1 = = y b 2 ( ) n 2 b0 1 T.Nagy Judi 19
Saiszika II. A számoláshoz szükséges munkaábláza: Év y 2 y 2002. 6 1 1 6 2003. 14 2 4 28 2004. 19 3 9 57 2005. 22 4 16 88 2006. 27 5 25 135 2007. 31 6 36 186 Összesen 119 21 91 500 Álag 19,8333 3,5 500 6 3,5 19,8333 = = 4,7715 21 91 6 b1 2 b0 1 = y b = 19,8333-4,7715 3,5 = 3,1299 A lineáris kapcsolao leíró rendfüggvény: ŷ = 4,77 + 3, 13. Ábrázolva: 35 30 25 20 y 15 10 5 0 0 1 2 3 4 5 6 7 2.2. ábra A paraméerek érelmezése: b 0 =3,13 A vizsgál időszako megelőző időponban, azaz 2001-ben 3,13 100mrd F vol a fennálló devizaalapú hielállomány a rend szerin. T.Nagy Judi 20
Saiszika II. b 1 =4,77: A rend szerin a vizsgál időszakban évene álagosan 4,77 100mrd F-al nő a devizaalapú hielállomány. b 0 : A vizsgál időszako megelőző időpon rend szerini éréke. b 1 : Ennyivel válozik időszakonkén álagosan a vizsgál jelenség, a rend szerin. Megegyezik a korábban már anul d muaóval. A rendfüggvény hibája Számísuk ki a rendérékeke a =1, 2, 6-ra. Ha a rendfüggvénybe ( ŷ = 4,77 + 3,13) helyeesíjük a megfelelő érékeke, megkapjuk az idősor becsül érékei ( ŷ -ke): A számoláshoz szükséges munkaábláza: Év y ŷ ( y 2 ŷ ) 2002. 6 1 7,9 3,6100 2003. 14 2 12,67 1,7689 2004. 19 3 17,44 2,4336 2005. 22 4 22,21 0,0441 2006. 27 5 26,98 0,0004 2007. 31 6 31,75 0,5625 Összesen 119 21 119 8,4195 Álag 19,8333 3,5 Az abszolú hiba (reziduális szórás) s e 2 e = ahol e = y ŷ n 8,4195 s e = =1,1846 6 A relaív hiba (relaív reziduális szórás) V e = s e y T.Nagy Judi 21
Saiszika II. Érelmezés 1,1846 V e = =0,0597=5,97% 19,8333 Tehá a fennálló hielállomány lineáris rendfüggvénnyel becsül érékei és a valós érékek álagosan 1,1846 100mrd F-al, azaz 5,97%-kal érnek el egymásól.. Ha a relaív reziduális szórás nem haladja meg a 10%-o, akkor minősíjük a rendfüggvény jónak (ekkor alkalmas előrejelzés készíésére). Az szezonaliás meghaározás (addiív modell eseén) II. 2. MINTAPÉLDA: A Magyarországra érkező külföldi láogaók számának alakulása 2005 és 2007 közö (KSH): Év Negyedév Egy napra láogaók száma, millió fő 2005. I. 4,6 II. 5,9 III. 9,4 IV. 6,3 2006. I. 5,4 II. 6,8 III. 10,0 IV. 6,8 2007. I. 6,2 II. 7,4 III. 10,6 IV. 6,6 1.) Ábrázoljuk az idősor adaai: T.Nagy Judi 22
Saiszika II. láogaók száma (millió fő ) 12,0 10,0 8,0 6,0 4,0 2,0 0,0 I. II. III. IV. I. II. III. IV. I. II. III. IV. 2005. 2006. 2007. időszak 2.3. ábra Kövekezeés: lineáris kapcsola, van szezonaliás (addiív modell). 2.) Mivel az ábra lineáris kapcsolara ual, az adaoka lineáris rendfüggvénnyel közelíjük. A számoláshoz szükséges munkaábláza: Év Negyedév y 2 y 2005. I. 4,6 1 1 4,6 II. 5,9 2 4 11,8 III. 9,4 3 9 28,2 IV. 6,3 4 16 25,2 2006. I. 5,4 5 25 27,0 II. 6,8 6 36 40,8 III. 10,0 7 49 70,0 IV. 6,8 8 64 54,4 2007. I. 6,2 9 81 55,8 II. 7,4 10 100 74,0 III. 10,6 11 121 116,6 IV. 6,6 12 144 79,2 Összesen 86,0 78,0 650,0 587,6 Álag 7,1667 6,5 A paraméerek kiszámíása: 587,6 12 6,5 7,1667 = =0,2 78 650 12 b1 2 b 0 = 7,1667 0,2 6,5 =5,8667 A lineáris kapcsolao leíró rendfüggvény: ŷ = 0,2 + 5, 9 T.Nagy Judi 23
Saiszika II. y 12,0 10,0 8,0 6,0 4,0 2,0 0,0 0 2 4 6 8 10 12 14 2.4. ábra A paraméerek érelmezése: b 0 =5,9: A vizsgál időszako megelőző időponban, azaz 2004 IV. negyedévében 5,9 millió fő láogao hazánkba, rend szerin. b 1 =0,2: A rend szerin a vizsgál időszakban negyedévene álagosan 0,2 millió fővel nő a hazánkba láogaó külföldiek száma. 3.) A szezonhaás kimuaása Cél: A szezonok álalános jellemzése. Mivel a szezonális ingadozások abszolú nagysága állandó addiív modell használunk: y = ŷ + s + v. Az egyedi szezonális elérések ( y ŷ ) kiszámíásához az alábbi munkaáblázao készíjük (ahol az ŷ érékek a 2.) ponban meghaározo lineáris rend függvénnyel becsül érékek.): Év Negyedév y ŷ y ŷ 2005. I. 4,6 1 6,1-1,5 II. 5,9 2 6,3-0,4 III. 9,4 3 6,5 2,9 IV. 6,3 4 6,7-0,4 2006. I. 5,4 5 6,9-1,5 II. 6,8 6 7,1-0,3 III. 10,0 7 7,3 2,7 IV. 6,8 8 7,5-0,7 2007. I. 6,2 9 7,7-1,5 II. 7,4 10 7,9-0,5 III. 10,6 11 8,1 2,5 IV. 6,6 12 8,3-1,7 Összesen 86,0 78,0 86,4-0,4 T.Nagy Judi 24
Saiszika II. Az uolsó oszlopban szereplő egyedi szezonális eléréseke szezononkén rendezve a kövekező áblá kapjuk: Időszak I. II. III. IV. negyedév negyedév negyedév negyedév 2005-1,5-0,4 2,9-0,4 2006-1,5-0,3 2,7-0,7 2007-1,5-0,5 2,5-1,7 Az egyes negyedévek szezonális elérései (számani álagok): 1,5 + ( 1,5) + ( 1,5) s I = = -1,50 3 0,4 + ( 0,3) + ( 0,5) s II = = -0,40 3 2,9 + 2,7 + 2,5 s III = = 2,70 3 1,5 + ( 0,7) + ( 1,7) s IV = = -0,93 3 Ha ezeke összeadva nem 0- kapunk, akkor nem sikerül eljesen kiszűrnünk az ingadozás, így korrekció szükséges. -1,5+(-0,4)+2,7+(-0,93) 0 s I + s II + s III + s A korrekciós ényező: 4 IV (számani álag) 1,5 0,4 + 2,7 0,93 Korrekciós ényező: = 0, 03 4 Az egyes negyedévek korrigál szezonális elérései: s * = s korrekciós ényező s * I = -1,5-(-0,0333) = -1,4667 s * II = -0,4-(-0,0333) = -0,3667 s * III = 2,7-(-0,0333) = 2,7333 s * IV = -0,93-(-0,0333) = -0,8967 T.Nagy Judi 25
Saiszika II. Időszak I. II. III. IV. negyedév negyedév negyedév negyedév 2005-1,5-0,4 2,9-0,4 2006-1,5-0,3 2,7-0,7 2007-1,5-0,5 2,5-1,7 Össz. Korr. s: szezonális elérés (számani álag) -1,50-0,40 2,7-0,9333-0,1333-0,0333 s*: korrigál szezonális elérés (s-korr) -1,4667-0,3667 2,7333-0,8967 0 Így a korrekcióval elérük, hogy a (korrigál) szezonális elérések összege 0 legyen: s I * + s II * + s III * + s IV * = 0-1,4667 + (-0,3667) + (2,7333) + (-0,8967) = 0 A szezonális elérések jelenése: s I * = - 1,47: A vizsgál időszakban az első negyedévben a szezonhaás mia a ényleges láogaók száma álagosan 1,47 millió fővel alaa marad a rend szerini éréknek. s III * = 2,73: A vizsgál időszakban a harmadik negyedévben a szezonhaás mia a ényleges láogaók száma álagosan 2,73 millió fővel meghaladja a rend szerini éréke. T.Nagy Judi 26
Saiszika II. Előrejelzés (Exrapoláció) Addiív modellben: ŷ + s* (vagy s) II. 2. MINTAPÉLDA Haározzuk meg a láogaók számá 2008. IV. és 2009. I. negyedévében: 2008. IV. negyedévére: = 16 -o behelyeesíve a rendfüggvény egyenleébe kapjuk a rend szerini éréke: ŷ 16 = 0,2 16 + 5,9 = 9,1, * ami a IV. negyedév szezonális elérésével módisíunk ŷ + IV = 9,1-0,8967 = 8,2033 16 s Érelmezés: A láogaók várhaó száma 2008. IV. negyedévében, ha a apaszal endencia folyaódik 8,2 millió fő lesz. 2009. I. negyedévére hasonlóan számolunk: = 17 eseén ŷ 17 = 0,2 17 + 5,9 = 9,3 a rend szerini érék. A szezonaliás is figyelembe véve: * 17 s I ŷ + = 9,3-1,4667 = 7,8333 millió fő lesz a láogaók várhaó száma 2009. I. negyedévében, ha a apaszal endencia folyaódik. Vélelen haás (inerpoláció segíségével) II. 2. MINTAPÉLDA Haározzuk meg, hogy mekkora vol a vélelen haás 2007. III. negyedévében. Az addiív modell szerin: y = ŷ + s * + v (ha a szezonális elérések korrekciójára vol szükség, akkor a képleben s helye s * * szerepel), amiből v = y (ŷ s ) = 11 eseén ŷ 11 = 8,1 + A láogaók száma a rend szerin 2007. III. negyedévében 8,1 millió fő. * (ŷ s ) = 8,1 + 2,7333 = 10,8333 11 + T.Nagy Judi 27
Saiszika II. A láogaók száma a becslésünk szerin (figyelembe véve a szezonaliás) 2007. III. negyedévében 10,83 millió fő. Az ilyen ípusú előrejelzés, amely során a vizsgál időszakon belülre végzünk becslés inerpolációnak nevezzük. v 11 = 10,6-10,8333 = 0,2333 Tehá a vélelen haás 2007. III. negyedévében 0,23 millió fő vol. Az szezonaliás meghaározás (muliplikaív modell eseén) II. 3. MINTAPÉLDA A kövekező ábláza a Magyarországon érékesíe burgonyamennyisége aralmazza (ezer onnában), 2004. és 2007. közö (KSH): Időszak Burgonya (ezer onna) 2004 J M 5,5 Á Jú 9,4 Jl Sz 24,7 O D 11,8 2005 J M 7,7 Á Jú 10,0 Jl Sz 17,8 O D 13,5 2006 J M 8,2 Á Jú 10,4 Jl Sz 16,7 O D 7,7 2007 J M 4,1 Á Jú 6,0 Jl Sz 10,8 O D 6,9 1.) Ábrázoljuk az idősor adaai: T.Nagy Judi 28
Saiszika II. érékesíe burgonya mennyiség (e z e r o n n a ) 30,0 25,0 20,0 15,0 10,0 5,0 0,0 J M Á Jú Jl Sz O D J M Á Jú Jl Sz O D J M Á Jú Jl Sz O D J M Á Jú Jl Sz O D 2004 2005 2006 2007 időszak 2.5. ábra Kövekezeés: lineáris kapcsola, van szezonaliás (muliplikaív modell). 2.) Mivel az ábra lineáris kapcsolara ual, az adaoka lineáris rendfüggvénnyel közelíjük. A számoláshoz szükséges munkaábláza: időszak y 2 y 2004 J M (I.) 5,5 1 1 5,5 Á Jú (II.) 9,4 2 4 18,8 Jl Sz (III.) 24,7 3 9 74,1 O D (IV.) 11,8 4 16 47,2 2005 J M (I.) 7,7 5 25 38,5 Á Jú (II.) 10,0 6 36 60,0 Jl Sz (III.) 17,8 7 49 124,6 O D (IV.) 13,5 8 64 108,0 2006 J M (I.) 8,2 9 81 73,8 Á Jú (II.) 10,4 10 100 104,0 Jl Sz (III.) 16,7 11 121 183,7 O D (IV.) 7,7 12 144 92,4 2007 J M (I.) 4,1 13 169 53,3 Á Jú (II.) 6,0 14 196 84,0 Jl Sz (III.) 10,8 15 225 162,0 O D (IV.) 6,9 16 256 110,4 Összesen 171,18 136 1496 1340,3 Álag 10,7 8,5 A paraméerek kiszámíása: 1340,3 16 8,5 10,7 = = - 0,3379 136 1496 16 b1 2 b 0 = 10,7 ( 0,3379) 8,5 =13,5722 T.Nagy Judi 29
Saiszika II. A lineáris kapcsolao leíró rendfüggvény: ŷ = 0,34 + 13, 57 30,0 25,0 20,0 y 15,0 10,0 5,0 0,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2.6. ábra A paraméerek érelmezése: b 0 = 13,57: A vizsgál időszako megelőző időponban, azaz 2003 IV. negyedévében az érékesíe burgonyamennyiség 13,57 ezer, a rend szerin. b 1 = - 0,34: A rend szerin a vizsgál időszakban negyedévene álagosan 0,34 ezer onnával csökken a hazánkban érékesíe burgonyamennyiség. 3.) A szezonhaás kimuaása Mivel a szezonális ingadozások relaív nagysága állandó muliplikaív modell használunk y = ŷ s v. y Az egyedi szezonindexek kiszámíásához az alábbi munkaáblázao ŷ készíjük ahol az ŷ érékek a 2.) ponban meghaározo ŷ = 0,34 + 13, 57 lineáris rend függvénnyel becsül érékek.: T.Nagy Judi 30
Saiszika II. Év Negyedév y ŷ 2004 I. 5,5 1 13,23 0,42 II. 9,4 2 12,89 0,73 III. 24,7 3 12,55 1,97 IV. 11,8 4 12,21 0,97 2005 I. 7,7 5 11,87 0,65 II. 10,0 6 11,53 0,87 III. 17,8 7 11,19 1,59 IV. 13,5 8 10,85 1,24 2006 I. 8,2 9 10,51 0,78 II. 10,4 10 10,17 1,02 III. 16,7 11 9,83 1,70 IV. 7,7 12 9,49 0,81 2007 I. 4,1 13 9,15 0,45 II. 6,0 14 8,81 0,68 III. 10,8 15 8,47 1,28 IV. 6,9 16 8,13 0,85 y ŷ Az uolsó oszlopban szereplő hányadosoka (szezonindexeke) szezononkén rendezve a kövekező áblá kapjuk: Időszak I. II. III. IV. 2004 0,42 0,73 1,97 0,97 2005 0,65 0,87 1,59 1,24 2006 0,78 1,02 1,7 0,81 2007 0,45 0,68 1,28 0,85 Az egyes negyedévek szezonindexei (mérani álagok): s I. = 4 0,42 0,65 0,78 0, 45 = 0,5564 s II. = 4 0,73 0,87 1,02 0, 68 = 0,8147 s III. = 4 1,97 1,59 1,7 1, 28 = 1,6158 s IV. = 4 0,97 1,24 0,81 0, 85 = 0,9539 Ha ezeke összeszorozva nem 1-e kapunk, akkor nem sikerül eljesen kiszűrnünk az ingadozás, ehá korrekció szükséges. 0,5564 0,8147 1,658 0,9539 1 T.Nagy Judi 31
Saiszika II. A korrekciós ényező: 4 s I. s II. s III. s IV. (mérani álag) Korrekciós ényező: 4 0,5564 0,8147 1,6158 0,9539 = 0, 9143 Az egyes negyedévek korrigál szezonindexei: s * = s korrekciós ényező s I. * = s II. * = s III. * = s IV. * = 0,5564 = 0,6086 0,9143 0,8147 = 0,8911 0,9143 1,6158 =1,7673 0,9143 0,9539 =1,0433 0,9143 Időszak I. II. III. IV. 2004 0,42 0,73 1,97 0,97 2005 0,65 0,87 1,59 1,24 2006 0,78 1,02 1,7 0,81 2007 0,45 0,68 1,28 0,85 Prod. Korr. s: szezonindex (mérani álag) 0,5564 0,8147 1,6158 0,9539 0,6987 0,9143 s*: korrigál szezonindex 0,6086 0,8911 1,7673 1,0433 1 Így a korrekcióval elérük, hogy a (korrigál) szezonindexek szorzaa 1 legyen: s I. * s II. * s III. * s IV. * = 1 0,6086 0,8911 1,7673 1,0433=1 A szezonindexek jelenése: s * I. = 0,6086: A vizsgál időszakban az első negyedévben a szezonhaás mia a ényleges érékesíe burgonyamennyiség álagosan 0,6086-szorosa (60,86%-a, 39,14%-kal alaa marad) a rend szerini éréknek. T.Nagy Judi 32
Saiszika II. s Jl-Sz * = 1,7673: A vizsgál időszakban a harmadik negyedévben a szezonhaás mia a ényleges érékesíe burgonyamennyiség álagosan 1,7673-szorosa (76,73%-kal meghaladja) a rend szerini éréknek (éréke). Előrejelzés (Exrapoláció) Muliplikaív modellben: ŷ s* (vagy s) II. 3. MINTAPÉLDA Haározzuk meg érékesíe burgonyamennyisége 2008. IV. negyedévében: 2008. IV. negyedévére: = 20-a a rend szerini érék: ŷ 20 = 0,34 20 + 13, 57 =6,77 a szezonaliás figyelembe véve azaz a IV. negyedév szezonindexével módosíva ŷ s* = 6,77 1,0434 = 7,0638 Érelmezés: Tehá a várhaóan érékesíe burgonyamennyiség 2008. IV. negyedévében, ha a apaszal endencia folyaódik 7,06 ezer lesz. 20 IV. Vélelen haás II. 3. MINTAPÉLDA Haározzuk meg, hogy mekkora vol a vélelen haás 2007. I. negyedévében. A muliplikaív addiív modell szerin: y = szükség, akkor a képleben s helye s * y szerepel), amiből v =. * ŷ s = 13 eseén ŷ 13 = 9,15 ŷ s * v (ha a szezonindexek korrekciójára vol A érékesíe burgonyamennyiség a rend szerin 2007. I. negyedévében 9,15 ezer onna. * I. (ŷ s ) = 9,15 0,6086 = 5,5687 13 T.Nagy Judi 33
Saiszika II. A érékesíe burgonyamennyiség a becslésünk szerin, figyelembe véve a szezonaliás 2007. I. negyedévében 5,57 ezer onna. 4,1 v 13 = = 0,7363 5,5687 Érelmezés: Tehá a vélelen haás 2007. I. negyedévében 0,74 vol. T.Nagy Judi 34
Saiszika II. Összefoglalás Az idősorelemzés menee 1. Ábrázoljuk az adaoka pondiagramon. Ebből megállapíhaó a rendfüggvény ípusa (lineáris, nemlineáris) hogy van-e szezonaliás (és, hogy addiív vagy muliplikaív a modell) 2. A lineáris rendfüggvény meghaározása b 1, b 0 paraméerek meghaározása majd a rendvonal egyenleének egyenle felírása.: ŷ = b1 + b0 Ha van szezonaliás: 3. A rendfüggvénnyel becsül adaok ( ŷ ) kiszámíása. 4. A szezonális ingadozás kimuaása (szezonális elérések vagy szezonindexek meghaározása) Az egyedi szezonális elérések/szezonindexek kiszámíása Addiív modell y ŷ Muliplikaív modell Cél: Az egyes szezonok álalános jellemzése, szezononkéni (számani ill. mérani) álagolással. Így kapjuk s I., s II., s III., s IV. szezonális elérések/szezonindexek éréké. Ha sikerül eljesen kiszűrnünk az ingadozás: s = 0 s = 1 Ha nem, akkor az s-eke nyers szezonális eléréseknek/szezonindexeknek nevezzük és belőlük korrekcióval kapjuk az ún. korrigál szezonális eléréseke/szezonindexeke (s * ). A korrekciós ényező a szezonális elérések/szezonindexek számani/mérani álaga. s korrekciós ényező = korrekciós ényező = m s m s * = s korrekciós ényező y ŷ s * = s korrekciós ényező T.Nagy Judi 35
Saiszika II. Gyakorló Feladaok 1. Magyarország burgonyaermelésének alakulása 2001-2007 közö (KSH): Burgonyaermelés Év (ezer hekár) 2001 36 2002 34 2003 31 2004 31 2005 25 2006 23 2007 26 Felada Illesszen rendfüggvény az adasorra. Érelmezze a függvény paraméerei. Becsülje meg a rendfüggvény segíségével az ország 2009-es burgonyaermelésé. 2. A hangverseny láogaók számának alakulása 1990 és 2006 közö Magyarországon (KSH): 1000 lakosra juó hangverseny Év láogaó 1990 72 1991 58 1992 56 1993 50 1994 49 1995 45 1996 44 1997 37 1998 39 1999 41 2000 42 2001 44 2002 48 2003 46 2004 45 2005 50 2006 43 2 = 1785 y =6900 Felada Illesszen rendfüggvény az adasorra. Érelmezze a függvény paraméerei. T.Nagy Judi 36
Saiszika II. Becsülje meg a rendfüggvény segíségével, a 2008-ban ezer lakosra juó hangverseny láogaók számá. 3. Az egyeeme végze foglalkozaoak számának alakulása Magyarországon (december 31.) (KSH): Év Egyeeme végze foglalkozaoak száma (ezer fő) 1998 246,6 1999 244,9 2000 275,7 2001 269,8 2002 265,6 2003 299,0 2004 332,7 2005 335,5 2006 330,8 Felada Illesszen rendfüggvény az adasorra. Érelmezze a függvény paraméerei. Becsülje meg a rendfüggvény segíségével a foglalkozaoak számá, 2008-ban. 4. Magyarország vendégláóhelyeinek eladási forgalma 2005 és 2007 közö (KSH): Időszak Forgalom (Mrd F) 2005 I. negyedév 16 II. negyedév 17 III. negyedév 14 IV. negyedév 20 2006 I. negyedév 21 II. negyedév 18 III. negyedév 14 IV. negyedév 22 2007 I. negyedév 22 II. negyedév 21 III. negyedév 16 IV. negyedév 24 T.Nagy Judi 37
Saiszika II. Felada Haározza meg a forgalom irányzaá leíró lineáris rendfüggvény és érelmezze a paraméerei. Vizsgálja meg a szezonaliás, muliplikaív kapcsolao feléelezve. Haározza meg a vélelen szerepé 2006. III. negyedévében. Becsülje meg a 2008. IV. negyedévében várhaó forgalma. 5. Az iasan, segédmoor kerékpárral okozo baleseek számának alakulása Magyarországon 2005 és 2007 közö (KSH): Időszak Baleseek száma 2005 I. negyedév 22 II. negyedév 67 III. negyedév 70 IV. negyedév 36 2006 I. negyedév 20 II. negyedév 79 III. negyedév 89 IV. negyedév 46 2007 I. negyedév 34 II. negyedév 87 III. negyedév 99 IV. negyedév 48 Felada Haározza meg és érelmezze a lineáris rendfüggvény paraméerei. Vizsgálja meg a szezonaliás, addiív modell feléelezve. Haározza meg a vélelen szerepé 2005. IV. negyedévében. Becsülje meg, hogy a 2009. I. negyedévében hány balese várhaó. 6. Egy uazási iroda, lineáris rend szerini bevéele 2001. IV. negyedévében 45 millió F vol. Ez az éréke a 2002. és 2007. időszak (negyedéves) adaaiból számío rend alapján haározák meg. A negyedévenkéni álagos növekedés 1,2 millió F. Felada Írja fel a lineáris rend egyenleé. Haározza meg a 2005. I. negyedévi rend szerini éréke. A negyedévekre vonakozó korrigál szezonindexek a kövekezők volak: szezonindex I. negyedév II. negyedév III. negyedév IV. negyedév % 76 130 90 T.Nagy Judi 38
Saiszika II. Felada Számísa ki és érelmezze a hiányzó adao. Készísen előrejelzés 2009. III. negyedévére (a szezonaliás figyelembe véve). 7. Egy cég forgalma 2001. és 2007. közö a negyedéves adaok alapján a kövekező rendfüggvénnyel írhaó le (M F): ŷ =1,6 + 11,2 A negyedévekre vonakozó korrigál szezonális elérések a kövekezők volak: Szezonális elérés I. negyedév II. negyedév III. negyedév IV. negyedév M F 0,8-1,3-2,2 Felada Érelmezze a rendfüggvény paraméerei. Haározza meg és érelmezze a hiányzó szezonális elérés. Becsülje meg 2009. II. negyedévében várhaó forgalma. T.Nagy Judi 39