Ökonometria gyakorló feladatok Többváltozós regresszió 2019. március 1. 1. Az UCSD egyetem felvételi irodája egy 427 hallgatóból álló véletlen mintát vett, és kiszámolta az egyetemi átlagpontszámukat (COLGPA), a középiskolai átlagpontszámukat (HSGPA), a felvételi vizsgán elért pontszámaikat nem módszertani tárgyakból (VSAT) és matematikából (MSAT). A következő modellt becsülték (a t alsó indexet elhagytuk az egyszerűség kedvéért): COLGP A t = β 1 + β 2 HSGP A t + β 3 V SAT t + β 4 MSAT t + ε t. A becsült együtthatók és sztenderd hibáik a következők: Együttható Sztenderd hiba Tesztstatisztika Szignifikancia ˆβ 1 0.423 0.220 ˆβ 2 0.398 0.061 ˆβ 3 7.375e-04 2.807e-04 ˆβ 4 0.001015 2.936e-04 a) A fenti táblázatban töltse ki az együtthatók egyenkénti relevanciájára vonatkozó tesztstatisztika oszlopot, majd 5%-os szignifikancia szinten döntsön arról, hogy az együttható szignifikáns-e! (Az eloszlás kritikus értékének megállapításához használja a megfelelő eloszlás táblázatokat.) b) A fenti modellben azt kaptuk, hogy a HSGPA változó esetén V IF HSGP A = 3, 138. Értelmezze ezt az eredményt, számítsa ki belőle a tolerancia mutatót és az R 2 HSGP A V SAT,MSAT értékét, majd magyarázza is meg a kapott eredményeket! c) Állapítsa meg az eredményváltozó magyarázó változók szerinti parciális rugalmasságát akkor, ha HSGP A = 3, 42, V SAT = 430 és MSAT = 600! Értelmezze is a kapott eredményeket! 2. A következő táblázat négy olyan modell becsléseit és a hozzájuk tartozó statisztikákat tartalmazza (a p-értékkel a zárójelben), melyek az építési engedéllyel rendelkező magánlakások számát az ezt meghatározó tényezőkkel hozzák összefüggésbe (ha nincs bejegyzés, az azt jelenti, hogy a változó hiányzik a modellből). Az adatok az Egyesült Államok 40 városára vonatkoznak. A modell a következő: HOUSING t = β 1 + β 2 DENSIT Y t + β 3 V ALUE t + β 4 INCOME t + β 5 P OP CHANG t + ahol +β 6 UNEMP t + β 7 LOCALT AX t + β 8 ST AT ET AX t + ε t, HOUSING = a kiadott építési engedélyek száma DENSITY = a négyzetmérföldenkénti népsűrűség VALUE = tulajdonossal rendelkező házak értékének mediánja (száz dollárban) INCOME = háztartások jövedelmének mediánja (ezer dollárban) POPCHANG = a népesség százalékos növekedése 1980 és 1992 között UNEMP = munkanélküliségi ráta LOCALTAX = egy főre eső átlagos helyi adó (dollárban) STATETAX = egy főre eső átlagos állami adó (dollárban) 1
a) Az A modell minden regressziós együtthatóját tesztelje 10 százalékos szinten, hogy értékük nulla-e vagy sem (a zárójelben lévő értékek a kétoldali alternatív hipotézis p-értékei). A próba alapján a változót a modellben hagyná, vagy kihagyná a modellből? b) Tesztelje a modell egészének relevanciáját 5%os szignifikancia szinten! c) Az A modellben tesztelje a H 0 : β 2 = β 6 = β 7 = β 8 = 0 együttes hipotézist 10 százalékos szinten. Ne felejtse el felírni az alternatív hipotézist, kiszámítani és felírni a tesztstatisztikát és eloszlását a nullhipotézis fennállása esetén, és a nullhipotézis elfogadásának vagy elvetésének kritériumát. Ismertesse következtetését! d) Melyik a "legjobb" a modellek közül? Milyen kritériumot használt a legjobb modell kiválasztásához? e) Tegyük fel, hogy a D modellben a HOUSING változót ezer egységben mérik, és ugyanakkor a jövedelmet száz dollárban. Írja fel az új modell becsült együtthatóit, a hozzájuk tartozó p-értékeket, és az új korrigált R-négyzetet. Változók A modell B modell C modell D modell CONSTANT 813 (0.74) DENSITY 0.075 (0.43) VALUE 0.855 (0.13) INCOME 110.411 (0.14) POPCHANG 26.766 (0.11) UNEMP 76.546 (0.48) LOCALTAX 0.061 (0.95) STATETAX 1.006 (0.40) 392 (0.81) 0.062 (0.32) 0.873 (0.11) 133.025 (0.04) 29.185 (0.06) 1.004 (0.37) 1279 (0.34) 0.042 (0.47) 0.994 (0.06) 125.705 (0.05) 29.406 (0.001) 973 (0.44) 0.778 (0.07) 116.597 (0.06) 24.857 (0.08) ESS 4.763e+7 4.843e+7 4.962e+7 5.038e+7 Nem korr. R 2 0.349 0.338 0.322 0.312 σ 2 1.488e+6 1.424e+6 1.418e+6 1.399e+6 AIC 1.776e+6 1.634e+6 1.593e+6 1.538e+6 HQ 2.007e+6 1.791e+6 1.719e+6 1.821e+6 SCHWARZ 2.490e+6 2.105e+6 1.967e+6 1.821e+6 3. 31 év adatainak felhasználásával a következő modellt becsülték az oregoni fakitermelésre: ahol HARV EST t = β 1 + β 2 EXP ORT S t + β 3 HOUST ART t + β 4 INDP ROD t + +β 5 T IMBP RIC t + β 6 P RODP RIC t + ε t, HARVEST = teljes fakitermelés milliárd boardfoot-ban (1 boardfoot=144 köbhüvelyk) EXPORTS = külföldi oszágokba irányuló faanyag-export volumene 100 millió boardfootban HOUSTART = összes megkezdett lakásépítés az Egyesült Államokban, millióban INDPROD = papír- és faipari termékek ipari termelési indexe TIMBPRIC = 1000 boardfoot faanyag ára dollárban PRODPRIC = a fogyasztási cikkek termelői árindexe 2
A következő táblázat három alternatív modell becsléseit tartalmazza (n=31, és a zárójelben lévő értékek a sztenderd hibák): A modell B modell C modell Változó együttható t-stat. együttható t-stat. együttható t-stat. (std. hiba) (std. hiba) (std. hiba) CONSTANT 3.913 (0.574) EXPORTS 0.108 (0.082) HOUSTART 0.524 (0.355) INDPROD 0.525 (0.127) TIMBPRIC 0.018 (0.011) PRODPRICE 0.456 (0.087)...... 4.269 (0.376) 3.602 (0.533)...... 0.618 (0.360)...... 0.694 (0.080)............ 0.556 (0.079)...... 0.612 (0.091)...... 0.481 (0.089).................. d.f................... Kritikus érték.................. ESS 6.22273 7.90322 7.1265 R 2 0.798 0.744 0.769 Korrigált R 2 0.758 0.725 0.743 AIC 0.29562 0.309385 0.297571 HQ 0.323613 0.323702 0.316071 SCHWARZ 0.390185 0.355441 0.358054 a) Egészítse ki a fenti táblázatot a hiányzó adatokkal! (Írja be a tesztstatisztikák megfelelő értékeit annak teszteléséhez, hogy az egyes regressziós együtthatók - kivéve a konstanst - szignifikánsan különböznek nullától. Írja be mindegyik modellhez a szabadságfokokat (d.f.) is. Írja be a 10%-os szignifikanciaszinthez tartozó kritikus értékeket, és tesztstatisztikák mellé írja oda, hogy a hozzá tartozó együttható szignifikáns-e vagy sem.) b) A három modell közül melyiket gondolja a "legjobbnak"? Ismertesse, milyen kritériumot használt, és miért azt a modellt választotta, amelyiket! c) A B modellben tesztelje az EXPORTS, HOUSTART és TIMBPRIC változók együttes relevanciáját 5%-os szignifikancia szinten! d) Értelmezze a HOUSTART változó marginális hatását és a korrigált R 2 mutató értékét az A modell esetén! e) Tegyük fel, hogy az EXPORTS változót milliárd boardfootban mérik. Írja fel az együtthatók és a sztenderd hibák új számszerű értékeit, melyek emiatt megváltoztak (csak az A modellben). Hogyan hatott a mértékegység megváltoztatása a t-statisztikákra, F -statisztikákra és az R 2 -re? 4. Tíz év negyedéves adatainak felhasználásával (40 adat összesen) az ezer főre eső új gépkocsi eladások számát (NUMCARS) modellezték az új gépkocsik árindexe (PRICE), az egy főre jutó reáljövedelem (INCOME), a kamatláb (INTRATE), és a munkanélküliségi ráta (UNEMP) segítségével. Két alternatív modellt becsültek, melyek adatai az alábbi táblázatban láthatóak (a 3
zárójelben lévő értékek a sztenderd hibák, és ha a táblázatban nincs bejegyzés, az azt jelenti, hogy az adott változó hiányzik a modellből): Változók A modell B modell CONSTANT -7,4533 15,2380 (13,57) (1,167) PRICE -0,071-0,024 (0,035) (0,007) INCOME 0,0032 (0,001) INTRATE -0,154-0,205 (0,049) (0,051) UNEMP -0,073 (0,298) R 2 0,758 0,565 a.) Az "A" modellben tesztelje az INCOME és UNEMP változók együtthatóinak együttes relevanciáját 5%-os szinten! b.) Értelmezze mindkét modell R 2 mutatójának értékét! c.) Értelmezze a "B" modellben a PRICE és INTRATE változók marginális hatását! d.) Határozza meg a "B" modellben az ezer főre eső új gépkocsik eladási számának kamatlábra vonatkozó rugalmasságát INT RAT E = 10% és P RICE = 116 esetén! 5. 82 megfigyelés alapján személygépkocsik árát (P) modellezzük lineáris regresszió segítségével a hosszúság (L), a szélesség (WI), a súly (WE), a motor teljesítménye (PO) és a fogyasztás (GAS) függvényében. a.) A futási eredmények során azt kaptuk, hogy a súly (WE) változó esetén VIF WE = 9, 647. Számítsa ki a tolerancia és az RWE L,WI,PO,GAS 2 mutatókat, majd értelmezze mindhárom értéket! b.) A fenti modellben eredetileg az árat ezer euro-ban, a fogyasztást pedig literben mérték. Ekkor a modell becsült együtthatói az alábbiak voltak: const = 59, 25, β L = 0, 385, β W I = 0, 132, β W E = 2, 185, β P O = 0.264, β GAS = 0, 196. Hogyan változnak meg a becsült együtthatók értékei, ha az árat euro-ban, a fogyasztást pedig deciliterben mérjük? 6. 40 véletlenszerűen kiválasztott külföldi utazás jellemző adatait vizsgáltuk az alábbi változók függvényében: AR: az utazás ára (ezer Ft) T AV : utazás hossza (száz km) IDO: az utazás időtartama (nap) D 1 és D 2 : az utazás módját jelölő dummy változók, melyek a referencia kódolás alapján az alábbi értékeket veszik fel: D 1 = 0 és D 2 = 0, ha autóbusszal utaztunk, D 1 = 1 és D 2 = 0, ha repülővel utaztunk, és D 1 = 0 és D 2 = 1, ha autóbusszal és repülővel is utaztunk. 4
A becsült lineáris regressziós modell az alábbi (zárójelben a p-értékek): AR t = 14, 698 + 7, 28 T AV t + 3, 164 IDO t + 17, 712 D 1,t + 25, 384 D 2,t 0,0000 0,005 0,028 0,024 a.) Értelmezze a modell becsült paramétereit (a konstans kivételével), valamint szignifikanciájuk p-értékeit! b.) Határozza meg az ár távolságra vonatkozó rugalmasságát egy olyan kovariáns esetén, amikor az utazás hossza 4000 km, repülővel utazunk, és az utazás időtartama egy hét! 7. Egy szabadidőpark 100 napon keresztül figyeli a következő változók értékeit: Y : a látogatók száma (fő) X 1 : hőmérséklet (C o ) X 2 : 0, ha hétköznap, 1, ha hétvége volt D 1 és D 2 : az időjárást jelölő dummy változók, melyek a referencia kódolás alapján az alábbi értékeket veszik fel: D 1 = 0 és D 2 = 0, ha sütött a nap, D 1 = 1 és D 2 = 0, ha esett az eső, és D 1 = 0 és D 2 = 1, ha borult volt az idő, de nem esett. A becsült modell az alábbi (zárójelben a p-értékek): Y t = 384 + 124 0,0000 X 1,t + 401 0,001 X 2,t 274 0,012 D 1,t 361 0,003 D 2,t RSS = 13 372 617 ESS = 414 984. a.) Értelmezze a modell becsült paramétereit (konstans kivételével)! b.) Határozza meg és értelmezze a többszörös determinációs együtthatót! c.) Határozza meg a látogatók számának hőmérsékletre vonatkozó rugalmasságát egy olyan hétvégi napon, amikor sütött a nap, és a napi középhőmérséklet 25 C 0 volt! 8. Egy ingatlanközvetítő iroda adatai alapján 20 véletlenszerűen kiválasztott budapesti öröklakás eladási ára (AR, millió Ft), életkora (KOR, év) és területe (T ERULET, m 2 ) közti kapcsolatot vizsgáltuk többváltozós lineáris regresszió segítségével. a.) Egészítsük ki az alábbi számítógépes output hiányzó adatait! Model: OLS, using observations 1 20 Dependent variable: AR Coefficient Std. Error t-ratio p-value const.......... 1.083 0.69 0.499 KOR -0.017 0.008.......... 0.049 TERULET 0.0373.......... 2.55 0.02 Sum squared resid (ESS)...... S.E. of regression (s e )...... R 2 0.64 Adjusted R 2...... 5
ANOVA tábla Source SS df MS F p RSS 19,0732........................... 0,000 ESS........................... TSS 29,8103......... b.) Írja fel a kapott modellt, értelmezze a magyarázó változók együtthatóit (a konstans kivételével), valamint a modell R 2 mutatóját! c.) Határozza meg az eladási ár korra és alapterületre vonatkozó rugalmasságát egy 15 éves, 72 m 2 -es lakás esetén! 9. Egy vállalatnál azt vizsgálták, hogy milyen tényezők befolyásolják a kereset alakulását. Ennek érdekében 45 dolgozó esetén feljegyezték az órabérüket (Y, órabér Ft/óra), a munkahelyen eltöltött időt (MUELIDO, év), az életkort (KOR, év), a nemet (NEM, 1 ha férfi, 0 ha nő) és a szakképzettséget (SZAKKEP Z, 1 ha van, 0 ha nincs). A változók közti kapcsolat feltérképezésére többváltozós lineáris regressziót alkalmaztunk. a.) Egészítsük ki az alábbi számítógépes output hiányzó adatait! ANOVA tábla Model: OLS, using observations 1 45 Dependent variable: Y Coefficient Std. Error t-ratio p-value const 105.05 10.72 9.80 0.000 MUELIDO 2.2585.......... 5.48 0.000 KOR 0.2238 0.3536.......... 0.53 NEM.......... 5.277 1.55 0.129 SZAKKEPZ 21.97 4.952.......... 0.000 Sum squared resid (ESS)...... S.E. of regression (s e )...... R 2 0.783 Adjusted R 2...... Source SS df MS F p RSS.................. 8268,7 36,07 0,000 ESS........................... TSS 42 244, 4......... b.) Írja fel a kapott modellt (csak a szignifikáns együtthatókhoz tartozó változókat vegye be a modellbe)! Értelmezze a szignifikáns együtthatóval rendelkező magyarázó változók együtthatóit, valamint a modell R 2 mutatóját! c.) Határozza meg az órabér munkahelyen eltöltött időre vonatkozó rugalmasságát egy 5 éve a vállalatnál dolgozó, szakképzettséggel rendelkező, 38 éves férfi dolgozó esetén! 6
MEGOLDÁSOK, VÉGEREDMÉNYEK 1. a.) A kritikus érték: t 0,975(427 4) = 1, 96. 2. Együttható Sztenderd hiba Tesztstatisztika Szignifikancia ˆβ 1 0.423 0.220 =0,423/0,22=1,922 nem szig. ˆβ 2 0.398 0.061 =0,393/0,061=6,524 szig. ˆβ 3 7.375e-04 2.807e-04 =2,627 szig. ˆβ 4 0.001015 2.936e-04 =3,457 szig. b.) A V IF HSGP A = 3, 138 azt jelenti, hogy az együttható becslésekor keletkező variancia 3, 138- szeresére változik a multikollinearitás miatt. 1 T ol HSGP A = V IF HSGP A = 0, 318, azaz ez a változó viszonylag kevés többletinformációt hoz a modellbe. RHSGP 2 A V SAT,MSAT = 1 T ol HSGP A = 0, 682, azaz a HSGPA változó mintabeli szóródását a VSAT és MSAT változók 68, 2%-ban magyarázzák. c.) Mivel az adott kovariánsnál így COLGP A = 0, 423 + 0, 398 3, 42 + 7, 375 10 4 430 + 0, 001015 600 = 2, 71, COLGP A HSGP A HSGP A COLGP A = β 2 HSGP A COLGP A = 0, 398 3, 42 2, 71 = 0, 502, azaz ha a középiskolai átlagpontszám (HSGPA) 1%-kal növekszik, akkor az egyetemi átlagpontszám átlagosan 0, 502%-kal nő. COLGP A V SAT V SAT COLGP A = β V SAT 3 COLGP A = 0, 117, azaz ha a nem módszertani tárgyakból elért felvételi pontszám 1%-kal növekszik, akkor az egyetemi átlagpontszám átlagosan 0, 117%-kal nő. COLGP A MSAT MSAT COLGP A = β 4 MSAT COLGP A = 0, 225, azaz ha a matematika felvételi vizsga átlagpontszáma 1%-kal növekszik, akkor az egyetemi átlagpontszám átlagosan 0, 225%-kal nő. a.) A p-értékeke alapján minden változót ki kellene hagyni a modellből, mert mindegyik p-értéke 10% feletti. b.) H 0 : β 1 =... = β 8 = 0, H 1 : β i 0, i = 1,..., 8. Mivel R 2 = 0, 349 = RSS/T SS = 1 ESS/T SS és ESS = 4, 763 10 7, így innen T SS = 7, 316 10 7, tehát T SS ESS = RSS = 2, 553 10 7. ANOVA teszt: F = 2,553 10 7 7 4,763 10 7 (40 8) = 2, 45. A kritikus érték F 0,95(7, 32) = 2, 3, így a nullhipotézist elutasítjuk, modellünk releváns. 7
c.) Wald teszt az A és a D modell segítségével. A bővebb modell az A modell, a szűkebb a D. m = 4, hiszen ennyi változó elhagyását teszteljük, n = 40 a mintaelemszám, m + q = 8 a bővebb modell becsült együtthatóinak száma. A kritikus érték F 0,95(4, 32) = 2, 68. A számított statisztika: F = 0,349 0,312 4 1 0,349 (40 8) = 0, 455, azaz a nullhipotézis elfogadjuk, elhagyható egyszerre mind a négy változó a modellből. d.) Az A modell kiesett a játékból a feladat a.) pontján. A maradék három modellből az információs kritériumok alapján a C vagy a D modellt érdemes választani. Nincs egzakt megoldás, bármelyik modell mellett lehet érvelni. Az R 2 mutatók nem hasonlíthatóak össze, mert különbözik a magyarázó változók darabszáma a modelleknél. e.) Ekkor HOUSING = 1000 HOUSING, ahol HOUSING jelöli az új, ezer darabos egységben mért változót. Ugyanekkor INCOME = 0, 1 INCOME, ahol INCOME jelöli az új, száz dollárban mért jövedelmet. Az új modell: HOUSING = 973 1000 0, 778 1000 V ALUE + 116, 597 1000 1 10 24, 857 INCOME + P OP CHANG. 1000 A p-értékek és R 2 mutatók értékei nem változnak, mert mértékegység-függetlenek. 3. A táblázat kitöltendő részlete: A modell B modell C modell Változó együttható t-stat. együttható t-stat. együttható t-stat. (std. hiba) (std. hiba) (std. hiba) CONSTANT 3.913 (0.574) EXPORTS 0.108 (0.082) HOUSTART 0.524 (0.355) INDPROD 0.525 (0.127) TIMBPRIC 0.018 (0.011) PRODPRICE 0.456 (0.087) 0,108 0,082 = 1, 317 4.269 (0.376) 3.602 (0.533) 1, 476 0.618 (0.360) 4, 134 0.694 (0.080) 1, 636 5, 241 0.556 (0.079) 8, 675 0.612 (0.091) 7, 04 0.481 (0.089) 1, 717 6, 725 5, 4 d.f. 31 6 = 25 31 3 = 28 31 4 = 27 Kritikus érték 1, 708 1, 701 1, 703 a.) A pirossal jelölt együtthatók szignifikánsan nullák, a kékkel szedettek szignifikánsan nem nullák. b.) Az A modellt a szignifikánsan nulla együtthatók miatt nem választjuk. A B és C modell közül a korrigált R 2 mutatók és az információs kritériumok alapján a C modellt lenne érdemes választani, de a feladat c.) részében éppen azt kapjuk, hogy a B modell a legjobb választás. 8
c.) Wald teszt az A és a B modell segítségével. A bővebb modell az A modell, a szűkebb a B. m = 3, hiszen ennyi változó elhagyását teszteljük, n = 31 a mintaelemszám, m + q = 6 a bővebb modell becsült együtthatóinak száma. A kritikus érték F0,95(3, 25) = 2, 991. A számított statisztika: F = 0,798 0,743 3 1 0,798 (31 6) = 2, 23, azaz a nullhipotézis elfogadjuk, elhagyható egyszerre mind a három változó a modellből. d.) R 2 = 0, 798 azt jelenti, hogy a magyarázó változók az eredményváltozó mintabeli szóródását 79, 8%-ban magyarázzák. A HOU ST ART változó marginális hatása HARV EST HOUST ART = 0, 524 azt jelenti, hogy ha az összes megkezdett lakásépítés darabszáma egységnyivel, azaz egymillió darabbal növekszik, akkor a teljes fakitermelés átlagosan 0, 502 egységnyivel nő, azaz kb. 500 millió boardfoot mennyiséggel nő. e.) Ekkor EXP ORT S = 10 EXP ORT S, ahol EXP ORT S jelöli az új változót. Ennek megfelelően csak az ő együtthatója változik meg, az új βexp = 1, 08, sztenderd hibája 0, 82, minden más együttható változatlan marad. A t-statisztika, F -statisztika, R 2 mutató nem változtak, mert mértékegység függetlenek. 4. a.) Wald teszt az A és a B modell segítségével. A bővebb modell az A modell, a szűkebb a B. m = 2, hiszen ennyi változó elhagyását teszteljük, n = 40 a mintaelemszám, m + q = 5 a bővebb modell becsült együtthatóinak száma. A kritikus érték F0,95(2, 35) = 3, 28. A számított statisztika: F = 0,758 0,565 2 1 0,758 (40 5) = 13, 98, azaz a nullhipotézis elutasítjuk, nem hagyható el egyszerre mind a két változó a modellből. b.) RA 2 = 0, 758 azt jelenti, hogy az ezer főre eső új gépkocsik eladási számának mintabeli szóródását az A modellbeli magyarázó változók 75, 8%-ban magyarázzák. RB 2 = 0, 565 azt jelenti, hogy az ezer főre eső új gépkocsik eladási számának mintabeli szóródását a B modellbeli magyarázó változók 56, 5%-ban magyarázzák. c.) A P RICE változó marginális hatása NUMCARS P RICE = 0, 024 azt jelenti, hogy ha az árindex egységnyivel növekszik, akkor az ezer főre eső új gépkocsik eladási száma átlagosan 0, 024 egységnyivel csökken. Az INT RAT E változó marginális hatása NUMCARS INT RAT E = 0, 205 azt jelenti, hogy ha a kamatláb egységnyivel növekszik, akkor az ezer főre eső új gépkocsik eladási száma átlagosan 0, 205 egységnyivel csökken. 9
d.) MIvel az adott kovariánsnál így NUMCARS INT RAT E NUMCARS = 15, 238 0, 024 116 0, 205 10 = 10, 404, INT RAT E NUMCARS = β INT RAT E INT RAT E NUMCARS = 0, 205 10 10, 404 = 0, 197, azaz ha a kamatláb 1%-kal növekszik, akkor az ezer főre eső új gépkocsik eladási száma átlagosan 0, 502%-kal nő. 5. a.) A V IF W E = 9, 647 azt jelenti, hogy az együttható becslésekor keletkező variancia 9, 642- szeresére változik a multikollinearitás miatt. 1 T ol W E = V IF W E = 0, 104, azaz ez a változó viszonylag kevés többletinformációt hoz a modellbe. RW 2 E L,W I,P O,GAS = 1 T ol W E = 0, 896, azaz a WE változó mintabeli szóródását a többi magyarázó változók 89, 6%-ban magyarázzák. b.) Ekkor P = 1 P, ahol P jelöli az új, ezer euro-ban mért változót. Ugyanekkor GAS = 1000 1 10 GAS, ahol GAS jelöli az új, deciliterben mért fogyasztást. const = 59, 25 1000, β L = 0, 385 1000, β W I = 0, 132 1000, β W E = 2, 185 1000, β P O = 0.264 1000, β GAS = 0, 196 100. 6. a.) A β T AV = 7, 28 azt jelenti, hogy ha az utazás távolsága egységnyivel nő (100 km), akkor az ár átlagosan 7, 28 egységnyivel, azaz 7280 forinttal lesz drágább. A β IDO = 3, 164 azt jelenti, hogy ha az utazás időtartama egységnyivel nő (1 nap), akkor az ár átlagosan 3, 164 egységnyivel, azaz 3164 forinttal lesz drágább. A β D1 = 17, 712 azt jelenti, hogy ha repülővel utaztunk, akkor az ár átlagosan 17, 712 egységnyivel, azaz 17712 forinttal drágább, mint az autóbuszos utazás. A β D2 = azt jelenti, hogy ha autóbusszal és repülővel is utaztunk, akkor az ár átlagosan 25, 384 egységnyivel, azaz 25384 forinttal drágább, mint az autóbuszos utazás. 5%-os szignifikancia szinten minden együttható szignifikáns. 1%-os szignifikancia szinten D 1 és D 2 együtthatói már szignifikánsan nullák. b.) MIvel az adott kovariánsnál ÂR = 14, 698 + 7, 28 40 + 3, 164 7 + 17, 712 1 = 316, 362, így AR T AV T AV ÂR = β T AV T AV ÂR = 7, 28 40 = 0, 92, 316, 362 azaz ha a távolság 1%-kal növekszik, akkor az ár átlagosan 0, 92%-kal nő. 7. a.) A β X1 = 124 azt jelenti, hogy ha a hőmérséklet egységnyivel nő (1 C o ), akkor a látogatók száma átlagosan 124 fővel növekszik. A β X2 = 401 azt jelenti, hogy hétvégén a látogatók száma átlagosan 401 fővel növekszik a hétköznapokhoz képest. 10
A β D1 = 274 azt jelenti, hogy ha esik az eső, akkor a látogatók száma átlagosan 274 fővel csökken egy napsütéses nap látogatóihoz viszonyítva. A β D2 = 361 azt jelenti, hogy ha borult az idő, de nem esett, akkor a látogatók száma átlagosan 361 fővel csökken egy napsütéses nap látogatóihoz viszonyítva. b.) R 2 RSS = RSS + ESS = 13372617 = 0, 969, 13372617 + 414984 azaz a magyarázó változók 94, 9%-ban magyarázzák a látogatók számának mintabeli szóródását. c.) MIvel az adott kovariánsnál Ŷ = 384 + 124 25 + 401 1 = 3885, így Y X1 X 1 Ŷ = β X 1 X1 Ŷ = 124 25 = 0, 798, 3885 azaz ha a hőmérséklet 1%-kal növekszik, akkor a látogatók száma átlagosan 0, 798%-kal nő. 8. a.) A kitöltött táblázat: Model: OLS, using observations 1 20 Dependent variable: AR Coefficient Std. Error t-ratio p-value const 0.747 1.083 0.69 0.499 KOR -0.017 0.008-2.12 0.049 TERULET 0.0373 0.146 2.55 0.02 Sum squared resid (ESS) 10,7371 S.E. of regression (s e ) 0,795 R 2 0.64 Adjusted R 2 0,618 ANOVA tábla Source SS df MS F p RSS 19,0732 2 9,5366 15,099 0,000 ESS 10,7371 17 0,6316 TSS 29,8103 19 A táblázat első fele kitölthető az együtthatók egyenkénti relevanciájára vonatkozó t = összefüggés felhasználásával. Az ESS mutató kiszámításához az ESS = T SS RSS összefüggést kell használni, mely az ANOVA tábla első oszlopából kiszámítható. Ennek segítségével a regresszió sztenderd hibája s e = ESS, a korrigált determinációs együttható pedig 17 R 2 = 1 ESS(n 2) T SS(n k) 11 = 1 10, 7371 18 29, 8103 17 = 0, 618. ˆβ s ˆβ
A szabadsági fokokra: df RSS = k 1 = 2, df ESS = n k = 20 3 = 17 és df T SS = n 1 = 19, ahol n a mintaelemszám (20), k pedig a modell becsült együtthatóinak száma (3). Innen MS RSS = RSS 2 = 9, 5366 MS ESS = ESS 17 = 0, 6316 F = MS RSS MS ESS = 15, 099. b.) A kapott modell: ÂR = 0, 747 0, 017 KOR + 0, 0373 T ERULET. R 2 = 0, 64 azt jelenti, hogy a KOR és TERULET magyarázó változók az AR mintabeli szóródását 64%-ban tudják magyarázni. A β KOR = 0, 747 azt jelenti, hogy az életkor egységnyi (1 év) növekedésével az ár átlagosan 0, 747 egységgel, azaz 747000 forinttal csökken. A β T ERULET = 0, 0373 azt jelenti, hogy a terület egységnyi (1 m 2 ) növekedésével az ár átlagosan 0, 0373 egységgel, azaz 37300 forinttal nő. c.) MIvel az adott kovariánsnál ÂR = 0, 747 0, 017 15 + 0, 0373 72 = 3, 1776, így AR KOR = β KOR KOR ÂR = 0, 017 15 = 0, 08, 3, 1776 azaz ha az életkor 1%-kal növekszik, akkor az ár átlagosan 0, 08%-kal csökken, és AR T ERULET T ERULET ÂR = β T ERULET T ERULET ÂR = 0, 0373 azaz ha a terület 1%-kal növekszik, akkor az ár átlagosan 0, 85%-kal nő. 9. a.) A kitöltött táblázat: ANOVA tábla Model: OLS, using observations 1 45 Dependent variable: Y Coefficient Std. Error t-ratio p-value const 105.05 10.72 9.80 0.000 MUELIDO 2.2585 0.412 5.48 0.000 KOR 0.2238 0.3536 0.633 0.53 NEM 8.179 5.277 1.55 0.129 SZAKKEPZ 21.97 4.952 4.437 0.000 Sum squared resid (ESS) 9169,6 S.E. of regression (s e ) 15,14 R 2 0.783 Adjusted R 2 0,767 72 = 0, 845 3, 1776 12
Source SS df MS F p RSS 33074,8 4 8268,7 36,07 0,000 ESS 9169,6 40 229,24 TSS 42 244, 4 44 A táblázat első fele kitölthető az együtthatók egyenkénti relevanciájára vonatkozó t = összefüggés felhasználásával. Az ESS mutató kiszámításához az ESS = T SS RSS összefüggést kell használni, mely az ANOVA tábla első oszlopából kiszámítható, miután az RSS mutató értékét kiszámítottuk. Az RSS mutató kiszámításához az ANOVA tábla eredményeit kell használni: RSS = MS RSS df RSS = 8268, 7 4 = 33074, 8. ESS A regresszió sztenderd hibája s e =, a korrigált determinációs együttható pedig 40 R 2 = 1 ESS(n 2) T SS(n k) = 1 9169, 6 43 42244, 4 40 = 0, 767. A szabadsági fokokra: df RSS = k 1 = 4, df ESS = n k = 45 5 = 40 és df T SS = n 1 = 44, ahol n a mintaelemszám (45), k pedig a modell becsült együtthatóinak száma (5). Innen b.) A kapott modell: MS ESS = ESS 40 = 229, 24. Ŷ = 105, 05 + 2, 2582 MUELIDO + 21, 97 SZAKKEP Z. R 2 = 0, 783 azt jelenti, hogy a munkahelyen eltöltött id és a szakképzettség magyarázó változók a kereset mintabeli szóródását 78, 3%-ban tudják magyarázni. A β MUELIDO = 2, 2582 azt jelenti, hogy a munkahelyen eltöltött idő egységnyi (1 év) növekedésével a kereset (órabér) átlagosan 2, 2582 egységgel, azaz forinttal nő. A β SZAKKEP Z = 21, 97 azt jelenti, hogy a szakképzettség az órabért átlagosan 21, 97 forinttal növeli. c.) Mivel az adott kovariánsnál így Y MUELIDO MUELIDO Ŷ Ŷ = 105, 05 + 2, 2582 5 + 21, 97 1 = 138, 3125, = β MUELIDO MUELIDO Ŷ = 2, 2582 5 = 0, 082, 138, 3125 azaz ha a munkahelyen eltöltött idő 1%-kal növekszik, akkor az órabér átlagosan 0, 082%-kal nő. Határozza meg az órabér munkahelyen eltöltött időre vonatkozó rugalmasságát egy 5 éve a vállalatnál dolgozó, szakképzettséggel rendelkező, 38 éves férfi dolgozó esetén! ˆβ s ˆβ 13