Ökonometria gyakorló feladatok 1. 018. szeptember 6. 1. Egy vállalatnál megvizsgálták 0 üzletkötő éves teljesítményét és prémiumát. A megfigyelt eredményeket, és a belőlük számolt regressziós részeredményeket az alábbi táblázatban foglaljuk össze: eladott termékek (db/év) (X) prémium (ezer Ft/év) (Y ) számítási részeredmények 7 80 X = 46, Ȳ = 104 9 75 Xi Y i = 99 936 X i = 45 531 67 10 Y i = 683 70 150 (Yi Ŷi) = 7 a) Írja fel a becsült kétváltozós lineáris regressziós modellt, és értelmezze a β paraméter értékét! b) Határozza meg, hogy a teljesítmény hány százalékban magyarázza a prémium szóródását! c) Vizsgálja meg a prémium teljesítményre vonatkozó rugalmasságát az átlagos szinten! Értelmezze az eredményt! d) Adjon 95%-os konfidencia intervallumot a 45 üzletet kötő dolgozó várható prémiumának nagyságára!. Egy New England székhelyű légitársaság 15 repülőjegy értékesítéssel foglalkozó irodájában megvizsgálták, hogy hogyan befolyásolja a reklámkiadás nagysága a repülőjegy értékesítésből származó bevétel alakulását. Az adott év egyik hónapjára vonatkozó adatokat (mindkettő ezer dollárban mérve), és a belőlük számolt regressziós részeredményeket az alábbi táblázatban foglaljuk össze: értékesítés bevétele (Y ) reklámkiadás (X) számítási részeredmények 79,3,5 X = 5, 5, Ȳ = 169 00,1 5,5 (Xi X)(Y i Ȳ ) = 91, 5 (Xi X) = 87, 5 146,0 5, (Yi Ȳ ) = 89600 177,7 7,6 a) Írja fel a becsült kétváltozós lineáris regressziós modellt, és értelmezze a β paraméter értékét! b) Határozza meg, hogy a reklámkiadás hány százalékban magyarázza a bevétel szóródását! c) Határozza meg a bevétel reklámkiadásra vonatkozó rugalmasságát 5000 dolláros reklámkiadás esetén, majd vizsgálja meg a bevétel reklámkiadásra vonatkozó rugalmasságát az átlagos szinten is! Értelmezze az eredményt! d) Adjon 95%-os konfidencia intervallumot a 6000 dolláros reklámkiadáshoz tartozó értékesítés várható bevételének nagyságára! 1
3. Ön egy életbiztosító társaságnak dolgozik, és egy igazgatói értekezletre készül. Közgazdász múltja azt súgja, hogy az életbiztosításban lekötött vagyont (lins) legjobban a jövedelem jelzi előre. Összegyűjti a fontos adatokat (családi életbiztosítás és családi jövedelem, mindkettő ezer dollárban) és elemezni kívánja kapcsolatukat egy, az életbiztosításban lekötött vagyon és a jövedelem (x) közötti regresszió becslésével. Az eredmények a következők: Model 1: OLS, using observations 1 0 Dependent variable: lins Coefficient Std. Error t-ratio p-value const 6,854991 7,383473 0,9844 0,365471 jovedelem 3,880186 0,1115 34,606006 0,0000 Mean of dep. var. 36.95 S.D. of dep. bariable 114.838319 Error Sum of Sq (ESS) 3710.374715 Std Err of Resid. (sgmahat) 14.35795 Unadjusted R-squared 0.985 Adjusted R-squared 0.984 F -statistic (1, 18) 11197.575635 Prob. F >1197.576 is <0.0001 a) El kell magyaráznia a regresszió eredményeit, és mivel az igazgatótanács nem élvezi e kurzus elvégzésének előnyeit, egyszerű szavakkal is le kell tudnia írnia, mi történt. Magyarázza meg, mit jelentenek a következő (ne csak a számokat ismertesse, hanem mutassa be, hogy ezek mit jelentenek a probléma szempontjából): (1) A konstans együttható (α). () A jövedelem együtthatója (β). (3) Az ˆα + ˆβx 0 érték néhány tetszőleges x 0 -ra. (4) Az illeszkedés jóságát mérő R determinációs együttható értéke. b) Az egyik menedzser azzal érvel, hogy a piaci hüvelykujjszabály szerint az embereknek öt dollár életbiztosításuk van a jövedelmük minden egyes dollárjára. Egy másik azt mondja, hogy ez valószínűtlen, ez a szám túl magas. Meg szeretné vizsgálni ezt a véleménykülönbséget. (1) Milyen null- és alternatív hipotézist használna ezen feltételezések megkülönböztetésére? () Tesztelje a hipotézist 5%-os elsőfajú hibát használva. (3) Számolja ki és értelmezze a próba tesztstatisztikáit. (4) Készítsen 95%-os konfidencia-intervallumot a jövedelem együtthatójának becslésére. 4. A következő adófüggvényt az 50 amerikai állam és Washington szövetségi főváros keresztmetszeti adatainak felhasználásával becsülték. T ax = 0.1 (0.087) + 0.14 (<0.0001) Income n = 51 R = 0.997 ˆσ = 0.687, ahol Tax az összes befizetett adó, az Income pedig a teljes jövedelem, mindkettő milliárd dollárban mérve. A zárójelben lévő számok az adott változó együtthatójának szignifikanciáját tesztelő statisztikából számolt p-értékek.
a) A regressziós együtthatók megfigyelt előjelei egyeznek-e az előzetes elképzeléseivel? Magyarázza meg! b) Hogyan értelmezné a jövedelem együtthatóját? c) Fogalmazza meg a null- és alternatív hipotézist, amit a fönt megadott p-értékkel tesztelhet. Szignifikánsak-e az együtthatók 5%-os szinten? Igazolja válaszát! d) A fenti eredmények a Ramanathan könyv D) függelékében bemutatott DATA3-4 fájl használatával ellenőrizhetőek. Az adatbázis ugyanezen a néven a Gretl saját adatbázisai közt is elérhető. Töltse be az adatbázist a Gretl programba, és ellenőrizze a fenti eredményeket a számítógép segítségével is! 5. Egy cég építkezéseknél használt szigetelőanyagot gyárt. A szigetelő keresletére felírt egyszerű modell Q t = α + βp t + u t, ahol Q t adott hónapban leszállított szigetőanyag mennyisége gallonban mérve, és P t a szigetelőanyag gallononkénti ára dollárban. A modellt 89 hónap adatainak felhasználásával becsültük. A következő táblázat a számítógépes output egy részlete (az adatok a Ramanathan könyv DATA3-5 adatbázisában találhatóak meg). Model 1: OLS, using observations 1 89 Dependent variable: Q Coefficient Std. Error const 596,053755 955,809956 P -381,009383 104,76575 Error Sum of Sq (ESS) 1.869999e + 08 Std Err of Resid. (sgmahat) 1466.09133 Unadjusted R-squared 0.13 Adjusted R-squared 0.1 a) Milyen előjelet vár α-ra és β-ra, és miért? A regressziós együtthatók megfigyelt előjelei egyeznek-e az elvárásaival? b) Mi az ár együtthatójának értelmezése? Írja le, mennyivel változik a kereslet, amikor a gallononkénti ár megnő egy dollárral. c) Mit tud mondani az illeszkedés jóságáról? d) Tesztelje, hogy minden regressziós együttható szignifikánsan különbözik-e nullától, vagy sem (1%-os szignifikancia szinten szinten). Írja fel a null- és alternatív hipotézist, a tesztstatisztikákat, azok eloszlásait és a szabadságfokokat, és a nullhipotézis elvetésének kritériumát! Mit állapít meg? e) Véleménye szerint megfelelő a modell? Mit gondol, milyen más változókat kellene a modellbe fölvenni? 3
6. Egy gépkocsi fenntartási költségeinek következő két modelljét becsültük: E t = α 1 + β 1 Miles t + u t E t = α + β Age t + u t ahol E a kumulált fenntartási költség (az üzemagyag nélkül) dollárban, a Miles változó a megtett út kumulált mennyisége (ezer mérföldben), az Age változó pedig a jármű életkorát jelöli hetekben mérve. A két modellt 57 elemű minta felhasználásával becsültük. A futási eredményeket az alábbi táblázatok foglalják össze: Model A: OLS, using observations 1 57 Dependent variable: E Coefficient Std. Error t-ratio p-value const -65,93505 104,149581-6,00996 0,0000 Age 7,343478 0,3958,81356 0,0000 Error Sum of Sq (ESS) 7.401653e + 06 Std Err of Resid. (sgmahat) 366.845346 R-squared 0.900 Model B: OLS, using observations 1 57 Dependent variable: E Coefficient Std. Error t-ratio p-value const -796,074573 134,74494-5,908011 0,0000 Miles 53,45074,96144 18,66661 0,0000 Error Sum of Sq (ESS) 1.050175e + 07 Std Err of Resid. (sgmahat) 436.96796 R-squared 0.858 a) Milyen előjelet vár β 1 -re és β -re? A megfigyelt előjelek megfelelnek-e várakozásainak? b) Melyik modellt gondolja "jobbnak" a kettő közül? Fogalmazza meg az alkalmazott kritériumot. c) A jobbnak ítélt modellben a t-statisztikák segítségével végezzen el a megfelelő próbákat az együtthatók szignifikanciájának tesztelésére. Ne felejtse el felírni a null- és alternatív hipotézist, a tesztstatisztika eloszlását, beleértve a szabadságfokot, és a nullhipotézis elvetésének kritériumát. Mit állapít meg? d) Az A modellben tegyük fel, hogy az Age változót hetek helyett napokban mértük. Írja át a táblázatot ennek megfelelően. e) A fenti eredmények a Ramanathan könyv D) függelékében bemutatott DATA3-7 fájl használatával ellenőrizhetőek. Az adatbázis ugyanezen a néven a Gretl saját adatbázisai közt is elérhető. Töltse be az adatbázist a Gretl programba, és ellenőrizze a fenti eredményeket a számítógép segítségével is! 4
7. Egy nagy állami egyetemen hét véletlenszerűen kiválasztott alsóéves közgazdászhallgatónak a következő két kérdést tették fel. (a) Mennyi volt az előző félévben elért tanulmányi átlaga (grade-point average, GPA)? (b) Hetente átlagosan hány órát töltött az Orange and Brew-ban, mely az egyetemi kampusz egyetlen és legnépszerűbb kocsmája? A diákok által adott válaszok az alábbi táblázatban szerepelnek: Diák GPA, G Az Orange and Brew-ban töltött órák száma jetente, H 1. 3,6 3., 15 3. 3,1 8 4. 3,5 9 5.,7 1 6.,6 1 7. 3,9 4 a) A fent szereplő adatok felhasználásával becsüljük a legkisebb négyzetek módszerével a modellt! G = α + βh + u b) Milyen előjelet vár a β együtthatóra? Igazolják-e az adatok a várakozásainkat? c) Tegyük fel, hogy az egyik elsőéves hallgató a tanulmányi időszak első két hetében heti 15 órát töltött az Orange and Brew-ban. Adja meg az első negyedév végi tanulmányi átlagának 90 százalékos konfidenciaintervallumát, ha a hallgató továbbra is heti 15 órát tölt az Orange and Brew-ban. d) Tegyük fel, hogy diákunk négy évig jár az alsóéves képzésre, és teljesíti a végzéshez szükséges 1 szemesztert. Számítsuk ki a végső, kumulált tanulmányi átlagának 90 százalékos konfidenciaintervallumát! e) Tegyük fel, hogy a legtöbb közgazdasági egyetem felsőéves (graduális) képzése minimum 3,5-s átlagot ír elő felvételi követelményként. Milyen eséllyel sikerül hallatónknak alsóéves tanulmányai befejezése után bekerülnie graduális képzésre? 8. A sarki fűszeres megállapítja, hogy a kínált narancsok ára igen erőteljes változékonyságot mutat az év során. Szezonon kívül a narancs ára darabonként akár 60 centre is emelkedik, míg a csúcsszezonban különleges árleszállításokat tartanak, amelyeken akár 10, 0 vagy 30 centért kínálják a narancsot. Az eladott narancsmennyiség (y) és az ár (x) hat hétre vonatkozó adatai a következők: 5
Eladott narancsmennyiség, y (100 darabban) Narancsár darabonként, x (centben) 6 10 4 0 5 30 4 40 3 50 1 60 Tegyük fel, hogy a narancskeresletet az y = α + βx + u lineáris egyenlet írja le. Becsüljük meg az egyenlet együtthatóit a legkisebb négyzetek módszerével! Adjuk meg a hetedik héten eladott narancsmennyiség 90 százalékos konfidenciaintervallumát, ha azon a héten 5 centbe kerül a narancs! 9. A Ramanathan könyv DATA3-10 adatbázisa keresztmetszeti adatokat tartalmaz 7 német társaság 1995-ös teljes eladásairól. Töltse be az adatbázist a Gretl programba, és oldja meg az alábbi feladatokat a számítógép segítségével. a) Becsülje a P ROF IT S t = α + β SALES t + u t modellt. b) Rajzolja meg a pontdiagramot. Jó illeszkedésre számít? Számolja ki R -et. Valóban jó az illeszkedés? c) Becsülje a reziduumok (hibák), valamint ˆα és ˆβ szórását. d) Végezze el a t-próbát az α = 0 és a β = 0 hipotézisekre, saját maga által választott szignifikanciaszinten. Mindegyik esetben írja fel a null- és alternatív hipotézist, a tesztstatisztika eloszlását, és a nullhipotézis elfogadásának vagy elvetésének kritériumát. e) Tegyük fel, hogy a profitot millió dollár helyett dollárban mértük. Mutassa be a mértékegység megváltozásának hatását a regressziós együtthatókra, a becsült szórásokra, a t- és F -statisztikákra, és az R értékére. f) Véleménye szerint milyen egyéb tényezőkön nyugszik egy társaság profitja? 10. A Ramanathan könyv DATA3-11 adatbázisa különböző egyetemek professzorának a fizetésére (ezer dollárban) és a Ph. D. megszerzése óta eltelt évek számára vonatkozó adatait tartalmazza. Töltse be az adatbázist a Gretl programba, és a számítógép segítségével becsülje a modellt. SALARY = α + β Y EARS + u a) Tesztelje a modell általános szignifikanciáját (saját maga által választott szignifikanciaszinten). b) Tesztelje minden egyes regressziós együttható szignifikanciáját is 1%-os szinten. c) Mit mond önnek az R értéke? Ábrázolja a fizetést az évek függvényében, és tegye fel magának a kérdést, hogy a modell megfelelő-e a fizetési szintek szóródásának megmagyarázására. 6
d) Az eredményeire alapozva milyen javaslatokat tenne a modellspecifikáció javítása érdekében? e) Vizsgálja meg annak következményeit, ha a fizetést ezer dollár helett dollárban mérnénk. Képletgyűjtemény - kétváltozós regressziós modell Modell: Y t = α + βx t + u t, t = 1,..., n Paraméterbecslés: ˆα = Ȳ ˆβ X és ˆβ = n t=1 X ty t n XȲ n t=1 X t n X = S xy S xx Becslések sztenderd hibái: s e = n t=1 e t n, sˆα = s n t=1 X t ns xx s ˆβ = s S xx A pontbecslés sztenderd hibája: s Ŷ i = s e ( 1 n + (X i X) ) S xx Konfidencia intervallum az együtthatókra: ( P t 1 ε/(n ) ˆα α ) t 1 ε/(n ) = 1 ε sˆα P ( t 1 ε/(n ) ˆβ β s ˆβ t 1 ε/(n ) ) = 1 ε Az együtthatók relevanciájára vonatkozó hipotézisvizsgálat teszt-statisztikája: t = ˆα α s ˆβ sˆα t n és t = ˆβ β t n, Konfidencia intervallum az eredményváltozó átlag-előrejelzésére: t = Ŷi Y i sŷi t n 7