. Sugár Szarvas fgy., 86. o. S3. feladat Egy antikvárium könyvaukcióján árverésre került 9 könyv licitálási adatai alapján vizsgáljuk a könyvek kikiáltási és ún. leütési ára ezerft közötti sztochasztikus kapcsolatot. Az antikvárium által realizált, a licitálásnak köszönhető átlagos haszon 6000 Ft volt, míg a leütési átlagár a kikiáltási átlagár kétszeresének bizonyult. Az aukció során továbbá a kikiáltási ár relatív szórása 80%-kal volt magasabb a leütési árénál, a kétféle ár közötti kovariancia pedig megegyezett a kikiáltási ár varianciájával. a Becsülje és értelmezze a lineáris regressziófüggvény paramétereit! b Határozza meg és és értelmezze a rugalmasságot a kikiáltási ár átlagos szintje mellett! c Jellemezze a kikiáltási ár és a leütési ár közti kapcsolat szorosságát, továbbá a lineáris regresziós modell magyarázó erejét! Megoldás : x: kikiáltási ár, y: leütési ár. } y x 6 y x x 6, y a s y y.8s x x s xy s x y i β 0 + β x i + ε i, i,..., n 9 β 0 y β x β x i xy i xi x sxy s x miatt β 0 y x 6 β 0 6, β β 0 jelentése: ha a kikiáltási ár 0 lenne, a leütési ár akkor is átlagosan 6000 Ft lenne. β jelentése: ha egy könyv kikiáltási ára 000 Ft-tal magasabb, akkor a leütési ára is átlag 000 Ft-tal magasabb. b Az y x-re vonatkozó rugalmassága: E y,x lim x 0 a becsült rugalmasság az x helyen: y y x x Ê y,x β y lim x 0 x x y dy dx x y β x β 0 + β x 6 6 + 6. E y,x jelentése: ha a kikiáltási átlagár környezetében %-kal megváltoztatjuk a kikiáltási árat, akkor 0.5%-kal változik ugyanilyen irányban a leütési ár is. c A kapcsolat szorossága a korrelációs együttatóval jelemezhető. A tapasztalati korrelációs együttató: corr n x, y s xy s x s y s xy s x s y -ből s x s y -ből x y ; x.8 y 6.8 3.6 0.8,
tehát a kikiáltási ár és a leütési ár közötti kapcsolat nem túl szoros. A lineáris regressziós modell magyarázó ereje a determinációs együtthatóval jellemezhető. Ismert, hogy a determinációs együttható a tapasztalati korrelációs együttató négyzeteként is előállítható : R corr n x, y 0.8 0.077, tehát a kikiáltási ár 7.7%-ot magyaráz meg a leütési ár szórásnégyzetéből azaz elég rosszul magyarázza.. Mit nevezünk négyzetösszeg felbontásnak a lineáris regressziós modell esetén? Vezessük le ezt az egyváltozós lineáris regressziós modell esetén! Megoldás : Az egyváltozós lineáris regressziós modell: a normálegyenletek: Négyzetre emelve és összeadva az y i β 0 + β x i + ε i, i,..., n, y β 0 + β x 3 xy β 0 x + β x. y i y ŷ i y + y i ŷ i, i,..., n egyenleteket: y i y Mivel egyrészt másrészt ŷ i y + y i ŷ i + ŷ i y y i ŷ i. 4 y i ŷ i n y ŷ n y β 0 β x 3 miatt 0, ŷ i y i ŷ i 0 ui. a baloldal éppen az euklideszi belsőszorzata az ŷ és az y ŷ n dimenziós vektoroknak, amelyek a legkisebb négyzetes becslés miatt ortogonálisak egymásra, ezért 4-ben a vegyes tag kiesik: ŷ i y y i ŷ i ŷ i y i ŷ i y y i ŷ i 0, és így megkaptuk a négyzetösszeg felbontást: y i y } {{ } SST ŷ i y + } {{ } SSR y i ŷ i. } {{ } SSE A bizonyítást ld. a 3. feladatban.
3. Mi a determinációs együttható definiciója? Mutassuk meg, hogy az y β 0 + β x + ε egyváltozós lineáris regressziós modell esetén a determinációs együttható kiszámítható az R corrn x, y módon! Megoldás : Az R definiciója: Az SSR-beli ŷ i y -ok: R. SSR SST. ŷ i y β 0 + β x y + β xi x 3 miatt β xi x, így A SSR ŷ i y β x i x. β x i xy i x i x x i xy i y x i x képletet beírva: SSR n x i xy i y n x i x x i x n x i xy i y x, i x amiből R SSR SST n x i xy i y x i x n y i y corr n x, y. 4. Sugár Szarvas fgy., 86. o. S4. feladat Legyen y βx + ε konstans nélküli regresszió β 0 0. Határozza meg ŷi ε i értékét! Megoldás : y i βx i + ε i, A β legkisebb négyzetes becslés az, amire i,..., n y βx x, azaz yi βx i xi 0. Másrészt ŷ i βx i, ezért ŷ i ε i ŷ i y i ŷ i βx i y i βx i β x i y i βx i 0. 3
5. Számoljuk ki egyváltozós lineáris regressziós modell esetén a β 0, β legkisebb négyzetes becslések és az ŷ i jósolt érték szórásnégyzeteit! Megoldás : Var β 0 Var y β x σ n + x Var β x cov y, β Var β Var x i xy n i n x i x x i x σ x i x σ n x 5 i x cov y, β cov n 0 y i, n x i x n x i x σ n x i x x i x x i x y i x j x cov y i, y j j x i x Var y i x i x } {{ } 0 Var β 0 σ n + σ x x i x σ n + x n x i x 6 Var ŷ i Var β0 + β x i Var β 0 + x i Var β + x i cov β0, β cov β0, β cov y β x, β cov y, β σ x x Var β x Var β x i x Var ŷ i σ n + x x i x + σ n + x + x i x i x x i x σ x i x i x σ x i x n x i x σ n + x i x x i x 7 4
6. Sugár Szarvas fgy., 86. o. S7. feladat Igazolja, hogy a becsült lineáris regressziós modellben 0 Var ŷ i Var y i + n. Megoldás : Az előző feladat eredményét használva: 0 Var ŷ i σ n + x i x x σ i x n + Var y i n +, amiből kapjuk a bizonyítandó egyenlőtlenségeket. 7. könyv, 8.6. feladat Az Egyesült Államok bruttó hazai termékének GDP és a készpénz- és látraszóló betétállományának M alakulása: év pénzállomány GDP milliárd $ 980 409 708 98 436 303 98 474 350 983 5 3405 984 55 3777 985 60 4039 986 75 469 987 750 4540 988 787 4900 989 795 55 990 87 55 99 899 5678 99 07 595 SPSS adat-file: http://www.inf.unideb.hu/valseg/dolgozok/igloi/kgstat/regresszio/konyv8 6feladat.sav a Készítsen pontdiagramot! b Számítsa ki a lineáris regressziófüggvény paramétereit és azok standard hibáit! c Értelmezze a számítások eredményeit! Megoldás : a Pontdiagram: Graphs.Scatter.Simple menüpont. b Kézzel: A lineáris regressziófüggvény: y β 0 + β x x: pénzállomány, y: GDP. x 678.6538, y 434.6930, x 494536.6538, xy 33003.0769, β xy x y 33003.0769 678.6538 434.6930 8800.36837 x x 494536.6538 678.6538 3407.784 5.534 β 0 y β x 434.6930 5.534 678.6538 570.3379 Itt a fgy.-ben a jobboldalon hibásan szerepel. 5
év x y ŷ y ŷ 980 409 708 833.06895-5.06895 98 436 303 98.44407 48.55593 98 474 350 39.6757-4.6757 983 5 3405 345.69908-47.69908 984 55 3777 364.0385 5.7965 985 60 4039 4000.40786 38.594 986 75 469 458.30-3.30 987 750 4540 479.640-79.640 988 787 4900 494.3064-4.3064 989 795 55 4968.57994 8.4006 990 87 55 545.67 376.3888 99 899 5678 5543.95077 34.0493 99 07 595 65.09949-30.09949 A reziduális szórásnégyzet becslése: yi ŷ i σ 5.06895 +... + 30.09949 465.563, n 3 a reziduális szórás becslése: σ 465.563 4.769. A standard hibák: s β0 ld. 6 σ n + x xi x σ n + x x x 4.769 3 σ x n x x 494536.6538 494536.6538 678.6538 7.5, s β ld. 5 σ xi x σ n x x 4.769 0.33. 3 494536.6538 678.6538 SPSS-sel: Lineáris regresszió: Analyze.Regression.Linear menüpont. β 0 570.3: Coefficients táblázat, Constant, B cella β 5.53: Coefficients táblázat, penzallomany, B cella 7.5: s β0 Coefficients táblázat, Constant, Std. Error cella 0.33: s β Coefficients táblázat, penzallomany, Std. Error cella Megjegyzés: σ 465.563: ANOVA táblázat, Residual, Mean Square cella. c β 0 értelmezése: ha a pénzállomány 0, a GDP átlagosan 570.3 milliárd $. β értelmezése: milliárd $ pénzállomány növekedéshez átlagosan 5.53 milliárd $ GDP növekedés tartozik. értelmezése: σ β0 A β 0 paraméter 7.5 milliárd $ szórással becsülhető. értelmezése: σ β A β paraméter 0.33 milliárd $ szórással becsülhető. 6
8. könyv, 8.. feladat Egy utazási iroda programfüzetéből kiválasztottunk 0 társasutat, amelyeknél vizsgáljuk az utak időtartama X és részvételi díja Y közötti kapcsolatot. a Írja fel a regressziófüggvényt és értelmezze a paramétereket! b Számítsa ki és értelmezze a rugalmassági együtthatót az X 0 helyen! c Készítsen 95%-os konfidencia intervallumot a β paraméterre, a b paraméterre! sorszám időtartam részvételi díj nap eft. 4 4. 5 8 3. 0 56 4. 3 0 5. 3 6. 4 4 7. 8 4 8. 8 50 9. 7 3 0. 9 86 SPSS adat-file: http://www.inf.unideb.hu/valseg/dolgozok/igloi/kgstat/regresszio/konyv8 feladat.sav Megoldás : a Az Y változó X-től való függését, majd a logy változó kiszámítása a Transform.Compute menüponttal X-től való függését ábrázolva Graphs.Scatter.Simple menüpont látszik, hogy logy X-nek lineáris függvénye. Tehát a regresszió exponenciális: Y b 0 b X. Az x X és y logy transzformált változókra vonatkozó lineáris regressziófüggvény: y β 0 + β x, ahol b 0 e β 0, b e β. Az együtthatók becslése: x 7., y 3.4949, x 59.3, xy 6.996, β xy x y 6.996 7. 3.4949 0.45, x x 59.3 7. β 0 y β x 3.4949 0.45 7..7547, tehát b 0 e β 0 e.7547 5.78, b e β e 0.45.78, és az exponenciális regressziófüggvény: Y b 0 b X 5.78.78 X. 7
Az együtthatók becslése SPSS-sel: Analyze.Regression.Curve Estimation. menüpont, Compound modell. b 0 értelmezése: a 0 napos társasút átlagosan 578 Ft-ba kerülne. b értelmezése: az nappal hosszabb társasút átlagosan 7.8%-kal többe kerül. b A rugalmassági együttható: E Y,X dy dx X Y db 0 b X dx X b 0 b X b 0 b X logb X b 0 b X logb X β X A becsült rugalmassági együttható az X 0 helyen: ez azt jelenti, hogy Ê Y,0 β 0.45 ; egy 0 napos társasúthoz képest a 9 ill. napos kb. 5%-kal kerül kevesebbe ill. többe. A és a együtt nem ellentmondás! Miért nem? c sorszám X y logy ŷ y ŷ. 4.639.735-0.096. 5.8904.980-0.0899 3. 0 4.054 4.056-0.803 4. 3 4.7005 4.9409-0.404 5. 3.4849.490-0.005 6. 4.639.735-0.096 7. 8 3.7377 3.755 0.0 8. 8 3.90 3.755 0.965 9. 7 3.4657 3.4704-0.0047 0. 9 4.4543 3.9606 0.4938 A reziduális szórás becslése: yi ŷ i σ n 0.096 0 +... + 0.4938 0.36, β standard hibája: s β σ xi x σ n x x 0.36 0 59.3 7. 0.037 ; a β -re vonatkozó 95%-os konfidencia intervallum végpontjai: β Ft n α 0.45 F s β t 8 0.975 0.037 0.45.306 0.037 0.904 és 0.300. A b -re vonatkozó 95%-os konfidencia intervallum végpontjai: e 0.904. és e 0.300.35. 8
9. könyv, 8.4. feladat A munkanélküliségi Y és inflációs ráta X olaszországi adatai a 80-as évtizedben az alábbiak voltak: év Y % X % 980 7.5. 98 8.3 9.3 98 8.9 6.3 983 9.8 4.6 984 0. 0.8 985 0.5 9. 986.4 5.9 987.5 4.7 988.0 5.0 989.0 6.3 990.0 6.5 SPSS adat-file: http://www.inf.unideb.hu/valseg/dolgozok/igloi/kgstat/regresszio/konyv8 4feladat.sav a Becsülje meg és értelmezze a lineáris regresszió paramétereit! b Tesztelje a regressziós egyenes meredekségét! α 0.05 c Ha a 90-es évekre az inflációt sikerül 6%-os szinten tartani, becsülje meg 95%-os megbízhatósággal a munkanélküliség várható rátájának határait! Megoldás : Kézzel: a A lineáris regressziófüggvény: y β 0 + β x. x 0.8909, y 0.377, x 5.4455, xy 04.98, β xy x y 04.98 0.8909 0.377 0.64. x x 5.4455 0.8909 β 0 y β x 0.377 + 0.64 0.8909 3.50, SPSS-sel a lineáris regresszió: Analyze.Regression.Linear menüpont. b β 0 értelmezése: β értelmezése: 0%-os infláció esetén a munkanélküliségi ráta átlagosan 3.3% lenne. ha az infláció %-kal nagyobb/kisebb, akkor a munkanélküliségi ráta átlagosan 0.6%-kal kisebb/nagyobb. H 0 : β 0 H : β 0. 8 Kézzel: a próbastatisztika: t β s β t n eloszlású. H 0 Az ŷ i β 0 + β x i, i,...,, jósolt értékek és az y i ŷ i, i,...,, becsült hibák kiszámítása: 9
év Y % X % Ŷ % Y Ŷ % 980 7.5. 7.64844-0.4844 98 8.3 9.3 8.5054 0.4946 98 8.9 6.3 8.9433-0.0433 983 9.8 4.6 9.3956 0.40744 984 0. 0.8 0.39675-0.9675 985 0.5 9. 0.8957-0.3957 986.4 5.9.6963-0.963 987.5 4.7.00874 0.496 988.0 5.0.9946 0.07054 989.0 6.3.5859 0.4408 990.0 6.5.53307-0.53307 A reziduális szórásnégyzet becslése: yi ŷ i σ 0.4844 +... + 0.53307 0.667, n a reziduális szórás becslése: A β standard hibája: s β ld. 5 σ xi x σ n σ 0.667 0.3559. x x 0.3559 5.4455 0.8909 0.0873. Így és mivel a kritikus érték t β 0.64 0.0873 4., s β F tn α F t9 0.975.6, és t 4. >.6, H -et fogadjuk el, tehát β 0, azaz az X változónak van szerepe az Y magyarázatában X és Y nem függetlenek. SPSS-sel: a 8 hipotézisek tesztelésére való t-próba az output Coefficients táblázatában van. Mivel a p-érték megfigyelt elsőfajú hiba 0.000, így is H -et fogadjuk el. c Az E Y β 0 +β X várhatóértékre vagy az E Y X β 0 +β X feltételes várhatóértékre kell 95%-os konfidencia intervallumot adni az X 6 helyen. Mivel Ŷ EŶ sŷ t n, a 95%-os konfidencia intervallum végpontjai kézzel kiszámolva: 0
Ŷ F tn α sŷ β 0 + β X F tn α X x σ + n n x i x 6 0.8909 3.50 0.64 6 F t9 0.975 0.3559 + 36.69 3.50 0.64 6.6 0.3559 0.3964.6649 0.394.04 és.984. SPSS-sel: Be kell irni -ediknek az x 6-ot az x oszlopba. A várhatóértékre vonatkozó konfidencia intervallum: Analyze.Regression.Linear.Save.Prediction Intervals.Mean; az eredmény az adattáblázatban keletkezik. 0. A 8. feladat adataival próbáljuk ki az SPSS Curve Estimation eljárásában levő fontosabb görbetípusok illesztését: a lineáris, b kvadratikus: Y b 0 + b X + b X, c,,compound : Y b 0 b X ill. logy logb 0 + logb X, d,,growth : Y e b 0+b X ill. logy b 0 + b X, e logaritmikus: Y b 0 + b logx, f,,s-görbe : Y e b 0+ b X ill. logy b 0 + b X, g exponenciális: Y b 0 e b X ill. logy logb 0 + b X, h reciprok: Y b 0 + b X, i hatvány: Y b 0 X b ill. logy logb 0 + b logx. Ellenőrzés céljából mindegyik esetben csináljuk meg a paraméterbecslést a lineárisra transzformált modellnél is! Melyik a legjobban illeszkedő modell? Megoldás : Futtassuk le a http://www.inf.unideb.hu/valseg/dolgozok/igloi/kgstat/regresszio/konyv8 feladat.sav adatfile-ra a http://www.inf.unideb.hu/valseg/dolgozok/igloi/kgstat/regresszio/0feladat.sps programot! Mivel a vizsgalt modellek közül a kvadratikus 3 változós, a többi pedig változós a konstanst is beleértve, az összehasonlításra az R statisztka helyett az,,adjusted R -et használjuk; ez pedig a hatvány regresszió esetén a legnagyobb, tehát ez a legjobban illeszkedő modell.