Többváltozós lineáris regressziós modell feltételeinek tesztelése II. - A magyarázó változóra vonatkozó feltételek tesztelése - Optimális regressziós modell kialakítása - Kvantitatív statisztikai módszerek Petrovics Petra
A magyarázó változókra vonatkozó feltételek 1. Egymástól lineárisan függetlenek legyenek. (egyik magyarázó változót se lehessen a többi magyarázó változó lineáris kombinációjaként előállítani) 2. Értékeik rögzítettek legyenek, ne változzanak mintáról mintára. 3. Mérési hibát nem tartalmaznak. 4. Nem korrelálnak a hibatényezővel.
Multikollinearitás Mintabeli tulajdonság mintán kívül nem alkalmazható. Ellenőrzése: Többszörös determinációs együtthatóval F-próbával (F>F krit ) VIF-mutató
1 VIF VIF=1 VIF-mutató ha R j2 =0 (amikor a j. magyarázó változó nem korrelál a többi magyarázó változóval) VIF R j2 =1 (a j. magyarázó változó pontosan kifejezhető a többi lineáris kombinációjaként) - gyenge multikollinearitás 1 2 5 VIF VIF VIF 2 5 VIF - erős zavaró multikollinearitás - nagyon erős, káros multikollinearitás j 1 1 R 2 j
Káros multikollinearitás esetén megkeressük azokat a magyarázó változókat, amelyek a zavart okozzák, és elhagyjuk őket a modellből; az egymással nagyon szoros kapcsolatban álló magyarázó változókat egy új változóban összevonjuk(főkomponensek), amely másabb lesz, mint az eredeti, de hordozza azok információtartalmát.
SPSS (Feladat) 10 véletlenszerűen kiválasztott vállalat adatai a következők: y - árbevétel x 1 -vagyon x 2 -létszám 1 35 54 98 2 27 52 120 3 42 50 95 4 47 58 145 5 53 82 184 6 45 72 106 7 61 120 240 8 58 108 175 9 65 92 165 10 77 122 202
Multikollinearitás - SPSS Analyze / Regression / Linear - Statistics
Optimális regresszió
Modell specifikáció I.1. Változók - Kimaradnak releváns változók - Irreleváns változók maradnak a modellben I.2. Függvénytípus Optimális regressziófüggvény Forward módszer Backward módszer
Forward módszer Alapadatok Legnagyobb determinációs együtthatóhoz tartozó változó tesztelése (t-próba; F-próba) Releváns változók bevonása Backward eliminációs módszer Valamennyi magyarázó változó bevonása Paraméterek tesztelése (t-próba) Nem szignifikáns paraméterek elhagyása Optimális regressziófüggvény Optimális regressziófüggvény
Regresszió Open: Employee data.sav Aktuális fizetést befolyásoló tényezők? Analyze / Regression / Linear
Forward módszer Backward módszer Minority Classification Previous Experience y= current salary; Forward: x 1 =salbegin; x 2 =prevexp; x 3 = jobtime; x 4 =educ; x 5 = bdate Backward: x 1 =salbegin; x 3 = jobtime; x 3 =educ; x 4 = bdate
Analyze / Regression / Linear Gazdaságtudományi Kar
Gyakorlás Összefoglalás
Garázs: 0-nincs, 1-van Szín: 0 - nincs 1- van metálfény Gazdaságtudományi Kar Sorszám Évjárat Henger Garázs Szín Ár (pénzegység) 1 1993 75 0 0 50 000 2 1993 125 0 0 70 000 3 1993 75 0 0 60 000 4 1994 250 1 0 80 000 5 1994 75 0 0 70 000 6 1994 125 1 0 80 000 7 1995 75 0 0 60 000 8 1995 125 0 0 80 000 9 1995 250 0 0 100 000 10 1996 250 1 1 170 000 11 1996 250 1 0 168 000 12 1997 75 1 1 100 000 13 1997 125 1 1 120 000 14 1998 250 0 0 156 000 15 2004 250 1 1 560 000 16 1999 500 1 1 380 000 17 2000 500 1 1 425 000 18 2001 250 0 1 320 000 19 2002 125 1 1 300 000 20 2003 75 1 1 220 000
Köszönöm a figyelmet! stgpren@uni-miskolc.hu