Korrelácó-számítás 1. előadás Döntéselőkészítés módszertana Dr. Varga Beatr
Két változó között kapcsolat Függetlenség: Az X smérv szernt hovatartozás smerete nem ad semmlen többletnformácót az Y szernt hovatartozásról. Sztochasztkus: Az egk smérv hatással van a máskra, de nem határozza meg egértelműen annak értéket/változatat. Függvénszerű (determnsztkus): A vzsgált egségek X szernt hovatartozásának smeretében egértelműen megmondható azok Y szernt hovatartozása s.
A kapcsolat mérőszáma Két nomnáls változó között kapcsolatot az asszocácós mérőszámokkal jellemezzük. Ordnáls típusú változók összefüggését a rangkorrelácós mutatók mérk. Arán skála típusú változók összefüggését korrelácó- és regresszó-analízssel elemezzük. Intervallum/arán és nomnáls skálán mért változók között összefüggést H;
Korrelácós kapcsolat elemzése esetén a következő kérdésekre keressük a választ Van- e valamlen összefüggés az smérvek között? Mlen ránú az összefüggés Mennre szoros a kapcsolat? Az egk smérv változása mlen hatással van a másk smérv változására?
A mennség smérvek között kapcsolatot korrelácónak nevezzük. A korrelácószámítás: a mennség smérvek között kapcsolat szorosságának mérése. A regresszó-számítás: a mennség smérvek egmásra gakorolt hatásának számszerűsítésével, e hatások ránának és mértékének megállapításával foglalkozk.
Ha a korrelácós kapcsolat mögött egránú okozat összefüggés van akkor: az ok szerepét betöltő smérv a ténezőváltozó, (magarázóváltozó), jele: az okozat szerepét betöltő smérv az eredménváltozó, jele:
A korrelácó fontosabb típusa
Korrelácó hána A regresszó-függvén bármel X helen azonos (közel azonos) értéket vesz fel. A függvén képe vízszntes vonal. Y független X-től, X nem befolásolja Y értékét.
A korrelácó hána Y = - 7. 4 E - 0 + 0. 0 8 3 4 8 X 3 R - S q = 3. 4 % 1 0-1 - - 3 - - 1 0 1 N n c s k o r r e l á c ó
Függvénszerű kapcsolat A korrelácó hánának logka ellentéte a függvénszerű kapcsolat. Eg adott X értékhez egetlen Y érték tartozhat. A pontdagram pontja a regresszó-vonalhoz lleszkednek, A regresszó-vonal körül nncs szóródás.
Poztív korrelácó Y = - 8. 6 E -0 + 0. 6 9 0 8 6 X 3 R - S q = 6. 5 % 1 0-1 - - 3-3 - - 1 0 1 3 P o z t ív k o r r e l á c ó
Negatív korrelácó Y = 5. 0 7 E - 0-0. 6 4 7 8 7 X 3 R - S q = 7 0. 9 % 1 0-1 - - 3-3 - - 1 0 1 3 N e g a t ív k o r r e lá c ó
Nem lneárs korrelácó Y = 1. 0 9 5 8 + 6. 0 7 6 8 4 X + 1. 1 6 6 8 6 X * * 4 0 R - S q = 8 8. 4 % 3 0 0 1 0 0-3 - - 1 0 1 3 N e m l n e á r s k o r r e lá c ó
A kapcsolat szorosságának mérőszáma
A kovaranca Az X és Y mennség változók között kapcsolat ránát mutatja meg. C = d d n -1 = n -1 - C r s s
Kovaranca tulajdonsága A kovaranca nulla, ha a poztív és a negatív előjelű eltérésszorzatok összege kegenlít egmást. Kovaranca előjele a kapcsolat ránát mutatja. A kovaranca abszolút mértékének nncs határozott felső korlátja. A kovaranca a két változóban szmmetrkus, X és Y szerepe a formulában felcserélhető.
A korrelácós egüttható A korrelácós egüttható a lneárs korrelácó szorosságának legfontosabb mérőszáma. A kapcsolat hánát (korrelálatlanság) az r = 0 érték jelz. Az r előjele a korrelácó ránát mutatja. Tökéletes (függvénszerű) lneárs kapcsolatnak - az rántól függően - az r = +1, lletve r = -1 értékek felelnek meg. A szélsőséges helzetek között az egüttható abszolút értéke a kapcsolat szorosságáról tájékoztat.
Korrelácós egüttható ) )( ( n n - n d d d d C = r s s d d = - n d = n d = n
Determnácós egüttható A determnácós egüttható megmutatja, hog a magarázóváltozó hán %-ban befolásolja az eredménváltozó szóródását. Jele: r A determnácós egüttható jellemz: A regresszós függvén lleszkedését, A modell magarázó erejét.
A rangkorrelácó Létezhetnek a statsztka sokaság egségenek olan kvanttatív jellegű tulajdonsága, amelek számszerűen egáltalán nem, vag csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen - 1 és 1 között helezkedk el. Ha a kétféle rangsorszám rendre megegezk, akkor = 1, ha a sorszámok a két smérv szernt következetesen ellentétesen alakulnak, akkor = -1. = 1-6 n(n d 1)
A korrelácós hánados A görbevonalú kapcsolatok szorosságának mérőszáma. A mutatószám kalakításának gondolatmenete: csoportosítjuk a megfgelt értékeket a ténezőváltozó értéke vag osztálköze szernt, és kszámítjuk az eredménváltozó részátlagat az eges csoportokban. S K () B () 1 1 S K() / () () ( ) S S B () ()
A korrelácós hánados A korrelácós hánados négzetét defnáltuk, mvel az csupán a kapcsolat ntenztását jelz, ránát nem. Megoszlás vszonszám jellegénél fogva a korrelácós hánados négzete mndg nulla és eg közé esk. Előjelét nem értelmezzük, megállapodásszerűen poztív számként kezeljük. A korrelácós hánadost nem szokták százalékos formában kfejezn. Általában / / tehát nem szmmetrkus az X és Y változókban. X csupán mnt csoportképző smérv szerepel.
Eg vállalat dolgozónak keresete és hav megtakarítása Dolgozó Bér (Ft/fő) Hav megtakarítás (Ft/hó) d d d d d d 1 10000 13000-13000 -3010 39130000 169000000 9060100 90000 10000-43000 -6010 58430000 1849000000 3610100 3 0000 35000 87000 18990 165130000 7569000000 36060100 4 150000 18000 17000 1990 33830000 89000000 3960100 5 100000 1000-33000 -4010 13330000 1089000000 16080100 6 115000 1500-18000 -3510 63180000 34000000 130100 7 160000 0000 7000 3990 107730000 79000000 1590100 8 130000 13800-3000 -10 6630000 9000000 4884100 9 145000 14000 1000-010 -410000 144000000 4040100 10 100000 11800-33000 -410 138930000 1089000000 1774100 Összesen 1330000 160100 0 0 40800000 1360000000 48079000
Kovaranca C = d d n -1 = n -1-40800000 9 67577777, 8 Értelmezés: a dolgozók keresete és a hav megtakarított összege között kapcsolat poztív ránú.
Korrelácós egüttható Dolgozó Bér (Ft/fő) Hav megtakarítás (Ft/hó) d d d d d d Összesen 1330000 160100 0 0 40800000 1360000000 48079000 r = s C d d s d d 40800000 1360000000 48079000 0,954 Értelmezés: a dolgozók keresete és a hav megtakarított összege között kapcsolat poztív ránú és erős.
Determnácós egüttható r 0,954 0,9098 90,98% Értelmezés: a dolgozók keresete 90,98%- ban befolásolja a hav megtakarított összeg szóródását.
Rangkorrelácó Eg régó vállalatanak gazdálkodására vonatkozó adatok Régó 1 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 5 1 10 1 8 31 0 Nereség (MFt) 16 10,5 10 1 7 4 1 9 11 10 8 7 6 5 3 1 9 4 10 7 6 9 4 3 1 5 8 d 0 1-1 -3 1-1 1 0 4-4 d 0 1 1 9 1 1 1 0 16 15 6d 645 1-1 n(n 1) 10 10 1 = 0,773 Értelmezés: a vállalatok árbevétele és neresége között közepesnél szorosabb, poztív ránú kapcsolat van.
Regresszó-számítás célja: A ténezőváltozónak () az eredménváltozóra () gakorolt hatását valamlen matematka modell segítségével fejezzük k.
A leggakorbb regresszó-függvének lneárs regresszó, hatvánktevős regresszó, eponencáls regresszó, parabolkus regresszó, hperbolkus regresszó
A kétváltozós lneárs regresszó modellje Legen X eg ténezőváltozó és Y eg eredménváltozó. Tételezzük fel, hog X lneárs törvénszerűség szernt fejt k hatását Y-ra, lletve közrejátszk eg véletlen mozzanat s. A két változó kapcsolatának a formulája: Y = + 0 1 regresszós egütthatók véletlen változó
Az ε véletlen változóról feltételezzük: várható értéke 0 szórása állandó ε változók páronként korrelálatlanok
A becsült regresszó függvén: ˆ b b 0 1 Ahol: b 0 és b 1 a regresszós egütthatók becsült értéke
Regresszós egütthatók becslése ŷ = b 0 b 1 A becsült regresszós egütthatók kszámításához a legksebb négzetek módszerét alkalmazzuk.
b 0 és b 1 paraméterek becslése a legksebb négzetek módszerével: Szélső értéke adott helen akkor lehet, ha b b 1 0 ˆ 1 1 0 1 0, n b b b b f 0 0 1 0 1 1 0 0 b b b f b b b f
Ebből átalakítás után nert normálegenletek: 1 0 1 0 X b X b X b n b b b 1 0 1 d d d b
Azonos tevékenséget végző vállalkozások adata Vállalkozás Reklámkadás Árbevétel (X) 100eFt (Y) MFt d d A 8 0,5 0,9,5 6,5 0,81 B 7 16 1,5-3,1-4,65,5 9,61 C 4 15-1,5-4,1 6,15,5 16,81 D 3 14 -,5-5,1 1,75 6,5 6,01 E 5 19-0,5-0,1 0,05 0,5 0,01 F 4 1, -1,5-6,9 10,35,5 47,61 G 5 18-0,5-1,1 0,55 0,5 1,1 H 7 4 1,5 4,9 7,35,5 4,01 I 3 16 -,5-3,1 7,75 6,5 9,61 J 5-0,5,9-1,45 0,5 8,41 K 9 8 3,5 8,9 31,15 1,5 79,1 L 6 5 0,5 5,9,95 0,5 34,81 Összesen 66 9, 0 0 75, 41 58,1 n= 1 ȳ=9,/1=19,1 ẋ=66/1=5,5
ˆ 9,0131, 834
Elasztctás egüttható Y relatív változása hánszorosa az X relatív változásának E ; lm 0 Lneárs regresszó esetén az elasztctás egüttható: E : ; b1 b0 b1 d d Átlagos sznten: E b ; 1
n Rezduáls változó ˆ ˆ ˆ 1 1 e n ˆ ˆ e e n 1 A megfgelt Y értékek eltérés négzetösszege S ˆ S = + S e A regresszó által magarázott eltérésnégzetösszeg A rezduáls eltérés (maradék) eltérésnégzetösszege
r r 1 0 A fent összefüggésből a korrelácós hánadoshoz hasonló mérőszám defnálható, amel azonos a determnácós egütthatóval. S ˆ e r 1 r b1 S S S Az Y ngadozását teljes mértékben a regresszóval magarázzuk Az Y szóródása csak a véletlentől függ A b 1 előjelét rendeljük hozzá. s s
Reklámk. (X) 100eFt Árbevétel (Y) MFt 8 0 64 6,5 0,81 1,06 13,58 3,685 7 16 49,5 9,61 7,569 34,37 1,851 4 15 16,5 16,81 7,569 1,819 16,349 3 14 9 6,5 6,01 1,06 0,65 14,515 5 19 5 0,5 0,01 0,841 0,668 18,183 4 1, 16,5 47,61 7,569 17,1 16,349 5 18 5 0,5 1,1 0,841 0,033 18,183 7 4 49,5 4,01 7,569 4,617 1,851 3 16 9 6,5 9,61 1,06,06 14,515 5 5 0,5 8,41 0,841 14,570 18,183 9 8 81 1,5 79,1 41,10 6,153 5,50 6 5 36 0,5 34,81 0,841 4,830 0,017 66 9, 404 41 58,1 137,98 10,19 9, S e
A regresszós modell tesztelése H 0 : β 1 =0 a lneárs regresszó fennállásának tagadása H 1 : β 1 0 A H 0 ellenőrzésére alkalmas próbafüggvén: (ν 1 =1 és ν =n-) Ha F<F krt H 0 -t elfogadjuk Ha F>F krt van szgnfkáns kapcsolat F S s ˆ e S ˆ Se n
s e n ˆ Varanca-analízs tábla kétváltozós regresszó-számításnál Összetevő Négzetösszeg Szabadságfok Szórásnégzet Regresszó (SSR) 1 Hbaténező (SSE) Teljes (SST) n- n-1
s S ( n 1)
Az F-eloszlás táblázata (p=0,95) 1 1 3 4 5 6 7 8 9 10 15 0 40 50 60 100 10 1 1 161,45 199,50 15,71 4,58 30,16 33,99 36,77 38,88 40,54 41,88 45,95 48,0 51,14 51,77 5,0 53,04 53,5 54,3 1 18,51 19,00 19,16 19,5 19,30 19,33 19,35 19,37 19,38 19,40 19,43 19,45 19,47 19,48 19,48 19,49 19,49 19,50 3 10,13 9,55 9,8 9,1 9,01 8,94 8,89 8,85 8,81 8,79 8,70 8,66 8,59 8,58 8,57 8,55 8,55 8,53 3 4 7,71 6,94 6,59 6,39 6,6 6,16 6,09 6,04 6,00 5,96 5,86 5,80 5,7 5,70 5,69 5,66 5,66 5,63 4 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,8 4,77 4,74 4,6 4,56 4,46 4,44 4,43 4,41 4,40 4,37 5 6 5,99 5,14 4,76 4,53 4,39 4,8 4,1 4,15 4,10 4,06 3,94 3,87 3,77 3,75 3,74 3,71 3,70 3,67 6 7 5,59 4,74 4,35 4,1 3,97 3,87 3,79 3,73 3,68 3,64 3,51 3,44 3,34 3,3 3,30 3,7 3,7 3,3 7 8 5,3 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3, 3,15 3,04 3,0 3,01,97,97,93 8 9 5,1 4,6 3,86 3,63 3,48 3,37 3,9 3,3 3,18 3,14 3,01,94,83,80,79,76,75,71 9 10 4,96 4,10 3,71 3,48 3,33 3, 3,14 3,07 3,0,98,85,77,66,64,6,59,58,54 10 11 4,84 3,98 3,59 3,36 3,0 3,09 3,01,95,90,85,7,65,53,51,49,46,45,40 11 1 4,75 3,89 3,49 3,6 3,11 3,00,91,85,80,75,6,54,43,40,38,35,34,30 1 13 4,67 3,81 3,41 3,18 3,03,9,83,77,71,67,53,46,34,31,30,6,5,1 13 14 4,60 3,74 3,34 3,11,96,85,76,70,65,60,46,39,7,4,,19,18,13 14 15 4,54 3,68 3,9 3,06,90,79,71,64,59,54,40,33,0,18,16,1,11,07 15 16 4,49 3,63 3,4 3,01,85,74,66,59,54,49,35,8,15,1,11,07,06,01 16 17 4,45 3,59 3,0,96,81,70,61,55,49,45,31,3,10,08,06,0,01 1,96 17 18 4,41 3,55 3,16,93,77,66,58,51,46,41,7,19,06,04,0 1,98 1,97 1,9 18 19 4,38 3,5 3,13,90,74,63,54,48,4,38,3,16,03,00 1,98 1,94 1,93 1,88 19 0 4,35 3,49 3,10,87,71,60,51,45,39,35,0,1 1,99 1,97 1,95 1,91 1,90 1,84 0 1 4,3 3,47 3,07,84,68,57,49,4,37,3,18,10 1,96 1,94 1,9 1,88 1,87 1,81 1 4,30 3,44 3,05,8,66,55,46,40,34,30,15,07 1,94 1,91 1,89 1,85 1,84 1,78 3 4,8 3,4 3,03,80,64,53,44,37,3,7,13,05 1,91 1,88 1,86 1,8 1,81 1,76 3 4 4,6 3,40 3,01,78,6,51,4,36,30,5,11,03 1,89 1,86 1,84 1,80 1,79 1,73 4 5 4,4 3,39,99,76,60,49,40,34,8,4,09,01 1,87 1,84 1,8 1,78 1,77 1,71 5 40 4,08 3,3,84,61,45,34,5,18,1,08 1,9 1,84 1,69 1,66 1,64 1,59 1,58 1,51 40 50 4,03 3,18,79,56,40,9,0,13,07,03 1,87 1,78 1,63 1,60 1,58 1,5 1,51 1,44 50 60 4,00 3,15,76,53,37,5,17,10,04 1,99 1,84 1,75 1,59 1,56 1,53 1,48 1,47 1,39 60 100 3,94 3,09,70,46,31,19,10,03 1,97 1,93 1,77 1,68 1,5 1,48 1,45 1,39 1,38 1,8 100 10 3,9 3,07,68,45,9,18,09,0 1,96 1,91 1,75 1,66 1,50 1,46 1,43 1,37 1,35 1,5 10 3,84 3,00,60,37,1,10,01 1,94 1,88 1,83 1,67 1,57 1,39 1,35 1,3 1,4 1, 1,00
A regresszós egüttható (β 1 ) tesztelése H 0 : β 1 =0 valójában nncs korrelácó H 1 : β 1 0 A H 0 ellenőrzésére alkalmas próbafüggvén: t v Ha t <t (1-α/) H 0 -t elfogadjuk Ha t >t (1-α/) H 0 -t elvetjük, van kapcsolat X és Y között b s b n 1
Student s Gazdaságtudomán t-test Kar Df 0,55 0,60 0,70 0,75 0,80 0,90 0,95 0,975 0,99 0,995 1 0,158 0,35 0,77 1,000 1,376 3,08 6,31 1,71 31,8 63,66 0,14 0,89 0,617 0,816 1,061 1,89,9 4,30 6,96 9,9 3 0,137 0,77 0,584 0,765 0,978 1,64,35 3,18 4,54 5,84 4 0,134 0,71 0,569 0,741 0,941 1,53,13,78 3,75 4,60 5 0,13 0,67 0,559 0,77 0,90 1,48,0,57 3,36 4,03 6 0,131 0,65 0,553 0,718 0,906 1,44 1,94,45 3,14 3,71 7 0,130 0,63 0,549 0,711 0,896 1,4 1,90,36 3,00 3,50 8 0,130 0,6 0,546 0,706 0,889 1,40 1,86,31,90 3,36 9 0,19 0,61 0,543 0,703 0,883 1,38 1,83,6,8 3,5 10 0,19 0,60 0,54 0,700 0,879 1,37 1,81,3,76 3,17 11 0,19 0,60 0,540 0,697 0,876 1,36 1,80,0,7 3,11 1 0,18 0,59 0,539 0,695 0,873 1,36 1,78,18,68 3,06 13 0,18 0,59 0,538 0,694 0,870 1,35 1,77,16,65 3,01 14 0,18 0,58 0,537 0,69 0,868 1,34 1,76,14,6,98 15 0,18 0,58 0,536 0,691 0,866 1,34 1,75,13,60,95 16 0,18 0,58 0,535 0,690 0,865 1,34 1,75,1,58,9 17 0,18 0,57 0,534 0,689 0,863 1,33 1,74,11,57,90 18 0,17 0,57 0,534 0,688 0,86 1,33 1,73,10,55,88 19 0,17 0,57 0,533 0,688 0,861 1,33 1,73,09,54,86 0 0,17 0,57 0,533 0,687 0,860 1,3 1,7,09,53,84 1 0,17 0,57 0,53 0,686 0,859 1,3 1,7,08,5,83 0,17 0,56 0,53 0,686 0,858 1,3 1,7,07,51,8 3 0,17 0,56 0,53 0,685 0,858 1,3 1,71,07,50,81 4 0,17 0,56 0,531 0,685 0,857 1,3 1,71,06,49,80 5 0,17 0,56 0,531 0,684 0,856 1,3 1,71,06,48,79 6 0,17 0,56 0,531 0,684 0,856 1,3 1,71,06,48,78 7 0,17 0,56 0,531 0,684 0,855 1,31 1,70,05,47,77 8 0,17 0,56 0,530 0,683 0,855 1,31 1,70,05,47,76 9 0,17 0,56 0,530 0,683 0,854 1,31 1,70,04,46,76 30 0,17 0,56 0,530 0,683 0,854 1,31 1,70,04,46,75 40 0,16 0,55 0,59 0,681 0,851 1,30 1,68,0,4,70 60 0,16 0,54 0,57 0,679 0,848 1,30 1,67,00,39,66 10 0,16 0,54 0,56 0,677 0,845 1,9 1,66 1,98,36,6 0,16 0,53 0,54 0,674 0,84 1,8 1,645 1,96,33,58
Regresszós becslés pontossága
Paraméter Becslő függvén Standard hba 0 b 0 s e n( ) 1 b 1 ( ) s e 0 ŷ 0 s e 1 n ( 0 ( ) ) Y 0 ŷ 0 s e 1 1 n + ( 0 ( ) ) s e n ˆ
Köszönöm a fgelmet! stcsera@un-mskolc.hu