Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika
A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata az összeüggéseket eltárja és azokat számszerűen jellemezze. A társadalmi, gazdasági élet jelenségeit nem elszigetelten kell vizsgálni. Az összeüggések elemzésének egyik ő módszere sztochasztikus kapcsolatok elemzése.
Ismérvek közötti kapcsolat Függvényszerű vagy determinisztikus kapcsolat ha az egyik ismérv szerinti hovatartozás egyértelműen eldönti a másik ismérv szerinti hovatartozást. (pl születési év életkor) Kapcsolat teljes hiánya az egyik ismérv szerinti hovatartozás egyáltalán nem beolyásolná a másik ismérv szerinti hovatartozást. A két ismérv között nem egyértelműen, csak tendenciaszerűen érvényesülő kapcsolat van valószínűségi vagy sztochasztikus kapcsolat.
Sztochasztikus kapcsolatok ajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).
Kapcsolatvizsgálat eszköze Két ismérv szerinti kombinatív osztályozás, eredménye a kombinációs tábla. Kontingencia tábla (X (ok), Y (okozat)). Elemzési eszköz a tábla adataiból megoszlási vagy koordinációs viszonyszámokat számolunk.
Mintapélda Egy vállalat dolgozóinak megoszlása adott évben őben Megnevezés Féri Nő Összesen Fizikai 251.309 143.044 394.353 Szellemi 24.074 59.032 83.106 Összesen 275.383 202.076 477.459 Egy vállalat dolgozóinak megoszlása adott évben %-ban Megnevezés Féri Nő Összesen Fizikai 63,73 36,27 100,00 Szellemi 28,97 71,03 100,00 Összesen 57,68 42,32 100,00 Forrás cég adatai Forrás cég adatai
Kontingencia tábla X szerinti osztályok Y C 1 Y C 2 Y szerinti osztályok Y C i Y C t j X C 1 X C 2 X C i X C s i 11 21 i1 s1.1 12 1 j. 22 i2 s2.2 2 j ij sj. j N 1t 2t it st.t 1 2. i. s.
Függetlenségvizsgálat Minta Nem paraméteres hipotézisvizsgálat Függetlenségvizsgálat Előordulhat, hogy véletlen hatás miatt egymástól teljesen üggetlen ismérvek vizsgálatakor nullától eltérő eredményt kapunk - -- Hipotézisvizsgálat Van-e kapcsolat adott szigniikancia szinten, a két minőségi ismérv között?
H 0 üggetlenek H 1 nem üggetlenek 2 s t i1 j1 ij ij ij 2
Ha van kapcsolat, milyen erős?
Viszonyításos mérőszámok Yule éle asszociációs együttható (alternatív ismérvek közötti kapcsolat) Csuprov éle asszociációs együttható Cramer éle asszociációs együttható
Yule éle asszociációs együttható Jellemzői csak alternatív ismérvek közötti kapcsolat szorosságának mérésére alkalmas; alapgondolata a koordinációs viszonyszámokkal történő vizsgálathoz kapcsolódik; alternatív ismérvek esetén jelöljük az ismérv egyik változatát 1- el, a másik ismérvváltozatot pedig 0-val; értéke -1 és +1 között van; Y=0 üggetlenség; Y= 1 - üggvényszerű kapcsolat.
Yule éle asszociációs együttható Ismérv (i,j) 1 0 Összesen 1 11 10 1 0 01 00 0 Összesen 1 0 n Ha nincs kapcsolat a két alternatív ismérv között, akkor a megelelő koordinációs részviszonyszámok megegyeznek egymással, vagyis 10 00 Az egyenlőség átalakítható a következőképpen 11 0 10 01 11 00 01 11 00 10 01
Yule éle asszociációs együttható Ha van az ismérvek között kapcsolat Y 11 00 10 01 11 00 10 01 1 Y 1 0 Y 1
Mintapélda Megnevezés Féri Nő Összesen Fizikai 251.309 143.044 394.353 Szellemi 24.074 59.032 83.106 Összesen 275.383 202.076 477.459 Y = 11 00 10 01 11 00 10 01 251309. 59. 032 24. 074 143. 044 251309. 59. 032 24. 074 143. 044 0, 62
Csuprov-éle asszociációs együttható Ha a két ismérv - melyeknek a kapcsolatát vizsgáljuk - legalább egyike nem alternatív, akkor a Yule-éle együttható nem alkalmazható. Csuprov-éle/Cramer-éle asszociációs együttható. Alapgondolata a tényleges gyakoriság és a üggetlenség esetére eltételezett gyakoriság közötti eltérés vizsgálatán alapul.
X szerinti osztályok Kontingencia tábla Y C 1 Y C 2 Y szerinti osztályok Y C i Y C t j X C 1 X C 2 X C i X C s i 11 21 i1 s1.1 12 1 j. 22 i2 s2.2 2 j ij sj. j N 1t 2t it st.t 1 2. i. s.
Csuprov-éle asszociációs együttható A megoszlási viszonyszámokkal történő elemzés alapján azt mondhatjuk, hogy ha az A és B ismérvek egymástól teljesen üggetlenek, akkor bármely tetszőleges gyakoriságra igaz, hogy i ij.. n j vagy Függetlenség esetére eltételezett gyakoriság ij * ij * (i = 1,... s; j = 1,... t) = i. ij. n j. j i. n
Csuprov-éle asszociációs együttható Fő mutatója a khi (c ) t 2 i=1 j=1 s ( * tényleges és eltételezett gyakoriságok összehasonlítására szolgál méri a tényleges és eltételezett gyakoriságok különbségét ij ij ij * ) 2
Csuprov-éle asszociációs együttható Jellemzői 0 T 1 2 T = n s - 1 t - 1 A T együtthatót mindig pozitívnak tekintjük. s=t esetében a maximális értéke 1. Az s=t=2 esetben akár a Yule-éle, akár a Csuprov-éle együtthatót használhatjuk az asszociáció szorosságának mérésére.
Cramer-éle asszociációs együttható A t s esetében a T által elérhető maximális érték T 4 max s -1 t -1 (s t) Ebben az esetben a Csuprov-éle együttható helyett a Cramer mutatót használjuk, melynek képlete C = T T max
Mintapélda A kutyatartók családi állapot és nem szerinti megoszlása egy településen Megnevezés éri nő Összesen nőtlen, hajadon 18 2 20 házas 49 5 54 elvált 17 7 24 özvegy 8 15 23 Összesen 92 29 121
2 Munkatábla ij ij * ( ij - ij *) 2 / ij * 18 15,20661 0,513133 49 41,05785 1,536313 17 18,24793 0,085343 8 17,4876 5,147339 2 4,793388 1,627871 5 12,94215 4,873822 7 5,752066 0,270744 15 5,512397 16,32949 121 121 30,38405 s t i1 j1 ij ij ij 2 30,384
Cramer éle asszociációs együttható T n 2 30,384 s 1 t 1 121 2 1 4 1 0,289 T max 4 s 1 t 1 4 2 1 4 1 0,7598 C = T T max 0,289 0,759 0,381 Gyenge kapcsolat edezhető el a kutyatartók családi állapota és a neme között.
Illeszkedésvizsgálat A sokaság eloszlásának egészére vonatkozó hipotézisek vizsgálatát illeszkedésvizsgálatnak hívjuk. Tiszta illeszkedésvizsgálat Becsléses illeszkedésvizsgálat Elméleti alapeloszlás Egyenletes eloszlás Normális eloszlás Tapasztalati eloszlások összehasonlítása
2 r i1 i np np i i 2 Gazdaságtudományi Kar H H 1 0 P r ( x r i ) i P ( x ) 2 r i1 i i np P P i i np i i (i=1,2,,r) 2 = H 0 H 1 normális eloszlást követ nem követ normális eloszlást Feltétel legalább 50 tagú legyen a sokaság, továbbá, hogy egy-egy ismérvváltozathoz (osztályközhöz) tartozó várható gyakoriság legalább 5 legyen
Osztály A kategória előordulásán ak valószínűsége a sokaságban A kategória előordulásán ak gyakorisága a mintában A kategória előordulásán ak relatív gyakorisága a mintában C 1 P 1 1 g 1 C 2 P 2 2 g 2 C i Pi i gi C r P r r g r Összesen 1 n 1
Egy 1986-os széles körű vizsgálat szerint Magyarországon a 15 éves és idősebb népesség 15%-a sovány, 25 %-a normál súlyú és 60 %-a túlsúlyos volt egy bizonyos kritériumrendszert igyelembe véve. 1994-ben azt találták, hogy 500 véletlenszerűen kiválasztott 15 éves és idősebb személy közül 72 ő sovány, 176 ő normál súlyú, 252 ő pedig túlsúlyos, ugyanannak a kritériumrendszernek az alapján. Az 1986-os eredményt teljes körű vizsgálat eredményének tekintve állíthatjuk-e 1 %-os szigniikancia-szinten, hogy a két eloszlás egyorma?
Életkor eloszlás normális eloszlást követ-e? H 0 normális eloszlás H 1 nem követ normális eloszlást
5%-os szign. szinten elogadható-e az az állítás, miszerint az almaák termésmennyiség szerinti átlag 138,75 eloszlása normális eloszlást követ? szórás 34,98 =NORM.ELOSZLÁS(x;középérték;szórás;igaz) Termésmennyiség (kg/a) Almaák száma (db) Pi' 51 75 14 0,034 76 100 15 0,1345 101 125 27 0,348 126 150 64 0,625 151 175 56 0,849 176 200 19 0,96 201 5 1 Összesen 200 -
Termésmennyiség (kg/a) Almaák száma (db) 51 75 14 0,034 0,034 76 100 15 0,1345 0,1005 101 125 27 0,348 0,2135 126 150 64 0,625 0,277 151 175 56 0,849 0,224 176 200 19 0,96 0,111 201 5 1 0,04 Pi' Összesen 200-1 Pi
Termésmennyiség (kg/a) Almaák száma (db) Pi' Pi n*pi 51 75 14 0,034 0,034 7 76 100 15 0,1345 0,1005 20 101 125 27 0,348 0,2135 43 126 150 64 0,625 0,277 55 151 175 56 0,849 0,224 45 176 200 19 0,96 0,111 22 201 5 1 0,04 8 Összesen 200-1 200
Termésmennyiség (kg/a) Almaák száma (db) Pi' Pi n*pi Khi^2 51 75 14 0,034 0,034 7 7 76 100 15 0,1345 0,1005 20 1,25 101 125 27 0,348 0,2135 43 5,95 126 150 64 0,625 0,277 55 1,47 151 175 56 0,849 0,224 45 2,69 176 200 19 0,96 0,111 22 0,41 201 5 1 0,04 8 1,125 Összesen 200-1 200 19,895
kritikus szigniikancia szint =KHI.ELOSZLÁS(x;szabadságok) 0,05% r 7 b 2 Kritikus érték meghatározása mivel hét osztályközünk van! mivel két becsült paramétert (átlag, szórás) használtunk, INVERZ.KHI(0,05;4) C= 9,487729 C< χ2, Ho-t elutasítjuk
Köszönöm a igyelmet! stbea@uni-miskolc.hu