V. Gyakorisági táblázatok elemzése
Tartalom Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét változók segítségével Diszkrét változók kapcsolatvizsgálata
Példák diszkrét változóra Személy neme (x 1 = férfi, x 2 = nő) Iskolázottsági szint (x 1 = Alsófok, x 2 = Középfok, x 3 = Felsőfok) 5-fokú skálaváltozók Diagnózis (x 1 = Neurózis, x 2 = Szkizofrénia,...)
60 NEM 50 40 30 20 P erc ent 10 0 férfi nõ NEM
40 ISK 30 20 10 P erc ent 0 7 8 9 10 11 12 13 14 15 16 17 18 ISK
50 ISKKOD 40 30 20 P erc ent 10 0 7-11 12-15 16-20 ISKKOD
Az iskolai végzettség eloszlása Alsófok Középfok Felsőfok 29% 40% 31%
Másik példa diszkrét eloszlásra érték 0 1 2 3 arány 0,20 0,35 0,40 0,05
Kiemelt fontosságú diszkrét változók Változó típusa Kvantitatív Kvalitatív Arány Intervallum Ordinális Nominális
0 Statisztikai problématípusok diszkrét változók esetén
1 1. Egy diszkrét változó eloszlásával kapcsolatos kérdések vizsgálata (Eloszlásvizsgálatok) Igaz-e, hogy a pszichológusok között több az extravertált, mint az introvertált? A Koronás, a Kádár és a Kossuth címer kedveltsége ugyanolyan mértékű-e?
2 2a. Populációk összehasonlítása egy diszkrét változó segítségével (Homogenitásvizsgálatok független mintákkal) Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?
3 2b. Helyzetek összehasonlítása egy diszkrét változó segítségével (Homogenitásvizsgálatok összetartozó mintákkal) Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?
4 3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok) Függ-e a pártpreferencia az iskolázottságtól? Milyen szoros kapcsolatban van a fenti két változó egymással?
5 Problématípusok rendszere Statisztikai probléma típusa Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat Független minták Összetartozó minták
6 A khi-négyzet-próba alapötlete A mintabeli kapott és a nullhipotézis (H 0 ) igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása. 2 g i 1 (kapott i várt várt i i ) 2
7 Két populáció összehasonlítása egy diszkrét változó segítségével Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok.
8 Kétszempontos gyakorisági táblázat Koronás Kádár Kossuth Össz. Bpest 116 15 32 n 1 =163 Vidék 592 94 90 n 2 =776 Össz.: 708 109 122 N =939
9 Kétszempontos gyakorisági táblázat (sorösszegek szerinti százalékok) Koronás Kádár Kossuth Össz. Bpest 71,2% 9,2% 19,6% 100% Vidék 76,3% 12,1% 11,6% 100%
0 Általános khi-négyzet-próba H 0 igaz volta esetén a (kapott 2 ij várt várt i, j próbastatisztika 2 -eloszlást követ (szabadságfok: f = (sorok-1) (oszlopok-1)). 2 < 2 : H 0,05 0-t 5%-os szinten nem utasítjuk el. 2 2 0,05 : H 0 -t 5%-os szinten elutasítjuk. ij ij ) 2
1 A címeres példa eredménye Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1) (3-1) = 1 2 = 2 Kritikus értékek: - 2 0,05 = 5,991-2 0,01 = 9,210 Kiszámított khi-négyzet-érték: 2 = 8,144 p-érték: p = 0,0170 * Döntés: H 0 -t 5%-os szinten elutasítjuk (p < 0,05)
2 A khi-négyzet-próba lényege Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H 0 nem igaz. Az eltérés egyik mértéke a 2 próbastatisztika. Ha igaz H 0, ez a mennyiség közelítőleg 2 -eloszlású. Ha 2 elég nagy, akkor H 0 -t elutasítjuk.
3 A 2 -próba alkalmazási feltétele A várt gyakoriságok ne legyenek kb. 5- nél kisebbek. Engedmény: elég, ha 80%-ra teljesül. Például egy 2x2-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell. GYAK
4 Mit tehetünk, ha az alkalmazási feltétel nem teljesül? Kis gyakoriságú sorok vagy oszlopok összevonása. Nagyobb minta választása. 2x2-es táblázat esetén a Fisher-egzaktpróba alkalmazása a 2x2-es 2 helyett.
5 Példa oszlopok összevonására h6 változó értékei Isk. szint 0 1 2 3 4 Össz. Alsófok 3 2 16 10 24 55 Középfok 0 2 10 13 20 45 Felsőfok 0 4 17 5 16 42 Össz. 3 8 43 28 60 142 GYAK
6 Két diszkrét változó kapcsolatának 15 éves lányok vizsgálata Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Kapcsolatvizsgálat homogenitásvizsgálat
7 Sorösszegek szerinti százalékok táblázata 15 éves Könnyen teremt baráti lányok kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1 13,9 100 Nem 58,0 42,0 100 Összesen 61,7 38,3 100
8 A pártpreferencia függése az életkortól és a nemtől A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.
9 Két változó (X és Y) függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett; Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett; A függetlenség kölcsönös
0 Iskolázottság és szimpátia Függ-e az iskolai végzettségtől ennek a személynek a kedveltsége?
1 Eloszlás a 3 iskolázottsági szinten 50 40 százalék 30 20 10 0 Neg+ Neg 0 Poz Poz+ alsófok középfok felsőfok
2 Nem és szimpátia Összefügg-e a nemmel ennek a személynek a kedveltsége?
3 Az eloszlás férfiaknál és nőknél 50 40 százalék 30 20 10 0 Neg+ Neg 0 Poz Poz+ férfi nő
4 A kapcsolat szorosságának mérése diszkrét változók esetén Cramér-féle V kontingencia-együttható: V 2 N (min( g, h) 1) Ha X és Y független, V = 0. 0 V 1. Dichotóm változók esetén V φ kontingencia e.h. GYAK