IV. Változók és csoportok összehasonlítása
Tartalom Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta átlagának egyszempontos összehasonlítása
Példa összetartozó mintákra
Hogyan juthatunk összetartozó mintákhoz? Változás vizsgálata Önkontrollos kísérletek Ugyanazon a skálán mért változók összehasonlítása Összetartozó párok (házaspárok) vizsgálata
Független minták
Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.
Két összetartozó minta összehasonlítása 1) Átlagok összehasonlítása Pl. ugyanakkora-e egy párt szimpátiaszintje egy választás előtt és után? Ugyanakkora-e az X változó elméleti átlaga két helyzetben vagy időpontban? H 0 : μ = μ 2) Növekedés-csökkenés vizsgálata Csökkenti-e a szorongást egy terápiás eljárás? H 0 : Növekedés esélye = Csökkenés esélye
Pulzus két helyzetben (n = 115) 120 100 80 60 40 szórás átlag 20 0 PE PK
Anya és apa testmagassága (n = 500) 190 180 170 160 150 140 130 120 110 100 AnyaTes tm ag ApaTes tm ag szórás átlag
0 Két összetartozó minta átlagának összehasonlítása Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két helyzetben vagy időpontban? Nullhipotézis: H : μ = μ 0 Próbastatisztika: t = (y x)/se dif
1 Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
2 Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
3 Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
4 Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
5 Összetartozó mintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
6 Két példa Pulzus beavatkozás előtt és után (n = 115): Változás átlaga (y - x) = 6,17 t(114) = 3,987, p = 0,0001 (p < 0,001) Anya és apa testmagassága (n = 500): anya-átlag = 161,12, apa-átlag = 173,35 Különbség átlaga (y - x) = 12,23 (cm) t(499) = 36,396, p = 0,000 (p < 0,001) GYAK
7 Az egymintás t-próba alkalmazási feltétele A különbségváltozó normalitása Ha a minta kicsi? Ha a minta nagy? Robusztus alternatívák Johnson-próba Gayen-próba GYAK
8 Változás vizsgálata arányskálájú változók segítségével Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra? Nullhipotézis: E(Y/X) = 1 Próba: Egymintás t-próba Kiszámítandó: Változás aránya személyenként (Y/X)
9 Változás vizsgálata egy másik próba segítségével Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra? Nullhipotézis: Növekedés esélye = csökkenés esélye Próba: Előjelpróba Kiszámítandó: Pozitív és negatív változások száma GYAK
0 Két független minta összehasonlítása
1 Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.
2 Csoportdefiniálás a ROPstatban 1. Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok 1. Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú GYAK
3 Férfiak és nők feminitása (n = 82) 18 16 14 12 10 8 6 4 2 0 Nők CPI-Feminitás skála Férfiak szórás átlag
4 Apa érettségije és gyerekének matematika jegye (n = 3507) Matek-jegy a 8. osztály végén 6 5 4 3 2 szórás átlag 1 0 Apa érettségi nélkül Apa érettségivel
5 Két független minta átlagának összehasonlítása Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban? Nullhipotézis: H : μ = μ 0 Próbastatisztika: t = (y x)/se dif
6 Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
7 Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
8 Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
9 Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
0 Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H 0 nem igaz. Ha igaz H 0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H 0 -t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
1 Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag = 12,1, Y-átlag = 14,0 t(80) = -2,95, p = 0,0041 (p < 0,01) Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507): X-átlag = 4,06, Y-átlag = 3,82 t(3505) = 6,38, p = 0,000 (p < 0,001) GYAK
2 A kétmintás t-próba alkalmazási feltételei Különbségváltozó normalitása Elméleti szórások egyenlősége: σ = σ Szóráshomogenitás tesztelése: milyen próbákkal? Kétmintás t-próba robusztus alternatívája?
3 Példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése: Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+ Átlagok összehasonlítása: Kétmintás t: t(80) = -2,95 (p = 0,0041)** Welch-féle d: d(13,1) = -2,37 (p = 0,0337)* GYAK
Kezelési hatás két független minta esetén Elméleti változás (különbség): 1 2 Cohen-féle delta (átlagok standardizált különbsége): ( 1 2 )/ Mintabeli becslés: d = (x 1 x 2 )/s e Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK
5 Kettőnél több független minta átlagának összehasonlítása
6 80 GBR-csökkenés 60 40 20 0-20 -40-60 Agr 1 Agr 2 Agr 3 Fény Verbális Kísérleti csoport
7 Különbözik-e a minták elméleti nagyságszintje? Két ellentétes hatás: Minél jobban szóródnak a mintaátlagok, annál jobban eltérnek egymástól a minták. Minél jobban szóródnak az adatok az egyes mintákon belül, annál nagyobb az átfedés, annál kevésbé különböztethetők meg egymástól a minták.
8 80 GBR-csökkenés 60 40 20 0-20 -40-60 Agr 1 Agr 2 Agr 3 Fény Verbális Kísérleti csoport
9 Varianciaanalízis (VA) Var = Átlagok varianciája k = Hatásvariancia Var = Minták átlagos varianciája b = Hibavariancia Próbastatisztika: F = Var /Var k b F = Hatásvariancia/Hibavariancia
0 Egyszempontos független mintás VA Nullhipotézis: elméleti átlagok egyenlősége: H 0 : 1 = 2 =... = I Ha igaz H 0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H 0 -t elutasítjuk. F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
1 Egyszempontos független mintás VA Nullhipotézis: elméleti átlagok egyenlősége: H 0 : 1 = 2 =... = I Ha igaz H 0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H 0 -t elutasítjuk. F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
2 Egyszempontos független mintás VA Nullhipotézis: elméleti átlagok egyenlősége: H 0 : 1 = 2 =... = I Ha igaz H 0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H 0 -t elutasítjuk. F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
3 Egyszempontos független mintás VA Nullhipotézis: elméleti átlagok egyenlősége: H 0 : 1 = 2 =... = I Ha igaz H 0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H 0 -t elutasítjuk. F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
4 Egyszempontos független mintás VA Nullhipotézis: elméleti átlagok egyenlősége: H 0 : 1 = 2 =... = I Ha igaz H 0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H 0 -t elutasítjuk. F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H 0 -t elutasítjuk.
5 VA alkalmazási feltételei Minták függetlensége Normalitás Elméleti szórások egyenlősége (szóráshomogenitás): σ 1 = σ 2 =... = σ I
Konkrét példa Agr 1 Agr 2 Agr 3 Fény Verb. n i 5 4 6 4 4 xi 14,50 6,75 5,20-13,45-30,08 s i 29,60 9,15 6,96 13,11 14,57
Szóráshomogenitás ellenőrzése Levene-próba: F(4; 7) = 0,784 (p > 0,10, n. sz.) O Brien-próba: F(4; 8) = 1,318 (p > 0,10, n. sz.) GYAK
Hagyományos VA Hatásvariancia: Var k = 1413,9 Hibavariancia: Var b = 286,2 F próbastatisztika: F(4; 18) = 4,940** p-érték: p = 0,0073 (p < 0,01) GYAK
9 Mit csináljunk, ha a szóráshomogenitás feltétele erősen sérül? Robusztus varianciaanalízisek Welch-próba James-próba Brown-Forsythe-próba
Robusztus VA-k Welch-próba: W(4; 7,8) = 5,544* (p = 0,0203) James-próba: U = 27,851* (p < 0,05) Brown-Forsythe-próba: BF(4; 9) = 5,103* (p = 0,0200) GYAK
1 H 0 elutasítása esetén utóelemzés: az összes átlag páronkénti összehasonlítása Ha az elméleti átlagok különböznek, hogyan teszik ezt? Mi az eltérések mintázata? Cél: úgy végezzük el az összes páronkénti öszszehasonlítást, h. az I. fajta hiba ne nőjön meg. Szóráshomogenitás OK: Tukey-Kramer-próba Szóráshomogenitás sérül: Games-Howell-próba
A bemutatott példa utóelemzése Tukey-Kramer-próba: T12= 0,97 T13= 1,28 T14= 3,48 T15= 5,55** T23= 0,20 T24= 2,39 T25= 4,35* T34= 2,42 T35= 4,57* T45= 1,97 GYAK
Utóelemzés konklúziói Legszignifikánsabb különbség az 1. és az 5. minta átlaga között van (T15**) Az 5. minta (Verbális) átlaga három másik átlagtól is szignifikánsan különbözik (T25*, T35*, T15**) Az 5. minta (Verbális) kilógása okozza az öt átlag szignifikáns különbségét. GYAK
Kezelési hatás több független minta esetén Megmagyarázott variancia-arány (nemlineáris determinációs együttható): eta-négyzet e 2 = Hatás variabilitás/teljes variabilitás Korrelációs hányados (nemlineáris korrelációs együttható): eta GYAK
5 Mit csináljunk, ha a függő változó normalitása nagyon sérül? Összehasonlított populációk homogenitásának tesztelése rangsorolásos eljárásokkal. Szakmai kérdés: kilóg-e valamelyik populáció (alulról vagy felülről) a többi közül? Nagyobbak-e (kisebbek-e) valamelyik populációban az adatok, mint a többiben?
6 Kettőnél több összetartozó minta átlagának összehasonlítása Minden nagyjából úgy történik, mint független minták esetén, csak más képletekkel.
7 Eltérések A szóráshomogenitás a változók páronkénti különbségeire vonatkozik (szfericitás) A szóráshomogenitás sérülésének mértékét az epszilon együtthatók jelzik Robusztus alternatívák (Greenhouse-Geisser, Huynh-Feldt) Átlagok páronkénti összehasonlítása (Tukey)
Egy konkrét példa Változó átlag szórás Pulzus1 91,5 22,6 Pulzus2 97,7 21,5 Pulzus3 90,7 18,6
Hagyományos VA Hatásvariancia: Var = 1686,9 k Hibavariancia: Var = 121,4 e F-érték: F(2; 226) = 13,896*** Átlagok páronkénti összehas.: T12= 6,01** T13= 0,82 T23= 6,83** GYAK
Epszilon együtthatók Geisser-Greenhouse-féle ε: ε = 0,964 Huynh-Feldt-féle ε: ε = 0,980 Szabadságfok korrekció: A robusztus próbáknál ilyen arányban csökkennek a szabadságfokok
Robusztus VA-k Geisser-Greenhouse-féle VA: F(2; 218) = 13,896*** (p = 0,0000) Huynh-Feldt-féle VA: F(2; 222) = 13,896*** (p = 0,0000) Konklúzió: A 2. (intervenció alatt mért) pulzus kilóg a többi közül. GYAK