Nemparaméteres módszerek Krsztna Boda PhD SZTE ÁOK Orvos Fzka és Orvos Informatka Intézet
Paraméteres próbák Paraméter: egy szám, amely a populácó eloszlását jellemz (és általában meghatározza). A normáls eloszlás paramétere :, A bnomáls eloszlás paramétere : n, p A Posson eloszlás paramétere : Krsztna Boda 2
Normáls eloszlások N(, 2 ) N(0,1) N(1,1) Probablty Densty Functon Probablty Dstrbuton Functon y =normal(x;0;1) p=normal(x;0;1) 0.6 1.0 Probablty Densty Functon y =normal(x;1;1) 0.6 1.0 Probablty Dstrbut p=normal(x 0.5 0.8 0.5 0.8 0.4 0.6 0.4 0.3 0.6 0.4 0.3 0.2 0.4 0.2 0.1 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Probablty Densty Functon 0.0 Probablty Dstrbuton -3 Functon -2-1 0 1 2 3 0.0-3 -2-1 0 y =normal(x;0;2) p=normal(x;0;2) 0.6 1.0 0.5 0.8 0.4 0.3 0.6 0.4, : parameters 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 N(0,2 2 ) Krsztna Boda 3
Bnomáls eloszlások 1. A kísérletünk egy olyan eseménnyel kapcsolatos, amelynek csak 2 kmenetele van (pl. skeres, skertelen) 2. A sker valószínűsége, p, konstans kísérletről kísérletre 3. Sok kísérletet végzünk, egymástól függetlenül M a valószínűsége, hogy n számú smétlés során k számú legyen a skeres? n P P X k k p k q n k k n k ( ), 0, 1,..., n k n! n n k!( n k)!,! 1 2... M(X)=np, D(X)=np(1-p)=npq Pl. Bzonyos populácóban egy bzonyos betegség előfordulása 30%. M a valószínűsége, hogy egy n=10 elemű mntában pontosan k=4 lyen beteg lesz? Krsztna Boda 4
Példa Pl. Bzonyos populácóban egy bzonyos betegség előfordulása 30%. M a valószínűsége, hogy egy n=10 elemű mntában pontosan k=4 lyen beteg lesz? 10 4 6 10! 4 P( X 4) 0.3 0.7 0.3 0.7 4 4!6! 2100.00810.117649 0.200121 6 Krsztna Boda 5
Number of Success Probablty dstrbuton Dstrbuton functon Probablty of "success" 0 0.028247525 0.028247525 0.3 1 0.121060821 0.149308346 2 0.233474441 0.382782786 3 0.266827932 0.649610718 4 0.200120949 0.849731667 5 0.102919345 0.952651013 6 0.036756909 0.989407922 7 0.009001692 0.998409614 8 0.001446701 0.999856314 9 0.000137781 0.999994095 10 5.9049E-06 1 Összesen 1 Probablty dstrbuton Dstrbuton functon 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 Bnomal dstrbuton n=10, p can be changfed, k=0,1,,10 Krsztna Boda 6
Posson eloszlás Véges dőszak, véges térrészben levő események, a mntában levő, adott tulajdonságú egyedek számának eloszlása Pl. a mkroszkóp látómezejében lévő vérsejtek száma A tér egy kválasztott részében a halak száma Adott darab süteményben a mazsolák száma A Posson eloszlás értelmezhező a bnomáls eloszlás határeseteként, ha n nagy és az np= állandó. A képletben az eloszlás várható értéke és és varancája s. k n k n k lm Pk lm ( ) n n k p q f k k! e Krsztna Boda 7
Példa. Egy bzonyos betegség esetén az újabb előfordulások száma havonta átlagosan 3. Feltéve, hogy az új megbetegedések száma Posson eloszlást követ, m a valószínűsége, hogy Senk se lesz beteg (0.0498) Pontosan 2 új megbetegedés lesz (0.224) Number of events Probablty Dstrbuton functon Average number of events 0 0.049787068 0.049787068 3 1 0.149361205 0.199148273 2 0.224041808 0.423190081 3 0.224041808 0.647231889 4 0.168031356 0.815263245 5 0.100818813 0.916082058 6 0.050409407 0.966491465 7 0.021604031 0.988095496 8 0.008101512 0.996197008 9 0.002700504 0.998897512 10 0.000810151 0.999707663 Total 0.999707663 Probablty Dstrbuton functon 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 10 1 Krsztna Boda 8 1 0.8 0.6 0.4 0.2 0
Paraméteres próbák az eloszlás típusát smertnek tételezve fel, az eloszlás egyes smeretlen paraméterere tett hpotézseket ellenőrzk. Példák: Egymntás t-próba: H 0 : =c, Két mntás t-próba: H 0 : 1 = 2, feltétele: 12 = 2 2 Krsztna Boda 9
Nemparaméteres próbák Nem tételezk fel a paraméter megsmerhetőségét, sőt gyakran még a létezését sem. Krsztna Boda 10
Statsztka próbával Normaltásvzsgálat H0: a mnta normáls eloszlású populácóból származk Szgnfkáns esetben (p<), elvetjük a normaltás nullhpotézsét Nemszgnfkáns esetben (p>), elfogadjuk a normaltás nullhpotézsét(!) > shapro.test(trees$heght) Shapro-Wlk normalty test A mnta normáls eloszlásból származk data: trees$heght W = 0.9655, p-value = 0.4034 A mnta nem normáls eloszlásból származk > shapro.test(trees$volume) Shapro-Wlk normalty test data: trees$volume W = 0.8876, p-value = 0.003579 Krsztna Boda t11
Normaltásvzsgálat (folyt.) QQ-plot. A Q-Q plot, vagy quantle-quantle plot, két kvantls összehasonlításából származó pontdagram. Ha mndkét kvantls ugyanabból az eloszlából származk (pl. normáls eloszlásból), a pontok egy egyenes körül látszanak elhelyzkedn. A mnta normáls eloszlásból származk A mnta nemnormáls eloszlásból származk Krsztna Boda 12
Specáls nemparaméteres próbák: rangsoroláson alapuló próbák Feltétele: a változók folytonos eloszlásból származnak Akkor alkalmazhatók, ha Az eloszlás nem normáls Az eloszlás alakja nem nylvánvaló Az adatokat ordnáls skálán mérjük (alacsony-normáls-magas, elégtelen-elégséges, közepes-jó-jeles) Statsztkusok: Frank Wlcoxon (1882-1965), H. Mann (1905-2000) and D.R Whtney (1915-2007) Krsztna Boda 13
Az adatok rangsorolása Az adatok értéke helyett csak azok nagyságrendjét használjuk. A rangsorolás menete: a legksebb az 1-es rangot kapja, majd mnden rákövetkező eggyel nagyobb rangszámot kap, a legnagyobb rangszáma n lesz. Tegyük fel, hogy a következő adatank vannak: 199, 126, 81, 68, 112, 112. Lépések. 1. Rendezzük őket nagyság szernt: 68, 81,112,112,126,199 2. Adjunk rangszámokat 1 -től n-g, folytassuk akkor s, ha maguk a számok egyenlők: 1, 2, 3, 4, 5, 6 3. Utólag korrgáljuk az egyenlő számokhoz tartozó rangszámokat, helyettesítsük az eredet rangszámokat az egyenlőkhöz tartozó rangszámok átlagával (ún. kapcsolt rangokat kapunk most a két 112-höz tartozó 3 és 4-ből lesz 3.5) 4. A kész rangsor kapcsolt rangszámokkal: 1, 2, 3.5, 3.5, 5, 6 Krsztna Boda 14
Rangsorolás Esetszám Rendezett adat Rang Kapcsolt rang 4 68 1 1 3 81 2 2 5 112 3 3.5 6 112 4 3.5 2 126 5 5 1 199 6 6 A rangszámok összege mndg A fent formulával ellenőrzhetjük a számításankat n 1 r n( n 1) 2 Krsztna Boda 15
Paraméteres és nemparaméteres próbák a kísérlet elrendezésnek megfelelően Paraméteres Egy mnta, átlag vzsgálata: egymntás t-próba Két összetartozó mnta, átlagok vzsgálata: páros t-próba Két független mnta, átlagok vzsgálata: kétmntás t-próba Több független mnta, átlagok vzsgálata: egyszempontos varancaanalízs, ANOVA Nemparaméteres Egy mnta, medán vzsgálata : Wlcoxon-féle előjeles rangpróba Két összetartozó mnta, medánok vzsgálata : Wlcoxonféle előjeles rangpróba Két független mnta, medánok vzsgálata, eltolás vzsgálata : Mann-Whtney U-próba Több független mnta, medánok vzsgálata, eltolás vzsgálata : Kruskal-Walls próba Krsztna Boda 16
Rangsoroláson alapuló eljárások összetartozó adatokra I. Előjelpróba Nullhpotézs: a mnták ugyanabból a populácóból származnak, a különbségek medánja=0 Feltétel: a különbség-mnta folytonos eloszlású populácóból származk Krsztna Boda 17
Az előjelpróba Példa: 13 hallgató olvasás sebességét mérték meg egy specáls kurzus végén és egy hónappal később. Poztív előjelek száma: 6 Negatív előjelek száma: 5 Azok az esetek, ahol nncs változás, kmaradnak Ha a nullhpotézs gaz, egyforma számú poztív és negatív előjelet várunk Hallgató Pontszám Pontszám a kurzus 1 hónap Különbség Előjel végén múlva 1 50 52-2 - 2 48 51-3 - 3 46 46 0 4 50 49 1 + 5 52 50 2 + 6 80 70 10 + 7 23 21 2 + 8 30 33-3 - 9 45 46-1 - 10 53 53 0 11 49 48 1 + 12 51 48 3 + 13 46 48-2 - Krsztna Boda 18
Az előjelpróba táblázata A táblázat adott elemszám és esetén tartalmazza az elfogadás tartományt, ekkor mndkét szám beleesk az ntervallumba Poztív előjelek száma: 6 Negatív előjelek száma: 5 n=11 és =0.05 esetén az elfogadás ntervallum 1-10. Mvel mnd az 5, mnd a 6 beleesk ebbe az ntervallumba, elfogadjuk a nullhpotézst és azt mondjuk, hogy az eltérés nem szgnfkáns 5%-os sznten Krsztna Boda 19
bnom.test(k,n), ahol k a poztív vagy a negatív különbségek száma, n a nem nulla előjelek száma R > bnom.test(6,11) Exact bnomal test data: 6 and 11 number of successes = 6, number of trals = 11, p-value = 1 alternatve hypothess: true probablty of success s not equal to 0.5 95 percent confdence nterval: 0.2337936 0.8325119 sample estmates: probablty of success 0.5454545 > bnom.test(5,11) Exact bnomal test data: 5 and 11 number of successes = 5, number of trals = 11, p-value = 1 alternatve hypothess: true probablty of success s not equal to 0.5 95 percent confdence nterval: 0.1674881 0.7662064 sample estmates: probablty of success 0.4545455 Krsztna Boda 20
Rangsoroláson alapuló eljárások összetartozó adatokra II. Wlcoxon féle előjeles rangpróba Nullhpotézs: a mnták ugyanabból a populácóból származnak, a különbségek medánja=0 Feltétel: a különbség-mnta folytonos és szmmetrkus eloszlású populácóból származk Krsztna Boda 21
Wlcoxon féle előjeles rangpróba Példa: 13 hallgató olvasás sebességét mérték meg egy specáls kurzus végén és egy hónappal később. A poztív előjelekhez tartozó rangszámösszeg: R + =2+5.5+11+5.5+2+9=35 A negítív előjelekhez tartozó rangszámösszeg: R - =5.5+9+9+2+5.5=31 Azok az esetek, ahol nncs változás, kmaradnak Ha a nullhpotézs gaz, a poztív és negatív előjelekhez tartozó rangszámösszeg hasonló. Hallgató Pontszám Pontszám kurzus 1 hónap Különbség Rangszám előjeltől végén múlva függetlenül 1 50 52-2 5.5 2 48 51-3 9 3 46 46 0 4 50 49 1 2 5 52 50 2 5.5 6 80 70 10 11 7 23 21 2 5.5 8 30 33-3 9 9 45 46-1 2 10 53 53 0 11 49 48 1 2 12 51 48 3 9 13 46 48-2 5.5 Krsztna Boda 22
Az előjeles rangszámpróba táblázata A táblázat adott elemszám és esetén tartalmazza az elfogadás tartományt A poztív előjelekhez tartozó rangszámösszeg: R + =35 A negatív előjelekhez tartozó rangszámösszeg : R - =31 n=11 és =0.05 esetén ez az nttervallum 10-56. Mvel mndkét rangszámösszeg beleesk ebbe az ntervallumba, elfogadjuk a nullhpotézst és azt mondjuk, hogy az eltérés nem szgnfkáns 5%-os sznten. Elvleg a táblázat csak akkor használható, ha nncsenek kapcsolt rangok! Krsztna Boda 23
Nagy elemszám esete A táblázatok csak ks elemszámokra tartalmazzák az elfogadás ntervallumokat. Nagy elemszám esetén kszámítható egy közelítően normáls eloszlást követő (z) statsztka. Számítógépes szoftverek általában ezt alkalmazzák z R n( n 1) / 4 ( n( n 1)(2n 1) / 24) ~ N(0,1) Folytonosság korrekcó: a próbastatsztka számlálóját 0.5-del csökkentjük (a statsztka dszkrét, de m mégs egy folytonos eloszláshoz vszonyítjuk. Az R alapfeltevés szernt folytonosság korrekcót számol, az SPSS nem. Krsztna Boda 24
R wlcox.test. By default (f exact s not specfed), an exact p-value s computed f the samples contan less than 50 fnte values and there are no tes. Otherwse, a normal approxmaton s used. a > wlcox.test(pre,post, pared=true,exact=false) #folytonosság korrekcóval Wlcoxon sgned rank test wth contnuty correcton data: pre and post V = 35, p-value = 0.893 alternatve hypothess: true locaton shft s not equal to 0 > wlcox.test(pre,post, pared=true,exact=false, correct=f) #folytonosság korrekcó nélkül Wlcoxon sgned rank test data: pre and post V = 35, p-value = 0.8576 alternatve hypothess: true locaton shft s not equal to 0 Krsztna Boda 25
SPSS eredmények Frequences VAR00002 - VAR00001 Negatv e Df ferences a Postve Dff erences b Tes c Total a. VAR00002 < VAR00001 b. VAR00002 > VAR00001 c. VAR00002 = VAR00001 N 6 5 2 13 Test Statstcs b VAR00002 - VAR00001 Exact Sg. (2-taled) 1.000 a a. Bnomal dstrbuton used. b. Sgn Test Ranks VAR00002 - VAR00001 Negatv e Ranks Postv e Ranks Tes Total a. VAR00002 < VAR00001 b. VAR00002 > VAR00001 c. VAR00002 = VAR00001 N Mean Rank Sum of Ranks 6 a 5.83 35.00 5 b 6.20 31.00 2 c 13 Test Statstcs b VAR00002 - VAR00001 Z -.179 a Asy mp. Sg. (2-taled).858 a. Based on postve ranks. b. Wlcoxon Sgned Ranks Test Krsztna Boda 26
Egy mnta esete A párosított adatokon bemutatott eljárások egy mnta esetén s lefuttathatók R-ben, lyenkor a nullhpotézs az, hogy a populácó medánja adott konstans Krsztna Boda 27
Két független csoport összehasonlítása: Mann-Whtney U próba Feltétele: a változók eloszlása folytonos, sűrűségfüggvények azonos alakúak (eltolással egymásba átvhetők) Nullhpotézs: a mnták ugyanazon populácóból származnak (az eltolás=0) Nem teknthető a t-próba nemparaméteres megfelelőjének, különösen akkor, ha a varancák különbözők! (Ekkor: közel normáls eloszlás esetén a Welch próba, vagy ennek hányában Brunner-Munzel próba vagy bootstrap Mann-Whtney próba alkalmazható (nem tárgyaljuk)) Krsztna Boda 28
Mntapélda (hpotetkus adatok) Testsúlyváltozásokat hasonlítunk össze egy specáls détát követő csoportban és a kontrollcsoportban. Nullhpotézs: a déta nem hatásos, mndkét csoport ugyanabból a populácóból származó véletlen mnta. A két csoport adatat egyesítve sorba rendezzük, majd csoportonként képezzük a rangszámösszegeket. Ha gaz a nullhpotézs, a két rangszámösszeg hasonló lesz. Krsztna Boda 29
Patent Change n body weght (kg) Group Rank Rank corrected for tes 1. -1 Det 3 3 2. 5 Det 16 16.5 3. 3 Det 12 13 4. 10 Det 21 21 5. 6 Det 18 19 6. 4 Det 15 15 7. 0 Det 4 5.5 8. 1 Det 8 9 9. 6 Det 19 19 10. 6 Det 20 19 Sum of ranks, R 1 140 11. 2 Control 11 11 12. 0 Control 5 5.5 13. 1 Control 9 9 14. 0 Control 6 5.5 15. 3 Control 13 13 16. 1 Control 10 9 17. 5 Control 17 16.5 18. 0 Control 7 5.5 19-2 Control 1 1.5 20. -2 Control 2 1.5 21. 3 Control 14 13 Sum of ranks R 2 91 Krsztna Boda 30
A Mann-Whtney U próba táblázata (részlet) Krsztna Boda 31
Krsztna Boda 32
Döntés táblázat alapján Rangszámösszeg az első csoportban (n=10): R 1 =140 Rangszámösszeg a másodk csoportban(n=11): R 2 =91 T=140. n 1 =10 és n 2 =11 és =0.05 esetén az elfogadás tartomány 81-139. Mvel T ezen tartományon kívül esk, elvetjük a nullhpotézst és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. T=91. n 1 =11 és n 2 =10 és =0.05 esetén az elfogadás ntervallum 92-150. Mvel T ezen tartományon kívül esk, elvetjük a nullhpotézst és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. Krsztna Boda 33
Egy alternatív próbastatsztka Az U-val jelölt próbastatsztka (Mann Whtney). Jelölje a két mntát x 1,x 2,, x n és y 1,y 2,, y m. Képezzük az összes (x, y ) értékpárt. Az U statsztka azon párok száma, melyre x <y (egyenlőség esetén a párt ½-del számoljuk). Jelentése: ha véletlenszerűen kválasztunk egyegy egyedet mndkét populácóból, U/nm azon valószínűség becslése, hogy az első populácóból kválasztott érték ksebb. 1 U n1n2 n1 ( n1 1) T 2 Krsztna Boda 34
Nagy elemszám esete Nagy elemszám esetén a T próbastatsztka közelítően normáls eloszlású. A T próbastatsztka várható értéke és szórása alapján számolt z statsztka közelítően standard normáls eloszlást követ z ~ N(0,1) A legtöbb számítógépes szoftver ezt a formulát használja a p-érték megadásakor Krsztna Boda 35
Döntés a példa adatara z=-2.129. A nullhpotézs teljesülése esetén a standard normáls eloszlásból az elfogadás tartomány (α=0.05) : (- z α, z α )=(-1,96 ; 1,96) A képlet alapján számolt z-statsztka a próbastatsztka: z b = 2.129 az elfogadás tartományon kívül esk, ezért elvetjük a nullhpotézst és az alternatív H A mellett döntünk és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. 0.025 0.95 0.025 z >z α H A t fogadjuk el (a különbség szgnfkáns 5%-os sznten közelítő p=0.033, a különbség szgnfkáns 5%-os sznten -2, 1 -z α z α 2,1 Krsztna Boda
R > egy=c(-1,5,3,10,6,4,0,1,6,6) > kettő=c(2,0,1,0,3,1,5,0,-2,-2,3) > wlcox.test(egy, ketto,exact=f) #alapfeltételezés folytonosság korrekcóval Wlcoxon rank sum test wth contnuty correcton data: egy and ketto W = 85, p-value = 0.03629 alternatve hypothess: true locaton shft s not equal to 0 > wlcox.test(egy, ketto,exact=f,correct=f) folytonosság korrekcó nélkül Wlcoxon rank sum test data: egy and ketto W = 85, p-value = 0.03324 alternatve hypothess: true locaton shft s not equal to 0 Megjegyzés. R-ben más a próbastatsztka számolása: W = R1 n1(n1+1)/2 = 140 10*11/2=140-55= 85; A p-érték egyezk az SPSS folytonosság korrelcó nélkül p-értékével Krsztna Boda 37
SPSS output Ranks VAR00001 group 1.00 2.00 Total N Mean Rank Sum of Ranks 10 14.00 140.00 11 8.27 91.00 21 Test Statstcs b Mann-Whtney U Wlcoxon W Z Asy mp. Sg. (2-taled) Exact Sg. [2*(1-taled Sg.)] a. Not corrected f or tes. VAR00001 25.000 b. Groupng Varable: group 91.000-2.129.033.036 a Aszmptotkus p-érték: p=0.033 Egzakt p-érték: p=0.036 p<0.05, a különbség szgnfkáns 5%-os sznten Krsztna Boda 38
Több független mnta összehasonlítása Kruskal-Walls próba H0: a k számú mnta ugyanazon populácóból származk. A H-val jelölt próbastatsztkát a rangszámösszegekből számoljuk. Ha H0 gaz, akkor H ún. 2 (kh-négyzet) eloszlást követ k-1 szabadságfokkal Példa. Egy kísérletben (Farkas és mtsa, 2003.) lokáls szkémának alávetett, zolált patkányszívben a szívfrekvenca és a QT szakasz hosszának változását vzsgálták három antartmás gyógyszer hatására. 5 Mm K+ kálum on koncentrácó esetén, 25 perccel a lokáls szkéma után a QT szakasz hosszára a 4.8. táblázatban látható értékeket kapták. Vzsgáljuk meg, hogy a 4 csoportban van-e különbség a QT szakasz átlagos hosszában! Control Qundne Ldocane Flecande 61 76 65 69 53 84 56 65 68 89 76 73 66 78 72 71 54 81 66 61 89 69 69 mean 60.4 82.8 67.3 68.0 SD 6.80 5.49 6.86 4.34 Krsztna Boda 39
Kruskal-Walls próba a példa adatara. Eredményképpen egyetlen p- értéket kapunk. Ha nemszngfkáns a adott, sznten, a nullhpotézst elfogadjuk. Ha a nullhpotézst elvetjük, akkor tovább páronként összehasonlításokra lehet szükség. Ezek nem mnden szoftverben találhatók meg, pl. az SPSS-ben sem. A páronként hasonlításokat páronként Mann-Whtney U próbával végezzük, majd a p- értékeket korrgáljuk. QT Group Control Qundne Ldocane Flecande Total Ranks Test Statstcs a,b Ch-Square df Asy mp. Sg. N QT 14.837 3.002 a. Kruskal Walls Test b. Groupng Varable: Group Mean Rank 5 5.20 6 20.42 6 10.42 6 10.83 23 > kruskal.test(mt~csoport) Kruskal-Walls rank sum test data: mt by csoport Kruskal-Walls ch-squared = 14.8366, df = 3, p-value = 0.001962 Krsztna Boda 40
Páronként hasonlítások Pár p-érték, M-W próba korrgált p-érték* 1-2 0.004 0.024 1-3 0.126 0.756 1-4 0.052 0.312 2-3 0.002 0.012 2-4 0.002 0.012 3-4 0.937 1.000 *Bonferron korrekcó: korrgált p-érték=p M-W *6 (Most 6, mert 6 pár van) Krsztna Boda 41
Páronként hasonlítások a Kruskal- Walls próba után, R wlcox.test(mt[csoport==1],mt[csoport==2],exact=false) wlcox.test(mt[csoport==1],mt[csoport==3],exact=false) wlcox.test(mt[csoport==1],mt[csoport==4],exact=false) wlcox.test(mt[csoport==2],mt[csoport==3],exact=false) wlcox.test(mt[csoport==2],mt[csoport==4],exact=false) wlcox.test(mt[csoport==3],mt[csoport==4],exact=false) > wlcox.test(mt[csoport==2],mt[csoport==3],exact=false) Wlcoxon rank sum test wth contnuty correcton data: mt[csoport == 2] and mt[csoport == 3] W = 35.5, p-value = 0.0063 alternatve hypothess: true locaton shft s not equal to 0 Mann_Whtney p Korrgált, mndent mndennel Korrgált, csak a kontrollhoz 1-2 0.007969 0.047814 0.023907 1-3 0.1432 0.8592 0.4296 1-4 0.06664 0.39984 0.19992 2-3 0.0063 0.0378 2-4 0.004922 0.029532 3-4 1 1 Krsztna Boda 42
Több összetartozó mnta nemparaméteres összehasonlítása, Fredman próba Test Statstcs a N 22 Ch-Square 57,113 df 3 Asymp. Sg.,000 a. Fredman Test Id subject repeat meres 1 1 1 4 1 1 2 5 1 1 3 4 1 1 4 41 2 2 1 6 2 2 2 9 2 2 3 5 2 2 4 41 3 3 1 9 3 3 2 5 3 3 3 3 3 3 4 43 4 4 1 12 4 4 2 8 4 4 3 5 4 4 4 46 > fredman.test(meres~repeat. d) Fredman rank sum testdata: meres and repeat. and d Fredman ch-squared = 57.1132, df = 3, p-value = 2.431e-12 Krsztna Boda 43
Rangkorrelácó A Pearson féle korrelácós együtható csak olyan adatokra alkalmazható, amelyeket legalábbs ntervallum skálán mértek. Ha még hpotézs vzsgálatot s szeretnénk végezn a korrelácós együtthatóra, akkor a normaltást s fel kell tennünk. Az olyan adatokra, amelyek vagy nem normáls eloszlásúak, vagy nem ntervallum skálán mérték, egy másk mérőszám, az ún. Spearman féle rangkorrelácós együttható áll rendelkezésre. A rangkorrelácós együttható a rangszámok között Pearson korrelácós együttható, ha nncsenek kapcsolt rangok. Az így kszámított korrelácós együttható tehát szntén -1 és +1 között vesz fel értéket, és az értelmezése s ugyanaz, kvéve, hogy tt most rangszámokat, nem az eredet értékeket hasonlítjuk össze, így nema lneárs, hanem csak a monoton kapcsolatot jellemezzük. Jelentése: a változók között monoton kapcsolatot jellemz. A Pearson féle korrelácós együtthatóhoz hasonlóan a rangkorrelácóra s végezhetünk szgnfkanca vzsgálatot. Ha azt a nullhpotézst szeretnénk teszteln, hogy a rangkorrelácós együttható a populácóban = 0, akkor ugyanaz a formula alkalmazható, mnt a Pearson féle korrelácós együttható esetében Krsztna Boda 44
Krsztna Boda Formula a rangkorrelácó kszámítására n n s s r r s s r r R n n n n d 3 1 2 1 2 1 2 1 6 1 ) ( ) ( ) )( ( n n n n n s r 1 1 1 2 1) ( n n n y y x x y y x x r 1 2 1 2 1 ) ( ) ( ) )( ( Pearson-féle korrelácós együttható Spearman korrelácós együttható n n n n n n n s s r r 1 1 2 2 1 2 12 1) ( 1) ( 2 1 ) ( ) ( Tulajdonságok: 1 R +1 Rangszámok X-re Rangszámok Y-ra Különbség r 1 q 1 d 1 =r 1 -q 1 r 2 q 2 d 2 =r 2 -q 2......... r n q n d n =r n -q n
Hpotézsvzsgálat a rangkorrelácós együtthatóra H 0 :ρ=0 A populácóbel Spearman rangkorrelácós együttható nulla H A :ρ 0 A populácóbel Spearman rangkorrelácós együttható nem nulla Próbastatsztka: Szabadságfok: n-2 t R S n 2 1 R 2 S Krsztna Boda
Példa (X) (Y) rangszámok X Rangszámok Y d d ² 2 1,5 1 2,5-1,5 2,25 10 9,1 6,5 9-2,5 6,25 7,1 8,1 5 7-2 4 2,3 1,5 2 2,5-0,5 0,25 3 3,1 3 4-1 1 4,1 5,2 4 5-1 1 10 1 6,5 1 5,5 30,25 10,5 9,6 8 10-2 4 12,1 7,6 9 6 3 9 15 9 10 8 2 4 Krsztna Boda
R H 0 :ρ=0, H A :ρ 0 Döntés: Táblázat alapján Krsztna Boda Számítás szabadságfok=n-2=8; t tab(8;0,05) =2,306 s 6 n n 1 1 3 d 2 n 662 1 1 0,38 0,62 1000 10 n 2 1 R Mvel t=2,24< t Tab (8;0,05)=2,306 H 0 t elfogadjuk p-érték alapján Mvel p=0,055 > =0,05 H 0 t elfogadjuk Tehát a két változó között nem tudunk kapcsolatot kmutatn, a rangkorrelácós együttható nem tér el 0-tól szgnfkánsan 5%-os sznten. Megjegyzés. 5% hba mellett nem tudjuk kmutatn a kapcsolatot, azonban ez nem jelent azt, hogy nncs kapcsolat. 10%-os sznten pl. már szgnfkáns a korrelácó. Enny nformácó alapján azonban 5% hba mellett éppen nem tudtuk kmutatn az esetleg meglévő kapcsolatot. t R S 2 S 0,62 10 2 2 1 0,62 2,246
Rangkorrelácó számítás R-ben > cor(suly, magassag,method="spearman") ##Spearman féle korr. [1] 0.7289343 > cor.test(suly,magassag, method="spearman",exact=f) Spearman's rank correlaton rho data: suly and magassag S = 10251.71, p-value = 2.729e-11 alternatve hypothess: true rho s not equal to 0 sample estmates: rho 0.7289343 Krsztna Boda 49
Paraméteres vs. nemparaméteres módszerek Néha nehéz eldönten, mlyen próbát alkalmazzunk: nem csak ez a két féle próba létezk. Az orvos rodalomban bevett szokás, hogy valamlyen próbával ellenőrzk a normaltást, és ha az szgnfkáns, nemparaméteres próbát végeznek, egyébként paraméterest. Ezt az eljárást többen krtzálják (a nemszgnfkáns eredmény még nem jelent azt, hogy a nullhpotézs gaz, és fordítva; ugyanazon adatokon való tesztelés növel az eljárás első fajta hbáját (Rochon et al, 2012, BMC Medcal Research Methodology 12:81) Helyette a normaltás grafkus vzsgálatát javasolják vagy a normaltás korább (független) adatokon való ellenőrzését (Ugyanez vonatkozk a paraméteres kétmntás t-próba varancák azonosságára vonatkozó feltételének ellenőrzésére.) Krsztna Boda INTERREG 50
Paraméteres vs. nemparaméteres módszerek A paraméteres módszerek robusztusak: feltételek ksebb megsértése esetén még érvényes az eredményük A nemparaméteres próbáknak kevesebb a feltétele Ha a paraméteres próba feltétele teljesülnek, akkor ők erősebbek Krsztna Boda INTERREG 51
Krsztna Boda Összefoglaló kérdések és feladatok Normaltásvzsgálat grafkusan A paraméter jelentése A paraméteres próba jelentése A nemparaméteres próba jelentése Mely esetben használunk rangsoroláson alapuló próbákat? Adjunk példát rangszámok készítésére! Két összetartozó mnta összehasonlítása rangsoroláson alapuló módszerekkel Két független mnta összehasonlítása rangsoroláson alapuló módszerekkel A szgnfkanca megállapása ks és nagy elemszám esetén két mnta nemparaméteres módszerekkel való összehasonlításakor. Rangsorolja a következő adatokat: 21, 23, 24, 21, 20, 30, 25, 24, 31 A rangkorrelácós együttható jelentése, tulajdonsága, számítása A rangkorrelácós együttható szgnfkancája 52
Példák az orvos rodalomból Krsztna Boda INTERREG 53
Krsztna Boda INTERREG 54
Krsztna Boda INTERREG 55
Irodalom Reczgel Jenő, Harnos Andrea, Solymos Norbert: Bostatsztka nem statsztkusoknak. Pars Kft. Nagykovács, 2007. Vargha András: Matematka statsztka pszchológa, nyelvészet és bológa alkalmazásokkal. Pólya Kadó Budapest, 2000. Krsztna Boda 56