RANGSOROLÁSON ALAPULÓ NEM-PARAMÉTERES PRÓBÁK Sorrendbe állítjuk a vzgált értékeket (a mntaelemeket) é az aktuál érték helyett a rangzámokat haználjuk a próbatatztkák értékenek kzámítáára. Egye próbáknál a két vagy több mntából zármazó értékeket özevonjuk é az egéz mntát egy közö orba rendezzük, majd hozzárendeljük a mntaelemekhez a rangzámokat (pl. Mann-Whtney é Krukal-Wall próbák); má próbáknál a két mntát külön-külön rangoroljuk é mndkettőhöz külön-külön rendelünk rangokat (pl. rangkorrelácó módzereknél). Általában a nem-paramétere próbákat akkor haználjuk, amkor a paramétere próbák feltétele nem teljeülnek: Ha nem gaz, hogy az alapokaág normál elozláú. A nem-paramétere-próbákat lehet elozlá-függetlennek nevezn, mert nnc kköté erre vonatkozóan. Ha az értékek eleve cak ordnál kálán mértek (pl. zubjektív rangorolá: melyk állat barátágoabb). A rangoroláo próbáknál mndenképpen áttérünk ordnál kálára, vagy nformácót veztünk, ha az eredet adatok arány- vagy ntervallum-kálán voltak megadva. Ebből következk ezeknek a módzereknek a gyengeége: cak a nagy eltéréeket tudják kmutatn, a kebb eltéréek eetén a próba eredménye a H 0 megtartáa lez, vagy nő az II. tpuú hba valózínűége. (Mndazonáltal könnyebbég, hogy cak ordnál kálán kell tudnunk mérn a változókat, pl. érkezé orrendnél nem zükége a ponto érkezé dő, elég a orrend megadáa a tatztka elvégzééhez.) Kapcolt rangok: ha többzör zerepel ugyanaz az érték, akkor ugyanazt a rangot kell nekk adn, mndegyknek azt az átlago rangot, am a orzámak átlaga lenne: 5 + 6 Pl. az 5. é 6. érték ua.: r 5 = r6 = = 5, 5, a 7. mntaérték a 7-e rangzámot kapja. + + Pl. az elő ua.: r = r = r = =, a negyedk a 4-e rangot kapja. Kapcolt rangok eetén korrekcó tényezőként zerepel: E = e e, ahol e azt adja meg, hogy hány érték egyezk meg az. coportban. Mann-Whtney tezt A kétmntá t-próba lletve d-próba helyett alkalmazható. Nullhpotézünk az, hogy a két mnta ugyanabból az alapokaágból zármazk. A zgnfkanca próbák alapelve, hogy ha a két mnta azono alapokaágból zármazk, akkor a rangzámok véletlenzerűen ozlanak meg a mnták közt. Ekkor a véletlen cak nagyon rtkán produkál pl. olyan zélőége megozlát, hogy az egyk mnta mnden eleme kebb a mák mntáénál: pl.. mnta: 5 6 7 8. mnta: 0 rangzámok: 4 5 6 7 8 Nylvánvalóan látzk, hogy tt el kell vetn a rangorzámok véletlen megozláának feltételezéét, a megozlát a kezelé -nek tudjuk be.
Általánoágban a következő próbatatztkát kell kzámítan: Legyen n a kebbk mnta elemzáma, n a nagyobbké (tehát a két mnta lehet eltérő méretű, mnt a kétmntá t-próbánál, cak alkalmaan kell elnevezn, tehát a kebbk legyen az. mnta). A két mntát özevonva az értékeket helyetteítjük a rangzámokkal. Az egyk mnta mnden elemére (célzerű a kebbre) kzámoljuk, hogy a mák mntában hány nála kebb érték van. Ezeket az értékeket özeadjuk, ez lez a C érték. (Ha az egyk mnta elemének rangja ugyananny, mnt a mák mnta egy eleméé, akkor ½-el zámolunk.) A próbatatztka értéke, U a C lletve az n n -C értékek közül a nagyobb. U { C, n n C} = max Az U krt n, n ) ( értékeket a Mann-Whtney U-táblázatból nézzük k: ha kétoldalú próbát végzünk, akkor az α/ orból, mvel a táblázat egyoldalú. A táblázat zélen a mntaelemzámok zerepelnek, nem pedg a zabadágfokok! A következő két példa zélőége eetet mutat. Mnkét eetben α=0,05.. példa: a két mnta nagyon egyezk:. mnta: 6 4 9 4. mnta: 9 5 0 7 7 rangz.: 4 5 6 7 8 9 0 n =5, n =6, R =0, C =+++4+5=5 n n -C=0-5=5 U =5 U krt,5,6, 0,05 = U < U krt, így elfogadjuk H 0 -t.. példa: a két mnta nagyon különbözk:. mnta: 7 9 4 7. mnta: 9 5 6 0 4 rangz.: 4 5 6 7 8 9 0 n =5, n =6, R =45, C =0 n n -C=0-0=0 U =0 U krt,5,6, 0,05 = U > U krt, elvetjük H 0 -t. A Mann-Whtney tezt U táblázata cak akkor haználható, ha a nagyobb elemzám nem nagyobb 0-nál ( n 0 ). Amennyben ennél nagyobb mnta-elemzámú mntákat akarunk özehaonlítan, úgy egy közelítét kell alkalmaznunk. Az U elozláa nagy n-re közelít a normál elozlát, µ = n n / várható értékkel, é σ = n n n + n / zóráal. ( ) +
nn U U µ Ekkor kzámoljuk a következőt: Z = = σ nn ( n + n + ) Ezt a Z értéket kell özehaonlítan a tandard normál elozlá megfelelő zgnfkanca zntű értékével. Megjegyzé: ha a mnták között kapcolt rangok vannak (egyező orzámok, ld. a példában), akkor n 0 eetén haználható az Ukrt táblázat, ám n >0 eetén a fent Z értéket korrgáln kell. Egyező orzámok eetén a közelítő formula alakja egy kct má. Mnden egyezét tartalmazó coportra legyen e az egyezéek záma. Számoljuk k a (e -e ) értéket é adjuk öze őket. Ez eetben a közelítő normál elozlá zóráa: ( n + n ) ( n + n ) nn E σ = ahol E = ( n ) ( ) E = ( e e ) + n n + n A Krukal-Wall próba Ez a próba az egyzemponto varancaanalíz nem-paramétere megfelelője. vagy több mnta özehaonlítáa eetén alkalmazzuk. H 0 : a mnták azono alapokaágból zármaznak. H : legalább egy mnta különböző alapokaágból zármazk. Feltételek: a mntaelemek egymától független, random kválaztáa. NEM feltétel a normál elozláú alapokaág. A próba elve haonló a Mann-Whtney próbáéhoz: Az özeített mntában koztjuk a rangzámokat. Ha a mnták ugyanabból az alapokaágból zármaznak, akkor a rangzámok elozláa véletlenzerű lez az egye mnták között. h: a mnták záma n j : a j-k mnta elemzáma R j : a j-k mnta rangzámözege N = h n j j= az adatok záma= özelemzám H h R = N( N + ) j= n j j ( N + ) ha nncenek egyező (kapcolt) rangok! Ez a próbatatztka h- zabadágfokú χ -elozlát követ, 5-nél nagyobb mntaelemzámokra jó közelítéel. (A képlet átalakítható olyan formára, amely haonlít a χ -próbánál megzokotthoz: egy-egy mntára vonatkozó várható é tapaztalt rangözeg különbégének négyzetét úlyozva özegz.)
Ha H > χ krt( h, α ), akkor H0-t elvetjük, mert a rangözegek túlágoan eltérnek a várttól, nem valózínű, hogy a rangok puztán a véletlen matt ozlanának el ennyre egyenlőtlenül. Ha H < χ krt( h, α ), akkor H0-t megtartjuk, a rangözegek eltérée a várttól nem túl nagy, betudható a ztochaztku ngadozának. Ha zgnfkán eltérét találtunk, a varanca anlízhez haonlóan tt tovább vzgálhatjuk különböző özehaonlítáokkal, hogy mely mnták különbége okozta ezt. Korlátok (a Krukal-Wall-próbánál): ) Ha kapcolt rangok vannak, akkor H értékét korrgáln kell: legyen k a kapcolt rangú coportok záma: H korr = = N H k E N ) Általában legyen a mntaelemzám 5-nél több mnden coportban. Általában ezt könnyű elérn, ha mégem teljeül ez a feltétel, akkor a Krukal-Wall krtku-érték táblázatot kell haználn a χ táblázat helyett, amely mnta özehaonlítáára alkalma. Ezt nem rézletezzük. Két változó kapcolatának mérée: rangkorrelácó módzerek Az eddg tanult Pearon-féle korrelácó-zámítá (r ) nem haználható, ha az adatok nem normál elozláúak, lletve ha cak ordnál kálán mértek. Pl. pzchológa kíérlet: állítuk orba az objektumokat, hogy mennyre haonlítanak X-re. Két egyén által adott rangorolá egyezéét rangkorrelácóval mérhetjük. Pl. 6 növényen a círázá orrend é vrágzá orrend kapcolata. n mntaelemen két-két változó: x é y értéket mérjük. Alapelv: külön-külön rangoroljuk az x é y értékeket. Fgyeln kell az özetartozó adatpárokat, mert az özehaonlítá az alapján történk, hogy az özetartozó rangértékek mennyre különböznek. Felírjuk az egyk változónak (x) megfelelő rangokat növekvő orrendben, majd mndegyk alá írjuk a mák változóból (y) ugyanarra a mntaelemre kapott rangot (ezek már nem leznek monoton növekvő orrendben, kvéve a maxmál poztív korrelácó eetét). Pl. x: círázá orrend: 4 5 6 (r x értékek) y: vrágzá orrend: 4 5 6 (r y értékek) ez a példa a maxmál poztív korrelácót mutatja, elváráunk, hogy a rangkorrelácó értéke legyen 4
Pl. x: 4 5 6 y: 6 5 4 ez pedg a maxmál negatív korrelácó zélőége eete lenne, a rangkorrelácónak --nek kell lenne. Ha a két rangor között nnc kapcolat, az egyk a mákhoz képet véletlenzerű, lletve nem-zgnfkánan tér el a véletlentől, akkor korrelálatlanok. A rangkorrelácót ennek megfelelően mér a Spearman-féle ρ(= r ) é a Kendall-féle τ. ) Spearman-féle rangkorrelácó ρ = r n 6 d = = ahol d =r x -r y a rangok különbége az -k mntaelemre n n ha nncenek kapcolt rangok, akkor gaz, hogy r (kapcolt rangok eetén bonyolultabb) Hpotézvzgálat: H 0 : r értéke nem tér el zgnfkánan a 0-tól, vagy a két változó valójában független, cupán a véletlen matt nem 0 a korrelácó. H : r értéke zgnfkánan eltér a 0-tól, a két változó nem független. Ha n elég nagy ( n 0), akkor r elozláa megegyezk r-ével (a lneár korrelácóéval): ˆ n t = r df=n- r ) Kendall-féle τ Mnt fent, x változó zernt növekvő orrendbe rendezzük a rangokat é alá írjuk a megfelelő y rangot. Kzámítjuk a C értékeket: az egyk or -k eleme után nagyobb rangzámúak záma a máodk orban. 4 τ = n = C n( n ) n( n ) Ha n > 40, akkor τ elozláa közelít a normálhoz, ekkor: t = τ (n 5) 9n( n ) 5
Példa: méhanya mérete é utód hoza (parthenogenez), n = 5 r x : 4 5 6 7 8 9 0 4 5 r y : 5 4 9 0 6 7 8 4 5 C : 9 0 9 4 5 4 0 = 79 τ=(4.79-5.4)/5.4=0,504 t =0,504/ (5) /(9 5 4) =,6 t -nél nézzük meg (ez közelíté, perze): 0,05 =.96 < t eredményt adott. Pontoabb vzgálathoz egy pecál táblázat kell. t C, tehát a próba zgnfkán A két rangkorrelácó koeffcen özehaonlítáa: r : nagyobb úlyt ad a távoleő rangoknak (d ), ezért ott célzerű haználn, ahol a közel rangeltéréek kevébé megbízhatóak. τ: egyenlően úlyozza a rangbel eltéréeket. 6