RANGSOROLÁSON ALAPULÓ NEM-PARAMÉTERES PRÓBÁK

Hasonló dokumentumok
Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

A m becslése. A s becslése. A (tapasztalati) szórás. n m. A minta és a populáció kapcsolata. x i átlag

Wilcoxon-féle előjel-próba. A rangok. Ismert eloszlás. A nullhipotézis megfogalmazása H 1 : m 0 0. A medián 0! Az eltérés csak véletlen!

Regresszióanalízis. Lineáris regresszió

ANOVA. Egy faktor szerinti ANOVA. Nevével ellentétben nem szórások, hanem átlagok összehasonlítására szolgál. Több független mintánk van, elemszámuk

Portfólióelméleti modell szerinti optimális nyugdíjrendszer

fizikai-kémiai mérések kiértékelése (jegyzkönyv elkészítése) mérési eredmények pontossága hibaszámítás ( közvetlen elvi segítség)

VARIANCIAANALÍZIS (ANOVA) véletlen faktorok esetén

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

9. GYAKORLAT STATISZTIKAI PRÓBÁK SPSS-BEN FELADATOK

ξ i = i-ik mérés valószínségi változója

Gazdaságstatisztika példatár

Laplace transzformáció

Felderítő statisztika

Statisztikai alapismeretek amit feltétlenül tudni kell

4 2 lapultsági együttható =

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Műszaki folyamatok közgazdasági elemzése Előadásvázlat november 06. A közgazdaságtan játékelméleti megközelítései

Mintapélda. Szivattyúperem furatának mérése tapintós furatmérővel. Megnevezés: Szivattyúperem Anyag: alumíniumötvözet

Adatok statisztikai értékelésének főbb lehetőségei

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Budapesti Műszaki és Gazdaságtudományi Egyetem Közlekedésmérnöki Kar Repülőgépek és hajók Tanszék

Bevezetés a hipotézisvizsgálatokba

Matematika M1 1. zárthelyi megoldások, 2017 tavasz

Statisztika gyakorló feladatok

STATISZTIKA 2. KÉPLETGYŰJTEMÉNY. idősorok statisztikai becslések hipotézisvizsgálat regressziószámítás

METEOROLÓGIAI INTERPOLÁCIÓS RENDSZER (MISH) ÉGHAJLATI INFORMÁCIÓK FELHASZNÁLÁSÁVAL

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Villamos gépek tantárgy tételei

II.2. A Monte Carlo számítógépes szimuláció

A robusztos PID szabályozó tervezése

= 450 kg. b) A hó 4500 N erővel nyomja a tetőt. c) A víz tömege m víz = m = 450 kg, V víz = 450 dm 3 = 0,45 m 3. = 0,009 m = 9 mm = 1 14

Képletgyűjtemény a Gazdaságstatisztika tárgy A matematikai statisztika alapjai című részhez

A várható érték vizsgálata u és t statisztika segítségével

FIZIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Hipotézis vizsgálatok

Forgó mágneses tér létrehozása

Az átviteli (transzfer) függvény, átviteli karakterisztika, Bode diagrammok

Maradékos osztás nagy számokkal

TARTÓSZERKEZETEK II.-III.

biometria I. foglalkozás előadó: Prof. Dr. Rajkó Róbert Alapfogalmak

Eloszlás-független módszerek 13. elıadás ( lecke)

Tetszőleges mozgások

Post hoc analízisek BIOMETRIA. LSD-teszt (legkisebb szignifikáns ns differencia) Bonferroni-teszt. LSD Bonferroni Student-Newman

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Széchenyi István Egyetem MTK Szerkezetépítési és Geotechnikai Tanszék Tartók statikája I. Dr. Papp Ferenc RÚDAK CSAVARÁSA

Regresszió. Fő cél: jóslás Történhet:

MINİSÉGBIZTOSÍTÁS 6. ELİADÁS Március 19. Összeállította: Dr. Kovács Zsolt egyetemi tanár

Matematikai statisztika

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Többváltozós lineáris regressziós modell feltételeinek

STATISZTIKA. Terjedelem. Forgalom terjedelem. R=MAX(adatok) MIN(adatok) kvartilis eltérés : Qe

Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ANOVA ( ) 2. χ σ. α ( ) 2. y y y p p y y = + + = + + p p r. Fisher-Cochran-tétel

ANOVA. Mekkora különbséget tudnánk kimutatni? Statistics>Power Analysis>Several Means, ANOVA 1-Way

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

STATISZTIKA. Excel INVERZ.T függvf. ára 300 Ft/kg. bafüggvény, alfa=0,05; DF=76. Tesztelhetjük, hogy a valósz. konfidencia intervallum nagyságát t is.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Populáció nagyságának felmérése, becslése

Intelligens elosztott rendszerek

GÉPSZERKEZETTAN - TERVEZÉS IDŐBEN VÁLTOZÓ IGÉNYBEVÉTEL, KIFÁRADÁS

The original laser distance meter. The original laser distance meter

GÉPSZERKEZETTAN - TERVEZÉS IDŐBEN VÁLTOZÓ IGÉNYBEVÉTEL, KIFÁRADÁS

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Tartalomjegyzék. dr. Lublóy László főiskolai docens. Nyomott oszlop vasalásának tervezése

5. gyakorlat Konfidencia intervallum számolás

Gyakorló feladatok Az alábbiakon kívül a nappalis gyakorlatokon szereplő feladatokból is lehet készülni.

Konfidencia-intervallumok

Leica DISTOTMD510. X310 The original laser distance meter. The original laser distance meter

Megint egy keverési feladat

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Korreláció és lineáris regresszió

Zárthelyi dolgozat 2014 B... GEVEE037B tárgy hallgatói számára

STATISZTIKA. Terjedelem. Forgalom terjedelem. R=MAX(adatok) MIN(adatok) rtékek a sokaság g elemeinek k. méri. Leggyakrabban a számtani. 3.

Paraméteres eljárások, normalitásvizsgálat, t-eloszlás, t-próbák. Statisztika I., 2. alkalom

STATISZTIKA (H 0 ) 5. Előad. lete, Nullhipotézis 2/60 1/60 3/60 4/60 5/60 6/60

1. MINTAFELADATSOR KÖZÉPSZINT JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

NEMPARAMÉTERES PRÓBÁK

Hatvani István fizikaverseny forduló megoldások. 1. kategória

Villámvédelem 3. #5. Elszigetelt villámvédelem tervezése, s biztonsági távolság számítása. Tervezési alapok (norma szerint villámv.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Az aszinkron (indukciós) gép.

Minősítéses mérőrendszerek képességvizsgálata

Statisztikai módszerek 7. gyakorlat

A maximálisan lapos esetben a hurokerősítés Bode diagramjának elhelyezkedése Q * p így is írható:

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Családi állapottól függõ halandósági táblák Magyarországon

Statisztika elméleti összefoglaló

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Átírás:

RANGSOROLÁSON ALAPULÓ NEM-PARAMÉTERES PRÓBÁK Sorrendbe állítjuk a vzgált értékeket (a mntaelemeket) é az aktuál érték helyett a rangzámokat haználjuk a próbatatztkák értékenek kzámítáára. Egye próbáknál a két vagy több mntából zármazó értékeket özevonjuk é az egéz mntát egy közö orba rendezzük, majd hozzárendeljük a mntaelemekhez a rangzámokat (pl. Mann-Whtney é Krukal-Wall próbák); má próbáknál a két mntát külön-külön rangoroljuk é mndkettőhöz külön-külön rendelünk rangokat (pl. rangkorrelácó módzereknél). Általában a nem-paramétere próbákat akkor haználjuk, amkor a paramétere próbák feltétele nem teljeülnek: Ha nem gaz, hogy az alapokaág normál elozláú. A nem-paramétere-próbákat lehet elozlá-függetlennek nevezn, mert nnc kköté erre vonatkozóan. Ha az értékek eleve cak ordnál kálán mértek (pl. zubjektív rangorolá: melyk állat barátágoabb). A rangoroláo próbáknál mndenképpen áttérünk ordnál kálára, vagy nformácót veztünk, ha az eredet adatok arány- vagy ntervallum-kálán voltak megadva. Ebből következk ezeknek a módzereknek a gyengeége: cak a nagy eltéréeket tudják kmutatn, a kebb eltéréek eetén a próba eredménye a H 0 megtartáa lez, vagy nő az II. tpuú hba valózínűége. (Mndazonáltal könnyebbég, hogy cak ordnál kálán kell tudnunk mérn a változókat, pl. érkezé orrendnél nem zükége a ponto érkezé dő, elég a orrend megadáa a tatztka elvégzééhez.) Kapcolt rangok: ha többzör zerepel ugyanaz az érték, akkor ugyanazt a rangot kell nekk adn, mndegyknek azt az átlago rangot, am a orzámak átlaga lenne: 5 + 6 Pl. az 5. é 6. érték ua.: r 5 = r6 = = 5, 5, a 7. mntaérték a 7-e rangzámot kapja. + + Pl. az elő ua.: r = r = r = =, a negyedk a 4-e rangot kapja. Kapcolt rangok eetén korrekcó tényezőként zerepel: E = e e, ahol e azt adja meg, hogy hány érték egyezk meg az. coportban. Mann-Whtney tezt A kétmntá t-próba lletve d-próba helyett alkalmazható. Nullhpotézünk az, hogy a két mnta ugyanabból az alapokaágból zármazk. A zgnfkanca próbák alapelve, hogy ha a két mnta azono alapokaágból zármazk, akkor a rangzámok véletlenzerűen ozlanak meg a mnták közt. Ekkor a véletlen cak nagyon rtkán produkál pl. olyan zélőége megozlát, hogy az egyk mnta mnden eleme kebb a mák mntáénál: pl.. mnta: 5 6 7 8. mnta: 0 rangzámok: 4 5 6 7 8 Nylvánvalóan látzk, hogy tt el kell vetn a rangorzámok véletlen megozláának feltételezéét, a megozlát a kezelé -nek tudjuk be.

Általánoágban a következő próbatatztkát kell kzámítan: Legyen n a kebbk mnta elemzáma, n a nagyobbké (tehát a két mnta lehet eltérő méretű, mnt a kétmntá t-próbánál, cak alkalmaan kell elnevezn, tehát a kebbk legyen az. mnta). A két mntát özevonva az értékeket helyetteítjük a rangzámokkal. Az egyk mnta mnden elemére (célzerű a kebbre) kzámoljuk, hogy a mák mntában hány nála kebb érték van. Ezeket az értékeket özeadjuk, ez lez a C érték. (Ha az egyk mnta elemének rangja ugyananny, mnt a mák mnta egy eleméé, akkor ½-el zámolunk.) A próbatatztka értéke, U a C lletve az n n -C értékek közül a nagyobb. U { C, n n C} = max Az U krt n, n ) ( értékeket a Mann-Whtney U-táblázatból nézzük k: ha kétoldalú próbát végzünk, akkor az α/ orból, mvel a táblázat egyoldalú. A táblázat zélen a mntaelemzámok zerepelnek, nem pedg a zabadágfokok! A következő két példa zélőége eetet mutat. Mnkét eetben α=0,05.. példa: a két mnta nagyon egyezk:. mnta: 6 4 9 4. mnta: 9 5 0 7 7 rangz.: 4 5 6 7 8 9 0 n =5, n =6, R =0, C =+++4+5=5 n n -C=0-5=5 U =5 U krt,5,6, 0,05 = U < U krt, így elfogadjuk H 0 -t.. példa: a két mnta nagyon különbözk:. mnta: 7 9 4 7. mnta: 9 5 6 0 4 rangz.: 4 5 6 7 8 9 0 n =5, n =6, R =45, C =0 n n -C=0-0=0 U =0 U krt,5,6, 0,05 = U > U krt, elvetjük H 0 -t. A Mann-Whtney tezt U táblázata cak akkor haználható, ha a nagyobb elemzám nem nagyobb 0-nál ( n 0 ). Amennyben ennél nagyobb mnta-elemzámú mntákat akarunk özehaonlítan, úgy egy közelítét kell alkalmaznunk. Az U elozláa nagy n-re közelít a normál elozlát, µ = n n / várható értékkel, é σ = n n n + n / zóráal. ( ) +

nn U U µ Ekkor kzámoljuk a következőt: Z = = σ nn ( n + n + ) Ezt a Z értéket kell özehaonlítan a tandard normál elozlá megfelelő zgnfkanca zntű értékével. Megjegyzé: ha a mnták között kapcolt rangok vannak (egyező orzámok, ld. a példában), akkor n 0 eetén haználható az Ukrt táblázat, ám n >0 eetén a fent Z értéket korrgáln kell. Egyező orzámok eetén a közelítő formula alakja egy kct má. Mnden egyezét tartalmazó coportra legyen e az egyezéek záma. Számoljuk k a (e -e ) értéket é adjuk öze őket. Ez eetben a közelítő normál elozlá zóráa: ( n + n ) ( n + n ) nn E σ = ahol E = ( n ) ( ) E = ( e e ) + n n + n A Krukal-Wall próba Ez a próba az egyzemponto varancaanalíz nem-paramétere megfelelője. vagy több mnta özehaonlítáa eetén alkalmazzuk. H 0 : a mnták azono alapokaágból zármaznak. H : legalább egy mnta különböző alapokaágból zármazk. Feltételek: a mntaelemek egymától független, random kválaztáa. NEM feltétel a normál elozláú alapokaág. A próba elve haonló a Mann-Whtney próbáéhoz: Az özeített mntában koztjuk a rangzámokat. Ha a mnták ugyanabból az alapokaágból zármaznak, akkor a rangzámok elozláa véletlenzerű lez az egye mnták között. h: a mnták záma n j : a j-k mnta elemzáma R j : a j-k mnta rangzámözege N = h n j j= az adatok záma= özelemzám H h R = N( N + ) j= n j j ( N + ) ha nncenek egyező (kapcolt) rangok! Ez a próbatatztka h- zabadágfokú χ -elozlát követ, 5-nél nagyobb mntaelemzámokra jó közelítéel. (A képlet átalakítható olyan formára, amely haonlít a χ -próbánál megzokotthoz: egy-egy mntára vonatkozó várható é tapaztalt rangözeg különbégének négyzetét úlyozva özegz.)

Ha H > χ krt( h, α ), akkor H0-t elvetjük, mert a rangözegek túlágoan eltérnek a várttól, nem valózínű, hogy a rangok puztán a véletlen matt ozlanának el ennyre egyenlőtlenül. Ha H < χ krt( h, α ), akkor H0-t megtartjuk, a rangözegek eltérée a várttól nem túl nagy, betudható a ztochaztku ngadozának. Ha zgnfkán eltérét találtunk, a varanca anlízhez haonlóan tt tovább vzgálhatjuk különböző özehaonlítáokkal, hogy mely mnták különbége okozta ezt. Korlátok (a Krukal-Wall-próbánál): ) Ha kapcolt rangok vannak, akkor H értékét korrgáln kell: legyen k a kapcolt rangú coportok záma: H korr = = N H k E N ) Általában legyen a mntaelemzám 5-nél több mnden coportban. Általában ezt könnyű elérn, ha mégem teljeül ez a feltétel, akkor a Krukal-Wall krtku-érték táblázatot kell haználn a χ táblázat helyett, amely mnta özehaonlítáára alkalma. Ezt nem rézletezzük. Két változó kapcolatának mérée: rangkorrelácó módzerek Az eddg tanult Pearon-féle korrelácó-zámítá (r ) nem haználható, ha az adatok nem normál elozláúak, lletve ha cak ordnál kálán mértek. Pl. pzchológa kíérlet: állítuk orba az objektumokat, hogy mennyre haonlítanak X-re. Két egyén által adott rangorolá egyezéét rangkorrelácóval mérhetjük. Pl. 6 növényen a círázá orrend é vrágzá orrend kapcolata. n mntaelemen két-két változó: x é y értéket mérjük. Alapelv: külön-külön rangoroljuk az x é y értékeket. Fgyeln kell az özetartozó adatpárokat, mert az özehaonlítá az alapján történk, hogy az özetartozó rangértékek mennyre különböznek. Felírjuk az egyk változónak (x) megfelelő rangokat növekvő orrendben, majd mndegyk alá írjuk a mák változóból (y) ugyanarra a mntaelemre kapott rangot (ezek már nem leznek monoton növekvő orrendben, kvéve a maxmál poztív korrelácó eetét). Pl. x: círázá orrend: 4 5 6 (r x értékek) y: vrágzá orrend: 4 5 6 (r y értékek) ez a példa a maxmál poztív korrelácót mutatja, elváráunk, hogy a rangkorrelácó értéke legyen 4

Pl. x: 4 5 6 y: 6 5 4 ez pedg a maxmál negatív korrelácó zélőége eete lenne, a rangkorrelácónak --nek kell lenne. Ha a két rangor között nnc kapcolat, az egyk a mákhoz képet véletlenzerű, lletve nem-zgnfkánan tér el a véletlentől, akkor korrelálatlanok. A rangkorrelácót ennek megfelelően mér a Spearman-féle ρ(= r ) é a Kendall-féle τ. ) Spearman-féle rangkorrelácó ρ = r n 6 d = = ahol d =r x -r y a rangok különbége az -k mntaelemre n n ha nncenek kapcolt rangok, akkor gaz, hogy r (kapcolt rangok eetén bonyolultabb) Hpotézvzgálat: H 0 : r értéke nem tér el zgnfkánan a 0-tól, vagy a két változó valójában független, cupán a véletlen matt nem 0 a korrelácó. H : r értéke zgnfkánan eltér a 0-tól, a két változó nem független. Ha n elég nagy ( n 0), akkor r elozláa megegyezk r-ével (a lneár korrelácóéval): ˆ n t = r df=n- r ) Kendall-féle τ Mnt fent, x változó zernt növekvő orrendbe rendezzük a rangokat é alá írjuk a megfelelő y rangot. Kzámítjuk a C értékeket: az egyk or -k eleme után nagyobb rangzámúak záma a máodk orban. 4 τ = n = C n( n ) n( n ) Ha n > 40, akkor τ elozláa közelít a normálhoz, ekkor: t = τ (n 5) 9n( n ) 5

Példa: méhanya mérete é utód hoza (parthenogenez), n = 5 r x : 4 5 6 7 8 9 0 4 5 r y : 5 4 9 0 6 7 8 4 5 C : 9 0 9 4 5 4 0 = 79 τ=(4.79-5.4)/5.4=0,504 t =0,504/ (5) /(9 5 4) =,6 t -nél nézzük meg (ez közelíté, perze): 0,05 =.96 < t eredményt adott. Pontoabb vzgálathoz egy pecál táblázat kell. t C, tehát a próba zgnfkán A két rangkorrelácó koeffcen özehaonlítáa: r : nagyobb úlyt ad a távoleő rangoknak (d ), ezért ott célzerű haználn, ahol a közel rangeltéréek kevébé megbízhatóak. τ: egyenlően úlyozza a rangbel eltéréeket. 6