NEMPARAMÉTERES PRÓBÁK

Hasonló dokumentumok
Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Páros binomiális próbák

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Statisztika feladatok

4 2 lapultsági együttható =

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Nemparaméteres eljárások

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Hipotézis vizsgálatok

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Eloszlás-független módszerek 13. elıadás ( lecke)

Regresszió. Fő cél: jóslás Történhet:

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Kísérlettervezési alapfogalmak:

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Minősítéses mérőrendszerek képességvizsgálata

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

[Biomatematika 2] Orvosi biometria

Normális eloszlás paramétereire vonatkozó próbák

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Több laboratórium összehasonlítása, körmérés

RANGSOROLÁSON ALAPULÓ NEM-PARAMÉTERES PRÓBÁK

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Varianciaanalízis. Egytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varianciaanalízis ANOVA)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

ADATREDUKCIÓ I. Középértékek

Kettőnél több csoport vizsgálata. Makara B. Gábor

ANOVA. Egy faktor szerinti ANOVA. Nevével ellentétben nem szórások, hanem átlagok összehasonlítására szolgál. Több független mintánk van, elemszámuk

Matematikai statisztika

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Varianciaanalízis 4/24/12

Lineáris regresszió. Statisztika I., 4. alkalom

Adatelemzés és adatbányászat MSc

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

A sokaság/minta eloszlásának jellemzése

BIOMETRIA_ANOVA_2 1 1

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Biomatematika 13. Varianciaanaĺızis (ANOVA)

KISTERV2_ANOVA_

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

y ij = µ + α i + e ij

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Nemparaméteres próbák

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Adatok statisztikai értékelésének főbb lehetőségei

Minőség-képességi index (Process capability)

Az entrópia statisztikus értelmezése

Statisztika elméleti összefoglaló

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Biostatisztika Összefoglalás

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Többváltozós lineáris regressziós modell feltételeinek

Az első számjegyek Benford törvénye

Biostatisztika e-book Dr. Dinya Elek

Bevezetés a hipotézisvizsgálatokba

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

METROLÓGIA ÉS HIBASZÁMíTÁS

Biostatisztika Összefoglalás

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

Hipotézis vizsgálatok

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

1 Y t = X tmod(n) azaz periodikusan kiterjesztjük a mintát. 3 Adott b blokkméretre készítsünk N =mb (N N)

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ANOVA ( ) 2. χ σ. α ( ) 2. y y y p p y y = + + = + + p p r. Fisher-Cochran-tétel

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Segítség az outputok értelmezéséhez

Átírás:

NEMPARAMÉTERES PRÓBÁK A nemparaméteres próbák nem tételezk föl a normáls eloszlást. A leggyakrabban használt próbák (pl. a t-próbák, ANOVA) feltételezk a normáls eloszlást. Sokszor ez nem teljesül. Következmény: az első ll. másodfajú hba-valószínűsége eltér a deklarálttól (Pl. azt hsszük, hogy p=0.01, tehát szgnfkáns a különbség, pedg helyesen számolva p=0. lenne, tehát nem szgnfkáns a különbség.) BIOMETRIA_NEMPARAMÉTERES_1 1

Mkor nem várható a normáls eloszlás? Sokszor az adatok természete már nylvánvalóvá tesz: a selejtarány bnomáls eloszlású a rtkán előforduló eset (pl. hbák száma) Posson-eloszlású őrlésnél a szemcseméret lognormáls eloszlású bzonyos adatok csak sorrend skálán értelmezhetők (pl. Lkert-skála) Máskor csak az eloszlás vzsgálatával derül k : hsztogram normaltásvzsgálat (grafkusan: Normal Probablty Plot, statsztka próbával: pl. Shapro-Wlk test) BIOMETRIA_NEMPARAMÉTERES_1

Nemparaméteres jegyzet 1. fejezet Mről lesz szó ebben a negyedévben? 1. rangokon alapuló próbák kétmntás t-próba Wlcoxon-Mann-Whtney egymntás t-próba Wlcoxon sgned rank páros t-próba Wlcoxon sgned rank egy faktor szernt ANOVA Kruskal-Walls véletlen blokk Fredman + rang-korrelácó. Medánok vzsgálata egy vagy két párosított mnta előjel-próba két vagy több független mnta Mood-féle medán próba BIOMETRIA_NEMPARAMÉTERES_1 3

Mről lesz szó ebben a negyedévben? (folytatás) Nemparaméteres jegyzet. fejezet 3. bnomáls eloszláson alapuló próbák egymntás bnomáls próba kétmntás bnomáls próba két arány összehasonlítására kontngenca-táblázatok: homogentásvzsgálat bnomáls eloszláson alapuló páros próbák függetlenségvzsgálat vagy McNemar próba Fsher egzakt próbája BIOMETRIA_NEMPARAMÉTERES_1 4

Mről lesz szó ebben a negyedévben? (folytatás) Nemparaméteres jegyzet 3., 4. fejezet 4. Illeszkedésvzsgálat Posson-eloszlásra multnomáls eloszlásra kontngenca-táblázatokra 5. Logt regresszó (a függő változó névleges vagy sorrend skálán mért) 6. Túlélés vzsgálatok BIOMETRIA_NEMPARAMÉTERES_1 5

Néhány fgyelmeztető megjegyzés: ha az adatok ténylegesen normáls eloszlásúak, a nemparaméteres próbák statsztka ereje ksebb (könnyebben elfogadják a nullhpotézst, amkor az nem gaz) ha lehet (azaz a normáls eloszlású adatokra) a paraméteres próbákat célszerű alkalmazn a nemparaméteres próbák ugyan nem feltételezk a normáls eloszlást, de más, elég szgorú feltételeket támasztanak! (pl. függetlenség, a két összehasonlítandó mnta azonos alakú eloszlásból származzék) ha ezek nem teljesülnek, a nem-paraméteres próbák ugyanúgy hams eredményt adnak, mnt a paraméteresek BIOMETRIA_NEMPARAMÉTERES_1 6

Néhány fgyelmeztető megjegyzés (folytatás): ha a próba eredménye szgnfkáns (a nullhpotézst elutasítjuk), az s lehetséges, hogy a nullhpotézs (pl. két sokaság medánjanak várható értékek megegyezk) gaz, csak a próba feltételezése nem teljesülnek BIOMETRIA_NEMPARAMÉTERES_1 7

1. példa Két független mnta összehasonlítása: Wlcoxon-Mann-Whtney próba a kétmntás t-próba nemparaméteres megfelelője (Conover, W.J.: Practcal nonparametrc statstcs, J. Wley, 3rd ed. 1999, p. 101 nyomán) Felmérést végeztek általános skolás gyerekek körében, hogy azok a gyerekek, akk óvodába jártak, eredményesebbek-e az skolában. 1 gyerek eredményet vzsgálták, közülük 4 volt óvodás. átlag 4.5 4. 4.1 3.8 4.6 4.4 4.3 4.0 3.9 3.7 3.6 3.5 járt-e RANGOK VIZSGÁLATA Függő változó sorrend skála! gen gen gen gen nem nem nem nem nem nem nem nem BIOMETRIA_NEMPARAMÉTERES_1 8

Rangok (rangszámok) Sorba rendezzük a gyerekeket az átlageredmények szernt: 1. a legmagasabb, 1. a legalacsonyabb. Majd a sorrendben elfoglalt helyük alapján mnden egyes mntaelemnek adunk egy rangszámot. átlag 4.6 4.5 4.4 4.3 4. 4.1 4.0 3.9 3.8 3.7 3.6 3.5 rang 1 3 4 5 6 7 8 9 10 11 1 járt-e nem gen nem nem gen gen nem nem gen nem nem nem Rang(szám): az adat sorszáma a nagyság szernt sorbarendezett mntában BIOMETRIA_NEMPARAMÉTERES_1 9

Nullhpotézs - egyoldal ellenhpotézs H 0 : a 4 óvodát járt nem teljesít jobban, rangszámuk véletlen mnta az 1-1 közül H 1 : a 4 óvodát járt jobban teljesít, rangszámak alacsonyabbak Próbastatsztka: az óvodát jártak W rang-összege W mn = 10 (1,, 3, 4) W max = 4 (9, 10, 11, 1) W aktuáls = (, 5, 6, 9) BIOMETRIA_NEMPARAMÉTERES_1 10

Ksmntás eljárás - flózófa Állíthatjuk-e bztonsággal, hogy az óvodások jobban teljesítenek (a valóságban ksebbek a rangszámak) és nem véletlen okozta a mntában tapasztalt sorrendet? Precíz módszer, de (még ks mntánál s) sok számolást gényel. 1 4 111109 134 495 lehetséges konfgurácók száma Ha a rangszámokat véletlenszerűen osztanánk k, mndegyk konfgurácó előfordulás valószínűsége: 1 495 BIOMETRIA_NEMPARAMÉTERES_1 11

Ksmntás eljárás számítás (egyoldal) W P (W=H0) P (W H0) 1,,3,4 10 1/495 1/495=0.00 1,,3,5 11 1/495 /495=0.004 1,,3,6 1 /495 4/495=0.008 1,,4,5 1,,3,7 13 3/495 7/495=0.014 1,,4,6 1,3,4,5 1,,3,8 14 5/495 1/495=0.04 1,,4,7 1,,5,6,3,4,5 1,3,4,6 1,,3,9 15 6/495 18/495=0.036 1,,4,8 1,,5,7 1,3,5,6 1,3,4,7,3,4,6 1 4 111109 134 495 15 H 0 0. 036 P W 16 H 0 0. 057 P W Aktuálsan az óvodát jártak rangszáma:, 5, 6, 9 W= Döntés: H 0 -t elfogadjuk, az óvodások nem jobbak BIOMETRIA_NEMPARAMÉTERES_1 1

Nullhpotézs - kétoldal ellenhpotézs H 0 : az óvodát jártak és nem jártak egyformán teljesítenek rangszámok véletlenszerűen osztódnak k H 1 : az óvodát jártak és nem jártak különbözően teljesítenek (akár jobban, akár rosszabbul) Mndkét oldalra (ks és nagy rangszám összeg) megnézzük 0.05 határral. BIOMETRIA_NEMPARAMÉTERES_1 13

Ksmntás eljárás számítás (kétoldal) W P (W= ) P (W ) 1,11,10,9 4 1/495 1/495=0.00 1,11,10,8 41 1/495 /495=0.004 1,11,10,7 40 /495 4/495=0.008 1,11,9,8 1,11,10,6 39 3/495 7/495=0.014 1,11,9,7 1,10,9,8 1,11,10,5 38 5/495 1/495=0.04 1,11,9,6 1,11,8,7 1,10,9,7 11,10,9,8 1,11,10,4 37 6/495 18/495=0.036 1,11,9,5 1,11,8,6 1,10,9,6 1,10,8,7 11,10,9,7 H 0 -t elfogadjuk, ha 14 < W < 38 BIOMETRIA_NEMPARAMÉTERES_1 14

Közelítés normáls eloszlással (nagymntás eljárás) z W E( W ) Var( W ) n1 ( n1 n E( W H0) 1) 4(4 8 1) E( W H0) 6 Var n ( n n 1 1) n 1 1 ( W H0) 4(4 8 1) 8 Var( W H0) 34.67 1 n1 N 1 W 6 z 0 z0 0. 6794 n1n N 1 34.67 1 BIOMETRIA_NEMPARAMÉTERES_1 15

Nagymntás eljárás (folytatás): z 6 0 p 34.67 P 0.6794 H 0 - H 1 hpotézspárra (egyoldal): z 0.6794 0. 48 H 0 - H 1 hpotézspárra (kétoldal): 0.6794 z 0.6794 * 0.48 0. 496 p 1 P Döntés mndkét esetben: H 0 -t elfogadjuk Mann-Whtney U Test (Ovoda n Workbook1) By varable jarte Marked tests are sgnfcant at p <,05000 Rank Sum Rank Sum U Z p-value varable n rang,00000 56,00000 1,00000-0,679366 0,496906 BIOMETRIA_NEMPARAMÉTERES_1 16

Nagymntás eljárás alkalmazhatóság feltétele: 1 N 1 p N N 1 Az aktuáls példában: N=1 1 1 1 p 1 1 1 0.077 0.495 0.93 BIOMETRIA_NEMPARAMÉTERES_1 17

Folytonosság korrekcó (Contnuty correcton) 0.3 0. x=b=7 P(x = 7) helyett P(6.5 < x 7.5) 0.1 0.0 0 1 3 4 5 6 7 8 9 10 P(x < 7) helyett P(x 7 0.5 = 6.5) P(x 7) helyett P(x 7 + 0.5 = 7.5) 0.3 0. x < b 7 0.3 0. x b 7 0.1 0.1 0.0-0 4 6 8 10 1 0.0 0 1 3 4 5 6 7 8 9 10 BIOMETRIA_NEMPARAMÉTERES_1 18

Folytonosság korrekcó alkalmazása az 1. példára egyoldal p P z z 0 0.3 0. 0.1 z 6 0.5 34.67 0 0.5944 p = P(z -0.5944) = 0.766 0.0 0 1 3 4 5 6 7 8 9 10 emlék: korrekcó nélkül p P z 0.6794 0. 48 A folytonosság korrekcó konzervatívabbá tesz a becslést! kétoldal p = 0.766* = 0.553 Mann-Whtney U Test (w/ contnuty correcton) (Ovoda n Ovoda) By varable jarte Marked tests are sgnfcant at p <,05000 Rank Sum Rank Sum U Z p-value varable n rang,00000 56,00000 1,00000-0,594445 0,5515 BIOMETRIA_NEMPARAMÉTERES_1 19

. példa Kapcsolt rangok (tes) (J. Krauth: Dstrbuton-free statstcs, An applcaton-orented approach, Elsever, 1988, p. 50) Pszchátra betegeket lítum-készítménnyel való kezelésének hatásosságát vzsgálták. A függő változó a pácensek önértékelése a depresszós skálán (VAS: Vsual Analogue Score, nagy érték súlyosabb depresszót jelent). Kapcsolt rang: azonos értékek esetén a mndegyk érték a rájuk jutó rangok átlagát kapja kezelt kontroll VAS rang VAS rang 7 1 10.5 10.5 15 6 11 4 1 5 BIOMETRIA_NEMPARAMÉTERES_1 0

Ksmntás eljárás Adatok sorba rendezése és rangok kosztása: csoport T T C T C C VAS 7 10 10 11 1 15 rang 1.5.5 4 5 6 H 0 : a kezeltek eredménye nem jobbak a nem kezeltekénél (a rangszám csak a véletlentől függ) H 1 : a kezeltek eredménye jobbak (alacsonyabb rangszámok) A lehetséges konfgurácók száma: 6 3 Ha a rangszámokat véletlenszerűen osztanánk k, mndegyk konfgurácó előfordulás valószínűsége: 0 1 0 = 0.05 BIOMETRIA_NEMPARAMÉTERES_1 1

Ksmntás eljárás (folytatás): 1.5 4.5 6 5 W 1 1 (T) 1 (T) 1 (T) (C) (C) (C) 7.5 1 1 1 6 3 1 1 1 9.5 4 1 1 1 8.5 5 1 1 1 7.5 6 1 1 1 11 7 1 1 1 10 8 1 1 1 9.5 9 1 1 1 8.5 10 1 1 1 1 11 1 1 1 9 1 1 1 1 1.5 13 1 1 1 11.5 14 1 1 1 11 15 1 1 1 10 16 1 1 1 13.5 17 1 1 1 1.5 18 1 1 1 11.5 19 1 1 1 15 0 1 1 1 13.5 p mntabel eset mntabel vagy ugyanolyan vagy jobb (a véletlen műveként): 3 0 α = 0.05 Döntés? 0.15 BIOMETRIA_NEMPARAMÉTERES_1

Nagymntás eljárás: z W E( W ) Var( W ) E WหH 0 = n 1 n 1 + n + 1 = 3 7 = 10.5 Kapcsolt rangok esetén módosított képlet a varancára: Var WหH 0 = n 1n N s R = 3 3 3.4 = 5.1 6 തR = N+1 =3.5 s R = σ k=1 N R k N തR N 1 = 1 5 1 +.5 +.5 + 4 + 5 + 6 6 3.5 = 3.4 z 0 = 7.5 10.5 5.1 = 1.38 z krt = 1.64 Döntés? α = 0.05 BIOMETRIA_NEMPARAMÉTERES_1 3

Statstcs > Nonparametrcs > Comparng two ndependent samples (groupes) > Mann-Whtney U test Mann-Whtney U Test (Ltum n Workbook) By varable treate Marked tests are sgnfcant at p <,05000 Rank Sum Rank Sum U Z p-value Z p-value Vald N Vald N *1sded varable T C adjusted T C exact p Rang 7,500000 13,50000 1,500000-1,30931 0,190431-1,384 0,184040 3 3 0,00000 eredet képlettel számolva Var WหH 0 = n 1 n 1 + n n z 0 = 7.5 10.5 5.5 = 1.309 = 3 7 3 1 = 5.5 adjusted = adjusted for tes azaz kapcsolt rangokkal számolt BIOMETRIA_NEMPARAMÉTERES_1 4

Csak a rangok számítanak, az adatok közt távolságok nem! 1 3 4 5 6 1 treate VAS 3 rang0 4 Vasm1 5 rang1 6 Vasm 7 rang 8 Vasm3 9 rang3 T 7 1 9 1 1 1 9 1 T 10.5 10.5 10 T 11 4 11 4 3 3 11 3 C 10.5 10.5 1 4 1 4 C 15 6 15 6 13 5 13 5 C 1 5 1 5 14 6 14 6 varable VAS vasm1 vasm vasm3 Mann-Whtney U Test (ltum) By varable treate Marked tests are sgnfcant at p <.05000 Rank Sum Rank Sum U Z p-level Z p-level Vald N Vald N *1sded T C adjusted T C exact p 7.500000 13.50000 1.500000-1.30931 0.190431-1.384 0.184040 3 3 0.00000 7.500000 13.50000 1.500000-1.30931 0.190431-1.384 0.184040 3 3 0.00000 6.000000 15.00000 0.000000-1.96396 0.049535-1.96396 0.049535 3 3 0.100000 6.000000 15.00000 0.000000-1.96396 0.049535-1.96396 0.049535 3 3 0.100000 BIOMETRIA_NEMPARAMÉTERES_1 5

3. példa R. Hoerl, R. Snee: Statstcal thnkng, Duxbury, 00 nyomán Vevő elégedettség összehasonlítása szállodában 150-150 kérdőív alapján. 5 4 3 1 Hotel1 30 66 30 13 11 Hotel 50 7 1 4 3 rang 60.5 151.5 57 3 7.5 13+4=17 fő 15 31 sorszám kapcsolt rang: 15 + 31 = 3 legrosszabb mnősítést adtak: 11+3=14 fő 1 14 sorszám kapcsolt rang: 1 + 14 = 7.5 BIOMETRIA_NEMPARAMÉTERES_1 6

1 3 4 5 6 7 8 9 10 1 score 3 number Hotel 5 30 Hotel1 4 66 Hotel1 3 30 Hotel1 13 Hotel1 1 11 Hotel1 5 50 Hotel 4 7 Hotel 3 1 Hotel 4 Hotel 1 3 Hotel Mann-Whtney U Test (Hotel n Workbook4) By varable Hotel Marked tests are sgnfcant at p <,05000 Weght varable: number Rank Sum Rank Sum U Z p-value Z p-value Vald N Vald N varable Hotel1 Hotel adjusted Hotel1 Hotel score 19905,50 544,50 8580,500-3,5534 0,000380-3,79116 0,000150 150 150 BIOMETRIA_NEMPARAMÉTERES_1 7

Wlcoxon-Mann-Whtney próba feltétele 1. A két mnta véletlen mnta a két sokaságból. A két mnta független 3. Legalább sorrend skálán mért változókról van szó 4. A két mnta mögött álló két sokaság eloszlása azonos alakú, vagys amennyben a két eloszlásfüggvény különböző, a különbség helyzet BIOMETRIA_NEMPARAMÉTERES_1 8

A 4. feltételhez értelmezéséhez : H 0 : F G Px y Px y H 1 : F G Px y Px y azaz x többnyre ksebb y-nál F() x G() y x y Custom Text BIOMETRIA_NEMPARAMÉTERES_1 9

A hpotézsek természete: Erre tudunk válaszoln H 0 : F G Ezt szeretnénk vszont tudn : E x Ey H 1 : F G H 0 H 1 : E x E y csak akkor ha: a két mnta mögött álló két sokaság eloszlása azonos alakú, vagys amennyben a két eloszlásfüggvény különböző, a különbség helyzet BIOMETRIA_NEMPARAMÉTERES_1 30

Ellenpélda: nem azonos alakú eloszlások, bár a várható értékük megegyezk 0.4 0. x~χ ν=3 0.0 0.18 0.16 x y y~6 χ ν=3 0.14 0.1 E x Ey 3 0.10 0.08 0.06 0.04 0.0 0.00-5 0 5 10 15 0 5 P de x y Px y Elutasítjuk H 0 -t, de nem azt, am érdekel mnket! BIOMETRIA_NEMPARAMÉTERES_1 31

Összehasonlítás egy előírt értékkel: Wlcoxon előjeles rang próbája (sgned rank test) 4. Példa az egymntás t próba megfelelője QS-9000, Measurement systems analyss, Reference manual, 3 rd ed. 00, p. 87) Egy munka-etalon méretét nagyon pontos eszközzel meghatározták (x ref =6.00), majd ezt a munka-etalont 15-ször megmérték a mnősítendő mérőeszközzel. Vzsgáljuk meg, hogy torzít-e a mérőrendszer! H 0 : e 0 μ 0 = x ref = 6.0 (standard) azaz a medán várható értéke egy meghatározott érték BIOMETRIA_NEMPARAMÉTERES_1 3

Számolás elve: d x R R 0 kszámítjuk referencához képest különbségeket rangsoroljuk a nem-nulla különbségek abszolút értéket előjeles rangot képzünk Próbastatsztka nagy mntára: W E( W ) z Var( W ) W R z 0 R R Próbastatsztka ks mntára W d 1 R 0 BIOMETRIA_NEMPARAMÉTERES_1 33

Nagymntás eljárás előjeles rangszám x d x xref R ha x x 0 ref R R 1 5.8-0. 6.5-6.5 4.5 5.7-0.3 8.5-8.5 7.5 3 5.9-0.1 3-3 9 4 5.9-0.1 3-3 9 5 6.0 0.0 6 6.1 0.1 3 3 9 7 6.0 0.0 8 6.1 0.1 3 3 9 9 6.4 0.4 10.5 10.5 110.5 10 6.3 0.3 8.5 8.5 7.5 11 6.0 0.0 1 6.1 0.1 3 3 9 13 6. 0. 6.5 6.5 4.5 14 5.6-0.4 10.5-10.5 110.5 15 6.0 0.0 z 0 = R R BIOMETRIA_NEMPARAMÉTERES_1 34 z 0 3 494.5 = 0.135

Statstcs > Nonparametrcs > Comparng two dependent samples (varables) > Wlcoxon matched pars test 1 3 4 5 6 7 8 9 10 11 1 13 14 15 Sheet1 1 x ref 5,8 6 5,7 6 5,9 6 5,9 6 6 6 6,1 6 6 6 6,1 6 6,4 6 6,3 6 6 6 6,1 6 6, 6 5,6 6 6 6 Ksmntás eljárással számol W = W = εd <0 εd >0 R = 31.5 R = 34.5 közül a ksebb Wlcoxon Matched Pars Test (gagebas n Workbook1) Marked tests are sgnfcant at p <,05000 Vald T Z p-value Par of Varables N x & ref 11 31,50000 0,133366 0,893904 BIOMETRIA_NEMPARAMÉTERES_1 35

Párokon belül összehasonlítás: Wlcoxon előjeles rang próbája (sgned rank test) 5. példa a páros t próba megfelelője G. E. P. Box, W. G. Hunter, J. S. Hunter: Statstcs for expermenters, J. Wley, 1978, p. 97 Cpőtalp anyagának kopásállóságát vzsgálták. 10 fút választottak k véletlenszerűen, majd mndegyküknél ksorsolták, hogy melyk lábukon melyk cpőtalp-anyagból készült cpőt vseljék. Van-e különbség a cpőtalpak átlagos kopásában? BIOMETRIA_NEMPARAMÉTERES_1 36

boy materal A materal B B A dfference d R R előjeles rang 1 13. (L) 14.0(R) 0.8 9 9 8.(L) 8.8(R) 0.6 8 8 3 10.9(R) 11.(L) 0.3 4 4 4 14.3(L) 14.(R) -0.1 1-1 5 10.7(R) 11.8(L) 1.1 10 10 6 6.6(L) 6.4(R) -0. - 7 9.5(L) 9.8(R) 0.3 4 4 8 10.8(L) 11.3(R) 0.5 6.5 6.5 9 8.8(R) 9.3(L) 0.5 6.5 6.5 10 13.3(L) 13.6(R) 0.3 4 4 Nagymntás eljárás: R 49 z average dfference 0.41 0.505 R 38.5 BIOMETRIA_NEMPARAMÉTERES_1 37 A különbségek abszolút értékenek rangszáma!

Ksmntás eljárás: W = εd <0 Wlcoxon előjeles rang próba (nemparaméteres módszer) Wlcoxon Matched Pars Test (fucpo n Workbook) Marked tests are sgnfcant at p <,05000 Vald T Z p-value Par of Varables N TALPA & TALPB 10 3,000000,49771 0,01516 R = 3 Páros t-próba (feltételez a különbségek normáls eloszlását) Varable TALPA TALPB T-test for Dependent Samples (fucpo n Workbook) Marked dfferences are sgnfcant at p <,05000 Mean Std.Dv. N Dff. Std.Dv. t df p Dff. 10,63000,45136 11,04000,518465 10-0,410000 0,387155-3,34888 9 0,008539 BIOMETRIA_NEMPARAMÉTERES_1 38

Wlcoxon előjeles rang próba alkalmazás feltétele 1. Legalább ntervallum skálán mérhető adatok. Szmmetrkus eloszlás Megjegyzés: Ha párosított mntákra használjuk, akkor a különbségekre kell a fent feltételeknek teljesüln. BIOMETRIA_NEMPARAMÉTERES_1 39

6. példa Több független csoport összehasonlítása: Kruskal-Walls próba az egy faktor szernt ANOVA megfelelője, a Wlcoxon-Mann-Whtney próba általánosítása Háromféle gyógyszerrel (A, B és C) kezelt csoport vzeletében található blrubn mennységét kell összehasonlítanunk. Negatív 0 Kcs s Mérsékelt m Nagy l Gyógyszer A B C 0 s 0 Blrubn 0 0 m mennysége s m s 0 s m s 0 s BIOMETRIA_NEMPARAMÉTERES_1 40

Kruskal-Walls próba Nullhpotézs: a mnták (csoportok) mögött álló sokaságok eloszlása azonos A nullhpotézsnek tehát ellentmond, ha különbözk: - akár az eloszlások várható értéke (medánja), - akár varancája, - vagy egyéb alakparamétere (ferdeség, lapultság). Számítás elve: Az összehasonlításhoz a rangokat használja. A rangokat az összes mntát egyesítve számolja k. A próbastatsztka (H) a mntánként rangszámösszegekből (R ) számítódk. BIOMETRIA_NEMPARAMÉTERES_1 41

R A ranga B rangb C rangc 0 3.5 s 9.5 0 3.5 0 3.5 0 3.5 m 14 s 9.5 m 14 s 9.5 0 3.5 s 9.5 m 14 s 9.5 0 3.5 s 9.5 összeg 9.5 40 50.5 Próbastatsztka: 1 H = N(N + 1) r R =1 p 3 N + 1 = 1 15 16 9.5 5 + 40 5 + 50.5 5 3 16 =,05 kapcsolt rangok esetén: H corr = H 1 σ t 3 t N 3 N =.05 1 63 6 + 6 3 6 + 3 3 3 15 3 15 eloszlású, r 1 szabadság fokkal =.537 BIOMETRIA_NEMPARAMÉTERES_1 4

Statstcs > Nonparametrcs > Comparng multple ndependent samples (groups) > Summary: Kruskal-Walls ANOVA & Medan test Depend.: y A B C Kruskal-Walls ANOVA by Ranks; y (blrubn) Independent (groupng) varable: Gyógyszer Kruskal-Walls test: H (, N= 15) =,540741 p =,807 Code Vald Sum of Mean N Ranks Rank 104 5 9,50000 5,90000 105 5 40,00000 8,00000 106 5 50,50000 10,10000 Döntés? BIOMETRIA_NEMPARAMÉTERES_1 43

Kruskal-Walls próba alkalmazás feltétele 1. A mnták véletlen mnták a megfelelő sokaságból.. A mnták függetlenek. 3. A függő változó legalább sorrend skálán mérhető. 4. A mnták (az egyes faktorszntekhez tartozó csoportok) azonos alakú sokaságokból származnak. BIOMETRIA_NEMPARAMÉTERES_1 44

7. példa Véletlen blokk elrendezés: Fredman ANOVA G. E. P. Box, W. G. Hunter, J. S. Hunter: Statstcs for expermenters, J. Wley, 1978, p. 09 Penclln gyártása: 4 technológát akarnak összehasonlítan, a kukorcalekvár-adagok különböznek. technológa kuk. lekvár 1 3 4 y j 1 89 88 97 94 9 84 77 9 79 83 3 81 87 87 85 85 4 87 9 89 84 88 5 79 81 80 88 8 y 84 85 89 86 y 86 blokk BIOMETRIA_NEMPARAMÉTERES_1 45

Fredman ANOVA Számítás elve: Az összehasonlításhoz a rangokat használja. A rangokat blokkonként (tt: kukorcalekvár) osztja k, majd a rangokat a faktorszntenként (tt technológa) összegz. A próbastatsztka (képletet nem tanuljuk) a rangszámösszegekből számítódk. Nullhpotézs: a blokkon belül (tt: egy adott kukorcalekvár) a rangszámok kosztása véletlen, azaz a rögzített faktornak nncs hatása Ellenhpotézs: legalább egy faktorsznten (tt: technológa) nagyobb értékek várhatók, mnt egy másk faktorsznten BIOMETRIA_NEMPARAMÉTERES_1 46

Statstcs > Nonparametrcs > Comparng multple dependent samples (varables) > Summary: Fredman ANOVA Varable technológa_1 technológa_ technológa_3 technológa_4 Fredman ANOVA and Kendall Coeff. of Concordance (PENICILL n Penclln_Fredman) ANOVA Ch Sqr. (N = 5, df = 3) = 3,489796 p =,309 Coeff. of Concordance =,365 Aver. rank r =,0408 Average Sum of Mean Std.Dev. Rank Ranks 1,800000 9,00000 84,00000 4,13106,500000 1,50000 85,00000 5,958188 3,300000 16,50000 89,00000 6,84903,400000 1,00000 86,00000 5,5681 1. kukorcalekvár. kukorcalekvár 3. kukorcalekvár 4. kukorcalekvár 5. kukorcalekvár 1 technológa_ 1 technológa _ 3 technológa _3 4 technológa _4. 89 1. 88 4. 97 3. 94 3. 84 77 9 79 1. 81 87 87 85. 87 9 89 84 1. 79 81 80 88 szumma: 9 rangszámok BIOMETRIA_NEMPARAMÉTERES_1 47

Fredman ANOVA alkalmazás feltétele 1. A mérés eredmények blokkokon belül és blokkok között s függetlenek.. A függő változó legalább sorrend skálán mérhető. BIOMETRIA_NEMPARAMÉTERES_1 48

Előjel-próba (sgn test): egy mntára vagy párokon belül összehasonlításra 5. példa adata MEDIÁNOK VIZSGÁLATA Cpőtalp anyagának kopásállóságát vzsgálták. 10 fú, akk egyk lábukon A cpőtalp-anyagból készült cpőt, másk lábukon pedg B cpőtalp-anyagból készült cpőt vseltek. Van-e különbség a cpőtalpak átlagos kopásában? Nullhpotézs: a különbség medánja nulla Máshogy fogalmazva: ugyanolyan valószínűséggel kapunk a különbségre poztív ll. negatív értéket BIOMETRIA_NEMPARAMÉTERES_1 49

H 0 : p + = 0.5 Bnomáls eloszlás: boy materal A materal B A-B előjel 1 13.(L) 14.0(R) -0.8-8.(L) 8.8(R) -0.6-3 10.9(R) 11.(L) -0.3-4 14.3(L) 14.(R) 0.1 + 5 10.7(R) 11.8(L) -1.1-6 6.6(L) 6.4(R) 0. + 7 9.5(L) 9.8(R) -0.3-8 10.8(L) 11.3(R) -0.5-9 8.8(R) 9.3(L) -0.5-10 13.3(L) 13.6(R) -0.3 - Mntában: + előjel: db - előjel: 8 db Véletlen műveként: P k = หH 0 = 10 0.5 0.5 8 = 0.0439 P k หH 0 = 10 0 + 10 1 + 10 0.5 0.5 8 = 0.0546 0.0546 = 0.109 BIOMETRIA_NEMPARAMÉTERES_1 50

Páros t-próba, Wlcoxon-féle előjeles rang-próba és az előjel próba összehasonlítása a fúcpő példára (38. és 50. da alapján) próba p (kétoldal esetre) előjel-próba 0.109 Wlcoxon-próba 0.015 páros t-próba 0.0085 Melyk próba erősebb? M lehet az oka? (Segítség: mlyen nformácót vesz fgyelembe a módszer?) BIOMETRIA_NEMPARAMÉTERES_1 51

próba p (kétoldal esetre) előjel-próba 0.109 Wlcoxon-próba 0.015 páros t-próba 0.0085 15 13 11 wear 9 7 5 0 1 3 4 5 6 7 8 9 10 11 boys materal A materal B BIOMETRIA_NEMPARAMÉTERES_1 5

Előjel-próba bnomáls eloszlás közelítése normáls eloszlással (fúcpő példán) z = ξ E ξ ) Var(ξ ahol ξ normáls eloszlású valószínűség változó Most: ξ = k 0 a mntában talált selejtes darabok száma z 0.5 10 0.5 0 10 0.5 1.58 1.58 1 0.9495 0. 057 F p 0.057 0. 114 Sgn Test (fucpo n Fucpo) Marked tests are sgnfcant at p <,05000 No. of Percent Z p-value Par of Varables Non-tes v < V BIOMETRIA_NEMPARAMÉTERES_1 53 TALPA & TALPB 10 80,00000 1,581139 0,113846

Előjel-próba 8. példa: Arbuthnot (1710) a legelső lyen jellegű próba ( Argument for Dvne Provdence ) 8 év születés adatat (London) vzsgálva azt találta, hogy mnd a 8 évben több fú született, mnt lány. Hhető-e ennek ellenére, hogy ugyanolyan valószínűséggel születk fú, mnt lány? H 0 : p fú =0.5 P 8 8 0 8 5 k 8 p 0.5 0.5 0.5 0.5.06810 p 8 BIOMETRIA_NEMPARAMÉTERES_1 54

Mood-féle medán-próba: több független csoport összehasonlítása 6. példa adata az egy faktor szernt ANOVA megfelelője Háromféle gyógyszerrel (A, B és C) kezelt csoport vzeletében található blrubn mennységét kell összehasonlítanunk. Negatív 0 Kcs s Mérsékelt m Nagy l medán: s Gyógyszer A B C 0 s 0 Blrubn 0 0 m mennysége s m s 0 s m s 0 s Nullhpotézs: a csoportok medánja mnd megegyeznek BIOMETRIA_NEMPARAMÉTERES_1 55

Számítás elve: Ha a három faktorsznt között nem lenne különbség (a faktornak nem lenne hatása) számított érték : a 15 adatból összesen 1-szer fordul elő a medánnal egyenlő vagy annál ksebb érték (azaz 0 vagy s ), egyenlően szétosztva 4 jut egy csoportra Gyógyszer A B C 0 s 0 Blrubn 0 0 m mennysége s m s 0 s m s 0 s medán: s BIOMETRIA_NEMPARAMÉTERES_1 56

Számítás elve: 0 1 j1 r c n j n n ν = (r 1) (c 1) Példában: χ 0 = 1 4 + 0 + 1 4 + 1 + 0 + 1 =.5 j j n j n j mért (mntabel) érték számított érték r faktorszntek száma c = (medán alatt és felett) ν = 1 = BIOMETRIA_NEMPARAMÉTERES_1 57

Statstcs > Nonparametrcs > Comparng multple ndependent samples (groups) > Summary: Kruskal-Walls ANOVA & Medan test Medan Test, Overall Medan = 1,00000; y (blrubn) Independent (groupng) varable: Gyógyszer Dependent: Ch-Square =,500000 df = p =,865 y A B C Total <= Medan: observed expected obs.-exp. > Medan: observed expected obs.-exp. Total: observed 5,00000 4,000000 3,00000 1,00000 4,00000 4,000000 4,00000 1,00000 0,000000-1,00000 0,00000 1,000000,00000 3,00000 1,00000 1,000000 1,00000-1,00000 0,000000 1,00000 5,00000 5,000000 5,00000 15,00000 BIOMETRIA_NEMPARAMÉTERES_1 58

Medán próbák alkalmazás feltétele 1. A mnták véletlen mnták a megfelelő sokaságból.. A mnták függetlenek. 3. A függő változó legalább sorrend skálán mérhető. Legenyhébb alkalmazhatóság feltételek Leggyengébb próbák BIOMETRIA_NEMPARAMÉTERES_1 59

Rang-korrelácó Emlékeztetőül a közönséges korrelácó : x és y (kétváltozós mnta, két valószínűség változó) legalább ntervallum-skálán mérhető adatok lneárs kapcsolat szorosságát mér értéke -1 és 1 közé esk ha a két változó független, r=0; de fordítva nem gaz Pearson-féle korrelácós együttható: r y yx x y y x x BIOMETRIA_NEMPARAMÉTERES_1 60

x R x R y R y R x R x R y R y R legalább sorrend skálán mérhető adatok Rang-korrelácó N x R N y R N x R N y R 1 1 1 1 x x y y x x y y r BIOMETRIA_NEMPARAMÉTERES_1 61 Spearman-féle rang-korrelácós együttható (Pearson rangokra)

Rang-korrelácó 9. példa S. Segel: Nonparametrc statstcs for the behavoral scences, McGraw-Hll, 1956, p. 04 A vzsgált személyek autortárus hajlamát és a társadalm belleszkedésre való törekvésük mértékét pontozták. A kérdés az, hogy van-e a két jellemző között összefüggés. BIOMETRIA_NEMPARAMÉTERES_1 6

Statstcs > Nonparametrcs > Correlatons (Spearman, Kendall tau ) 1 3 4 5 6 7 8 9 10 11 1 Correlaton between autortaransm and socal status strvng 1 AUTHORIT STRIVING 8 4 98 46 87 39 40 37 116 65 113 88 111 86 83 56 85 6 16 9 Vald 106 54 Par of Varables N 117 81 Spearman Rank Order Correlatons (Strvng) MD parwse deleted Marked correlatons are sgnfcant at p <.05000 Spearman t(n-) p-value R AUTHORIT & STRIVING 1 0.81818 4.500000 0.001143 Spearman Rank Order Correlatons (Strvng n Workbook1) MD parwse deleted Marked correlatons are sgnfcant at p <,05000 Varable AUTHORIT STRIVING AUTHORIT 1,000000 0,81818 BIOMETRIA_NEMPARAMÉTERES_1 63 STRIVING 0,81818 1,000000