Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Hasonló dokumentumok
Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

NEMPARAMÉTERES PRÓBÁK

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

4 2 lapultsági együttható =

Hipotézis vizsgálatok

Nemparaméteres eljárások

Statisztika feladatok

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Regresszió. Fő cél: jóslás Történhet:

Biostatisztika Összefoglalás

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

ADATREDUKCIÓ I. Középértékek

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Biostatisztika Összefoglalás

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Páros binomiális próbák

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Korreláció és lineáris regresszió

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

Matematikai statisztika

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

ADATREDUKCIÓ I. Középértékek

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Eloszlás-független módszerek 13. elıadás ( lecke)

Adatelemzés és adatbányászat MSc

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A sokaság/minta eloszlásának jellemzése

Adatok statisztikai értékelésének főbb lehetőségei

Lineáris regresszió. Statisztika I., 4. alkalom

[Biomatematika 2] Orvosi biometria

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

RANGSOROLÁSON ALAPULÓ NEM-PARAMÉTERES PRÓBÁK

Varianciaanalízis. Egytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varianciaanalízis ANOVA)

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Biostatisztika VIII. Mátyus László. 19 October

Biomatematika 13. Varianciaanaĺızis (ANOVA)

A m becslése. A s becslése. A (tapasztalati) szórás. n m. A minta és a populáció kapcsolata. x i átlag

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

METROLÓGIA ÉS HIBASZÁMíTÁS

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Minősítéses mérőrendszerek képességvizsgálata

Sztochasztikus kapcsolatok

Kísérlettervezési alapfogalmak:

Normális eloszlás paramétereire vonatkozó próbák

Kettőnél több csoport vizsgálata. Makara B. Gábor

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Véletlenszám generátorok. 6. előadás

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Hipotézis vizsgálatok

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Többváltozós lineáris regressziós modell feltételeinek

Bevezetés a hipotézisvizsgálatokba

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Hipotézisvizsgálat R-ben

Max-stabilis folyamatok. 6. előadás, március 29. Smith (1990) konstrukciója. Példák

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biostatisztika e-book Dr. Dinya Elek

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Az entrópia statisztikus értelmezése

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

STATISZTIKA III. Oktatási segédlet

Statisztika elméleti összefoglaló

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

Átírás:

Nemparaméteres módszerek Krsztna Boda PhD SZTE ÁOK Orvos Fzka és Orvos Informatka Intézet

Paraméteres próbák Paraméter: egy szám, amely a populácó eloszlását jellemz (és általában meghatározza). A normáls eloszlás paramétere :, A bnomáls eloszlás paramétere : n, p A Posson eloszlás paramétere : Krsztna Boda 2

Normáls eloszlások N(, 2 ) N(0,1) N(1,1) Probablty Densty Functon Probablty Dstrbuton Functon y =normal(x;0;1) p=normal(x;0;1) 0.6 1.0 Probablty Densty Functon y =normal(x;1;1) 0.6 1.0 Probablty Dstrbut p=normal(x 0.5 0.8 0.5 0.8 0.4 0.6 0.4 0.3 0.6 0.4 0.3 0.2 0.4 0.2 0.1 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Probablty Densty Functon 0.0 Probablty Dstrbuton -3 Functon -2-1 0 1 2 3 0.0-3 -2-1 0 y =normal(x;0;2) p=normal(x;0;2) 0.6 1.0 0.5 0.8 0.4 0.3 0.6 0.4, : parameters 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 N(0,2 2 ) Krsztna Boda 3

Bnomáls eloszlások 1. A kísérletünk egy olyan eseménnyel kapcsolatos, amelynek csak 2 kmenetele van (pl. skeres, skertelen) 2. A sker valószínűsége, p, konstans kísérletről kísérletre 3. Sok kísérletet végzünk, egymástól függetlenül M a valószínűsége, hogy n számú smétlés során k számú legyen a skeres? n P P X k k p k q n k k n k ( ), 0, 1,..., n k n! n n k!( n k)!,! 1 2... M(X)=np, D(X)=np(1-p)=npq Pl. Bzonyos populácóban egy bzonyos betegség előfordulása 30%. M a valószínűsége, hogy egy n=10 elemű mntában pontosan k=4 lyen beteg lesz? Krsztna Boda 4

Példa Pl. Bzonyos populácóban egy bzonyos betegség előfordulása 30%. M a valószínűsége, hogy egy n=10 elemű mntában pontosan k=4 lyen beteg lesz? 10 4 6 10! 4 P( X 4) 0.3 0.7 0.3 0.7 4 4!6! 2100.00810.117649 0.200121 6 Krsztna Boda 5

Number of Success Probablty dstrbuton Dstrbuton functon Probablty of "success" 0 0.028247525 0.028247525 0.3 1 0.121060821 0.149308346 2 0.233474441 0.382782786 3 0.266827932 0.649610718 4 0.200120949 0.849731667 5 0.102919345 0.952651013 6 0.036756909 0.989407922 7 0.009001692 0.998409614 8 0.001446701 0.999856314 9 0.000137781 0.999994095 10 5.9049E-06 1 Összesen 1 Probablty dstrbuton Dstrbuton functon 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 Bnomal dstrbuton n=10, p can be changfed, k=0,1,,10 Krsztna Boda 6

Posson eloszlás Véges dőszak, véges térrészben levő események, a mntában levő, adott tulajdonságú egyedek számának eloszlása Pl. a mkroszkóp látómezejében lévő vérsejtek száma A tér egy kválasztott részében a halak száma Adott darab süteményben a mazsolák száma A Posson eloszlás értelmezhező a bnomáls eloszlás határeseteként, ha n nagy és az np= állandó. A képletben az eloszlás várható értéke és és varancája s. k n k n k lm Pk lm ( ) n n k p q f k k! e Krsztna Boda 7

Példa. Egy bzonyos betegség esetén az újabb előfordulások száma havonta átlagosan 3. Feltéve, hogy az új megbetegedések száma Posson eloszlást követ, m a valószínűsége, hogy Senk se lesz beteg (0.0498) Pontosan 2 új megbetegedés lesz (0.224) Number of events Probablty Dstrbuton functon Average number of events 0 0.049787068 0.049787068 3 1 0.149361205 0.199148273 2 0.224041808 0.423190081 3 0.224041808 0.647231889 4 0.168031356 0.815263245 5 0.100818813 0.916082058 6 0.050409407 0.966491465 7 0.021604031 0.988095496 8 0.008101512 0.996197008 9 0.002700504 0.998897512 10 0.000810151 0.999707663 Total 0.999707663 Probablty Dstrbuton functon 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 10 1 Krsztna Boda 8 1 0.8 0.6 0.4 0.2 0

Paraméteres próbák az eloszlás típusát smertnek tételezve fel, az eloszlás egyes smeretlen paraméterere tett hpotézseket ellenőrzk. Példák: Egymntás t-próba: H 0 : =c, Két mntás t-próba: H 0 : 1 = 2, feltétele: 12 = 2 2 Krsztna Boda 9

Nemparaméteres próbák Nem tételezk fel a paraméter megsmerhetőségét, sőt gyakran még a létezését sem. Krsztna Boda 10

Statsztka próbával Normaltásvzsgálat H0: a mnta normáls eloszlású populácóból származk Szgnfkáns esetben (p<), elvetjük a normaltás nullhpotézsét Nemszgnfkáns esetben (p>), elfogadjuk a normaltás nullhpotézsét(!) > shapro.test(trees$heght) Shapro-Wlk normalty test A mnta normáls eloszlásból származk data: trees$heght W = 0.9655, p-value = 0.4034 A mnta nem normáls eloszlásból származk > shapro.test(trees$volume) Shapro-Wlk normalty test data: trees$volume W = 0.8876, p-value = 0.003579 Krsztna Boda t11

Normaltásvzsgálat (folyt.) QQ-plot. A Q-Q plot, vagy quantle-quantle plot, két kvantls összehasonlításából származó pontdagram. Ha mndkét kvantls ugyanabból az eloszlából származk (pl. normáls eloszlásból), a pontok egy egyenes körül látszanak elhelyzkedn. A mnta normáls eloszlásból származk A mnta nemnormáls eloszlásból származk Krsztna Boda 12

Specáls nemparaméteres próbák: rangsoroláson alapuló próbák Feltétele: a változók folytonos eloszlásból származnak Akkor alkalmazhatók, ha Az eloszlás nem normáls Az eloszlás alakja nem nylvánvaló Az adatokat ordnáls skálán mérjük (alacsony-normáls-magas, elégtelen-elégséges, közepes-jó-jeles) Statsztkusok: Frank Wlcoxon (1882-1965), H. Mann (1905-2000) and D.R Whtney (1915-2007) Krsztna Boda 13

Az adatok rangsorolása Az adatok értéke helyett csak azok nagyságrendjét használjuk. A rangsorolás menete: a legksebb az 1-es rangot kapja, majd mnden rákövetkező eggyel nagyobb rangszámot kap, a legnagyobb rangszáma n lesz. Tegyük fel, hogy a következő adatank vannak: 199, 126, 81, 68, 112, 112. Lépések. 1. Rendezzük őket nagyság szernt: 68, 81,112,112,126,199 2. Adjunk rangszámokat 1 -től n-g, folytassuk akkor s, ha maguk a számok egyenlők: 1, 2, 3, 4, 5, 6 3. Utólag korrgáljuk az egyenlő számokhoz tartozó rangszámokat, helyettesítsük az eredet rangszámokat az egyenlőkhöz tartozó rangszámok átlagával (ún. kapcsolt rangokat kapunk most a két 112-höz tartozó 3 és 4-ből lesz 3.5) 4. A kész rangsor kapcsolt rangszámokkal: 1, 2, 3.5, 3.5, 5, 6 Krsztna Boda 14

Rangsorolás Esetszám Rendezett adat Rang Kapcsolt rang 4 68 1 1 3 81 2 2 5 112 3 3.5 6 112 4 3.5 2 126 5 5 1 199 6 6 A rangszámok összege mndg A fent formulával ellenőrzhetjük a számításankat n 1 r n( n 1) 2 Krsztna Boda 15

Paraméteres és nemparaméteres próbák a kísérlet elrendezésnek megfelelően Paraméteres Egy mnta, átlag vzsgálata: egymntás t-próba Két összetartozó mnta, átlagok vzsgálata: páros t-próba Két független mnta, átlagok vzsgálata: kétmntás t-próba Több független mnta, átlagok vzsgálata: egyszempontos varancaanalízs, ANOVA Nemparaméteres Egy mnta, medán vzsgálata : Wlcoxon-féle előjeles rangpróba Két összetartozó mnta, medánok vzsgálata : Wlcoxonféle előjeles rangpróba Két független mnta, medánok vzsgálata, eltolás vzsgálata : Mann-Whtney U-próba Több független mnta, medánok vzsgálata, eltolás vzsgálata : Kruskal-Walls próba Krsztna Boda 16

Rangsoroláson alapuló eljárások összetartozó adatokra I. Előjelpróba Nullhpotézs: a mnták ugyanabból a populácóból származnak, a különbségek medánja=0 Feltétel: a különbség-mnta folytonos eloszlású populácóból származk Krsztna Boda 17

Az előjelpróba Példa: 13 hallgató olvasás sebességét mérték meg egy specáls kurzus végén és egy hónappal később. Poztív előjelek száma: 6 Negatív előjelek száma: 5 Azok az esetek, ahol nncs változás, kmaradnak Ha a nullhpotézs gaz, egyforma számú poztív és negatív előjelet várunk Hallgató Pontszám Pontszám a kurzus 1 hónap Különbség Előjel végén múlva 1 50 52-2 - 2 48 51-3 - 3 46 46 0 4 50 49 1 + 5 52 50 2 + 6 80 70 10 + 7 23 21 2 + 8 30 33-3 - 9 45 46-1 - 10 53 53 0 11 49 48 1 + 12 51 48 3 + 13 46 48-2 - Krsztna Boda 18

Az előjelpróba táblázata A táblázat adott elemszám és esetén tartalmazza az elfogadás tartományt, ekkor mndkét szám beleesk az ntervallumba Poztív előjelek száma: 6 Negatív előjelek száma: 5 n=11 és =0.05 esetén az elfogadás ntervallum 1-10. Mvel mnd az 5, mnd a 6 beleesk ebbe az ntervallumba, elfogadjuk a nullhpotézst és azt mondjuk, hogy az eltérés nem szgnfkáns 5%-os sznten Krsztna Boda 19

bnom.test(k,n), ahol k a poztív vagy a negatív különbségek száma, n a nem nulla előjelek száma R > bnom.test(6,11) Exact bnomal test data: 6 and 11 number of successes = 6, number of trals = 11, p-value = 1 alternatve hypothess: true probablty of success s not equal to 0.5 95 percent confdence nterval: 0.2337936 0.8325119 sample estmates: probablty of success 0.5454545 > bnom.test(5,11) Exact bnomal test data: 5 and 11 number of successes = 5, number of trals = 11, p-value = 1 alternatve hypothess: true probablty of success s not equal to 0.5 95 percent confdence nterval: 0.1674881 0.7662064 sample estmates: probablty of success 0.4545455 Krsztna Boda 20

Rangsoroláson alapuló eljárások összetartozó adatokra II. Wlcoxon féle előjeles rangpróba Nullhpotézs: a mnták ugyanabból a populácóból származnak, a különbségek medánja=0 Feltétel: a különbség-mnta folytonos és szmmetrkus eloszlású populácóból származk Krsztna Boda 21

Wlcoxon féle előjeles rangpróba Példa: 13 hallgató olvasás sebességét mérték meg egy specáls kurzus végén és egy hónappal később. A poztív előjelekhez tartozó rangszámösszeg: R + =2+5.5+11+5.5+2+9=35 A negítív előjelekhez tartozó rangszámösszeg: R - =5.5+9+9+2+5.5=31 Azok az esetek, ahol nncs változás, kmaradnak Ha a nullhpotézs gaz, a poztív és negatív előjelekhez tartozó rangszámösszeg hasonló. Hallgató Pontszám Pontszám kurzus 1 hónap Különbség Rangszám előjeltől végén múlva függetlenül 1 50 52-2 5.5 2 48 51-3 9 3 46 46 0 4 50 49 1 2 5 52 50 2 5.5 6 80 70 10 11 7 23 21 2 5.5 8 30 33-3 9 9 45 46-1 2 10 53 53 0 11 49 48 1 2 12 51 48 3 9 13 46 48-2 5.5 Krsztna Boda 22

Az előjeles rangszámpróba táblázata A táblázat adott elemszám és esetén tartalmazza az elfogadás tartományt A poztív előjelekhez tartozó rangszámösszeg: R + =35 A negatív előjelekhez tartozó rangszámösszeg : R - =31 n=11 és =0.05 esetén ez az nttervallum 10-56. Mvel mndkét rangszámösszeg beleesk ebbe az ntervallumba, elfogadjuk a nullhpotézst és azt mondjuk, hogy az eltérés nem szgnfkáns 5%-os sznten. Elvleg a táblázat csak akkor használható, ha nncsenek kapcsolt rangok! Krsztna Boda 23

Nagy elemszám esete A táblázatok csak ks elemszámokra tartalmazzák az elfogadás ntervallumokat. Nagy elemszám esetén kszámítható egy közelítően normáls eloszlást követő (z) statsztka. Számítógépes szoftverek általában ezt alkalmazzák z R n( n 1) / 4 ( n( n 1)(2n 1) / 24) ~ N(0,1) Folytonosság korrekcó: a próbastatsztka számlálóját 0.5-del csökkentjük (a statsztka dszkrét, de m mégs egy folytonos eloszláshoz vszonyítjuk. Az R alapfeltevés szernt folytonosság korrekcót számol, az SPSS nem. Krsztna Boda 24

R wlcox.test. By default (f exact s not specfed), an exact p-value s computed f the samples contan less than 50 fnte values and there are no tes. Otherwse, a normal approxmaton s used. a > wlcox.test(pre,post, pared=true,exact=false) #folytonosság korrekcóval Wlcoxon sgned rank test wth contnuty correcton data: pre and post V = 35, p-value = 0.893 alternatve hypothess: true locaton shft s not equal to 0 > wlcox.test(pre,post, pared=true,exact=false, correct=f) #folytonosság korrekcó nélkül Wlcoxon sgned rank test data: pre and post V = 35, p-value = 0.8576 alternatve hypothess: true locaton shft s not equal to 0 Krsztna Boda 25

SPSS eredmények Frequences VAR00002 - VAR00001 Negatv e Df ferences a Postve Dff erences b Tes c Total a. VAR00002 < VAR00001 b. VAR00002 > VAR00001 c. VAR00002 = VAR00001 N 6 5 2 13 Test Statstcs b VAR00002 - VAR00001 Exact Sg. (2-taled) 1.000 a a. Bnomal dstrbuton used. b. Sgn Test Ranks VAR00002 - VAR00001 Negatv e Ranks Postv e Ranks Tes Total a. VAR00002 < VAR00001 b. VAR00002 > VAR00001 c. VAR00002 = VAR00001 N Mean Rank Sum of Ranks 6 a 5.83 35.00 5 b 6.20 31.00 2 c 13 Test Statstcs b VAR00002 - VAR00001 Z -.179 a Asy mp. Sg. (2-taled).858 a. Based on postve ranks. b. Wlcoxon Sgned Ranks Test Krsztna Boda 26

Egy mnta esete A párosított adatokon bemutatott eljárások egy mnta esetén s lefuttathatók R-ben, lyenkor a nullhpotézs az, hogy a populácó medánja adott konstans Krsztna Boda 27

Két független csoport összehasonlítása: Mann-Whtney U próba Feltétele: a változók eloszlása folytonos, sűrűségfüggvények azonos alakúak (eltolással egymásba átvhetők) Nullhpotézs: a mnták ugyanazon populácóból származnak (az eltolás=0) Nem teknthető a t-próba nemparaméteres megfelelőjének, különösen akkor, ha a varancák különbözők! (Ekkor: közel normáls eloszlás esetén a Welch próba, vagy ennek hányában Brunner-Munzel próba vagy bootstrap Mann-Whtney próba alkalmazható (nem tárgyaljuk)) Krsztna Boda 28

Mntapélda (hpotetkus adatok) Testsúlyváltozásokat hasonlítunk össze egy specáls détát követő csoportban és a kontrollcsoportban. Nullhpotézs: a déta nem hatásos, mndkét csoport ugyanabból a populácóból származó véletlen mnta. A két csoport adatat egyesítve sorba rendezzük, majd csoportonként képezzük a rangszámösszegeket. Ha gaz a nullhpotézs, a két rangszámösszeg hasonló lesz. Krsztna Boda 29

Patent Change n body weght (kg) Group Rank Rank corrected for tes 1. -1 Det 3 3 2. 5 Det 16 16.5 3. 3 Det 12 13 4. 10 Det 21 21 5. 6 Det 18 19 6. 4 Det 15 15 7. 0 Det 4 5.5 8. 1 Det 8 9 9. 6 Det 19 19 10. 6 Det 20 19 Sum of ranks, R 1 140 11. 2 Control 11 11 12. 0 Control 5 5.5 13. 1 Control 9 9 14. 0 Control 6 5.5 15. 3 Control 13 13 16. 1 Control 10 9 17. 5 Control 17 16.5 18. 0 Control 7 5.5 19-2 Control 1 1.5 20. -2 Control 2 1.5 21. 3 Control 14 13 Sum of ranks R 2 91 Krsztna Boda 30

A Mann-Whtney U próba táblázata (részlet) Krsztna Boda 31

Krsztna Boda 32

Döntés táblázat alapján Rangszámösszeg az első csoportban (n=10): R 1 =140 Rangszámösszeg a másodk csoportban(n=11): R 2 =91 T=140. n 1 =10 és n 2 =11 és =0.05 esetén az elfogadás tartomány 81-139. Mvel T ezen tartományon kívül esk, elvetjük a nullhpotézst és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. T=91. n 1 =11 és n 2 =10 és =0.05 esetén az elfogadás ntervallum 92-150. Mvel T ezen tartományon kívül esk, elvetjük a nullhpotézst és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. Krsztna Boda 33

Egy alternatív próbastatsztka Az U-val jelölt próbastatsztka (Mann Whtney). Jelölje a két mntát x 1,x 2,, x n és y 1,y 2,, y m. Képezzük az összes (x, y ) értékpárt. Az U statsztka azon párok száma, melyre x <y (egyenlőség esetén a párt ½-del számoljuk). Jelentése: ha véletlenszerűen kválasztunk egyegy egyedet mndkét populácóból, U/nm azon valószínűség becslése, hogy az első populácóból kválasztott érték ksebb. 1 U n1n2 n1 ( n1 1) T 2 Krsztna Boda 34

Nagy elemszám esete Nagy elemszám esetén a T próbastatsztka közelítően normáls eloszlású. A T próbastatsztka várható értéke és szórása alapján számolt z statsztka közelítően standard normáls eloszlást követ z ~ N(0,1) A legtöbb számítógépes szoftver ezt a formulát használja a p-érték megadásakor Krsztna Boda 35

Döntés a példa adatara z=-2.129. A nullhpotézs teljesülése esetén a standard normáls eloszlásból az elfogadás tartomány (α=0.05) : (- z α, z α )=(-1,96 ; 1,96) A képlet alapján számolt z-statsztka a próbastatsztka: z b = 2.129 az elfogadás tartományon kívül esk, ezért elvetjük a nullhpotézst és az alternatív H A mellett döntünk és azt mondjuk, hogy a különbség szgnfkáns 5%-os sznten. 0.025 0.95 0.025 z >z α H A t fogadjuk el (a különbség szgnfkáns 5%-os sznten közelítő p=0.033, a különbség szgnfkáns 5%-os sznten -2, 1 -z α z α 2,1 Krsztna Boda

R > egy=c(-1,5,3,10,6,4,0,1,6,6) > kettő=c(2,0,1,0,3,1,5,0,-2,-2,3) > wlcox.test(egy, ketto,exact=f) #alapfeltételezés folytonosság korrekcóval Wlcoxon rank sum test wth contnuty correcton data: egy and ketto W = 85, p-value = 0.03629 alternatve hypothess: true locaton shft s not equal to 0 > wlcox.test(egy, ketto,exact=f,correct=f) folytonosság korrekcó nélkül Wlcoxon rank sum test data: egy and ketto W = 85, p-value = 0.03324 alternatve hypothess: true locaton shft s not equal to 0 Megjegyzés. R-ben más a próbastatsztka számolása: W = R1 n1(n1+1)/2 = 140 10*11/2=140-55= 85; A p-érték egyezk az SPSS folytonosság korrelcó nélkül p-értékével Krsztna Boda 37

SPSS output Ranks VAR00001 group 1.00 2.00 Total N Mean Rank Sum of Ranks 10 14.00 140.00 11 8.27 91.00 21 Test Statstcs b Mann-Whtney U Wlcoxon W Z Asy mp. Sg. (2-taled) Exact Sg. [2*(1-taled Sg.)] a. Not corrected f or tes. VAR00001 25.000 b. Groupng Varable: group 91.000-2.129.033.036 a Aszmptotkus p-érték: p=0.033 Egzakt p-érték: p=0.036 p<0.05, a különbség szgnfkáns 5%-os sznten Krsztna Boda 38

Több független mnta összehasonlítása Kruskal-Walls próba H0: a k számú mnta ugyanazon populácóból származk. A H-val jelölt próbastatsztkát a rangszámösszegekből számoljuk. Ha H0 gaz, akkor H ún. 2 (kh-négyzet) eloszlást követ k-1 szabadságfokkal Példa. Egy kísérletben (Farkas és mtsa, 2003.) lokáls szkémának alávetett, zolált patkányszívben a szívfrekvenca és a QT szakasz hosszának változását vzsgálták három antartmás gyógyszer hatására. 5 Mm K+ kálum on koncentrácó esetén, 25 perccel a lokáls szkéma után a QT szakasz hosszára a 4.8. táblázatban látható értékeket kapták. Vzsgáljuk meg, hogy a 4 csoportban van-e különbség a QT szakasz átlagos hosszában! Control Qundne Ldocane Flecande 61 76 65 69 53 84 56 65 68 89 76 73 66 78 72 71 54 81 66 61 89 69 69 mean 60.4 82.8 67.3 68.0 SD 6.80 5.49 6.86 4.34 Krsztna Boda 39

Kruskal-Walls próba a példa adatara. Eredményképpen egyetlen p- értéket kapunk. Ha nemszngfkáns a adott, sznten, a nullhpotézst elfogadjuk. Ha a nullhpotézst elvetjük, akkor tovább páronként összehasonlításokra lehet szükség. Ezek nem mnden szoftverben találhatók meg, pl. az SPSS-ben sem. A páronként hasonlításokat páronként Mann-Whtney U próbával végezzük, majd a p- értékeket korrgáljuk. QT Group Control Qundne Ldocane Flecande Total Ranks Test Statstcs a,b Ch-Square df Asy mp. Sg. N QT 14.837 3.002 a. Kruskal Walls Test b. Groupng Varable: Group Mean Rank 5 5.20 6 20.42 6 10.42 6 10.83 23 > kruskal.test(mt~csoport) Kruskal-Walls rank sum test data: mt by csoport Kruskal-Walls ch-squared = 14.8366, df = 3, p-value = 0.001962 Krsztna Boda 40

Páronként hasonlítások Pár p-érték, M-W próba korrgált p-érték* 1-2 0.004 0.024 1-3 0.126 0.756 1-4 0.052 0.312 2-3 0.002 0.012 2-4 0.002 0.012 3-4 0.937 1.000 *Bonferron korrekcó: korrgált p-érték=p M-W *6 (Most 6, mert 6 pár van) Krsztna Boda 41

Páronként hasonlítások a Kruskal- Walls próba után, R wlcox.test(mt[csoport==1],mt[csoport==2],exact=false) wlcox.test(mt[csoport==1],mt[csoport==3],exact=false) wlcox.test(mt[csoport==1],mt[csoport==4],exact=false) wlcox.test(mt[csoport==2],mt[csoport==3],exact=false) wlcox.test(mt[csoport==2],mt[csoport==4],exact=false) wlcox.test(mt[csoport==3],mt[csoport==4],exact=false) > wlcox.test(mt[csoport==2],mt[csoport==3],exact=false) Wlcoxon rank sum test wth contnuty correcton data: mt[csoport == 2] and mt[csoport == 3] W = 35.5, p-value = 0.0063 alternatve hypothess: true locaton shft s not equal to 0 Mann_Whtney p Korrgált, mndent mndennel Korrgált, csak a kontrollhoz 1-2 0.007969 0.047814 0.023907 1-3 0.1432 0.8592 0.4296 1-4 0.06664 0.39984 0.19992 2-3 0.0063 0.0378 2-4 0.004922 0.029532 3-4 1 1 Krsztna Boda 42

Több összetartozó mnta nemparaméteres összehasonlítása, Fredman próba Test Statstcs a N 22 Ch-Square 57,113 df 3 Asymp. Sg.,000 a. Fredman Test Id subject repeat meres 1 1 1 4 1 1 2 5 1 1 3 4 1 1 4 41 2 2 1 6 2 2 2 9 2 2 3 5 2 2 4 41 3 3 1 9 3 3 2 5 3 3 3 3 3 3 4 43 4 4 1 12 4 4 2 8 4 4 3 5 4 4 4 46 > fredman.test(meres~repeat. d) Fredman rank sum testdata: meres and repeat. and d Fredman ch-squared = 57.1132, df = 3, p-value = 2.431e-12 Krsztna Boda 43

Rangkorrelácó A Pearson féle korrelácós együtható csak olyan adatokra alkalmazható, amelyeket legalábbs ntervallum skálán mértek. Ha még hpotézs vzsgálatot s szeretnénk végezn a korrelácós együtthatóra, akkor a normaltást s fel kell tennünk. Az olyan adatokra, amelyek vagy nem normáls eloszlásúak, vagy nem ntervallum skálán mérték, egy másk mérőszám, az ún. Spearman féle rangkorrelácós együttható áll rendelkezésre. A rangkorrelácós együttható a rangszámok között Pearson korrelácós együttható, ha nncsenek kapcsolt rangok. Az így kszámított korrelácós együttható tehát szntén -1 és +1 között vesz fel értéket, és az értelmezése s ugyanaz, kvéve, hogy tt most rangszámokat, nem az eredet értékeket hasonlítjuk össze, így nema lneárs, hanem csak a monoton kapcsolatot jellemezzük. Jelentése: a változók között monoton kapcsolatot jellemz. A Pearson féle korrelácós együtthatóhoz hasonlóan a rangkorrelácóra s végezhetünk szgnfkanca vzsgálatot. Ha azt a nullhpotézst szeretnénk teszteln, hogy a rangkorrelácós együttható a populácóban = 0, akkor ugyanaz a formula alkalmazható, mnt a Pearson féle korrelácós együttható esetében Krsztna Boda 44

Krsztna Boda Formula a rangkorrelácó kszámítására n n s s r r s s r r R n n n n d 3 1 2 1 2 1 2 1 6 1 ) ( ) ( ) )( ( n n n n n s r 1 1 1 2 1) ( n n n y y x x y y x x r 1 2 1 2 1 ) ( ) ( ) )( ( Pearson-féle korrelácós együttható Spearman korrelácós együttható n n n n n n n s s r r 1 1 2 2 1 2 12 1) ( 1) ( 2 1 ) ( ) ( Tulajdonságok: 1 R +1 Rangszámok X-re Rangszámok Y-ra Különbség r 1 q 1 d 1 =r 1 -q 1 r 2 q 2 d 2 =r 2 -q 2......... r n q n d n =r n -q n

Hpotézsvzsgálat a rangkorrelácós együtthatóra H 0 :ρ=0 A populácóbel Spearman rangkorrelácós együttható nulla H A :ρ 0 A populácóbel Spearman rangkorrelácós együttható nem nulla Próbastatsztka: Szabadságfok: n-2 t R S n 2 1 R 2 S Krsztna Boda

Példa (X) (Y) rangszámok X Rangszámok Y d d ² 2 1,5 1 2,5-1,5 2,25 10 9,1 6,5 9-2,5 6,25 7,1 8,1 5 7-2 4 2,3 1,5 2 2,5-0,5 0,25 3 3,1 3 4-1 1 4,1 5,2 4 5-1 1 10 1 6,5 1 5,5 30,25 10,5 9,6 8 10-2 4 12,1 7,6 9 6 3 9 15 9 10 8 2 4 Krsztna Boda

R H 0 :ρ=0, H A :ρ 0 Döntés: Táblázat alapján Krsztna Boda Számítás szabadságfok=n-2=8; t tab(8;0,05) =2,306 s 6 n n 1 1 3 d 2 n 662 1 1 0,38 0,62 1000 10 n 2 1 R Mvel t=2,24< t Tab (8;0,05)=2,306 H 0 t elfogadjuk p-érték alapján Mvel p=0,055 > =0,05 H 0 t elfogadjuk Tehát a két változó között nem tudunk kapcsolatot kmutatn, a rangkorrelácós együttható nem tér el 0-tól szgnfkánsan 5%-os sznten. Megjegyzés. 5% hba mellett nem tudjuk kmutatn a kapcsolatot, azonban ez nem jelent azt, hogy nncs kapcsolat. 10%-os sznten pl. már szgnfkáns a korrelácó. Enny nformácó alapján azonban 5% hba mellett éppen nem tudtuk kmutatn az esetleg meglévő kapcsolatot. t R S 2 S 0,62 10 2 2 1 0,62 2,246

Rangkorrelácó számítás R-ben > cor(suly, magassag,method="spearman") ##Spearman féle korr. [1] 0.7289343 > cor.test(suly,magassag, method="spearman",exact=f) Spearman's rank correlaton rho data: suly and magassag S = 10251.71, p-value = 2.729e-11 alternatve hypothess: true rho s not equal to 0 sample estmates: rho 0.7289343 Krsztna Boda 49

Paraméteres vs. nemparaméteres módszerek Néha nehéz eldönten, mlyen próbát alkalmazzunk: nem csak ez a két féle próba létezk. Az orvos rodalomban bevett szokás, hogy valamlyen próbával ellenőrzk a normaltást, és ha az szgnfkáns, nemparaméteres próbát végeznek, egyébként paraméterest. Ezt az eljárást többen krtzálják (a nemszgnfkáns eredmény még nem jelent azt, hogy a nullhpotézs gaz, és fordítva; ugyanazon adatokon való tesztelés növel az eljárás első fajta hbáját (Rochon et al, 2012, BMC Medcal Research Methodology 12:81) Helyette a normaltás grafkus vzsgálatát javasolják vagy a normaltás korább (független) adatokon való ellenőrzését (Ugyanez vonatkozk a paraméteres kétmntás t-próba varancák azonosságára vonatkozó feltételének ellenőrzésére.) Krsztna Boda INTERREG 50

Paraméteres vs. nemparaméteres módszerek A paraméteres módszerek robusztusak: feltételek ksebb megsértése esetén még érvényes az eredményük A nemparaméteres próbáknak kevesebb a feltétele Ha a paraméteres próba feltétele teljesülnek, akkor ők erősebbek Krsztna Boda INTERREG 51

Krsztna Boda Összefoglaló kérdések és feladatok Normaltásvzsgálat grafkusan A paraméter jelentése A paraméteres próba jelentése A nemparaméteres próba jelentése Mely esetben használunk rangsoroláson alapuló próbákat? Adjunk példát rangszámok készítésére! Két összetartozó mnta összehasonlítása rangsoroláson alapuló módszerekkel Két független mnta összehasonlítása rangsoroláson alapuló módszerekkel A szgnfkanca megállapása ks és nagy elemszám esetén két mnta nemparaméteres módszerekkel való összehasonlításakor. Rangsorolja a következő adatokat: 21, 23, 24, 21, 20, 30, 25, 24, 31 A rangkorrelácós együttható jelentése, tulajdonsága, számítása A rangkorrelácós együttható szgnfkancája 52

Példák az orvos rodalomból Krsztna Boda INTERREG 53

Krsztna Boda INTERREG 54

Krsztna Boda INTERREG 55

Irodalom Reczgel Jenő, Harnos Andrea, Solymos Norbert: Bostatsztka nem statsztkusoknak. Pars Kft. Nagykovács, 2007. Vargha András: Matematka statsztka pszchológa, nyelvészet és bológa alkalmazásokkal. Pólya Kadó Budapest, 2000. Krsztna Boda 56