Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak megfelelőt! Egy ismert eloszlás valamilyen paraméterére vonatkozó hipotézis vizsgálata. Az ismert eloszlás leggyakrabban a normális eloszlás. Egy ismeretlen eloszlás paraméterére, típusára vonatkozó hipotézis vizsgálata. Nem-paraméteres eljárások Eloszlás-független eljárások. (distribution free methods) Rangok Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Előnyük : nem kötöttek eloszláshoz. Hátrányuk: általában kisebb teljesítményűek. Rangsorolásos módszerek: Az értékek helyett az ún. rangokat használjuk. pl.: Hadnagy Őrnagy Ezredes Stb. Kapcsolt rangok: Azonos értékek esetében az egyes értékek a rangok átlagát kapják. Érték: Rang:,,5,5,5 5
A rangok átlaga a medián A kérdés szerint egy csoport (minta) két csoport (minta) A medián veszi át az átlag szerepét. több csoport (minta) Variációk egy témára Vizsgálat egy csoportban paraméteres nem paraméteres Kérdés: A minta alapján lehet-e a populáció jellemző értéke egy megadott érték? egy csoport két csoport több csoport egymintás t-próba, kétmintás t-próba ANOVA Wilcoxon-féle előjeles rangpróba, előjel-próba Mann-Whitney U-próba Kruskall-Wallis próba paraméteres μ =? Nullhipotézis: x = μ nem paraméteres medián =? Nullhipotézis: a medián egy megadott érték (A teljesség igénye nélkül) egymintás t-próba Wilcoxon-féle előjel-próba
Egymintás t-próba A példa: Hatásos-e a lázcsillapító vagy sem? Mit jelent a nagy eltérés? Mi a mértéke az eltérésnek? Nullhipotézis: nem! μ =. De az átlag nem! minta... átlag -, C - C -,5 C Ha az eltérés nagyobb, biztosabbnak tűnik az alternatív hipotézis (a gyógyszer hatásos) Standard hiba: az átlagok átlagos eltérése a μ-től. ( x ± sx ) ~ 68% - konfidencia intervallum. A t-érték Miért alkalmasabb a t-érték? x μ = t s x Viszonyítsuk az eltérést a standard hibához! (μ igen gyakran = ) Képesek vagyunk kiszámolni ennek az eltérésnek a valószínűségét!!! (Student- vagy t-eloszlás) Mivel az átlagok a μ körül ingadoznak, a t-értékek a körül. (feltéve, hogy a nullhipotézis igaz!) Csak a t-értékek véletlen ingadozását írja le! Az eloszlás alakja függ az elemszámtól.
Miért t-eloszlású? A szabadsági fok x μ = t s x s s x = n s = i x ( x x) i n Az átlagok ingadozása normális eloszlással írható le. A számláló tehát egy normális eloszlású változó! A szórás pedig valószínűségi változók négyzetösszegéből vont négyzetgyök. Gondoltam számra! (minta) A szám átlaga: 8! (információ!) emlékeztető Q.E.D. (Quad erat demonstrandum) t-eloszlás ξ = n n ξ i ζ i A t változó (n-) szabadságfokú t-eloszlást követ.,, 8 vagy 5, 7, stb. A szabadsági fok = n,, 9 vagy 5, 7, stb. A szabadsági fok = n- A t-táblázat Döntés t-táblázat alapján Kiválasztunk egy alkalmas szignifikancia szintet! Ha t,78 elvetjük, ha kisebb megtartjuk a nullhipotézist. Különböző t krit értékek tartoznak a különböző szigfikancia szinthez.
Döntés számítógép segítségével A döntés Én tudok integrálni!!!. Ha a véletlen eltérés valószínűsége kicsi (p( t t krit ) 5%) elvetjük a nullhipotézist.. Ha a véletlen eltérés valószínűsége nagy (p( t t krit ) > 5%) megtartjuk a nullhipotézist. p: annak a valószínűsége, hogy véletlenül ilyen nagy a t számolt. Tévedtem? A hiba mérlegelése Elvetjük a nullhipotézist Megtartjuk a nullhipotézist Az α a tévedés mértéke. Minél kisebb p érték a kedvezőbb. A β a tévedés mértéke. Minél nagyobb p érték a kedvezőbb.
Az egymintás t-próba feltétele Wilcoxon-féle előjel-próba A feladat: egy minta alapján döntés a μ értékéről. A változó normális eloszlású legyen. Mi van, ha mégsem az? sorszám 5 6 7 8 9 előtte 5 Példa: Van-e hatása egy szórakoztató film megtekintésének, a páciensek együttműködési hajlamára? ( A számok pontértékek) utána 5 különbség - - Normális eloszlású? A rangok A nullhipotézis megfogalmazása A különbségek abszolút értékét (kivéve a értékeket) állítsuk sorba! A rangoknak adjuk vissza az előjelét! Majd számoljuk ki a rangok átlagát és szórását. különbség - abszolút érték rang,5,5 Előjeles rang,5 -,5 Nincs hatása a filmnek! A medián! Az eltérés csak véletlen!,5,5,5,5-5,5 7 5,5 5,5 7-5,5 H : μ = H : μ
Ismert eloszlás Döntés De a rangok eloszlása sem ismert! R t = s n Ha n elég nagy. Ó! Innen már tudom!!! Hát persze! Ez egy egymintás t-próba!!! R - az előjeles rangok átlaga s a rangok szórása Emlékeztető! A rangok átlaga = medián Párosított t-próba Kísérlet-tervezés Ha az adatok valamilyen szempontból párokba rendezhetőek! Egyazon egyeden, páros szerven (pl. vese) végzett két megfigyelés. Ritkábban, szempontok alapján (kor, foglalkozás, stb.) párosítható adatok. Vizsgálat hozott anyagból? Célszerű sorrend: Kérdés felvetés kísérlet-tervezés értékelés. Lásd: lázcsillapító hatása. Kísérlet-tervezés Már meglevő anyag. Sok problémát vethet fel. (pl. kevés megfelelő adat)
valódi egymintás t-próba Előjel-próba Lehet-e a várható érték egy megadott érték? x μ t = s x Példa: vizsgálat éves gyerekek populációjában az energia felvétel nagyságáról. Kérdés: Lehet-e a medián (egy másik felmérésből származó érték) 86 kcal? Nullhipotézis: a medián 86 kcal, az eltérés csupán véletlen. Ritkábban előforduló eset. A vizsgálat A döntés Kis elemszám esetében P( x) = x p x! n! ( n x)! n x ( p) Nagy elemszám esetében z = x np / np ( p) Kiszámoljuk a véletlen eltérés valószínűségét. (binomiális, vagy standard normális eloszlás) Vége ennek a résznek! binomiális eloszlás standard normális eloszlás x gyerekek száma 86 kcal alatt n vizsgálatba bevont gyerekek száma p annak a valószínűsége, hogy véletlenül kisebb legyen (lásd: binomiális eloszlás)