Hipotézis BIOMETRIA 5. Előad adás Hipotézisvizsg zisvizsgálatok Tudományos hipotézis Nullhipotézis feláll llítása (H ): Kétmintás s hipotézisek Munkahipotézis (H a ) Nullhipotézis (H ) > = 1
Statisztikai Az olyan eljárást, amelyik a minták n dönt, d statisztikai próbának nevezik Modell választv lasztás s vagy alkotás Próbaf bafüggvény előáll llítása Próbaf bafüggvény A f bafüggvény kiszámított értékéhez megadható egy P,, valósz színűségi érték. Ez megadja, hogy milyen valósz színűséggel várhatv rható a f bafüggvénynek a kiszámítottal azonos vagy annál l nagyobb értéke, ha a nullhipotézis igaz, azaz µ 1 = µ 2 A statisztikai menete 1. A statisztikai menete 2. A munka-hipot hipotézisek (H a ) nem igazolhatók k közvetlen k úton Ellenhipotézis, nullhipotézis feláll llítása (H ): µ 1 = µ 2, vagy µ 1 -µ 2 = Elsőfaj fajú hiba megválaszt lasztása, sa, ALFA A minta a nullhipotézist alátámasztja masztja-e? A munka-hipot hipotézist indirekt módon m bizonyíthatjuk Elsőfaj fajú hiba (H ): µ 1 = µ 2, vagy µ 1 - µ 2 = igaz A minta n elvetjük k a nullhipotézist zist,, tévesen t valódi különbsk nbséget állapítunk meg Mi ennek a valósz színűsége? α (alfa), melyet a statisztikai elvégz gzése előtt kell megválasztani, szignifikancia-szint szint Szokásos értékei: 1; 5; 1; ritkán n,1% p Kétoldali, szimmetrikus, alfa=5% 45% ELUTASÍTÁSI 4% 35% 3% 25% 2% 15% 1% 5% ELFOGADÁSI TARTOMÁNY % -4-3 -2-1 1 2 3 4 z ELUTASÍTÁSI 2
Egyoldali, aszimmetrikus, alfa=5% p 45% 4% 35% 3% 25% 2% 15% 1% 5% ELFOGADÁSI TARTOMÁNY % -4-3 -2-1 1 2 3 4 z ELUTASÍTÁSI KRITIKUS ÉRTÉK Egyoldali vagy kétoldali? k Alternatív v hipotézisre vonatkozik Egyoldali, ha előzetes informáci ciónk van arról, hogy az egyik csak nagyobb lehet, mint a másik. m Kétoldali, nincs informáci ciónk az összehasonlításról. A kétoldali k a gyakoribb Az egy- és s kétoldali k A null-hipotézis (H ) mindig egyenlőség Ha az alternatív hipotézis (H 1 ) nem egyenlő nagyobb kisebb ( X = X, P = P σ = σ ) ( X X, P P σ σ ), ( X > X, P > P, σ > σ ) ( X < X, P < P σ < σ ),, kétoldali jobboldali baloldali Döntés a hibák k 1. H -t elfogadjuk H igaz (egyformák) hibák k 2. H hamis (különböznek) hibák k 3. H igaz (egyformák) Döntés a H -t elutasítjuk Döntés a H -t elutasítjuk Elsőfajú hiba (α) 3
Döntés a hibák k 4. H -t elfogadjuk H hamis (különböznek) Másodfajú hiba (β) Döntés a hibák összefoglalásasa H -t elfogadjuk H -t elutasítjuk H igaz (egyformák) Elsőfajú hiba (α) H hamis (különböznek) Másodfajú hiba (β) Másodfajú hiba µ 1 nem egyenlőµ 2, vagy µ 1 -µ 2 nem nulla, H a igaz A minta n megtartjuk a nullhipotézist zist, tévesen egyformaságot got állapítunk meg Mi ennek a valósz színűsége? β (béta), melynek értékét t csak a statisztikai elvégz gzése után n lehet meghatározni A statisztikai ereje A valódi különbsk nbség g kimutatásának valósz színűsége P=1-β Gyakorlatilag egy igaz munkahipotézis vagy alternatív v hipotézis elfogadásának valósz színűsége Minél l kisebb az α,, annál l ritkább, hogy H -t tévesen elutasítjuk, tjuk, de annál l gyakoribb, hogy H -t t tévesen t elfogadjuk (másodfaj sodfajú hiba) Az első- és s másodfajm sodfajú hiba csökkent kkentése Minta elemszámának növeln velése Pontosabb mintavételez telezés s (szórás csökken) Lehet-e e az első- és s másodfajm sodfajú hibát nullára csökkenteni? NEM A véletlen v hatásokat nem tudjuk kiiktatni Elsőfaj fajú és s másodfajm sodfajú hiba közötti k összefüggés Fordított De nem lineáris! 4
29,5% 6,2% 1,96 Alfa és s béta b hiba Öreg vagy fiatal? 95% -4-2 2 4 6 8 1 Statisztikai próbák k 1. Eloszlásra sra vonatkozó Normális eloszlás Binomiális Egyenletes Kolmogorov-Smirnov teszt,45,4,35,3,25,2,15,1,5 Statisztikai próbák k 2. Az eloszlás s valamelyik paraméter terérere Medián Átlag Szórás,2,4,6,8 1 1,2 Nem paraméteres statisztikai próbák Khi-négyzet teszt, illeszkedés s vizsgálat Binomiális teszt a relatív v gyakoriságra gra Független kétmintk tmintás s teszt, pl. Mann- Whitney-u Független többmintt bbmintás s teszt, pl. Kruskal- Walis H Páronként nt összetartozó minták k tesztje, pl. Wilcoxon-teszt K számú összetartozó minta tesztje, pl. Friedman-teszt Khi-négyzet teszt Származhat rmazhat-e e egy gyepmag-kever keverék k egy 2, 17, 3, 2, 13%-os összetételű keverékb kből? A mintavételez telezés s során n az alábbi eredményt kaptuk: Faj magok száma (db) Réti perje 236 Angolperje 241 Réti komócsin 443 Réti csenkesz 252 Fehérhere 155 Összesen: 1 327 5
Binomiális teszt Igaz-e e a nemeknél l az 5:5%-s s arány? Mann-Whitney Whitney-u Két t független f minta medián egyezésének igazolására való eljárás A H, hogy a két k t sokaság g ugyanabba az eloszlásba sba tartozik Ordinális típust pusú adatoknál l használhat lható, vagy skála típust pusú adatoknál, ahol nem feltétel tel a normáleloszl leloszlás Csak az egyezésre ad elfogadható, megbízhat zható eredményt. Ha ettől l eltérő eredményt kapunk, nem tudhatjuk biztosan, hogy mi a valóság Kruskal-Walis H Rendezett mintán n alapuló,, több t mintás hipotézis vizsgálat Nullhipotézis zis: minden minta azonos eloszlású sokaságb gból l származik A segíts tségével h darab nh elemszámú mintát t vizsgálhatunk Wilcoxon-teszt Két t eloszlás s egyezésének vizsgálat latára alkalmas A két k t minta elemei páronkp ronként nt összefüggnek n 1 +n 2 elemű mintából l egyetlen rangsort képeznek A nullhipotézis zis: : a páronkp ronkénti nti különbségek a nulla körül k szimmetrikusan helyezkednek el Friedman teszt Több eloszlás s egyezésének vizsgálat latára alkalmas A K számú minta elemei összefüggnek n 1 +n 2 n K elemű mintából l egyetlen rangsort képeznekk A nullhipotézis zis: : a különbsk nbségek a nulla körül l szimmetrikusan helyezkednek el Paraméteres próbák Feltétel tel a normális eloszlás A teszt irányulhat várható értékre vagy 45% szórásra sra p 4% 35% 3% 25% 2% 15% 1% 5% % -4-3 -2-1 1 2 3 4 6
Paraméteres próbák k a várhatv rható értékre Ismert szórás Egymintás z- Független kétmintk tmintás z- Párosított z- A szórás s nem ismert, mintából l becsült Egymintás s t-prt Független kétmintk tmintás s t-prt Párosított t-prt 7