Hipotézis vizsgálatok
Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével egy véletlen minta alapján eldöntjük, hogy az adott hipotézis elfogadható-e vagy sem.
Meg kell határozni az alábbi hipotéziseket a vizsgálat indítása előtt: H 0 : Null-hipotézis H 1 : Alternatív hipotézis Döntési táblázat Valóshelyzet H 0 igaz H 0 hamis H 0 elfogadása H 0 elutasítása Helyes döntés (1- ) Elsőfajú hiba ( hiba) Másodfajú hiba ( hiba) Helyes döntés (Power = 1- )
Elkövethető hibafajták Type I error ( hiba vagy szignifikancia érték): annak valószínűsége, hogy elutasítjuk a valós H 0 hipotézist. Fontos, hogy az elsőfajta hiba kellően alacsony maradjon (felső határaként legtöbbször 5%-ot írnak elő, ezt fejezi ki a p<0,05 jelzés). Ez az ún. szignifikanciaszint. Type II error ( hiba): a hibás H 0 hipotézis elfogadásának valószínűsége.
Értelmezések 1 - : elfogadom a H 0 mikor az igaz, és elutasítom a nem igaz H 1 : 1 2 : elutasítom H 0 mikor az igaz, és elfogadom a nem igaz H 1 : 1 2 1 - : elutasítom a H 0 mikor az hamis, és elfogadom az igaz H 1 : 1 2 : elfogadom a H 0 mikor az hamis, és elutasítom az igaz H 1 : 1 2
Type I error ( hiba ) Az első fajta hiba valószínűségét a fogyasztó kockázatának is nevezik, hiszen ez a maximális valószínűsége annak, hogy a hatástalan gyógyszerek közül valamelyik forgalomba kerüljön. Megnyugtató tehát, hogy a statisztikai hipotézis vizsgálatának logikája szerint az ilyen típusú hibának van meghatározó szerepe a döntésekben (ennek felső határa rögzített).
Type II error ( hiba) A hiba: A vizsgáló/kutató kockázata. Úgy illik, hogy 20 százalékos szint alatt maradjon, de mindenki úgy gondolja, hogy az ezzel való törődés a kutató érdeke (hiszen ha nem vigyáz, kihullhat a rostán egy hatásos gyógyszer vagy a klinikai vizsgálat hatástalannak látszik).
Hipotézisek megfogalmazása
A statisztikai próba A munka-hipotézisek (H 0 ) nem igazolhatók közvetlen úton. Null hipotézis felállítása (H 0 ): μ 1 = μ 2, vagy μ 1 - μ 2 =0. Ellenhipotézis. A minta a nullhipotézist alátámasztja-e? Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezzük. Próbafüggvény előállítása.
Próbák Kétoldali próba: két oldalról állít alsó és felső korlátot (a feltételtől való eltérés tényét vizsgáljuk, irányát nem). Egyoldali próba: csak az egyik irányban állít korlátot (csak ilyen irányú eltérés lehetséges vagy fontos számunkra).
Egy- és kétoldalas próbák Kétoldalas próba H 0 : nincs változás H a : van változás (bármilyen irányú) Egyoldalas próba H 0 : az átlag nem növekedett H a : az átlag növekedett p-értékek esetén: p(egyoldalas)=p(kétoldalas)/2
Átlagra vonatkozó hipotézisek Kétoldalú próbák: x x H : 0 1 2 H : x 1 1 x2 Egyoldalú próbák Baloldali: Jobboldali: H x1 x2 H : 1 : 0 1 x x 2 x x1 x H : 0 1 2 H : > 1 x2
p-érték (empirikus szignifikancia-szint) Az a legkisebb valószínűség, amely mellett a vizsgált H 0 hipotézist elutasíthatjuk a H 1 hipotézissel szemben, azaz, ahol éppen az elfogadásból az elutasításba váltunk. (A gépi output-ok ezt adják meg.) Fisheri döntés a p értéke alapján: p < : H 0 -t elvetjük (elfogadjuk H 1 -t) p : H 0 -t elfogadjuk
A szignifikancia értelmezése Normális populáció esetén ha rögzítjük a szignifikanciaszintet és a próba erejét akkor a szükséges mintalemszám egyenesen arányos a populáció szórásnégyzetével és fordítottan arányos annak a különbségnek a négyzetével, melyet ki szeretnénk mutatni. Első látásra ez egyszerűsíti a dolgokat, hisz a statisztikai szignifikancia elérése jórészt mintaelemszám kérdése.
Kritikus tartomány 0,95 Elfogadási tartomány Kritikus tartomány 0,025 0,025-3.0-2.5-2.0-1.5-1.0-0.5 0 0.5 1.0 1.5 2.0 2.5 3.0 Standard (z) Score Szignifikancia értelmezése
Mintaszám és erő (Sample Size and Power): Mintaszám meghatározása: Power : (80 or 90%) Hatásméret Variancia pilot study Signifikancia szint ( ) : (0.05) 1-tailed or 2-tailed testing (Confounders) Non-compliance, Cross-overs (Drop Ins/Outs), Lost to follow up
A statisztikai próba ereje A második fajta hiba komplementere: annak valószínűsége, hogy hatásosnak ítéljük a gyógyszert, amely valóban az is. Mivel komplementerekről van szó, a 20 százalékos második fajta hibához 80 százalékos erő tartozik. A valódi különbség kimutatásának valószínűsége:p=1- β. Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége. Minél kisebb az α, annál ritkább, hogy H 0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H 0 -t tévesen elfogadjuk (másodfajú hiba).
Az első- és másodfajú hiba csökkentése Minta elemszámának növelése. Pontosabb mintavételezés (szórás csökken). Lehet-e az első- és másodfajú hibát nullára csökkenteni? NEM. A véletlen hatásokat nem tudjuk kiiktatni.
A pontosság fokozása a kísérlet pontosabb kivitelezésével az ismétlésszám növelésével a parcellák csoportosításával, blokkképzéssel
Torzítás Randomizáció. Az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés.
A hipotézis vizsgálat menete A null- és alternatív hipotézis megfogalmazása. Próbafüggvény keresése/szerkesztése. Előre rögzített szignifikanciaszint mellett az elfogadási és elutasítási tartomány megszerkesztése. A próbafüggvény empirikus értékének meghatározása. Döntés.
Próbafüggvény
A próbafüggvény A hipotézisvizsgálat eszköze a próbafüggvény. A próbafüggvény a véletlen minta elemeinek függvénye, értéke mintáról-mintára változik, vagyis valószínűségi változó. Valószínűségi eloszlása bizonyos feltételek és a nullhipotézis helyességének a feltételezése mellett ismert.
A statisztikai próba A próbafüggvény kiszámított értékéhez megadható egy p valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ 1 = μ 2
Normális eloszlást feltételezve, az átlagok összehasonlítására használható próbák Egy minta esete: egymintás t-próba Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal): páros t-próba= egymintás t-próba a különbségekre. Független minták (placebo-kezelés, férfi-nő, betegegészséges): kétmintás t-próba Azonos szórások esetén klasszikus. Különböző szórások esetén módosított (Welch, D). Szórások egyezésének tesztelése: F-próba, Levene-próba. Több (>2) minta esete: varianciaanalízis.
Egymintás t-teszt Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Feltétel: H : x x 0 1 2 Normális eloszlású populáció. Egy egyénen kétszer mérjünk. n>6-8. Próbastatisztika: (df = n-1 ): X t 0 s / n
Párosított t-próba Két összefüggő minta középértékének összehasonlítására szolgál. H 0 : d átlag = 0 Próbastatisztika: (df = n 1 1) t s d d / n s d a párosított minták különbségének szórása, becslése a minta alapján.
Két középérték különbségének tesztelése Feltételek: Független minták. Normális eloszlásúak/robusztusság. Azonos szórás.
Kétmintás t-próba Két független minta összehasonlítása Feltételek: A minták függetlenek: normális eloszlású populációból származnak:az x i -k N(µ 1, ) és az y i --k N µ 2, ) eloszlású populációból H 0 : 1 = 2, H a : 1 2 Próbastatisztika Azonos varianciák esetén: t s p x y x y nm 1 1 sp n m s n m. Szabadságfok: n+m-2 Döntés: Ha t >t α,szab.fok, a különbség szignifikáns α szinten, H0-t elvetjük 2 p ( n 1) s ( m 1) s n m 2 2 2 x y
Kétmintás t-próba Két független minta összehasonlítása Feltételek: A minták függetlenek: normális eloszlású populációból származnak:az x i -k N(µ 1, ) és az y i --k N µ 2, ) eloszlású populációból H 0 : 1 = 2, H a : 1 2 Próbastatisztika Különböző varianciák esetén: d x y sx n s 2 2 y m szabadságfok g 2. ( n 1) ( m 1) 2 ( m 1) (1 g ) ( n 1) Döntés: n m Ha t >t α,szab.fok, a különbség szignifikáns α szinten, H0-t elvetjük g s 2 sx n s 2 2 x y
A varianciák összehasonlítása H 0 : 2 1= 2 2 H a : 2 1 > 2 2 vagy 2 1 > 2 2 (egyoldalú próba) A próbastatisztika (F): a nagyobbik standard deviáció négyzetét osztjuk a kisebbel: Szabadságfokok: nagyobb SD-hez tartozó minta elemszáma-1 Kisebb SD-hez tartozó minta elemszáma-1 Döntés: F táblázat alapján Ha F>F α,táblázat, a két variancia szignifikánsan különbözik α szinten F sx sy max( 2, 2 ) 2 2 min( s, s ) x y
z próba arányokra z = p 1 - p 2 pq --- 1 + --- 1 ( ) N 1 N 1 N 1 : az 1. minta elemszáma k 1 : az esemény abszolút gyakorisága k 1 N 1 p 1 = ---- relatív gyakoriság az 1. mintában N 2 : az 2. minta elemszáma k 2 : az esemény abszolút gyakorisága k 2 N 2 p 2 = ---- relatív gyakoriság az 2. mintában
u-próbák A matematikai statisztikában több u-próbát is ismerünk. Szűkebb értelemben ezek az - egymintás u-próba és a - kétmintás u-próba. Mindkét próba a paraméteres próbák özé tartozik. A két próba nagyon hasonló matematikai háttérrel rendelkezik, alkalmazási feltételeikben és nullhipotéziseikben is nagyon sok hasonlóság van. Tágabb értelemben a matematikai statisztikában általában is szoktak u-próbaként, vagy u-próbákként utalni minden olyan próbára, melyben a próbastaisztika standard normális eloszlást követ. A fenti két próba rokonítható rendre az egy és a kétmintáss t-próbához, mivel páronként ugyanazt a H 0 vizsgálják ugyanolyan adottságok mellett.
u-próbák Az egymintás esetben a hasonlóság még nagyobb, ugyanis az egymintás t-próba képlete csak annyiban tér el az egymintás u-próbáétól, hogy benne az előre megadott szórás helyén a minta alapján becsült szórás áll. Sőt, az egymintás t- és u-próba a legtöbb alkalmazási feltételben is azonos. Különbség a két próba között az alkalmazás szintjén mindössze egy feltételben van, mégpedig abban, hogy az egymintás t-próba nem igényli a vizsgált valószínűségi változó szórásának ismeretét, míg az egymintás u-próba esetében ez eleve adott kell, hogy legyen. (A matematikai háttérben az eltérés nagyobb.) A kétmintás u-próbához nem a kétmintás t-próba, hanem a Welch-próba áll ugyanolyan közel, mint az egymintás u- hoz az egymintás t.
Egymintás u-próba A próba alapgondolata, hogy a populációt m átlagú (várható értékű) és σ szórású normális eloszlásúnak feltételezzük és mintavételezéssel tesztelni kívánjuk, hogy az m szám tényleg tekinthető-e a populációs átlagnak, vagy ez a feltételezésünk nem tartható. A populációból véletlen módon egy n elemszámú mintát veszünk (x 1, x 2,,x n ) a minta értékeiből átlagot számolunk ( )és meghatározzuk az átlag eltérését az m feltételezett populációs átlagtól. Vizsgáljuk az eltérést: m
Az egymintás u-próba ahol próbastatisztikája : a vizsgált valószínűségi változó átlaga a mintában, :az előre adott érték, amihez az átlagot viszonyítjuk, :a vizsgált valószínűségi változó ismert szórása és : a minta elemszáma.
Az u-próba feltétele Eszerint, hogy a vizsgált populáció ismérve (valószínűségi változója): - intervallum vagy arányskálán mért - normális eloszlású - ismert szórású - ismert populációs átlagú (illetve várható értékű) A próba a populációs átlagot teszteli, így az utolsó feltételt pontosabb úgy fogalmazni, hogy feltételezéssel kell rendelkeznünk a populáció átlagára vonatkozóan.
Az u-próba hipotézisei : a populáció átlaga = m (nullhipotézis) : a populáció átlaga m (kétoldali ellenhipotézis) : a populáció átlaga = m (nullhipotézis) : a populáció átlaga < m (bal oldali ellenhipotézis) Illetve a másik lehetőség, hogy : m < a populáció átlaga (jobb oldali ellenhipotézis).