A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet
Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai minta) alapján az egész jelenség (populáció) tulajdonságaira következtetünk. Azt vizsgáljuk, hogy a tapasztalt eredmény (különbség) nagyobb-e, mint amit a véletlen önmagában okoz. Krisztina Boda 2
Hipotézis Állítás a populációról (vagy annak paraméteréről) Példák H1: p=0.5 (a pénzérme szabályos a dobások fele fej, másik fele írás; p=pl. a fejdobás valószínűsége) H2: p 0.5 ( a pénzérme nem szabályos) H3: =20 (a populáció átlag 20) H4: 20 (a populációü átlag nem 20) Kétféle hipotézis: nullhipotézis általában a szabályosság, egyenlőség feltételezése Ellentéte, az alternatív hipotézis, különbség, eltérés feltételezése. Gyakran ez az, amit bizonyítani szeretnénk. Krisztina Boda 3
Hipotézisek tesztelése Mekkora esélyt adjunk a véletlennek, azaz, mekkora legyen a megbízhatósági szint: akármennyi lehet, (tőlünk függ), általában 95% vagy ami ugyanaz, mekkora legyen a szignifikancia szint: általában 5% ( =0.05) Krisztina Boda 4
A hipotézisvizsgálat menete Hipotézisek felállítása Nullhipotézis: semmi nem történt Alternatív hipotézis: valami változás van A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól) Mintaelemszám (n) meghatározása A minta előállítása (mérés, adatgyűjtés,stb) A döntési szabály kiszámítása Döntés A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten, nincs elegendő információ a különbség (hatás) kimutatására) A nullhipotézist elvetjük, a különbség szignifikáns -os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott. Krisztina Boda 5
Egymintás t-próba Hipotézis teszt a normális eloszlású populáció μ átlagára Egy kezelés során szükségessé vált annak ellenőrzése, hogy az milyen hatással van a vérnyomásra. A vizsgált paciensek korcsoportjában a systolés vérnyomás normálértéke 120. Mondhatjuk-e 95% biztonsággal, hogy a minta-adatok 120 átlagú populációból származnak? H O : A populáció átlag 120, =120 H a : A populáció átlag nem 120, 120 (kétoldalas) Általában: H O : =c H a : c =0 Mintavétel, adatok: n=9 személyt megmérve a következő értékeket kapták: 182.00 152.00 178.00 157.00 194.00 163.00 144.00 114.00 174.00 Az átlag=162 Hgmm volt, a standard deviáció SD=23.92. Krisztina Boda 6
Döntési szabály a konfidencia intervallum alapján Általában Ha c benne van az intervallumban: megtartjuk a nullhipotézist, a különbség nem szignifikáns adott szinten Ha c nincs benne az intervallumban : elvetjük a nullhipotézist, a különbség szignifikáns adott szinten Esetünkben Adjuk meg a populáció-átlagra vonatkozó 95%-os konfidencia intervallumot! t 8,0.05 =2.306 A standard error, SE=SD/ n=7.97. A konfidencia intervallum: (átlag - t*se, átlag + t * SE )= (162-2.306*23.92/ 9, 162+2.306*7.97) =(143.61,180.386) Döntés: Mondhatjuk-e a konfidencia intervallum alapján 95% biztonsággal, hogy a minta-adatok 120 átlagú populációból származnak? Nem, mivel a konfidencia intervallum nem tartalmazza 120-at. Esetünkben 120 nincs benne a konfidencia intervallumban, tehát a különbség szignifikáns 5%-os szinten Krisztina Boda 7
Döntési szabály a t-érték alapján Számítsuk ki a következő ún. próbastatisztikát: t= (átlag - c)/se Ha igaz a nullhipotézis, a t próbastatisztika n-1 szabadságfokú t-eloszlást követ. Ekkor megadható az a tartomány, ahova a t nagy 95% valószínűséggel beleesik (ennek határait a t-eloszlás táblázatából keressük ki a megfelelő szabadságfok és alapján). Az elfogadási tartomány a változó azon értékeinek halmaza, amelyekre elfogadjuk a nullhipotézist (- t tábla, t tábla ) A kritikus tartomány ennek ellentettje. A kritikus tartomány értékeire a nullhipotézist nem fogadjuk el. Döntési szabály: ha t >t tábla, a különbség szignifikáns adott szinten ha t <t tábla, a különbség nem szignifikáns adott szinten Esetünkben: t=(162-120)/7.97=5.26. Szabadságfok: n-1=9-1=7 t 8,0.05 =2.306 (táblázatbeli érték): Döntés: 5.26>2.306, a különbség szignifikáns 5%-os szinten Elfogadási tartomány t=5.26 Krisztina Boda 8
Döntési szabály a p-érték alapján p-érték: a mi általunk számított t-érték által az eloszlásból levágott terület nagysága Annak valószínűsége, hogy ha igaz a nullhipotézis (=nincs hatás), a tapasztalt eltérést vagy annál még nagyobb eltérést kapjunk Ha a p<, akkor a különbség szignifikáns adott szinten Esetünkben p=0.001<0.05 One-Sample Statistics VAR00001 VAR00001 Std. Error N Mean Std. Dev iation Mean 9 162.0000 23. 92175 7. 97392 One-Sample Test Test Value = 120 95% Conf idence Interv al of the Mean Dif f erence t df Sig. (2-tailed) Dif f erence Lower Upper 5.267 8.001 42.0000 23.6121 60.3879 Elfogadási tartomány t=5.26 Krisztina Boda 9
Másik mintafeladat Két oktató beszélget: vajon mennyi lehet az elsőéves idegen nyelven tanuló hallgatók átlagéletkora? Az egyik oktató szerint ez 20 év, a másik oktató ezzel nem ért egyet. Oktató#1: A populáció-átlag 20. H0: μ=20 Oktató#2: A populáció-átlag nem 20. Ha: μ 20 Krisztina Boda 10
Egymintás t-próba Döntési szabály: konfidencia intervallum H 0 : =20, H a : 20 α =0.05 Adatgyűjtés. n=137 Minta átlag=20.87 Minta SD=3.071 95%-os konfidenica intervallum számítás a populáció átlagra: Szabadságfok=136, t 136,0.05 =1.977 t SD n 3.071 1.977 1.977 0.262 0.518 137 Alsó határ: 20.87-0.518=20.352 Felső határ: 20.87+0.518=21.388 Az intervallum: (20.35-21.39). Az igazi átlag (a populációátlag) ebben az intervallumban van, 95%-os valószínűséggel. Döntési szabály: ellenőrizzük, hogy a hipotézisben szereplő feltételezett átlag (20) benne van-e az intervallumban Döntés 20 nincs benne a 95%-os konfidencia-intervallumban, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség szignifikáns 5%-os szinten. Krisztina Boda 11
H 0 : =20, H a : 20 α =0.05 Adatgyűjtés. n=137 Minta átlag=20.87 Minta SD=3.071 Egymintás t-próba Döntési szabály: kritikus érték 20.87 20 3.321 0.262 Próbastatisztika (t-érték) számítása: Ha H0 igaz, akkor a próbastatisztika n-1=136 szabadságfokú t-eloszlást követ. A t-eloszlás táblázatából meghatározható a kritikus érték, ennek segítségével az elfogadási tartomány: (- 1.977, 1.977) És ennek ellentéte, az elutasítási tartomány Döntési szabály: ellenőrizzük, hogy az általunk számolt próbastatisztika értéke benne van-e az elfogadási intervallumban Döntés t=3.321 nincs az elfogadási intervallumban, 3.321>1.977, t >t table, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség szignifikáns 5%-os szinten. t x c SE 0.5 0.4 0.3 0.2 0.1 0.0 y=student(x;136) -3-2 -1 0 1 2 3 Elfogadási intervallum t=3.321 1.0 0.8 0.6 0.4 0.2 0.0-3 Krisztina Boda 12
H 0 : =20, H a : 20 α =0.05 Adatgyűjtés. n=137 Minta átlag=20.87 Minta SD=3.071 Egymintás t-próba Döntési szabály: p-érték 20.87 20 3.321 0.262 Próbastatisztika (t-érték) számítása: A p-érték a t-eloszlásból a próbastatisztika által levágott szélső területek nagysága Annak valószínűsége, hogy ha igaz a nullhipotézis, a kapott, vagy annál nagyobb eltérést kapunk Döntés: p=0.001152<0.05, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség sziginifkáns 5%-os szinten. t x c SE Elfogadási intervallum t=3.321 p=.001152 Krisztina Boda 13
Az egymintás t-próba tesztelésére alkalmazható egyenértékű döntési szabályok. Feltétel: normalitás 1. H0: =c, (c adott konstans). 2. Ha: c. 3. rögzítsük a hibavalószínűséget. 4. Állapítsuk meg a mintaelemszámot n 5. Mérjük le (gyűjtsük be) az adatkokat, ( x 1 x 2 x n 6. A döntési szabály:,,...,.), számítsuk ki a minta átlagot ás szórást Konfidencia intervallum Döntési szabályok s s (x t, x t ) t = a kétoldalas t-táblázatból nyert kritikus érték n n Kritius pontok (t-érték) x c x c t SD SE n p-érték A p-értéket számítógépes programmal lehet kiszámolni 7. Döntés a) H a : elvetjük H0-t, a különbség szignifikáns 100%-os szinten. a) H 0 : nem vetjük el H0-t, a különbség nem szignifikáns 100%-os szinten. Döntés Konfidencia intervallum c nincs benne a konfidenicaintervallumban c benne van a konfidenicaintervallumban Kritius pontok (t-érték) p-érték t t p < t t p > Krisztina Boda 14
Eredmények az SPSS programmal One-Sample Statistics Age Age in years Std. Error N Mean Std. Dev iation Mean 137 20.87 3.071.262 One-Sample Test Age Age in years Test Value = 20 95% Confidence Interv al of the Mean Diff erence t df Sig. (2-tailed) Dif f erence Lower Upper 3.324 136.001.872.35 1.39 A t-érték és szabadságfok alapján történő döntéshez szükségünk van a t-táblázatra p-érték, Ha p<, a különbség szignifikáns, Ha p>, a különbség nem szignifikáns Krisztina Boda 15
Statisztika a magyar nyelven tanuló elsőéves orvostanhallgatók életkorára Case Processing Summary Kor Cases Valid Missing Total N Percent N Percent N Percent 244 100.0% 0.0% 244 100.0% Descriptives Kor Mean 95% Conf idence Interv al for Mean Lower Bound Upper Bound Stat istic Std. Error 19.25.110 19.03 19.46 5% Trimmed Mean Median Variance Std. Dev iation Minimum Maximum Range Interquartile Range Skewness Kurt osis 19.03 19.00 2.960 1.720 17 36 19 2 5.035.156 40.757.310 Mondhatjuk-e, hogy a magyar nyelven tanuló hallgatók átlagéletkora =20 év? Krisztina Boda 16
Egymintás t-próba a magyar populációra One-Sample Statistics Kor Std. Error N Mean Std. Dev iat ion Mean 244 19.25 1.720.110 One-Sample Test Kor Test Value = 20 95% Confidence Interv al of the Mean Diff erence t df Sig. (2-tailed) Dif f erence Lower Upper -6.847 243.000 -.754 -.97 -.54 Mondhatjuk-e, hogy a magyar nyelven tanuló hallgatók átlagéletkora =20 év? Krisztina Boda 17
Páros t-próba Adott két összetartozó minta, azaz ugyanazokon az egyedeken ugyanazt a változót kétszer megmérték önkontrollos kísérlet (kezelés előtti és utána adatok), vagy más módon összetartozó adatok pl. jobb oldal-bal oldal Vagy Illesztett párok- matched pairs (különböző személyek, de a kísérlet szempontjából párba állíthatók) Nullhipotézis: a két minta-átlag ugyanannak a populáció-átlagnak a közelítése, (nincs kezelés-hatás, a tapasztalt különbség véletlen) Alternatív hipotézis: van hatás Döntési szabály: Konfidenica intervallum a különbségre t-érték számítás és összehasonítás a táblázattal p-érték (szoftver) Krisztina Boda 18
Páros t-próba, példa Egy vizsgálat során egy speciális diéta hatását tesztelték. Szeretnénk ellenőrizni, vajon a diéta hatásos volt-e. A különbség-átlag=4 kg. Ez nagy vagy kis különbség? Véletlenül kaptunk-e ekkora eltérést (azaz, akár nulla is lehetne), vagy ekkora eltérést már nem minősíthetünk véletlen hatásnak? Before After Difference 85 86-1 95 90 5 75 72 3 110 100 10 81 75 6 92 88 4 83 83 0 94 93 1 88 82 6 105 99 6 Mean 90.8 86.8 4. SD 10.79 9.25 3.333 Krisztina Boda 19
Páros t-próba, példa (folytatás) Gondolatmenet: ha a kezelés nem hatásos, az átlagos különbség kicsi (közel 0). Ha a diéta hatásos, az átlagos különbség nagy. A populációra nézve ez a következő hipotéziseket jelenti: HO: előtt = után or különbség = 0 (c=0)!! HA: előtt után or különbség 0 Legyen =0.05. A szabadságfok=10-1=9, t táblázat =t 0.05,9 =2.262 átlag=4, SD=3.333 SE=3.333/ 10=1.054 Krisztina Boda 20
Páros t-próba, példa (folytatás) Döntés a konfidenciaintervallum alapján: 95%CI: (4-2.262*1.054, 4+2.262*1.054)=(1.615, 6.384) Ha H0 igaz, akkor a 0 benne van a konfidenciaintervallumban Most 0 nincs benne a 95%-os konfidenciaintervallumabn, ezért döntésünk az, hogy a különbség szignifikáns 5%- os szinten, a kezelés hatásos volt Az átlagos súlyveszteség 4 kg, ami akár 6.36 is lehetne, de minimum 1.615, 95% valószínűséggel. Krisztina Boda 21
Páros t-próba, példa (folytatás) Döntés a próbastatisztika alapján (t-érték: x c t SE x 0 4 SE 1.054 3.795 Azt hasonlítjuk a táblabeli kritikus értékhez. t =3.795>2.262(=t 0.05,9 ), a különbség szignifikáns 5%- os szinten Döntés p-érték alapján: p=0.004, p<0.05, a különbség szignifikáns 5%- os szinten Elfogadási tartomány t számított, próbastatisztika t tábla, kritikus érték Krisztina Boda 22
Példa. Tegyük fel, hogy 8 önként vállalkozó beteg kezelése során a következő systolés vérnyomásértékeket kaptuk (fiktív adatok) =0.05, és 7 -es szabadságfokhoz tartozó kritikus érték a t-eloszlás táblázatából t 0.025,7 =2.365. Kezelés előtt Kezelés után Különbség 170 150 20 160 120 40 150 150 0 150 160-10 180 150 30 170 150 20 160 120 40 160 130 30 d =21.25 s d =18.077 t =3.324 Döntés: t =3.324>2.365, tehát elvetjük H 0 -t és azt mondjuk, hogy a populáció átlagok közötti különbség szignifikáns 5 %-os szinten. A döntés hibája első fajta hiba, valószínűsége 0.05. 95%-os konfidencia-intervallum a különbségre: (6.137, 36.36) p-érték: p=0.013 Krisztina Boda 23
Példa az orvosi irodalomból Krisztina Boda 24
Krisztina Boda 25
Példa az orvosi irodalomból Krisztina Boda 26
Ellenőrző kérdések és feladatok A hipotézis fogalma Null- és alternatív hipotézis A hipotézisvizsgálat lépései Az egymintás t-próba null- és alternatív hipotézise Az egymintás t-próba döntési szabályai Az egymintás t-próba nullhipotézisének tesztelése konfidenciaintervallum alapján Az egymintás t-próba nullhipotézisének tesztelése t-érték alapján Az egymintás t-próba nullhipotézisének tesztelése p-érték alapján A p-érték jelentése Egy vizsgálatban, 10 egészséges nő systolsé vérnyomását vizsgálva, az átlag 119, a standard error 0.664. Feltéve, hogy a minta normális eloszlású populációból szármatik, ellenőrizzük, hogy a populáció-átlag 125-e? ( =0.05, t tábla =2.26). Egy új gyógyszer kipróbálásakor 5 betegen megmérték a systolés vérnyomást a gyógyszer beadása előtt és utána. Az átlagos különbség = 6, a különbségek standard errorja SE=4.65. Végezze el a megfelelő statisztikai próbát annak ellenőrzésére, hogy a két átlag között kimutatható-e szignifikáns különbség. ( =0.05, t tábla =2.57) Krisztina Boda 27
Hasznos WEB oldalak Klinikai Biostatisztikai Társaság http://www.biostat.hu Rice Virtual Lab in Statistics http://onlinestatbook.com/rvls.html Statistics on the Web http://www.claviusweb.net/statistics.shtml Hisztogram alakjának változása Old Faithful http://www.stat.sc.edu/~west/javahtml/histogra m.html Krisztina Boda 28