A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet
Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html 1 ötelemű mita vétele utá (2. sor) 1 átlagot kapok (3. sor) 1000 ötelemű mita vétele utá (2. sor) az 1000 átlag eloszlása közelítőe ormális (3. sor) Krisztia Boda 2
Mitavétel em ormális eloszlásból Krisztia Boda 3
Cetrális határeloszlás tétel Egy átlagú és szórású populációból vett agy elemszámú miták átlagai olya populációból származak, melyek eloszlása (az átlagolással yert új populáció eloszlása): közelítőe ormális eloszlású az átlaga (az összes lehetséges miták átlagaiak az átlaga) ugyaaz, mit a populáció átlaga,. A stadard deviáció kisebb az eredeti populáció stadard deviációjáál: függetleül az eredeti populáció eloszlásától : az átlag szórása, stadard error, SE Krisztia Boda 4
Stadard error számítása, ha em ismert Az x 1, x 2, x 3,, x statisztikai mita adatai alapjá a stadard error közelítő értékét a mita stadard deviációból számítjuk: SE SD i1 ~ ( x i x) ( 1) 2 Azt fejezi ki, hogy a populációból vett újabb miták alapjá számolt külöböző átlagok hogya igadozak az (ismeretle) populáció-átlag körül. Krisztia Boda 5
Stadard deviáció vagy stadard error?? Stadard deviáció, SD: a mita szórása, a mitaadatok szóródása az átlag körül. Normális eloszlás eseté az átlag 2SD- belül va az adatok kb. 95%-a Stadard error (SE=SD/): az átlag megbízhatósága, a mitaátlag szóródása az (ismeretle) populáció átlag körül. Normális eloszlás eseté az átlag 2SE- belül va az igazi átlag kb. 95%-os valószíűséggel. Krisztia Boda 6
SD vagy SE? 55.2 15.7 (SD) 55.21.57 (SE, =100) 0.26 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 Probability Desity Fuctio y=ormal(x;52.2;1.57) 1.0 0.8 0.6 0.4 0.2 0.00 20 40 60 80 0.0 49 23.8 86.6 52.2 58.34 Ebbe az itervallumba va az adatok 95.44%-a Ebbe az itervallumba va az igazi átlag 95.44%-os valószíűséggel Krisztia Boda 7
Ábratípusok a számolt jellemzők alapjá 85 Mea Plot (kerd97 20v*43c) 80 Átlag-szórás ábra 75 70 Átlag + SD Átlag + SE SULY 65 60 55 50 Átlag + 95% CI 45 fiú láy NEM Átlag SE Mea Mea±SE 85 Mea Plot (kerd97 20v*43c) 85 Mea Plot (kerd97 20v*43c) 80 80 75 75 70 70 SULY 65 60 SULY 65 60 55 55 50 50 45 fiú NEM láy Mea Mea±0.95 Cof. Iterval 45 fiú NEM láy Mea Mea±SD Átlag 95% CI Átlag SD Krisztia Boda 8
Statisztikai becslés A paraméter olya szám, amely egyértelműe jellemzi a sokaság eloszlását. Becslés: a mitaadatok alapjá kiszámítjuk azt a számot (statisztika- statistic), amely közelíti a sokaság megfelelő paraméterét. Pot-becslés: egyetle szám Pl. a mitaátlag a (ismeretle) populáció-átlag becslése. xi közelíti -t x SD x x... x 1 2 i 1 i1 ( x i x) 1 2 közelíti -t Krisztia Boda 9
Itervallum becslés, bizoyossági itervallum (kofidecia itervallum) Olya, a mitaelemekből számolt itervallum, amely agy valószíűséggel tartalmazza a populáció-paraméter valódi (ismeretle) értékét A megbízhatóság mértékét jelző agy valószíűség (kofidecia szit, megbízhatósági szit) tőlük függ. Szokásos értékei: 0.90, 0.95, 0.99 ) A becslés hibája (-val jelöljük) a megbízhatósági szit függvéyébe 1-0.90=0.10, 1-0.95=0.05, 1-0.99=0.01 Leggyakrabba haszált kofidecia szit 95% (0.95), tehát -ra leggyakrabba =0.05 értéket alkalmazzák. Krisztia Boda 10
A bizoyossági itervallum szemléltetése az adott kísérlet képzeletbeli ismétléseivel Ha a kísérletet képzeletbe 100-szor megismételék, a 100 kapott 95%-os kofidecia itervallum közül várhatóa (átlagosa) 95 fogja tartalmazi a populáció paraméterét, és 5 em http://www.kuleuve.ac.be/ucs/java/idex.htm Krisztia Boda 11
A populáció eloszlása Krisztia Boda 12
Hisztogram, átlag és 95%-os kofideciaitervallum egy, a populációból vett 30 elemű mita alapjá Krisztia Boda 13
Hisztogram, átlag és 95%-os kofideciaitervallum egy másik, a populációból vett 30 elemű mita alapjá Krisztia Boda 14
Hisztogram, átlag és 95%-os kofideciaitervallum egy harmadik, a populációból vett 30 elemű mita alapjá Krisztia Boda 15
Hisztogram, átlag és 95%-os kofideciaitervallum 100, a populációból vett 30 elemű mita alapjá Krisztia Boda 16
Hisztogram, átlag és 95%-os kofideciaitervallum 100 másik, a populációból vett 30 elemű mita alapjá Krisztia Boda 17
Beállítások: 1000 mitavétel Krisztia Boda 18
Kofidecia itervallum számítása ormális eloszlású sokaság átlagára (), ha a sokaság szórása () ismert Megmutatható, hogy így P(x u x u ) 1 (x u, x u ) (1-)100% szitű kofideciaitervallum -re. Itt u a stadard ormális eloszlás táblázatába az az érték, amely az eloszlás két végéből összese területet vág le (a közepé 1- területet hagy meg. =0.05 eseté u =1.96 =0.01 eseté u =2.58 95%-os kofideciaitervallum -re: (x 1.96, x 1.96 ) vagy ( x 1.96 SE, x 1.96 SE) Krisztia Boda 19
Példa Egy populációba az átlagos szívfrekveciát (per perc) szereték becsüli 36 pacies vizsgálata alapjá a mita-átlag 90, a stadard deviáció 15.5 (ismert). Feltéve, hogy a populáció ormális eloszlású, a 95 % -os kofidecia itervallum a populáció átlagára: =0.05, u =1.96, =15.5 Az alsó határ 90 1.96 15.5/ 36=90-1.96 15.5/6=90-5.063=84.937 A felső határ 90 + 1.96 15.5/ 36=90+1.96 15.5/6=90+5.063=95.064 A 95%-os kofidecia itervallum (84.94, 95.06) Ez azt jeleti, hogy az igazi (ismeretle) populáció átlag a (84.94, 95.06) itervallumba va, eek valószíűsége 95%. 95% biztosak vagyuk abba, hogy a szívfrekvecia populáció-átlag ebbe az itervallumba va. Krisztia Boda 20
Kofidecia itervallum a populáció átlagra, ha ismeretle Ha ismeretle, helyettesíthető a mita stadard deviációjával (SD). De ekkor már em haszálhatjuk u t, helyette t t kell haszáluk. (x SD t, x t SD ) (1-)100%-os kofideciaitervallum for -re. Itt t a Studet t-eloszlás -hoz és -1 szabadságfokhoz tartozó kritikus értéke (következő dia) Krisztia Boda 21
Studet-féle t-eloszlások df (degrees of freedom): szabadságfok=-1 Krisztia Boda 22
William Sealy Gosset, a t-eloszlás felfedezője Bor Jue 13, 1876, Died October 16, 1937 (aged 61) Emléktábla Dubliba Krisztia Boda 23
A t-eloszlás táblázata kétoldali alfa szabadságfok 0.2 0.1 0.05 0.02 0.01 1 3.077683537 6.313752 12.7062 31.82052 63.65674 2 1.885618083 2.919986 4.302653 6.964557 9.924843 3 1.637744352 2.353363 3.182446 4.540703 5.840909 4 1.533206273 2.131847 2.776445 3.746947 4.604095 5 1.475884037 2.015048 2.570582 3.36493 4.032143 6 1.439755747 1.94318 2.446912 3.142668 3.707428 7 1.414923928 1.894579 2.364624 2.997952 3.499483 8 1.39681531 1.859548 2.306004 2.896459 3.355387 9 1.383028739 1.833113 2.262157 2.821438 3.249836 10 1.372183641 1.812461 2.228139 2.763769 3.169273 11 1.363430318 1.795885 2.200985 2.718079 3.105807 Krisztia Boda 24
A t-eloszlás táblázata kétoldali alfa szabadságfok 0.2 0.1 0.05 0.02 0.01 0.001 1 3.077683537 6.313752 12.7062 31.82052 63.65674 636.6192 2 1.885618083 2.919986 4.302653 6.964557 9.924843 31.59905 3 1.637744352 2.353363 3.182446 4.540703 5.840909 12.92398 4 1.533206273 2.131847 2.776445 3.746947 4.604095 8.610302 5 1.475884037 2.015048 2.570582 3.36493 4.032143 6.868827 6 1.439755747 1.94318 2.446912 3.142668 3.707428 5.958816 7 1.414923928 1.894579 2.364624 2.997952 3.499483 5.407883... 100 1.290074761 1.660234 1.983971 2.364217 2.625891 3.390491... 500 1.283247021 1.647907 1.96472 2.333829 2.585698 3.310091... 1000000 1.281552411 1.644855 1.959966 2.326352 2.575834 3.290536 Krisztia Boda 25
Kofidecia itervallum a populáció átlagra, ha ismeretle Ilyekor -t a mitából számol stadard deviációval helyettesítjük Bebizoyítható, hogy SD i1 ( x i x) 1 2 így P(x SD SD t x t ) 1 SD (x t, x t SD (1-)100%-os kofidecia itervallum -re. Itt t a Studet t eloszlás -hoz és -1 szabadságfokhoz tartozó kritikus értéke ) Krisztia Boda 26
Példa Egy populációba az átlagos szívfrekveciát (per perc) szereték becsüli 36 pacies vizsgálata alapjá a mita-átlag 90, a stadard deviáció a mitaadatok alapjá: SD=15.5. Feltéve, hogy a populáció ormális eloszlású, a 95 % -os kofidecia itervallum a populáció átlagára: =0.05, SD=15.5 Szabadságfok: df=-1=36-1=35 t =2.0301 Az alsó határ: 90 2.0301 15.5/ 36=90-2.0301 2.5833=90-5.2444=84.755 A felső határ: 90 + 2.0301 15.5/ 36=90+2.0301 2.5833=90+5.2444=95.24 A 95%-os kofidecia itervallum (84.76, 95.24) Ez azt jeleti, hogy az igazi (ismeretle) populáció átlaga (84.76, 95.24) itervallumba va, eek valószíűsége 95%. 95% biztosak vagyuk abba, hogy a szívfrekvecia átlag ebbe az itervallumba va. Krisztia Boda 27
Összehasolítás Egy populációba az átlagos szívfrekveciát (per perc) szereték becsüli 13 pacies vizsgálata alapjá a mita-átlag 90, a stadard deviáció a mitaadatok alapjá: SD=15.5. Feltéve, hogy a populáció ormális eloszlású, a 95 % -os kofidecia itervallum a populáció átlagára: =0.05, SD=15.5 Szabadságfok: df=-1=13-1=12 t =2.179 Az alsó határ: 90 2.179 15.5/ 13=90-2.179 4.299=90-9.367=80.6326 A felső határ: 90 + 2.179 15.5/ 13=90+2.179 4.299=90+9.367=99.367 A 95%-os kofidecia itervallum (80.63, 99.36) Ez azt jeleti, hogy az igazi (ismeretle) populáció átlaga (80.63, 99.36) itervallumba va, eek valószíűsége 95%. 95% biztosak vagyuk abba, hogy a szívfrekvecia átlag ebbe az itervallumba va. Egy populációba az átlagos szívfrekveciát (per perc) szereték becsüli 36 pacies vizsgálata alapjá a mita-átlag 90, a stadard deviáció a mitaadatok alapjá: SD=15.5. Feltéve, hogy a populáció ormális eloszlású, a 95 % -os kofidecia itervallum a populáció átlagára: =0.05, SD=15.5 Szabadságfok: df=-1=36-1=35 t =2.0301 Az alsó határ: 90 2.0301 15.5/ 36=90-2.0301 2.5833=90-5.2444=84.755 A felső határ: 90 + 2.0301 15.5/ 36=90+2.0301 2.5833=90+5.2444=95.24 A 95%-os kofidecia itervallum (84.76, 95.24) Ez azt jeleti, hogy az igazi (ismeretle) populáció átlaga (84.76, 95.24) itervallumba va, eek valószíűsége 95%. 95% biztosak vagyuk abba, hogy a szívfrekvecia átlag ebbe az itervallumba va. Krisztia Boda 28
95%-os CI számítás, SPSS > t.test(magassag) R Oe Sample t-test data: magassag t = 140.1074, df = 60, p-value < 2.2e-16 alterative hypothesis: true mea is ot equal to 0 95 percet cofidece iterval: 168.5748 173.4580 sample estimates: mea of x 171.0164 Krisztia Boda 29
99%-os CI számítás, SPSS R > t.test(magassag, cof.level=0.99) Oe Sample t-test data: magassag t = 140.1074, df = 60, p-value < 2.2e-16 alterative hypothesis: true mea is ot equal to 0 99 percet cofidece iterval: 167.7692 174.2636 sample estimates: mea of x 171.0164 Krisztia Boda 30
Kofideciaitervallum más populációparaméterekre és becslésekre Nem csak a populáció-átlagra tuduk kofideciaitervallumot számítai. Létezik és számítható kofideciaitervallum pl. egy p valószíűségre, vagy valószíűségek külöbségére, a stadard deviációra, stb. Ezekek a számítását em tauljuk. Krisztia Boda 31
Az eredméyek közlése Krisztia Boda 32
%-ra voatkozó kofidecia-itervallum Krisztia Boda 33
Kérdések és feladatok A cetrális határeloszlás tétel Az átlag szórása számítása és jeletése (SE - stadard error of mea) A kofideciaitervallum fogalma A kofidecia szit Melyik szélesebb a 95%-os vagy a 99%-os kofideciaitervallum? Miért? Kofideciaitervallum számítása a populációátlagra ismeretle populációs stadard deviáció eseté Egy vizsgálatba 16 egészséges ő véryomásértékeit vizsgálták. A mitaátlag 121 volt, a mita stadard deviációja SD=8.2. Számítsuk ki a stadard errort. Egy vizsgálatba 16 egészséges ő véryomásértékeit vizsgálták. A mitaátlag 121 volt, a mita stadard errorja SE=0.664. Adjuk meg a populációátlagra voatkozó 95%-os kofideciaitervallumot! (=0.05, t tábla =2.26). Krisztia Boda 34
Haszos WEB oldalak Kliikai Biostatisztikai Társaság http://www.biostat.hu Rice Virtual Lab i Statistics http://oliestatbook.com/rvls.html Statistics o the Web http://www.claviusweb.et/statistics.shtml Krisztia Boda 35