[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát jellemzi (variancia, standard deviáció) (standard: szokásos, átlagos) Következtető statisztika: egy populáció tulajdonságaira következtet a minta elemzése segítségével. becslés hipotézis vizsgálat 1
Becslés Populációra vonatkozó paraméter becslése (µ, σ 2 ) a minta statisztika értékelésének (,σ ) segítségével Módszerek: pontbecslés intervallumbecslés Pontbecslés A minta segítségével egy érték meghatározása Nem ad információt a becsült érték és az ismeretlen populációs paraméter közötti távolságról pl.: a minta átlag = 5 (a populáció ismeretlen átlagértékének pontbecslése (µ)) 2
Intervallumbecslés Értékek egy tartományát mutatja (alsó határ, felső határ) a mintában lévő eredmények alapján Információt ad a becsült érték és az ismeretlen populációs paraméter közötti távolságról (valószínűség) pl.: a populáció ismeretlen átlaga 90%-os megbízhatóssággal 3 és 7 közé esik Az intervallumbecslés és elemei A minta statisztika (pontbecslés) Konfidencia intervallum (alsó határ felső határ) segítségével meghatározzuk, hogy egy populációra vonatkozó paraméter milyen valószínűséggel esik bele a konfidencia intervallumba. konfidencia=bizalom 3
Konfidencia intervallum σ +σ jelzi, hogy mennyire volt pontos egy mérés Jelzi, hogy mennyire biztos egy becslés Jelzi, hogy az ismételt mérés során az eredmény mennyire kerül közel a az eredetileg becsült értékhez mennyire vagyunk biztosak a becsült populációs paramétert illetően Konfidencia intervallum σ +σ A konfidencia intervallum meghatározásának lépései: A vizsgálni kívánt populációs paraméter kiválasztása (µ) Minta gyűjtése a populációból A minta átlagának és szórás értékének kiszámolása (, ) Konfidencia szint megadása (Z) (90%, 95%, 99%) A középérték standard hibája: = (a mintaeloszlás átlagának várható szórása (a mintaeloszlás varianciája) A hibahatár kiszámolása: á = éé kritikus érték (Z a/2 ): Z érték, ami a konfidencia szint feléhez tartozik (pl. 0.9/2) Konfidencia intervallum = minta statisztika ± hibahatár! " +! " 4
A konfidencia intervallum szélességét befolyásoló tényezők az intervallum szélessége 0! " ó2, +0! " 3 az adatok szóródása (σ) A minta mérete (n) = konfidencia szint (megbízhatósági szint) : (1 - α) Befolyásolja a Z értékét Konfidencia szint (megbízhatósági szint) Annak valószínűsége, hogy az ismeretlen populációs paraméter (pl. µ) a konfidencia intervallumba esik: (1 - α) α (szignifikancia szint) annak valószínűsége, hogy az ismeretlen populációs paraméter nem esik a konfidencia intervallumba (pl. 0.05 azaz 5%) 5
Konfidencia intervallum 0.45 ϕ(µ) 0.4 0.35 0.3 0.25 0.2 0.15 (1-α)/2 (1-α)/2 0.1 0.05 α/2 α/2 0-4 -3-2 -1 0 1 2 3 4 µ 0.4 0.3 φ x 0.2 0.1 95% 2.5% 2.5% 0.0-5 0 5 -Z (0.975) = -1.96 x +Z (0.975) = 1.96 6
Z-táblázat Az átlaghoz (µ) tartozó konfidencia intervallum meghatározása ismert σ esetén Alap feltevések A populáció szórása ismert A populációs paraméter normál eloszlású (ha nem normális eloszlású, akkor azzal közelíthető (n 30) Konfidencia intervallum 05 6 7 + 05 6 7
A populációs átlaghoz (µ) tartozó konfidencia intervallum meghatározása ismert σ esetén A véletlenszerű mintavétel (n=50) átlaga = 75. Állapítsuk meg a µ-re vonatkozó 95 %-os konfidencia intervallumot abban az esetben ha σ = 15. 05 6 7 + 05 6 75 1.96 15 50 7 75+1.96 15 50 >?.@A >B.CD Hipotézis vizsgálat Döntéshozás (igazolása vminek) egy feltételezés, megállapítás érvényességéről pl. a nők (populáció) 25% -nak (paraméter: mennyiségi változó) van viszere kategorikus változó (pl. viszeres vagy nem) számszerűsíthető változó (pl. 120 Hgmm vagy nem) a döntés érvényességi határainak megbecslése A hipotézisvizsgálat vonatkozhat két sokaság esetében a paramétereinek (átlag, szórás) egyenlőségére a véletlen változók eloszlásának azonosságára az eloszlások függetlenségére a változók közötti kapcsolatra a változók trendjére, arányára 8
Hipotézis vizsgálat A véletlen szerepének vizsgálata.! Null hipotézis (H 0 ): a tapasztalt különbségek a véletlennek tulajdoníthatóak. nincs különbség a vizsgált értékek között. H 0 : µ = x Alternatív hipotézis (H 1 ): a tapasztalt különbségek alternatív magyarázata (nem a véletlennek tulajdoníthatóak a különbségek). a tapasztalt különbségek nem a véletlennek tulajdoníthatóak. van különbség a vizsgált értékek között. Egymintás vagy kétmintás próba Kétoldalú (H 1 : µ x) vagy egyoldalú (H 1 : x > µ; H 1 : x < µ) próba Statisztikai következtetés H 0 igaz H 0 hamis elfogadom jó döntés másodfajú hiba (β) fals negatív eredmény elvetem elsőfajú hiba (α: szignifikancia szint) fals pozitív eredmény jó döntés 9
Előjel próba Két különböző aszpirin egyformán viselkedik e? H 0 : két fajta aszpirin koncentrációja a vizeletben azonos, az esetleges különbség véletlen hatásoknak tulajdonítható H 0 : μ 1 = μ 2 ; azaz μ 1 μ 2 =0 H 1 : a két aszpirin készítmény nem egyforma, koncentrációjuk a vizeletben eltérő: H 1 : μ 1 μ 2 ; azaz μ 1 - μ 2 0 Előjel próba sorszám aszpirin A (mg%)aszpirin B (mg%)különbség(mg%) előjel előjel n + előjelek száma P kumulatív P P (%) kumulatív P (%) 1 15 13 2 + + 10 0 0.00 0.00 0.05 0.05 2 26 20 6 + - 1 1 0.01 0.01 0.54 0.59 3 13 10 3 + 2 0.03 0.03 2.69 3.27 4 28 21 7 + 3 0.08 0.11 8.06 11.33 5 17 17 0! 4 0.16 0.27 16.11 27.44 6 20 22-2 - 5 0.23 0.50 22.56 50.00 7 7 5 2 + 6 0.23 0.73 22.56 72.56 8 36 30 6 + 7 0.16 0.89 16.11 88.67 9 12 7 5 + 8 0.08 0.97 8.06 96.73 10 18 11 7 + 9 0.03 0.99 2.69 99.41 11 21 16 5 + 10 0.01 1.00 0.54 99.95 12 17 11 6 + 11 0.00 1.00 0.05 100.00 átlag 19.2 15.3 3.9 szórás 7.8 7.2 2.9 A gyógyszert ugyanaz a beteg kapta 2 hét eltéréssel! 10
Előjel próba Binomiális eloszlás: Diszkrét (megszámlálható) valószínűségi változó (véletlentől függő számértékeket (értékek sokasága) felvevő változó; ξ, η, x). (pl. x = {0,1,2,3,4,5,6,7,8,9,10,11}) eloszlása valószínűségi változó: a + előjel előfordulásának gyakorisága Az elvégzet vizsgálat (kísérlet) száma (n=11) rögzített Minden kísérlethez két kimenetel társítható: siker vagy kudarc (+ vagy -). Minden kísérlet esetén a siker valószínűsége azonos (p=0.5) Az elvégzett kísérletek függetlenek egymástól Előjel próba sorszám aszpirin A (mg%)aszpirin B (mg%)különbség(mg%) előjel előjel n + előjelek száma P kumulatív P P (%) kumulatív P (%) 1 15 13 2 + + 10 0 0.00 0.00 0.05 0.05 2 26 20 6 + - 1 1 0.01 0.01 0.54 0.59 3 13 10 3 + 2 0.03 0.03 2.69 3.27 4 28 21 7 + 3 0.08 0.11 8.06 11.33 5 17 17 0! 4 0.16 0.27 16.11 27.44 6 20 22-2 - 5 0.23 0.50 22.56 50.00 7 7 5 2 + 6 0.23 0.73 22.56 72.56 8 36 30 6 + 7 0.16 0.89 16.11 88.67 9 12 7 5 + 8 0.08 0.97 8.06 96.73 10 18 11 7 + 9 0.03 0.99 2.69 99.41 11 21 16 5 + 10 0.01 1.00 0.54 99.95 12 17 11 6 + 11 0.00 1.00 0.05 100.00 átlag 19.2 15.3 3.9 szórás 7.8 7.2 2.9 11
Előjel próba µ=np µ=11*0.5 = 5.5 σ= (G(1 G)) σ= (11 0.5 (1 0.5))=1.375 0.25 0.20 P(x=k) 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 7 8 9 10 11 x = k Vége! 12