A biostatisztika alapfogalmai, valószínűségszámítási alapok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Hasonló dokumentumok
Biomatematika 2 Orvosi biometria

A valószínűségszámítás elemei

[Biomatematika 2] Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A valószínűségszámítás elemei

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Valószínűségszámítás összefoglaló

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Valószínűségi változók. Várható érték és szórás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

6. Előadás. Vereb György, DE OEC BSI, október 12.

Normális eloszlás tesztje

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

[Biomatematika 2] Orvosi biometria

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Területi sor Kárpát medence Magyarország Nyugat-Európa

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Abszolút folytonos valószín ségi változó (4. el adás)

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Kísérlettervezés alapfogalmak

BIOMATEMATIKA ELŐADÁS

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Készítette: Fegyverneki Sándor

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Biostatisztika VIII. Mátyus László. 19 October

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Biomatematika 2 Orvosi biometria

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Segítség az outputok értelmezéséhez

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Kísérlettervezés alapfogalmak

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Nemparaméteres próbák

Valószín ségszámítás és statisztika

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Biostatisztika Összefoglalás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

11.Négymezős táblázatok. Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

egyetemi jegyzet Meskó Balázs

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

[Biomatematika 2] Orvosi biometria

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Gyakorló feladatok a 2. dolgozathoz

A Statisztika alapjai

(Independence, dependence, random variables)

Folyadékszcintillációs spektroszkópia jegyz könyv

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Adatok statisztikai értékelésének főbb lehetőségei

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Statisztikai becslés

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

NEVEZETES FOLYTONOS ELOSZLÁSOK

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Számítógépes döntéstámogatás. Statisztikai elemzés

Biostatisztika Összefoglalás

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Valószín ségszámítás és statisztika

Gazdasági matematika II. vizsgadolgozat, megoldással,

Diagnosztikus tesztek értékelése

( 1) i 2 i. megbízhatóságú a levont következtetése? A matematikai statisztika eszközeivel értékelje a kapott eredményeket!

Hipotézis vizsgálatok

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Átírás:

A biostatisztika alapfogalmai, valószínűségszámítási alapok Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Véletlen kísérlet A kimenetele nincs egyértelműen meghatározva az általunk meghatározott feltételekkel. Példa kísérletre: pénzdobás, kockadobás, egy oldat koncentrációjának mérése, egy állat testsúlyának a mérése. A kísérleteknek több, néha végtelen sok kimenetele lehetséges. Krisztina Boda 2

Esemény: a kísérlet kimenetele Elemi esemény: egy kísérlet lehetséges kimenetele. Összetett esemény: elemi eseményekre bontható. Biztos esemény (W ): mindig bekövetkezik. Lehetetlen esemény ( ): sohasem következik be. Példa. Kockadobás kísérlet esetén: Az elemi események 1,2,3,4,5,6. Összetett események pl.: E1={1,3,5} (a kimenetel páratlan szám). E2={2,4,6} (a kimenetel páros szám). E3={5,6} (a kimenetel 4-nél nagyobb szám). W={1,2,3,4,5,6} (a kimenetel a biztos esemény). Krisztina Boda 3

Műveletek eseményekkel Egy A esemény kiegészítő eseménye az az A esemény, amely akkor következik be, amikor A nem következik be. Pl. E 1 = 1, 3, 5 ={2,4,6} Az A és B események összege az az A+B esemény, amely akkor következik be, ha vagy A, vagy B bekövetkezik. E1+E2={1,3,5}+{2,4,6}={1,2,3,4,5,6} E1+E3={1,3,5}+{5,6}={1,3,5,6} Az A és B események szorzata az az AB esemény, amely akkor következik be, ha A is és B is bekövetkezik. E1 E2={1,3,5} {2,4,6}= E1 E3={1,3,5} {5,6}={5} Ha A B =, akkor A és B-t kizáró eseményeknek nevezzük. Krisztina Boda 4

A valószínűség heurisztikus elve Ismételjünk meg egy kísérletet n-szer ugyanazon feltételek mellett, egymástól függetlenül, és figyeljük meg, hányszor következik be az A esemény (k-szor) (0 k n). k : az A esemény gyakorisága. k/n : az A esemény relatív gyakorisága. 0 k/n 1 Ha n nagy, a k/n egy adott számot fog megközelíteni, Ezt a számot az A esemény valószínűségének nevezzük és P(A)-val jelöljük. 0 P(A) 1 A valószínűség heurisztikusan tehát az a 0 és 1 közötti szám, amit a kísérlet képzeletbeli ismétlései során kapott relatív gyakoriságok sorozata megközelít, miközben az ismétlések számát növeljük. Krisztina Boda 5

Példa: egy szabályos pénzérme feldobása k: a fej eredmények száma n= 10 100 1000 10000 100000 k= 7 42 510 5005 49998 k/n= 0.7 0.42 0.51 0.5005 0.49998 P( fej )=0.5 1 0.5 k/n 0 10 100 1000 10000 Krisztina Boda 6

Krisztina Boda Biostat 4. 7 0 0.2 0.4 0.6 0.8 1 1.2 1 21 41 61 81 101 121 141 161 181 201 221 241 261 281 301 321 341 361 381 401 421 441 461 481 501 521 541 561 581 601 621 641 661 681 701 721 741 761 781 801 821 841 861 881 901 921 941 961 981 0 0.2 0.4 0.6 0.8 1 1.2 1 21 41 61 81 101 121 141 161 181 201 221 241 261 281 301 321 341 361 381 401 421 441 461 481 501 521 541 561 581 601 621 641 661 681 701 721 741 761 781 801 821 841 861 881 901 921 941 961 981 0 0.5 1 1 20 39 58 77 96 115 134 153 172 191 210 229 248 267 286 305 324 343 362 381 400 419 438 457 476 495 514 533 552 571 590 609 628 647 666 685 704 723 742 761 780 799 818 837 856 875 894 913 932 951 970 989

A valószínűség tulajdonságai A valószínűség egy 0 és 1közötti szám Egy esemény összes lehetséges kimenetelének együttes valószínűsége 1. Az A esemény kiegészítő eseményének valószínűsége 1-P(A) Krisztina Boda 8

Szabály a valószínűség kiszámítására Feltétel: minden elemi esemény egyformán valószínű P(A) kedvező kimenetelek száma összeslehetséges kimenetel száma Példák: Kockadobás. Mi az 5-ös dobás valószínűsége? P(5-ös dobás)=1/6. Mi a páratlan dobás valószínűsége? P(páratlan)=3/6=1/2. Krisztina Boda 9

Populáció (sokaság), minta Populáció: azoknak az egyedeknek, objektumoknak az összessége, amelyről egy vizsgálat során információt kívánunk nyerni. Minta: a sokaság azon részhalmaza, amelyet éppen vizsgálunk A minta kiválasztásakor arra törekszünk, hogy lehetőleg reprezentálja az egész populációt, vagy legalábbis következtetni lehessen a populációra. Követelmény a mintaelemek függetlensége is. Krisztina Boda 10

Példák Adathalmazok Minta Gyógyszerészhallgatók egy csoportja által kitöltött kérdőívek 20 egészséges nő vérnyomásértékei Sokaság Gyógyszerészhallgatók hallgatók Általában az egészséges nők vérnyomása Krisztina Boda 11

Percent Minta Kategóriás változó lehetséges értékeinek gyakoriságai, relatív gyakoriságai (megközelíti) Sokaság A változó (sokaság) eloszlását Valid male f emale Total 100 80 60 Gender Gender Cumulativ e Frequency Percent Valid Percent Percent 20 23.0 23.0 23.0 67 77.0 77.0 100.0 87 100.0 100.0 77 A relatív gyakoriság (százalék) az esemény valószínűségét közelíti 40 20 23 0 male female Krisztina Boda 12

Frequency Frequency Minta Egy folytonos változóról készített hisztogram (megközelíti) Sokaság A folytonos változó eloszlását (sűrűségfüggvényét) 30 Body height 30 Body height 20 20 10 Std. Dev = 8.52 Mean = 170.4 0 N = 87.00 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 Body height 10 Std. Dev = 8.52 Mean = 170.4 0 N = 87.00 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 Body height Krisztina Boda 13

Frequency Minta Átlag (x) Standard deviáció (SD) Medián 30 20 Body height (megközelíti) Sokaság Sokaság-átlag (ismeretlen) A sokaság standard deviációja (ismeretlen) A sokaság mediánja (ismeretlen) 10 Std. Dev = 8.52 Mean = 170.4 0 N = 87.00 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 Body height Krisztina Boda 14

Eloszlások Elméleti eloszlások a populáció eloszlásai

A valószínűségszámítás és a statisztika kapcsolata A valószínűségszámításban a kérdés mindig az, hogy egy ismertnek feltételezett világban hogyan zajlanak a történések, a statisztikában pedig megfigyelünk bizonyos történéseket, és azt próbáljuk kideríteni, hogy milyen is az a világ, amelyben ezek a történések végbemennek. (Reiczigel Jenő, Biostatisztika nem statisztikusoknak 85. o.) Krisztina Boda 16

Valószínűségi változók Egy valószínűségi változó olyan változó, amelynek az értéke egy véletlen jelenség számmal jellemezhető kimenetele. Jelölés: X, Y,.. Más szóval, a valószínűségi változó egy olyan függvény, amely az elemi eseményekhez számot rendel. X: W R Példák A pénzdobás kísérlete esetén. X(fej)=1 és X(írás)=2 Y(fej)=-10 and Y(írás)=10 A kockadobás kísérlete esetén W={1,2,3,4,5,6}. Legyen X az a szám, amelyet a kocka mutat. Krisztina Boda 17

Diszkrét valószínűségi változó Az X valószínűségi változót diszkrétnek (kategóriás) nevezzük, ha a lehetséges értékeinek száma véges sok. Az X változó valószínűségi eloszlása megmutatja, hogy melyek az X lehetséges értékei és azokat milyen valószínűséggel veszi fel: X lehetséges értékei: x 1 x 2 x 3 x n Hozzátartozó valószínűségek: p 1 p 2 p 3 p n p i 0, p 1 + p 2 +p 3 +p n =1 Krisztina Boda 18

Példák Pénzdobás. p 1 =0.5, p 2 =0.5 Kockadobás. p 1 =1/6, p 2 =1/6,, p 6 =1/6 1 0.5 1 0.5 0 x1 x2 0 x1 x2 x3 x4 x5 x6 Ez a két eloszlás amellett, hogy diszkrét, még egyenletes is, mivel minden valószínűség egyenlő. Krisztina Boda 19

Az elméleti eloszlások közelítése tapasztalati eloszlásokkal Ha nem ismerjük az elméleti valószínűségeket, ezeket a kísérletekből nyert relatív gyakoriságokkal közelíthetjük. Például a pénzdobás kísérlete esetén szabályos érmét feltételezve a változó elméleti eloszlása p 1 = 0.5, p 2 = 0.5. 1 0.5 0 x1 100 ismétlésből k 1 =52 fej és k 2 =48 írás lett az eredmény, tehát k 1 /100=0.52 és k 2 /100=0.48. Ez a változó tapasztalati eloszlása x2 1 0.5 0 x1 x2 Krisztina Boda Biostat 4.

Két kockával dobás Legyen az X valószínűségi változó a két dobás összege, melyek 2-12 közötti értékeket vehetnek fel, összesen 36- féleképpen: j=1 j=2 j=3 j=4 j=5 j=6 i=1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) X 2 3 4 5 6 7 i=2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) X 3 4 5 6 7 8 i=3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) X 4 5 6 7 8 9 i=4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) X 5 6 7 8 9 10 i=5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) X 6 7 8 9 10 11 i=6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) X 7 8 9 10 11 12 a változó eloszlása diszkrét, de nem egyenletes 6 5 4 /36 3 2 1 0 P(X=1) P(X=2) P(X=3) P(X=4) P(X=5) P(X=6) P(X=7) P(X=8) P(X=9) P(X=10) P(X=11) P(X=12) Krisztina Boda 21

Speciális diszkrét eloszlás: binomiális eloszlás 1. A kísérletünk egy olyan eseménnyel kapcsolatos, amelynek csak 2 kimenetele van (pl. sikeres, sikertelen) 2. A siker valószínűsége, p, konstans kísérletről kísérletre 3. Sok kísérletet végzünk, egymástól függetlenül Mi a valószínűsége, hogy n számú ismétlés során k számú legyen a sikeres? n k n k B( n, k) Pk P( X k) p q, k 0,1,..., n k n n n n k! k!( n k)!,! 1 2... M(X)=np, D(X)=np(1-p)=npq Pl. Bizonyos populációban egy bizonyos betegség előfordulása 30%. Mi a valószínűsége, hogy egy n=10 elemű mintában pontosan k=4 ilyen beteg lesz? Krisztina Boda 22

"sikeres" esetek száma Valószínűség eloszlás Eloszlásfüggvény "Siker" valószínűsége 0 0.000976563 0.000976563 0.5 1 0.009765625 0.010742188 2 0.043945313 0.0546875 3 0.1171875 0.171875 4 0.205078125 0.376953125 5 0.24609375 0.623046875 6 0.205078125 0.828125 7 0.1171875 0.9453125 8 0.043945313 0.989257813 9 0.009765625 0.999023438 10 0.000976563 1 Összesen 1 Valószínűség eloszlás Eloszlásfüggvény 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 Binomiális eloszlás n=10, p változtatható, k=0,1,,10 Krisztina Boda 23

"sikeres" esetek száma Valószínűség eloszlás Eloszlásfüggvény "Siker" valószínűsége 0 0.028247525 0.028247525 0.3 1 0.121060821 0.149308346 2 0.233474441 0.382782786 3 0.266827932 0.649610718 4 0.200120949 0.849731667 5 0.102919345 0.952651013 6 0.036756909 0.989407922 7 0.009001692 0.998409614 8 0.001446701 0.999856314 9 0.000137781 0.999994095 10 5.9049E-06 1 Összesen 1 Valószínűség eloszlás Eloszlásfüggvény 1 1 0.8 0.6 0.8 0.6 0.4 0.4 0.2 0.2 0 0 1 2 3 4 5 6 7 8 9 10 11 0 0 1 2 3 4 5 6 7 8 9 10 11 Binomiális eloszlás n=10, p változtatható, k=0,1,,10 Pl. Bizonyos populációban egy bizonyos betegség előfordulása 30%. Mi a valószínűsége, hogy egy n=10 elemű mintában pontosan k=4 ilyen beteg lesz? Krisztina Boda 24

Binomiális eloszlások (p:annak valószínűsége, hogy az esemény sikeres, n=ismétlések száma) n=10, p=0.3 n=10, p=0.5 Krisztina Boda Biostat 4. 25

Binomiális eloszlások (p:annak valószínűsége, hogy az esemény sikeres, n=ismétlések száma) n=20, p=0.5 n=100, p=0.5 Krisztina Boda Biostat 4. 26

Poisson eloszlás ritka események száma Véges időszak, véges térrészben levő események, a mintában levő, adott tulajdonságú egyedek számának eloszlása Pl. a mikroszkóp látómezejében lévő vérsejtek száma A tér egy kiválasztott részében a halak száma Adott darab süteményben a mazsolák száma A Poisson eloszlás értelmezhező a binomiális eloszlás határeseteként, ha n nagy és az np= állandó. P( X k) f ( k) k e k! A képletben az eloszlás várható értéke és és varianciája is. Krisztina Boda 27

Pl. egy bizonyos betegségben a új előfordulások száma havonta átlagosan 3. Feltéve, hogy az új betegségek számának előfordulása Poisson eloszlást követ, mi a valószínűsége, hogy egy adott hónapban nem betegszik meg senki (0.0498) egy adott hónapban pontosan 2 új megbetegedés lesz (0.224) Az események száma Valószínűség eloszlás Eloszlásfüggvény Egy adott egységre eső események átlaga 0 0.049787068 0.049787068 3 1 0.149361205 0.199148273 2 0.224041808 0.423190081 3 0.224041808 0.647231889 4 0.168031356 0.815263245 5 0.100818813 0.916082058 6 0.050409407 0.966491465 7 0.021604031 0.988095496 8 0.008101512 0.996197008 9 0.002700504 0.998897512 10 0.000810151 0.999707663 Összesen 0.999707663 Valószínűség eloszlás Eloszlásfüggvény 1 0.8 0.6 0.4 0.2 1 0.8 0.6 0.4 0.2 0 0 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 10 11 Krisztina Boda 28

Feltételes valószínűség: definíció Legyen adott két esemény, A és B (P(B)>0). Végezzük el n-szer egymástól függetlenül azt a kísérletet, amellyel ez a két esemény kapcsolatos. Válasszuk ki azokat az eseteket, amelyekben az B esemény bekövetkezett. Ezek száma k B, az B esemény gyakorisága. Ez utóbbi esetek némelyikében az A esemény is bekövetkezett, ezek száma k AB. E két gyakoriság hányadosa stabilitást mutat, ha a kísérletek számát növeljük. A P(AB)/P(B) számot az A eseménynek a B eseményre vonatkoztatott feltételes valószínűségének nevezzük és a következőképpen jelöljük: P k k AB B k AB k n n B P(AB) P(B) ( A B) P( A B) P( B) Krisztina Boda Biostat 4. 29

Feltételes valószínűség és függetlenség Az A és B eseményeket függetlennek nevezzük egymástól, ha az A-nak B-re vonatkoztatott feltételes valószínűsége nem függ B-től: Ebben az esetben P( A B) P( A) így P( A B) P( A B) P( A) P( B) P( A B) P( A) P( B) Tehát ha két esemény független, akkor szorzatuk valószínűsége megegyezik a valószínűségeik szorzatával. Krisztina Boda Biostat 4. 30

Példa Két kockát, egy fehéret és egy pirosat dobunk fel egyszerre. Mi a valószínűsége, hogy mindkettőn 6-os az eredmény? Az összes lehetséges eset száma: 6*6=36 Kedvező esetek száma: 1 P( 6 mindkettőn)=1/36 Mi a valószínűsége, hogy a piros kockát 6 az eredmény, FELTÉVE, hogy a fehéren is 6-os az eredmény? (Feltételes valószínűség) A: az eredmény 6 a fehér kockán. P(A)=1/6 B: az eredmény 6 a piros kockán. P(B)=1/6 AB: az eredmény 6 a mindkét kockán. P(AB)=1/36 1 P( AB) 36 6 1 P( A B) P( B) 1 36 6 6 Most P(AB)=P(A)P(B). Tehát A és B függetlenek. Krisztina Boda Biostat 4. 31

Feltételes valószínűség: példa 20 páciens bizonyos labortesztjének az eredménye a következő: Teszt: + + + + + - - - - - - - - - - - - - - - Mi a pozitív teszteredmény valószínűsége? P(+)~5/20=0.25. De azt is tudjuk, hogy melyik páciens beteg valójában: Teszt: + + + + + - - - - - - - - - - - - - - - Betegség: B B B E E B B B E E E E E E E E E E E E Mi a pozitív teszteredmény valószínűsége, feltéve, hogy az illető beteg? Ekkor csak a betegek közül válogatjuk ki a pozitív teszteredményt: P(T + B)=3/6 A definíciónak megfelelő számítás P( T P( T B) P( B) 3 20 6 20 0.5 Ezek a számok egy 2x2-es táblázatba írhatók. B) 3 6 Teszt Pozitív + 3 2 5 Negatív - 3 12 15 6 Beteg Igen (B) Nem ( E) 14 20 Krisztina Boda Biostat 4. 32

Feltételes valószínűség: Példa 2 Példa. A következő táblázat egy bizonyos laboratóriumi teszt eredményeit mutatja a betegség csoportjaiban. Mi a valószínűsége, hogy a teszt pozitív eredményt ad, feltéve, hogy az illető valóban beteg? Jelölések B: Beteg E: Egészséges T + : a teszt pozitív T - : a teszt negatív Teszt Pozitív + 15 10 25 Negatív - 5 70 75 20 Beteg Igen (B) Nem ( E) 80 100 P( T B) P P( T B) P( B) 0. 75 P( A B) ( A B) P( B) 15 100 20 100 15 20 Krisztina Boda Biostat 4. 33

Feltételes valószínűség: Példa 3 Példa. A következő táblázat egy bizonyos laboratóriumi teszt eredményeit mutatja a betegség csoportjaiban. Mi a valószínűsége, hogy a teszt negatív eredményt ad, feltéve, hogy az illető valójában egészséges? Jelölések B: Beteg E: Egészséges T + : a teszt pozitív T - : a teszt negatív Teszt Pozitív + 15 10 25 Negatív - 5 70 75 20 Beteg Igen (B) Nem ( E) 80 100 P( T E ) P P( T E) P( E ) 0. 875 P( A B) ( A B) P( B) 70 100 80 100 70 80 Krisztina Boda Biostat 4. 34

Diagnosztikus tesztek A diagnosztikai eljárások valamely vizsgáló módszer, mérés (teszt) alapján következtetnek egy betegség fennállására. Ehhez szükség van egy standard tesztre, amelyet referenciának tekintünk, és amihez az általunk vizsgált új teszt eredményét hasonlítjuk. A megbízhatóság mérése a két mérési teszt eredményeinek az egyezésén alapul. Ugyanazokon a személyeken mért standard (és objektív) referencia teszt és az általunk aktuálisan vizsgált (új) teszt eredményét hasonlítjuk össze. 35 Krisztina Boda

Kereszt-osztályozás A referencia teszt Az általunk vizsgált (új) teszt eredménye Pozitív (beteg) Negatív (nem beteg) Pozitív VP Valódi pozitív (a) ÁP Álpozitív (b) Össz pozitív (a + b) Negatív ÁN Álnegatív (c) VN Valódi negatív (d) Össz negatív (c + d) Összes beteg (a + c) Összes nem beteg (b + d) Összes eset (n=a+b+c+d) Vigyázat! A táblázat egyes könyvekben fordítva jelenik meg, a sorok és oszlopok felcserélődnek. A táblázatból származtatott mutatók formulái ennek megfelelően módosulhatnak, a jelentésük és értékük természetesen nem változik! 36 Krisztina Boda

Mérőszámok a diagnosztikai tesztek pontosságára/megbízhatóságára Szenzitivitás és specificitás Pozitív és negatív prediktív érték A ROC görbe alatti terület.. 37 Krisztina Boda

Szenzitivitás, érzékenység A referencia teszt oldaláról nézve a teszt szenzitivitása vagy érzékenysége a tesztnek azon képessége, hogy helyesen diagnosztizálja a valóban betegeket, azaz, az összes beteg közül a teszt által betegnek minősített esetek aránya (valódi pozitív/összes beteg). Az általunk vizsgált (új) teszt eredménye A referencia teszt Pozitív (beteg) Negatív (nem beteg) Pozitív a b a + b Negatív c d c + d a + c b + d n Szenzitivitás = a/(a + c) 100% valódi pozitív esetek száma / összes beteg száma Krisztina Boda 38

Specificitás, specifikusság A teszt specifitása a teszt azon képessége, hogy helyesen ismerje fel a nem-betegeket az összes nem-beteg eset közül: az összes kontroll közül a teszt által negatívnak minősített esetek aránya (valódi negatív/összes kontroll). Az általunk vizsgált (új) teszt eredménye A referencia teszt Pozitív (beteg) Negatív (nem beteg) Pozitív a b a + b Negatív c d c + d a + c b + d n Specificitás = d/(b + d) 100% valódi negatív esetek száma / összes kontroll száma Krisztina Boda 39

Prediktív (jósló) értékek - Predictive values A teszt oldaláról nézve azt is vizsgálhatjuk, hogy mi a valószínűsége annak, hogy a teszt helyes diagnózist adott. 40 Krisztina Boda

Pozitív prediktív érték A pozitív prediktív érték (PPV Positive Predictive Value) az összes, a teszt által pozitívnak minősített esethez képest a valódi pozitív esetek aránya (Valódi pozitív/összes pozitív). Például egy 80%-os pozitív prediktív érték azt jelenti, hogy a teszt által pozitívnak minősített személyek közül 80% valóban beteg. Az általunk vizsgált (új) teszt eredménye A referencia teszt Pozitív (beteg) Negatív (nem beteg) Pozitív a b a + b Negatív c d c + d a + c b + d n PPV = a / (a + b) 100% a valódi pozitív esetek száma /össz pozitív Krisztina Boda 41

Negatív prediktív érték A negatív prediktív érték (NPV Negative Predictive Value) az összes, a teszt által negatívnak minősített esethez képest a valódi negatív esetek aránya (Valódi negatív/összes negatív). Az általunk vizsgált (új) teszt eredménye A referencia teszt Pozitív (beteg) Negatív (nem beteg) Pozitív a b a + b Negatív c d c + d a + c b + d n NPV = d / (c + d) 100% a valódi negatív esetek száma /össz negatív Krisztina Boda 42

A diagnosztikus tesztek legfontosabb mérőszámai Szenzitivitás= a/(a+c) 100% P(T + B) = P(T + B)/P(B) Specificikusság= d/(b+d) 100% P(T - E ) = P(T - E )/P(E ) Pozitív prediktív érték= a/(a+b) 100% Negatív prediktív érték = d/(c+d) 100% Validitás = (a+d)/(a+b+c+d) 100% Álnegatívitási arány= c/(a+c) 100% ; Álpozitívitási arány= b/(b+d) 100% ; Új teszt A referencia teszt Pozitív (B) Negatív (E) Pozitív a b a + b Negatív c d c + d a + c b + d n Valódi pozitív esetek száma: a Valódi negatív esetek száma : d Álpozitív esetek száma : b Álnegatív esetek száma : c Krisztina Boda Biostat 4. 43

Példa a diagnosztikus tesztek mérőszámainak számítására Szenzitivitás= a/(a+c) 100% =15/20 100% = =75% Specificitás= d/(b+d) 100% =70/80 100% = =87.5% Pozitív prediktív érték= a/(a+b) 100%= =15/25 100%=60% Negatív prediktív érték = d/(c+d) 100%= =70/75 100%=93.3% Validitás =(a+d)/(a+b+c+d) 100%=85% Álnegativitási arány= c/(a+c) 100%= =5/20 100%=25% Álpozitivitási arány= b/(b+d) 100%= =10/25 100%=40% Új teszt Referencia teszt Pozitív (B) Negatív (E) Positív a=15 b=10 25 Negatív c=5 d=70 75 20 80 100 Valódi pozitív esetek száma: a Valódi negatív esetek száma : d Álpozitív esetek száma : b Álnegatív esetek száma : c Krisztina Boda Biostat 4. 44

ROC görbe (Receiver Operating Characteristic) Diagnosztikai vagy osztályba sorolási eljárások, mérési módszerek jellemzésére szolgáló görbe, a különböző álpozitivitási (lásd: álpozitivitás, specifikusság) arányokhoz tartozó szenzitivitásértékeket (lásd: szenzitivitás) ábrázolja. Mérési, diagnosztizálási vagy osztályozási módszerek teljesítményének összehasonlítására alkalmazható abban az esetben, ha a mérés (osztályozás, diagnózis) pontos eredménye vagy valamely elfogadott becslése ismert. Krisztina Boda 45

A ROC-görbe Receiver operating characteristics curve Az (1 specificitás, szenzitivitás) koordinátájú pontokat összekötve (folytonos mérés esetén görbét illesztve) kapjuk a ROC görbét. A ROC görbe alatti terület alkalmas mérték különböző módszerek hasznosságának, prediktív erejének összehasonlítására. A laborvizsgálat eredménye általában folytonos változóval jellemezhető, ilyenkor keressük az az ún. kritikus értéket ( cut-point ), amely alapján a legjobb a pozitív és negatív esetek szétválasztása, megítélése. Ezen értékhatár használata dönti el a diagnosztikus teszt eredményét. Ha találunk olyan értékhatárt, ami egyértelműen elválasztja a pozitív és a negatív eseteket (tökéletes teszt), akkor a ROC görbe kiegyenesedik egy függőleges és egy vízszintes vonallá az ábra bal oldalán és tetején haladva. Ha teljes a keveredés, akkor a ROC görbe a négyzet átlója. A görbe alatti terület maximális értéke 1; a nagyobb érték nagyobb prediktív erőt jelent. Az ábrán a kék görbével jelzett tesztnek jobb a diagnosztizáló képessége 46 Krisztina Boda

Kiváló diagnosztikus teszt Krisztina Boda Biostat 4. 47

Átlagos teszt Krisztina Boda Biostat 4. 48

ROC görbe alatti terület ROC = 0,5 ROC < 0,7 0,7 ROC < 0,8 0,8 ROC < 0,9 ROC 0,9 Nem használható teszt Gyenge szétválaszthatóság Elfogadható a teszt Jó diagnosztikus teszt Kiváló diagnosztikus teszt Krisztina Boda 49

A ROC görbe készítése, példa Krisztina Boda 50

Küszöb Szenz. Spec. 9999 0% 100% 26.7 75% 80% 19.8 83% 70% 18.7 92% 65% 0 100% 0% 51 Krisztina Boda

Küszöb Szenz. Spec. 9999 0% 100% 26.7 75% 80% 19.8 83% 70% 18.7 92% 65% 0 100% 0% 52 Krisztina Boda

Küszöb Szenz. Spec. 9999 0% 100% 26.7 75% 80% 19.8 83% 70% 18.7 92% 65% 0 100% 0% 53 Krisztina Boda

Küszöb Szenz. Spec. 9999 0% 100% 26.7 75% 80% 19.8 83% 70% 18.7 92% 65% 0 100% 0% 54 Krisztina Boda

Küszöb Szenz. Spec. 9999 0% 100% 26.7 75% 80% 19.8 83% 70% 18.7 92% 65% 0 100% 0% 55 Krisztina Boda

Szenzitivitás ROC-görbe a BNP-re 100% Küszöb 0 80% Küszöb 18.7 Küszöb 19.8 Küszöb Szenz. Spec. 1-spec. 60% Küszöb 26.7 9999 0% 100% 0% 26.7 75% 80% 20% 40% 19.8 83% 70% 30% 20% 18.7 92% 65% 35% 0% Küszöb 9999 0% 20% 40% 60% 80% 100% 0 100% 0% 100% 1-specificitás 56 Krisztina Boda

Példa Ditchburn and Ditchburn(1990) Üledékes vizsgálat alapján 229 gennyes vizeletet vizsgáltak mikrobiológiai laboratóriumban a standardnak tekintett tenyésztéssel, és egy gyors - teszttel. A vizsgálatok eredményeit négymezős táblázatban összefoglalva kapjuk Krisztina Boda 57

Krisztina Boda Biostat 4. 58

Megfigyelt gyakoriságok Culture test Positive Negative Dipstick Positive + 84 43 127 Negative - 10 92 102 94 135 229 Szenzitivitás = a/(a+c)=84/94 = 0.894 Specificitás = d/(b+d)=92/135 = 0.681 Pozitív jósló érték = a/(a+b)=84/127 = 0.661 Negatív jósló érték =d/(c+d)=92/102 = 0.902 Validitás = (84+92)/ 229 =0.77 Krisztina Boda Biostat 4. 59

Ritka betegségek szűrővizsgálata A diagnosztikus teszt megválasztása: Szenzitivitás legalább 90%, Specificitás 99,9%. Krisztina Boda 60

Élsport Miért alkalmaznak kettős ellenőrző vizsgálatot? 1. teszt: magas specificitás (99,9%) és NPV. 2. teszt: magas szenzitivitás (99,9%) és PPV. Krisztina Boda 61

Folytonos valószínűségi változó Az X valószínűségi változót folytonosnak nevezzük, ha a lehetséges értékei egy adott intervallumba eső bármely valós szám (végtelen sok érték). Az X valószínűségi változót folytonosnak nevezzük, ha van olyan f(x) 0 függvény, hogy a számegyenes minden (a,b) intervalluma esetén F ( b) F( a) P( a x b) f ( x) dx Az X folytonos változó eloszlását a sűrűségfüggvény írja le, megmutatja, hogy melyek az X lehetséges értékei, és azok milyen valószínűséggel esnek egyes intervallumokba. A sűrűségfüggvény A vízszintes tengely felett van (f(x) 0) egy adott intervallumba esés valószínűsége=a görbe alatti terület az adott intervallumon a teljes görbe alatti terület =1 b a P(A) A Krisztina Boda 62

A sűrűségfüggvény görbéje az eloszlás alakjának leírására való idalizált görbe, amely az aktuálisan mért adatok ( minta ) alapján nyert hisztogram véletlen ingadozásait kisimítja. A sűrűségfüggvény Értékei mindig nemnegatívak f(x) 0, és A görbe alatti teljes terület=1. f ( x) dx A görbe alatti terület bármely intervallum felett megegyezik az adott intervalumba eső megfigyelések arányával az összes esethez viszonyítva. b a Sűrűségfüggvény 1 f ( x) dx P( a x b) Krisztina Boda 63

A sűrűségfüggvény 1. A vízszintes tengely felett van (f(x) 0) A sűrűségfüggvény 2. A görbe alatti teljes terület=1. f ( x) dx 1 a b 3. Egy adott intervallumba esés valószínűsége = a görbe alatti terület az adott intervallumon b a f ( x) dx P( a x b) Krisztina Boda 64

Eloszlásfüggvény Tekintsük az X valószínűségi változót és egy x tetszőleges valós számot (- és között) és vizsgáljuk az (X<x) esemény valószínűségét. Ezt a valószínűséget (amely x függvénye) az X valószínűségi változó (kumulatív) eloszlásfüggvényének nevezzük és F(x)-szel jelöljük: F(x)=P(X<x). Krisztina Boda 65

Diszkrét változók eloszlásfüggvénye Kockadobás eloszlásfüggvénye 2 kockával dobás eloszlásfüggvénye Krisztina Boda 66

Folytonos változók eloszlásfüggvénye 0.6 y=normal(x;0;1) 1.0 p=inormal(x;0;1) 0.5 0.8 0.4 0.6 0.3 1 0.2 0.5 0.1 0 0 360 0.4 0.2 0.0-3 -2-1 0 1 2 3 Egyenletes eloszlás eloszlásfüggvénye 0.0-3 -2-1 0 1 2 3 Standard normális eloszlás eloszlásfüggvénye Krisztina Boda 67

Az eloszlásfüggvény tulajdonságai Az egész számegyenesen értelmezve van növekvő (nemcsökkenő) balról folytonos Mínusz végtelenben a 0-t, plusz végtelenben az 1-et közelíti Krisztina Boda 68

Kapcsolat a sűrűségfüggvény és az eloszlásfüggvény között x F ( x) f ( t) dt a f ( x) F '( x) Krisztina Boda 69

Speciális folytonos eloszlások: egyenletes eloszlás Sűrűségfüggvénye f(x)=c=1/(b-a), ha a x<b, f(x)=0, ha x<a vagy x b Példa. Legyen a változó egy óra mutatójának a helyzete fokokban mérve, tetszőleges időpillanatban. A sűrűségfüggvénye a (0,360) intervallum felett konstans (c=1/360), másutt 0. 0.003 0.002 1 0.001 0.5 0 0-120 -60 0 60 120 180 240 300 360 420 480 0 360 f(x) Krisztina Boda 70 F(x)

Exponenciális eloszlás Sűrűségfüggvénye f(x)= e - x, ha x > 0, különben 0. A λ állandót az eloszlás paraméterének tekintjük. Eloszlásfüggvénye F(x)=1- e - x, ha x > 0. Exponenciális eloszlást követnek a különféle várakozási idők, például a radioaktív bomlás során az egyes atomok élettartama. Ugyancsak exponenciális eloszlásúak a használati tárgyak vagy azok különböző alkatrészeinek élettartamai, ha csak véletlen törés következtében ment tönkre. Akárhogyan választunk egy időpontot, ha az objektum eddig nem pusztult el, akkor úgy tekinthető, mintha ebben az időpontban született volna Krisztina Boda 71

y Az exponenciális eloszlás λ= 1 λ=1 0,9 0,8 0,7 0,6 0,5 f(x) F(x) 0,4 0,3 0,2 0,1 0-1 0 1 2 3 4 5 6 7 y Krisztina Boda 72

Frequency Normális eloszlások Jelölés: N(, 2 ) A hisztogramot kisimító görbe gyakran szimmetrikus, egycsúcsú, harang alakú görbe. Ez a görbe egyértelműen leírható két paraméterrel: a középpel és a standard deviációval (szórás). Az ábrán a kék vonalat a mintából számolt átlag és szórás alapján rajzoltuk be. Body height 30 20 10 Std. Dev = 8.52 Mean = 170.4 0 N = 87.00 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 Body height Krisztina Boda 73

Krisztina Boda Biostat 4. 74

Krisztina Boda Biostat 4. 75

Krisztina Boda Biostat 4. 76

Egy speciális, nevezetes folytonos valószínűségeloszlás: a normális eloszlás A normális eloszlást matematikailag DeMoivre fedezte fel 1733-ban, mint a binomiális eloszlás határesetét. Laplace alkalmazta a normális eloszlást 1783-ban a hibák eloszlásának leírására. Gauss csillagászati adatok feldolgozására alkalmazta a normális eloszlást in 1809. A normális eloszlást gyakran nevezik Gauss-eloszlásnak is A harang-görbe is gyakran használt kifejezés Carl Friedrich Gauss (1777 1855), Christian Albrecht Jensen festette Krisztina Boda Biostat 4. 77

N(0,1) N(1,1) 0.6 Probability Density Function y =normal(x;0;1) 1.0 Probability Distribution Function p=inormal(x;0;1) Probability Density Function y =normal(x;1;1) 0.6 1.0 Probabil p 0.5 0.8 0.5 0.8 0.4 0.6 0.4 0.6 0.3 0.3 0.4 0.2 0.2 0.4 0.1 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 0.0 1 2 3-3 -2-1 0 1 2 3 0.0-3 -2 - Probability Density Function Probability Distribution Function y =normal(x;0;2) p=inormal(x;0;2) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 N(0,2 2 ) Krisztina Boda 78

Standard normális eloszlás (N(0,1), azaz =0 és =1) sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;0;1) p=inormal(x;0;1) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 79

N(1,1) normális eloszlás sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;1;1) p=inormal(x;1;1) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 80

N(2,1) normális eloszlás sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;2;1) p=inormal(x;2;1) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 81

N(0,2 2 ) normális eloszlás sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;0;2) p=inormal(x;0;2) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 82

N(0,3 2 ) normális eloszlás sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;0;3) p=inormal(x;0;3) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 83

N(0,0.5 2 ) normális eloszlás sűrűségfüggvénye és eloszlásfüggvénye y=normal(x;0;0.5) p=inormal(x;0;0.5) 0.6 1.0 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.1 0.2 0.0-3 -2-1 0 1 2 3 0.0-3 -2-1 0 1 2 3 Krisztina Boda 84

Harang alakú Szimmetrikus Fő tulajdonságai Paraméterei: µ - elméleti átlag, - elméleti szórás Középpontja: µ = átlag=medián=módus Szóródás (szélesség): Inflexiós pontok: µ-, µ+ A 68-95-99.7 szabály (következő dia) Krisztina Boda 85

A 68-95-99.7 szabály Egy és paraméterekkel meghatározott normális eloszlás esetén: A megfigyelések 68% -a esik a középtől egyszeres távolságra A megfigyelések 95% -a esik a középtől kétszeres távolságra A megfigyelések 99.7% -a esik a középtől 3-szoros távolságra Krisztina Boda 86

Az eloszlás elképzelése adott átlag és szórás (SD) alapján (normális eloszlást feltételezve) A cikkekben a táblázatok leggyakrabban az átlagot és a szórást ismertetik. Ezek alapján el tudjuk képzelni, milyen lehet az eloszlás Pl. életkor (év) 55.2 15.7 23.8 86.6 Ebben az intervallumban van az adatok 95.44%-a Krisztina Boda 87

Az SD ferde eloszlások esetén Stent length per lesion (mm): 18.8 10.5 Ezekkel a paraméterekkel a következő eloszlás képzelhető el: A szórás a ferde eloszlás miatt lett nagy. Ezért gyakran a standard deviáció helyett a standard errort adják meg a táblázatokban vagy ábrákon. Az valóban kisebb, de mást jelent. 0.040 0.035 0.030 0.025 0.020 0.015 0.010 Probability Density Function y=normal(x;18.8;10.5) 1.0 0.8 0.6 0.4 0.2 Prob 0.005 0.000-5 0 5 10 15 20 25 30 35 40 0.0-5 0 5 Krisztina Boda 88

z Standard normális eloszlás táblázata (részlet) -4 0.0003-3 0.0013-2.58 0.0049-2.33 0.0099-2 0.0228-1.96 0.0250-1.65 0.0495-1 0.1587 0 0.5 1 0.8413 1.65 0.9505 1.96 0.975 2 0.9772 2.33 0.9901 2.58 0.9951 3 0.9987 4 0.99997 z-től balra eső terület aránya >pnorm(0) [1] 0.5 > pnorm(1) [1] 0.8413447 > pnorm(-1) [1] 0.1586553 Krisztina Boda 89

Ha X ~ 2 N(, ) Standardizálás tehát az X változó normális eloszlást követ μ és σ paraméterekkel, X akkor a z ~ N(0,1), z X tehát a változó standard normális eloszlású. Krisztina Boda 90

Valószínűségek kiszámítása a standard normális eloszlás táblázata alapján a standardizálás segítségével Legyen X~N(70,10 2 ), azaz normális eloszlású =70 és =10 paraméterekkel. 1. Számítsuk ki annak valószínűségét, hogy X értéke 50- nél kisebb, P(X<50). Megoldás. Az 50-nek megfelelő z-érték 50 z 50 70 10 P(X<50)=P(z<-2)=0.0228 2 2. Számítsuk ki annak valószínűségét, hogy X értéke 100- nál nagyobb, P(X>100). Megoldás. A 110-nek megfelelő z-érték 100 100 70 z 10 3 P(X>100)=P(z>3)=1-p(z<3)=1-0.9987 =0.0013 z z-től balra eső terület aránya -4 0.0003-3 0.0013-2.58 0.0049-2.33 0.0099-2 0.0228-1.96 0.0250-1.65 0.0495-1 0.1587 0 0.5 1 0.8413 1.65 0.9505 1.96 0.975 2 0.9772 2.33 0.9901 2.58 0.9951 3 0.9987 4 0.99997 Krisztina Boda 91

Valószínűségek kiszámítása R függvénnyel Legyen X~N(70,10 2 ), azaz normális eloszlású =70 és =10 paraméterekkel. 1. Számítsuk ki annak valószínűségét, hogy X értéke 50-nél kisebb, P(X<50). > pnorm(50, mean=70, sd=10) [1] 0.02275013 2. Számítsuk ki annak valószínűségét, hogy X értéke 100-nál nagyobb, P(X>100). > 1-pnorm(100, mean=70, sd=10) [1] 0.001349898 Krisztina Boda 92

Mintavétel normális eloszlásból http://www.ruf.rice.edu/~lane/stat_sim/index.html 1 ötelemű minta vétele után (2. sor) 1 átlagot kapok (3. sor) 1000 ötelemű minta vétele után (2. sor) az 1000 átlag eloszlása közelítően normális (3. sor) Krisztina Boda 93

Mintavétel nem normális eloszlásból Krisztina Boda 94

Centrális határeloszlás tétel Egy átlagú és szórású populációból vett nagy elemszámú minták átlagai olyan populációból származnak, melynek eloszlása (az átlagolással nyert új populáció eloszlása): közelítően normális eloszlású az átlaga (az összes lehetséges minták átlagainak az átlaga) ugyanaz, mint a populáció átlaga,. A standard deviáció kisebb az eredeti populáció standard deviációjánál: n függetlenül az eredeti populáció eloszlásától n : az átlag szórása, standard error, SE Krisztina Boda 95

Standard error számítása, ha nem ismert Az x 1, x 2, x 3,, x n statisztikai minta adatai alapján a standard errort a minta standard deviációból számítjuk: SE n SD n standard deviáció n Azt fejezi ki, hogy a populációból vett újabb minták alapján számolt különböző átlagok hogyan ingadoznak az (ismeretlen) populáció-átlag körül. Krisztina Boda 96

SD vagy SE? 55.2 15.7 (SD) 55.2 1.57 (SE, n=100) 0.26 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 Probability Density Function y=normal(x;52.2;1.57) 1.0 0.8 0.6 0.4 0.2 0.00 20 40 60 80 0.0 49 23.8 86.6 52.2 58.34 Ebben az intervallumban van az adatok 95.44%-a Ebben az intervallumban van az igazi átlag 95.44%-os valószínűséggel Krisztina Boda 97

Kérdések A valószínűség heurisztikus elve Szabály a valószínűség pontos kiszámítására. Mely esetben alkalmazható? A feltételes valószínűség definíciója. A valószínűségi függetlenség definíciója A diagnosztikus tesztek célja Szenzitivitás, specificitás definíciója. Pozitív és negatív jósló érték definíciója. Milyen vizsgálatnál alkalmazzuk a ROC görbét? Mit jelent a ROC görbe alatti terület nagysága? Miért alkalmaznak kettős doppingvizsgálatot az élsportban? Milyen tulajdonságú diagnosztikus tesztet javasolna általános szűrésre? Diszkrét változó eloszlásának definíciója A diszkrét eloszlás tulajdonságai Folytonos változó eloszlásának definíciója A folytonos eloszlás tulajdonságai Az eloszlásfüggvény deifníciója, tulajdonságai A binomiális eloszlás Diszkrét és folytonos egyenletes eloszlás A Poisson eloszlás A normális eloszlás A normális eloszlás paraméterei A normális eloszlás tulajdonságai A centrális határeloszlás tétel Az átlag szórása (standar error of mean) Krisztina Boda 98

Feladatok 1. Egy kockát feldobva 6 lehetséges kimenetel van, Ha X jelöli a dobás eredményét, számítsuk ki a következõ valószínűségeket: a) P(X=1); b) P(X>1); c) P(1<X<4) 2. Egy pénzérmét kétszer egymás után feldobunk. Soroljuk fel az elemi eseményeket! Mi annak a valószínűsége, hogy mindkét dobás írás? 3. A standard normális eloszlás táblázata alapján adja meg a következő valószínűségeket és ábrázolja a jelentésüket: a) P(X<0)=. b) P(X>0)=.. c)p(x<1)=. d) P(X>1)=.. e)p(x<-1)=..f)p(-1<x<1)= 4. Bizonyos laboradatok normális eloszlást mutatnak a következő paraméterekkel: N(120,10 2 ) =120, =10. a) Mi a valószínűsége, hogy az eredmények 120-nál kisebbek? b) Mi a valószínűsége, hogy az eredmények 100 és 140 közé esnek? 5. Két diagnosztikus teszt összehasonlításakor a következő gyakoriságokat kapták. Számolja ki a teszt érzékenységét, specifikusságát és a negatív, illetve pozitív prediktív értékeket!! 6. Egy diagnosztikus tesztnél a 300 vizsgálatból 270 valódi pozitív és 30 valódi negatív eredményt találtak. Mekkora a módszer érzékenysége? 7. Mekkora a módszer specifikussága? 8. Mekkora a módszer pozitív prediktív értéke? Standard teszt Új teszt Pozitív Negatív Pozitív 60 5 Negatív 10 25 9. Egy diagnosztikus tesztnél 90 valódi pozitív és 10 ál-pozitív eredményt találtak. A megadott adatokból jellemezze a diagnosztikus tesztet (Melyik paraméter számolható, és mekkora az értéke)? 10. Egy diagnosztikus tesztnél 90 valódi negatív és 10 ál-pozitív eredményt találtak. A megadott adatokból jellemezze a diagnosztikus tesztet (Melyik paraméter számolható, és mekkora az értéke)? Krisztina Boda 99

Hasznos WEB oldalak Klinikai Biostatisztikai Társaság http://www.biostat.hu Rice Virtual Lab in Statistics http://onlinestatbook.com/rvls/index.html Statistics on the Web http://www.claviusweb.net/statistics.shtml Hisztogram alakjának változása Old Faithful http://www.stat.sc.edu/~west/javahtml/histogra m.html Krisztina Boda 100