Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Hasonló dokumentumok
Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Biomatematika 2 Orvosi biometria

Területi sor Kárpát medence Magyarország Nyugat-Európa

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

[Biomatematika 2] Orvosi biometria

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Készítette: Fegyverneki Sándor

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Valószínűségi változók. Várható érték és szórás

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Valószínűségszámítás összefoglaló

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

[Biomatematika 2] Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika c. tárgy oktatásának célja és tematikája

A valószínűségszámítás elemei

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

[Biomatematika 2] Orvosi biometria

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A valószínűségszámítás elemei

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Hipotézis vizsgálatok

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Gazdasági matematika II. Tantárgyi útmutató

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószín ségszámítás és statisztika

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

A Statisztika alapjai

Gazdasági matematika II. tanmenet

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai statisztika Tómács Tibor

6. Előadás. Vereb György, DE OEC BSI, október 12.

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biostatisztika 1. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika. Hullám Gábor

Statisztika I. 1. előadás. Előadó: Dr. Ertsey Imre

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Adatok statisztikai értékelésének főbb lehetőségei

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Kísérlettervezés alapfogalmak

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

y ij = µ + α i + e ij

Biostatisztika Összefoglalás

Megoldások MATEMATIKA II. VIZSGA (VK) NBT. NG. NMH. SZAKOS HALLGATÓK RÉSZÉRE (Kérjük, hogy a megfelelő szakot jelölje be!

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Nemparaméteres próbák

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Osztályozóvizsga követelményei

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Gazdasági matematika II. vizsgadolgozat, megoldással,

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Biostatisztika Összefoglalás

Tantárgy kódja Meghirdetés féléve 3 Kreditpont 4 Összóraszám (elm+gyak) 2+2

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Kísérlettervezés alapfogalmak

Hipotézis vizsgálatok

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

1. Kombinatorikai bevezetés

Bevezető Mi a statisztika? Mérés Csoportosítás

Környezet statisztika

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

(Independence, dependence, random variables)

Osztályozóvizsga követelményei

Átírás:

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus. KOKI, 2015.09.17.

Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot tudjuk kezelni, - tudjunk jellemzőivel számolni, - információt szerezni a sokaságról, - információt szolgáltatni a sokaságról.

Mi az információ? Olyan új ismeret, amely megszerzője számára szükséges, és korábbi tudása alapján értelmezhető. Olyan tény, amelynek megismerésekor olyan tudásra teszünk szert, ami addig nem volt a birtokunkban. (Úgy is fogalmazhatunk, hogy az információ valamely meglévő bizonytalanságot szüntet meg.)

Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás útján információkat, azaz új ismereteket nyerünk. A számítástechnikai eszközökkel rögzített, azokkal feldolgozható és megjeleníthető információt adatnak nevezzük. Az információ tehát értelmezett adat.

Az adat nagyon tág fogalom: gyakorlatilag bármilyen jel potenciálisan adatnak tekinthető. Adatnak nevezzük a számokkal leírható dolgokat, melyek számítástechnikai eszközökkel rögzíthetők, feldolgozhatóak, és megjeleníthetők. Az adat egy objektum egy meghatározott változójának (tulajdonságának, attribútumának, jellemzőjének, karakterének), értéke (karakterállapota, megvalósult formája). Egy konkrét adat tehát akkor tekinthető definiáltnak, ha meghatározzuk, hogy milyen objektum, melyik változója, milyen értéket vesz fel.

Adat osztályozása Az adatok jellegűk szerint lehetnek: minőségi / megállapítható / kvalitatív, mennyiségi / mérhető / kvantitatív adatok.

Az adatok értékük / értékkészletük szerint lehetnek: bináris, diszkrét, folytonos adatok.

Paraméter Adataink változókhoz, paraméterekhez tartoznak. Paraméternek a vizsgált objektum/jelenség mért, számszerű jellemzőjét, tulajdonságát nevezzük, amelynek az alábbiak a sajátosságai (Fábián-Zsidegh 1998): számszerű, mennyiségi jellegű, egyetlen számmal jellemezhető, egyértelmű, pontos, értelmezhető.

Az adat típusa (skálája) Nominális adat: amelynek lehetséges értékei között csak az azonos vagy nem azonos reláció van értelmezve (=, ). Ordinális adat: amelynek lehetséges értékei között a kisebb v. nagyobb (<,>) reláció is megengedett az előőbi relációk mellett. Intervallum adat: amelynél fentieken kívül az +, -, * műveleteket is tudjuk értelmezni. Arány skála adat: mind a négy alapművelet értelmezve van (/).

Stanley Smith Stevens (1906 1973) (946: "On the Theory of Scales of Measurement" Science 103 (2684): 677 680 p.

A statisztika legfontosabb fogalmai Sokaság Minta/Mintaelem Mintavétel Ismérv (változó) Statisztikai függvény (próbafüggvény) Statisztikai ítéletalkotás Hasznosítás (adaptálás)

Sokaság (populáció) Mindazon elemek halmaza (a vizsgálat tárgya), amelyre statisztikai következtetés irányul. A sokaság nem emberek (egyedek), hanem egy őket jellemző ismérv (változó) által felvett vagy felvehető értékek halmaza. Két típusa van: időpontban (álló sokaság) vagy időintervallumban (mozgó sokaság) vizsgáljuk-e.

Minta Egy adott véges számú sokaságból kiválasztott véges számú egységek összessége. A minta elemszáma mindig kisebb, mint maga az alapsokaság. Ha e kettő megegyezik, akkor cenzusról beszélünk (például népszámlálás). Mintaelem: a minta egyes elemei.

Véletlen minta A minták egy speciális esete. A véletlen kiválasztás esetében az alapsokaság minden egységéről megmondható, hogy milyen valószínűséggel kerülhet be a mintába. A társadalomkutatás módszertana, azaz a matematikai statisztika a véletlen mintavételre támaszkodik.

Reprezentativitás Egy minta bizonyos változók mentén akkor reprezentatív, ha a mintába került elemek (emberek) ugyan olyan arányban vannak jelen, mint az alapsokaságban. Tehát egy minta csak bizonyos szempontok alapján nevezhető reprezentatívnak. Ha más szempontokat veszünk figyelembe, akkor mintánk lehet, hogy nem reprezentatív.

Mintavételi hiba A mintavétel hibája abból adódik, hogy nem a teljes populációt kérdezzük meg, hanem annak csak egy részét. Így információink részlegesek lesznek a teljes alapsokaságról. A mintavételi hiba mértéke szoros összefüggésben van a minta elemszámával, valamint a mintavételi módszerrel. A mintavételi hiba mértéke akkor számolható ki érvényesen, ha véletlen mintát vettünk.

Nem mintavételi hiba A nem mintavételi hibák az adatfelvételhez kapcsolódnak, nincsenek kapcsolatban sem a mintavétel módszerével, sem a minta elemszámával. Nem mintavételi hibák összetevői az alábbiak lehetnek: - a kérdőív hibás megszerkesztése; - kérdezőbiztosok munkájának hibái; - hibás rögzítés; - a mintába bekerült válaszadó félreérthető vagy valós véleményét elfedő válasza, stb.

Változó Több értéket képes fölvenni, így nem kell egyenként behelyettesítenünk őket például egy függvénybe, hanem elegendő csak a változó. A változónk értékét külön tárolhatjuk, vagy más módon is megadhatjuk például intervallummal. Természetesen nem csak olyan változók léteznek, melyek számokat vehetnek fel.

Valószínűségi változó A valószínűségi változó a változók speciális esete. Ebben az esetben meg lehet mondani, hogy a változó milyen valószínűséggel veheti fel értékeit, tehát minden egyes általa fölvehető értékhez hozzá tudunk rendelni egy valószínűséget.

Hipotézis Hipotéziseknek nevezzük az alapsokaságra vonatkozó különféle feltevéseket. A hipotézisek a vizsgált sokaság eloszlására, vagy az adott eloszlás egy vagy több paraméterére vonatkozhatnak.

Próbafüggvény A nullhipotézis fennállásának eldöntését hivatott meghatározni. A próbafüggvény a nullhipotézis fennállását feltételezve, azaz H 0 feltétel mellett adja meg az adott valószínűségi változó eloszlását. Ahhoz, hogy a próbafüggvény eloszlása H 0 fennállását feltételezve pontosan ismert lehessen, a H 0 hipotézisnek egyszerű hipotézisnek kell lennie.

Küszöbérték A próbafüggvény lehetséges értéktartományának két részre való bontásának helyét határozza meg. Itt definiálódik, hogy hol lesz a határ az elfogadási tartomány és az elutasítási tartomány között.

Eloszlás A statisztika központi fogalma: valami vagy valamik hol vannak, hogyan oszlanak el, hogyan helyezkednek el. A sokaság eloszlását a változó típusától függően jellemezhetjük: - függvénnyel (valószínűségsűrűségfüggvény, kumulatív eloszlásfüggvény), - vagy paraméteresen (elméleti szórás, várható érték stb.).

Valószínűség Azt a számot, amely körül egy esemény relatív gyakorisága ingadozik, az illető esemény valószínűségének nevezzük. Egy esemény bekövetkezésének vagy be nem következésének mértékbeli megadása. A valószínűség, mint mérték 0 és 1 közötti szám. A jelölés a latin probabilitas, valószínűség szó kezdőbetűjéből ered.

Eseménynek nevezünk mindent, amiről a kísérlet elvégzése után eldönthető, hogy bekövetkezett-e, vagy sem (elemi esemény). Valamely kísérlet összes kimenetele egy halmazt alkot. Ezt nevezzük eseménytérnek ( ). Biztos eseményről akkor beszélünk, ha a kísérlet során biztosan (minden kimenetelnél) bekövetkezik. Azt az eseményt, mely akkor és csak akkor következik be, ha az A esemény nem következik be, az A esemény ellentett eseményének nevezzük ( A).

Andrey Kolmogorov (1903-1987)

1. Valószínűség: Alapfogalmak Eseményeken értelmezett számértékű függvény (mérték). Jelölésben P(A)=p Kolmogorov axiómák: 0 P(A) 1 P(0)=0 és P(I)=1 Ha AB = 0 P(A+B) = P(A) + P(B) 2. Valószínűségszámítás és a statisztika kapcsolata (klasszikus modell) k kedvező esetek száma p = = --------------------------- n összes eset száma 3. Statisztikai próba (teszt): A mért adatokon értelmezett függvény. 4. Szignifikancia értelmezése : p < 0.05

Feltételes valószínűség P(AB) P(A B) = P(B) Teljes valószínűség tétele Ha B 1, B 2, B 3,., B n események teljes eseményrendszert alkotnak és P(B I ) 0, akkor az A esemény valószínűsége N P(A)= P(A B i ) P(B i ) i=1 Bayes elmélet Ha a B 1, B 2, B 3,., B n események teljes eseményrendszert alkotnak és P(Bi) 0, akkor tetszőleges A esemény mellett ( P(A) 0), igaz P(A B i ) P(B i ) P(B i A) = N P(A B k ) P(B k ) k=1

Thomas Bayes (1701-1761)

Valószínűségeloszlás Egy teljes eseményrendszer valószínűségeinek sorozatát valószínűségeloszlásnak, vagy röviden eloszlásnak nevezzük. Olyan függvény, mely leírja, hogy egy valószínűségi változó milyen valószínűséggel vehet fel egy bizonyos értéket. Eloszlásfüggvénye minden valószínűségi változónak létezik.

Diszkrét eloszlások Csak diszkrét, definiált értékeket vehet fel. 1. Véges tartományú diszkrét eloszlások: Bernoulli-eloszlás Binomiális eloszlás Hipergeometrikus eloszlás Poisson-féle binomiális eloszlás

2. Végtelen tartományú diszkrét eloszlások Béta-negatív binomiális eloszlás Geometriai eloszlás Logaritmikus eloszlás Negatív binomiális eloszlás Parabolikus fraktáleloszlás

Folytonos eloszlások A folytonos eloszlású valószínűségi változó végtelen sok értéket vehet fel. 1. Zárt intervallumú folytonos eloszlások: Logit normális eloszlás Folytonos egyenletes eloszlás Derékszögű eloszlás Csonkolt normális eloszlás

Félig végtelen intervallumú folytonos eloszlások [0, ) Khí-eloszlás Khí-négyzet eloszlás Dagum-eloszlás Exponenciális eloszlás F-eloszlás Nem centrális F-eloszlás Fisher-féle z-eloszlás Gamma-eloszlás Erlang-eloszlás Inverz Gamma-eloszlás Khí valószínűségsűrűség-függvény Valószínűség sűrűségfüggvény Kumulatív eloszlásfüggvény

A teljes valós tartományra érvényes eloszlások Normális eloszlás Normális exponenciális gammaeloszlás T-eloszlás

Valószínűségi változók Diszkrét Folytonos p k = P(A k ) = P( < x) Eloszlás függvény F(x) = P( < x) F(x) = f(x)

Diszkrét eloszlások Binomiális p k = P( = k) = ( )p k q n-k M( ) = n p D( ) = n p q Poisson k p k = P( = k) = e - M( ) = D( ) = n k k!

Legfontosabb folytonos eloszlások

f(x) Inflexiós pont 1 2 34,1 % 34,1 % 13,6 % 13,6 % 2,2 % 2,2 % 0,1 % 0,1 % -3-2 - + +2 +3 x Normális eloszlás tulajdonságai

Sűrűségfüggvény f x 1 ( x) e 2 2 2 2

Normáleloszlás eloszlásfüggvénye 1.000 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100 0.000 1.96; 0.975 0; 0.500-1.96; 0.025-4 -2 0 2 4

Eloszlásfüggvény F x 1 ( x) e 2 2 x 2 2 dx

(x) 1 ~ 0,4 2 inflexiós pont inflexiós pont 34,1 % 34,1 % 13,6 % 13,6 % 2,2 % 2,2 % 0,1 % 0,1 % -3-2 -1 0 1 2 3 Standard normális eloszlás z x- z =

Standardizálás z i x i

Standard normáleloszlás sűrűségfüggvénye 0.400 0.350 0.300 0.250 0.200 0.150 0.100 0.050 1 2 μ, medián, módusz 0.000-4 -2 0 2 4

Standard normális eloszlás sűrűségfüggvénye ( x) 1 e x 2 2 2

Standard normáleloszlás eloszlásfüggvénye 1.000 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100 0.000 1.96; 0.975 0; 0.500-1.96; 0.025-4 -2 0 2 4

Standard normális eloszlás eloszlásfüggvénye x 1 ( x) e 2 2 x 2 dx

Standard normáleloszlás 95%-os valószínűségei 0.400 0.350 0.300 0.250 0.200 0.150 95% 0.100 0.050 0.000-4 -2 0 2 4