Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Hasonló dokumentumok
Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Területi sor Kárpát medence Magyarország Nyugat-Európa

Biomatematika 2 Orvosi biometria

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Valószínűségi változók. Várható érték és szórás

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Valószínűségszámítás összefoglaló

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

A valószínűségszámítás elemei

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Készítette: Fegyverneki Sándor

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

[Biomatematika 2] Orvosi biometria

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

A valószínűségszámítás elemei

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Valószín ségszámítás és statisztika

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Adatok statisztikai értékelésének főbb lehetőségei

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Bevezető Mi a statisztika? Mérés Csoportosítás

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Környezet statisztika

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Gazdasági matematika II. tanmenet

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika Tómács Tibor

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Gazdasági matematika II. Tantárgyi útmutató

Gazdasági matematika II. vizsgadolgozat, megoldással,

y ij = µ + α i + e ij

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

[GVMGS11MNC] Gazdaságstatisztika

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Abszolút folytonos valószín ségi változó (4. el adás)

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Hipotézis vizsgálatok

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Biomatematika 2 Orvosi biometria

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

1. Kombinatorikai bevezetés

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

6. Előadás. Vereb György, DE OEC BSI, október 12.

BIOMATEMATIKA ELŐADÁS

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Biostatisztika 1. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika. Hullám Gábor

Bizonytalan tudás kezelése

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Backhausz Ágnes 1. Bevezetés A valószínűség elemi tulajdonságai... 5

Vargha András Károli Gáspár Református Egyetem Budapest

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Biostatisztika Összefoglalás

A Statisztika alapjai

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

A biostatisztika és informatika szerepe a mindennapi orvosi gyakorlatban

Normális eloszlás tesztje

[Biomatematika 2] Orvosi biometria

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Nemparaméteres próbák

Átírás:

Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás útján információkat, azaz új ismereteket nyerünk. A számítástechnikai eszközökkel rögzített, azokkal feldolgozható és megjeleníthető információt adatnak nevezzük. Az információ tehát értelmezett adat.

Adat osztályozása Az adatok jellegűk szerint lehetnek: minőségi / megállapítható / kvalitatív, mennyiségi / mérhető / kvantitatív adatok.

Az adatok értékük / értékkészletük szerint lehetnek: bináris, diszkrét, folytonos adatok.

Az adat típusa (skálája) Nominális adat: amelynek lehetséges értékei között csak az azonos vagy nem azonos reláció van értelmezve (=, ). Ordinális adat: amelynek lehetséges értékei között a kisebb v. nagyobb (<,>) reláció is megengedett az előőbi relációk mellett. Intervallum adat: amelynél fentieken kívül az +, -, * műveleteket is tudjuk értelmezni. Arány skála adat: mind a négy alapművelet értelmezve van (/).

Kategórikus adatok Adatfajta Az adatokon értelmezett relációk Példa Nominális (nevesítő) =, Nem, faj, betegségfajta Ordinális (rendező) =,, <, > Betegség súlyossága, dohányzás súlyossága Azokat a kategorikus adatokat, amelyek csak két osztály valamelyikébe sorolhatók, dichotómikus vagy bináris adatoknak nevezzük.

Metrikus (folytonos) adatok Adatfajta Az adatokon értelmezett relációk Példa Fontos Intervallum =,, <, >, +, -, * Potenciál, Celsius fokban mért hõmérséklet Nincs fix 0 pont, az önkényes. Arány =,, <, >, +, -, *, Tömeg, Abszolut hõmérséklet, vérnyomás Létezik fix 0 pont. A kvantitatív adatok lehetnek folytonos vagy diszkrét (mérhető vagy leszámlálható, gyakran metrikusnak nevezettek) adatok.

Sokaság (n, populáció) Mindazon elemek halmaza (a vizsgálat tárgya), amelyre statisztikai következtetés irányul. A sokaság nem emberek (egyedek), hanem egy őket jellemző ismérv (változó) által felvett vagy felvehető értékek halmaza. Két típusa van: időpontban (álló sokaság) vagy időintervallumban (mozgó sokaság) vizsgáljuk-e.

Minta (N) Egy adott véges számú sokaságból kiválasztott véges számú egységek összessége. A minta elemszáma mindig kisebb, mint maga az alapsokaság. Ha e kettő megegyezik, akkor cenzusról beszélünk (például népszámlálás). Mintaelem: a minta egyes elemei.

Véletlen minta A minták egy speciális esete. A véletlen kiválasztás esetében az alapsokaság minden egységéről megmondható, hogy milyen valószínűséggel kerülhet be a mintába. A társadalomkutatás módszertana, azaz a matematikai statisztika a véletlen mintavételre támaszkodik.

Reprezentativitás Egy minta bizonyos változók mentén akkor reprezentatív, ha a mintába került elemek (emberek) ugyan olyan arányban vannak jelen, mint az alapsokaságban. Tehát egy minta csak bizonyos szempontok alapján nevezhető reprezentatívnak. Ha más szempontokat veszünk figyelembe, akkor mintánk lehet, hogy nem reprezentatív.

Mintavételi hiba A mintavétel hibája abból adódik, hogy nem a teljes populációt kérdezzük meg, hanem annak csak egy részét. Így információink részlegesek lesznek a teljes alapsokaságról. A mintavételi hiba mértéke szoros összefüggésben van a minta elemszámával, valamint a mintavételi módszerrel. A mintavételi hiba mértéke akkor számolható ki érvényesen, ha véletlen mintát vettünk.

Nem mintavételi hiba A nem mintavételi hibák az adatfelvételhez kapcsolódnak, nincsenek kapcsolatban sem a mintavétel módszerével, sem a minta elemszámával. Nem mintavételi hibák összetevői az alábbiak lehetnek: - a kérdőív hibás megszerkesztése; - kérdezőbiztosok munkájának hibái; - hibás rögzítés; - a mintába bekerült válaszadó félreérthető vagy valós véleményét elfedő válasza, stb.

Mit kell tenni? A klinikai tervezés előtt: Mintaszám meghatározás Erő (Power) analízis N=2987?!

Valószínűség Azt a számot, amely körül egy esemény relatív gyakorisága ingadozik, az illető esemény valószínűségének nevezzük. Egy esemény bekövetkezésének vagy be nem következésének mértékbeli megadása. A valószínűség, mint mérték 0 és 1 közötti szám. A jelölés a latin probabilitas, valószínűség szó kezdőbetűjéből ered.

Eseménynek nevezünk mindent, amiről a kísérlet elvégzése után eldönthető, hogy bekövetkezett-e, vagy sem (elemi esemény). Valamely kísérlet összes kimenetele egy halmazt alkot. Ezt nevezzük eseménytérnek ( ). Biztos eseményről akkor beszélünk, ha a kísérlet során biztosan (minden kimenetelnél) bekövetkezik. Azt az eseményt, mely akkor és csak akkor következik be, ha az A esemény nem következik be, az A esemény ellentett eseményének nevezzük ( A).

1. Valószínűség: Alapfogalmak Eseményeken értelmezett számértékű függvény (mérték). Jelölésben P(A)=p Kolmogorov axiómák: 0 P(A) 1 P(0)=0 és P(I)=1 Ha AB = 0 P(A+B) = P(A) + P(B) 2. Valószínűségszámítás és a statisztika kapcsolata (klasszikus modell) k kedvező esetek száma p = = --------------------------- n összes eset száma 3. Statisztikai próba (teszt): A mért adatokon értelmezett függvény. 4. Szignifikancia értelmezése : p < 0.05

Feltételes valószínűség P(AB) P(A B) = P(B) Teljes valószínűség tétele Ha B 1, B 2, B 3,., B n események teljes eseményrendszert alkotnak és P(B I ) 0, akkor az A esemény valószínűsége N P(A)= P(A B i ) P(B i ) i=1 Bayes elmélet Ha a B 1, B 2, B 3,., B n események teljes eseményrendszert alkotnak és P(Bi) 0, akkor tetszőleges A esemény mellett ( P(A) 0), igaz P(A B i ) P(B i ) P(B i A) = N P(A B k ) P(B k ) k=1

Mennyi a valószínűsége, hogy érmével fejet dobunk? Egy dobásnak 2 kimenetel van, tehát n = 2. Kedvező számunkra, hogy fejre esik az érme, tehát k = 1 P(fejet dobunk) = ½ = 0,5 = 50% Mennyi a valószínűsége, kockával páros számot dobunk? Egy dobásnak 6 kimenetele van, n = 6. Kedvező számunkra 3 eset, így k = 3 P(páros számot dobunk kockával) =3/6 = ½=0.5=50% Mennyi a valószínűsége, hogy kockával nem 6-ost dobunk? n = 6 k = 5 P(nem 6-ost dobunk) = 5/6 = 0,833

Változó Több értéket képes fölvenni, így nem kell egyenként behelyettesítenünk őket például egy függvénybe, hanem elegendő csak a változó. A változónk értékét külön tárolhatjuk, vagy más módon is megadhatjuk például intervallummal. Természetesen nem csak olyan változók léteznek, melyek számokat vehetnek fel.

Valószínűségi változó A valószínűségi változó a változók speciális esete. Ebben az esetben meg lehet mondani, hogy a változó milyen valószínűséggel veheti fel értékeit, tehát minden egyes általa fölvehető értékhez hozzá tudunk rendelni egy valószínűséget.

A statisztikában gyakran előfordul még a függő és független változók megkülönböztetése. A gyakorlatban ez azt jelenti, hogy egyik tulajdonság függvényében miként változik egy másik tulajdonság, ami értelemszerűen többváltozós esetekre is értelmezhető.

Gyakoriság: egy vagy több változó által felvehető értékre, értékekre jutó megfigyelések száma. Relatív gyakoriság: ha egy változó által felvehető értékekre jutó megfigyelések számát elosztjuk a teljes mintanagysággal, akkor a relatív gyakorisághoz jutunk.

Eloszlás A statisztika központi fogalma: valami vagy valamik hol vannak, hogyan oszlanak el, hogyan helyezkednek el. A sokaság eloszlását a változó típusától függően jellemezhetjük: - függvénnyel (valószínűségsűrűségfüggvény, kumulatív eloszlásfüggvény), - vagy paraméteresen (elméleti szórás, várható érték stb.).

Valószínűségeloszlás Egy teljes eseményrendszer valószínűségeinek sorozatát valószínűségeloszlásnak, vagy röviden eloszlásnak nevezzük. Olyan függvény, mely leírja, hogy egy valószínűségi változó milyen valószínűséggel vehet fel egy bizonyos értéket. Eloszlásfüggvénye minden valószínűségi változónak létezik.

Diszkrét eloszlások Csak diszkrét, definiált értékeket vehet fel. Néhány véges tartományú diszkrét eloszlás: Binomiális eloszlás Poisson-féle binomiális eloszlás Bernoulli-eloszlás Diszkrét egyenletes eloszlás Hipergeometrikus eloszlás

Folytonos eloszlások A folytonos eloszlású valószínűségi változó végtelen sok értéket vehet fel. 1. Néhány zárt intervallumú folytonos eloszlás: Arkuszszinusz-eloszlás Logit normális eloszlás 2. Félig végtelen intervallumú folytonos eloszlás [0, ): Khí-eloszlás Khí-négyzet eloszlás Exponenciális eloszlás F-eloszlás 3. A teljes valós tartományra érvényes eloszlások [-, ) Normális eloszlás T-eloszlás

Valószínűségi változók Diszkrét Folytonos p k = P(A k ) = P( < x) Eloszlás függvény F(x) = P( < x) F(x) = f(x)

Legfontosabb folytonos eloszlások

f(x) Inflexiós pont 1 2 34,1 % 34,1 % 13,6 % 13,6 % 2,2 % 2,2 % 0,1 % 0,1 % -3-2 - + +2 +3 x Normális eloszlás tulajdonságai

Sűrűségfüggvény f x 1 ( 2 x) 2 e 2 2

Normáleloszlás eloszlásfüggvénye 1.000 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100 0.000 1.96; 0.975 0; 0.500-1.96; 0.025-4 -2 0 2 4

Eloszlásfüggvény F x x 1 ( x) e 2 2 2 2 dx

(x) 1 ~ 0,4 2 inflexiós pont inflexiós pont 34,1 % 34,1 % 13,6 % 13,6 % 2,2 % 2,2 % 0,1 % 0,1 % -3-2 -1 0 1 2 3 Standard normális eloszlás z x- z =

Standard normális eloszlás sűrűségfüggvénye ( x) 1 e x 2 2 2

Standard normáleloszlás eloszlásfüggvénye 1.000 0.900 0.800 0.700 0.600 0.500 0.400 0.300 0.200 0.100 0.000 1.96; 0.975 0; 0.500-1.96; 0.025-4 -2 0 2 4

Standard normális eloszlás eloszlásfüggvénye x x 1 ( x) e 2 2 2 dx

A normál eloszlás nevezetes értékei α% μ ± σ 5 1,96 1 2,58 0,1 3,29

Az eloszlás alakjának jellemzése Ferdeség (skewness, normális eloszlás=0 körüli érték) Csúcsosság (kurtosis, normális eloszlás=0 körüli érték)

POSITIVELY SKEWED

NEGATIVELY SKEWED

BI-MODAL

További folytonos eloszlások t-eloszlás Exponenciális eloszlás Egyenletes eloszlás F-eloszlás Gamma