Biostatisztika és alkalmazásai

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Biostatisztika és alkalmazásai"

Átírás

1 2013. szeptember 25.

2 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

3 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)

4 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!

5 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

6 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

7 Új ismeretek szerzése Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte

8 Hogy ne tudjanak átverni minket A KSH szerint 2011-ben a magyar bruttó átlagkereset 213 ezer forint volt. Mégis, a másik táblázatból az derül ki, hogy az emberek 68%-a ennél kevesebbet keresett! Hogy a fenében lehetne akkor ez az átlag?! A KSH hazudik! A HRT-kezelésben részesülő nők körében 1,8-szer kevesebb a szív-érrendszeri megbetegedés, mint az ilyet nem kapók között. A HRT-kezelés tehát jó hatással van a kardiovaszkuláris rendszerre. A minap a suliból (munkahelyem) hazafelé tartva, a buszra vártam. Néhány diák a közelben beszélgetett. Az volt a téma, hogy milyen sokan hiányoznak az osztályból, mert betegek. Egyikük megjegyezte, hogy ő is azóta beteg, mióta megkapták az oltást.

9 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?

10 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata

11 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek

12 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),

13 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

14 Pár demonstratív kérdés, amit szeretnénk megválaszolni Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Egy új vérnyomáscsökkentő gyógyszer-jelölt nem okoz megnövekedett epilepszia-kockázatot? Magasfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? Milyen tényezők hatnak adott rákban a túlélési időre? Mennyi jelen kurzus hallgatóinak átlagos testtömege? Mennyi az I. éves fiú egyetemisták átlagos testtömege? Igaz-e, hogy az I. éves fiú egyetemisták átlagos testtömege 70 kg? Van-e összefüggés tehenek takarmányozása és a tejhozamuk között?

15 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

16 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)

17 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább

18 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

19 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

20 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt

21 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála

22 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség

23 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

24 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)

25 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

26 Egyváltozós elemzés, minőségi változó Példa race (rassz): low age lwt race smoke ptl ht ui ftv bwt

27 Egyváltozós elemzés, minőségi változó Analitikus eszközök Gyakorisági sor: Kategória f i g i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 (Istenigazából semmilyen adatvesztést nem jelent most)

28 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme

29 Egyváltozós elemzés, minőségi változó Grafikus eszközök: oszlopdiagram Oszlopdiagram Gyakoriság [fő] Kaukázusi Afroamerikai Egyéb Rassz

30 Egyváltozós elemzés, minőségi változó Grafikus eszközök: tortadiagram Kördiagram Kaukázusi 50.8 % Afroamerikai 13.8 % Egyéb 35.4 % Rassz

31 Egyváltozós elemzés, minőségi változó Grafikus eszközök Melyik jobb? Miért? (Van rá tudományos válasz!) Az emberi szem sokkal jobban érzékeli a lineáris méreteket, mint a relatív területeket

32 Egyváltozós elemzés, mennyiségi változó Példa bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt

33 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor I. Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) Megoldás az osztályközös gyakorisági sor, például: C i0 C i1 f i g i f i g i , , , , , , , , , , , , , , , , , ,000 Összesen 189 1,000

34 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor II. De vigyázat, itt már van információvesztés! kérdés, hogy hogyan vesszük fel az osztályközöket

35 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)

36 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )

37 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

38 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság

39 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]

40 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)

41 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram Hátránya, hogy érzékeny az intervallumok határainak megválasztására: A születési tömegek hisztogramja A születési tömegek hisztogramja A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e Születési tömeg [g] Születési tömeg [g] Születési tömeg [g]

42 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A születési tömegek magfüggvényes sűrűségbecslése Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]

43 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A mintapontokat koncentrált helyett valódi eloszlással helyettesíti Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni)

44 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot A születési tömegek boxplot-ja Születési tömeg [g]

45 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is

46 Két minőségi változó kapcsolata: asszociáció Példa Két minőségi változó kapcsolatát asszociációnak nevezzük race (rassz) és ui (irritábilis méh): low age lwt race smoke ptl ht ui ftv bwt

47 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések

48 Két minőségi változó kapcsolata: asszociáció Grafikus eszközök Esetleg mozaikábra vagy asszociációs ábra nem túl gyakori Vetületi megoszlások vagy feltételes megoszlások ábrázolhatóak oszlop-, illetve kördiagramon

49 Két mennyiségi változó kapcsolata: korreláció Példa Két mennyiségi változó kapcsolatát korreláció nevezzük lwt (anyai testtömeg) és bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt

50 Két mennyiségi változó kapcsolata: korreláció Grafikus eszközök: szóródási diagram Ez minden információt hordoz: Az anya és az újszülött testtömegének szóródási diagramja Születési tömeg [g] Anya testtömege (UM) [font]

51 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma 1 n [ n i=1 (xi x) (y i y) ] r x,y = σ x σ y A kapcsolat irányát és szorosságát mutatja

52 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható A kapcsolat iránya és szorossága szemléletesen: corr = -1 corr = corr = -0.7 corr = -0.2 corr = 0 corr = 0.2 corr = 0.7 corr = 0.99 corr = 1 y y y y y y y y y x x x x x x x x x

53 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható De vigyázzunk (Anscombe-kvartett): y y x x2 y y x x4

54 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

55 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

56 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

57 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

58 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

59 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

60 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

61 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

62 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

63 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )

64 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz

65 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

66 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

67 Hipotézisvizsgálat Próbafüggvény megszerkesztése Ez ún. pivot, eloszlása már nem függ ismeretlen paramétertől: Z := X µ 0 σ/ n H 0 N (0, 1), azaz a próbafüggvény H 0 fennállása esetén N (0, 1) eloszlást követ

68 f Hipotézisvizsgálat Döntés a hipotézisvizsgálatban I. Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? Biztos döntés nincs! De: mennyire hihetőek ezek? f z z

69 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)

70 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

71 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

72 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)

73 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

74 Hipotézisvizsgálat Próba hibái II. Bár néhol bevett szokás, de elvileg nem korrekt egy próba előfeltevését ugyanazon mintán egy másik próbával eldönteni ( testing hypothesis suggested by data )

75 Hipotézisvizsgálat Szignifikanciavadászat I. Mivel minden tesztnek α elsőfajú hibája van, ezért (sajnos!) aki keres az talál!

76 Hipotézisvizsgálat Szignifikanciavadászat II. Védekezés ellene: az orvosok nem viszik túlzásba... A p-érték korrekciója: Bonferroni-, Holm-, Hochberg-, Hommel-eljárások Ezek az ún. familywise α (az összes tesztben együtt mennyi az elsőfajú hiba; értsd: legalább egy tesztben hibásan elutasítunk) erős kontrollját jelentik Alternatíva: például az FDR-eljárások A microarray és hasonló adatok kiértékelése kapcsán nagyon megnőtt a jelentőségük

77 Empirikus adatgyűjtés nehézségei Szolgáltatott információk: Keresztmetszeti adatokból nem lehet időbeli viszonyokon alapuló következtetést levonni Korreláció nem implikál kauzalitást stb. Nehézségek: Technikai (szervezési, pénzügyi, stb.) Időbeli Bioetikai stb. Evidenciák hierarchiája (tipikusan trade-off a két fenti szempont között: az informatívabb, megbízhatóbb vizsgálat nehezebb)

78 Klinikai vizsgálatok kategorizálása Klinikai vizsgálat (clinical study) lehet 1 Experimentális (beavatkozásos), más szóval klinikai kísérlet 2 Obszervációs (megfigyeléses)

79 Klinikai kísérletek fajtái A fő kérdések: Randomizálás Kontrollálás Vakosítás A kettős vak RCT a gold standard egy kérdés megválaszolására ugyanis nem érzékeny a korreláció nem implikál kauzalitást problémára! Cserében a legösszetettebb, legdrágább stb. feladat a megvalósítása Gyógyszerbevezetésnél különösen fontos a szerepe (elsősorban fázis-iii)

80 Megfigyeléses vizsgálatok Főbb típusok: 1 Kohorsz 2 Eset-kontroll 3 Keresztmetszeti 4 Ecological 5 (Esetismertetés, case series) Ez a megbízhatóság sorrendje is Közös gond: ki vannak téve a confounding-nak (különféle bias-ek) Például: ABC-hipotézis (tudományos szempontok mellett a politika (és a média) megjelenése tette tanulságossá)

81 A világ első dokumentált klinikai kísérlete Leírás: 10 És mondá az udvarmesterek fejedelme Dánielnek: Félek én az én uramtól, a királytól, aki megrendelte a ti ételeteket és italotokat; minek lássa, hogy a ti orcátok hitványabb amaz ifjakénál, akik egykorúak veletek? és így bűnbe kevernétek az én fejemet a királynál. 11 És mondá Dániel a felügyelőnek, akire az udvarmesterek fejedelme bízta vala Dánielt, Ananiást, Misáelt és Azariást: 12 Tégy próbát, kérlek, a te szolgáiddal tíz napig, és adjanak nékünk zöldségféléket, hogy azt együnk, és vizet, hogy azt igyunk. 13 Azután mutassák meg néked a mi ábrázatunkat és amaz ifjak ábrázatát, akik a király ételével élnek, és aszerint cselekedjél majd a te szolgáiddal. 14 És engede nékik ebben a dologban, és próbát tőn velük tíz napig. 15 És tíz nap mulva szebbnek látszék az ő ábrázatuk, és testben kövérebbek valának mindazoknál az ifjaknál, akik a király ételével élnek vala. Dokumentálás helye: Biblia, Dániel könyve, 1. fejezet (Károli Gáspár fordítása)

82 Mik ezzel a bajok? Nagyon jó, de felmerül azért pár kérdés is: Dániel beszerezte a Regionális Bioetikai Bizottság engedélyét a kutatáshoz? A résztvevők teljes írásos tájékozott beleegyezéssel vettek részt a kísérletben? Regisztrálta Dániel a kutatást nemzetközi adatbázisban (pl. ClinicalTrials.gov-on)? Nem világos a végpont meghatározása: a szebbnek látszék az ő ábrázatuk pontosan milyen módon került operacionalizálásra? Hiányzik a használt kvantitatív mérési eljárás kellő pontosságú megadása. Nem derül ki, hogy a kísérleti alanyok randomizálásra kerültek-e, illetve milyen módszerrel. Nem világos, hogy a vizsgálók, illetve az alanyok vakosítva voltak-e az ételek tekintetében. Az eredményközlés elégtelen: hiányzik a végpontokon mért numerikus kimenet, és szignifikanciára vonatkozó statisztikai próba dokumentálása.

83 DE! DE! A fenti mégis fantasztikus: felmerült a gondolat (kb. i.e. 600-ban vagyunk!), hogy a kérdést empirikus alapon kell megválaszolni! Tények alapján (nem szent iratok, sámánok, vakszerencse vagy tapasztalati sejtés alapján)!

84 Pár hasznos link A tárgy anyagai elérhetőek a Moodle-ön A tárgy lapja a saját honlapomon (véleményezés!): Szakmai blogom (részben ide is kapcsolódó témákban): http: //vedooltas.blog.hu/2012/09/04/tartalomjegyzek_gyanant

85 Útravaló jótanácsok 1 És végül a legfontosabb: Csak olyan statisztikának higyj, amit sajátkezűleg hamisítottál! (Churchill-nek tulajdonítva) 2 A korreláció nem implikál kauzalitást! 3 Az anekdota többes száma nem az adat! (Roger Brinner) 4 Döntést csak adatra alapozhatunk! 5 Mindig ellenőrizzük és gondoljuk végig az adatok származását!

86 Köszönöm szépen a figyelmet! tamas.ferenci@medstat.hu

Biostatisztika és alkalmazásai

Biostatisztika és alkalmazásai 2013. szeptember 25. Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés,

Részletesebben

Pár történeti megjegyzés

Pár történeti megjegyzés Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész története alatt igen egyszerű alakban megfogalmazható kérdések

Részletesebben

Pár történeti megjegyzés

Pár történeti megjegyzés Pár történeti megjegyzés Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész története alatt igen egyszerű alakban

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

A confounding megoldásai: megfigyelés és kísérlet

A confounding megoldásai: megfigyelés és kísérlet A confounding megoldásai: megfigyelés és kísérlet Ferenci Tamás tamas.ferenci@medstat.hu 2018. szeptember 24. Ferenci Tamás tamas.ferenci@medstat.hu A confounding megoldásai: megfigyelés és kísérlet 2018.

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra Vörös Zsuzsanna NÉBIH RFI tervezési referens 2013. április 17. Egy kis felmérés nem kor Következtetések: 1. a jelenlevők nemi megoszlása:

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI Statisztikai alapfogalmak a klinikai kutatásban Molnár Zsolt PTE, AITI Bevezetés Research vs. Science Kutatás Tudomány Szerkezeti háttér hiánya Önkéntesek (lelkes kisebbség) Beosztottak (parancsot teljesítő

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

Statisztikai becslés

Statisztikai becslés Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,

Részletesebben

Korrelációs kapcsolatok elemzése

Korrelációs kapcsolatok elemzése Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15. Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért 2018. november 15. PÉNZ a boldogság bitorlója? A jövedelemegyenlőtlenség természetes határa A boldog ember gondolata a

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont) VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Az empirikus orvosi kutatások alapgondolata és a kauzalitás

Az empirikus orvosi kutatások alapgondolata és a kauzalitás Az empirikus orvosi kutatások alapgondolata és a kauzalitás Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

A konfidencia intervallum képlete: x± t( α /2, df )

A konfidencia intervallum képlete: x± t( α /2, df ) 1. feladat. Egy erdőben az egy fészekben levő tojásszámokat vizsgáltuk egy madárfajnál. A következő tojásszámokat találtuk: 1, 1, 1,,,,,,, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7. Mi a mintának a minimuma, maximuma,

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi

Részletesebben

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség.

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. 1. tétel Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. A valószínűségszámítás tárgya: véletlen tömegjelenségek vizsgálata. véletlen: a kísérlet kimenetelét

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI, Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus. KOKI, 2015.09.17. Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze.

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció: Biostatisztika = Biometria = Orvosi statisztika Biomatematika 2. előadás Néhány egyszerű definíció: A statisztika olyan tudomány, amely a tömegjelenségekkel kapcsolatos tapasztalati törvényeket megfigyelések

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102 Tárgy- és névmutató A a priori kontraszt 174 175 a priori kritérium 259, 264, 276 adatbevitel 43, 47, 49 52 adatbeviteli nézet (data view) 45 adat-elôkészítés 12, 37, 62 adatgyûjtés 12, 15, 19, 20, 23,

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot

Részletesebben

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17. Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások

Részletesebben

Vizuális adatelemzés

Vizuális adatelemzés Vizuális adatelemzés Rendszermodellezés 2017. Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben