Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA"

Átírás

1 Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

2 Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai minta) alapján az egész jelenség (populáció) tulajdonságaira következtetünk. Azt vizsgáljuk, hogy a tapasztalt eredmény (különbség) nagyobb-e, mint amit a véletlen önmagában okoz. Krisztina Boda 2

3 Mintavétel, szimuláció Legyen a populáció 120 átlagú, 10 szórású normális eloszlás, ebből veszünk 50 elemű mintákat Krisztina Boda 3

4 25 Histogram: s2 K-S d=.08901, p>.20; Lilliefors p>.20 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 4

5 20 Histogram: s3 K-S d=.06554, p>.20; Lilliefors p>.20 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 5

6 25 Histogram: s4 K-S d=.05667, p>.20; Lilliefors p>.20 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 6

7 20 Histogram: s5 K-S d=.06256, p>.20; Lilliefors p>.20 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 7

8 22 Histogram: s6 K-S d=.11902, p>.20; Lilliefors p<.10 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 8

9 25 Histogram: s7 K-S d=.07360, p>.20; Lilliefors p>.20 Expected Normal No. of obs X <= Category Boundary Krisztina Boda 9

10 átlag + SD 120 átlagú, 10 szórású populációból származó 50 elemű minták átlagai és szórásai ismétlés Krisztina Boda 10

11 Mekkora lehet a véletlen ingadozás? A minták átlagai 120 körül ingadoznak, ha nem történik semmi, csak sima ismétlés Két mérés különbségének átlaga a 0 körül ingadozik Mekkora az a különbség, amit már nem a véletlen okoz? Krisztina Boda 11

12 Nullhipotézis: véletlen ingadozást mértem, semmi nem történt. A különbség 0 körül ingadozik y=student(x;49) Hipotézisek Alternatív hipotézis: a véletlen ingadozásnál nagyobbat mértem, valami történt A különbség 0-tól eltérő szám körül ingadozik p=2*(1-istudent(abs(x);49))??? Krisztina Boda 12

13 Hipotézisek tesztelése Mekkora esélyt adjunk a véletlennek? (Megbízhatósági szint). Akármennyi lehet, (tőlünk függ), általában 95% Mekkora esélyt adjunk annak, hogy esetleg hibásan döntünk (szignifikancia szint) Általában 5% ( =0.05) Krisztina Boda 13

14 A hipotézisvizsgálat menete Hipotézisek felállítása Nullhipotézis: semmi nem történt Alternatív hipotézis: valami változás van A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól) Minta-elemszám meghatározása A minta előállítása (mérés, adatgyűjtés,stb) A döntési szabály kiszámítása Döntés A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten, nincs elegendő információ a különbség (hatás) kimutatására) A nullhipotézist elvetjük, a különbség szignifikáns %-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott. Krisztina Boda 14

15 Student féle t-próbák Általános cél. A Student t-próbák normális eloszlású populációk átlagait vizsgálják. A hipotézisek teszteléséhez egy t próbastatisztikát használnak, amely a nullhipotézis fennállása esetén adott szabadságfokú t-eloszlást követ. Egymintás t-próba. Adott egyetlen minta, amelyről feltesszük, hogy normális eloszlásból származik. A próbával azt teszteljük, hogy a populációátlag lehet-e egy adott konstans H0: =c Páros t-próba (= egymintás t-próba a különbségekre). Két összetartozó mintát vizsgál. Feltételezzük, hogy a különbség-minta normális eloszlásból származik. A próbával azt teszteljük, hogy a különbség-átlag a populációban lehet-e nulla H0: különbség =0 Kétmintás t-próba ( independent samples t-test). Két független mintánk van, mindegyikről feltétezzük, hogy normális eloszlású populációból származik. A próbával azt teszteljük, hogy a két populáció-átlag azonos-e H0: 1 = 2 Krisztina Boda 15

16 Normális eloszlást feltételezve, az átlagok összehasonlítására használható próbák Egy minta esete: egymintás t-próba Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal): páros t-próba= egymintás t-próba a különbségekre Független minták (placebo-kezelés, férfi-nő, betegegészséges): kétmintás t-próba Azonos szórások esetén klasszikus Különböző szórások esetén módosított (Welch, D) Szórások egyezésének tesztelése: F-próba, Levene-próba Több (>2) minta esete: varianciaanalízis Krisztina 3. Egyváltozós Boda statisztikák 16

17 Krisztina Boda t-próbák végrehajtásának általános menete Null- és alternatív hipotézis felállítása Rögzítjük -t Ellenőrizzük a feltételeket legalább grafikusan Normalitásvizsgálat, kétmintás t-próba esetén a varianciák azonossága a hisztogramok illetve boksz diagramok alapján A próbastatisztika kiszámítása általában egy formula Döntés táblabeli t-érték (t táblázat ) alapján döntés( kézi számolás) t >t táblázat - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség szignifikáns szinten t <t táblázat nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a különbség nem szignifikáns szinten Döntés p-érték alapján (számítógép) p< - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség szignifikáns szinten p> - nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a különbség nem szignifikáns szinten 17

18 Statisztikai próbákról általában

19 Egy- és kétoldalas próbák Kétoldalas próba H 0 : nincs változás 1 = 2 H a : van változás (bármilyen irányú) 1 2 Egyoldalas próba H 0 : az átlag nem csökkent, 1 2 H a : az átlag csökkent, 1 > 2 9 szabadságfokú t-eloszlás Más lesz a táblabeli kritikus érték. p egyoldalas =p kétoldalas /2 Krisztina Boda 19

20 valószínűség df valószínűség egyoldalas kétoldalas df Krisztina Boda 20

21 Szignifikancia Szignifikáns a különbség ha azt mondjuk, hogy van hatás, az esetleges hiba nagysága kicsi (maximum - ez az ún. első fajta hiba). Nem szignifikáns különbség ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy Valóban nincs is különbség Van különbség, csak kevés volt az elemszám Nagy volt a szórás Rossz volt a vizsgálati módszer A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e Krisztina Boda 21

22 Statisztikai hibák Hipotézisvizsgálat során a minták alapján az összehasonlítandó populációkról döntést hozunk: vagy azt állítjuk róluk, hogy különbözők, vagy azt, hogy azonosak. Bárhogyan döntünk is, nem tudhatjuk, hogy helyesen döntöttünk-e, mivel a valóságot nem ismerjük (a hipotézisvizsgálatot éppen ezért végezzük). Helyesen döntöttünk, ha különbséget állapítottunk meg és a populációk valóban eltérők, vagy ha nem állapítottunk meg különbséget, és a populációk valóban azonosak. Döntés H A igaz Igazság H 0 igaz Elvetjük H 0 -t helyes döntés első fajta hiba, Type I. error (szign.) (álpozitív eredmény) valószínűsége: Nem vetjük el második fajta hiba, helyes döntés H 0 -t Type II.error (álnegatív (nem szign.) eredmény) valószínűsége: Krisztina Boda 22

23 Kereszt-osztályozás emlékeztető A referencia teszt Az általunk vizsgált (új) teszt eredménye Pozitív (beteg) Negatív (nem beteg) Pozitív VP Valódi pozitív ÁP Álpozitív Össz pozitív (a + b) (a) (b) Negatív ÁN Álnegatív VN Valódi negatív Össz negatív (c + d) (c) (d) Összes beteg (a + c) Összes nem beteg (b + d) Összes eset (n=a+b+c+d) Szenzitivitás= a/(a+c) 100% P(T + B) = P(T + B)/P(B) Specificikusság= d/(b+d) 100% P(T - E ) = P(T - E )/P(E ) Pozitív prediktív érték= a/(a+b) 100% Negatív prediktív érték = d/(c+d) 100% Validitás = (a+d)/(a+b+c+d) 100% Álnegativitási arány= c/(a+c) 100% ; Álpozitivitási arány= b(b+d) 100% ; Krisztina Boda

24 Első fajta hiba, Type I. error Előfordulhat, hogy szignifikáns különbséget állapítunk meg, pedig valójában nincs különbség. Ebben az esetben a döntés hibás, az elkövetett hibát első fajta hibának nevezik, nagyságát elkövetésének valószínűségével szokás megadni. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ez éppen a szignifikanciaszinttel egyenlő ( ). Ha több összehasonlítást végzünk, pl. több csoportot páronként hasonlítunk össze, ez a hiba halmozódhat. Krisztina Boda 24

25 Második fajta hiba, Type II.error Hipotézisvizsgálat során nem állapítunk meg szignifikáns különbséget, pedig valójában azaz a populációk között mégis van különbség. Ebben az esetben a döntés hibás, az így elkövetett hibát második fajta hibának nevezik. A második fajta hiba valószínűségét ( ) általában nem ismerjük, mivel függ a szignifikanciaszinttől ( ), az elemszámtól, a populáció(k) szórásától tényleges különbség (hatás) nagyságától egyéb tényezők (milyen próba, a feltételek teljesülése, a kísérleti elrendezés,..) A második fajta hiba valószínűségének kiszámítását az nehezíti, hogy nem ismerjük a populációk közötti tényleges különbséget, így gyakran ehelyett a megfelelőnek tekintett különbséget (pl. a legkisebb klinikailag jelentős különbség), vagy a minták átlagai alapján becsült különbséget alkalmazzák. A populáció szórását pedig a minta(ák)ból számolt szórással közelítik. Krisztina Boda 25

26 A próba ereje A második fajta hiba valószínűsége helyett inkább (1 )-t, a próba erejét szokták megadni A próba ereje azt méri, hogy a próba milyen jó abban az esetben, ha elvetjük a hamis nullhipotézist. Minél erősebb a próba, (minél közelebb van értéke 1-hez), annál nagyobb valószínűséggel veti el a hamis nullhipotézist. Másképpen: a próba ereje annak valószínűsége, hogy egy különbséget adott mintanagyság és szignifikancia-szint mellett egy statisztikai próba kimutat. A vizsgálatok tervezésének gyakorlatában az erő nagyságának előre megszabott értékéből kiindulva határozzák meg a szükséges mintaelemszámot. A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé teszi adott esetén. Krisztina Boda 26

27 Második fajta hiba, Type II.error Ha a ködben semmit sem látsz, ez távolról sem jelenti azt, hogy nincs ott semmi. (Piepenbrink kapitány Hans-Peter Beck-Bernholdt, Hans-Hermann Dubben: A tojást rakó kutya. Magyar könyvklub, 1999.) Krisztina Boda 27

28 Második fajta hiba, Type II.error Krisztina Boda 28

29 A próba ereje adott elemszám és esetén, különböző alternatív hipotézisek mellett Krisztina Boda 29

30 A próba ereje adott elemszám és esetén, különböző alternatív hipotézisek mellett Krisztina Boda 30

31 Két átlag (változás) összehasonlításához szükséges elemszám ismert esetén z x 0 n Legyen a H0-ban és a H1-ben megfogalmazott átlag µ 0 ill. µ 1. Adott α,β, µ 0 ill. µ 1 esetén, konstans és ismert szórást tekintve a kritikus értékek a következők: z x 0 n z x 1 n z α µ 0 z β µ 1 ( z ) z n 1 0 Kétoldalas α=0.05 esetén z α =1.96, Egyoldalas β=0.1 esetén z β =1.28. Az egyenletekből az átlagot kifejezve és a két oldalt egyenlővé téve az n: 2 Krisztina Boda 31

32 Kérdések Ha két mintaátlagát vizsgálom, milyen esetben (milyen kísérlet esetén) lehet páros t-próbát és milyen esetben lehet kétmintás t- próbát alkalmazni? A kétmintás t-próba feltételei A kétmintás t-próba nullhipotézise A kétmintás t-próba végrehajtása azonos és különböző varianciák esetén A varianciák összehasonlítása: F-próba A statisztikai szignifikancia jelentése és értelmezése Statisztikai hibák Az első fajta hiba jelentése és valószínűsége A második fajta hiba jelentése és valószínűsége. Mitől függ? A próba ereje Elemszámbecslés két átlag összehasonlításához (mitől függ?) Krisztina Boda

33 Feladat A kalcium hatását vizsgálták a vérnyomásra két csoportban. A kezelés előtt és a kezelés után mért különbségeket hasonlították össze kétmintás t-próbával. Értelmezze az alábbi eredményeket! Kimutatható-e 5%-os hibát feltételezve, hogy a kalcium kezelés csökkenti a vérnyomást? Vérnyomás-esés alapstatisztikák Group Statistics decr treat Calcium Placebo Std. Error N Mean Std. Dev iation Mean t-próba eredménye: különböző varianciákat feltételezve, t=1.604, szabadságfok=15.591, p=0.129-et kaptunk. (Útmutatás: elegendő a p-érték alapján dönteni, p>0.05, a különbség nem szignifikáns 5%-os szinten) Independent Samples Test decr Equal v ariances assumed Equal v ariances not assumed Levene's Test f or Equality of Variances t-test for Equality of Means 95% Confidence Interv al of the Mean Std. Error Dif f erence F Sig. t df Sig. (2-tailed) Dif f erence Dif f erence Lower Upper Krisztina Boda

34 Feladatok 1. Vajon azonos-e a diabeteses és nem diabeteses populáció átlag- cholesterin szintje? Egy vizsgálatban az között születettek korcsoportjában a következő eredményeket kapták: Kontroll csoport n=63, átlag=5.27, SD=1.16 Diabetes csoport n=52, átlag=4.63, SD=1.31. A kérdés eldöntésére milyen statisztikai próbát használ? Mik a próba feltételei? A próbastatisztika értéke t= Szignifikáns-e a különbség? Döntsön 5%-os szinten (α =0.05) A p-érték Szignifikáns-e a különbség 5%-os szinten? 2. Vajon azonos-e a hallgatók populációjában a fiúk és lányok átlagéletkora? Az idegen nyelvű képzésben szereplő hallgatók adatait elemezve, az átlagok összehasonlítására a következő eredményeket kapták: Fiú: n=4, átlag=21.18, SD=3.025 Lány: n=53, átlag=20.38, SD=3.108 A kérdés eldöntésére milyen statisztikai próbát használ? Mik a próba feltételei? A próbastatisztika értéke t= Szignifikáns-e a különbség? Döntsön 5%-os szinten (α =0.05) A p-érték Szignifikáns-e a különbség 5%-os szinten? Krisztina Boda 34

35 Krisztina Boda Problémák több próba végrehajtásakor

36 átlag + SD Ugyanazon populációból származó minták páronkénti összehasonlítása t-próbával T-test for Dependent Samples: p-levels (veletlen) Marked differences are significant at p < Variable s10 s11 s12 s13 s14 s15 s16 s17 s18 s19 s20 s1 s2 s3 s4 s5 s6 s7 s8 s ismétlés Krisztina Boda 36

37 Miért nem t-próbákat végzünk páronként? Mert a véletlen is okozhat szignifikáns eredményt átlagosan minden 20-adik esetben. CSOP R1 R2 R3 R4 R5 R6 R7 R t - p r s z i g n. 4 e l s ő f a j t a h i b a v s z - e Krisztina Boda 37

38 Az első fajta hiba növekedése, összehasonlításonkénti és kísérletenkénti szignifikancia Ha egy adott adathalmaz esetén adott változóra vagy változókra vonatkozóan több statisztikai próbát is elvégzünk, mindegyiket adott mellett, az egész kísérletre vonatkozó az első fajta hibavalószínűség -nál sokkal nagyobb is lehet. Ez a meglepőnek látszó tényt a kétmintás t- próbával mutatjuk be: Az =0.05 szint azt jelenti, hogy amennyiben a nullhipotézis igaz, (pl. az összehasonlítandó populációk között nincs különbség), az első fajta hiba elkövetésének valószínűsége 0.05, azaz minden száz ilyen esetből 5 alkalommal, nagyjából minden húszadik esetben követhetjük el ezt a hibát. Ennyiszer okoz ugyanis a véletlen a különben egyforma, azonos populációkból vett minták közt túlságosan nagy, általunk szignifikánsnak minősített különbséget. Ha több, azonos populációból vett mintát páronként hasonlítunk össze, 20 közül átlagosan 1 összehasonlítás szignifikáns eredményre vezet! Általában, n számú független összehasonlítás esetén annak valószínűsége, hogy legalább egy összehasonlítás hibás (legalább egyszer elkövetjük az első fajta hibát), maximum:1-(1- ) n Krisztina Boda 38

39 A kísérletenkénti első fajta hiba valószínűségének növekedése Emiatt hibás több csoport esetén az átlagok összehasonlítására páronkénti kétmintás t-próbákat végezni, vagy két csoport esetén több összefüggő változót szintén kétmintás t-próbákkal összehasonlítani. Nem tudhatjuk ugyanis, hogy a szignifikáns eredmények közül melyek tulajdoníthatók a véletlennek, és melyek tükröznek valódi különbséget. Krisztina Boda 39

40 Sok kis darabból összecsomózott hegymászókötél: az egyes csomók 95%-os valószínűséggel jól tartanak Két csomó hibátlan voltának valószínűsége=0.95*0.95 =0.9025~90% 20 csomó hibátlan voltának valószínűsége= = =0.358~36% Lezuhanás valószínűsége 20 csomó esetén ~64% Krisztina Boda 40

41 Megoldás: sok t-próba helyett egyetlen varianciaanalízis Az egyedi p-értékek korrekciója Bonferroni Holm FDR (False Discovery Rate) Krisztina Boda 41

42 ANOVA Analysis of Variance Több (>2), normális eloszlású populáció átlagának összehasonlítására szolgáló módszer Fajtái: Egyszempontos (one-way): kontroll, kezelés I, kezelés II. Többszempontos (Kezelés, nem: a kettő együtt hogy hat) Bármelyik szempont lehet független ( between-subjects ) pl. nem, kezelési csoportok ismételt méréses ( within-subjects ) pl. időben mért ismétlések Krisztina Boda 42

43 Példa Egy kísérletben (Farkas és mtsai, 2003.) lokális iszkémiának alávetett, izolált patkányszívben a szívfrekvencia és a QT szakasz hosszának változását vizsgálták három antiaritmiás gyógyszer hatására. 5 Mm K+ kálium ion koncentráció esetén, 25 perccel a lokális iszkémia után a QT szakasz hosszára a 4.8. táblázatban látható értékeket kapták. Vizsgáljuk meg, hogy a 4 csoportban van-e különbség a QT szakasz átlagos hosszában! Kontroll Quinidine Lidocaine Flecainide átlag SD Kontroll Quinidine Lidocaine Flecainide Krisztina Boda 43

44 Egyszempontos ANOVA Feltételek, nullhipotézis Feltételek: Az egyedek véletlenszerűen kerülnek egyik vagy másik csoportba, a minták független minták (egy egyed csak egy csoportba kerülhet). Az összehasonlítandó értékeket tartalmazó változó folytonos. A minták normális eloszlású populációból származnak. Azok a populációk, amelyekből a minták származnak, azonos varianciájúak. Nullhipotézis: A független minták azonos eloszlású populációból származnak, azaz a populáció-átlagok megegyeznek H0: 1 = 2 = = t t a csoportok száma (t kezelés - treatment) HA: i j i j, i,j=1,2, t (van a csoport-átlagok között különböző) Krisztina Boda 44

45 Módszer Az ANOVA a teljes adathalmaz összvarianciáját kétféle forrásból származtatja: Csoportok közötti Csoportokon belüli Ha igaz az a nullhipotézis, hogy a populáció-átlagok megegyeznek, (H0: 1 = 2 = = t ), akkor a populációban a csoportok közötti és a csoportokon belüli variancia is megegyezik. A kettő hasonlításával lehet következtetni az átlagok azonosságára. új nullhipotézis: A populációban a csoportok közötti és a csoportokon belüli variancia megegyezik. 2 között= 2 belül Tesztelése: F-próba (egyoldalas). Egy p-értéket ad: ha p>0.05, akkor elfogadjuk az átlagok azonosságát (H0) ha p<0.05, akkor van az átlagok között különböző Krisztina Boda 45

46 a) b Azonos (a) és különböző (b) átlagú, egységnyi szórású normális eloszlású populációkból vett 6 elemű véletlen minták. Krisztina Boda 46

47 A varianciaanalízis táblázata A variancia analízis számításait általában táblázatba szokták foglalni A szóródás oka Négyzetösszeg Szabadságfok Variancia F t Csoportok 2 Qk ni ( xi x) között t-1 2 Qk s i 1 t 1 t ni Csoportokon 2 Qb ( xij xi ) 2 Qb belül i 1 j 1 N-t sb N t Teljes Q t ni 2 ( xij x) i 1 j 1 N-1 k F s s 2 k 2 b Krisztina Boda 47

48 A varianciaanalízis táblázata példafeladat adataira Kontroll Quinidine Lidocaine Flecainide A szóródás oka Négyzetösszeg Szabadságfok Variancia F p Csoportok között Csoportokon belül Teljes F(3,19)=14.426, p<0.001, a különbség szignifikáns, csoport-átlagok között van legalább egy, a többitől eltérő Krisztina Boda 48

49 További teendők, ha a varianciaanalízis eredménye szignifikáns Ha megállapítottuk, hogy az átlagok nem mind azonosak, felmerül a kérdés, hol van a különbség? Ismételt t-próbákkal nem dolgozhatunk (1. fajta hibanövekedés) Speciális páronkénti összehasonlítások (posthoc tesztek) Előre tervezett összehasonlítások Krisztina Boda

50 Páronkénti hasonlítások Módosított t-próbák (LSD) Bonferroni Scheffé Tukey Dunnett- egy kontrollhoz hasonlítja a többi csoportot Az átlagok különbsége Dunnett - p Kontroll Quinidine Kontroll Lidocaine Kontroll Flecainide Krisztina Boda

51 Páronkénti hasonlítások Multiple Comparisons Multiple Comparisons Dependent Variable: QT LSD (I) CSoport Kontroll Quinidine Lidocaine Flecainide (J) CSoport Quinidine Lidocaine Flecainide Kontroll Lidocaine Flecainide Kontroll Quinidine Flecainide Kontroll Quinidine Lidocaine Mean Diff erence 95% Confidence Interv al (I-J) Std. Error Sig. Lower Bound Upper Bound * * * * * * * * *. The mean diff erence is signif icant at the.05 lev el. Dependent Variable: QT Bonf erroni (I) CSoport Kontroll Quinidine Lidocaine Flecainide (J) CSoport Quinidine Lidocaine Flecainide Kontroll Lidocaine Flecainide Kontroll Quinidine Flecainide Kontroll Quinidine Lidocaine Mean Diff erence 95% Confidence Interv al (I-J) Std. Error Sig. Lower Bound Upper Bound * * * * * * *. The mean diff erence is signif icant at the.05 lev el. p Bonferroni =p LSD *összehasonlítások száma=p LSD *6 Krisztina Boda 51

52 > csoport<-factor(c(1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4)) > mit<c(61,53,68,66,54,76,84,89,78,81,89,65,56,76,72,66,69,69,65,73,71,61,69) > mean(mit[csoport==1]);sd(mit[csoport==1]) [1] 60.4 [1] > mean(mit[csoport==2]);sd(mit[csoport==2]) [1] [1] > mean(mit[csoport==3]);sd(mit[csoport==3]) [1] [1] > mean(mit[csoport==4]);sd(mit[csoport==4]) [1] 68 [1] > boxplot(mit~csoport) > fit<-aov(mit~csoport) #1-es tipusu, unbalanced eseten > fit Call: aov(formula = mit ~ csoport) R futtatás Terms: csoport Residuals Sum of Squares Deg. of Freedom 3 19 Residual standard error: Estimated effects may be unbalanced > summary(fit) #szokasos ANOVA tablat adja Df Sum Sq Mean Sq F value Pr(>F) csoport e-05 *** Residuals Signif. codes: 0 *** ** 0.01 * > pairwise.t.test(mit,csoport,p.adj="none") #LSD Pairwise comparisons using t tests with pooled SD data: mit and csoport e P value adjustment method: none > pairwise.t.test(mit,csoport,p.adj="bon") #Bonferroni Pairwise comparisons using t tests with pooled SD data: mit and csoport e P value adjustment method: bonferroni Krisztina Boda

53 Kérdések és feladatok Krisztina Boda Miért nem helyes több csoport átlagának összehasonlítására páronként t-próbákat alkalmazni? A Bonferroni korrekció Az egyszempontos varianciaanalízis céja, null- és alternatív hipotézise A varianciaanalízis elve (milyen varianciákat hasonlít?), táblázata Páronkénti hasonlítások

54 Hasznos WEB oldalak Klinikai Biostatisztikai Társaság Rice Virtual Lab in Statistics html Statistics on the Web Krisztina Boda 54

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet Elemszám becslés Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet Miért fontos? Gazdasági okok: Túl kevés elem esetén nem tudjuk kimutatni a kívánt hatást Túl kevés elem esetén olyan eredmény

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézis Állítás a populációról (vagy annak paraméteréről) Példák H1: p=0.5 (a pénzérme

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari

Részletesebben

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html

Részletesebben

Normál eloszlás. Gyakori statisztikák

Normál eloszlás. Gyakori statisztikák Normál eloszlás Átlag jól jellemzi az adott populációt folytonos eloszlás (pl. lottó minden szám egyszer fordul elő) kétkúpú eloszlás (IQ mindenki vagy zseni vagy félhülye, átlag viszont azt mutatja,

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás paramétereire vonatkozó próbák Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású

Részletesebben

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21. Középérték és variancia azonosságának próbái: t-próba, F -próba 2012. március 21. Hipotézis álĺıtása Feltételezés: a minta egy adott szempont alapján más populációhoz tartozik, mint b minta. Nullhipotézis

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Statisztikai szoftverek esszé

Statisztikai szoftverek esszé Statisztikai szoftverek esszé Dávid Nikolett Szeged 2011 1 1. Helyzetfelmérés Adott egy kölcsön.txt nevű adatfájl, amely információkkal rendelkezik az ügyfelek életkoráról, családi állapotáról, munkaviszonyáról,

Részletesebben

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit. 1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit. 1., Határozza meg az átlagos egyedszámot és a szórást. Egyedszám (x i )

Részletesebben

2012. április 18. Varianciaanaĺızis

2012. április 18. Varianciaanaĺızis 2012. április 18. Varianciaanaĺızis Varianciaanaĺızis (analysis of variance, ANOVA) Ismételt méréses ANOVA Kérdések: (1) van-e különbség a csoportok között (t-próba általánosítása), (2) van-e hatása a

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018 Hipotézisvizsgálat az Excel adatelemző eljárásaival Dr. Nyéki Lajos 2018 Egymintás t-próba Az egymintás T-próba azt vizsgálja, hogy különbözik-e a változó M átlaga egy megadott m konstanstól. Az a feltételezés,

Részletesebben

X PMS 2007 adatgyűjtés eredményeinek bemutatása X PMS ADATGYŰJTÉS

X PMS 2007 adatgyűjtés eredményeinek bemutatása X PMS ADATGYŰJTÉS X PMS ADATGYŰJTÉS 2007 1 Tartalom Összefoglalás...3 A kutatásba beválasztott betegek életkora... 4 A kutatásba bevont betegek nem szerinti megoszlása... 5 Az adatgyűjtés során feltárt diagnózisok megoszlása...

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2 Kabos: Ordinális változók Hipotézisvizsgálat-1 Minta: X 1, X 2,..., X N EVM (=egyszerű véletlen minta) X-re Feltesszük, hogy a mintaelemek között nincs két azonos. Rendezett minta: X (1), X (2),..., X

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157. Kiváltott agyi jelek informatikai feldolgozása 2018 Statisztika - Gyakorlat Kiss Gábor IB.157. kiss.gabor@tmit.bme.hu Példa I (Vonat probléma) Aladár 25 éves és mindkét nagymamája él még: Borbála és Cecília.

Részletesebben

IV. Változók és csoportok összehasonlítása

IV. Változók és csoportok összehasonlítása IV. Változók és csoportok összehasonlítása Tartalom Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta

Részletesebben

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis Hipotézis BIOMETRIA 5. Előad adás Hipotézisvizsg zisvizsgálatok Tudományos hipotézis Nullhipotézis feláll llítása (H ): Kétmintás s hipotézisek Munkahipotézis (H a ) Nullhipotézis (H ) > = 1 Statisztikai

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

Esetelemzés az SPSS használatával

Esetelemzés az SPSS használatával Esetelemzés az SPSS használatával A gepj.sav fileban négy különböző típusú, összesen 80 db gépkocsi üzemanyag fogyasztási adatai találhatók. Vizsgálja meg, hogy befolyásolja-e az üzemanyag fogyasztás mértékét

Részletesebben

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! A1 A2 A3 (8) A4 (12) A (40) B1 B2 B3 (15) B4 (11) B5 (14) Bónusz (100+10) Jegy NÉV (nyomtatott nagybetűvel) CSOPORT: ALÁÍRÁS: ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! 2011. december 29. Általános tudnivalók:

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti. Elmélet let BIOMETRIA 7. Előad adás Variancia-anal Lineáris modellek A magyarázat a függf ggő változó teljes heterogenitásának nak két k t részre r bontását t jelenti. A teljes heterogenitás s egyik része

Részletesebben

KISTERV2_ANOVA_

KISTERV2_ANOVA_ Két faktor szerinti ANOVA Az A faktor minden szintjét kombináljuk a B faktor minden szintjével, minden cellában azonos számú ismétlés (kiegyensúlyozott terv). A terv szerkezete miatt a faktorok hatását

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

A konfidencia intervallum képlete: x± t( α /2, df )

A konfidencia intervallum képlete: x± t( α /2, df ) 1. feladat. Egy erdőben az egy fészekben levő tojásszámokat vizsgáltuk egy madárfajnál. A következő tojásszámokat találtuk: 1, 1, 1,,,,,,, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7. Mi a mintának a minimuma, maximuma,

Részletesebben

BIOMETRIA_ANOVA_2 1 1

BIOMETRIA_ANOVA_2 1 1 Két faktor szerinti ANOVA Az A faktor minden szintjét kombináljuk a B faktor minden szintjével, minden cellában azonos számú ismétlés (kiegyensúlyozott terv). A terv szerkezete miatt a faktorok hatását

Részletesebben

Több laboratórium összehasonlítása, körmérés

Több laboratórium összehasonlítása, körmérés Több oratórium összehasonlítása, körmérés colorative test, round robin a rendszeres hibák ellenőrzése, számszerűsítése Statistical Manual of AOAC, W. J. Youden: Statistical Techniques for Colorative Tests,

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Statisztika Elıadások letölthetık a címrıl

Statisztika Elıadások letölthetık a címrıl Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel

Részletesebben

Variancia-analízis (folytatás)

Variancia-analízis (folytatás) Variancia-analízis (folytatás) 7. elıadás (13-14. lecke) Egytényezıs VA blokk-képzés nélkül és blokk-képzéssel 13. lecke Egytényezıs variancia-analízis blokkképzés nélkül Az átlagok páronkénti összehasonlítása(1)

Részletesebben

Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER

Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER KLINIKAI ALKALMAZÁSOK GYÓGYSZER TESZTELÉS MIK LEHETNEK A PROBLÉMÁK? STATISZTIKAI ALAPKÖVEK GYÓGYULÁSI ESÉLYEK TARTALOM

Részletesebben

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016 Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait

Részletesebben

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika

Részletesebben

Sztochasztikus kapcsolatok

Sztochasztikus kapcsolatok Sztochasztikus kapcsolatok Petrovics Petra PhD Hallgató Ismérvek közötti kapcsolat (1) Függvényszerű az egyik ismérv szerinti hovatartozás egyértelműen meghatározza a másik ismérv szerinti hovatartozást.

Részletesebben

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI Statisztikai alapfogalmak a klinikai kutatásban Molnár Zsolt PTE, AITI Bevezetés Research vs. Science Kutatás Tudomány Szerkezeti háttér hiánya Önkéntesek (lelkes kisebbség) Beosztottak (parancsot teljesítő

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta Nem-paraméteres és paraméteres módszerek Kontingencia tábla, rangtranszformálás, párosított minták, két független minta Az előadások célja bemutatni a hipotézis vizsgálat elveinek alkalmazását a gyakorlatban

Részletesebben

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik) 5.4: 3 különböző talpat hasonlítunk egymáshoz Varianciaanalízis. hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik) hipotézis: Létezik olyan μi, amely nem egyenlő a többivel (Van

Részletesebben

Statisztikai becslés

Statisztikai becslés Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,

Részletesebben

SPSS ÉS STATISZTIKAI ALAPOK II.

SPSS ÉS STATISZTIKAI ALAPOK II. SPSS ÉS STATISZTIKAI ALAPOK II. Bevezetés A második negyedéves anyag alapvetően olyan statisztikai elemzéseket tartalmaz, amelyek átlagok összehasonlítására alkalmasak. Tipikus kérdések: 1) Intelligensebbek-e

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31

Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31 Matematikai statisztika Gazdaságinformatikus MSc 11. előadás 2018. november 26. 1/31 A tojást rakó kutya - a könyv Hans Peter Beck-Bernholdt, Hans-Hermann Dubben: A tojást rakó kutya c. könyve alapján

Részletesebben

Az első számjegyek Benford törvénye

Az első számjegyek Benford törvénye Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26 ANOVA,MANOVA Márkus László 2013. március 30. Márkus László ANOVA,MANOVA 2013. március 30. 1 / 26 ANOVA / MANOVA One-Way ANOVA (Egyszeres ) Analysis of Variance (ANOVA) = szóráselemzés A szórásokat elemezzük,

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2 Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének

Részletesebben

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák Statisztikai hipotézisvizsgálatok Paraméteres statisztikai próbák 1. Magyarországon a lakosság élelmiszerre fordított kiadásainak 2000-ben átlagosan 140 ezer Ft/fő volt. Egy kérdőíves felmérés során Veszprém

Részletesebben