Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Hasonló dokumentumok
Kettőnél több csoport vizsgálata. Makara B. Gábor

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

y ij = µ + α i + e ij

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Bevezetés a hipotézisvizsgálatokba

[Biomatematika 2] Orvosi biometria

Hipotézis vizsgálatok

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biomatematika 13. Varianciaanaĺızis (ANOVA)

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Varianciaanalízis 4/24/12

Hipotézis vizsgálatok

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Kísérlettervezés alapfogalmak

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

[Biomatematika 2] Orvosi biometria

Adatok statisztikai értékelésének főbb lehetőségei

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Biostatisztika VIII. Mátyus László. 19 October

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

6. Előadás. Vereb György, DE OEC BSI, október 12.

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika elméleti összefoglaló

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Nemparametrikus tesztek december 3.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

2012. április 18. Varianciaanaĺızis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Az első számjegyek Benford törvénye

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Több valószínűségi változó együttes eloszlása, korreláció

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Többváltozós lineáris regressziós modell feltételeinek

Variancia-analízis (folytatás)

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Biomatematika 2 Orvosi biometria

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Normális eloszlás tesztje

Függetlenségvizsgálat, Illeszkedésvizsgálat

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Kutatástervezés és értékelés. az egy szempontos ANOVA használata

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

IV. Változók és csoportok összehasonlítása

Korreláció és lineáris regresszió

Valószínűségszámítás összefoglaló

[Biomatematika 2] Orvosi biometria

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

4. A méréses ellenırzı kártyák szerkesztése

Kutatásmódszertan és prezentációkészítés

A valószínűségszámítás elemei

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

KÖVETKEZTETŐ STATISZTIKA

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Matematikai geodéziai számítások 6.

Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

A pont példájának adatai C1 C2 C3 C

Átírás:

Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e különbség a különböző gyógytápszerek kalóriatartalma között?. Milyen sorrend állítható fel közöttük?

Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0 4.0 ± 0.5 4.0 ± 0.6

Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0** 4.0 ± 0.5* 4.0 ± 0.6** * p<0.05, ** p<0.01 vagy akár ***0.001

A véletlennek tulajdonítható-e minden különbség? Nézzük meg, mire vezethet a véletlen Használjunk táblázatkezelőt, benne véletlen szám generátort, grafikont és statisztikai elemzést.

Miért nem hasonlítunk össze minden csoportot párosával? Mert rosszabb hatásfokú, mint ha az összes megfigyelésből számítjuk a véletlennek tulajdonítható változékonyságot Mert torzíthatja döntéseinket Minden páros összehasonlításnál 1:0 arányban (vagy a szignifikancia szinttől függő arányban) van esélyünk hibás döntést hozni.

A több csoport elemzése két lépésből áll Megvizsgáljuk, van-e egyáltalában valamilyen különbség a csoportosított eredmények halmazában Ha valószínű, hogy a csoportok nem egy sokaságból vett véletlen minták, akkor megvizsgáljuk a csoportok közötti eltérések valószínűségét

Az elemzés alapgondolata: a varianciát két módon becsüljük Az ANOVA alkotója Ronald A. Fisher (egy angliai mezőgazdasági kísérleti állomáson, 1918-5 között). Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H0 úgy is vizsgálható, hogy a populáció varianciát becsüljük két módszerrel. Az egyik módszer: a mintákon/csoportokon belüli szóródásból következtet a varianciára A másik módszer ugyanazon minták átlagainak szóródásából következtet a varianciára.

A négyzetes összeg additív elemekre bontható A minta elemeinek távolságát a teljes minta nagy átlagától becsüljük a négyzetes összeggel Σ (x nagy átlag x i )² A négyzetes összeg particionálható (additív módon részekre bontható) Az egyes részeket úgy bontjuk, hogy azok a szórás egy meghatározott értelmezésű részének feleljenek meg,

Példa a szórás particionálására

A szórás elemzés gondolatmenete A minták normális eloszlásból származnak (n darab) Független minták (szórás elemzés =variancia analízis=analysis of variance=anova) Véletlen minták (randomizálás) Null hipotézis: a minták közös sokaságból/populációból származnak, várható értékük azonos, v 1 =v =v 3 = =v n Null hipotézis következménye, várható szórásnégyzetük is azonos: s 1 =s =s 3 = =s n A mintákból két független becslést készítünk a populáció szórására, pontosabban varianciájára ( ) A két variancia becslés hányadosa az F 1, eloszlást követi (F 1, = s 1 /s )

A szórás elemzés gondolatmenete (folytatás) Ha a minták egy sokaságból valók (a nullhipotézis érvényes), akkor F 1, eloszlásának várható értéke v(f 1, ) = 1 Ha p<0,05 arra, hogy F 1, = 1, akkor elvetjük a nullhipotézist Ha elvetettük a nullhipotézist, akkor megkeressük, mely csoportokra mondhatjuk ki, hogy nem egy eloszlásból származnak? Előre tervezett (a priori), vagy utólagos (a posteriori) összehasonlításokat végzünk

A szóráselemzés és a t próba kapcsolata A két eljárás ekvivalens A t próba képletében a nevezőben az átlag szórása van A számlálóban is szórásnak megfelelő érték van: minta átlagának különbsége van Ez nem más, mint a két szám eltérése az átlaguktól, osztva n-1 -el, ami n= esetben nem más mint 1. A számlálóban és a nevezőben ugyanazon értékre becslés szerepel, melynek négyzeteinek hányadosa F eloszlású

A t próba képlete, és annak átalakítása 1 ) ( 1 1, 1 1 1, 1 1 n n s m m t n n s m m t n n Ha a képlet mindkét oldalát négyzetre emeljük: Akkor a jobb oldalon két variancia hányadosát kapjuk, azaz 1, 1 1 n n n t n F

A nullhipotézis szerinti helyzet ábrázolása v 1 y v v 3 1.csoport.csoport 3.csoport

Az egyik alternatív hipotézis szerinti helyzet ábrázolása y -3.50-1.75 0.00 1.75 3.50 v 1.csoport.csoport 3.csoport -3.50-1.75 0.00 1.75 3.50 v 1-3.50-1.75 0.00 1.75 3.50 v 3

Variancia csoportok között és csoporton belül: ugyanannak a paraméternek két becslése ( csoport esetén bemutatva) nagy átlag a b Csoportokon belül Csoportok között (megtartjuk a szóródást) (megtartjuk a középértéket)

A négyzetes összeg összetevői egy szempont esetén Az A szempont szóródása A véletlen okozta szóródás

Egy szempontos ANOVA tábla Forrás sz.fok (df) Négyzetes összeg variancia F p A kezelés i-1 Q A s A s A/s b Mintákon belül n-i Q b s b Összes n-1 Q ö s ö i darab kezelés, kezelésenként n i, összesen n darab megfigyeléssel..

Tanulságok Ha több csoportra van szükségünk, tervezzünk erre vizsgálatot Ha egy szempont szerint rendezhetők a csoportok: egy szempontos ANOVA Utána többszörös összehasonlítás ha az ANOVA szignifikáns volt

A többszörös összehasonlítás gondolatmenete

Több mint két statisztikai döntés egy vizsgálatban? Mi lesz az első fajú hiba, ha két teljesen független kísérletet végzünk két független minta összehasonlításával. Két független hipotézisvizsgálatot végzünk, és két szignifikancia vizsgálatot, mindegyiket az α=0,05 szinten. A két szignifikancia vizsgálat is függetlennek tekinthető. Tegyük fel: mindkét esetben a nullhipotézis hibás elvetésének a valószínűsége p=0,05. Annak valószínűsége, hogy legalább egyik nullhipotézist (hibásan) elvetjük: Jelölje P(s 1 )=0,05 az első teszt esetében a hibás döntés valószínűsége, P(s )=0,05 a második teszt esetében a hibás döntés valószínűsége. A két esemény együttes előfordulásának valószínűsége P(s 1 )*P(s ), ami 0,05*0,05=0,005 A három lehetséges esemény: s önmagában, s önmagában, s 1 és s együtt. Annak valószínűsége, hogy legalább az egyikben hibásan elvetjük a null hipotézist: p= 0,05+0,05-0,005 = 0,0975, ami lényegesen magasabb, mint 0,05.

Ha sok a csoport? A fenti gondolatmenet k=10 független teszt elvégzése esetén p=1-(1-0,05) 10 =0,4 A független vizsgálatok számának növelésével jelentősen növeljük annak valószínűségét, hogy olyan hatások létezését mondjuk ki, amelyek a valóságban nem léteznek Minden lehetséges szignifikancia tesztet tekintve a tesztek nem függetlenek, noha a minták azok voltak

Megoldások Az egyedi összehasonlításokban az egyes döntésekre vonatkozó küszöbértékeket úgy módosítjuk, hogy a teljes eljárásban (egy vizsgálatban) az összes összehasonlításra együttesen érvényes ismert, küszöbérték(ek)et alkalmazunk Olyan eljárásokat készítünk és alkalmazunk, amelyek ismert közös valószínűséggel dolgoznak Multiple comparison tests

Általános eljárások Bonferroni eljárás A részdöntésenkénti szint alacsonyabb, mint a kísérletenkénti szint A részdöntésekben egy közös szintet alkalmazunk mindenütt α*=1-(1-α)exp(1/k), másképen az (1-α) k-adik gyökét kell vonnunk, és az kivonni 1-bõl Ha a függetlenség is bizonytalan, akkor α*=α/k Holm eljárása Részdöntésenként változó szinteket alkalmazunk k összehasonlítás esetén α/k, α/(k-1), α/(k-), α/(k-3),., α/, α

Holm módszerhez számolási eljárás Teszt Valószínûség Küszöb Érték (ha alfa=0,05, és k=5) 1 p1 alfa/k 0,01 p (>p1) alfa/(k-1) 0,015 3 p3 (>p) alfa/(k-) 0,0166. 4 p4 (>p3) alfa/(k-3) 0,05 5 p5 (>p4) alfa/(k-4), azaz alfa 0,05

Hátrányok, előnyök Előny: kontrolláljuk az elsőfokú hibát Hátrány: konzervatívak vagyunk a másodfokú hiba tekintetében Bonferroni eljárás konzervatívabb, mint Holm eljárása, miközben a két módszer ugyanolyan biztonságos az elsőfajú hiba tekintetében

ANOVA keretei közötti többszörös összehasonlítások Intenzív kutatás 1950-es évektől Statisztikai szoftverekbe beépítették a módszereket Két eljáráscsoport Előre tervezett összehasonlítások Utólag végzett összehasonlítások Minél többet végzünk, annál rosszabb a vizsgálat hatásfoka

ANOVA után alkalmazható többszörös összehasonlító eljárások Holm, Bonferroni Tervezett összehasonlítások Dunnett Dunn Általános, szignifikancia értékeket használ Kutatás kezdetekor előre tervezendő Egy kontrollhoz több kezelés Több páros összehasonlítás, kétséges elvi alapja Newman-Keuls Tukey Tukey nem egyenlő elemszámokra Scheffé páros Scheffé kontrasztok Több csoport összevont eredményeit is lehet vele vizsgálni

Tanulságok A sokféle eljárásból a helyzethez legjobbat válasszuk ki A Holm eljárás mindenféle szignifikancia teszt eredményére alkalmazható Az egy kontroll több vizsgálati csoporthoz: Dunnett próba Több páros összehasonlításhoz Newman-Keuls eljárás Scheffé kontraszt összetett következtetéshez