Kettőnél több csoport vizsgálata. Makara B. Gábor

Hasonló dokumentumok
Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

y ij = µ + α i + e ij

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria

Bevezetés a hipotézisvizsgálatokba

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Varianciaanalízis 4/24/12

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis vizsgálatok

Biostatisztika Összefoglalás

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biostatisztika Összefoglalás

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

2012. április 18. Varianciaanaĺızis

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

6. Előadás. Vereb György, DE OEC BSI, október 12.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

[Biomatematika 2] Orvosi biometria

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Kísérlettervezés alapfogalmak

Több valószínűségi változó együttes eloszlása, korreláció

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Többváltozós lineáris regressziós modell feltételeinek

Variancia-analízis (folytatás)

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika elméleti összefoglaló

Az első számjegyek Benford törvénye

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Biostatisztika VIII. Mátyus László. 19 October

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

IV. Változók és csoportok összehasonlítása

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Adatok statisztikai értékelésének főbb lehetőségei

Kutatásmódszertan és prezentációkészítés

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Nemparametrikus tesztek december 3.

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Normális eloszlás tesztje

Kutatástervezés és értékelés. az egy szempontos ANOVA használata

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Statisztikai módszerek 7. gyakorlat

Matematikai geodéziai számítások 6.

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

Matematikai geodéziai számítások 6.

Korreláció és lineáris regresszió

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Kísérlettervezés alapfogalmak

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

[Biomatematika 2] Orvosi biometria

Tantárgy: BEVEZETÉS A TUDOMÁNYOS KUTATÁS MÓD- SZERTANÁBA

Centura Szövegértés Teszt

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

4. A méréses ellenırzı kártyák szerkesztése

Biomatematika 2 Orvosi biometria

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Átírás:

Kettőnél több csoport vizsgálata Makara B. Gábor

Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e különbség A, B, és C kalóriatartalma között?. Milyen sorrend állítható fel a gyógytápszerek között?

Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0 4.0 ± 0.5 4.0 ± 0.6

Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0** 4.0 ± 0.5* 4.0 ± 0.6** * p<0.05, ** p<0.01 vagy akár ***0.001

Miért nem hasonlítunk össze minden csoportot párosával? Mert rossz hatásfokú Mert torzíthatja döntéseinket Minden páros összehasonlításnál 1:0 arányban (vagy a szignifikancia szinttől függő arányban) van esélyünk hibás döntést hozni. Az egy vizsgálatban végzett több páros összehasonlítás hibái halmozódnak A vizsgálat összes, valós első fajú hibája (α) magasabb, mint 0,05 A tudományos irodalom reprodukálhatósági krízisének egyik fontos oka a rejtett vagy tudatlan hibahalmozás a szignifikancia utáni hajszában

A több csoport elemzése két lépésből áll 1. Van-e különbség a csoportosított eredmények halmazában. Ha van különbség, akkor megvizsgáljuk a csoportok közötti lehetséges, vagy tervezett vizsgálatokban a páros vagy többes eltérések valószínűségét

A variancia elemzés alapgondolata: az összes mintában a varianciát két független módszerrel becsüljük Az ANOVA alkotója R.A. Fisher (biológus és statisztikus, egy angliai mezőgazdasági kísérleti állomáson, 1918-5 között). Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H 0 úgy is vizsgálható, hogy a populáció varianciát becsüljük két független módszerrel. Az egyik módszer: a mintákon/csoportokon belüli (belső) szóródásból következtet a varianciára A másik módszer ugyanazon minták átlagainak szóródásából következtet ugyanarra a varianciára. A varianciák hányadosának várható értéke 1, eloszlása az F-eloszlás (Fisher-Snedecor eloszlás) A t próba ekvivalens a két csoporton végzett varianciaanalízissel

Az ANOVA és a t próba kapcsolata A t próba képletében a nevezőben a csoport együttes belső szórása van A számlálóban is szórásnak megfelelő érték, a minta átlagának különbsége van Ez nem más, mint a két szám eltérése az átlaguktól, osztva n-1 -el, ami n= esetben nem más, mint n-1=1 A számlálóban és a nevezőben ugyanazon értékre független becslés szerepel, melynek négyzeteinek hányadosa F eloszlású

A t próba képlete, és annak átalakítása 1 ) ( 1 1, 1 1 1, 1 1 n n s m m t n n s m m t n n Ha a képlet mindkét oldalát négyzetre emeljük: akkor a jobb oldalon két variancia hányadosát kapjuk, azaz 1, 1 1 n n n t n F

A négyzetes összeg additív elemekre bontható A minta elemeinek távolságát a teljes minta nagy átlagától becsüljük a négyzetes összeggel Σ (x nagy-átlag x i )² A négyzetes összeg particionálható (additív módon részekre bontható) Az egyes részeket úgy bontjuk részekre, hogy azok a szórás meghatározott értelmezésű részeinek feleljenek meg, Összes szórás = A csoportok (belső) szórása + a csoportátlagok szórása Illusztráció: Σ (x nagy-átlag x i )²= = Σ (Σ[x nagy-átlag csoportátlag j ]² + Σ[csoportátlag j x i ]² )

A variancia elemzés gondolatmenete A minták normális eloszlásból származnak (n darab) Független minták (angol rövidítés - analysis of variance - ANOVA) Véletlen minták (randomizálás) H 0 : a null hipotézis: a minták közös sokaságból/populációból származnak (v 1 =v =v 3 = =v n ) H 1 : legalább egy minta egy másik sokaságból származik A null hipotézis következménye: s 1 =s =s 3 = =s n ) azaz a varianciák homogenitási feltétele (homoszcedaszcitás) A mintákból két független becslést készítünk a populáció varianciájára ( ) A két variancia becslés hányadosa az F 1, eloszlást követi (F 1, = s 1 /s )

A variancia elemzés gondolatmenete (folytatás) Ha a minták egy sokaságból valók (a null hipotézis igaz), akkor F 1, eloszlásának várható értéke v(f 1, ) = 1 Ha p<0,05 arra, hogy F 1, = 1, akkor elvetjük a nullhipotézist Ha elvetettük a null hipotézist, akkor megkeressük, mely csoportokra mondhatjuk ki, hogy nem egy eloszlásból származnak? Előre tervezett (a priori), vagy utólagos (a posteriori) összehasonlitásokat végzünk

Két variancia hányadosának eloszlása a Fisher Snedecor (F) eloszlás Normális eloszlású mintákból képzett varianciák hányadosa F (m,n) =s 1(m) /s (n)

A több csoport elemzésének második lépése Van-e különböző a csoportok eredményeinek halmazában Ha van, akkor megkeressünk a csoportok közötti valószínű eltérés(eke)t Az eltérés nem csak párok közötti különbség formájában lehet, hanem többes kontrasztokban is Kontrasztra példa: két csoport együttesen eltér másik két csoporttól, párosával nincs szignifikáns különbség

Kontraszt páros és többes összehasonlítás Ha 3 csoport átlagait m 1, m és m 3 jelöli, akkor a lehetséges összehasonlítások, a null hipotézis érvényessége mellett a következők: 0= c 1 *m 1 +c *m +c 3 *m 3, ahol a c 1 +c +c 3 =0 teljesül m1 és m különbsége: m 1 -m, ami kontrasztként felírva: 1*m 1-1*m +0*m 3, ahol c 1 =1, c =-1 és c 3 =0 (m 1 és m ) együttes eltérése (m 3 )-tól: c 1 =1, c =1, c 3 =-, azaz m 1 +m -*m 3 Ha m 1 egy fociklubhoz, m másik fociklubhoz és m 3 egy kézilabdaklubhoz tartozó mérések átlagai, akkor az m 1 +m -*m 3 kontraszt adja a foci és a kézilabda összehasonlítását (c 1 =1, c =1, c 3 =-, összegük nulla).

A több csoport elemzésének veszélyei A feltételek nem teljesülnek Szignifikáns ANOVA, nem találunk szignifikáns páros különbséget Többszörös összehasonlításra módszerválasztás tervezett vagy utólagos elemzés

Több független statisztikai döntés egy vizsgálatban? Mi történik az első fajú hibával, ha két teljesen független vizsgálatot végzünk? Ha két egymástól független hipotézisvizsgálatot végzünk, és két szignifikancia vizsgálatot, mindegyiket az α=0,05 szinten. Miután két független vizsgálatról van szó, ezért a két szignifikancia vizsgálat is függetlennek tekinthető. Ha mind a két null hipotézis igaz, akkor annak valószínűsége, hogy legalább egyik nullhipotézist (hibásan) elvetjük: P(s 1 )=0,05 az első teszt esetében a fenti valószínűséget, P(s )=0,05 a második teszt fenti valószínűségét. P(s 1 )*P(s ) a két esemény együttes előfordulásának valószínűsége, ami 0,05*0,05=0,005 A három lehetséges esemény: s 1 önmagában, s önmagában, s 1 és s együtt fordul elő A két független kísérlet esetében annak valószínűsége, hogy legalább az egyikben hibásan elvetjük a null hipotézist: p= 0,05+0,05-0,005= 0,0975, ami lényegesen magasabb, mint az egy szignifikancia teszt esetében elfogadott 0,05.... és, ha a kísérletek és az összehasonlítások nem függetlenek?

Ha sok a csoport? A fenti gondolatmenet k=10 független teszt elvégzése esetén p=1-(1-0,05) 10 =0,4 A független vizsgálatok számának növelésével jelentősen növeljük annak valószínűségét, hogy olyan hatások létezését mondjuk ki, amelyek a valóságban nem léteznek (fals pozitív döntés(ek))) Minden lehetséges szignifikancia tesztet tekintve a tesztek nem függetlenek, noha a minták azok voltak. Példa a közös kontroll

Ismételt páros összehasonlítások, együttes valószínűségek, az adott vizsgálati adatok tükrében Független döntések száma Névleges szignifikanciaszint Tényleges H0 igaz valószínűsége Tényleges szignifikancia szint 1 0,05 0,950 0,050 0,05 0,903 0,098 3 0,05 0,857 0,143 4 0,05 0,815 0,185 5 0,05 0,774 0,6 6 0,05 0,735 0,65 7 0,05 0,698 0,30 8 0,05 0,663 0,337 9 0,05 0,630 0,370 10 0,05 0,599 0,401 0 0,05 0,358 0,64 40 0,05 0,19 0,871

Lehetséges megoldások a többes összehasonlítások feladatára 1. Az egyedi összehasonlításokban az egyes döntésekre vonatkozó küszöbértékeket módosítjuk úgy, hogy a teljes eljárásban (egy vizsgálatban) az összes összehasonlításra együttesen érvényes küszöbérték(ek)et alkalmazunk. Olyan specifikus eljárásokat készítünk és alkalmazunk, amelyek ismert közös valószínűséggel dolgoznak

Általános eljárások többes összehasonlításokra Ezek az eljárások függetlenek a p értéket szolgáltató eljárásoktól Bonferroni eljárás A részdöntésenkénti szint alacsonyabb, mint a kisérletenkénti szint A részdöntésekben egy közös szintet alkalmazunk mindenütt α*=1-(1-α) 1/k másképen az (1-α) k-adik gyökét kell vonnunk, és az kivonni 1-ből Ha a függetlenség is bizonytalan, akkor α*=α/k (k=5 esetben 0,01) Holm eljárása Részdöntésenként változó szinteket alkalmazunk, rendezzük a p értékeket k összehasonlítás esetén α/k, α/(k-1), α/(k-), α/(k-3),., α/, α ha k=5, akkor α/5, α/4, α/3, α/, α elsőfajú hibát alkalmazunk

Hátrányok - előnyök, általános vagy specifikus eljárás? Előny: kontrolláljuk az elsőfokú hibát az egész vizsgálatra vonatkozóan Hátrány: konzervatívak vagyunk a másodfokú hiba tekintetében Holm eljárása ugyanolyan biztonságos az elsőfajú hiba tekintetében, és jobb hatásfokú, mint a konzervatívabb Bonferroni eljárás Általános eljárás, nem használja ki az ANOVA ismert tulajdonságait Vannak specifikus eljárások az ANOVA-ra optimalizálva Newman-Keuls, Tukey, Scheffé, Dunnett, kicsit eltérő alkalmazásokhoz optimalizálva

Az ANOVA eljárásához készített többes összehasonlító eljárások A különböző eljárások eltérő elvi megoldásokat alkalmaznak Az adott helyzetre és feladatra optimális eljárást érdemes ismerni és alkalmazni Példa: egy kontroll csoporthoz több csoportot hasonlítunk: optimális a Dunnett próba, legjobb, ha a kontroll csoportba nagyobb elemszámot teszünk, mint a többibe. A Scheffé próba a legáltalánosabb többes összehasonlító eljárás, eredménye ekvivalens az ANOVA döntéseivel, azaz szignifikáns ANOVA esetén biztos lesz szignifikáns páros vagy többes kontraszt