Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet
Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e különbség a különböző gyógytápszerek kalóriatartalma között?. Milyen sorrend állítható fel közöttük?
Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0 4.0 ± 0.5 4.0 ± 0.6
Több csoport statisztikai elemzése: pajzsmirigy gyulladás - szérum hormon értékek Csoport ft4 ft3 ft4/ft3 Kontroll (0) 14 ± 1.0 4. ± 0.5 3.3 ± 0.5 Beteg (18) 14 ±.0 4.4 ± 0.5 3. ± 0.4 Beteg kezelt (35) 16 ±.0** 4.0 ± 0.5* 4.0 ± 0.6** * p<0.05, ** p<0.01 vagy akár ***0.001
A véletlennek tulajdonítható-e minden különbség? Nézzük meg, mire vezethet a véletlen Használjunk táblázatkezelőt, benne véletlen szám generátort, grafikont és statisztikai elemzést.
Miért nem hasonlítunk össze minden csoportot párosával? Mert rosszabb hatásfokú, mint ha az összes megfigyelésből számítjuk a véletlennek tulajdonítható változékonyságot Mert torzíthatja döntéseinket Minden páros összehasonlításnál 1:0 arányban (vagy a szignifikancia szinttől függő arányban) van esélyünk hibás döntést hozni.
A több csoport elemzése két lépésből áll Megvizsgáljuk, van-e egyáltalában valamilyen különbség a csoportosított eredmények halmazában Ha valószínű, hogy a csoportok nem egy sokaságból vett véletlen minták, akkor megvizsgáljuk a csoportok közötti eltérések valószínűségét
Az elemzés alapgondolata: a varianciát két módon becsüljük Az ANOVA alkotója Ronald A. Fisher (egy angliai mezőgazdasági kísérleti állomáson, 1918-5 között). Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H0 úgy is vizsgálható, hogy a populáció varianciát becsüljük két módszerrel. Az egyik módszer: a mintákon/csoportokon belüli szóródásból következtet a varianciára A másik módszer ugyanazon minták átlagainak szóródásából következtet a varianciára.
A négyzetes összeg additív elemekre bontható A minta elemeinek távolságát a teljes minta nagy átlagától becsüljük a négyzetes összeggel Σ (x nagy átlag x i )² A négyzetes összeg particionálható (additív módon részekre bontható) Az egyes részeket úgy bontjuk, hogy azok a szórás egy meghatározott értelmezésű részének feleljenek meg,
Példa a szórás particionálására
A szórás elemzés gondolatmenete A minták normális eloszlásból származnak (n darab) Független minták (szórás elemzés =variancia analízis=analysis of variance=anova) Véletlen minták (randomizálás) Null hipotézis: a minták közös sokaságból/populációból származnak, várható értékük azonos, v 1 =v =v 3 = =v n Null hipotézis következménye, várható szórásnégyzetük is azonos: s 1 =s =s 3 = =s n A mintákból két független becslést készítünk a populáció szórására, pontosabban varianciájára ( ) A két variancia becslés hányadosa az F 1, eloszlást követi (F 1, = s 1 /s )
A szórás elemzés gondolatmenete (folytatás) Ha a minták egy sokaságból valók (a nullhipotézis érvényes), akkor F 1, eloszlásának várható értéke v(f 1, ) = 1 Ha p<0,05 arra, hogy F 1, = 1, akkor elvetjük a nullhipotézist Ha elvetettük a nullhipotézist, akkor megkeressük, mely csoportokra mondhatjuk ki, hogy nem egy eloszlásból származnak? Előre tervezett (a priori), vagy utólagos (a posteriori) összehasonlításokat végzünk
A szóráselemzés és a t próba kapcsolata A két eljárás ekvivalens A t próba képletében a nevezőben az átlag szórása van A számlálóban is szórásnak megfelelő érték van: minta átlagának különbsége van Ez nem más, mint a két szám eltérése az átlaguktól, osztva n-1 -el, ami n= esetben nem más mint 1. A számlálóban és a nevezőben ugyanazon értékre becslés szerepel, melynek négyzeteinek hányadosa F eloszlású
A t próba képlete, és annak átalakítása 1 ) ( 1 1, 1 1 1, 1 1 n n s m m t n n s m m t n n Ha a képlet mindkét oldalát négyzetre emeljük: Akkor a jobb oldalon két variancia hányadosát kapjuk, azaz 1, 1 1 n n n t n F
A nullhipotézis szerinti helyzet ábrázolása v 1 y v v 3 1.csoport.csoport 3.csoport
Az egyik alternatív hipotézis szerinti helyzet ábrázolása y -3.50-1.75 0.00 1.75 3.50 v 1.csoport.csoport 3.csoport -3.50-1.75 0.00 1.75 3.50 v 1-3.50-1.75 0.00 1.75 3.50 v 3
Variancia csoportok között és csoporton belül: ugyanannak a paraméternek két becslése ( csoport esetén bemutatva) nagy átlag a b Csoportokon belül Csoportok között (megtartjuk a szóródást) (megtartjuk a középértéket)
A négyzetes összeg összetevői egy szempont esetén Az A szempont szóródása A véletlen okozta szóródás
Egy szempontos ANOVA tábla Forrás sz.fok (df) Négyzetes összeg variancia F p A kezelés i-1 Q A s A s A/s b Mintákon belül n-i Q b s b Összes n-1 Q ö s ö i darab kezelés, kezelésenként n i, összesen n darab megfigyeléssel..
Tanulságok Ha több csoportra van szükségünk, tervezzünk erre vizsgálatot Ha egy szempont szerint rendezhetők a csoportok: egy szempontos ANOVA Utána többszörös összehasonlítás ha az ANOVA szignifikáns volt
A többszörös összehasonlítás gondolatmenete
Több mint két statisztikai döntés egy vizsgálatban? Mi lesz az első fajú hiba, ha két teljesen független kísérletet végzünk két független minta összehasonlításával. Két független hipotézisvizsgálatot végzünk, és két szignifikancia vizsgálatot, mindegyiket az α=0,05 szinten. A két szignifikancia vizsgálat is függetlennek tekinthető. Tegyük fel: mindkét esetben a nullhipotézis hibás elvetésének a valószínűsége p=0,05. Annak valószínűsége, hogy legalább egyik nullhipotézist (hibásan) elvetjük: Jelölje P(s 1 )=0,05 az első teszt esetében a hibás döntés valószínűsége, P(s )=0,05 a második teszt esetében a hibás döntés valószínűsége. A két esemény együttes előfordulásának valószínűsége P(s 1 )*P(s ), ami 0,05*0,05=0,005 A három lehetséges esemény: s önmagában, s önmagában, s 1 és s együtt. Annak valószínűsége, hogy legalább az egyikben hibásan elvetjük a null hipotézist: p= 0,05+0,05-0,005 = 0,0975, ami lényegesen magasabb, mint 0,05.
Ha sok a csoport? A fenti gondolatmenet k=10 független teszt elvégzése esetén p=1-(1-0,05) 10 =0,4 A független vizsgálatok számának növelésével jelentősen növeljük annak valószínűségét, hogy olyan hatások létezését mondjuk ki, amelyek a valóságban nem léteznek Minden lehetséges szignifikancia tesztet tekintve a tesztek nem függetlenek, noha a minták azok voltak
Megoldások Az egyedi összehasonlításokban az egyes döntésekre vonatkozó küszöbértékeket úgy módosítjuk, hogy a teljes eljárásban (egy vizsgálatban) az összes összehasonlításra együttesen érvényes ismert, küszöbérték(ek)et alkalmazunk Olyan eljárásokat készítünk és alkalmazunk, amelyek ismert közös valószínűséggel dolgoznak Multiple comparison tests
Általános eljárások Bonferroni eljárás A részdöntésenkénti szint alacsonyabb, mint a kísérletenkénti szint A részdöntésekben egy közös szintet alkalmazunk mindenütt α*=1-(1-α)exp(1/k), másképen az (1-α) k-adik gyökét kell vonnunk, és az kivonni 1-bõl Ha a függetlenség is bizonytalan, akkor α*=α/k Holm eljárása Részdöntésenként változó szinteket alkalmazunk k összehasonlítás esetén α/k, α/(k-1), α/(k-), α/(k-3),., α/, α
Holm módszerhez számolási eljárás Teszt Valószínûség Küszöb Érték (ha alfa=0,05, és k=5) 1 p1 alfa/k 0,01 p (>p1) alfa/(k-1) 0,015 3 p3 (>p) alfa/(k-) 0,0166. 4 p4 (>p3) alfa/(k-3) 0,05 5 p5 (>p4) alfa/(k-4), azaz alfa 0,05
Hátrányok, előnyök Előny: kontrolláljuk az elsőfokú hibát Hátrány: konzervatívak vagyunk a másodfokú hiba tekintetében Bonferroni eljárás konzervatívabb, mint Holm eljárása, miközben a két módszer ugyanolyan biztonságos az elsőfajú hiba tekintetében
ANOVA keretei közötti többszörös összehasonlítások Intenzív kutatás 1950-es évektől Statisztikai szoftverekbe beépítették a módszereket Két eljáráscsoport Előre tervezett összehasonlítások Utólag végzett összehasonlítások Minél többet végzünk, annál rosszabb a vizsgálat hatásfoka
ANOVA után alkalmazható többszörös összehasonlító eljárások Holm, Bonferroni Tervezett összehasonlítások Dunnett Dunn Általános, szignifikancia értékeket használ Kutatás kezdetekor előre tervezendő Egy kontrollhoz több kezelés Több páros összehasonlítás, kétséges elvi alapja Newman-Keuls Tukey Tukey nem egyenlő elemszámokra Scheffé páros Scheffé kontrasztok Több csoport összevont eredményeit is lehet vele vizsgálni
Tanulságok A sokféle eljárásból a helyzethez legjobbat válasszuk ki A Holm eljárás mindenféle szignifikancia teszt eredményére alkalmazható Az egy kontroll több vizsgálati csoporthoz: Dunnett próba Több páros összehasonlításhoz Newman-Keuls eljárás Scheffé kontraszt összetett következtetéshez