[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27.
Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? A vizsgálatban szívfrekvencia változását regisztrálták a gyógyszerek használata során.
VARIANCIAANALÍZIS (ANOVA: ANalysis Of VAriance) A kérdés ugyanaz, mint az összes teszt statisztikánál! (1) Létezik-e valamilyen szakmai megfontolásból megsejtett effektus, és (2) ha létezik, rendelkezik-e szignifikáns hatással? Ha a kísérletező szempontjából csak egy változó hatása érdekes egy másik változóra, akkor a kísérlet megtervezése és megvalósítása viszonylag egyszerű. A kísérlet lényegesen bonyolultabb abban az esetben, ha több változó egyidejű hatásának vizsgálatáról van szó. Ha egy kísérlet során megengedjük több változó egyidejű hatását, számolnunk kell a változók kölcsönhatásával. A varianciaanalízis során ketto ne l to bb sokasa g ko ze pe rte keinek minta alapján történo összehasonlítása történik. Ezért nevezik a ke tminta s t-pro ba a ltala nosi ta sa nak. A nullhipotézis eldöntéséhez használjuk a szo ra sne gyzeteket, innen származik a varianciaanalízis elnevezés is.
Miért jobb egy ilyen kísérleti terv, mint a két, vagy több független kísérlet elvégzése, a több t-próba alkalmazásával folyó kísérletezés? 1) Lehetővé teszi a kontroll és az N (=2) kezelés egymáshoz hasonlítását is, kísérletenkénti korrekt elsőfajú hibával. 2) Gazdaságosabb az erőforrások felhasználása, nem kell kísérletenként külön kontrollt használnunk. 3) Jobb a csoportokon belüli szórás becslés, mert azt több megfigyelésre alapozhatjuk, más szóval pontosabb becslést kapunk a populációról. 4) további előnye: a hatások kombinációban történő együttes tesztelésének lehetősége. Jó hatásfokú módszerek állnak rendelkezésünkre a kísérletenkénti szignifikancia szint melletti hipotézisvizsgálatra.
Története Az ANOVA alkotója R.A. Fisher (egy angliai mezőgazdasági kísérleti állomáson). Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H0 úgy is vizsgálható, hogy kiszámítjuk (egymástól függetlenül) két módszerrel a populáció varianciájának becslését. Egyik módszerrel a csoportokon belüli szóródásból, a másik módszerrel a csoportok közötti szóródásból. H0 érvényessége esetén a ketto ugyanannak a mennyiségnek két becslése. Ha ez nem valószínű, akkor arra következtetünk, hogy a H0 elvetendő: azaz a csoportok között van különbség. A különbség lehet az átlagokban, vagy a szórásban. Elnevezés: nem szerencsés, valójában additív faktorokat vizsgálunk, a varianciák elemzésének eszközét felhasználva, tehát az analízisnek nem célja, hanem eszköze a varianciák elemzése.
Az ANOVA sem (mint más teszt statisztika sem) ad felvilágosítást arról, hogy a különböző minták átlagai között milyen összefüggések vannak. Csupán annyit állapít meg, hogy vane legalább egy átlag, amely hatásában szignifikánsan különbözik a to bbito l. A z ANOVA alkalmazhatóságának általános feltételei: (1) az egyes megfigyelési vagy mérési adatok egymástól függetlenek (A minták függetlenségét leginkább a megfelelo kísérleti elrendezéssel biztosíthatjuk.), (2) a vizsgált változók normális eloszlást követnek (Ezzel kapcsolatban vagy szakmai ismereteink lehetnek, vagy a minta alapján ellenőrizhetjük a normalitás teljesülését.), (3) a minták varianciái egyenlőek (Itt a következo megkötést szokták tenni: ha közel azonosak a minták elemszámai, akkor a legnagyobb varianciának kisebbnek kell lennie, mint a legkisebb variancia kétszerese.).
A variancia: Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? Csak a frekvenciakülönbségeket vették figyelembe (önkontrollos minta). Mindhárom minta elemszáma kisebb, mint 30, ezért mindegyik úgynevezett kis minta. Biometriai szempontból az orvosbiológiai vizsgálat három populáció átlagának összehasonlítása a három minta alapján.
Az egyes varianciafrakciók számszerűsítése eltérés-négyzetösszegekkel történik (az átlagtól való eltérések négyzeteinek összege, sum of squares, SS) A teljes eltérés-négyzetösszeg (SS total ) a csoportok közötti (SS between ) és csoporton belüli (SS within ) eltérés-négyzetöszeg összege: SS total SS between SS within
A függő változó teljes varianciája: SS total n i 1 ( y i Y A csoportok közötti variancia: SS between k j 1 ( y j 2 ) Y 2 ) A csoporton belüli variancia: SS within k m j 1 l 1 ( y jl y j 2 )
A teszt statisztika elkészítésének menete 1. Ho :μ1=μ2 =...=μk H1 :legalábbegyszerμi= μj,i=1,2,...,k, j=1,2,...,k.
A teszt statisztika elkészítésének menete 2. közepes eltérésnégyzetösszeg MS (Mean Sum of Squares)
A teszt statisztika elkészítésének menete 3.
Emlékszünk, hogy mi is az az F-próba? A t-próbához kapcsolódó egyik feltétel - a varianciák egyenlősége - ellenőrzését az F-teszt segítségével végezhetjük el. Tegyük fel, hogy két populációt vizsgálunk, amelyeknek nem ismerjük az átlagát és szórását, viszont tudjuk, hogy a változók követik a normális eloszlást. ahol m és n jelenti a két minta szabadsági fokát, F-eloszlást követ. A számlálóban mindig a nagyobb variancia áll. Az F-eloszlás aszimmetrikus eloszlás, ferdesége a szabadsági fokok számától függ. Ha a döntéshez a P = 0.05 valószínűségi szintet választjuk, akkor a varianciák egyenlőségére vonatkozó nullhipotézist elutasítjuk, ha a következő egyenlőtlenség teljesül:. Ellenkező esetben a nullhipotézist fenntartjuk, a szórások (varianciák) egyenlőségére vonatkozó feltétel ebben az esetben teljesül, tehát pl. a t-próba alkalmazható.
F-eloszlás két eltérő szabadsági foknál. - Az F-eloszlás aszimmetrikus eloszlás, ferdesége a szabadsági fokok számától függ. - Ha a minták elemszáma nagy, az eloszlás közelíti a normális eloszlást. - Az F-eloszlás értékei különböző szabadsági fokokra megtalálhatók egy táblázatban.
A variancia-felbontás és az F-próba eredménye - ANOVA-táblázat Variancia forrása Szabadsági fok (df) Eltérésnégyzeösszeg SS (Sum of Squares) közepes eltérésnégyzetösszeg MS (Mean Sum of Squares) Próbastatisztika (F-value) p-érték Csoportok közötti (between groups) N-k SS between MS between = SS between /(N-k) F= MS betwen /MS within p Csoporton belüli (within groups) k-1 SS within MS within = SS within /(k-1) Teljes (total) N-1 SS total MS total =SS total /(N-1)
A faktor hatásának szignifikanciatesztje Tesztstatisztika: A csoportok közötti és a csoporton belüli eltérésnégyzetösszeget osztva a szabadsági fokaikkal: közepes eltérés-négyzetösszegeket (Mean of Sum of squares). A csoportok közötti és a csoporton belüli közepes eltérés-négyzetösszeg hányadosa az F próbastatisztika H0: a csoportok alapsokaságbeli átlagai azonosak: µ 1 = µ 2 = = µ k H1: van legalább két olyan csoport, melyeknek különbözik az alapsokaságbeli átlaga. (egyoldali hipotézis!)
Térjünk vissza Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? A vizsgálatban szívfrekvencia változását regisztrálták a gyógyszerek használata során. Nullhipotézis (nullhipotézis egyenlő átlagokra): nincs különbség a három drog hatása között, az átlagokban tapasztalt eltérés véletlen hatások következménye; a három minta azonos populációból származik: Alternatív hipotézis (nem minden átlag egyforma): a drogok között van legalább egy olyan (pl. a harmadik), amely hatásában különbözik a többitől, hatására a szívfrekvencia szignifikánsan csökken:
A teszt statisztika folytonos valószínűségi változó, eloszlása az F-eloszlást követi. Az F- eloszlás függ a szórások szabadsági fokainak számától, ahol n és m a szabadsági fokok száma, (s B ) 2 és (s W)2 pedig a varianciák. Az F-eloszlás alakját a 11.2. ábra mutatja.
Variancia táblázat
H 0 -t elvetjük
Probléma: Egy minőségellenőrzési kísérletben különbözo ti pusu elemek élettartamát vizsgálták. Minden ti pusu elemből 5-5 darabot választottak ki. Az élettartam órában van megadva a következo táblázatban. Vizsgáljuk meg, hogy van-e szignifikáns különbség a különbözo ti pusu elemek élettartama között!
2 minta Mintaszám? 3 vagy több Hány csoport? igen nem Független minták? igen nem Normál eloszlású a minta? igen nem igen nem igen nem igen nem 2 mintás t-próba Páros t-próba 1 szempontos AVOVA Ismételt méréses ANOVA Mann-Whitney t. Wilcoxon t. Kruskal-Wallis t. Friedman próba Paraméteres próbák Nem paraméteres próbák