[Biomatematika 2] Orvosi biometria Visegrády Balázs 2017. 03. 20.
Khí-négyzet (χ 2 ) Próba Ha mérés során kapott adatokról eleve tudjuk, hogy nem követik a normális vagy más ismert eloszlást, akkor a korábban megismert paraméteres próbák nem alkalmazhatók. A próba előnye, hogy diszkrét és folytonos valószínűségi eloszlások vizsgálatára egyaránt alkalmas. A 2 -négyzet próbát a következő problémák megoldásánál alkalmazzák: 1) illeszkedésvizsgálat: olyan statisztikai eljárás, amely során arról döntünk, hogy valamely minta tekinthető-e adott vagy adott típusú eloszláshoz tartozónak. 2) homogenitásvizsgálat: a vizsgált kísérleti problémánál a két véletlen változóhoz tartozó eloszlásfüggvény azonos-e vagy sem. Más szóval, két minta származik-e ugyanabból a populációból. 3) függetlenségvizsgálat: két valószínűségi változó tekinthető-e egymástól függetlennek.
Illeszkedésvizsgálat Probléma: Vizsgáljuk meg, hogy a Langerhans-szigetek valóban Poisson-eloszlást mutatnak-e a hasnyálmirigyben! Egy alkalmasan előkészített hisztológiai metszetet 900 négyzetet tartalmazó hálóra vetítenek, és megszámolják azon négyzetek számát, amelyekre 0, 1, 2, sziget esik. A számlálás eredményét a táblázat mutatja. islet of Langerhans, haemalum-eosin stain
Hipotézisvizsgálat menete: 1. Felállítjuk a Nullhipotézist és az Alternatív hipotézist 2. Elvégezzük az alkalmas teszt statisztikát 3. Döntés (szakmai döntés a statisztikai eredmény segítségével) Nullhipotézis: A Langerhans szigetek eloszlása a hasnyálmirígyben Poisson-eloszlást követ. Alternatív hipotézis: Az eloszlás nem követi a Poisson-eloszlást, az esetleges illeszkedés a véletlen következménye. Teszt statisztika: ahol O i (i = 1,,n) az empirikus eloszlás gyakoriságait (vagy relatív gyakoriságait) jelenti, míg E i a feltételezett eloszlás ugyanazon eseményekhez kapcsolódó gyakoriságait (vagy relatív gyakoriságait), f pedig a szabadsági fokok számát. A szabadsági fokok száma f = n - k - 1, ahol n az adatok vagy kategóriák száma, k a sokaság paramétereinek száma, amelyeket a mintából becsülnek. k = 0, ha az elméleti eloszlásnak nincs paramétere, k = 1, ha F(x) Poisson-eloszlásra ( ) vagy túlélési görbére vonatkozik, és k = 2 normális eloszlás esetében (átlag és standard deviáció).
x iå fx 904 i = @1 iå 90 f Emlékeztető: P(x = k) = lk k! *e-l (Poisson-eloszlás) A paraméter várható értékének becslése: Szabadsági fokok száma: f= n-k-1 = 7-1-1 = 5
Ha 5% -os szignifikancia szintet választunk, a kapott érték (1,57) ez alatt van: Nullhipotézist megtartjuk!
A khi-négyzet eloszlás sűrűségfüggvénye és sűrűségfüggvénye
Homogenitásvizsgálat (Gnyegyenko-Koroljuk teszt) Két eloszlás azonos származhat-e ugyanabból az eloszláscsaládból? Az eljárás akkor alkalmazható, ha - a vizsgált eloszlások folytonos valószínűségi eloszlások, - a vizsgálatba bevont adatok egymástól függetlenek, - a mérési adatok száma a két kísérleti sorozatban egyenlő. Példa: Legyen F(x) és G(x) a két véletlen változó eloszlásfüggvénye. H0: F(x) = G(x) H1: F(x) G(x) Az kumulatív eloszlásfüggvények lépcsős függvények, így a teszt statisztika gyanánt az azonos abszcisszájú pontokhoz tartozó maximális különbségeket használhatjuk:
Ha n*d - adott értéke mellett n*d + nagyobb, mint a táblázatban foglalt érték, akkor a nullhipotézist a választott valószínűségi szint mellett elutasítjuk.
Függetlenségvizsgálat Probléma: Hatásos-e a streptomycin a tüdőtuberkulózis gyógyítására? (Kérdés 1948-ból) A klinikai vizsgálat megkezdése előtt a pácienseket megröntgenezték, majd véletlen válogatással két csoportba osztották. Az egyik csoport streptomycint kapott, a másik placebot. Hat hónappal később a vizsgálatot megismételték. Az összehasonlítást két radiológus végezte egymástól függetlenül. Egyik radiológus sem ismerte sem a pácienseket, sem a kezelés módját (kettős vak kísérleti elrendezés). A megfigyelések egy, a radiológusok által önkényesen definiált, hatszintű nominális skálán kerültek besorolásra. A kategóriák száma, elnevezése változtatható; a skálán az egyes kategóriák rangszámmal is elláthatók.
A kontingencia táblázat egész számok mátrix formában történő elrendezése r számú sorban és c számú oszlopban; a táblázat adatai gyakoriságok vagy számlálás eredményei. A mátrix elemei cellákban foglalnak helyet, minden gyakoriságot a cellában két index jellemez: sorindex és oszlopindex. A sorindex mindig megelőzi az oszlopindexet; a két index nem felcserélhető.
Miért χ 2 Próba? Összefüggést keresünk a gyógyszer hatása Y (bináris változó: igen vagy nem) és a páciens állapotát jellemző minőségi kategóriák (X) között. A beteg állapotát minőségi kategóriák (kvalitatív változó lehetséges értékei) mutatják, ezért a módszer a nemparaméteres módszerek családjába tartozik. Az X változó i -edik eseményének valószínűsége A függetlenség esetén várható gyakoriság pedig az ik -adik cellában: A két változó függetlenségére tett feltételezés alapján kiszámított várható gyakoriságok:
Tegyük egymás mellé a tényleges adatokat és a cella valószínűségeket! Nullhipotézis: nincs semilyen kapcsolat a streptomycin adagolása és a radiológiai besorolás között, a két véletlen változó egymástól független. Alternatív hipotézis: a két véletlen változó nem független egymástól, a gyógyszeres kezelés befolyásolja a beteg tüdejének radiológiai megfigyelésen alapuló besorolását. Teszt statisztika: Szabadsági fokok száma: f = sorok száma-1 * oszlopok száma-1 f = 5
Még (egy szigorúbb) P=0,001 szignifikancia határt is nézve, a nullhipotézist el kell vetnünk. Az alternatív hipotézis értelmében feltehetjük, hogy a két változó nem független egymástól, streptomycin adagolása várhatóan befolyásolja a radiológiai besorolást.
Fisher exakt teszt (kis minták esete) Probléma: Kennedy, J. W., Ritchie, J. L., Davies, K.B.: The western Washington randomized trial of intracoronary streptokinase in acute myocardial infarction. A 12-month follow-up report. New Eng. J. Med. 312. 1073-1078, 1985 16 páciens közül 9 beteg kapott streptokináz kezelést, 7 páciens pedig placebót. A 12 hónapos követéses vizsgálat eredménye: Nullhipotézis: a streptokinázzal történő beavatkozás a miokardiális infarktus kezelésére eredménytelen, a populációkban a regisztrált halálesetek gyakorisága megegyezik, az esetleges különbség előfordulása a véletlennek tulajdonítható. Alternatív hipotézis: a streptokináz kezelés hatására a halálesetek gyakorisága a két populációban szignifikánsan eltér egymástól.
Az egyes cellákban 5-nél kisebb gyakoriságok fordulnak elő, így a 2 megnyugtatóan nem alkalmazható. -teszt Rögzített sor- és oszlopösszegek mellett a lehetséges elrendeződéseket: A számítás gondolatmenete: ha a nullhipotézis igaz, továbbá a sor- és oszlopösszegeket rögzítjük, akkor annak a valószínűsége, hogy egy adott a, b, c és d gyakorisági eloszlást kapjuk, az alábbi összefüggéssel számítható:
Ha a nullhipotézis igaz lenne, akkor a valószínűségi eloszlásból a megfigyelt gyakorisági eloszlás P = 0.3375 valószínűséggel fordul elő, ami sokkal nagyobb, mint a szignifikancia szinthez általában elfogadott 0.05 érték. Azaz, a megfigyelt gyakorisági eloszlás pusztán a véletlen folytán igen gyakran fordulhat elő. Ezért a nullhipotézist fenntartjuk.
Probléma: Egy kártyaosztó gép a póker asztalnál véletlenszeűen osztja a kártyákat. 1600 lapot megvizsgálva, a következő megoszlást kaptuk: Treff 404 Kőr 420 Káró 400 Pikk 376 Egyformán valószínű a kártyák megoszlása az eredmény alapján vagy esetleg az eltérések már nehezen magyarázhatók a véletlen szerepével?
Probléma: Zöldborsókat keresztezve azt tapasztaljuk, hogy az utódokban a sárga szín dominál a zölddel szemben és a roppanós héj a kemény héjjal szemben. Négy megfigyelhető tulajdonság-párt okozott két pár heterozigóta gén. Érvényes-e a megfigyelt utódokra a Mendel-féle genetikai megoszlás (9:3:3.1)? 193 zöld, roppanós 184 sárga, kemény 556 sárga, roppanós 61 zöld, kemény