SZDT-09 p. 1/36 Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu
Logisztikus regresszió SZDT-09 p. 2/36
SZDT-09 p. 3/36 Logisztikus regresszió, bináris regresszió Bináris - a megfigyelt eseménynek csak két állapota van A vizsgált y = 1 esemény lehet pl. szívinfarktus (bekövetkezett vagy nem következett be (y = 0)) transzplantáció eredménye (a beültetett szerv kilöködőtt vagy nem) műtét (a beteg túléli-e az 5 évet a műtét után vagy nem) Ilyen esetekben - az x i független változók egyaránt tartalmazhatnak folytonos és normális adatokat -, az y esemény bekövetkezési valószínűségét logisztikus regresszióval becsüljük. Az eljárás hasonlít a lineáris regresszióhoz y = a + N i=1 b ix i azzal a különbséggel, hogy az egyenlet jobb oldalán álló x i változóktól nem követeljük meg a normális eloszlást.
SZDT-09 p. 4/36 Bináris regresszió Az x i változók azok a rizikófaktorok, amelyek segítségével becsülni akarjuk az y esemény valószínűségét (P(y = 1). Ha vesszük az ln[p/(1 p)] kifejezést, ahol p a vizsgált esemény valószínűsége, akkor ehhez az értékhez a (, + ) intervallum tartozik. Ez megegyezik az y = a + N i=1 b ix i lineáris regressziós kifejezés intervallumával.
SZDT-09 p. 5/36 Bináris regresszió Legyen u = [x 1,x 2,...,x N ] az a vektor, amely a prediktor x i változókat (rizikófaktorokat) tartalmazza. Vizsgáljuk az y = 1 esemény bekövetkezését logisztikus regresszióval. A regressziós modell alakja: P(y=1 u) ln[ 1 P(y=1 u) ] = ln[p(y=1 u) P(y=0 u) ] = a + N i=1 b ix i Az ezzel ekvivalens modell: P(y = 1 u) = exp(a+ N b i=1 ix i ) 1+exp(a+ N b i=1 ix i ) Tehát a modell a lineáris regressziót használja az y esemény valószínűségének a becsléséhez.
SZDT-09 p. 6/36 Feladat1 Azt vizsgáljuk, hogy a műtét utáni 5 éves időszak túlélésének valószínűsége hogyan függ a daganat átmérőjétől.
SZDT-09 p. 7/36 Feladat1 Ábrázoljuk grafikusan az adatokat:
Feladat1 SZDT-09 p. 8/36
SZDT-09 p. 9/36 Feladat1 Végezzük el a logisztikus regressziót a Statistics > Advanced Models > Generalized Linear/Nonlinear modullal!
Feladat1 SZDT-09 p. 10/36
Feladat1 SZDT-09 p. 11/36
Feladat1 SZDT-09 p. 12/36
Feladat1 SZDT-09 p. 13/36
Túlélésanalízis SZDT-09 p. 14/36
SZDT-09 p. 15/36 Alapok A klinikai vizsgálatok során gyakran szükséges azt vizsgálni, hogy egy esemény mennyi idő múlva következik be. Ez az esemény sok minden lehet pl. tüdőrák kialakulása műtét után a felépülés kórházból való eltávozás betegség következtében bekövetkezett halálesemény A megfigyelt időt nevezzük túlélési időnek.
SZDT-09 p. 16/36 Alapok Probléma: a túlélési idő vizsgálata speciális vizsgálati módszereket igényel (nem mindenkinél következik be a vizsgált esemény) a túlélési idő nem normális eloszlású Történeti háttér: legelőször biztosítási statisztikusok használták életbiztosítással kapcsolatos problémák megoldásánál (Berkson és Gage, 1950) később továbbfejlesztették a módszert (Cutler és Ederer)
SZDT-09 p. 17/36 Alapok Definíciók: Esemény (endpoint, failure): bármilyen megfigyelés eredménye Megfigyelési idő (observation time): az esetek többségében egy előre definiált időintervallum Követés (follow-up): a betegek sorsának figyelése Kiesett egyének (drop-out): a vizsgálatból kiesett egyének Visszavonás (withdrawing): pl. együttműködés hiánya miatt egyéneket kizárunk a vizsgálatból Túlélési idő (survival time): a megfigyelés kezdetétől a vizsgált eseményig eltelt idő Nem teljes adat (censored data): olyan egyének, akik elvesznek a megfigyelés során (pl. elköltöznek), de addigi adataikat felhasználjuk
SZDT-09 p. 18/36 Feladat1 A táblázat szívátültetés utáni túlélés vizsgálatára vonatkozik:
SZDT-09 p. 19/36 Feladat1 Használjuk a Statistics > Advanced Models > Survival menüpontot:
SZDT-09 p. 20/36 Feladat1 Használjuk a Kaplan & Meier módszert, beállítjuk a vizsgált időintervallumot és a Censoring indikátort:
SZDT-09 p. 21/36 Feladat1 Szükséges beállítani a Code for complete responses és Code for censored responses mezőket:
SZDT-09 p. 22/36 Feladat1 Használjuk a Survival times vs. cum. proportion surviving gombot az adatok ábrázolásához:
SZDT-09 p. 23/36 Feladat1 Az eredményül kapott függvény görbe:
SZDT-09 p. 24/36 Feladat1 Használjuk a Summary: Product-limit survival analysis gombot:
SZDT-09 p. 25/36 Feladat1 Az Advanced fülön megtekinthetjük a túlélési függvény kvartiliseit:
SZDT-09 p. 26/36 Feladat2 Megvizsgáljuk, hogy a túlélési görbe különböző-e a 3 kórházban, ahonnan az adatok származnak. Az eseteik kórházakhoz rendelése a HOSPITAL oszlopban található.
SZDT-09 p. 27/36 Feladat2 Megadjuk a változókat:
SZDT-09 p. 28/36 Feladat2 Az összefoglalóban megjelenik egy statisztikai próba eredménye:
SZDT-09 p. 29/36 Feladat2 Használjuk a Quick fülön a Cumulative proportion surviving (Kaplan-Meier) by group gombot:
SZDT-09 p. 30/36 Feladat2 A kapott grafikon:
SZDT-09 p. 31/36 Feladat2 Csak két kórház adatait szeretnénk összehasonlítani:
SZDT-09 p. 32/36 Feladat2 A két kórház adatainak összehasonlítási eredménye:
SZDT-09 p. 33/36 Feladat2 Végrehajtunk egy tesztet.
SZDT-09 p. 34/36 Feladat2 A teszt eredménye, hogy elutasítjuk azt a hipotézist, hogy a két kórház között nincs különbség.
SZDT-09 p. 35/36 Feladat3 Vizsgáljuk meg, hogy a túlélési idő hogyan függ a betegek életkorától! Statistics > Advanced Models > Survival > Regression models
SZDT-09 p. 36/36 Feladat3 A kapott eredmények: látható, hogy a regresszió szignifikáns