Túlélés analízis. Probléma:



Hasonló dokumentumok
Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Túlélés elemzés október 27.

13. Túlélési analízis. SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Biostatisztika VIII. Mátyus László. 19 October

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Egy és többváltozós logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Matematikai geodéziai számítások 6.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Logisztikus regresszió október 27.

AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON

Matematikai geodéziai számítások 6.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Mérési adatok illesztése, korreláció, regresszió

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Regressziós vizsgálatok

Mérési hibák

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Biomatematika 2 Orvosi biometria

[Biomatematika 2] Orvosi biometria

Kísérlettervezés alapfogalmak

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Heckman modell. Szelekciós modellek alkalmazásai.

Korreláció és lineáris regresszió

y ij = µ + α i + e ij

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Alacsony iskolázottság hatása szívinfarktus, vagy ACBG utáni rehabilitációra, adverz kardiovaszkuláris eseményekre.

EPIDEMIOLÓGIA I. Alapfogalmak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

A kockázat fogalma. A kockázat fogalma. Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Likelihood, deviancia, Akaike-féle információs kritérium

KÖVETKEZTETŐ STATISZTIKA

Dr. Kalló Noémi. Termelés- és szolgáltatásmenedzsment. egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék. Dr.

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Több valószínűségi változó együttes eloszlása, korreláció

Segítség az outputok értelmezéséhez

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

11.Négymezős táblázatok. Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)

Logisztikus regresszió

Minitab 16 újdonságai május 18

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztikai módszerek 7. gyakorlat

Bevezetés a hipotézisvizsgálatokba

[Biomatematika 2] Orvosi biometria

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Számítógépes döntéstámogatás. Statisztikai elemzés

Lineáris regresszió vizsgálata resampling eljárással

Többváltozós lineáris regressziós modell feltételeinek

Regresszió számítás az SPSSben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztika elméleti összefoglaló

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Elektromiográfia (Dinamometria) A motoros egységek toborzása, az izomfáradás vizsgálata A mérési adatok elemzése és értékelése

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kísérlettervezés alapfogalmak

Követelmény a 7. évfolyamon félévkor matematikából

1/8. Iskolai jelentés. 10.évfolyam matematika

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

11. elıadás ( lecke) 21. lecke. Korreláció és Regresszió (folytatás) Lineáris-e a tendencia? Linearizálható nem-lineáris regressziós függvények

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Diszkriminancia-analízis

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Logisztikus regresszió

Adatok statisztikai értékelésének főbb lehetőségei

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Osztályozó- és javítóvizsga témakörei MATEMATIKA tantárgyból 2016 / tanév

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

[Biomatematika 2] Orvosi biometria

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Biostatisztika Összefoglalás

6 Ionszelektív elektródok. elektródokat kiterjedten alkalmazzák a klinikai gyakorlatban: az automata analizátorokban

Matematikai geodéziai számítások 10.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Nemzeti Onkológiai Kutatás-Fejlesztési Konzorcium 1/48/ Részjelentés: November december 31.

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Hipotézis vizsgálatok

11. modul: LINEÁRIS FÜGGVÉNYEK

A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.

A maximum likelihood becslésről

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Elektromiográfia (Dinamometria) A motoros egységek toborzása, az izomfáradás vizsgálata

Folyadékszcintillációs spektroszkópia jegyz könyv

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Logisztikus regresszió

Regresszió. Fő cél: jóslás Történhet:

Átírás:

1 Probléma: Túlélés analízis - Túlélési idő vizsgálata speciális vizsgálati módszereket igényel (pl. két csoport között az idők átlagait nem lehet direkt módon összehasonlítani) - A túlélési idő nem normális eloszlású (korlátozó feltétel). Történeti háttér: - Először életbiztosítási statisztikusok (actuarial) használták (Berkson és Gage 1950). - Cutler és Ederer fejlesztette tovább az eljárást Definíciók: - Esemény (endpoint, failure): bármilyen megfigyelés eredménye (műtét utáni felépülés). - Megfigyelési idő (observation time): Az esetek többségében egy előre definiált időintervallum. - Követés (follow-up): A betegek sorsának figyelése. - Kiesett egyének (drop-out): a vizsgálatból kiesett egyének. - Visszavonás (withdrawing): pl. együttműködés hiánya miatt egyéneket kizárunk a vizsgálatból. - Túlélési idő (survival time): a megfigyelés kezdetétől a vizsgált eseményig eltelt idő (pl. hány nap tellik el az operációt követően a felépülésig). - Nem teljes adat (censored data): olyan egyének, akik 'elvesznek' a megfigyelés során (pl. elköltöznek), de addigi adataikat felhasználjuk. Az elemzés egyik általános eszköze a túlélési függvény megrajzolása (jellegzetes lépcsős függvény): A grafikon csont tumor esetén alkalmazott két műtéti eljárás eredményét jeleníti meg az idő függvényében az összehasonlító statisztikai eljárás eredményével együtt:

2 Műtéti eljárások összehasonlítása A görbe a 0. időponttól indul jelezvén a megfigyelés kezdetét. Ebben az időpontban mindenki komplikációmentes, így a függvény maximális értékű, azaz 1 (vagy 100%). Valahányszor egy esemény bekövetkezik, a függvényértéke csökken. A jel jelzi a grafikonon az eseményt. (A számítógépes programok különböző módon jelzik az eseményeket.) A görbén a jel jelzi, hogy nem következett be a vizsgált esemény (cenzorált). A programok általában ezt a jelölést használják ilyen célra. Kétfajta módon készíthetünk túlélési függvényt: - Kaplan Meier eljárás (product limit módszer) - life table analízis (az előző módszert is tartalmazza). 1. Kaplan Meier becslés Tekintsük a következő hipotetikus vizsgálatot: 10 személy sorsát követjük a 10 napos megfigyelés alatt. Az esemény (end point) a bekövetkezett halál. A vizsgálat során 6 fő meghalt, 3 adata cenzorált, 1 fő a megfigyelés végén még élt. A számoláshoz a következő adatokra lesz szükségünk: - t i : a vizsgált megfigyelési időpont - r: a t i nél bekövetkezett halálesemény száma - n: az élők száma a t i időpontnál - p a : a t i időpontnál élők aránya (n r) / n - p: a t i időponton túli élés becsült valószínűsége, ami a t i nél számított p a és az előtte (t i 1 nél) lévő p i 1 szorzata - SE: a p érték standard hibája = p ( 1 p)/ n Az egyes megfigyelési időpontokra vonatkozó számítások: t = 2 t = 3 t = 4 az esemény cenzorált, nincs teendő eddig az időpontig 9 egyén él (hiszen t = 2 ben egy egyén kiesett, n = 9), itt 1 fő meghal (r = 1), tehát p a = (n r) / n = (9 1) / 9 = 8 / 9 = 0.89 és p = 1 0.89, az SE = p ( 1 p)/ n = 089. ( 1 089. )/ 9 = 010. az esemény cenzorált, nincs teendő t = 5 idáig 7 egyén él (n = 7), amelyből itt 1 fő meghal (r = 1), tehát p a = (7 1) / 7 = 0.86, a p = 0.89 0.86 = 0.77 és SE = 077. ( 1 077. )/ 7 = 014. t = 7 eddig 6 fő él (n = 6), itt 1 fő meghal (r=1), vagyis p a = (6 1) / 6 = 0.83, a p = 0.77 0.83 = 0.64 és SE = 064. ( 1 064. )/ 6 = 016. t = 8 eddig 5 fő él (n = 5) itt 2 fő meghal (r = 2), vagyis vagyis p a = (5 2) / 5 = 0.6, a p = 0.64

3 0.6 = 0.38 és SE = 038. ( 1 038. )/ 5= 013. t = 9 eddig 2 fő él (n = 2), itt 1 fő meghal (r = 1), vagyis p a = (2 1) / 2 = 0.5, a p = 0.38 0.5 = 0.19 és SE = 019. ( 1 019. )/ 2 = 012. t = 10 az esemény cenzorált (az egyén a vizsgálat lezártakor él, a további sorsát nem tudjuk). Foglaljuk táblázatba a számítás eredményeit t i r n P a p SE 0 0 1 1.0 1.0 0 3 1 9 0.89 0.89 0.10 5 1 7 0.86 0.77 0.14 7 1 6 0.83 0.64 0.16 8 2 5 0.60 0.38 0.13 9 1 2 0.50 0.19 0.12 Kaplan Meier eljárás számítási táblázata A p érték alapján a kumulatív túlélési grafikonja az idő függvényében megrajzolható. Túlélési görbék összehasonlítása: a) Általánosított (generalizált) Wilcoxon teszt: a korai események nagyobb súlyt kapnak. b) Mantel Cox teszt: egy exponenciális score teszt.. Lényegében egy log rank teszt. c) Breslow teszt: a korai megfigyeléseket súlyozza, kevésbé érzékeny a későbbi eseményekre. d) Tarone Ware teszt: a Breslow és a Mantel Cox teszt között helyezkedik el. Az eseményeket közepesen súlyozza. e) Peto Prentice teszt: az általánosított Wilcoxon teszttel analóg. f) Log-rank teszt: a két csoport közötti mortalitási arány egymáskonstanszorosa. Vizsgálati meggondolások: 1) A vizsgálat milyen mintaszámmal, milyen hosszú ideig tartson,mi a vizsgált esemény (end point). 2) Hogyan kezeljük a drop out eseteket. 3) Ismétlődő jelenségre ne végezzünk túlélés analízist.

4 4) A túlélési kritérium, a feltétel rendszer nem változhat meg a vizsgálat folyamán. 2. Cox regresszió Cox (1972) a túlélési problémák vizsgálatára dolgozta ki a proportional hazards regressziós módszerét (egyszerűen Cox modell). A vizsgált esemény kockázata a hazard rate (a kumulatív túlélési görbe meredeksége egy időintervallumban). A kockázatot úgyis definiálhatjuk, mint adott t időpontban a halál bekövetkezésének valószínűségét, amikor tudjuk, hogy az egyén a t idő előtt még él. A megfogalmazást kérdés formájában is feltehetjük: a beteg milyen valószínűséggel éli meg az öt évet a beavatkozás után, ha már három évet túlélt? Ha az egyik csoportban a halál kockázata háromszorosa a másik csoporténak, akkor a kockázat állandó marad az egész vizsgálat folyamán. Ezt úgy mondjuk, hogy a két csoport hazard függvénye egymással arányos, proporcionális. Az előbbi példa kapcsán ez azt jelenti, hogy az első csoportban a halálesemény valószínűsége háromszor nagyobb, mint a másik csoportban. A Cox regressziós modell a vizsgált magyarázó változók relatív kockázatát becsli. A kapcsolatot mindig egy kockázatmentes (rizikófaktor mentes) csoporthoz, a baseline csoporthoz viszonyítjuk. Jelölje h(t) a kockázat mértékét a t időpontban, x = [x 1, x 2, x 3,..., x n ] a vizsgált magyarázó változók vektorát. A Cox regressziós modell a kockázat nagyságát írja le a t időpontban, az x vektor értékei mellett log h(t, x) = log [h 0 (t)] + β i x i Az egyenletben a h 0 (t) függvény az egyén kockázatát jelenti a t időpontban, amikor a kovariánsok mindegyike 0. Az egyenlet az alábbi formában is írható n i= 1 [ 0 ] p(t > t, x)= P(T > t) n exp β i x i i= 1 Az egyenlet a t nél nagyobb időtartam (T) túlélési valószínűségét adja meg. A regressziós vizsgálat legfontosabb szempontja a β i regressziós együtthatók meghatározása. A modell lényegében logisztikus modellnek is tekinthető. Tekintsük az alábbi példát: Követéses vizsgálat során (amelynek időtartama 22 év volt), 30561 fős mintán (40 év felettiek) a tüdőrák rizikófaktorainak hatását tanulmányoztuk. A Cox regresszió alkalmazásával az egyes rizikótényezők relatív kockázatát kívántuk meghatározni. A táblázat a férfiakra vonatkozó vizsgálat egy részeredményét tartalmazza: Rizikó faktorok Regressziós koefficiens (β i ) Standard error (SE) β i k 95% os CI je (β A ; β F ) p Relatív kockáza t (RR) RR 95% os CI je (RR A ; RR F ) Mérsékelten dohányos 1.1138 0.3343 (0.46, 1.77) 0.001 3.1 (1.6, 5.9)

5 Erős dohányos 2.3326 0.2847 (1.77, 2.89) 0.001 10.3 (5.9, 18.0) Tüdő felületen hegesedés 0.7286 0.2165 (0.30, 1.15) 0.001 2.1 (1.4, 3.2) A megfigyelt kora 1.7281 0.2986 (1.14, 2.31) 0.001 5.6 (3.1, 10.1) Férfiak tüdőrák kockázatának Cox modellje A rizikófaktorok mellett a modell által számolt regressziós koefficiens, annak standard hibája, a regressziós együttható 95% os konfidencia intervalluma szerepel: alsó érték = β A = β i 1.96 SE felső érték = β F = β i + 1.96 SE A p a β i együttható 0 tól való szignifikáns eltérését jelenti (a H 0 : β i = 0). Erős dohányos férfi esetén ez 10 szeres értéket jelent. A relatív kockázatot a β i értéke alapján számoljuk: RR = e βi Az utolsó oszlop a relatív kockázat 95% os konfidencia intervallumát tartalmazza: RR e A = β A RR F e = β F Megfontolások: a) Érdemes a modellvizsgálat előtt a változók függetlenségvizsgálatát elvégezni. b) A modell feltételezi a kockázat arányának időbeli állandóságát. c) A mintaszám megválasztásánál alkalmazzunk az ökölszabályt, hogy minden kovariánsra legalább 5 esemény jusson. d) A Cox modellt gyakran alkalmazzák az exploratív vizsgálatok során hipotézisek felállítására.