13. Túlélési analízis SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D.
Túlélési analízis Eredetileg biológiai és orvosi alkalmazásoknál használták Egyéb alkalmazások pl. szociológia, ipar, közgazdaságtan A módszer célja a túlélési függvény becslése, ill. az ehhez kapcsolódó szignifikancia vizsgálatok. A túlélési függvény megadja, hogy egy kezdő eseménytől számítva várhatóan hogyan csökken a túlélők százalékaránya az idő függvényében 2
Tornóczky és mtsai. (2004) Cancer 100: 390-397 3
Large Cell esetek 4
Grafikus eredmény Túlélési függvény: annak valószínűsége, hogy a beteg egy adott időnél tovább él 5
Túlélési függvény Annak valószínűsége, hogy a beteg egy adott időnél tovább él. S(t)=P(X>t) Tulajdonságok: - nem-növekvő - S(0)=1 (0 időpontban (kezdetben) 1 a túlélés valószínűsége) - S( )=0 (ahogy időben haladunk a végtelen felé, a túlélés függvény a 0-t közelíti) - elméletileg a túlélés függvény folytonos. A gyakorlatban az eseményeket diszkrét időpontokban figyeljük meg, így a túlélés függvényt egy lépcsősfüggvénnyel közelítjük 6
Grafikus ábrázolás: a túlélési Step függvény A lépcsős függvények ábrázolásánál az ugrási pontoknál található üres körök határértékek (balról), de nem függvényértékek; a teli körök határértékek (jobbról) és függvényértékek is egyben. A szaggatott vonalak csak segédvonalak, nem tartoznak a függvény görbéjéhez, mivel egy függvénynek nem lehet függőleges szakasza, egy helyen legfeljebb egy értéke lehet 7
Alapstatisztikák Túlélési analízis
Medián és átlagos túlélési idő Chap T. Le: Survival Analysis Medián túlélés= T 0.5 az az idő, amelyben az adott betegségben szenvedő betegek fele még életben van Meghatározása: az a hely a t-tengelyen, ahol a túlélési függvény átlépi a 0.5-es valószínűséget Átlagos túlélés= μ (túlélési függvény alatti terület) 9
X=2,5,5,7,8 Medián és átlagos túlélési idő A general case Medián túlélés= T 0.5 az az idő, amelyben az adott betegségben szenvedő betegek fele még életben van Meghatározása: az a hely a t-tengelyen, ahol a túlélési függvény átlépi a 0.5-es valószínűséget Átlagos túlélés= μ (túlélési függvény alatti terület) Chap T. Le: Survival Analysis 10
Medián és átlagos túlélési idő Medián túlélési idő a baloldali ábrán= 5 2,5,5,7,8 adatsor mediánja= 5 Az átlagos túlélési idő= μ a görbe alatti területtel becsülhető Átlagos túlélési idő= 2*1+3*0,8+2*0,4+0,2=2+2,4+0,8+0,2=3,4 2,5,5,6,7 átlaga=(2+5+5+7+8)/5=17/5=3,4 Chap T. Le: Survival Analysis 11
S(t) Példa Átlag=7,05= 1*(1+0.7)/2+4*(0.7+0.4)/2+5*(0.4+0.3)/2+5*(0.3+0.2)/2+5*(0.2+0.1)/2+5*(0.1+0)/2 Cummulative survival 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 } 0 1 5 10 15 20 25 Median (T.5 ) t T.5 1 4 0,7 0,5 0,7 0,4 T 0,7 0,5 1 4 0,7 0,4. 5 3,66 12
Átlag=7,05= Átlag és a medián 1*(1+0.7)/2+4*(0.7+0.4)/2+5*(0.4+0.3)/2+5*(0.3+0.2)/2+5*(0.2+0.1)/2+5*(0.1+0)/2 Medián=3,66 Medián=1+(4*(0.7-0.5)/(0.7-0.4))=3.66 hónap periódus Kumulativ túlélés 0 1 1 1 4 0,7 5 5 0,4 10 5 0,3 15 5 0,2 20 5 0,1 25 0 0 13
Miért kell ilyenkor az átlagot és a mediánt ilyen bonyolult módon becsülni? Nagyon gyakran nem áll rendelkezésre pontos információ az illető személy túlélésről (a vizsgálat befejeződött és a beteg még életben van). Az ilyen megfigyelést cenzorált megfigyelésnek nevezzük. Cenzorált megfigyelések esetén nem lehetséges az átlag és a medián klasszikus módon való számítása, az eredmény torzított lesz. Ilyen esetben a túlélési függvényt kell először megbecsülni, és ebből számítjuk az átlag és medián túlélést. 14
Cenzorált adatok 15
Cenzorált megfigyelések Az adatgyűjtés folyamata során gyakran előfordul, hogy valakinek a túlélési idejét csak részlegesen ismerjük (az eddig megfigyelt túlélési időt, a végesemény még nem következett be). Az ilyen, ún. cenzorált adatokat mégis korrekt módon fel lehet használni a túlélési függvény becslésében Cenzorált eset előfordulhat: Az egyén elvész a vizsgálatból ismeretlen helyre elköltözik Kizárják A vizsgált terápia nem folytatható. A vizsgálat idő előtt befejeződik Halálozás egyéb okból (pl.: baleset) 16
A túlélési függvény becslése Nemparaméteres módszerek Halandósági tábla (life table) ACTUARIAL módszer (intervallum becslés) Kaplan Meier (pont becslés) Paraméteres Exponenciális, lognormális, Weibull, stb. eloszlást feltételezve haladó anyag. 17
Halandósági tábla 18
Alapképletek n: adott intervallumban életben levők száma d: események száma az adott intervallumban n és d megfigyelésekből származnak. Intervallum kockázat: q i =d i / n i Intervallum túlélés: p i =1 q i Komplementer események q i és p i Kumulatív túlélés : s i =p 0 *p 1 *p 2 *...*p i P(A 0 *A 1 *A 2.*A n )=P(A n A 0 *A 1 *A 2.*A n-1 ) P(A n-1 A 0 *A 1 *A 2.*A n-2 )... P(A 2 A 0 ) P(A 0 ) Feltételes valószínűség 19
Példa: 5 beteg a következő ideig élt: 2,5,5,7,8 év Idő (t) Életben levők száma (n) Események száma (d) Intervallum kockázat (q=d/n) Intervallum túlélésl (p=1-q) Cumulative túlélés(s) SE 0 5 0 0 1 1 2 5 1 0,2 0,8 0,8 5 4 2 0,5 0,5 0,4 7 2 1 0,5 0,5 0,2 8 1 1 1 0 t t 2 t 5 t 7 t 8 t S ˆ( t ) 1 4 4 2 2 1 1 0 0 5 5 5 5 5 5 20
Halandósági tábla 1.Példa: Egy 1000 fős, kezdetben betegségmentes vizsgálatban az első év folyamán 5, a második évben 10, a harmadik évben 20, a negyedik évben 35 és az ötödik évben 50 esetben alakult ki szívkoszorúér megbetegedés. Vizsgáljuk meg a betegség kialakulásának valószínűségét 5 éven belül 21
Mark Woodward: Epidemiology Study design and Data analysis, Chapman Hall/CRC 1999 Idő (t) Tünetmentes (n) Megbetegedett (d) Intervallum kockázat (q) Intervallum túlélés (p) kumulatív túlélés (s) SE 0 1000 5 1 995 10 2 985 20 3 965 35 4 930 50 5 880 22
A kiszámolt halandósági tábla Idő (t) Tünetmentes (n) Megbetegedett (d) Intervallum kockáz at (q) Intervallum túlélés (p) Kumulatív túlélés (s) SE 0 1000 5 0.0050 0.9950 0.9950 0.00223 1 995 10 0.0101 0.9899 0.9850 0.00384 2 985 20 0.0203 0.9797 0.9650 0.00581 3 965 35 0.0363 0.9637 0.9300 0.00806 4 930 50 0,0538 0.9462 0.8800 0.01027 5 880 Az 5-éves tünetmentesség valószínűsége: s 4 =p 0 *p 1 *p 2 *p 3 *p 4 =0,995*0,989*0,979*0,963*0,946=0,88 23
Greenwood test a kumulatív túlélési valószínűségre Standard error, SE 95% KI, konfidencia intervallum Hipotézisek: H0: a kumulatív túlélési valószínűség (μ) = c (konstans), Ha: a kumulatív túlélési valószínűség (μ) c (konstans) Döntés: ha c 95%KI H0-t elfogadjuk ha c 95%KI H0-t elvetjük se( s ) s t t t i 1 i q i n d i s t 1,96* se( st ) 24
Teszt statisztikák Standard hiba se( s t ) s t t i 1 n i q i d i 95% Konfidencia intervallum s t 1,96* se( st ) Greenwood teszt (khi-négyzet teszt 1 szabadságfokkal) st s se( s ) t 2 25
Példa Egy tanulmányban az átlagos tünetmentesség ideje 5,2 év volt (SE=0.44). Hasonlítsuk össze az irodalomból vett 4,2 éves túlélési valószínűséggel a 95% konfidencia intervallum (KI) alapján! H0 : 4,2 és H A : 95% KI képlete 95% KI számítása: 5,2 ± 1,96*0,44=5.2 ± 0,8624 95%KI: 4,34 6,06 s t 4,2 1,96* se( st ) Döntés: H A t fogadjuk el, mivel a 4,2-t nem tartalmazza a 95%-os KI. 26
Cenzorált esetek Cenzorált adatok esetén a halandósági táblázat a következőképpen számítható: n helyett az igazított (n*) értékkel számolunk a már ismertetett formulákban, ahol n* t =n t 0,5c t Pl: a kockázat meghatározása: q t =d t /n* t 27
A skót szív-koszorúér (CHD) rizikótényetőinek vizsgálata tanulmány adatai (Mark Woodward: Epidemiology) Nyomonkövetési idő (évek) Cenzorált esetek száma Megbetegedések Összesen 0 <= év <1 7 17 24 1 <= év <2 12 22 34 2 <= év <3 24 26 50 3 <= év <4 19 23 42 4 <= év <5 21 37 58 5 <= év <6 15 38 53 5 <= év <7 501 31 532 7 <= év <8 2143 20 2163 8 <= év <9 1375 5 1380 9 <= év <10 66 0 66 Összesen 4183 219 4402 28
Példa (Cenzorált eset) A t=0 intervallumra vonatkozó n* értéke : 4402-0,5*7=4398,5. Így q 0 =17/4398,5 =0,003868 29
SPSS eredmény Interval Start Time Number Entering Interval Censored Number Exposed to Risk Number of Terminal Events Proportion Terminating Proportion Surviving Cumulative Proportion Surviving at End of Interval Std. Error 0 4402 7 4398,5 17 0,003864954 0,996135 0,99613505 0,000936 1 4378 12 4372 21 0,004803294 0,995197 0,99135032 0,001397 2 4345 24 4333 27 0,006231249 0,993769 0,98517297 0,001825 3 4294 19 4284,5 23 0,005368188 0,994632 0,97988437 0,002123 4 4252 21 4241,5 37 0,008723329 0,991277 0,97133652 0,002527 5 4194 15 4186,5 38 0,009076794 0,990923 0,9625199 0,00288 6 4141 501 3890,5 31 0,007968127 0,992032 0,95485042 0,00317 7 3609 2143 2537,5 20 0,007881773 0,992118 0,9473245 0,003564 8 1446 1375 758,5 5 0,006591958 0,993408 0,94107978 0,004503 30
Kaplan-Meier módszer A Kaplan-Meier (KM) módszer nagyon hasonlít a halandósági tábla módszeréhez, azzal a különbséggel, hogy a követési idő nincs szakaszokra osztva, ehelyett a kockázatot és a túlélési valószínűséget minden olyan időpontban meghatározzuk, amelyben legalább egy halálozás történt. (pontbecslés) Kaplan E. L., Paul Meier. Nonparametric Estimation from Incomplete Observations. Journal of the American Statistical Association, Vol. 53, No. 282 (Jun., 1958), pp. 457-481). 31
Paul Meier (1924-2011) 32
Actuarial Cumulative survival (s) SE(s) Cumulative survival (s) Kaplan- Meier SE(s) 0 0,996135 0,000935576 0,996136 0,0009345 1 0,991122 0,001415222 0,991125 0,0014180 2 0,985174 0,001825293 0,985177 0,0018249 3 0,979885 0,002122627 0,979885 0,0021226 4 0,971337 0,002526819 0,971339 0,0025267 5 0,962521 0,002880359 0,962525 0,0028800 6 0,954851 0,003169718 0,954982 0,0031607 7 0,947325 0,003563568 0,947144 0,0036308 8 0,941081 0,004503339 0,936608 0,0070003 9 Kaplan-Meier és a halandósági tábla módszerek összehasonlítása 33
Túlélési valószínűségek összehasonlítása független csoportok esetén Greenwood teszt st se( s (1) (1) t s (2) t s (2) t ) 2 2 statisztik a 1szab. fokkal (1) (2) (1) 2 (2) ( st st ) se( st ) se( st se ) 2 Mantel-Haenszel teszt Log-rank test Weighted log-rank teszt Tarone-Ware teszt Berslow-Day teszt 34
Túlélési valószínűségek összehasonlítása H0: a két túlélési függvény azonos a két populációban, S 1 (t)=s 2 (t) Ha: a két túlélési függvény különböző a két populációban, S 1 (t) S 2 (t) A több, különböző néven is elterjedt próba közti különbség a végesemények súlyozásában van. Ha a próba szignifikáns (pl. p < 0,05), akkor azt mondjuk, hogy a csoportok túlélésében szignifikáns különbség van, vagyis a csoportosító tényező (pl. rizikófaktor, vagy kezelés) szignifikánsan befolyásolja a túlélést. 35
Összehasonlító módszerek log-rank próba, Cox Mantel-próba: egyformán súlyozzák az összes végeseményt Breslow, általánosított Wilcoxon-próba: korai végesemények nagyobb súlyt kapnak Tarone Ware-próba, az előzőek közötti súlyozás 36
Példa A skót szív-koszorúér (CHD) rizikótényetőinek vizsgálata tanulmány ban összehasonlították a tulajdonos és bérlők csoportok CHD betegség kialakulásának idejét (Mark Woodward: Epidemiology Data analysis and Study design). 37
Tulajdonos csoport Time (yrs) Number adjusted Censored Events risk survival cummulative survival 0 2482 2481 2 8 0.0032 0.9968 0.9968 0.0011 1 2472 2469,5 5 12 0.0049 0.9951 0.9919 0.0018 2 2455 2450 10 11 0.0045 0.9955 0.9875 0.0022 3 2434 2429,5 9 8 0.0033 0.9967 0.9842 0.0025 4 2417 2411 12 17 0.0071 0.9929 0.9773 0.0030 5 2388 2386 4 21 0.0088 0.9912 0.9687 0.0035 6 2363 2239,5 247 15 0.0067 0.9933 0.9622 0.0039 7 2101 1458 1286 9 0.0062 0.9938 0.9563 0.0069 8 806 428,5 755 3 0.0070 0.9930 0.9496 0.0053 9 48 24 48 0 0 1 SE 38
Bérlők csoport Time (yrs) Number adjusted Censored Events risk survival cummulative survival 0 1920 1917,5 5 9 0.0047 0.9953 0.9953 0.0016 1 1906 1902,5 7 10 0.0053 0.9947 0.9901 0.0023 2 1889 1882 14 15 0.0080 0.9920 0.9822 0.0030 3 1860 1855 10 15 0.0081 0.9919 0.9742 0.0036 4 1835 1830,5 9 20 0.0109 0.9891 0.9636 0.0043 5 1806 1800,5 11 17 0.0094 0.9906 0.9545 0.0048 6 1778 1651 254 16 0.0097 0.9903 0.9452 0.0054 7 1508 1079,5 857 11 0.0102 0.9898 0.9356 0.0083 8 640 330 620 2 0.0061 0.9939 0.9299 0.0070 9 18 9 18 0 0 1 SE 39
Probability 1 0,99 0,98 0,97 0,96 Owner Renter 0,95 0,94 0,93 0,92 0 2 4 6 8 10 Survival time (year) 40
SPSS Eredmény Chi-Square df Sig. Log Rank (Mantel-Cox) 7.89604 1 0.0049 Breslow (Generalized Wilcoxon) 8.10267 1 0.0044 Tarone-Ware 8.05598 1 0.0045 41
Mi az átlagos túlélés grafikus jelentése? Kérdések és feladatok A(z)... túlélési időt a túlélési függvény alatti területtel becsüljük. Mely teszt(ekk)el hasonlíthatunk össze átlagos túlélési időket? Melyik statisztikai módszert NEM alkalmazzuk két vagy több csoport túlélési idejének összehasonlítására? A folytonos túlélési függvény alakja... Túlélési analízisben azt az időpontot, melynél a vizsgálati populáció fele még életben van... nevezzük. Milyen paramétereket tartalmaz a halandósági tábla? Jellemezze a túlélési függvény grafikonját! Mi a lényegi eltérés a Kaplan-Meier és a halandósági tábla módszerek között túlélési analízisnél? Mit fejez ki a medián túlélési idő? Mit fejez ki a túlélési analízisben használt intervallum kockázati valószínűség? Mi a túlélési analízisben használt cenzorált megfigyelés? Egy tanulmányban az első évben 0,99 volt az intervallum túlélés valószínűsége, a következő négy évben pedig 0,98 ; 0,97; 0,96 és 0,95. Számolja ki az 5-éves túlélési valószínűséget! Egy tanulmányban az első évben 0,90 volt az intervallum túlélés valószínűsége, a következő négy évben szintén 0,90 ; 0,90; 0,90 és 0,90. Számolja ki az 5-éves túlélési valószínűséget! Egy vizsgálatban egy betegség tünetmentességi idejét a következő minta statisztikák jellemzik: átlag: 3,5 év SE=0,5. Adja meg a populáció átlagra vonatkozó 95%-os konfidencia intervallumot! Egy vizsgálatban egy betegség tünetmentességi idejét a következő minta statisztikák jellemzik: átlag: 3,5 év SE=1,0. Adja meg a populáció átlagra vonatkozó 95%-os konfidencia intervallumot! Egy tanulmányban az átlagos tünetmentességi idő 3,5 év volt (SE=0,5). 95% konfidencia intervallum használatával hasonlítsa össze a vizsgált átlagos tünetmentességi időt a korábbi tanulmányból vett ezen betegségre vonatkozó 2,0 éves átlaggal! Egy tanulmányban az átlagos tünetmentességi idő 3,5 év volt (SE=1,0). 95% konfidencia intervallum használatával hasonlítsa össze a vizsgált átlagos tünetmentességi időt a korábbi tanulmányból vett ezen betegségre vonatkozó 2,0 éves átlaggal! 42