Eötvös Loránd Tudományegyetem Természettudományi Kar. Házastársak élettartamának vizsgálata. Szakdolgozat. Töttösi Nikolett

Hasonló dokumentumok
1. Példa. A gamma függvény és a Fubini-tétel.

Abszolút folytonos valószín ségi változó (4. el adás)

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Taylor-polinomok. 1. Alapfeladatok április Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

2. SZÉLSŽÉRTÉKSZÁMÍTÁS. 2.1 A széls érték fogalma, létezése

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

BIOMATEMATIKA ELŐADÁS

Lagrange-féle multiplikátor módszer és alkalmazása

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Függvények folytonosságával kapcsolatos tételek és ellenpéldák

Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén

Valószínűségszámítás összefoglaló

Gazdasági matematika II. tanmenet

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Matematikai statisztika szorgalmi feladatok

Valószín ségszámítás és statisztika

Véletlen bolyongás. 2. rész. Márkus László jegyzete alapján Tóth Tamás december 10.

Függvények július 13. f(x) = 1 x+x 2 f() = 1 ()+() 2 f(f(x)) = 1 (1 x+x 2 )+(1 x+x 2 ) 2 Rendezés után kapjuk, hogy:

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

Yule és Galton-Watson folyamatok

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Határozott integrál és alkalmazásai

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Sorozatok és Sorozatok és / 18

Parciális dierenciálegyenletek

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

matematikai statisztika október 24.

Normális eloszlás paramétereire vonatkozó próbák

Adatok statisztikai értékelésének főbb lehetőségei

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Készítette: Fegyverneki Sándor

Lineáris algebra numerikus módszerei

Skalárszorzat, norma, szög, távolság. Dr. Takách Géza NyME FMK Informatikai Intézet takach/ 2005.

Valószínűségi változók. Várható érték és szórás

A mérési eredmény megadása

A maximum likelihood becslésről

Bemenet modellezése (III.), forgalommodellezés

A valószínűségszámítás elemei

Lineáris egyenletrendszerek

Lineáris algebra 2. Filip Ferdinánd december 7. siva.banki.hu/jegyzetek

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

MBNK12: Permutációk (el adásvázlat, április 11.) Maróti Miklós

1. Parciális függvény, parciális derivált (ismétlés)

Dierenciálhatóság. Wettl Ferenc el adása alapján és

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

Statisztika elméleti összefoglaló

Boros Zoltán február

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

1. Komplex függvények dierenciálhatósága, Cauchy-Riemann egyenletek. Hatványsorok, elemi függvények

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

SZAKDOLGOZAT. Két életre szóló járadékok modellezése kopula függvények segítségével. Nánássi Berta. egyetemi tanár. Budapesti Corvinus Egyetem,

Végeselem modellezés alapjai 1. óra

Nemparaméteres próbák

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Bevezetés a hipotézisvizsgálatokba

Korreláció és lineáris regresszió

(1 + (y ) 2 = f(x). Határozzuk meg a rúd alakját, ha a nyomaték eloszlás. (y ) 2 + 2yy = 0,

17. előadás: Vektorok a térben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

3. Lineáris differenciálegyenletek

Dierenciálhányados, derivált

Permutációk véges halmazon (el adásvázlat, február 12.)

(Independence, dependence, random variables)

Valószín ségszámítás és statisztika

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Statisztika Elıadások letölthetık a címrıl

1. A k-szerver probléma

Chomsky-féle hierarchia

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

MATE-INFO UBB verseny, március 25. MATEMATIKA írásbeli vizsga

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

4. Laplace transzformáció és alkalmazása

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

1/1. Házi feladat. 1. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy

Lagrange és Hamilton mechanika

Határérték. Wettl Ferenc el adása alapján és Wettl Ferenc el adása alapján Határérték és

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Markov-láncok stacionárius eloszlása

Átírás:

Eötvös Loránd Tudományegyetem Természettudományi Kar Házastársak élettartamának vizsgálata Szakdolgozat Töttösi Nikolett Matematika BSc Alkalmazott matematikus szakirány Témavezet : Csiszár Vill adjunktus Valószín ségelméleti és Statisztika Tanszék Budapest, 2012

.

Tartalomjegyzék Bevezet 5 1. Túlélés-analízis 7 1.1. Alapdeníciók................................. 7 1.2. A függés típusai................................ 8 1.3. Egyéni túlélések vizsgálata.......................... 9 1.4. Együttes túlélés vizsgálata.......................... 10 2. 12 2.1. általában.......................... 12 2.2. Gauss- és t-kopula.............................. 15 2.3. Arkhimédészi kopulák............................ 15 2.4. Egyéni túlélések vizsgálata kopulák segítségével.............. 18 2.4.1. Speciális esetek............................ 20 2.4.2. Arkhimédészi kopulák alkalmazásával................ 21 2.5. Közös túlélés vizsgálata kopulák segítségével................ 22 2.5.1. Speciális esetek............................ 22 2.5.2. Arkhimédészi kopulák alkalmazásával................ 24 2.6. A paraméterek becslése............................ 27 3. Rövid idej függ ség vizsgálata 31 3.1. Markov modell................................ 31 3.2. Kiterjesztett Markov modell......................... 32 3.3. A paraméterek becslése............................ 34 3.4. A modell tesztelése.............................. 35 Irodalomjegyzék 36 III

Köszönetnyilvánítás Ezúton szeretném megköszönni témavezet tanáromnak, Csiszár Vill nek, hogy elvállalta a konzulensi teend ket. Köszönöm, hogy a félév során gyelemmel kísérte munkámat, ötleteivel és szakmai tanácsaival nagyban segítette szakdolgozatom elkészülését. Külön köszönettel tartozom családomnak, akik az évek során mellettem álltak és támogatták tanulmányaimat. IV

Bevezet A túlélés-analízis egyik népszer ága a házastársak élettartamával foglalkozik. Számos statisztika bizonyítja ugyanis, hogy azoknak az embereknek az élettartama, akik kapcsolatban állnak egy másik személlyel lényegesen hosszabb, mint azoké, akik egyedülállók. A kapcsolatban állók között is vannak különbségek. Megkülönböztetünk rövid- és hosszú idej függést. Rövid idej függés van két élet között amikor a túlél házastárs halálának az esélye növekszik az együtt eltöltött id függvényében. Hosszú idej függésnél pedig pont fordítva, azaz minél kés bb hal meg a párja, annál kisebb lesz az halálának valószín sége, vagy egyáltalán nem is változik. Szakdolgozatomban mindkét esetre ismertetek egy-egy példát. Az els fejezet egy kisebb elméleti bevezet. Bemutatom a túlélési függvényt, a hazárdfüggvényt és a cenzorálás fogalmát is, amik nélkül a házastársak túlélésvizsgálata lehetetlen lenne. Kitérek két külön esetre is. Az egyik, amikor külön-külön nézem a két félt és az élettartamukról szeretnék mondani valamit, míg a másik esetben együtt vizsgálom ket és meghatározom, hogy az adott pillanatban hány év után várható az els halála és hány év után a másodiké. A második fejezetben a hosszú idej függés egy modelljét, pontosabban a kopula modellt vizsgálom. napjaink egyik legnépszer bb eszköze a házastársak élettartamának vizsgálatában. Ez a fogalom nem tekint vissza hosszú múltra, ám mára már számos területen felhasználták. Népszer ségre könnyen kezelhet sége és követhet lépései miatt tett szert. Ebben a szakaszban ismertetem a fogalmakat, összefüggéseket és kitérek néhány speciális eset bemutatására. Ilyen például, amikor két élet független egymástól, vagy rendelkeznek egy adott tulajdonsággal. Ebben a fejezetben az ötleteket f ként a [3]. forrásból merítettem. A harmadik és egyben az utolsó fejezet a rövid idej függés egy modelljét taglalja. Deniálom a Markov-modellt, amit kiterjesztek úgy, hogy kell képp hiteles képet adjon nekünk err l a függésr l. A fejezetben megmutatom, hogyan becsüljük a paramétereket, 5

TARTALOMJEGYZÉK TARTALOMJEGYZÉK valamint adok egy olyan módszert, amivel meg lehet vizsgálni, hogy a férj és a feleség élettartamára ugyanannyira van-e hatással a másik halála. Ebben a részben a [4] forrásra támaszkodtam. 6

1. fejezet Túlélés-analízis A házastársak túlélésének vizsgálatához szükségünk van pár denícióra és azok tulajdonságaira, amiket a kés bbiekben alkalmazni tudunk. 1.1. Alapdeníciók 1.1.1. Deníció (túlélési függvény). Legyen adott egy T valószín ségi változó (az egyén hátralév ideje) és egy t R szám (id tartam). Legyen S(t) = P (T > t), azaz annak valószín sége, hogy a halál kés bb, mint t id múlva következik be. Ekkor S(t)-t túlélési függvénynek, vagy más néven túlélhet ség függvénynek nevezzük. Általában feltesszük, hogy S(0) = 1, habár ez a valószín ség igazából kisebb 1-nél, ha az azonnali halált is számba vesszük. Ez a függvény a 0-hoz tart, ugyanis még nem találták meg az örök élet titkát. 1.1.2. Deníció (hazárdfüggvény). A hazárdfüggvény (lényegében a pillanatnyi kockázat) t id ben a halálozás esélye feltéve, hogy a túlélés t-ig, vagy tovább tart, azaz µ(t) = P (t T < t+ε T > t). Vagyis annak a feltételes valószín sége, hogy a meggyelt személy ε < id n belül meghal, feltéve, hogy a t id pontban még élt. Ezt a függvényt más módszerrel is meg tudjuk határozni. µ(t) = P (t T < t + ε T > t) = = P (t T < t + ε, T > t) P (T > t) ahol f(t) a túlélési függvény s r ségfüggvénye. = P (t T < t + ε) P (T > t) = f(t) S(t) = S(t) t S(t), 7

A függés típusai Túlélés-analízis Cenzorálás El fordulhat egy adott vizsgálat során, hogy van néhány adat, amely nagyban kilóg a meggyelés adott id tartamából. Ilyenkor csak annyit tudunk feljegyezni magunknak, hogy a várt jelenség korábban, vagy kés bb következett be, mint ahogy mi vártuk. Ezt nevezzük cenzorálásnak. Bizonyos esetekben el fordulhat, hogy a cenzorált adatok nem hagyhatóak gyelmen kívül, mert akkor torzulna a kép. A cenzorálásnak a következ típusait különböztethetjük meg: felülr l való levágás: amikor egy várt esemény egy adott id pontnál kés bb következik be. Jelen esetben a meggyelt személy a meggyelés id tartama alatt élve marad. Ilyenkor ezeket az adatokat szokás kihagyni a vizsgálatból. alulról való levágás: amikor nem tudjuk mióta állnak kapcsolatban az egyének, vagy mi történt a vizsgálat el tt. A meggyelés kezdetén csak a koruk számít nekünk. 1.2. A függés típusai A továbbiakban tekintsünk két életet (férj és feleség). Legyen a férj x és a feleség y korú a vizsgálat kezdetén. Jelölje T x és T y a hátralév élettartamukat. Feltesszük, hogy ezek a valószín ségi változók abszolút folytonos eloszlásúak ω x x és ω y y fels határokkal, ahol ω x és ω y a házastársak maximum életkorát jelölik. Legyen t [0, ω x x) és s [0, ω y y) esetén µ 1 (x + t) és µ 2 (y + s) a házastársak hazárdfüggvénye külön-külön. Legyen µ 1 (x + t T y = t y ) a férj feltételes hazárdfüggvényét t id re (azaz x + t korig), ha a feleség t y év után meghalt, ahol t y [0, s) (vagyis t y id t töltöttek el közösen). Hasonlóan jelölje µ 2 (y + s T x = t x ) a feleség feltételes hazárdfüggvényét s év után, ha a férj t x év után hunyt el, ahol t x [0, t). Ezek után deniálhatjuk a függés két típusát: 1.2.1. Deníció. T x és T y hátralév élettartamok rövid idej függést mutatnak, ha µ 1 (x + t T y = t y ) egy monoton növeked függvény t y -ra nézve (másképpen, ha µ 2 (y + s T x = t x ) egy monoton növeked függvény t x -re nézve). T x és T y hátralév élettartamok hosszú idej függést mutatnak, ha µ 1 (x + t T y = t y ) konstans (állandó), vagy monoton csökken függvénye t y -nak (ekvivalensen, ha µ 2 (y + s T x = t x ) konstans, vagy monoton csökken függvénye t x -nek). 8

Egyéni túlélések vizsgálata Túlélés-analízis Ez a deníció tehát a következ t mondja ki: rövid idej függés van két élet között amikor a túlél házastárs halálának az esélye növekszik az együtt eltöltött id függvényében. Hosszú idej függésnél pedig pont fordítva, azaz minél kés bb hal meg a párja, annál kisebb lesz az halálának valószín sége, vagy egyáltalán nem is változik. A továbbiakban 3 darab túlélési függvényre lesz szükségünk: S 1 (t x ) = P (T x > t x ) a férj túlélési függvénye; S 2 (t y ) = P (T y > t y ) a feleség túlélési függvénye; S(t x, t y ) = P (T x > t x, T y > t y ) a közös túlélési függvényük. A házastársak túlélésének vizsgálatánál a következ eseteket vizsgálhatjuk meg: 1. A feleség elhunyt és a férj még életben van. Ilyenkor a férj hátralév élettartamát vizsgáljuk. 2. A feleség még életben van, de a férj elhunyt, amikor is a feleség fennmaradó idejére koncentrálunk. 3. Mindketten életben vannak. Ekkor további három dolgora lehetünk kíváncsiak: A házasság alatt várhatóan kit ér el bb a halál és kit utóbb. A házasság alatt a férj várhatóan meddig él, ha tudjuk, hogy a feleség megél egy adott id tartamot. A házasság alatt a feleség várhatóan meddig él feltéve, hogy a férj túlél egy adott id t. 1.3. Egyéni túlélések vizsgálata Ebben az alfejezetben egyének túléléseit vizsgáljuk. Nézzük el ször a legels esetet, vagyis tegyük fel, hogy a feleség elhunyt t y és t y + dt id tartam között (vagyis ez jelöli a halál pillanatát), ahol t y [0, t] (t a vizsgálat id tartama). Ekkor a férj túlélési függvényére vagyunk kíváncsiak, vagyis arra, hogy mennyi a 9

Együttes túlélés vizsgálata Túlélés-analízis valószín sége annak, hogy még s id t élni fog. S 1;t (s T y = t y ) = P (T x > s + t T x > t, T y = t y ) = P (T x > s + t, T x > t, T y = t y ) P (T x > t, T y = t y ) = P (T x > s + t, T y = t y ) P (T x > t, T y = t y ) = t y P (T x > t + s, T y > t y ) t y P (T x > t + s, T y > t y ) = t y S(t + s, t y ) t y S(t, t y ) Következ leg vizsgáljuk meg a férj élettartamát akkor, amikor a feleség is még az él k sorában tartózkodik, és a vizsgálat tartson t 0 ideig. Ekkor, ha tudjuk, hogy a feleség t id t él még, akkor a férj feltételes túlélési függvénye el áll az alábbi alakban: S 1;t (s T y > t) = P (T x > t + s T x > t, T y > t) = P (T x > t + s, T x > t, T y > t) P (T x > t, T y > t) = P (T x > t + s, T y > t) P (T x > t, T y > t) = S(t + s, t). S(t, t) Hasonló meggondolással kaphatjuk az S 2;t (s T x = t x ) feltételes túlélési függvényt, ami a feleség várható élettartamát jelöli, ha a férj elhunyt t x közös id tartam után és S 2;t (s T x > t) túlélési függvényt, ami a feleség várható élettartamát mutatja az esküv pillanatától, ha tudjuk, hogy a férj a házasság alatt él még t id t. Ezek után lehet ségünk van a közös túlélési függvény meghatározására. Egy adott t id tartamra tehát S t (s 1, s 2 ) felírható: S t (s 1, s 2 ) = P (T x > t + s 1, T y > t + s 2 T x > t, T y > t) = P (T x > t + s 1, T y > t + s 2, T x > t, T y > t) P (T x > t, T y > t) = P (T x > t + s 1, T y > t + s 2 ) P (T x > t, T y > t) 1.4. Együttes túlélés vizsgálata = S(t + s 1, t + s 2 ). S(t, t) Egy speciális problémája a túlélés-analízisnek a két különböz élet kapcsolatának tanulmányozása. A következ struktúra gyakran el fordul az egészségügyben (két vese élettartamának vizsgálata) és más demográai vizsgálatokban (ikerpárok élettartamának vizsgálata) is. A jelölések ebben a fejezetben is legyenek ugyanazok, vagyis T x és T y olyan valószín ségi változók, amik a férj és a feleség hátralév élettartamát mutatják. Tegyük fel, hogy a meggyelés t ideig tart. Ennek a kezdetén legyen a fér x, míg a n y korú. Az egyének életének meggyelése véget ér, ha a halál el bb következik be, mint a koruk és t összege, vagy ha lejár a t id. Az utóbbi esetben csak azt tudjuk, hogy a halál mi után következett be, ami a felülr l való levágást jelenti. 10.

Együttes túlélés vizsgálata Túlélés-analízis Legyen v = (v 1, v 2,..., v n ) olyan vektor, aminek az i-edik koordinátája jelöli az i-edik házaspár meggyelését. Ezeket a koordinátákat egy vektor állítja el, mégpedig: v i = (x i, y i, t ix, t iy, c ix, c iy ), ahol x i, y i a férj és a feleség kora a meggyelés kezdetén, t ix, t iy a hátralév életüket jelöli és c ij (j {x, y}) a cenzoráló indikátor: c ij = { 0, ha tij = t (cenzorálás) 1, ha t ij < t (nincs cenzorálás) Az egyik legfontosabb kérdés a sok lehetséges közül az, hogy vajon meddig fognak a házastársak élni. A következ kben becslést adok a jöv beli élettartamok eloszlására a belépési korokat gyelembe véve. Az együttes els élet túlélési függvény (joint rst-life survival function): p F L (t; x, y) = P (min {X x, Y y} > t min {X x, Y y} > 0) Ez adja annak a valószín ségét, hogy együtt megélnek t id t, vagy máshogy fogalmazva a házasságban az els halál t id után következik be. Az együttes utolsó túlél függvény (joint last-survivor function): p LS (t; x, y) = P (max {X x, Y y} > t min {X x, Y y} > 0) Annak a valószín sége, hogy a tovább él fél mikor hal meg. Egy egzakt formulával is megadható ez a két függvény a kétváltozós közös túlélési függvénnyel, vagyis S(t x, t y )-nal: p F L (t; x, y) = S(x + t, y + t) S(x, y) és p LS (t; x, y) = S(x, y + t) + S(x + t, y) S(x + t, y + t) S(x, y) 11

2. fejezet napjaink egyik legnépszer bb módszere a valószín ségi változók közötti összefüggések vizsgálatában, f ként a biostatisztika, a biztosításmatematika és a pénzügy területén. A kopulák alapötlete, hogy többdimenziós eloszlás esetén szeretnénk az egydimenziós valószín ségi változók közötti függ séget modellezni úgy, hogy a peremeloszlások és az együttes eloszlás között keresünk olyan kapcsolatot, melyet egy többdimenziós függvénnyel kifejezhetünk. Ebben a fejezetben ismertetem a kopula modellt, majd az el z fejezetben tárgyaltakkal összhangba hozom. 2.1. általában A kopula függvény (copula - egyesülés, összekötés) összeköti az együttes eloszlásfüggvényt a peremeloszlás függvényekkel. A copula szó el ször Abe Sklar dolgozatában jelent meg 1956-ban. 2.1.1. Deníció (kopula függvény). A C : [0, 1] n [0, 1] n változós függvény kopula függvény, ha igazak a következ tulajdonságok: 1. C(u 1, u 2,..., u k 1, 0, u k+1,..., u n ) = 0, u 1, u 2,..., u n [0, 1] 2. C(1, 1,..., 1, u k, 1,..., 1) = u k, u k [0, 1], ahol k = 1,..., n 3. n-növ, azaz: b ac(u) = b 1 a1... bn a n C(u) 0, a < b [0, 1] n. 12

általában Itt b k ak C(u) = C(u 1,..., u k 1, b k, u k+1,..., u n ) C(u 1,..., u k 1, a k, u k+1,..., u n ) dierencia. A következ állítás lényege, hogy egy többváltozós eloszlásfüggvény megadható a marginálisai függvényében egy kopula segítségével. Ezt az összefüggést Sklar vette észre (amit a [6] forrásban tanulmányoznak): 2.1.1. Tétel (Sklar tétele). Legyen F F(F 1,..., F n ) egy n dimenziós eloszlásfüggvény F 1,..., F n peremeloszlásokkal. Ekkor C kopula függvény, amire igaz a következ :. F (x 1,..., x n ) = C(F 1 (x 1 ),..., F n (x n )) A bizonyításhoz szükségünk lesz egy másik tételre is, ami azt mondja ki, hogy ha adott egy valószín ségi változónk és azt a saját eloszlásfüggvényébe beírjuk, akkor egy [0, 1]-en egyenletes eloszlású változót kapunk. 2.1.2. Tétel (Eloszlás-transzformáció). Legyen U egy eloszlás-transzformáltja az X valószín ségi változónak, azaz U := F (X, Y ), ahol Y egy (0, 1)-en egyenletes eloszlású valószín ségi változó és F (x, λ) := P (X < x) + λp (X = x). Ekkor U egyenletes eloszlású valószín ségi változó a (0, 1) intervallumon és X = F 1 (U) m.m. 2.1.1. Megjegyzés. Speciálisan, ha λ = 1, akkor az X valószín ségi változó eloszlásfüggvényét kapjuk. Bizonyítás: Legyen 0 < α < 1 esetén q α (X) := sup{x : P (X x) < α} egy α-kvantilis. Ekkor F (X, V ) α akkor és csak akkor, ha (X, V ) {(x, λ) : P (X < x) + λp (X = x) α}. Ha β := P (X = qα (X)) > 0 és q := P (X < qα (X)), akkor a fenti halmaz ekvivalens a következ vel: {X < qα (X)} {X = qα (X), q + V β α} és 13

általában P (U α) = P (F (X, V ) α) = q + βp (V α q β ) = q + β α q β Ha β = 0, akkor = α. P (F (X, V ) α) = P (X < qα (X)) = P (X qα (X)) = α. A másik állítás bizonyításához vegyük észre, hogy U deníciója miatt fennáll, hogy F (X ) U F (X). Mivel bármilyen u (F (x ), F (x)]-re igaz, hogy F 1 (u) = x, a fenti egyenl tlenségb l következik, hogy F 1 (U) = X m.m. Akkor most nézzük Sklar tételének bizonyítását. Bizonyítás: Legyen X = (X 1,..., X n ) egy tetsz leges vektor az (Ω, A, P ) valószín ségi mez n. Legyen F az együttes eloszlásfüggvény, és V X-t l független a (0, 1) intervallumon egyenletes eloszlású valószín ségi változó (azaz V U(0, 1)). Tekintsük az U i := F i (X i, V ) eloszlástranszformációt. Ekkor az 2.1.2.Tétel miatt U i U(0, 1) és X i = F 1 i (U i ) m.m., 1 i n. Így az U = (U 1,..., U n ) eloszlásfüggvényeként deniált C segítségével írható fel F : F (x) = P (X x) = P (F 1 i (U i ) x i, 1 i n) = P (U i F i (x i ), 1 i n) = C(F 1 (x 1 ),..., F n (x n )), vagyis F -nek C kopula függvénye. Tekintsük Sklar tételét két változóban. Ekkor a tétel a következ : 2.1.3. Tétel. Bármely kétváltozós H(x, y) eloszlásfüggvény, melynek folytonosak az F 1, F 2 peremeloszlásai, egyértelm en reprezentál egy kopula függvényt, mégpedig a C(u, v) = H(F 1 1 (u), F 1 2 (v)) függvényt. Szükségünk lesz még a következ kre a kopulák alkalmazásához: 2.1.2. Deníció (Pozitívan kvadratikus összefüggés (PQD)). Legyenek X és Y valószín ségi változók. Azt mondjuk, hogy X és Y pozitívan kvadratikusan összefüggnek, ha x, y-ra fennáll, hogy P (X x, Y y) P (X x)p (Y y).. 14

Gauss- és t-kopula 2.1.1. Állítás (Fréchet-Hoeng-határok). Tetsz leges C(u) n dimenziós kopulára fennáll az alábbi egyenl tlenség: { n } max u i + 1 d, 0 C(u) min {u 1,..., u n } i=1 Az egyenl tlenség bal oldalát szokás Fréchet alsó határnak, a jobb oldalát, pedig Fréchet fels határnak nevezni. 2.2. Gauss- és t-kopula Az egyik módja a kopula függvények deniálásának a kétváltozós eloszlásfüggvények invertálása. Az együttes viselkedések tanulmányozásánál rendkívül népszer módszereket alakítottak ki. Ilyen például a 2-dimenziós Gauss kopula, ami a C G (u, v; ρ) = Φ 2 ρ(φ 1 (u), Φ 1 (v)) = Φ 1 (u) Φ 1 (v) 1 2π x 2 ρxy+y 2 1 ρ 2 e 2(1 ρ 2 ) dxdy függvény. Itt Φ(x) az egyváltozós standard normális eloszlásfüggvényt, és Φ 2 ρ(x, y) a kétváltozós normális eloszlás együttes eloszlásfüggvényét jelöli, melynek marginálisai standard normálisak, ρ korrelációval a peremeloszlások között. A Student t-kopula hasonló alapokra épül, itt a C t (u, v; ρ, ν) = t 2 ρ,ν(t 1 ν = t 1 ν (u) t 1 ν (v) (u), t 1 (v)) ν 1 2π 1 dxdy 1 ρ 2 (1 + x2 ρxy+y 2 ) 1+ ν ν(1 ρ 2 2 ) kopula a reprezentáló függvény, ahol t ν (x) a t-eloszlás ν szabadságfokkal, és t 2 ρ,ν(x, y) a kétváltozós t-eloszlás eloszlásfüggvénye ρ korrelációval. 2.3. Arkhimédészi kopulák A kopula felépítésének módszere nem korlátozódik a Gauss és a t-eloszlásra, ugyanis ezek az eloszlások nem mindig írják le megfelel en a valóságot, így vannak sokkal alkalmasabbak is. Használhatjuk a peremeloszlás-függvények helyett a túlélési függvényeket is. 15

Arkhimédészi kopulák Tehát lehetnek a kopula függvény argumentumai egyváltozós túlélési függvények, vagyis S 1 (t x ) = P (X > t x ) és S 2 (t y ) = P (Y > t y ). Ekkor S(t x, t y ) = C(S 1 (t x ), S 2 (t y )) alakba írható, ahol a C kopula az (S 1 (t x ), S 2 (t y )) együttes eloszlásfüggvénye. Ezt az elgondolást használják fel az úgynevezett Arkhimédészi kopulák, amik már jól ismertek és széles körben elfogadottak a matematikai kezelhet ségük, valamint rugalmasságuk miatt. Ezek egy adott generáló függvény segítségével állíthatóak el. Deniálunk egy Φ : [0, 1] R + szigorúan monoton csökken függvényt, aminek létezik és folytonos az els, illetve a második deriváltja. Ezeket jelölje Φ (τ) és Φ (τ). A generáló függvényre a következ ek legyenek jellemz ek: Φ(1) = 0; Φ (τ) < 0, ahol 0 τ 1; Φ (τ) > 0, ahol 0 τ 1. Ekkor az Arkhimédészi kopulák a következ módon állnak el : C(u, v; α) = Φ(Φ [ 1] (u) + Φ [ 1] (v)), u, v [0, 1], ahol α a kapcsolati paraméter (Φ( ) képletében található) és Φ [ 1] ( ) pszeudoinverze Φ( )- nek, vagyis { Φ 1 Φ [ 1] (τ), ha 0 τ Φ(0) (τ) = 0, ha Φ(0) τ Jelen esetben csak olyan függvényeket vizsgálunk, ahol a függvény pszeudonverze egybeesik az inverzével. Az Arkimédészi kopulákra továbbá meghatározható a Kendall-féle korrelációs együttható (τ). 2.3.1. Deníció (Kendall-féle korrelációs együttható). A Kendall-féle τ a következ : τ = P ((X 2 X 1 )(Y 2 Y 1 ) > 0) P ((X 2 X 1 )(Y 2 Y 1 ) < 0), ahol (X 1, Y 1 ), (X 2, Y 2 ) két független példány az együttes eloszlásból. Ennek van egy tapasztalati verziója is, amikor ez az együttható két szám különbségéb l kapható. Az egyik a p +, ami a konkordáns (egyirányú) párok aránya a populációban, a másik pedig a p, ami a diszkordáns (ellentétes irányú) párok aránya, így kapjuk, hogy τ = p + p. Minél nagyobb ennek a mennyiségnek az abszolút értéke, annál er sebb a kapcsolat a valószín ségi változók között. A Kendall-féle τ jellemz i: 16

Arkhimédészi kopulák 1 τ 1; ha X, Y független, akkor τ = 0; τ = 1: determinisztikusan fogyó kapcsolat; τ = 1: determinisztikusan növ kapcsolat. Ezek után tekintsünk néhágy jól ismert Arkhimédészi kopulát. Clayton kopulája Ezt a kopulát a Φ 1 (t) = t α 1 függvény generálja. Ekkor a kopula a következ képp néz ki: C C (u, v; α) = (u α + v α 1) 1 α, ahol α a kapcsolati paraméter. A kopula f bb jellemz i: PQD: ha α > 0 függetlenség: ha α 0 Kendall τ maximuma: 1(α ) Gumbel-Hougaard kopula Itt a generáló függvény a következ alakú: Φ 1 (t) = ( log t) α. Ekkor kapjuk, hogy a kopula a C GH (u, v; α) = e [( log u)α +( log v) α ] α 1 függvény, ahol α szintén a kapcsolati paraméter. A kopula f bb jellemz i: PQD: ha α 1 függetlenség: ha α = 1 Kendall τ maximuma: 1(α ) 17

Egyéni túlélések vizsgálata kopulák segítségével Frank kopulája Ezt a kopulát a Φ(t) = log eαt 1 e α 1 függvény generálja. Ebb l kapjuk a kopulát, ami a C F (u, v; α) = 1 [ ] α log 1 + (e αu 1)(e αv 1) e α 1 alakban írható. A Frank kopula jellemz i: PQD: ha α < 0 függetlenség: ha α 0 Kendall τ maximuma: 1(α ) Az Arkhimédészi kopuláknak még számos fajtája van, de a legnépszer bb az imént tárgyalt 3, így többet nem sorolok fel. 2.4. Egyéni túlélések vizsgálata kopulák segítségével A kopulákat alkalmazzák az aktuáriusi vizsgálatok során, amikor életbiztosításokhoz számolnak várható élettartamokat. A közös túlélési függvény tekinthet egy kétváltozós kopula függvénynek, ahol a változók helyére az egyéni túlélési függvényeket írjuk: S(s 1, s 2 ) = C[S 1 (s 1 ), S 2 (s 2 )] Ebben az alfejezetben a korábban deniált túlélés-analízis-beli függvényeket adjuk meg kopula függvények segítségével El ször is nézzük mennyi a valószín sége annak, hogy a férj él még s id t, ha a feleség meghal t y id után. Ekkor a túlélési függvény a következ lesz: S 1;t (s T y = t y ) = P (T x > t + s T x > t, T y = t y ) = t y S(t + s, t y ) t y S(t, t y ) = C 2[S 1 (t + s), S 2 (t y )], C 2 [S 1 (t), S 2 (t y )] ahol C 2 [, ] jelöli a második változó szerinti parciális deriváltját C[, ]-nak. Természetesen ez a meghatározás csak akkor értelmes, ha a nevez nem nulla, vagyis C 2 [S 1 (t), S 2 (t y )] 0. 18

Egyéni túlélések vizsgálata kopulák segítségével Jobban szeretjük a halálozást a hazárdfüggvényekkel szemléltetni, ha lehet ség van rá. Tegyük fel, hogy C 2 [S 1 (t + s), S 2 (t y )] 0. Ekkor a hazárdfüggvény: µ 1 (x + t + s T y = t y ) = s log C 2[S 1 (t + s), S 2 (t y )] = µ 1 (x + t + s) S 1(t + s)c 21 [S 1 (t + s), S 2 (t y )] C 2 [S 1 (t + s), S 2 (t y )] ahol µ 1 (x + t + s) jelöli a férj hazárdfüggvényét jelöli x + t + s korra T x eloszlásának megfelel en, továbbá C 21 [, ] a kopula függvény második parciális deriváltját, ahol el ször a második, majd az els változó szerint deriválunk., 2.4.1. Állítás. Tegyük fel, hogy a hazárdfüggvény állandó, azaz konstans. Ekkor a két házastárs élettartama független. Bizonyítás: Tegyük fel, hogy a férj hazárdfüggvénye konstans. Legyen u = S 1 (t + s) és v = S 2 (t y ). Ekkor µ 1 (x + t + s T y = t y ) képletében lev kopula függvényekre igaz, hogy: C 21 [u, v] C 2 [u, v] = log C 2[u, v] ; u, v [0, 1], u itt a logaritmusfüggvényt, mint összetett függvényt deriváljuk és kapjuk ezt az összefüggést. A kezdetiérték feltétel itt simán csak a kopula deníciójából kapható, vagyis, hogy C(0, v) = C(u, 0) = 0 és C(u, 1) = u, C(1, v) = v. A fenti kifejezés független v-t l, ezért log C 2 [u, v] felírható K 1 (u) + K 2 alakban. Itt K 1 (u) jelöl egy olyan valós érték dierenciálható függvényt, ami csak u-tól és a függés paraméterét l függ, de v-t l nem, valamint K 2 R. Ezt visszaintegrálva megkapjuk a kopula függvényt, vagyis ekkor: C 2 [u, v] = e K 1(u)+K 2 C[u, v] = ve K 1(u)+K 2 + K 3, ahol K 3 R. Abból a feltételb l, hogy C[u, 0] = 0 (ahol u [0, 1]) kapjuk, hogy K 3 másodikból (C[u, 1] = u, u [0, 1] pedig, hogy = 0. A u = e K 1(u)+K 2 log u = K 1 (u) + K 2 K 1 (u) = log u K 2. 19

Egyéni túlélések vizsgálata kopulák segítségével Így kapjuk végül, hogy a kopula függvényünk a következ : C[u, v] = uv, ami egy független kopula. Más szavakkal, ha két élet függ egymástól és egy kopula modellel felírható ez a függés, akkor az egyéni hazárdfüggvény mindig függ a másik ember halálának idejét l. A függésnek ezt a típusát vizsgáljuk a továbbiakban néhány kopulacsalád esetén. 2.4.1. Speciális esetek Függetlenség Tudjuk, hogy ekkor a kopula alakja C[u, v] = uv. Ebben az esetben a túlélési függvény és a feltételes hazárdfüggvényt könnyen kiszámíthatjuk: S 1;t (s T y = t y ) = C 2[S 1 (t + s), S 2 (t y )] C 2 [S 1 (t), S 2 (t y )] = [S S 2 (t y) 1(t + s)s 2 (t y )] [S S 2 (t y) 1(t)S 2 (t y )] µ 1 (x + t + s T y = t y ) = µ 1 (x + t + s) S 1(t + s)c 21 [S 1 (t + s), S 2 (t y )] C 2 [S 1 (t + s), S 2 (t y )] = S 1(t + s). S 1 (t) = µ 1 (x + t + s) S 1(t + s) 2 S 1 (t+s) S 2 (t y) [S 1(t + s)s 2 (t y )] S 2 (t y) [S 1(t + s), S 2 (t y )] = µ 1 (x + t + s) S 1(t + s) S 1 (t + s) = µ 1 (x + t + s) Erre számítottunk, vagyis arra, hogy a feltételes hazárdfüggvénye az egyénnek nem változik, ha a két élet független egymástól. Hasonlóan ki tudjuk számolni a feleség túlélési függvényét és hazárdfüggvényét. Fréchet fels határ Ebben az esetben a kopula függvényünk C[u, v] = min{u, v} alakú, és így a második változó szerinti parciális deriváltja a C 2 [u, v] = I u>v. Tehát S 1;t (s T y = t y ) akkor és csak akkor létezik, ha S 2 (t y ) < S 1 (t). Most is meg tudjuk adni a férj és a feleség túlélési függvényét: S 1;t (s T y = t y ) = { [ 1] 1, ha s < S 1 (S 2 (t y )) t 0, ha s > S [ 1] 1 (S 2 (t y )) t, 20

Egyéni túlélések vizsgálata kopulák segítségével ahol S [ 1] 1 (κ) = { S 1 1 (κ), ha 0 < κ 1 ω x, ha κ = 0. Azaz, ha a feleség t y id után meghal, akkor a férj x + S [ 1] 1 (S 2 (t y )) korban fog. Fréchet alsó határ Fréchet alsó határ esetén a kopula C[u, v] = max{u + v 1, 0} alakban adható meg és ekkor a második változó szerinti parciális derivált C 2 [u, v] = I v>u 1, ami miatt S 1;t (s T y = t y ) akkor és csak akkor létezik, ha S 2 (t y ) > 1 S 1 (t). Ekkor a feltételes túlélési függvény: S 1;t (s T y = t y ) = { [ 1] 1, ha s < S 1 (1 S 2 (t y )) t 0, ha s > S [ 1] 1 (1 S 2 (t y )) t. Vagyis szavakkal megfogalmazva, ha a feleség t y id után hal meg, akkor a férj x + S 1 1 (1 S 2 (t y )) korban fog. 2.4.2. Arkhimédészi kopulák alkalmazásával Tudjuk, hogy az Arkhimédészi kopulák C[u, v] = Φ 1 (Φ(u) + Φ(v)) alakban állnak el. Most ezt helyettesítsük be a feltételes hazárdfüggvénybe: µ 1 (x + t + s T y = t y ) =µ 1 (x + t + s)s 1 (t + s)( Φ (S 1 (t + s))) ( ) (Φ 1 ) (Φ(S(t + s, t y ))). (Φ 1 ) (Φ(S(t + s, t y ))) Ez függ t y -tól. Ha (Φ 1 ) (Φ(S(t+s,t y))) (Φ 1 ) (Φ(S(t+s,t y))) monoton csökken (növeked ) t y -ban, akkor hosszú idej (rövid idej ) függésr l beszélünk. Most tegyük fel, hogy hosszú idej a függés a házastársak között, ugyanis a legtöbb kopula ezen a függésen alapszik. Egy alap példája a hosszú idej függésnek a törékenység, amit a következ ekben tárgyalunk. Ha a generátor inverze egy Laplace transzformált, akkor el áll a következ alakban: Φ 1 (v) = e zv df (z), ahol F (z) a törékenység eloszlásfüggvénye. Ekkor a fenti függvény monoton növeked (amit a [?]-ban bizonyítanak is). Ebb l látható, hogy a törékenység tényleg a hosszú idej függés egy speciális esete. 21

Közös túlélés vizsgálata kopulák segítségével 2.4.1. Példa (Clayton kopula esetén). A generátor inverze, Φ 1 (τ) = (τ + 1) 1 α a Laplace transzformáltja a Gamma(a, b) eloszlásnak, ahol a = α 1 és b = 1. Általában a Gamma(a, b) eloszlás Laplace transzformáltja Φ 1 (τ) = ( τ b + 1) 1 α, ahonnan a generátor Φ(τ) = b(t α 1). Jelen esetben b = 1, így ez nem befolyásolja az eredményt, vagyis a hazárdfüggvénye a férjnek: (S 1 (t + s)) α µ 1 (x + t + s T y = t y ) = µ 1 (x + t + s)(α + 1) (S 1 (t + s)) α + (S 2 (t y )) α 1, ami csökken t y -ban. Ha t y = 0 (vagyis a házasságkötés után azonnal meghal), abban az esetben elt nik a törtes kifejezés és ekkor µ 1 (x+t+s T y = 0) = µ 1 (x+t+s)(α+1). Vagyis szavakkal, ha a feleség a házasságot követ en azonnal meghal, akkor a férj hazárdfüggvénye a perem hazárdfüggvénye (α + 1)-szer. 2.4.2. Példa (Gumbel-Hougaard kopula esetén). A generátor inverze, Φ 1 (τ) = e τ 1 α a Laplace transzformáltja a pozitív stabilis eloszlásnak. Ekkor a feltételes hazárdfüggvényre a következ t kapjuk: ( µ 1 (x + t + s T y = t y ) =µ 1 (x + t + s) ami szintén monoton csökken, mint t y függvénye. ( log S 1 (t + s)) α ( log S 1 (t + s)) α + ( log S 2 (t y )) α ( 1 + (α 1)(( log S 1 (t + s) α + ( log S 2 (t y )) α ) 1 α ) 1 1 α 2.4.3. Példa (Frank kopulája esetén). A generátor inverze, Φ 1 (τ) = log{1+(eα 1)e τ }α Laplace transzformáltja a lognormális eloszlásnak. Ekkor a feltételes hazárdfüggvény: e αs 1(t+s) µ 1 (x + t + s T y = t y ) =µ 1 (x + t + s)s 1 (t + s)( α) 1 e αs 1(t+s) ( ) 1 e α 1 e α (1 e αs 1(t+s) )(1 e αs 2(t y), ) ami szintén monoton csökken a t y -ban. ), 2.5. Közös túlélés vizsgálata kopulák segítségével 2.5.1. Speciális esetek Függetlenség Ekkor a kopula függvényünk C[u, v] = uv alakú, amib l a hazárdfüggvény: µ 1 (x + t + s T y > t) = µ 1 (x + t + s) S 1(t + s)c 1 [S 1 (t + s), S 2 (t)] C[S 1 (t + s), S 2 (t)] 22 = µ 1 (x + t + s),

Közös túlélés vizsgálata kopulák segítségével amire számítottunk is, ugyanis függetlenség esetében a hazárdfüggvény nem függ a másik élet történetét l. Ekkor kapjuk, hogy a közös túlélési függvény S t (s 1, s 2 ) = S 1(t + s 1 )S 2 (t + s 2 ) S(t, t) = S 1;t (s 1 T y > t)s 2;t (s 2 T x > t). Fréchet fels határ Tegyük fel, hogy a kopula függvényünk C[u, v] = min{u, v} alakú. Ekkor igaz a következ : S 1;t (s T y > t) = C[S 1(t + s), S 2 (t)] C[S 1 (t), S 2 (t)] = min{s 1(t + s), S 2 (t)} min{s 1 (t), S 2 (t)}. Hasonlóan kapható S 2;t (s T y > t)-ra. Ebben az esetben a közös túlélés kopula függvénye: C t [S 1;t (s 1 T y > t), S 2;t (s 2 T x > t)] = C[S 1(t + s 1 ), S 2 (t + s 2 )] S(t, t) = min(s 1;t (s 1 T y > t), S 2;t (s 2 T x > t)). = min(s 1(t + s 1 ), S 2 (t + s 2 )) S(t, t) Vagyis ha a közös túlélési függvény kezdetben eléri a Fréchet fels határt, mint kopula, akkor a jöv ben is el fogja érni a Fréchet fels határt. Fréchet alsó határ Tegyük fel, hogy a kopula rendelkezik Fréchet alsó határ tulajdonságával, vagyis C[u, v] = max{u + v 1, 0} alakú. Ekkor S 1;t (s T y > t) = max{s 1(t + s) + S 2 (t) 1, 0} S(t, t) és S 2;t (s T x > t) hasonlóan néz ki. Ebben az esetben a közös túlélési függvény, mint kopula függvény a következ alakban írható fel: C t [S 1;t (s 1 T y > t), S 2;t (s 2 T y > t)] = max{s 1(t + s) + S 2 (t + s) 1, 0} S(t, t) = max(s 1;t (s 1 T y > t) + S 2;t (s 2 T x > t) 1, 0), azaz ha a közös túlélési függvény eléri a Fréchet alsó határt a kezdetekkor, akkor a továbbiakban is el fogja érni. 23

Közös túlélés vizsgálata kopulák segítségével 2.5.2. Arkhimédészi kopulák alkalmazásával Alkalmazzuk az együttes eloszlás meghatározásához az Arkhimédészi kopulákat. Nézzük el ször, hogy számítható ki a férj hátralév idejének feltételes túlélési függvénye ezen kopulák segítségével, ami megadja, hogy mennyi a valószín sége annak, hogy a férj él még s + t ideig, ha tudjuk, hogy a feleség él t id t: S 1;t (s T y > t) = Φ 1 (Φ(S 1 (t + s)) + Φ(S 2 (t))). S(t, t) Hasonló egyenl séget kapunk a feleség feltételes túlélési függvényére, vagyis S 2;t (s T x > t)-re. A hazárdfüggvény annyiban fog változni az korábbi esethez képest, hogy most nem azt nézzük, hogy a feleség megélt t y id t, hanem, hogy tovább él, mint t id, vagyis: ( ) µ 1 (x + t + s T y > t) = µ 1 (x + t + s)s 1 (t + s)( Φ (S 1 (t + s))) (Φ 1 ) (Φ(S(t + s, t)). Φ 1 (Φ(S(t + s, t))) 2.5.1. Tétel. Tegyük fel, hogy az együttes túlélési függvény kopulája Arkhimédészi kopula a kezdetekkor (t = 0). Ekkor a feltételes együttes túlélési függvény kopulája (azzal a feltétellel, hogy T x és T y is nagyobb, mint t) szintén Arkhimédészi. Precízebben: Legyen Φ( ) az Arkhimédészi kopula generátorfüggvénye t = 0 id pontban. Ekkor Φ t ( ) (generálófüggvény t id pontban) a következ alakban áll el : Φ t (τ) = Φ(τS(t, t)) Φ(S(t, t)), ahol τ [0, 1]. Bizonyítás: adja t id után. Megmutatjuk, hogy az a kopula, amit Φ t ( ) generál mindkét élet túlélését El ször vizsgáljuk meg, hogy Φ t ( ) rendelkezik-e az Arkhimédészi kopulák generátorfüggvényének tulajdonságaival (Φ t (1) = 0, Φ t(τ) < 0 és Φ t (τ) > 0): Φ t (1) = Φ(1S(t, t)) Φ(S(t, t)) = 0 Φ t(τ) = Φ (τs(t, t))s(t, t) < 0, mert Φ (τs(t, t)) < 0, hiszen Φ( ) generáló függvény és S(t, t) [0, 1], mivel valószín ség. Φ t (τ) = Φ (τs(t, t))(s(t, t)) 2 > 0, 24

Közös túlélés vizsgálata kopulák segítségével mert Φ (τs(t, t)) > 0, hiszen Φ( ) generáló függvény és (S(t, t)) 2 0, mivel négyzetszám nem lehet negatív. A következ lépésben meghatározzuk a kopulát, amit Φ t ( ) generál. Legyen Φ t ( ) inverze Φ 1 t ( ). Ekkor: Φ 1 t (τ) = Φ 1 (τ + Φ(S(t, t))). S(t, t) Innen már meg tudjuk adni az új kopulát, amit értelemszer en C t [, ]-tal jelölünk: C t [u, v] = Φ 1 t (Φ t (u) + Φ t (v)) = Φ 1 (Φ(uS(t, t)) + Φ(vS(t, t)) Φ(S(t, t))). S(t, t) Most helyettesítsünk u és v helyére S 1;t (s T y > t) és S 2;t (s T x > t) feltételes túlélési függvényeket. Ekkor kapjuk, hogy C t [S 1;t (s T y > t), S 2;t (s T x > t)] = Φ 1 (Φ(S 1 (t + s)) + Φ(S 2 (t + s))) S(t, t) Azaz Φ t [ ] tényleg mindkét élet túlélését adja t id után. = P (T x > t + s, T y > t + s T x > t, T y > t). A továbbiakban a kapcsolat többféle id t l függ mértékér l tárgyalunk, amik közül az egyik a Kendall-féle korrelációs együttható, másik pedig a kereszt-arány ( cross-ratio) függvény. El ször tekintsük a Kendall-féle τ-t kopulák esetén, ami népszer azon tulajdonsága miatt, hogy független a marginálisok eloszlásától. 2.5.1. Deníció. Két valószín ségi változó (U, V ) Kendall-féle korrelációs együtthatója kopulák segítségével (azaz H(u, v) = C(F (u), G(v))) az alábbi alakban adható meg: 1 τ(x 1, X 2 ) = 4 0 1 0 C[u, v]dc[u, v] 1 Ez az együttható Arkhimédészi kopulák esetén megadható a generátorfüggvény segítségével is: 1 τ t (U, V ) = 4 0 Φ t (v) Φ t(v) dv + 1 Alkalmazzuk ezt most a házastársak hátralév idejét tartalmazó valószín ségi változókra, azaz határozzuk meg τ(t x, T y )-t: 1 τ t (T x, T y ) = 4 0 Φ t (v) Φ t(v) dv + 1 = 4 S(t, t) 1 u=0 Φ(uS(t, t)) Φ(S(t, t)) dv + 1. Φ t(us(t, t)) 25

Közös túlélés vizsgálata kopulák segítségével Ezt az összefüggést nevezik csonka τ-nak. Most nézzük a másik id t l függ kapcsolati mértéket, azaz a kereszt-arány függvényt (CR( )). 2.5.2. Deníció. A közös túlélésfüggvény (S(t, t)) kereszt-arány függvénye (CR(S(t, t))) megadható a következ alakban: CR(S(t x, t y )) = S(t x, t y ) 2 t x t y S(t x, t y ) t x S(t x, t y ) t y S(t x, t y ). Ezek után látható, hogy egy egyszer összefüggést fel tudunk írni a csonka tau és a kereszt-arány függvény között: τ t (T x, T y ) = CR(S(t x, t y )) 1 CR(S(t x, t y )) + 1. Két okból szeretjük jobban használni a kereszt-arány függvényt a csonka tau-nál. Egyik szempont, hogy meghatározza az egyének halálozási erejének relatív növekedési ütemét a partner haláláig, vagyis: CR(S(t x, t y )) = µ 1(x + t x T y = t y ) µ 1 (x + t x T y > t y ). A másik szempont pedig az, hogy ezt a függvényt könnyebb becsülni, mint a csonka taut, mivel nincs benne integrálás. Tegyük fel ugyanis, hogy t x = t y = t, ekkor adódik a kereszt-arány függvényre, hogy CR(S(t, t)) = Φ 1 (Φ(S(t, t)))(φ 1 ) (Φ(S(t, t))) ((Φ 1 ) (Φ(S(t, t)))) 2. Azaz ez a függvény csak a generáló függvényt l függ. A következ ekben meghatározzuk pár kopula családnál ezt a kereszt-arány függvényt. 2.5.1. Példa (Clayton kopulája esetén). Legyen a generáló függvény a következ : Φ(τ) = δ(τ α 1), ahol α > 0 és δ > 0. Ekkor a feltételes hazárdfüggvény (S 1 (t + s)) α µ 1 (x + t + s T y > t) = µ 1 (x + t + s) S 1 (t + s)) α + S 2 (t)) α 1 alakú. Így ha t id re nézzük a túlélést Φ t ( ) a következ alakú: Φ t (τ) = δ(s(t, t)) α (τ α 1) = δ(s(t, t)) α Φ(τ), vagyis a kopula lényegében nem változik az id múlásával. Ilyenkor a kereszt-arány függvény konstans az adott id ben és egyenl α + 1-gyel. 26

A paraméterek becslése 2.5.2. Példa (Gumbel-Hougaard kopula esetén). Ebben az esetben a generáló függvény Φ(τ) = ( log τ) α alakú, ahol α 1. Ilyenkor a feltételes hazárdfüggvényre igaz, hogy ( µ 1 (x + t + s T y > t) = µ 1 (x + t + s) ( log S 1 (t + s)) α ( log S 1 (t + s)) α + ( log S 2 (t)) α ) 1 1 α. Ebb l pedig következik, hogy Φ t (τ) = ( log τs(t, t)) α ( log S(t, t)) α, vagyis a két élet közötti kapcsolat 0-hoz tart. Más szavakkal a két élet egyre kevésbé függ egymástól az évek múlásával. Így a kereszt-arány függvény a következ lesz: CR(S(t, t)) = 1 + α 1 log S(t, t). 2.5.3. Példa (Frank kopulája esetén). Frank kopulájánál a generáló függvény: Φ(τ) = log (eατ 1) e α 1, ahonnan µ 1 (x + t + s T y > t) =µ 1 (x + t + s) (1 e αs 2(t) )e αs 1(t+s) ( α)s 1 (t + s) ((e α 1) + (e αs 1(t+s) 1)(e αs 2(t) 1)) log 1 + (eαs 1 (t+s) 1)(e αs 2 (t) 1) e α 1 Innen kapjuk a generáló függvényre t id ben, hogy Φ t (τ) = log eαs(t,t)τ 1 e αs(t,t) 1. Ahogy az id változik, az α paraméter 0-hoz tart, utalva a függetlenségre. Így a keresztarány függvény αs(t, t) CR(S(t, t)) = 1 e. αs(t,t) 2.6. A paraméterek becslése A közös túlélési függvény becslése két lépésben történik. El ször becsüljük a perem túlélési függvényeket (S 1 (t x ), S 2 (t y )), majd a becsült túlélési függvényeket beillesztjük az adott kopulákba, valamint becsüljük a kapcsolati paramétert. A túlélési függvényt becsülhetjük nem paraméteres és paraméteres módon is. Egy nem paraméteres becslése a túlélési függvénynek a Kaplan-Meier becslés (aminek módszerét [5] forrásból merítettem). A vizsgálat során legyen n darab egyedünk, melyeket sorbarendezve t 1, t 2,..., t n id pontokban ért a halál. Jelölje d i a halálozások számát t i -kor (vagyis. 27

A paraméterek becslése di = n) és legyen r j az él k száma kicsivel t j el tt (azaz r j+1 = r j d j ). Ekkor a becsült eloszlásfüggvényünk F (t) = 1 n s d j, ahol t s t t s+1. Így kapjuk, hogy a becsült túlélési függvény j=1 Ŝ(t) = 1 F (t) = ahol szintén fennáll, hogy t s t t s+1. A kapott túlélési függvény "szebb" alakra hozható, vagyis a következ alakban adható meg: s ( Ŝ(t) = 1 d ) j. r j j=1 Adatok cenzorálása esetén változik az él k száma, mégpedig: r 1 = n l 1, r j+1 = r j d j l j+1, ahol l 1 a t 1-ig cenzorált adatok száma, l i pedig a t i 1 és t i közöttiek száma. Egy másik becslése a túlélési függvénynek egy paraméteres modell segítségével történik. n Ezek lehetnek a Gompertz- vagy a Weibull-eloszlások. 2.6.1. Deníció (Gompertz-eloszlás). Az X valószín ségi változó Gompertz-eloszlású, ha eloszlásfüggvénye F (x; β, γ) = s j=1 n d j { 1 e γ(e βx 1), ha x 0 0, ha x < 0, ahol γ > 0az alakparaméter és β > 0 a skálaparaméter. 2.6.2. Deníció (Weibull-eloszlás). Az X valószín ségi változó Weibull-eloszlású, ha eloszlásfüggvénye F (x; β, γ) = { 1 e ( x β ) γ, ha x 0 0, ha x < 0, ahol γ > 0az alakparaméter és β > 0 a skálaparaméter. Ezek után tekintsük a következ kétváltozós túlélési függvényt, mint kopulát: S(t x, t y ; θ x, θ y, α) = C(S 1 (t x ; θ x ), S 2 (t y ; θ y ); α), ahol θ x és θ y a marginálisok paraméterei és α a kapcsolati paraméter. 28,

A paraméterek becslése ahol Jobbra cenzorált esetben a likelihood függvény θ = (θ x, θ y, α) esetén a következ lesz: n l(θ) = f(x i, y i ; θ x, θ y ) cx i cy i f1 (x i, y i ; θ x, θ y ) cx i (1 cy i ) i=1 f 2 (x i, y i ; θ x, θ y ) (1 cx i )cy i S(xi, y i ; θ x, θ y ) (1 cx i )(1 cy i ), f(x, y; θ x, θ y ) = 2 x y S(x, y; θ x, θ y ); f 1 (x, y; θ x, θ y ) = x S(x, y; θ x, θ y ); f 2 (x, y; θ x, θ y ) = y S(x, y; θ x, θ y ); és x i =belépési kor +t xi, y i =belépési kor +t yi. Tegyük fel, hogy a túlélési függvényt a Weibull-eloszlással határoztuk meg, vagyis kapjuk, hogy S(t j ) = P (T j > t j ) = e ( t β j ) γj, ha t 0, ahol β j a skála- és γ j az alakparaméter j = x, y-ra. Ezután helyettesítsük be a perem túlélési függvényeket egy adott kopulába. Nézzük mondjuk a Gumbel-Hougaard kopulát. Kapjuk, hogy: S(t x, t y ) = C GH (S(t x ; β x, γ x ), S(t y ; β y, γ y ); α) [ = e ( tx βx ) γxα ( ) ty γyα ] 1 α + βy. = e ( log e ( tx βx ) γx ) ( ) ty γy α+ log e βy α 1 α Ennek a függvénynek a maximum likelihood becslése elég bonyolult, így nem vezetem le, de megtalálható [?]-ben. Ez az el állítás rendkívül elegáns és hatásos, azonban néha kevésnek bizonyul a kapcsolatok típusától függ en. Ez azért lehet, mert egy kétváltozós túlélési függvényt használunk ahhoz, hogy egy 3-változós függvényt vizsgáljunk (rst-life, last-survivor ). Tekintsük a következ s r ségfüggvényt: f(x, y) = 2 S(x, y), x y ami mutatja a változás mértékét S(x, y)-ban, amikor a halálok x és y korban bekövetkeznek. Bontsuk fel S(x, y)-t a következ képp: S(x, y) = S(x 0 + t x, y 0 + t y ), ahol x 0 és y 0 a házasságba belépéskor az életkor. 1.eset: t x = t y f(x, y) mutatja a változás mértékét S(x, y)-ban, amikor a halálok x és y korban bekövetkeznek. Ekkor a halál egyszerre, vagy szinte egymás után azonnal történik. 29

A paraméterek becslése 2.eset: t x t y Legyen ekkor például t y = t x + t, ahol t 0. Itt szintén f(x, y) mutatja a változás mértékét S(x, y)-ban, amikor a halálok x és y korban bekövetkeznek, de most a két halál között t id telik el. Egyik esetben sincs probléma akkor, ha a házasságba belépéskor mindkét fél egyforma id s, azaz x 0 = y 0 (ez áll fent mondjuk akkor, ha páros szerveink élettartamát vizsgáljuk). Akkor sincs baj, ha a két élet közötti kapcsolat csak a kortól függ és nincs külön befolyásoló tényez. Azonban házastársak életének vizsgálatánál egyik sem áll fent feltétlenül, ugyanis nem csak azonos korú emberek kötk össze életüket és házasságukra több küls hatás is befolyással lehet (például egy végzetes karambol, ahol mindkét fél elhunyt). Befolyásoló tényez lehet még az összetört szív szindróma, vagyis amikor az egyik fél meghal a másik nem sokkal utána követi t a halálba. Ebb l kifolyólag úgy t nik, hogy nincs tökéletes becslés kopulákkal az együttes túlélési függvényre, valamint az els -élet és utolsó-túlél függvények becslésére. (Ezt a problémát b vebben [?] tárgyalja és próbálja megoldani) 30

3. fejezet Rövid idej függ ség vizsgálata Két élettartam között rövid idej függ ségr l beszélünk, ha a tovább él ember hazárdfüggvénye magasabb lesz miután a partnere meghal. Ezt a függést egy összetett modellel lehet vizsgálni, amit ebben a fejezetben fogok bemutatni. 3.1. Markov modell A rövid idej függ ség ezen modelljét Norberg és Wolthuis alakították ki, ami a Markov lánc elméletén alapszik. 3.1.1. Deníció (Markov-lánc). Legyenek X 1, X 2,... valószín ségi változók, I állapottér, ami véges vagy megszámlálhatóan végtelen. Tegyük fel, hogy X n (n = 0, 1, 2,...) értékei I-be esnek. Azt mondjuk, hogy ezen valószín ségi változók Markov-láncot alkotnak, ha rendelkeznek a Markov-tulajdonsággal, azaz P (X n+1 = x n+1 X 0 = x 0,..., X n = x n ) = P (X n+1 = x n+1 X n = x n ) (vagyis a jöv nem függ a múlttól, csak a jelent l). Jelen esetben a Markov-lánc 4 lépcs b l áll (amit a 3.1. ábra mutat). Kezdetben mind a ketten életben vannak, amit 0. állapotnak nevezünk. A második és a harmadik lépcs re akkor kerülünk, ha valamelyik fél meghalt, vagyis ha a férj hal meg az els, míg ha a feleség, akkor a második állapotba jutunk. Ezután már csak egy eset lehetséges, ha az életben maradt fél is távozik az él k sorából. Ekkor érünk a lánc aljára. Legyen T x a férj, T y a feleség hátralev élettartama a házasságkötést l, valamint x és y a házasságba lépési koruk. Ekkor tehát az átmenetvalószín ségek: µ 01 (t) = µ 1 (x + t T y > t), vagyis a fér hazárdfüggvénye x + t id re, ha tudjuk, hogy a n tovább él, mint t év. 31

Kiterjesztett Markov modell Rövid idej függ ség vizsgálata µ 02 (t) = µ 2 (y + t T x > t), vagyis a n hazárdfüggvénye y + t id re, ha tudjuk, hogy a fér tovább él, mint t év. µ 13 (t) = µ 2 (y + t T x t), vagyis a n hazárdfüggvénye y + t id re, ha tudjuk, hogy a fér t éven belül elhunyt. µ 23 (t) = µ 1 (x + t T y t), vagyis a fér hazárdfüggvénye x + t id re, ha tudjuk, hogy a n t éven belül elhunyt. Tegyük fel, hogy ezek a hazárdfüggvények el állnak a fér és a n hazárdfüggvényeib l a következ alakban: µ 01 (t) = (1 α01)µ 1 (x + t); µ 02 (t) = (1 α02)µ 2 (y + t); µ 13 (t) = (1 + α13)µ 2 (y + t); µ 23 (t) = (1 + α23)µ 1 (x + t); ahol α01, α02, α13, α23 0 paraméterek. 3.1. ábra. Így kaptunk egy 4 lépéses modellt. Azonban ez a modell még nem adja vissza kell képpen a valóságot, szükség van némi változtatásra, amit a következ fejezetben mutatunk be. 3.2. Kiterjesztett Markov modell A kiterjesztett Markov modell azon alapszik, hogy a fennmaradó élet hazárdfüggvénye függ a házastárs halála óta eltelt id t l. Így további 2 állomást teszünk be az alapmodellbe 32

Kiterjesztett Markov modell Rövid idej függ ség vizsgálata és így kapunk egy 6 lépcs s kiterjesztett Markov modellt. Ezt a további két állomást úgy kapjuk, hogy felbontjuk azt az id intervallumot, amikor már az egyik fél elhunyt és a másik életben van. El ször nézzük azt, amikor els ként a férj távozik az él k sorából. Ekkor a feleség belép az 1 jelzés állapotba és ott marad mindaddig, amíg a haláltól eltelt id 0-tól nagyobb, de kisebb, mint egy adott t y id tartam. Miután letelt a t y id és még mindig életben van a n, akkor átkerül a 2-es jelzés állapotba, ahol egészen addig marad, amíg meg nem hal. Másodszor tekintsük azt az esetet, amikor a feleséget éri utol el bb a halál. Ilyenkor a férj kerül a 3-as jelzés állapotba és egészen addig ott marad, amíg a feleség halála óta eltelt id 0 és t x között van. Amikor az id átlépi t x -et a fér átkerül a 4 jelzés állapotba és mindaddig ottmarad, amíg véget nem ér az élete. Értelemszer en az 1 és 3 jelzés állapotból kerülhetünk a végállapotba, amikor a férj és a feleség sem él tovább, mint a halál után eltelt adott id tartam. Valamint nem tehet fel, hogy t x = t y, ugyanis ez a törött szív két külön tulajdonsága a féraknál és a n knél. 3.2. ábra. 33

A paraméterek becslése Rövid idej függ ség vizsgálata A kiterjesztett modell így a következ hazárdfüggvényekkel rendelkezik: µ 01 (t) = µ 1 (x + t T y > t) = (1 α 01 )µ 1 (x + t); µ 03 (t) = µ 2 (y + t T x > t) = (1 α 03 )µ 2 (y + t); µ 15 (t) = µ 2 (y + t 0 t T x < t y ) = (1 + α 15 )µ 2 (y + t); µ 25 (t) = µ 2 (y + t t T x > t y ) = (1 + α 25 )µ 2 (y + t); µ 35 (t) = µ 1 (x + t 0 t T y < t x ) = (1 + α 35 )µ 1 (x + t); µ 45 (t) = µ 1 (x + t t T y > t x ) = (1 + α 45 )µ 1 (x + t); ahol α 01, α 03, α 15, α 25, α 35, α 45 0 adott paraméterek. Ennek a kiterjesztett modellnek az eredeti speciális esete, ha α 15 = α 25 = α13 és α 35 = α 45 = α23. 3.3. A paraméterek becslése Tegyük fel, hogy a perem hazárdfüggvényeket a Gompertz-eloszlásból kaptuk, amit már korábban deniáltunk. Ekkor ezek a következ alakúak: µ x = 1 x m f σ e f ; µ y = 1 e y mn σn, σ f σ n ahol m f és m n a férj és a feleség életkorának várható értékét,valamint σ f és σ n a férj és a feleség élettartamának szórását jelöli. Ezeket a paramétereket könnyen megadhatjuk a maximum likelihood becsléssel. Az α paramlétereket szintén maximum likelihood módszerrel becsülhetjük. Legyen a vizsgálatban résztvev n k száma n, míg a féraké m. Jelölje az egyes állapotokba belépés korát b, míg az onnan kilépését k. Ez alapján kapjuk, hogy ha a 0. állapotban vagyunk, akkor az 1.-be és a 3.-ba jutáshoz az α-k a következ ek: α 01 = 1 i=1 b(i) d 01 ; α 03 = 1 k(i) m µ xi dx i d 03, k(i) n µ yi dy i i=1 b(i) ahol d 01 (d 03 ) jelöli a 0. lépcs n a meggyelt férak (n k) halálának számát. A meggyelés azonnal véget ér, ha bekövetkezik az egyik fél halála, vagy cenzorálják az adatokat. A keletkezett hibát a következ formulával kaphatjuk meg: o( α 0j ) = 1 α 0j, j = 1, 3. d0j 34

A modell tesztelése Rövid idej függ ség vizsgálata Nézzük azokat az eseteket, amikor az 1, 2, 3, 4 állapotban vagyunk. Itt jelölje a j. állapotban éppen tartozkodó n k számát n j, a férakét pedig m j, ahol j = 1, 2, 3, 4. Ekkor a paraméterekre a következ becsléseket mondhatjuk: α l5 = n j i=1 b(i) d l5 k(i) µ yi dy i 1; α k5 = m j i=1 b(i) d k5 k(i) µ xi dx i 1, ahol l = 1, 2 és k = 3, 4, valamnt d l5 (d k5 ) jelöli az l. (k.) lépcs ben a meggyelt n k (férak) halálának száma. A keletkezett hibát itt is könnyedén meg tudjuk adni: o( α j5 ) = 1 α j5, j = 1, 2, 3, 4. dj5 A becslésnél látszik, hogy nagyon érzékeny a kor megválasztásától, hiszen az integrálás a belépési kortól a kilépési korig tart. A becslésben általában a belépési korokat a következ intervallumokból vesszük: férak esetén [65, 85], míg n knél [60, 80], ugyanis ezek a leggyakoribb korok, amikor valaki megözvegyül. A meghatározásunk még alapszik a korok közötti függésr l, vagyis az eredmények nagyban függnek a kapcsolattól. 3.4. A modell tesztelése A következ kben teszteljük, hogy a túlél házastárs hazárdfüggvénye szignikánsan függ-e a párja halála óta eltelt id t l. Ezáltal megfogalmazhatunk egy nullhipotézist és egy alternatív (ellen) hipotézist: H 0 : α 15 = α 25 H 1 : α 15 α 25 Ha elfogadjuk H 0 -t, akkor a hazárdfüggvény az 1. és a 2. szinten megegyezik, vagyis a túlélési függvényük ugyanazok, vagy kevés az adatunk ezt cáfolni. Amennyiben elvetjük H 0 -t, akkor arra kapunk statisztikai bizonyítékot, hogy a hazárdfüggvény az 1. és a 2. szinten különbözik, vagyis a túlélési függvényük is eltér. Ezáltal át tudjuk fogalmazni a null- és az ellen hipotézisünket a következ képpen: H 0 : S (y)15 (t) = S (y)25 (t) H 1 : S (y)15 (t) S (y)25 (t), ahol S (y)i5 (t) a túlél házastárs túlélési függvénye y korban az i. állapotban (i {1, 2}). Ugyanígy fogalmazható meg, a másik oldalra, vagyis amikor a feleség hunyt el korábban. 35

A modell tesztelése Rövid idej függ ség vizsgálata Ezek után alkalmazzuk a kétoldali, kétmintás Kolmogorov-Smirnov próbát, ami a következ alakú: D mn = sup S (y)m (t) S (y)n (t), t ahol S (y)m (t) a megfelel Kaplan-Meier függvénye S (y)15 (t)-nek és m a halálok száma, hasonlóan S (y)n (t). Így látszik, hogy a Kolmogorov-Smirnov teszt csak folytonos valószín ségi változóknál használható és az eloszlások közötti eltérésre kérdez rá. A nullhipotézist elvetjük, ha ( ) 1 mn 2 Dmn c m + n, ahol c a kritikus értéket a Kolmogorov eloszlásból nyertük az el re meghatározott terjedelem mellett. 36