Eötvös Loránd Tudományegyetem Természettudományi Kar Fodor Péter Halandósági táblák el rejelzése BSc Szakdolgozat Témavezet : Zempléni András Valószín ségelméleti és Statisztika Tanszék Budapest, 2016
Köszönetnyilvánítás Szeretném megköszönni Zempléni Andrásnak, hogy elvállalta a témavezet i feladatkört, valamint, hogy rendszeres konzultációkkal segítette szakdolgozatom elkészítését. Továbbá köszönettel tartozom feleségemnek és szüleimnek a támogatásukért. 2
Tartalomjegyzék Bevezetés 4 1. Halandósági táblák 5 1.1. Halandósági táblák konstruálása..................... 5 1.2. Simítási módszerek............................ 9 2. Halandósági táblák összehasonlítása 14 2.1. Hasonlósági mér számok......................... 14 2.2. Alkalmazások............................... 15 3. Modellezés és szimuláció 21 3.1. Lee-Carter modell............................. 21 3.1.1. Paraméterek becslése....................... 22 3.1.2. κ t kiigazítása........................... 24 3.1.3. κ t el rejelzése........................... 24 3.2. El rejelzés................................. 25 3.3. Összehasonlítás.............................. 26 4. Összefoglalás 30 3
Bevezetés Szakdolgozatom témájának kiválasztásakor arra törekedtem, hogy olyan témát válasszak, ami a biztosításmatematikának gyakorlati alkalmazása. Így esett a választásom a halandósági táblák el rejelzésére, ami biztosítótársaságok gyakori feladata. Szakdolgozatom vezérvonala [1] cikk volt, és a f cél a cikkben ismertetett módszerek gyakorlati tesztelése volt, amire az azóta eltelt id adott lehet séget. Az els fejezetben bemutatjuk, hogy a halandósági táblák milyen adatokat tartalmaznak és megmutatjuk hogy a meggyelt adatokból hogyan konstruálhatjuk meg. Majd ismertetünk simítási módszereket amiket nyers adatok kiegyenlítésére használunk. A második fejezetben részletezünk néhány statisztikát amelyekkel összehasonlíthatunk halandósági táblákat. Továbbá összehasonlítjuk a magyar halandósági táblákat múltbeli USA táblákkal és leellen rizzük a 10 évvel ezel tti eredmény használhatóságát. A harmadik fejezetben bemutatjuk a Lee-Carter modellt, mortalitás el rejelzésére. Majd el rejelzést készítünk magyar fér és n i adatokból. Az el rejelzések viszonyáról kapunk képet a két módszer összehasonlítása révén. Az eredményeim megbízhatóságának növelése érdekében a számításokat és az ábrákat R programkörnyezetben készítettem. 4
1. fejezet Halandósági táblák 1.1. Halandósági táblák konstruálása A biztosításmatematika egyik legfontosabb és legnehezebb feladata az, hogy meghatározza egy konkrét biztosítás esetén a biztosítási díjat. Az életbiztosításoknál a díjkalkuláció alapjául a halandósági táblák szolgálnak. A halandósági táblák megadják,hogy 100000 db élve született csecsem b l el reláthatólag hány éli meg az 1, 2, 3... életkort. A táblázat egy ω életévvel ér véget, ami után feltételezzük, hogy mindenki meghal. A táblázat tartalmazza az életkort, ezt jelöljük x-szel, az x életkort elér emberek számát ezt jelöljük l x -el, továbbá azt, hogy egy évben az x-edik és az x + 1-edik életéveik között hány ember halálozott el, ez jelöli d x = l x l x+1. Megmutatjuk, hogy egy fér halandósági táblát hogyan konstruálhatunk meg nyers adatokból (Ezek az adatok fellelhet k a KSH kiadványaiban minden évben). Tudjuk, hogy egy adott évben hány x éves fér volt, ezt jelöljük P x -el. Emellett azt is, hogy hány olyan x éves fér halt meg, aki x-edik születésnapját megérte, jelöljük D x -el, hasonlóan D x-el jelöljük azoknak az x éveseknek a számát akik elhaláloztak az x. születésnapjuk el tt. A szakirodalomban elterjedt Böck-féle módszer a következ értékeken alapul: Ahol p (1) x p (2) x x = P x D x, p (2) x = P x 1 D x 1 D x 1 P x P x 1 D. x 1 p (1) annak a valószín sége, hogy az x évesek betöltik az x. születésnapjukat, annak a valószín sége, hogy azok az x 1 évesek, akik betöltötték az x 1. szü- 5
letésnapjukat megérik az x. évüket. Legyen p x = p (1) x p (2) x túlélési valószín ség, azaz p x annak a valószín sége, hogy egy x 1 éves fér legalább egy évet él még. Ezekb l a halandósági tábla x-edik évre vonatkoztatott nyers halálozási valószín ségei a következ módon származtathatóak: q x = 1 p (1) x p (2) x. A q x annak a valószín sége, hogy egy x 1 éves fér meghal egy éven belül. El fordul, hogy nagyok a különbségek a közel azonos korúak valószín ségei között és néhol olyan is, hogy a atalabbak nagyobb valószín séggel halnak meg. Ez lehet véletlen vagy az adatok hibás felvétele miatt. Ekkor a nyers valószín ségeket célszer simítani. A hibák kiegyenlítésére interpolációs és extrapolációs módszereket használunk az alábbiak szerint(vázlatosan): 1. 0-3 éves életkorokban nincs kiegyenlítés 2. 4-15 éves életkorokban analitikus kiegyenlítés: negyedfokú polinommal, Jordan féle ortogonális polinomok alkalmazásával. 3. 15-75 éves életkorokban mechanikus módszerrel, ami egy Karup által módosított Newton-interpoláció. 4. 75 éves kor fölött pedig Gompertz-Makeham függvény illesztéssel, King-Hardy féle csoportképzési eljárással. Ezen simítási módszerek segítségével a nyers valószín ségekb l megkapjuk a q x kiegyenlített halálozási valószín ségeket. Egy halandósági tábla a nyers valószín ségeket csak 84 éves korig tartalmazza, 84 év fölött extrapolációval történik a Gompertz eloszlás illesztése. Ezek az életkorok annyira nem fontosak, mert ritkán fordulnak el a biztosítási gyakorlatban. Ezután kiindulásként vegyünk l 0 = 100000 darab ktív élveszületett csecsem t. Az l x halandósági függvény értékeit a következ képp számítjuk ki: l x = (1 q x )l x 1 x = 1, 2,..., ω (ezeket egészre kerekítjük). A tábla d x oszlopa a következ képpen határozható meg : d x = l x l x 1. Ezekb l az adatokból több, a biztosítóknak fontos valószín séget számíthatunk ki: Egy x éves fér még minimum k évig fog élni: 6
kp x = l x+k /l x Egy x éves fér az x + k-edik és az x + k + 1-edik életévei között halálozik el: Egy x éves fér meghal k éven belül: k 1q x = d x+k /l x kq x = 1 k p x = (l x l x+k )/l x A tábla tartalmaz még további két adatot: az x éves férak várható hátralév élettartamát és az élettartamainak szórását. A várható hátralev élettartamot a következ képp számítjuk ki: Egy y 1,..., y m adatsor statisztikai várható értéke az adatok átlaga, amit E-vel jelölünk: E = y 1 + y 2 + + y m. m Például újszülött csecsem k várható élettartamát úgy számoljuk ki, hogy 100000 élve született csecsem életét végigkísérjük és feljegyezzük, hogy hány évet éltek(ez legyen y 1 + y 2 + + y 10000 ) és ezeknek vesszük az átlagát: y 1 + y 2 + + y 100000. 100000 Hasonlóan számítjuk ki egy x éves fér várható élettartamát. x éves férb l l x van összesen, akik y 1 + y 2 + + y lx y 1 + y 2 + + y lx évesen halnak meg, vagyis várható életkoruk az évek átlaga. Az átlagban x + 1, x + 2,..., ω 1, ω, ω + 1 évek szerepelnek(ha egy fér i és i + 1 éves kora között hal meg, akkor i + 1-et veszünk). Ekkor x + 1 d x -szer,x + 2 d x+1 -szer,..., ω d ω 1 -szer és az ω + 1 d ω -szer szerepel, vagyis a várható élettartam becslése: E x = y 1 + y 2 + + y 100000 100000 Mivel d x = l x l x+1 (ha x < ω) és d ω = l ω, ezért = 1 l x ( (x+1)d x +(x+2)d x+1 + +ωd ω 1 +(ω +1)d ω ). E x = x + l x + l x+1 + + l ω 1 + l ω l x. Így egy x éves fér várható hátralev élettartam becslése lx+l x+1+ +l ω 1 +l ω l x. Mivel a számításoknál az elhalálozási életkort mindig felfelé kerekítettük, pontosabb képletet kapunk, ha csökkentjük 1/2 évvel. Vagyis a hátralev várható élettartam: 7
e 0 x = l x + l x+1 + + l ω 1 + l ω l x 1 2. A statisztikai szórás megmutatja, hogy y 1,..., y m számok átlagosan mennyivel térnek el az E = y 1 + y 2 + + y m m σ = várható értékt l, ezt jelöljük σ-val: 1 m m (y i E) 2 i=1 Bár m 1-gyel osztva kapunk torzítatlan becslést a szórásnégyzetre a nagy m érték és a kényelmesebb számolási mód miatt a szakirodalom így deniálja. Ebben a képletben az (y i E) 2 az adatok négyzetes eltérése az E átlagtól, vagyis 1 (y m m i E) 2 az adatok átlagos négyzetes eltérése E-t l, ez a szórásnégyzet, aminek a négyzetgyöke a szórás. A szórásnégyzetet így egyszer síthetjük: Legyen µ 2 = 1 m σ = µ E 2. m i=1 σ 2 = 1 m = 1 m = 1 m m (y i E) 2 = 1 m (yi 2 2Ey i + E 2 ) m i=1 m yi 2 2E 1 m y i + 1 m E 2 m m i=1 i=1 i=1 m yi 2 2E 2 + E 2 = 1 m yi 2 E 2. m i=1 i=1 i=1 yi 2, az adatok négyzetes átlaga. Vagyis a szórás rövidebb alakja: Ezek alapján kiszámoljuk l x darab x éves fér életkorának négyzetes átlagát a következ képp: i=1 µ x = y2 1 + + yl 2 x l x = 1 ( ) (x + 1) 2 d x + (x + 2) 2 d x+1 + + ω 2 d ω 1 + (ω + 1) 2 d ω l x Mivel d x = l x l x+1 (ha x < ω) és d ω = l ω, ezért µ x = x 2 + 1 l x ( (2x + 1)l x + (2x + 3)l x+1 + + (2ω 1)l ω 1 + (2ω + 1)l ω ). Vagyis σ x = µ x E 2 x érték megadja az x éves férak élettartamainak szórását. 8
1.1. ábra. 2011-es magyar fér nyers(szaggatott) és kiegyenlített(folytonos) halálozás 1.2. Simítási módszerek Az el z alfejezetben említettük, hogy el fordul a nyers halálozási valószín ségeknél, hogy nagy különbségek vannak a közel azonos korúak között, s t olyan is el fordulhat, hogy az öregebbek kisebb valószín séggel halnak meg. Ennek több oka lehet: véletlen, hibás adatfelvétel vagy bizonyos korcsoportokra ez jellemz (például a csecsem knél nagyobb az érték, mivel nekik még gyengébb az immunrendszerük). Ezért célszer a nyers valószín ségeket simítani. A 0-3 év közötti korcsoportra nem alkalmazunk kiegyenlítést. A nagy és gyors változás miatt minden módszer torzítana és a valóságot teljesen elferdítené. A 4-15 éves korcsoportot analitikus kiegyenlítéssel, negyedfokú polinommal, Jordan féle ortogonális polinomok alkalmazásával simítjuk az alábbiak szerint. Feltételezzük, hogy az észlelt függvény menetét a következ alakú q x = a 0 + a 1 x + a 2 x 2 + a 3 x 3 + a 4 x 4 negyed fokú parabola ívvel tudjuk leírni, akkor a probléma az a 0, a 1, a 2, a 3, a 4 paraméterek meghatározására redukálódik. 9
A parabola együtthatóit a legkisebb négyzetek módszerével határozhatjuk meg, ami megköveteli, hogy a nyers és a kiegyenlített értékek eltéréseinek négyzetösszege minimális legyen, vagyis: 15 S = (q x q x ) 2 = minimum. x=4 A minimumhoz szükséges feltételek a következ k: S a i = 0 i = 0, 1, 2, 3, 4. Az így nyert 5 egyenlet meghatározza a 0, a 1, a 2, a 3, a 4 ismeretleneket. Ennek a korosztálynak a kiegyenlítését az (1.1)-es ábrán láthatjuk. A 15-75 évek értékeit két ütemben végzett mechanikus eljárással egyenlítjük ki. Els lépésben 5 éves egyenl távolságú korokra úgynevezett f pontokat határozunk meg a nyers adatokból. Második lépésben a f pontok közötti 4 értéket a Karup-féle eljárással állapítjuk meg. A f pontokat Newton-interpolációs képletével számítjuk ki az alábbiak szerint: q x+5 = Z x + Z x 0, 04 2 Z x (1.1) ahol Z x = q x 2 + q x 1 + q x + q x+1 + q x+2 5 Z x = Z x+5 Z x 2 Z x = Z x+5 Z x Ha az 1.1-es képletben a különbségeket feloldjuk és x + 5 életkorról áttérünk x-re, akkor megkapjuk a gyakorlatban használt képletet: q x = 1, 08Z x 0, 04(Z x 5 + Z x+5 ) ahol x = 15, 20, 25,..., 75. A közbees értékek kiszámítására a következ Karup-féle formulák szolgálnak: q x+1 = 0, 00256Z x 10 0, 1056Z x 5 + 0, 9808Z x + 0, 1456Z x+5 0, 024Z x+10 + 0, 00064Z x+15 q x+2 = 0, 00288Z x 10 0, 1056Z x 5 + 0, 7376Z x + 0, 432Z x+5 0, 0688Z x+10 + 0, 00192Z x+15 q x+3 = 0, 00192Z x 10 0, 0688Z x 5 + 0, 432Z x + 0, 7376Z x+5 0, 1056Z x+10 + 0, 00288Z x+15 q x+4 = 0, 00064Z x 10 0, 024Z x 5 + 0, 1456Z x + 0, 9808Z x+5 0, 1056Z x+10 + 0, 00256Z x+15 10
1.2. ábra. 2011-es magyar fér nyers(szaggatott) és kiegyenlített(folytonos) halálozás 11
Ennek a korosztálynak a kiegyenlítését az (1.2)-es ábrán láthatjuk. Exponenciális függvénnyel a halandósági táblát csak olyan intervallumban lehet kiegyenlíteni, ahol a feltételezés szerint a halálozási intenzitás monoton növekv en változik a korral. Ez a hipotézis 75 év felett elfogadható. Így 75 év felett Gompertz- Makeham függvény illesztésével simítunk. Feltételezésünk szerint l x kifejezhet az x életkor függvényében a következ képpen: l x = ks x e cx. A paraméterek meghatározása céljából az el bbi képlettel kifejezzük p x továbbélési valószín séget: l x = ks x e cx ; l x+1 = ks x+1 e cx+1 p x = l x+1 l x = Se (c 1)cx A gyakorlati számításokat megkönnyítve logaritmáljuk az 1.2 egyenletet: (1.2) Legyen a = log S, b = c 1 vagyis: log p x = log S + (c 1)c x log p x = a + bc x (1.3) Az a, b és c paraméterek meghatározására az úgynevezett King-Hardy csoportképzési eljárást és a legkisebb négyzetek elvén alapuló eljárást alkalmazzuk. A számításoknál használt képletek a következ k : H 1 = 79 x=75 Ebb l már c kiszámítható. log p x ; H 2 = 84 x=80 c 5 = H 3 H 2 H 2 H 1. log p x ; H 3 = 89 x=85 log p x B = 89 x=75 a = A = H 1 + H 2 + H 3 c x ; C = 89 x=75 AC BD 15C B 2 c 2x ; D = 89 x=75 15D AB ; b = 15C B 2 12 c x log p x
1.3. ábra. 2011-es magyar fér nyers(szaggatott) és kiegyenlített(folytonos) halálozás Ezekb l megkapjuk a-t és b-t. Ismerve az összes paramétert az 1.3 képlet alapján megkapjuk a kiegyenlített továbbélési valószín ségek logaritmusait (log p x ), amib l már könnyen meghatározhatóak p x -ek, amib l meghatározható a kiegyenlített halálozási valószín ségek q x = 1 p x. A 1.3 képlet a 75-89 évek nyers adatainak kiegyenlítése mellett még arra is lehet séget ad, hogy a további évek elhalálozási valószín ségeit extrapoláljuk és így a halandósági táblákat 100 éves korig b víthetjük. Ennek a korosztálynak a kiegyenlítését az (1.3) ábrán láthatjuk. 13
2. fejezet Halandósági táblák összehasonlítása 2.1. Hasonlósági mér számok A f kérdés az az, hogy hogyan mérjük a hasonlóságot a halandósági táblák között. Ebben a fejezetben megvizsgáljuk a hasonlósági mér számokat, amelyekkel jellemezhetjük a halandósági táblákat. A Society of Actuaries f oldalán található számos halandósági tábla, ezeken kívül a Központi Statisztikai Hivatal halálozási tábláit használjuk forrásként. Jelöljük a közelíteni kívánt táblát q 1 -el és elemeit q i1 -el. Az els statisztika, melyet részletezünk a súlyozott négyzetes szórás (QDEV ) : N P i (q i1 q i0 ) 2 QDEV =, (2.1) q i0 i=k ahol P i az i évesek számát jelöli, q 0 pedig az a választott tábla, amit a közelítésre jelöltünk ki (ennek elemeit q i0 -val jelöljük). K és N pedig az els és utolsó év amiket a rendelkezésre álló adatokhoz és a probléma megoldásához alkalmasan tudunk választani. Ennek a statisztikának a határeloszlása khi-négyzet, vagyis egy statisztikai teszt a két tábla egyenl ségére az N K + 1 szabadságfokú khi-négyzet eloszlás kritikus értékeire alapozhat. Habár, ezek az értékek a gyakorlatban a halandósági tábláknak mindig statisztikailag szignikánsak. De ez nem egészen ugyanaz, mint a gyakorlatban is lényeges eltérés, ami azt jelentené, hogy a két tábla nem felcserélhet gyakorlati számításokhoz. A következ statisztikák alkalmasabbak a gyakorlatban is lényeges eltérés kimutatására. 14
A következ két statisztika megtalálható Mitchell és McCarthy cikkében [6]. Az els alternatíva az úgynevezett A/E statisztika, a következ képp megadva: N l i0 q i1 A/E = 100 ERL = 100 i=k, (2.2) N l i0 q i0 ahol l i0 annak a valószín sége, hogy az i. évben még él a közelít tábla szerint, azaz l i+1,0 = l i0 (1 q i0 ) és l K0 = 1. Azaz a tagok a nevez ben arányosak a népességben az adott életkorra becsült halálozások számával, míg a számláló hasonló mennyiséget ad, ami a közelít tábla népesség eloszlásán és a vizsgált tábla által meghatározott kockázatokon alapszik. Úgy is értelmezhet mint egy Laspeyres index, ahol a két adatsor (q i1, q i0 ), a súlyokat(l i0 ) az alap táblából véve. A várható hátralev élettartamot a következ képpen deniálhatjuk: N l i1 0.5 i=k i=k, (2.3) N l i0 0.5 ahol l K0 = l K1 = 1. (2.3)-as formula megadja a várható hátralev élettartamok arányát(k. évvel kezdve az N.-évig) a két tábla között.a 100-as szorzó miatt százalékban kapjuk meg a hányadost. Annak ellenére, hogy a f érdekeltség (különösen a járulékok) az id sebb korosztály halandóságában rejlik, az együtthatókat K = 20,K = 30,N = 60 és N = 70 választással használjuk. Egy tipikus biztosító társaságnak rendelkezésére állnak az adatok ebben az intervallumban. i=k 2.2. Alkalmazások Ebben a fejezetben a fenti módszerekre mutatunk alkalmazást. Aktuális magyar halandósági táblákat hasonlítunk össze múltbeli USA halandósági táblákkal. Itt az illeszkedés általában nem olyan jó a biztosítótársaságok járandósági tábláihoz, de mi még megfelel illeszkedést kapunk. Számos táblát kipróbáltunk mint lehetséges közelítés, de az eredmények alapján(és a [1] cikk szerint is) ezeket találtuk a legjobbnak. 15
2.1. ábra. Magyar fér halandóság (2000.év,folytonos) és az USA fér halandóság (1950.év,szaggatott) összehasonlítása 16
2.2. ábra. Magyar fér halandóság (2010.év,folytonos) és az USA fér halandóság (1960.év,szaggatott) összehasonlítása 17
Az 2.1-es ábrán láthatjuk a 2000. évi magyar fér halandósági ráta és az 1950. évi USA fér halandósági ráta összehasonlítását. Különösen a jobb fels ábrából látszik(ahol a referencia az USA-beli halandóság), hogy a magyar adatok kisebb halálozást mutatnak 20 és 40 év között, míg 40 és 60 között és 90 fölött nagyobb halálozást mutatnak. Viszont, 60 és 90 év között az illeszkedés nagyon jó (és például a nyugdíjszámítás esetén ezek a legfontosabb korok). A 2.2-es ábrán hasonló összehasonlítást láthatunk mint a 2.1-esen csak a magyar adatokat 2010. évb l az USA adatokat pedig 1960. évb l vettük. Látszik, hogy itt már kevésbé jó az illeszkedés, mivel a magyar halandóság nagyobb mértékben csökkent. Itt a magyar halandóság kisebb 45 év alatt, 90 év fölött nagyobb, míg 45-90 év közötti korosztálynál kapunk jó illeszkedést. A 2.3-es ábrán összehasonlítottuk 2000. évi magyar n i halandósági rátát és az 1970. évi USA n i halandósági rátával. Ezen az ábrán is a halálozási ráták arányából láthatjuk, hogy 20 és 40 év között a magyar halálozási ráta kisebb, míg 90 év fölött nagyobb halálozást mutat. Emellett 40 és 90 év között jó illeszkedést kapunk, kivéve a 76-78 éveseknél, ott a magyar halandósági ráta kicsit megugrik, amit szintén láthatunk a jobb alsó ábrából. A 2.4-es ábrán a 10 évvel kés bbi összehasonlítást láthatjuk. Mindkét halandósági ráta csökkent közel azonos mértékben, kivéve 40-50 év között, ott a magyar adatok jobban csökkentek. Vagyis itt csak az 50-90 közötti korosztálynál kapunk jó illeszkedést. Az alábbi táblázatban láthatjuk a statisztikák értékeit, magyar táblákat közelítve USA táblákkal Magyar tábla USA tábla QDEV(30,70) A/E(30,70) ERL(30,70) ERL(20,60) fér,2000 fér,1950 964,7867 112,9041 102,0939 100,0717 fér,2010 fér,1960 947,9737 90,46882 98,29569 97,98171 n i,2000 n i,1970 127,5261 97,59053 99,6666 99,37032 n i,2010 n i,1980 282,8437 94,06687 99,51969 99,30953 18
2.3. ábra. Magyar n i halandóság (2000.év,folytonos) és az USA n i halandóság (1970.év,szaggatott) összehasonlítása 19
2.4. ábra. Magyar n i halandóság (2010.év,folytonos) és az USA n i halandóság (1980.év,szaggatott) összehasonlítása 20
3. fejezet Modellezés és szimuláció Ebben a fejezetben az a célunk, hogy úgy modellezzük a halandóságot, hogy a modell alapján el rejelzést is tudjunk készíteni. Ezt az el rejelzést össze tudjuk hasonlítani az el z fejezetben látott, analógián alapuló módszer eredményeivel. Ilyen módszer a Lee-Carter modell, melyet a következ alfejezetben bemutatunk. 3.1. Lee-Carter modell A módszert Ronald D.Lee és Lawrence R.Carter publikálta 1992-ben. Amerikai mortalitási rátákat modelleztek, amely során egy extrapolatív módszert találtak ki és alkalmaztak. A modellt korévenként kett (α x, β x ) és a meggyelt id pontonként (κ t ) egy paraméter írja le. Lee és Carter modelljét a következ formula adja meg: q x,t = e αx+βxκt+ɛx,t. Amelyben q x,t egy x éves ember t. id szakra vonatkozó halálozási rátáját adja meg, α x a mortalitási ráta alapértéke, β x és κ t az id t l való függés er sségét, ɛ x,t pedig a hibatag. Az egyenletet logaritmáljuk és kapjuk a következ egyenletet: log q x,t = α x + β x κ t + ɛ x,t (3.1) A Lee-Carter modell a következ 3 lépésb l áll: 1. A modell paramétereit becsüljük 2. A modellezett halálozások számát a meggyelt halálozások számához igazítjuk 21
3. El rejelzést készítünk a mortalitási rátákra vonatkozóan. A Lee-Carter modell túlparaméterezett abban az értelemben, hogy invariáns az alábbi transzformációkra: {α x, β x, κ t } {α x, β x /c, κ t c} {α x, β x, κ t } {α x c β x, β x, κ t + c} Ezért Lee és Carter a következ feltételeket vezette be: N βx 2 = 1, (3.2) x=0 T κ t = 0, (3.3) t=1 ahol T jelöli az évek számát, N pedig a legmagasabb életkor, ami a meggyelésben szerepel. A 3.3 és 3.2 azért szükségesek, hogy a paraméterek egyértelm en meghatározhatóak legyenek. 3.1.1. Paraméterek becslése Els nek becsüljük α x paramétert. Az alábbi függvényt minimalizáljuk 3.2 és 3.3 feltételek mellett: L(α, β, κ) = t,x (log(q x,t ) α x β x κ t ) 2 (3.4) Ekkor L α x = L β x = L κ t = 0 feltételek miatt a következ egyenleteket kapjuk: L = 2 (log(q x,t ) α x β x κ t ) = 0 (3.5) α x t L = 2 (log(q x,t ) α x β x κ t ) κ t = 0 (3.6) β x t L = 2 (log(q x,t ) α x β x κ t ) β x = 0 (3.7) κ t x A 3.5 egyenlet és 3.3 feltétel segítségével kapjuk α paraméter becslését: T α x = t T log q x,t t T β x κ t t T α x = t T log q x,t t 22
Ebb l megkapjuk α x paraméter becslését: α x = 1 T T log q x,t Vezessük be az M mátrixot melyet a következ egyenlettel deniálunk: t M x,t = log q x,t α x = β x κ t Az M mátrix segítségével a következ egyenleteket írhatjuk föl β x és κ t paraméterekre: M x,t κ t = (log q x,t α x ) κ t = (β x κ t ) κ t = β x κ 2 t (3.8) t t t t M x,t β x = (log q x,t α x ) β x = (β x κ t ) β x = κ t βx 2 = κ t (3.9) x x x x Vezessük be a következ jelölést: κ 2 t = b Ezt felhasználva kapjuk a következ egyenleteket: t M κ = b β M T β = κ A második egyenletet M-mel szorozva kapjuk, hogy: (M M T ) β = M κ = b β Vagyis β az M M T mátrix b sajátértékéhez tartozó sajátvektor. Az el bbi összefüggéseket felhasználva L(α, β, κ)-ra a következ ket kapjuk: L(α, β, κ) = (log(q x,t ) α x β x κ t ) 2 = (3.10) t,x = (M x,t β x κ t ) 2 = (3.11) t,x = Mx,t 2 + βx 2 κ 2 t 2 κ t ( β x M x,t ) = (3.12) t,x t,x t x = Mx,t 2 + 1 b 2 κ 2 t = (3.13) t,x t = Mx,t 2 + b 2 b = (3.14) t,x = t,x M 2 x,t b (3.15) 23
Tehát az L(α, β, κ) akkor lesz minimális, ha b maximális. Vagyis β x az M M T mátrix maximális sajátértékéhez tartozó sajátvektor lesz, míg κ t = M T β x. Vagyis a Lee-Carter módszer szerint az így nyert α x paramétereket id független korspecikus paraméterként; a κ t paramétereket pedig korfüggetlen, id függ, látens folyamatként értelmezzük. A β x paraméterek azt fejezik ki, hogy melyik korspeci- kus ráta változik gyorsan vagy lassan a κ t paraméter egy egységnyi változásának hatására. Az ɛ x,t a mortalitási ráták körüli véletlen szerepet jelöli. 3.1.2. κ t kiigazítása Második lépés során a κ t paramétereket igazítjuk ki, hogy a meggyelt és a modellezett halálozások száma minden évben megegyezzen egymással. Erre azért van szükség, mert a modell paramétereinek becslésekor a atal korok halálozási rátái ugyanakkora súlyt kapnak, mint az id s koroké, pedig a atal korok jóval kisebb mértékben járulnak hozzá az összes halálozás számához. A κ t -t helyettesítjük κ t -vel, amelyet a következ egyenletb l egyértelm en meghatározhatunk: ahol D x,t = x x D x,t a t. évben x évesen meghaltak száma, N x,t a t. évben az x évesek száma, β x és α x az els lépésben becsült paraméterek. N x,t exp( α x + β x κ t ) 3.1.3. κ t el rejelzése A Lee-Carter modell nagy el nye, hogy egyetlen id függ paraméter van csak a rendszerben, vagyis a κ t, így a halálozási ráták el rejelzéshez csak ezt a paramétert kell becsülnünk. Lee és Carter arra a következtetésre jutottak, hogy a halálozási ráták el rejelzésénél az alábbi formula tudja a legjobban leírni a κ t jöv beli értékeit: κ t = κ t 1 + θ + η t (3.16) ahol θ az úgynevezett drift-(vagy trend-) paraméter, ami a mortalitás csökkenésének várható tendenciáját, mértékét ragadja meg, 24
η t pedig N(0, δ 2 ) eloszlású hiba. A drift paraméter csak a κ t els és utolsó elemét l függ és a következ képp becsülhet : θ = κ T κ 1 T 1 Továbbá a maximum likelihood módszer a következ becslést adja a hiba varianciájára és a trend sztenderd hibájára: δ 2 = 1 T 1 ( κ t 1 κ t T 1 θ) 2 t=1 SE( θ) = δ T 1 Ha a (T + s)-edik id pontra szeretnénk el rejelezni (ahol T id pontig vannak meg- gyelt adataink), akkor iteratívan behelyettesítve 3.16 egyenletbe a megel z összefüggéseket kapjuk a következ összefüggést: κ T +s = κ T + s θ + s n=1 η T +n A becsült paramétereket felhasználva becsüljük az új M x,t mátrixot, és kiszámoljuk a becsült halálozási rátákat: log q x,t = α x + β x κ t 3.2. El rejelzés Ebben az alfejezetben a Lee-Carter modellt fogjuk használni el rejelzésre. Magyar fér és n i adatokat használunk 1990-2014 évekre és 0-100 éves korosztályokra. A számításokat R programkörnyezetben végeztük és a demography kiegészítést használva készítettük az el rejelzést. A 3.1 ábrán láthatjuk a fér és n i α x paraméterek becslését. Láthatjuk, hogy a vizsgált 25 naptári év azt mutatja, hogy csecsem korban jelent s halálozás van, ami 12 éves korig csökken, utána 20 éves korig egy intenzív növekedés és végül fokozott emelkedés látható. A 3.2 ábrán láthatjuk a fér és n i β x paraméterek becslését. Az els 40 évet er s 25
ingadozás jellemzi, majd a magas érzékenység 60 éves korig csökken. 65 és 80 között láthatunk egy újabb magas érzékenységet. A féraknál kisebb az ingadozás 40 éves korig és 60 fölött csökken trendet mutat minimális hullámzással. A 3.3 ábrán láthatjuk a fér és n i κ t paramétereket, el rejelzést 2020-ig és az el rejelzés 0,8-as kondencia tartományának határait. A κ t 1990 és 2014 között kis ingadozással csökken trendet mutat és az el rejelzés alapján tovább fog csökkenni. A 3.4-es ábra mutatja az q x,2010 -es halálozási rátákat és a 2020-ra el rejelzett q x,2020 adatokat férak és n k esetében. Láthatjuk, hogy mind a férak mind a n k esetében csökkenni fog a mortalitás az el rejelzésünk alapján. 3.3. Összehasonlítás Ebben a fejezetben az el rejelzett magyar mortalitás segítségével készítünk összehasonlítást az amerikai múltbeli adatokkal a 2.2-es fejezethez hasonlóan. A 3.5-ös és 3.6-os ábrákon láthatjuk a fér és n i adatokra az összehasonlítást. A fér- aknál és a n knél is csökken tendenciát mutat az arány az id múlásával. A féraknál a magyar adatok minden korban alacsonyabbak, míg a n knél is az 50-65 éves korosztály kivételével ugyanez a meggyelés igaz. 26
3.1. ábra. fér(folytonos) és n i(szaggatott) α x paraméterek 3.2. ábra. fér(folytonos) és n i(szaggatott) β x paraméterek 27
3.3. ábra. fér és n i κ t paraméterek 3.4. ábra. fér és n i q x,2010 (szaggatott) halálozási ráták és q x,2020 (folytonos) Lee- Carter el rejezés 28
3.5. ábra. Magyar és USA fér mortalitások aránya 2020/1970(pontozott);2010/1960(szaggatott);2000/1950(folytonos) 3.6. ábra. Magyar és USA n i mortalitások aránya 2020/1990(pontozott);2010/1980(szaggatott);2000/1970(folytonos) 29
4. fejezet Összefoglalás A szakdolgozat els fejezetében megmutattuk, hogy nyers adatokból hogyan konstruálhatunk meg egy halandósági táblát, majd bemutattunk simítási módszereket nyers adatok kiegyenlítésére. A második fejezetben összehasonlítottunk aktuális magyar és múltbeli USA halandósági táblákat (az [1]-es cikk mintájára) és megnéztük, a cikkhez képest 10 évvel kés bbi adatok összehasonlítását és azt kaptuk eredményül, hogy a halálozási ráták aránya csökkent és még jobb közelítést kaptunk. Végül a harmadik fejezetben ismertettük a Lee-Carter modellt, amely segítségével el rejelzést készítettünk. Az el rejelzés felhasználásával csináltunk egy újabb összehasonlítást, ami azt mutatta, hogy a halálozási ráták aránya csökkent az id múlásával, mivel a magyar mortalitás nagyobb csökkenést mutatott, viszont az illeszkedés rosszabb lett. 30
Irodalomjegyzék [1] Arató Miklós, Bozsó Dávid, Elek Péter, Zempléni András: Forecasting and simulating mortality tables-mathematical and computer modelling. 49(2009) 805-813. [2] Pallós Emil, Magyarország halandósági táblái. KSH Népességtudományi Kutató Intézet Közleményei, 34. sz. Budapest, 1974/2. [3] Szabó László Imre, Viharos László: Az életbiztosítás alapjai. Szeged, 2001. [4] Ronald D. Lee, Lawrence R. Carter Modelling and Forecasting U.S mortality.journal of the American Statistical Association, 87(419), 1992 szeptember, 659-671 [5] Májer István, Dr.Kovács ErzsébetÉlettartam-kockázat-a nyugdíjrendszerre nehezed egyik teher, Statisztikai szemle, 89.évfolyam, 7-8. szám, 2011 [6] O.S Mitchell, D.G. Mcarthy,Estimating international adverse selection in annuities, North American Actuarial Journal 6(4), 2002, 38-54 31
NYILATKOZAT Név: Fodor Péter ELTE Természettudományi Kar, szak: Matematika BSc NEPTUN azonosító: YOG9M2 Szakdolgozat címe: Halandósági táblák el rejelzése A szakdolgozat szerz jeként fegyelmi felel sségem tudatában kijelentem, hogy a dolgozatom önálló munkám eredménye, saját szellemi termékem, abban a hivatkozások és idézések standard szabályait következetesen alkalmaztam, mások által írt részeket a megfelel idézés nélkül nem használtam fel. Budapest, 2016. május 31. a hallgató aláírása