A Lee-Carter módszer magyarországi alkalmazása Baran Sándor, Gáll József, Ispány Márton, Pap Gyula Alkalmazott Matematika és Valószínűségszámítás Tanszék, Debreceni Egyetem, Informatikai Kar 1
Feladatok: hazai mortalitási adatokra a Lee-Carter modell illesztése előrejelzés, Lee-Carter variánsok vizsgálata, CI, (becslési) hibák Jelölések: m x,t : halálozási ráta (Demográfiai Évkönyv) x: életkor (1,..., 100) t: év (1949-2003) 2
Lee-Carter módszer: Lee, R. D., and Carter, L. R. 1992. Modelling and forcasting the time series of U.S. mortality, Journal of the American Statistical Association 87, no. 419 (September): 659-671. Lee, R. D. 2000. The Lee-Carter method for forcasting mortality, with various extensions and applications, North American Actuarial Journal 4, no. 1: 80-91. Booth, H., Maindonald, J., and Smith, L. 2002. Age-time interactions in mortality projection: applying Lee-Carter to Australia, Working Paper, The Australian National University Renshaw, A. E., and Haberman, S. 2003. Lee-Carter mortality forcasting with age-specific enchancement, Insurance: Mathematics and Economic 33: 255-272. 3
Lee-Carter modell: ln(m x,t ) = a x + b x k t + ε k,t a x : életkori,,fő összetevő k t : halálozási szint a t évben, b x : érzékenység az x életkorban ε x,t N (0, σ ε ): hiba ln(m x,t ) t = b x k t t, 4
Nem egyértelmű paraméterek: a x + b x k t = (a x cb x ) + b x (k t + c), a x + b x k t = a x + (cb x )(k t /c), Feltételek: N x=1 b x = 1, T t=1 k t = 0 5
Paraméterek becslése: â x = 1 T T t=1 ln(m x,t ) M = ( M x,t ) M x,t := ln(m x,t ) â x ˆb x és ˆk t : SVD (szinguláris felbontás) az M-re, azaz: M = UDV, ˆb x = 1 c U x,1, ˆk t = cd 1,1 V 1,t, ahol c = N x=1 U x,1 6
Illesztés és előrejelzés: ˆk t idősorra illesztés (ARIMA), ˆk t, majd mortalitás előrejelzés: ˆm x,t = exp ( ) â x + ˆb xˆk t Megjegyzés: T t=1 ˆk t = 0, ˆk t tipikusan csökkenő, ha ˆb x < 0 akkor a ráta növekvő! Két illesztés: 55 év (1949 2003) és 15 év (1989 2003) alapján 7
â x, férfiak 0 Férfiak 1 1949 2003 2 1989 2003 3 4 a x 5 6 7 8 9 0 10 20 30 40 50 60 70 80 90 100 Életkor 8
â x, nők 0 Nök 1 1949 2003 2 1989 2003 3 4 a x 5 6 7 8 9 0 10 20 30 40 50 60 70 80 90 100 Életkor 9
ˆb x, férfiak 0.14 Férfiak 0.12 0.1 0.08 1949 2003 1989 2003 0.06 b x (1) 0.04 0.02 0 0.02 0.04 0.06 0 10 20 30 40 50 60 70 80 90 100 Életkor 10
ˆb x, nők 0.04 Nök 0.035 0.03 0.025 1949 2003 1989 2003 0.02 b x (1) 0.015 0.01 0.005 0 0.005 0 10 20 30 40 50 60 70 80 90 100 Életkor 11
További szinguláris értékek használata: M = U DV b (1) x, b (2) x, b (3) x,... k t (1), k t (2), k t (3),... becsléseik: ahol c i = N x=1 U x,i ˆb (i) x = 1 c i U x,i, ˆk (i) t = c i D i,i V i,t, előrejelzés: ˆm x,t = exp â x + i ˆb x (i) ˆk t (i) 12
Halálozási szintek (indexek): férfiak (k (1) t, k (2) t, k (3) t ) 30 20 10 0-10 KTF1 KTF2-20 KTF3 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 Sequence number 13
Halálozási szintek (indexek): nők (k (1) t, k (2) t, k (3) t ) 80 60 40 20 0-20 KTN1-40 KTN2-60 KTN3 1 7 13 19 25 31 37 43 49 55 4 10 16 22 28 34 40 46 52 Sequence number 14
Idősorok illesztése a halálozási szintekre, példa: k t (1) esete, autokorreláció: KTF1 1,0,5 0,0 -,5 Confidence Limits ACF -1,0 Coefficient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Lag Number 15
k (1) t esete, parciális autokorreláció: KTF1 1,0,5 0,0 -,5 Confidence Limits Partial ACF -1,0 Coefficient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Lag Number 16
k (1) t elsőrendű differenciái, autokorreláció: KTF1, diff(1) 1,0,5 0,0 -,5 Confidence Limits ACF -1,0 Coefficient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Lag Number Transforms: difference (1) 17
k (1) t elsőrendű differenciái, parciális autokorreláció: KTF1, diff(1) 1,0,5 0,0 -,5 Confidence Limits Partial ACF -1,0 Coefficient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Lag Number Transforms: difference (1) 18
k t (1) -re illesztett néhány (legjobb) modell összefoglalása: ARIMA AIC SBC P (konstans) P (paraméter) (0,1,0) 97,63 99,62,000015 (1,0,0) 124,45 126,45,000 (0,1,1) 95,91 99,89,000,0617 (1,1,0) 95,67 99,65,000,0529 19
Az elfogadott modellek: 55 év esetén ˆk (1) : ARIMA(0,1,0), negatív konstanstag, ˆk (2) : az elsőrendű diff. fehér zaj, ˆk (3) : ARIMA(0,1,0) (férfiak), ARIMA(1,0,0) (nők) 15 év esetén ˆk (1) : ARIMA(0,1,0), negatív konstanstag, ˆk (2) : ARIMA(1,0,0) (férfiak), fehér zaj (nők), ˆk (3) : fehér zaj, 20
További kérdések, megjegyzések: intervallum becslés, hibák: ln(m x,t+s ) = â x + α x + (ˆb x + β x )(ˆk t+s + u t+s ) + ε x,t+s β x szórásbecslése: bootstrap, kevés adat, M véletlenítése, majd SVD kicsi mintaméret, nagy szórások!!! 21
Előrejelzések: 1. modell: az eredeti Lee-Carter (1 szinguláris érték használata), 2. modell: 2 szinguláris érték használata, 3. modell: 3 szinguláris érték használata 22
55 (minta)év esetén, 25 éves férfi: 4 x 10 3 25 éves férfi 3.5 megfigyelt adatok Halálozási ráta 3 2.5 2 1. modell 2. modell 3. modell 1.5 1 0.5 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 23
55 (minta)év esetén, 50 éves férfi: 0.03 50 éves férfi 0.025 megfigyelt adatok 1. modell Halálozási ráta 0.02 0.015 2. modell 3. modell 0.01 0.005 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 24
55 (minta)év esetén, 75 éves férfi: 0.1 75 éves férfi Halálozási ráta 0.095 0.09 0.085 0.08 megfigyelt adatok 1. modell 2. modell 3. modell 0.075 0.07 0.065 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 25
55 (minta)év esetén, 25 éves nő: 3 x 10 3 25 éves nö 2.5 megfigyelt adatok 1. modell Halálozási ráta 2 1.5 1 2. modell 3. modell 0.5 0 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 26
55 (minta)év esetén, 50 éves nő: 7.5 x 10 3 50 éves nö Halálozási ráta 7 6.5 6 5.5 megfigyelt adatok 1. modell 2. modell 3. modell 5 4.5 4 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 27
55 (minta)év esetén, 75 éves nő: 0.09 75 éves nö 0.08 megfigyelt adatok 1. modell Halálozási ráta 0.07 0.06 2. modell 3. modell 0.05 0.04 0.03 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 Évek 28
15 (minta)év esetén, 25 éves férfi: 1.8 x 10 3 25 éves férfi 1.6 1.4 1.2 megfigyelt adatok 1. modell 2. modell Halálozási ráta 1 0.8 0.6 0.4 0.2 0 1990 1995 2000 2005 2010 2015 2020 2025 2030 2035 2040 Évek 29
15 (minta)év esetén, 50 éves férfi: 0.017 50 éves férfi 0.016 0.015 0.014 megfigyelt adatok 1. modell 2. modell Halálozási ráta 0.013 0.012 0.011 0.01 0.009 0.008 1990 1995 2000 2005 2010 2015 2020 2025 2030 2035 2040 Évek 30
15 (minta)év esetén, 75 éves férfi: 0.085 75 éves férfi 0.08 megfigyelt adatok 1. modell Halálozási ráta 0.075 0.07 2. modell 0.065 0.06 0.055 1990 1995 2000 2005 2010 2015 2020 2025 2030 2035 2040 Évek 31
55 év esetén, minden életkorra Férfiak 0.15 Halálozási ráta 0.1 0.05 0 80 60 40 Életkor 20 0 1960 1980 Évek 2000 2020 2040 32
15 év esetén, minden életkorra Férfiak Halálozási ráta 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 80 60 40 Életkor 20 0 1990 2000 2010 Évek 2020 2030 2040 33