Magyar halandósági táblák előrejelzése multipopulációs modellekkel
|
|
- Károly Csonka
- 6 évvel ezelőtt
- Látták:
Átírás
1 Eötvös Loránd Tudományegyetem Budapesti Corvinus Egyetem Horváth Roland Magyar halandósági táblák előrejelzése multipopulációs modellekkel MSc Diplomamunka Témavezető: Vékás Péter Budapesti Corvinus Egyetem Operációkutatás és Aktuáriustudományok Tanszék Budapest, december
2 Köszönetnyilvánítás Ezúton is szeretném megköszönni Vékás Péternek, hogy elvállalta a konzulensi feladatokat. A téma kiválasztása mellett a szakmai beszélgetések és tanácsok nagyban segítették szakdolgozatom elkészültét. Hálával tartozom továbbá családomnak, barátaimnak és csoporttársaimnak, akik egyetemi éveim során végig támogató és inspiráló közeget biztosítottak, felejthetetlenné téve ezt az időszakot. 2
3 Tartalomjegyzék 1. A halandóság modellezésének alapjai Módszertani alapok A halandóság folytonos modellezése Diszkrét modell és halandósági tábla A halandóság becslése Lee-Carter modell A modell és interpretálása Paraméterek becslése Előrejelzés Az általánosított modellkeret A Lee-Carter modell továbbfejlődése A GAPC modellcsalád Poisson Lee-Carter modell Renshaw-Haberman modell APC modell Cairns-Blake-Dowd modell M7 modell Plat modell Becslés és előrejelzés Paraméterbecslés és modellválasztás Előrejelzés Többpopulációs módszerek Motiváció A standard modellek kiterjesztése két populációra Modellfelírások és paraméterbecslés Sztochasztikus faktorok
4 3.3. További többpopulációs módszerek Numerikus elemzés Adatok és a modellezés menete Kétpopulációs modellezés és eredményei Magyar-osztrák férfi Magyar-szlovák férfi Magyar-osztrák női Magyar-szlovák női Magyar férfi-magyar női Összehasonlítás az egypopulációs modellek eredményeivel, alkalmazások A legjobb magyar mortalitási modellek Magyar, osztrák és szlovák mortalitás előrejelzések 2040-ig Életjáradék árazása és várható élettartam Kitekintés és konklúzió Összefoglalás 55 Irodalomjegyzék 56 4
5 Bevezetés Mennyi ideig fogok még élni? teszi fel a kérdést magában sok ember akár nap, mint nap, legyen fiatal vagy idős. És teszik fel időről időre a kérdést élet- és nyugdíjbiztosítók aktuáriusai, akik az ügyfeleikről szeretnék tudni, hogy legalábbis várhatóan meddig élnek, és így milyen jövőbeli kiadásokkal és bevételekkel számolhatnak. A kérdés megválaszolása azonban nem csak egyéni szempontból reménytelen, de sokévnyi megfigyeléseken alapuló statisztikai előrejelzések sem teljesítenek még mindig olyan bizonyossággal, melyet bátran fel lehetne használni egy több évtizedes halandósági vagy más néven mortalitási projekciónál. Az aktuáriusi szakirodalomban longevity risk-ként ismert 1, a várható élettartamban rejlő ilyen jellegű kockázat modellezése ma a biztosítási terület kockázati modellezésének egyik legizgalmasabb témája. Az életbiztosítások kapcsán nem túl gyakori a pozitív gazdaság-politikai jelenségként fellépő kockázat, a longevity risk viszont ilyen. A várható élettartam ugyanis rohamos léptékben nőtt lényegében minden fejlett országban az elmúlt évtizedekben. Magyarországon 1950-ben a nők születéskor várható élettartama 64, a férfiaké 59 év volt ben ez a két szám 79 és 72 év. Ez a trend ráadásul globális jelenség. Wilson (2001) tanulmánya szerint egy egyértelmű konvergencia figyelhető meg a halandósági folyamatokban, különösen azon nemzetek populációi között, melyek a globalizáció révén egyre szorosabb kapcsolatban élnek és fejlődnek egymással. Magyarország esetén érdekesnek látszik megvizsgálni, hogy felírható-e bármilyen konvergencia a nyugati vagy szomszédos országok mortalitásaival, különösen más Európai Uniós tagországokéval. Több populáció halandóságának együttes modellezése viszont nem egyszerű feladat, a vonatkozó modellek csupán néhány éves múltra tekintenek vissza. Legjobb tudomásom szerint dolgozatom lesz az első olyan írás, mely többpopulációs módszerekkel vizsgálja hazánk mortalitását. Ehhez végül Ausztria és Szlovákia férfi illetve női népességének halandóságát vettem segítségül, és több esetben is sikerült jobban teljesítő előrejelzést adni, mint az egypopulációs modellekkel. 1 A magyar szakirodalomban használatos még a Kovács és Májer (2011) által meghonosított élettartamkockázat szakzsargon is. 5
6 A nemzetközi modellezés különösen hatékony módszer lehet a multinacionális életbiztosítóknak, hiszen amennyiben két biztosított részsokaság élettartam-kockázatában valóban fellelhető összefüggőség, úgy ezen kitettség kezeléséhez bizonyosan hatékonyabb módszer az együttes modellezés, mint az egymástól független. Különösen égető probléma ez a mai S2-környezetben illetve az alacsony hozamok mellett, ahol a befektetések közel sem tudják kompenzálni az élettartamok rohamos, egyelőre elég kiszámíthatatlannak bizonyuló fejlődését. A dolgozat felépítése a következő. Az 1. fejezetben ismertetem a halandóság modellezésének alapjait, illetve az úttörő 1992-es Lee-Carter modellt. A 2. fejezetben mutatom be, hogy a mortalitási modellezés egy populációra hova is fejlődött az elmúlt bő két évtizedben, és hogy hogyan foglalhatóak a ma legjobbnak vélt modellek egy keretbe matematikailag. A 3. fejezetben szólok ezen hat ismertetett modell kiterjesztéséről kétpopulációs esetre, illetve a legfontosabb ma létező irányzatokról a témában. A 4. fejezetben mutatom be a saját elemzést, és vonom le a megfelelő következtetéseket a magyar, illetve az osztrák és szlovák mortalitásokra is. Ezt követően lezárásként összefoglalom a dolgozat eredményeit. 6
7 1. fejezet A halandóság modellezésének alapjai Ebben a fejezetben a halandósági modellezés alapjait mutatom be, majd a mérföldkőnek számító Lee-Carter modellt részletesen tárgyalom. 1 Ez jelenti minden ma használt legfejlettebb modell módszertani és heurisztikus alapját is. Ezeket a modelleket a későbbi fejezetekben fogom részletesebben tárgyalni, hogy aztán a kellő matematikai alapok után bemutathassam saját elemzésemet a magyar, osztrák és szlovák halandósági adatokon Módszertani alapok A modellek bemutatásához első lépésben az alapfogalmakat, jelöléseket és összefüggéseket ismertetem. Dolgozatomban végig igyekszem a szakirodalomban elterjedt jelölésekkel dolgozni, és ezeket konzisztensen használni a különböző modellekben A halandóság folytonos modellezése A mortalitási modellezés egyik legfontosabb fogalma a túlélési függvény (angolul survival function), mely az egyén élettartamának eloszlását leíró függvény. Jelölje L az élettartamot, ami tehát egy nemnegatív, folytonos valószínűségi változó. Ezen valószínűségi változó túlélési függvényén azt a G : R + [0, 1] függvényt értjük, melyre: G(y) = P(L y) (y 0). (1.1) Nyilvánvalóan fennállnak az alábbi összefüggések: G(0) = 1, 1 Az itt olvasható elméleti alapok Vékás (2016) munkájára épülnek. 7
8 G(y) = 1 F (y) (y 0), ahol F jelöli L eloszlásfüggvényét. Kiemelt fontosságú emellett a hátralévő élettartam valószínűségeloszlása: ha az egyén megélt x 0 életkort, akkor a számára még hátralévő L x élettartam eloszlását az L x feltétel melletti feltételes eloszlás adja. Ezt a valószínűséget fejezi ki a reziduális túlélési függvény: G x (y) = P(L x L x) = P(L x + y) P(L x) = G(x + y) G(x) (x, y 0). Ahogy azt a Bevezetésben említettem, számunkra különösen érdekes lesz a várható hátralévő élettartam. Az x kort megélt egyén számára ez valószínűségelméletileg természetesen a feltételes várható értékkel fejezhető ki, ami pedig továbbírható integrál segítségével: e x = E(L x L x) = G x (y)dy (x 0). e x tehát az az időmennyiség, melyet várhatóan egy jelenleg x éves egyén még élni fog, amennyiben élettartamának reziduális túlélési függvénye G x. Kitüntetett szerepet kap a születéskor várható élettartam: e 0 = E(L x) = G x (y)dy. Folytonos modellkeretnél maradva a pillanatnyi halálozási valószínűség nyilván 0. Határértékben azonban vizsgálhatjuk a halálozási valószínűséget. Ehhez szokás definiálni az ún. halálozási intenzitást (angolul hazard rate vagy force of mortality): x 0 P(L < y + ɛ L y) µ(y) = lim ɛ 0+ ɛ (y 0). A halálozási intenzitás tehát felfogható úgy, mint a pillanatnyi halálozási valószínűség évesített értéke. Felhasználva a feltételes valószínűség definícióját, és bővítve a túlélési függvénnyel kaphatjuk a következő, gyakorlati szempontból hasznos összefüggést: F (y + ɛ) F (y) µ(y) = lim = f(y) ɛ 0+ ɛg(y) G(y) (y 0, G(y) > 0), ahol továbbra is F az élettartam eloszlásfüggvénye, G a túlélési függvény, illetve f jelöli a sűrűségfüggvényét Diszkrét modell és halandósági tábla A gyakorlatban aktuáriusi alkalmazásoknál lényegében kivétel nélkül diszkrét halálozási adatokkal dolgozunk, a legtöbbször egyéves időtávokat tekintve. Ehhez az alábbiakban 8
9 definiálom a koréves túlélési illetve a koréves halálozási valószínűségeket, melyek azt a valószínűséget fejezik ki, hogy az x éves kort éppen betöltő egyén a következő születésnapját megéli-e: p x = P(L x + 1 L x) (x N), vagy sem: q x = P(L < x + 1 L x) (x N). A definícióból nyilvánvalóan p x + q x = 1 felhasználva is meghatározható a koréves túlélési valószínűség: p x = G(x + 1) G(x) x N esetén. Továbbá a túlélési függvényt (x N, G(x) > 0). Az egészértékű felírás haszna a halandósági táblák használatakor látszik. Ezen táblák kor- és naptári évekre bontva tartalmazzák többek közt a koréves túlélési és halálozási valószínűségeket, melyre példát az alábbi ábrán láthatunk: 1.1. ábra. A 2014-es magyar férfi halandósági tábla 0-20 éves korig. (Adatok forrása: mortality.org) A halandósági tábla minden esetben el van vágva egy felső korláttal, melyet ω-val szokás jelölni. A mortality.org táblái esetén ez 110, vagyis a 110 évesekre már azt tesszük fel, hogy mindannyian ebben a korban halnak meg, azaz q 110 = 1. Ez nem egy erős megszorítás, hiszen például hazánkban 2014-ben két férfi és három nő élt ennél magasabb életkorban, vagyis modellszempontból elhanyagolható létszámban. A halandósági tábla tartalmazza még az alábbi mutatókat: 9
10 l x = l 0 G(x) továbbélési rendet, mely főre vetítve mutatja meg, várhatóan hányan élik meg az x éves kort. Itt súlyos feltételezés és ezzel később még foglalkozom, hogy az idő előrehaladtával a korévenkénti halálozási valószínűségeket változatlannak tekintjük ezen mutatónál. d x = l x+1 l x kihalási rendet, mely az adott korosztály várható elhunytjainak számát jelöli szintén fős kezdeti népességre vetítve, és az említett feltételezéssel élve. Végül e x = 1 l x ω i=x+1 l i várható hátralévő élettartamot. A mortalitási modellezés célja az, hogy a jövőbeli q x korévenkénti halálozási valószínűségeket megbecsüljük. Ebből pedig már többek közt várható élettartamokat vagy például egy járadéktermék díját is könnyen kiszámolhatjuk. Mielőtt a konkrét modelleket elkezdeném bemutatni, tekintsük át ennek a valószínűségbecslésnek az alaptechnikáját A halandóság becslése A múltbeli halálozási adatok számszerűsítéséhez leggyakrabban használt statisztika a mortalitási ráta (vagy angolul mortality rate). Ez a mutató a választott időszak (naptári év), kor és populáció esetén a megfigyelt halálesetek számának és a populáció létszámának arányaként írható fel: m x,t = D x,t E x,t. A halálesetek száma egy egyértelmű mennyiség adott x és t mellett. A populáció létszáma viszont már egy dinamikus mennyiség, hiszen a halálozások vagy szerződések megszűnése miatt ez a megfigyelt időszakon belül csökkenhet. Ha az időszak kezdőpontjában vett létszámot vesszük figyelembe, akkor azt kezdeti kitettségnek nevezzük (initial exposure to risk), jelölje E 0 x,t. A másik használatos definíció az időszak alatt élt egyének átlagos számát veszi figyelembe, ez a központi kitettség (central exposure to risk), aminek E c x,t a szokásos jelölése. Ez az átlagos szám persze attól függ, hogy mennyi időt éltek átlagosan a megfigyelt időszakban azok, akik ekkor meg is haltak. Jelölje ezt A. Ez a következő összefüggést implikálja: E c x,t = E 0 x,t (1 A)D x,t. (1.2) Természetesen a leggyakoribb egyszerűsítő feltevés és én is ezzel fogok élni a dolgozat elemzése során az A = 1 2 paraméterezés. A kitettség definíciójának függvényében beszélhetünk tehát kezdeti (m 0 x,t) és központi (m c x,t) halandósági rátáról. Az már a modellezés mikéntjétől függ, hogy melyiket használjuk. A definíció választásától függetlenül elmondható viszont, hogy a modellezés során 10
11 a fiatal és idős korosztály rátái közötti nagyságrendi különbség miatt ezek logaritmusát vagy logit függvényét fogjuk tekinteni. Az 1.2. grafikonon a magyar adatokon szemléltetem a logaritmált központi mortalitási rátákat. A korábbi klasszikus mortalitási modellek (Gompertz és Makeham vagy Heligman és Pollard konstrukciója) ezen keresztmetszeti függvények formájára próbáltak paraméteres modelleket felírni. Dolgozatomban ezzel nem foglalkozom, de az Olvasónak ajánlom további részletekért a téma egyik alapművét: Dickson, Hardy és Waters (2009) könyvét ábra. Logaritmált központi mortalitási ráták a magyar férfi illetve női populációra 1950-ben és 2014-ben. (Adatok forrása: mortality.org) A fenti ábrán jól kivehető a fejlődés, vagyis a mortalitások erőteljes csökkenése. Ennek mértéke korosztályonként és nemenként változó: például a csecsemőhalandóság jelentősen visszaszorult, ugyanakkor a nyugdíjazás előtt álló férfiak halandósága alig alacsonyabb a 64 évvel ezelőttinél. Érdekes jelenség még, hogy a huszonéves korban látható halandósági púp, melyet a fiatalok veszélyesebb, sokszor motorozási szokásainak tulajdonítanak a nőknél teljesen eltűnt. Továbbá megjegyzendő, hogy 80 éves kor felett az adatokat szolgáltató Human Mortality Database a kevés megfigyelés miatt kiegyenlítő eljárást alkalmaz. A számunkra fontos összefüggés természetesen az lesz, hogy a statisztikailag könnyebben megfogható mortalitási ráta és a q x,t valószínűségek hogyan feleltethetőek meg egymásnak. Többek közt az Ágoston-Kovács (2000) vagy a Vékás (2016) munkákban megtalálható 11
12 a könnyű, de hosszadalmas levezetés; az összefüggések pedig: q x,t = m x,t = m x,t m, x,t q x,t q. x,t (1.3) 1.2. Lee-Carter modell A mortalitás modellezésben mára már klasszikussá vált struktúrát Ronald D. Lee és Lawrence Carter alkotta meg 1992-ben. Alapötletük az volt, hogy egy log-bilineáris paraméteres modellt állítanak fel a központi mortalitási rátákra mint függő változóra. A következőkben bemutatandó modell meglepően jól írta le az 1933 és 1987 közötti USA-beli mortalitási adatokat, mára azonban már jóval szofisztikáltabb modellekkel készítik az előrejelzéseket, az elméleti alapok viszont ezeknél a struktúráknál is hasonlóak A modell és interpretálása A dolgozat ezen szakaszában végig központi mortalitási rátákkal dolgozom, ezért a c indexelést elhagyom. Jelölje tehát m x,t az x {1, 2,..., X} korévhez és t {1, 2,..., T } naptári évhez tartozó központi halálozási rátát. Feltesszük, hogy ezeket az értékeket minden x és t esetén ismerjük, alakulásukat pedig a következő egyenlet írja le: ln m x,t = α x + β x κ t + ɛ x,t (x = 1, 2,..., X, t = 1, 2,..., T ). (1.4) ahol X 2 és T 2 a korcsoportok és naptári évek darabszámai. A három paraméter közül α x és β x fogják meg a kortól való függést, míg κ t a halandóság időbeli fejlődését testesíti meg. Utóbbit mortalitási indexnek is nevezik. Az ɛ x,t hibatag a modell által meg nem magyarázott hatásokat foglalja magában. A hibatagokról szokás megkövetelni, hogy 0 várható értékű és σ 2 > 0 varianciájú, egymástól független normális eloszlást kövessenek: ɛ x,t N (0, σ 2 ) ( x, t), (1.5) Megjegyzendő, hogy bár a szerzők az eredeti cikkben nem tesznek feltételt a peremeloszlásra csak a 0 várható értéket és a konstans varianciát követelik meg, a normális eloszlás lehetővé teszi, hogy a cikkben ismertetett eredmények maximum likelihood becsléssel is elérhetőek legyenek. A normalitásból könnyen látható, hogy ln m x,t is normális eloszlást követ: ln m x,t N (α x + β x κ t, σ 2 ) ( x, t). (1.6) 12
13 Látható, hogy az (1.4) egyenlet paraméterezése nem egyértelmű, hiszen az alábbi két transzformációra is invariáns: {α x, β x, κ t } {α x, c β x, κ t c } c R, c 0, illetve {α x, β x, κ t } {α x c β x, β x, κ t + c} c R. A szabadságfokok megszüntetése érdekében a szerzők az alábbi paramétermegkötéseket teszik: T κ t = 0, t=1 X βx 2 = 1. t=1 A második megszorításban az eredeti cikkben (Lee és Carter, 1992) nem négyzetes tagok összege szerepel, de a továbbiakban ennek a használata megkönnyít bizonyos számításokat, az irodalomban is ez a variáció terjedt el. Az első egyenlet pedig pontosan azt írja elő, hogy az α x értékek a korévenkénti log-mortalitások empirikus átlagának feleljenek meg. Hogy még szemléletesebb legyen a modell felépítése, tekintsük az alábbi ábrákat, melyek a Lee-Carter modell együtthatóit mutatják sematikusan : 1.3. ábra. A Lee-Carter modell együtthatóinak szemléltetése. (Forrás: Katrien Antonio (2016)). β x (1) ami tehát az én jelölésemnél α x az átlagos korévenkénti mortalitás, κ t az időbeli fejlődés, míg β x (2) ennek az időbeli fejlődésnek a korévenkénti érzékenysége. 13
14 Paraméterek becslése A paraméterek becsléséhez a maximum likelihood (ML) módszer alkalmazása a legkézenfekvőbb. Belátható, hogy normális eloszlású hibatagok esetén ugyanerre az eredményre vezet a szerzők által is javasolt szinguláris érték felbontás (SVD), mely jóval kisebb számításigényű eljárásnak számít. Ma már főként egy halandósági modellezésnél ezek az időhatékonyságbeli különbségek elhanyagolhatóak. Én is azt tapasztaltam az elemzésemnél, hogy akár SVD-t akár ML-módszert és ehhez Newton-Raphson iterációt használtam a programozás során az R szoftverben, néhány másodperc alatt minden modell paraméterbecslése elkészült. Az ML-módszerhez egyébként könnyen felírható a log-likelihood függvény felhasználva a log-mortalitásokra felírt (1.6) normális eloszlást: l = 1 1 X T XT ln(2π) XT ln σ 2 2σ 2 (ln m x,t α x β x κ t ) 2. (1.7) x=1 t=1 Ezt kell tehát maximalizálnunk az α x, β x, κ t és σ paraméterek szerint úgy, hogy teljesüljön a két paramétermegkötés. A levezetéstől és az analitikus eredményektől eltekintek, de az említett két magyar cikkben ezek megtalálhatóak. A becslés egyik fontos tulajdonsága, hogy minden mortalitási megfigyelést azonos súllyal vett figyelembe. Lee és Carter szerint ez ellentmond annak a gyakorlati tényezőnek, hogy az egyes kor- és naptári év csoportok létszámai és haláleseti gyakoriságai nagyságrendileg eltérhetnek. Ezért a szerzők a következő egyenletrendszert mint kiigazítást javasolják: X X ˆκ adj = {κ R T : D t = D x,t = E x,t exp(ˆα x + ˆβ x κ t ) (t = 1, 2,..., T )}. (1.8) x=1 x=1 Az egyenletrendszernek létezik megoldása és az egyértelmű, ha minden időszakban történt haláleset. Megoldásával tehát elérhető a numerikus alkalmazásnál, hogy az egyes időszakokban megfigyelt halálesetek száma megegyezzen a modellből adódó várható értékeivel Előrejelzés A fentiek alapján tehát meg tudjuk becsülni egy adott populációra illesztett Lee-Carter modell paramétereit. Ahhoz viszont, hogy jövőbeli előrejelzést készítsünk, az időtől függő paramétert, vagyis κ t -t külön kell modelleznünk. Lee és Carter (1992) úgy találta számos idősor empirikus vizsgálata után, hogy a kiigazított mortalitási indexre leginkább az eltolásos véletlen bolyongás (angolul Random Walk with Drift) folyamat illeszthető, amit eltolásos ARIMA(0, 1, 0)-ként is ismerhetünk. A sztochasztikus modell tehát: ˆκ adj t = ˆκ adj t 1 + s + Φ t (t = 2, 3,..., T ), (1.9) 14
15 ahol a kezdőérték (ˆκ adj 1 ) ismert, s az eltolás paraméter, Φ t pedig a hibatag. Utóbbiról feltesszük, hogy függetlenek egymástól, a Lee-Carter modell (1.4) alapegyenletének hibatagjaitól szintén, és az alábbi normális eloszlást követik: Φ t N (0, σ 2 RW D) (t = 2, 3,..., T ). (1.10) A Lee-Carter modellben tehát a mortalitási index egy időben lineáris sztochasztikus folyamatot követ, növekményei függetlenek, a trend meredekségét pedig az s paraméter adja meg, mely a valóságban legtöbbször negatív a javuló historikus halálozási trendek miatt. Ahhoz, hogy előrejelzést készíthessünk, az s és a σ RW D paraméterekre kell becslést adnunk. Az (1.9) és (1.10) egyenletek alapján felírhatjuk a kiigazított mortalitási index elsőrendű differenciáinak eloszlását: ˆκ adj t ˆκ adj t 1 N (0, σ2 RW D) (t = 2, 3,..., T ). Ismert, hogy normális eloszlás várható értékének és varianciájának ML-becslése rendre a megfigyelt minta átlaga illetve varianciája: ŝ = 1 T 1 ˆσ 2 RW D = 1 T 1 T (ˆκ adj t ˆκ adj t 1 ) = ˆκadj T T 1 t=2 T (ˆκ adj t ˆκ adj t 1 ŝ)2. t=2 ˆκadj 1 Érdekes, de nem túl meglepő tény, hogy a mortalitási index trendparaméterének becslése kizárólag az első és az utolsó megfigyeléstől függ. Így tehát a jövőbeli mortalitási index pontbecslését az alábbiak szerint kaphatjuk meg: E(ˆκ adj adj T +j ) = E(ˆκ T = ˆκ adj T = ˆκ adj T j + (ˆκ adj T +i ˆκadj T +i 1 )) = i=1 + j i=1 E(ˆκ adj T +i ˆκadj T +i 1 ) = + js (j = 1, 2,... ). A becsléshez s trendparaméter helyére kihasználva a maximum likelihood becslés függvénytranszformációra vonatkozó invarianciáját beírhatjuk ŝ-t. Az alapegyenletbe visszahelyettesítve kapjuk a log-mortalitás előrejelzését a T + j. évre: ln ˆm x,t +j = ˆα x + ˆβ x (ˆκ adj T + jŝ) (x = 1, 2,..., X, j = 1, 2,... ). Érdekes még vizsgálni az előrejelzés hibáját, melyhez az analitikus bonyolultság miatt Monte-Carlo szimulációt szokás használni. Erről még bővebben lesz szó a következő fejezetben., 15
16 2. fejezet Az általánosított modellkeret 2.1. A Lee-Carter modell továbbfejlődése A Lee-Carter modell legalább az ezredfordulóig töretlen siker volt, számos tanulmány született különböző országok mortalitási modellezésére. Meglepően jól teljesített a modell a tapasztalatokról Lee (2000) készített átfogó tanulmányt, azonban sok elméleti vita folyt és folyik arról, hogy helyes-e az elmúlt évszázad elképesztő halandósági javulását feltételezni, jogosan számítunk-e azzal statisztikailag megegyező mértékű javulásra az előrejelzésnél. Ezzel az érdekes elméleti kérdéssel dolgozatomban most nem foglalkoznék, sokkal inkább a módszertanra helyezem a hangsúlyt. Amely tehát szintén kapott számos kritikát. Még az eredeti cikk is tartalmazott egy kiegészítést: az ugrásszerű outlier időszakokra mint például a spanyolnátha évei érdemes dummy változót bevezetni. Ennél módszertanilag sokkal erősebb kritikák is felbukkantak, melyek jelentősen hozzájárultak ahhoz, hogy mára egy egész modellcsalád fejlődjön ki a mortalitás modellezésére. Ebben az alfejezetben a legfontosabb ilyen modelleket fogom áttekinteni, majd a következő fejezetben ezek többpopulációs keretre való kiterjesztésével foglalkozom. A legelső módszertani kritikai írás a cikk megjelenését követő évben jelent meg Wilmoth publikálásában (1993). Szerinte a modell egyik legtámadhatóbb pontja, hogy a logmortalitásokra minden korév - naptári év páros esetén ugyanazt a varianciát, vagyis homoszkedaszticitást feltételez. A cikk rávilágít, hogy a variancia nagyjából fordítottan arányos a csoportokba eső halálesetek számával, ezért érdemes súlyozott legkisebb négyzetek módszerét alkalmazni a Lee és Carter által javasolt SVD helyett. Egy Wilmoth felvetését is tartalmazó, de annál még sajátosabb modellel állt elő Brouhns, Denuit és Vermunt (2002). A szerzőhármas a homoszkedaszticitás feltételének eltörlése mellett ML-módszert alkalmaz, továbbá az eredeti modell mortalitási indexre vonat- 16
17 kozó utólagos kiigazítását is elveti, lévén ez egy, a sztochasztikus modellkeretbe nehezen illeszkedő lépés. Modelljük leglényegibb eleme, hogy a normális eloszlású hibatagok helyett a mortalitási rátákhoz használt halálesetek számát tekintjük Poisson-eloszlású valószínűségi változónak. A matematikáját később részletesen ismertetem még. Nagyon hasznos ez abból a szempontból is, hogy azon korév - naptári év csoportokra, ahol nincs haláleseti megfigyelés, ezzel a lépéssel kiküszöböljük, hogy a modell bal oldalán ln 0 szerepelhessen. Gyakorlati haszna ennek óriási, hiszen biztosított állományoknál tipikusan nagyon kevés, egy-egy korosztályban sokszor nulla haláleset történik, vagy érdekes például az a tény is, hogy 2014-ben Szlovákiában egyetlen 9 és 10 éves lány sem hunyt el. A Lee-Carter modell másik legnagyobb hiányosságaként az ún. kohorszhatást (angolul cohort effect) róják fel. Ennek lényege, hogy a mortalitást nem csak a naptári év és a kor befolyásolja, de számos megfigyelés létezik rá, hogy a születési év is szignifikáns faktor. Erre az alábbi ábra nyújt kiváló példát: 2.1. ábra. Bal oldalon a férfi, jobb oldalon pedig a női magyar Lee-Carter modell reziduálisainak hőtérképe láthatóak. A modellt naptári éveken és korosztályra generáltam. (Forrás: saját szerkesztés.) Ebben a modellkeretben tehát az azonos évben születettek egy csoportot, úgynevezett kohorszt alkotnak. A 2.1. ábrán mindenki egy balról jobbra felfelé tartó diagonális mentén éli életét. A reziduálisok alapján a kohorszhatás mindkét nem esetén szembeötlő. Matematikailag ezt könnyen behozhatjuk a sztochasztikus modellbe. Ezt először Renshaw és Haberman (2006) tette meg. Az ezt követően publikált modellek lényegében mindegyike tartalmazza már a kohorszhatást is. A Renshaw-Haberman modellt a szerzőpáros 2011-es cikkében néhány egyszerűsítéssel újraalkotta, ugyanis az eredeti modell a gyakorlatban numerikusan instabilnak bizonyult. 1 1 Sőt, ahogy az később az elemzésemből is ki fog derülni, még így is instabil a gyakorlatban: a vizsgált hat populációból mindössze kettőben sikerült bekonvergálnia R-ben ennek a modellnek. 17
18 Az új modelljük egy speciális esete az ún. APC modell, az angol age-period-cohort szóhármas rövidítéséből. Az elnevezés arra utal, hogy itt a kortól nem csak a korhorszhatás, de a naptári év hatás is független, míg ugye ez eddig egyik említett modellben sem volt annak tekinthető. Az APC modell már jóval korábban használatos volt az orvostudományban (Hobcraft és szerzőtársai, 1982), mortalitási keretbe először Carstensen (2007) foglalta. Dolgozatomban ezt a modellt is fogom vizsgálni többpopulációs esetben is. Egy másik, nagyon sikeres modellbővítési irányzat a többtényezős mortalitási modellezés. Ennek alapötlete, hogy számos mortalitási index vagyis a korábbi egy κ t idősor helyett kettő vagy akár több együttesen írja le a halandóság javulását. A legismertebb ilyen modell a Cairns-Blake-Dowd (2006), illetve a Plat (2009) konstrukciók, előbbi két, míg utóbbi három tényezővel operál. Ezek mellett még számos további irányzat létezik. Összességében elmondható, hogy az egyre kifinomultabb modellek nagyon jól teljesítenek bizonyos adathalmazokon. Kiváló kutatási terület, hogy mely ország, populáció esetén mely modell hogyan viselkedik. Az Olvasó számára többek közt Lovász (2011) cikkét ajánlanám, mely áttekintő képet ad számos európai ország esetén a numerikus tapasztalatokról. Magyarországi adatokon végzett tanulmányként a már említett Májer-Kovács (2011) cikket, ezen kívül a Baran és szerzőtársai (2007) valamint a Bajkó-Maknics-Tóth-Vékás (2015) tanulmányokat ajánlanám A GAPC modellcsalád A számos modell és irányzat jól láthatóan nagyon sok matematikai vonásában közös. Így felmerült az igény néhány évvel ezelőtt, hogy egy egységes modellkeretben foglalják össze ezeket a mortalitás-előrejelző eljárásokat. Erre Hunt-Blake (2014), Currie (2016), illetve Villegas és szerzőtársai (2016) tettek kísérletet. Az általuk javasolt egységes modellkeretet általánosított kor-időszak-kohorsz modellnek (angolul Generalized Age-Period-Cohort vagy röviden GAPC modellnek) nevezzük. Ez a modellkeret egységesíti azon mortalitáselőrejelző eljárásokat, melyek a kor - naptári év csoportosításban log-bilineáris vagy logitbilineáris, egy- vagy többtényezős, valamint korhorszhatást figyelembe vevő illetve ignoráló modellek. A következő alfejezetekben a fent már röviden bemutatott modelleket fejtem ki részleteiben, és mutatom meg, hogy hogyan illeszthetőek bele a GAPC családba. Fontos megjegyeznem, hogy a fenti modellek közül mind beleillik ezen modellkeretbe, kivéve az eredeti Lee-Carter modellt (1992), így ennek csak a Poisson-változatával fogok foglalkozni. Maradva a korábbi jelöléseknél, legyen m 0 x,t illetve m c x,t az x {1, 2,..., X} korcsoporthoz és t {1, 2,..., T } naptári évhez tartozó kezdeti illetve központi mortalitási ráta. Megfigyelésink a D x,t N halálesetek száma, illetve az Ex,t 0 N + kezdeti vagy Ex,t c > 0 18
19 központi kitettségek. Követve Villegas és szerzőtársainak (2016) konstrukcióját, a GAPC modellcsalád négy komponensből épül fel: Sztochasztikus komponens Mint már említettem, az eredeti Lee-Carter modell továbbfejlesztésének egyik sarokköve, hogy a D x,t mennyiséget érdemesebb valószínűségi változónak tekinteni, amire vezessük be a megfigyelések számától eltérő D x,t jelölést. A halálesetek számát minden naptári évre és korcsoportra egymástól független, binomiális vagy Poisson-eloszlásúnak feltételezzük: D x,t Bin(Ex,t, 0 m 0 x,t) (2.1) vagy D x,t P oisson(e c x,t m c x,t). (2.2) Linkfüggvény A kezdeti vagy központi halandósági rátákat szeretnénk becsülni. Ahogy Lee és Carter esetén láttuk, ezt egyszerűbb megtenni, ha annak valamilyen függvényét tekintjük. Legyen g : R + R ez a függvény, melyet szokás linkfüggvénynek nevezni. Hunt-Blake (2014) központi kitettségek és Poisson-eloszlás használata esetén a g(x) = ln(x) logaritmikus függvényt javasolják, míg kezdeti kitettség és binomiális eloszlás mellett a g(x) = ln ( ) x 1 x logit függvényt. Szisztematikus komponens A megfelelő linkfüggvény argumentumába beírva a megfelelő mortalitási rátát kapjuk az ún. szisztematikus komponenst: η x,t = g(m x,t ) (x = 1, 2,..., X, t = 1, 2,..., T ). (2.3) A mortalitási modelleink tehát ezt a változót szeretnék előrejelezni. A GAPC modellkeret így az alábbi univerzális egyenlettel írható fel: ahol: η x,t = α x + N i=1 β (i) x κ (i) t + β (0) x γ t x (x = 1, 2,..., X, t = 1, 2,..., T ), (2.4) ahogy már megismertük, α x a kor szerinti hatás paramétere. 19
20 N N a kor - naptári év tényezők száma. A κ (i) t mortalitási indexek testesítik meg a mortalitási szint időbeli sztochasztikus alakulását, míg β x (i) együtthatók a halandósági ráta érzékenységét adják meg kor szerint a mortalitási indexekre nézve. Végül pedig a γ t x paraméterek veszik fel a kohorszhatást, vagyis hogy a tipikus halandósági pályához képest az adott kohorsz milyen mértékben tér el. Megszorítások Ahogy az eredeti modellnél, az általánosított esetben is csak transzformáció erejéig egyértelmű a paraméterbecslések megoldása, ezért bizonyos megszorításokat kell tennünk a paraméterekre. Általánosan ezt úgy fogalmazhatjuk meg, hogy a Θ := ( α x, β x (1),..., β (N) x, κ (1) t,... κ (N) t, β (0) x, γ t x ) (2.5) paramétervektorra fennáll, hogy egy bizonyos θ transzformációja kielégíti a θ(θ) = Θ = ( ᾱ x, (1) (N) β x,..., β x, κ (1) t,... κ (N) (0) ) t, β x, γ t x egyenletet, és így a (2.5) egyenlet által definiált Θ paramétervektor θ(θ) transzformáltja szintén a (2.4) egyenletbeli szisztematikus komponenst eredményezi Poisson Lee-Carter modell A Brouhns és szerzőtársai (2002) által megalkotott modell lényegében az eredeti Lee- Carter modell (1992) hibatag nélküli változata, ahol a GAPC modellkerethez hűen a bal oldalon valószínűségi változót, méghozzá a Poisson-eloszlás miatt η x,t = ln m c x,t változót tételezünk fel: η x,t = α x + β (1) x κ (1) t (x = 1, 2,..., X, t = 1, 2,..., T ). A szerzők javaslata alapján a következő megszorításokkal élünk: X x=1 β (1) x = 1, T t=1 κ (1) t = 0. A mortalitás előrejelzéséhez továbbra is ARIMA folyamatokat használunk, ennél a modellnél is empirikusan alátámasztottnak bizonyult az RWD folyamat, azaz: κ (1) t = δ + κ (1) t 1 + Φ t, Φ t N (0, σ 2 RW D). 20
21 Renshaw-Haberman modell A következő tárgyalt struktúra a Renshaw-Haberman (R-H) modell (2006) volt, mely már figyelembe vette a kohorszhatást. Ez tehát a Poisson Lee-Carter modell alábbi módon bővített változata: η x,t = α x + β (1) x κ (1) t + β (0) x γ t x (x = 1, 2,..., X, t = 1, 2,..., T ). Az identifikációs probléma megoldására javasolt paraméter-megkötések: X x=1 X x=1 β (1) x = 1, β (0) x = 1, T t=1 T 1 c=1 X κ (1) t = 0, γ c = 0. β x (0) κ (1) t Mivel numerikusan instabilnak találták a fenti modellt, ezért 2011-es cikkükben a = 1 egyszerűsítést javasolták. A korábbiakhoz képest most már két idősorunk van: és γ t x. Mindkettő modellezése a már bemutatott ARIMA folyamatokkal történik, fontos, hogy e két idősor független folyamat APC modell Az Age-Cohort-Period (APC) modell ahogy azt korábban említettem a kor, kohorsz és naptári év dimenziók mentén függetlennek tekinti a mortalitást. Ez lényegében az R-H modell egy speciális esete β x (0) = β x (1) = 1 feltételek mellett, melyet először Carstensen (2007) publikált: η x,t = α x + κ (1) t + γ t x (x = 1, 2,..., X, t = 1, 2,..., T ). Az alábbi megszorításokkal elérhető az identifikációs probléma feloldása: T t=1 κ (1) t = 0, T 1 c=1 X γ c = 0, T 1 c=1 X cγ c = Cairns-Blake-Dowd modell A Cairns-Blake-Dowd (CBD) modell (2006) egy olyan kéttényezős struktúra, mely kezdeti kitettséget használ logit linkfüggvénnyel, és nem tartalmaz sem additív életkorhatást, sem kohorszhatást: η x,t = κ (1) t + (x x)κ (2) t (x = 1, 2,..., X, t = 1, 2,..., T ), 21
22 ahol x = X+1 2 az előforduló korcsoportok számtani átlaga. A szerzők ezt a modellt főként magasabb, x 0 = 60 éves kor feletti populációra találták megfelelőnek, ahol az η x,t szisztematikus faktor x 0 + x korcsoportra vonatkozik. Itt nem lép fel identifikációs probléma, ezért a megszorítások halmaza üres M7 modell Későbbi cikkükben (Cairns, 2009) alapmodelljükből kiindulva egy még szofisztikáltabb struktúrát fejlesztettek, mely már kohorszhatást is tartalmaz. Ez pedig a kvadratikus CBD modell kohorszhatással bővített változata, melyet a szakirodalomban csak 7-es modellként vagy még rövidebben M7 -ként szoktak említeni. A modell struktúrája a következő: η x,t = κ (1) t + (x x)κ (2) t + κ (3) t ( (x x) 2 + ˆσ x 2 ) + γt x (x = 1, 2,..., X, t = 1, 2,..., T ), ahol ˆσ 2 x a korcsoportok indexeinek kvadratikus átlagtól való eltéréseinek átlaga, vagyis az (x x) 2 értékek átlaga. A szerzők az alábbi megszorításokat javasolják: T 1 c=1 X γ c = 0, T 1 c=1 X cγ c = 0, T 1 c=1 X c 2 γ c = 0. Ez a feltételhármas azért hasznos, mert biztosítja, hogy a kohorszhatás 0 körül fluktuáljon, és ne legyen lineáris illetve kvadratikus trendje. A modellnek létezik egy speciális esete (M6 ) és egy másik változata (M8 ) is a gyakorlatban, de ezekkel a dolgozatban nem foglalkozom Plat modell Végül a ma használatos standard halandósági modellek közül Plat (2009) konstrukcióját ismertetném. Alapjaiban a CBD-modellből indul ki, de amellett, hogy már háromtényezős, a Poisson Lee-Carter modellből is vesz át elemeket: η x,t = α x + κ (1) t + (x x)κ (2) t + κ (3) t ( x x) + + γ t x (x = 1, 2,..., X, t = 1, 2,..., T ), ahol ( x x) + a szokásos jelölése max(0, x x)-nek, és az alábbi paramétermegszorítás javasolt: T 1 T t=1 c=1 X κ (1) t = 0, γ c = 0, T t=1 T 1 c=1 X κ (2) t = 0, cγ c = 0, T t=1 T 1 c=1 X κ (3) t = 0, c 2 γ c = 0. A szerző magasabb életkorokra κ (3) t paraméter elhagyását mivel ekkor x > x miatt ( x x) + = 0 és a CBD modellnél látott logika használatát javasolja. 22
23 2.3. Becslés és előrejelzés Az előző alfejezetben tehát összesen 6 egypopulációs mortalitási modellt mutattam be. Ezek mindegyike a nemrégiben publikált GAPC modellcsalád tagjai. Ezt a tényt mindegyik konstrukcióra könnyű ellenőrizni, további részletekért lásd Hunt-Blake (2014) vagy Currie (2016) írását. Ezek a modellek igen sikeresnek mondhatók a gyakorlatban. Több olyan irány létezik viszont, melyek segítségével ezek az előrejelzések még pontosabbá, megbízhatóbbá tehetők. Az egyik legérdekesebb és legújabb ilyen irányzat a többpopulációs modellezés. A következő fejezetben a fentiekben bemutatott 6 modellt fogom kiterjeszteni két populációra, majd végzek numerikus számításokat. Előtte viszont még az eredeti Lee-Carterhez hasonlóan itt is bemutatom a paraméterbecslés és az előrejelzés mikéntjét Paraméterbecslés és modellválasztás A (2.4) általános modellfelírás paramétereit a (2.5)-ben definiált Θ vektorral fejeztük ki. A paraméterek becslése maximum likelihood módszerrel végezhető el, ahol a log-likelihood függvény az alábbi formában írható fel Poisson-eloszlású haláleset számokat feltételezve: l(θ) = X T x=1 t=1 míg binomiális eloszlás esetén: X T ( ( ) E 0 l(θ) = ω x,t ln x,t x=1 t=1 ( ) ω x,t Ex,tm c c x,t + D x,t (ln Ex,t c + ln m c x,t) ln(d x,t!), (2.6) D x,t ) + D x,t ln m 0 x,t + (Ex,t 0 D x,t ) ln(1 m 0 x,t), (2.7) ahol ω x,t mindkét esetben az az indikátorfüggvény, mely rögzített (x, t) esetén 1-et vesz fel, ha van megfigyelésünk az x korcsoportra és t időszakra, illetve 0-t, ha nincs. A választott modellspecifikációban tehát a log-likelihood maximalizálásával található meg az optimális paraméterezés, figyelembe véve a modellre korábban tett identifikációs megszorításokat. Az optimalizálási feladat megoldására számos numerikus módszer létezik, én munkám során az R szoftver StMoMo csomagját használtam, melyet részletesen mutat be Villegas és szerzőtársainak (2016) cikke Előrejelzés A modellezés utolsó lépése miután már megbecsültük a paramétereket az előrejelzés. Az egypopulációs modellek mortalitási indexét tipikusan a Lee-Carter modellnél már bemutatott eltolásos véletlen bolyongással (RWD) szokás modellezni. A GAPC jelentette általános, többdimenziós esetre többek közt Villegas és szerzőtársai (2016) specifikálja ezt 23
24 a modellstruktúrát. A szóban forgó mortalitási indexeket, melyekből tehát összesen N darab van, foglaljuk egy vektorba: ˆκ t = ˆκ (1) t ˆκ (2) ṭ. ˆκ (N) t Így a többdimenziós RWD felírása az alábbi egyenlettel történik: ˆκ t = ˆκ t 1 + s + Φ t (t = 2, 3,..., T ), ahol ˆκ 1 a kezdőérték-vektor a mortalitási indexre, s az eltolás mértékét kifejező trendparaméter, Φ t pedig az egymástól és a halálozási gyakoriságoktól független hibatagok, melyek 0 várható értékű, Σ pozitív definit kovarianciamátrixú többdimenziós normális eloszlást követnek: Φ t N (0, Σ) (t = 2, 3,..., T ). A (2.4) általános GAPC felírásban nemcsak a mortalitási indexek, hanem a kohorsz indexek is mint idősorok szerepelnek, így γ t x változókra is fel kell írnunk valamilyen sztochasztikus modellt. Az irodalomban ez esetben is a trendparaméteres ARIMA(p, q, d)- folyamatokat szokás használni, melynek általános alakja a kohorsz indexre felírva: d γ c = δ 0 + Φ 1 d γ c Φ p d γ c p + ɛ c + δ 1 ɛ c δ q ɛ c q, ahol d a d-edik differenciaoperátor, δ 0 a trendparaméter, Φ 1,..., Φ p az autoregresszív együtthatók (Φ p 0), δ 1,..., δ q a mozgóátlag koefficiensek (δ q 0), végül pedig ɛ i -k egymástól független, 0 várható értékű, σ 2 varianciájú normális eloszlást követő hibatagok. A Cairns (2011), Lovász (2011) és Villegas és szerzőtársai (2016) cikkeket követve az alábbi paraméterezéseket ajánlatos alkalmazni a kohorszhatást tartalmazó modellek esetén: 2.1. táblázat: A kohorsz index modellparaméterezése Mortalitás modell Kohorsz index paraméterezése APC ARIMA(1, 1, 0) RH ARIMA(1, 1, 0) M7 ARIMA(2, 0, 0) Plat ARIMA(2, 0, 0) 24
25 A modellezés után ismét felírhatóak a differenciákra a megfelelő normális eloszlások, és az azokból következő log-likelihood függvények. Ezektől most a terjedelmük miatt eltekintek, de a levezetések a korábban említett cikkekben megtalálhatóak. Ha a becslések megvannak, akkor már egyszerűen adódnak a j időszakkal későbbi pontbecslések RWD segítségével a mortalitási indexre: ( j ) E(ˆκ T +j ) = E ˆκ T + (ˆκ T +i ˆκ T +i 1 ) = i=1 j = ˆκ T + E(ˆκ T +i ˆκ T +i 1 ) = ˆκ T + jŝ (j = 1, 2,... ), i=1 illetve például ARIMA(1, 1, 0) esetén a kohorsz indexre: E(γ T 1+j ) = ˆδ 0 + ˆΦ 1 E(γ T 2+j ) + ˆΦ 2 E(γ T 3+j ) (j = 1, 2,... ). Ezeket a becsléseket pedig már behelyettesíthetjük a szisztematikus komponens egyenletébe, és megkapjuk a pontbecslését: ˆη x,t +j = ˆα x + N i=1 β x (i) E(ˆκ (i) (0) T +j ) + ˆβ x E(ˆγ T +j x ) (x = 1, 2,..., X, j = 1, 2,... ). A pontbecslés nevében is benne van, hogy ez csak a legjobbnak vélt átlagos értéket fogja figyelembe venni, és azzal számol előrejelzést, a mögöttes sztochasztikus változók bizonytalanságát nem veszi figyelembe. Mivel analitikailag ezek elég bonyolult képletek, már az első Lee-Carter modellfejlesztések óta a Monte Carlo szimulációk alkalmazása a bevett gyakorlat. Ez egy viszonylag egyszerű módszer a modellezésre: a becslések után a hibatagokat szimuláljuk, és ezekkel jelzünk előre számos szcenáriót. A GAPC modellcsalád minden tagjára használható ez a népszerű módszer, a használt R-csomag szintén tartalmazza ennek numerikus megvalósítását. Fontos viszont megjegyezni, hogy eddig nem vettük figyelembe a paraméterbecslésben rejlő bizonytalanságot. Erre először Brouhns és társai (2005) mutattak rá. Ők a szemiparaméteres bootstrap eljárást javasolják a probléma megoldására, melyet az StMoMo R-csomag is használ. Lényege, hogy a megfigyelt D x,t halálozási értékeket a paraméterbecslések után újra kell generálni a megfelelő feltételezett eloszlás szerint (Poisson vagy binomiális), majd az így kapott összes mintára az eredeti modellválasztást megtartva kell elvégezni újra a becsléseket. Elég sok mintagenerálással a bootstrap már jól fogja közelíteni a mortalitás vagy más vizsgált mennyiség elméleti eloszlását. 25
26 3. fejezet Többpopulációs módszerek 3.1. Motiváció A korábbiakban tehát áttekintést adtam a mai mortalitási modellek legnépszerűbbjeiről, a GAPC modellcsalád hat kiemelt tagjáról. Ezek bár igen sikeresnek számítanak további statisztikai eszközökkel tovább fejleszthetőek, hogy még pontosabb halandósági előrejelzés legyen lehetséges. Az utóbbi évek egyik meghatározó irányzata a többpopulációs modellezés. Új változók bevonása a standard egypopulációs modellekbe, vagy bármilyen más, matematikailag kisebb volumenű változtatás nem igazán hozott jobb eredményeket az előrejelzésekben. Viszont két nagyon fontos megfigyelést érdemesnek találhatunk beépíteni a modellbe. Az egyik, hogy a biztosított állomány része az országos populációnak; és ugyan ismert, hogy ezek hajlamosak merőben eltérő halandóságot mutatni, fejlődéseik erősen összefüggnek. Az ebből a különbözőségből fakadó kockázatot population basis risk néven ismeri a szakma, amit magyarul bázispopulációs kockázatnak fordíthatunk. Dolgozatomban ezzel a populáció-szubpopuláció iránnyal nem fogok foglalkozni, de szólok róla bizonyos modelleknél, illetve a jövőben hazai modellezéseknél adott biztosított állományra ezeket a módszereket kimondottan ajánlatosnak tartom elemzésre. A bázispopulációs kockázat modellezése lényegében csak többpopulációs modellezési technikával lehetséges. A másik fontos megfigyelés pedig, hogy az egymással szoros kapcsolatban élő populációk halandóságai összefüggőséget mutatnak. A 1.2. ábrán már láthattuk, hogy a magyar női és férfi halandóság mennyire hasonlóan fejlődött az elmúlt bő 60 évben. Elemzésem másik iránya pedig a szomszédos országok halandóságait hivatott nemenként együtt modellezni. A historikus együttmozgásra láthatunk példát a 3.1. ábrán. Láthatjuk, hogy nem tökéletes az együttmozgás, de annyira szoros összefüggőség ötlik szembe, ami már érzésre is rengeteg plusz információt tehet hozzá a modellhez, amennyiben sikerül egy érvényes együttes struktúrát találni. Az ábrát elkészíthettem volna a férfiakra 26
27 is, vagy nemzeten belül férfi-női párosokra, hasonló képet látnánk kibontakozni. Bizonyos, hogy az Európai Unión belül legtöbb esetben, főleg a szomszédos országoknál, nagyon hasonló jelenségre bukkanhatunk. Különösen hasznos lehet így a többpopulációs modellezési technika a multinacionális európai életbiztosítók esetén, köztük számos hazai vállalatnál is ábra. A bal oldali ábrán a magyar, osztrák és szlovák női APC-modellből adódó κ t, vagyis mortalitási indexek láthatóak; míg jobb oldalon ugyanezen egypopulációs modellekből adódó γ t x kohorsz index idősorok. (Forrás: saját szerkesztés adatokon futtatva a modellt a éves korosztályokra.) Érdekes lehet megvizsgálni még, hogy ezen egymásra ható populációkat ne csak országok mentén vagy nemzeten belül nemek szerint különítsük el, hanem például dohányzó - nem dohányzó szubpopulációkra vagy bizonyos gazdasági-szociális helyzet szerint felsávozva a társadalmat. Ezekkel az irányzatokkal dolgozatomban nem foglalkozom, és sajnos a magyar adatbázisok szűkössége miatt a jövőben is nehézkesnek tartanám. Érdekes tanulmány ezzel kapcsolatban viszont Cairns és szerzőtársainak cikke (2016), melyben Dánia népességét tíz szociális-gazdasági csoportra osztják fel, és modellezik azok mortalitásait többpopulációs módszerrel. 27
28 3.2. A standard modellek kiterjesztése két populációra Már az újabb mortalitási modellek kidolgozását megelőzően megszületett az igény a többpopulációs modellezésre. Li és Lee 2005-ös cikkükben az eredeti Lee-Carter modellt terjesztették ki kétpopulációs esetre. Ötletük azon alapszik, hogy hosszú távon ahogy ezt a már említett Wilson cikk (2001) is bemutatja a mortalitási szintek konvergálnak globálisan. A későbbi modelleknél is ez az elsődleges feltételezés: a két vagy több vizsgált populáció mortalitásainak hosszú távú együttmozgása figyelhető meg. Erre a kapcsolatra kézenfekvő kointegrációs elemzéseket végezni, és teszi is ezt a többpopulációs modellek legtöbbje. Fontos kérdés, hogy a vizsgált populációkat ezen összefüggőség esetén szimmetrikusnak feltételezzük, vagy ellenkezőleg: az egyik dominálja a másik halandóságát, vagyis meghatározza a hosszú távú trendet. Utóbbi irányzatra alkotta Dowd és szerzőtársai (2011) az ún. gravitációs modellt. Lényege, hogy a domináns populációt függetlenül modellezzük, majd ezt követően a másik populáció historikus eltéréseit ezektől a domináns mortalitásoktól vizsgáljuk, és a populációk egymáshoz képesti méretei gravitációs paraméterként foghatóak fel. A modell már kohorszhatást is tartalmazott, egészen pontosan az APC modellt terjesztették ki ezen elv alapján két populációra, eredményeiket pedig az angol és wales-i férfi populáción mutatták be. A gravitációs elvet alkalmazza Jarner és Kryger (2011). Ők még nagyobb hangsúlyt fektetnek a létszámban arányaiban messze eltérő, és az idősebb korévekre fókuszáló modellezésre. Ez egy kiváló módszertan lehet biztosítóknál, hiszen az állomány méreteiben általában jóval kisebb, mint az országos populáció; emellett nyugdíjtermékeknél a 65 feletti halandóságokra kell tekintettel lenni. Dolgozatomban mégsem ezt az irányt mutatom be, ugyanis magyar adatokra épülő, bevezető többpopulációs modellezésként hasznosabbnak, érdekesebbnek tűnt országos halandósági elemzést végezni. Térjünk ezért át a másik irány modelljeire, ahol közel szimmetrikus feltevésekkel élünk. Ez azt jelenti, hogy a hosszú távú kapcsolat vizsgálata során a sztochasztikus faktorokat populációpáronként egymással összefüggő folyamatoknak tekintjük; és ezeket az idősorokat együttesen, szimmetrikus feltételekkel élve modellezzük. Hogy erre milyen módszerek léteznek, arról a szakaszban lesz szó. Ez az ötlet és a modell kidolgozása a Yang-Wang (2012) illetve a Zhou és szerzőtársai (2012) cikkben jelent meg. A sztochasztikus folyamatok összefüggő modellezésének bonyolultsága miatt azonban csak az eredeti Lee-Carter modellre, ami, mint láttuk, már az egypopulációs modellezéshez sem mondható igazán erősnek. Az irányzat egyik legújabb tanulmánya, Li, Zhou és Hardy 2015-ös írásában viszont már mindegyik korábban említett standard modellre kidolgozta a kétpopulációs eset modellfelírásait. Ezt fogom bemutat- 28
29 ni a következő két alfejezetben, melynek kidolgozása során erősen támaszkodtam a fent említett három cikk mindegyikére. Az n populációra való általánosítás egyelőre itt még nincs levezetve, és elemzésem sem tartalmaz kettőnél magasabb dimenziójú modelleket. Jövőbeli nemzetközi analízisekhez viszont szükségessé válhat még az általánosítás Modellfelírások és paraméterbecslés A több populációra való kiterjesztés első lépéseként írjuk fel minden populációra a standard modellt. Az egységes jelöléshez felső indexbe fogom írni a populáció sorszámát. Így tehát a következő 6 konstrukciót tekintjük: 3.1. táblázat: Multipopulációs modellek Mortalitás modell Poisson Lee-Carter Renshaw-Haberman APC CBD M7 Plat Struktúra η (j) x,t = α(j) x η (j) x,t = α(j) x + β x (1,j) κ (1,j) t + β x (1,j) κ (1,j) t + γ (j) t x η (j) x,t = α(j) x + κ (1,j) t + γ (j) t x η (j) x,t = κ(1,j) t + (x x)κ (2,j) t η (j) x,t = κ(1,j) t + (x x)κ (2,j) t η (j) x,t = α(j) x + κ (1,j) t + (x x)κ (2,j) t + γ (j) t x + κ (3,j) ( t (x x) 2 + ˆσ x) 2 (j) + γ t x Elevenítsük fel a korábbi jelöléseket, immár a j-edik populációra értelmezve, és továbbra is az x = 1, 2,..., X illetve t = 1, 2,..., T futóindexeket használva: m (j) x,t : a j-edik populáció központi halandósági rátája az x éves korcsoport és a t. naptári év esetén. q (j) x,t : a j-edik populáció x éves egyénére a t. időszakban vonatkozó egyéves halálozási valószínűség. η (j) x,t : a linkfüggvény milyenségéből adódó logaritmikus vagy logit mortalitási ráta. Poisson Lee-Carter, R-H és APC modellek esetén ln m (j) használata a javasolt az alkotók ajánlása alapján, míg a többi modellnél ln is megengedett. α (j) x,t : a kor szerinti hatás paramétere. x,t ( (j) q x,t 1 q (j) x,t ), de ettől eltérő alkalmazás κ (i,j) x,t β (i,j) x,t (i = 1, 2, 3): mortalitási indexek. (i = 1): a halandósági ráta érzékenysége az i-edik mortalitási indexre. 29
Antal Edina. Halandósági modellek összehasonlítása és alkalmazása
Budapesti Corvinus Egyetem Eötvös Loránd Tudományegyetem Antal Edina Halandósági modellek összehasonlítása és alkalmazása MSc Szakdolgozat Biztosítási és pénzügyi matematika MSc Aktuárius specializáció
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Matematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 11. Előadás Portfólió probléma Portfólió probléma Portfólió probléma Adott részvények (kötvények,tevékenységek,
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Likelihood, deviancia, Akaike-féle információs kritérium
Többváltozós statisztika (SZIE ÁOTK, 2011. ősz) 1 Likelihood, deviancia, Akaike-féle információs kritérium Likelihood függvény Az adatokhoz paraméteres modellt illesztünk. A likelihood függvény a megfigyelt
Vékás Péter 1 Nyugdíjcélú életjáradékok életartam-kockázata az általánosított korcsoport időszak kohorsz modellkeretben
Vékás Péter 1 Nyugdíjcélú életjáradékok életartam-kockázata az általánosított korcsoport időszak kohorsz modellkeretben Tanulmányom módszertani részében a halandóság statisztikai előrejelzésére alkalmazható
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
Least Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
Nyugdíjcélú életjáradékok élettartam-kockázata az általánosított korcsoport-idôszak-kohorsz modellkeretben
Nyugdíjcélú életjáradékok élettartam-kockázata az általánosított korcsoport-idôszak-kohorsz modellkeretben Vékás Péter, a Budapesti Corvinus Egyetem tanársegédje, az MTA-BCE Lendület Stratégiai Interakciók
A Lee-Carter módszer magyarországi
A Lee-Carter módszer magyarországi alkalmazása Baran Sándor, Gáll József, Ispány Márton, Pap Gyula Alkalmazott Matematika és Valószínűségszámítás Tanszék, Debreceni Egyetem, Informatikai Kar 1 Feladatok:
BIOMATEMATIKA ELŐADÁS
BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség
Statisztikai módszerek a skálafüggetlen hálózatok
Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti
A Markowitz modell: kvadratikus programozás
A Markowitz modell: kvadratikus programozás Losonczi László Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar Debrecen, 2011/12 tanév, II. félév Losonczi László (DE) A Markowitz modell 2011/12 tanév,
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés
Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
Adaptív dinamikus szegmentálás idősorok indexeléséhez
Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november
Vékás Péter. Az élettartam-kockázat. modellezése
Vékás Péter Az élettartam-kockázat modellezése Operációkutatás és Aktuáriustudományok Tanszék Témavezetők: Dr. Kovács Erzsébet CSc Dr. Deák István DSc Vékás Péter Budapesti Corvinus Egyetem Általános és
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
A Markowitz modell: kvadratikus programozás
A Markowitz modell: kvadratikus programozás Harry Markowitz 1990-ben kapott Közgazdasági Nobel díjat a portfolió optimalizálási modelljéért. Ld. http://en.wikipedia.org/wiki/harry_markowitz Ennek a legegyszer
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
Loss Distribution Approach
Modeling operational risk using the Loss Distribution Approach Tartalom»Szabályozói környezet»modellezési struktúra»eseményszám eloszlás»káreloszlás»aggregált veszteségek»további problémák 2 Szabályozói
Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Valószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
TÉZISGYŰJTEMÉNY. Vékás Péter
Általános és Kvantitatív Közgazdaságtan Doktori Iskola TÉZISGYŰJTEMÉNY Vékás Péter Az élettartam-kockázat modellezése című Ph.D. értekezéséhez Témavezetők: Dr. Kovács Erzsébet CSc Dr. Deák István DSc Budapest,
Matematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
1. Példa. A gamma függvény és a Fubini-tétel.
. Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
Növelhető-e a csőd-előrejelző modellek előre jelző képessége az új klasszifikációs módszerek nélkül?
Közgazdasági Szemle, LXI. évf., 2014. május (566 585. o.) Nyitrai Tamás Növelhető-e a csőd-előrejelző modellek előre jelző képessége az új klasszifikációs módszerek nélkül? A Bázel 2. tőkeegyezmény bevezetését
Gazdasági matematika II. vizsgadolgozat megoldása A csoport
Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.
Pontműveletek Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2012. február 20. Sergyán (OE NIK) Pontműveletek 2012. február 20. 1 / 40 Felhasznált irodalom
1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)
Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő
TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató
BGF PÉNZÜGYI ÉS SZÁMVITELI KAR Módszertani Intézeti Tanszéki Osztály TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató 2015/2016. tanév I. félév Tantárgyi program Tantárgy megnevezése Tantárgy jellege/típusa:
Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.
Nagyságrendek Kiegészítő anyag az Algoritmuselmélet tárgyhoz (a Rónyai Ivanyos Szabó: Algoritmusok könyv mellé) Friedl Katalin BME SZIT friedl@cs.bme.hu 018. február 1. Az O, Ω, Θ jelölések Az algoritmusok
A leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
Gépi tanulás és Mintafelismerés
Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,
A MIDAS_HU modell elemei és eredményei
A MIDAS_HU modell elemei és eredményei Tóth Krisztián Országos Nyugdíjbiztosítási Főigazgatóság A MIDAS_HU mikroszimulációs nyugdíjmodell eredményei további tervek Workshop ONYF, 2015. május 28. MIDAS_HU
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
TANTÁRGYI PROGRAM Matematikai alapok II. útmutató
BGF PÉNZÜGYI ÉS SZÁMVITELI KAR Módszertani Intézeti Tanszéki Osztály TANTÁRGYI PROGRAM Matematikai alapok II. útmutató 2013/2014. tanév II. félév Tantárgyi program Tantárgy megnevezése Tantárgy jellege/típusa:
Matematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai
Exponenciális kisimítás Üzleti tervezés statisztikai alapjai Múlt-Jelen-Jövő kapcsolat Egyensúlyi helyzet Teljes konfliktus Részleges konfliktus: 0 < α < 1, folytatódik a múlt, de nem változatlanul módosítás:
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.
Poisson folyamatok, exponenciális eloszlások Azt mondjuk, hogy a ξ valószínűségi változó Poisson eloszlású λ, 0 < λ
Gazdasági matematika II. vizsgadolgozat megoldása, június 10
Gazdasági matematika II. vizsgadolgozat megoldása, 204. június 0 A dolgozatírásnál íróeszközön kívül más segédeszköz nem használható. A dolgozat időtartama: 90 perc. Ha a dolgozat első részéből szerzett
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
Differenciálegyenletek numerikus megoldása
a Matematika mérnököknek II. című tárgyhoz Differenciálegyenletek numerikus megoldása Fokozatos közeĺıtés módszere (1) (2) x (t) = f (t, x(t)), x I, x(ξ) = η. Az (1)-(2) kezdeti érték probléma ekvivalens
Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához
Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához Izsák Ferenc 2007. szeptember 17. Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához 1 Vázlat Bevezetés: a vizsgált egyenlet,
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Vékás Péter. Az élettartam-kockázat. modellezése
Vékás Péter Az élettartam-kockázat modellezése Operációkutatás és Aktuáriustudományok Tanszék Témavezetők: Dr. Kovács Erzsébet CSc Dr. Deák István DSc Vékás Péter Budapesti Corvinus Egyetem Általános és
A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata
A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
Valószínűségi változók. Várható érték és szórás
Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :
5. előadás - Regressziószámítás
5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat
egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk
Valószínűségszámítás 8. feladatsor 2015. november 26. 1. Bizonyítsuk be, hogy az alábbi folyamatok mindegyike martingál. a S n, Sn 2 n, Y n = t n 1+ 1 t 2 Sn, t Fn = σ S 1,..., S n, 0 < t < 1 rögzített,
(Independence, dependence, random variables)
Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,
Markov-láncok stacionárius eloszlása
Markov-láncok stacionárius eloszlása Adatbányászat és Keresés Csoport, MTA SZTAKI dms.sztaki.hu Kiss Tamás 2013. április 11. Tartalom Markov láncok definíciója, jellemzése Visszatérési idők Stacionárius
i p i p 0 p 1 p 2... i p i
. vizsga, 06--9, Feladatok és megoldások. (a) Adja meg az diszkrét eloszlás várható értékének a definícióját! i 0... p i p 0 p p... i p i (b) Tegyük fel, hogy a rigófészkekben található tojások X száma
Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ
Megoldások Harmadik fejezet gyakorlatai 3.. gyakorlat megoldása ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4;, 3 normális eloszlású P (ξ 8 ξ 5 feltételes valószínűségét (.3. alapján számoljuk.
Termelés- és szolgáltatásmenedzsment
Termelés- és szolgáltatásmenedzsment egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék Termelés- és szolgáltatásmenedzsment 13. Előrejelzési módszerek 14. Az előrejelzési modellek felépítése
Lineáris algebra numerikus módszerei
Hermite interpoláció Tegyük fel, hogy az x 0, x 1,..., x k [a, b] különböző alappontok (k n), továbbá m 0, m 1,..., m k N multiplicitások úgy, hogy Legyenek adottak k m i = n + 1. i=0 f (j) (x i ) = y
Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n
Elemi statisztika >> =weiszd=
Készítette: Fegyverneki Sándor
VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y
6. előadás - Regressziószámítás II.
6. előadás - Regressziószámítás II. 2016. október 10. 6. előadás 1 / 30 Specifikációs hibák A magyarázó- és eredményváltozók kiválasztásának alapja: szakirányú elmélet, mögöttes viselkedés ismerete, múltbeli
Bevezetés az állapottér-elméletbe Dinamikus rendszerek állapottér reprezentációi
Tartalom Bevezetés az állapottér-elméletbe Irányítható alak Megfigyelhetőségi alak Diagonális alak Állapottér transzformáció 2018 1 A szabályozáselmélet klasszikus, BODE, NICHOLS, NYQUIST nevéhez kötődő,
Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH
Idősorok Idősor Statisztikai szempontból: az egyes időpontokhoz rendelt valószínűségi változók összessége. Speciális sztochasztikus kapcsolat; a magyarázóváltozó az idő Determinisztikus idősorelemzés esetén
REGIONÁLIS KLÍMAMODELLEZÉS AZ OMSZ-NÁL. Magyar Tudományos Akadémia szeptember 15. 1
Regionális klímamodellezés az Országos Meteorológiai Szolgálatnál HORÁNYI ANDRÁS (horanyi.a@met.hu) Csima Gabriella, Szabó Péter, Szépszó Gabriella Országos Meteorológiai Szolgálat Numerikus Modellező
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
Gazdasági matematika II. tanmenet
Gazdasági matematika II. tanmenet Mádi-Nagy Gergely A hivatkozásokban az alábbi tankönyvekre utalunk: T: Tóth Irén (szerk.): Operációkutatás I., Nemzeti Tankönyvkiadó 1987. Cs: Csernyák László (szerk.):
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
Matematikai geodéziai számítások 5.
Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP
Principal Component Analysis
Principal Component Analysis Principal Component Analysis Principal Component Analysis Definíció Ortogonális transzformáció, amely az adatokat egy új koordinátarendszerbe transzformálja úgy, hogy a koordináták
Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta
Autoregresszív és mozgóátlag folyamatok Géczi-Papp Renáta Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
Szolvencia II. Biztosítástechnikai tartalékok 2005.04.27
Szolvencia II. Biztosítástechnikai tartalékok 2005.04.27 Biztosítástechnikai tartalékok A. Nem-életbiztosítási tartalékok B. Életbiztosítási tartalékok C. Próbaszámolások 2005.04.27 2 A. Nem-életbiztosítási
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
Autoregresszív és mozgóátlag folyamatok
Géczi-Papp Renáta Autoregresszív és mozgóátlag folyamatok Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
A Termelésmenedzsment alapjai tárgy gyakorló feladatainak megoldása
azdaság- és Társadalomtudományi Kar Ipari Menedzsment és Vállakozásgazdaságtan Tanszék A Termelésmenedzsment alapjai tárgy gyakorló feladatainak megoldása Készítette: dr. Koltai Tamás egyetemi tanár Budapest,.
A valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén
Matematikai modellek, I. kisprojekt Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén Unger amás István B.Sc. szakos matematikus hallgató ungert@maxwell.sze.hu, http://maxwell.sze.hu/~ungert
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
Módszertani hozzájárulás a Szegénység
Módszertani hozzájárulás a Szegénység Többváltozós Statisztikai Méréséhez MTA doktori értekezés főbb eredményei Hajdu ottó BCE KTK Statisztika Tanszék BME GTK Pénzügyek Tanszék Hajdu Ottó 1 Egyváltozós
AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON
AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON DR. PAKSY ANDRÁS A lakosság egészségi állapotát jellemző morbiditási és mortalitási mutatók közül a halandósági tábla alapján
Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban
Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban Szépszó Gabriella Országos Meteorológiai Szolgálat, szepszo.g@met.hu RCMTéR hatásvizsgálói konzultációs workshop 2015. június 23.
Többváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull
14 A Black-choles-Merton modell Copyright John C. Hull 01 1 Részvényárak viselkedése (feltevés!) Részvényár: μ: elvárt hozam : volatilitás Egy rövid Δt idő alatt a hozam normális eloszlású véletlen változó:
Gauss elimináció, LU felbontás
Közelítő és szimbolikus számítások 3. gyakorlat Gauss elimináció, LU felbontás Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 EGYENLETRENDSZEREK 1. Egyenletrendszerek
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció: