Eötvös Loránd Tudományegyetem Természettudományi Kar Kopulák alkalmazása a nem-élet biztosításokban Biró Bianka Alkalmazott matematikus BSc Témavezet : Dr. Zempléni András egyetemi docens Valószín ségelméleti és Statisztika Tanszék Budapest, 2016
Tartalomjegyzék 1. A kétdimenziós összefügg ség modellezése 7 1.1. Mér számok az összefügg ség vizsgálatára............... 8 1.1.1. Pearson-féle korrelációs együttható............... 8 1.1.2. Rangkorrelációs együtthatók................... 8 1.1.3. Farok-összefüggés......................... 9 1.2. A kopulák és tulajdonságaik....................... 10 1.3. A kopulák f bb fajtái........................... 12 1.3.1. Elliptikus kopulák......................... 12 1.3.2. Arkhimédeszi kopulák...................... 13 1.3.3. A kopulafajták összehasonlítása................. 17 1.4. A kopulák és a rangkorrelációs együtthatók kapcsolata........ 19 2. Módszerek kopulák illesztésére 22 2.1. A paraméterek maximum likelihood becslése.............. 22 2.2. Kopula illesztése rangszámok segítségével................ 23 2.2.1. Empirikus kopulák........................ 23 2.3. A megfelel kopula kiválasztása és az illeszkedés pontossága..... 24 2.4. Szimuláció Arkhimédeszi kopulákból.................. 25 3. Kopula illesztése a vizsgált adatokra 27 3.1. Az adatok bemutatása.......................... 27 3.2. Kopula illesztése............................. 29 4. Alkalmazás viszontbiztosítások díjkalkulációjára 32 4.1. A viszontbiztosítások........................... 32 4.1.1. A matematikai modell...................... 33 2
4.2. Peremeloszlások.............................. 34 4.3. Viszontbiztosítások árazása....................... 35 5. Összefoglalás 41 3
Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani témavezet mnek, Zempléni Andrásnak, aki mindvégig gyelemmel kísérte a munkám, hasznos tanácsokkal látott el, és segített egy olyan téma kiválasztásában, aminek feldolgozására sokszor kikapcsolódásként tekinthettem. Hálás vagyok családomnak a tanulmányaim alatt nyújtott sok-sok biztatásért és támogatásért, valamint barátaimnak, amiért végtelen türelemmel mellettem álltak a legnehezebb napokban is. Közülük külön köszönet illeti Rácz Nórit, aki lelkesedésével mindvégig motivált, és olykor szinte jobban várta a szakdolgozatom elkészültét, mint jómagam. Végül, de nem utolsó sorban, köszönettel tartozom Banáné Gyuró Juliannának, Szauer Anitának és Kiss Zoltánnak, akik nélkül ma 1-valószín séggel olyan dologgal foglalkoznék, ami kevésbé érdekel, mint a matematika. 4
Bevezetés A biztosítás alapait már az ókorban lefektették a kínai keresked k, akik a szállítani kívánt árut több hajóra osztották szét, csökkentve ezzel a kockázatot, hogy egy esetleges hajótörés során a teljes árukészlet kárbavesszen, továbbá közös pénzalapot hoztak létre a veszteségek enyhítésére. Id vel a díjak mértékét függ vé tették többek közt a szállított árutól, valamint az út hosszától, viszont matematikai-statisztikai alapjai nem voltak még a díjszámításnak. A biztosításmatematika kialakulása a valószín ségszámítás és statisztika fejl désével vonható párhuzamba, melynek kezdete a XVII. századra datálható. Az id közben létrejött biztosítótársaságok különböz kockázattípusok alapján hozták létre termékeiket, a díjak számításában pedig egyre nagyobb szerepet játszottak különböz statisztikák és az egyes kockázatok eloszlásai is. Mára már számos terméket találunk a piacon, a biztosítók pedig különböz kockázatfügg modellek és alapos elemzések segítségével törekednek az optimális díjkalkulációra, és tartanak lépést a kockázatok folyamatos változásával és a tudomány fejl désével. A modern biztosításokat két nagy csoportba, az élet- és nem-életbiztosítások közé sorolhatjuk. Az életbiztosítási szerz dések jellemz en hosszútávúak, melyek során a halálozás kockázata folyamatosan n. A nem-életbiztosításokhoz általában egy éves, lejáratkor hosszabbítható szerz dések tartoznak, a kockázatok pedig lényegében állandónak mondhatók. Ebbe az ágba soroljuk többek közt a felel sség-, baleset- és lakásbiztosításokat. Nem nehéz meggondolni, hogy a két ágnál jelent sen eltér ek mind a tartalékképzés, mind a díjkalkuláció módszerei. A dolgozatban els ként kétdimenziós összefügg séget szeretnénk modellelzni, amiben a kopulafüggvények lesznek segítségünkre, melyek a XX. század végén kezdtek teret hódítani a biztosításmatematikán túl többek között pénzügyi matematikában, biológiában, valamint hidrológiában is. A széleskör alkalmazhatóság nem meglep, ugyanis számos területen van szükség arra, hogy összefügg valószín - 5
ségi változók együttes eloszlását becsüljük, ez pedig kopulák segítségével egyszer en megtehet akár magasabb dimenzióban is. A modellt alkalmazva szeretnénk viszontbiztosítások árazásába betekintést nyerni, melyhez felel sségbiztosítások kárkizetési összegei, valamint a hozzájuk tartozó kárrendezési költségek állnak rendelkezésünkre. Sejthet, hogy ezek nem függetlenek egymástól, továbbá mivel a költségek nem-életbiztosításoknál igen magasak lehetnek, a díjkalkuláció során sem mondhatók elhanyagolandónak. Az els fejezetben látni fogjuk, hogy miként jellemezhet két valószín ségi változó kapcsolata, és bemutatjuk magát a kétdimenziós összefügg ségi modellt is. Ezután a második fejezetben különböz módszereket ismertetünk kopulák illesztésére, majd a harmadik fejezetben alkalmazva mindezt az általunk vizsgált adatsorokra, eredményként a kárkizetések és költségek együttes eloszlására kapunk becslést. A negyedik fejezetben megvizsgáljuk az egyes peremeloszlásokat, majd összehasonlítjuk az összefügg ségi modell alapján számolt viszontbiztosítási díjakat a függetlennek tekintett változók eloszlása alapján számoltakkal. 6
1. fejezet A kétdimenziós összefügg ség modellezése Amikor több valószín ségi változó együttes viselkedését szeretnénk vizsgálni, az el ször felmerül kérdések egyike, hogy milyen kapcsolat áll fenn köztük. Amennyiben függetlenek egymástól, az együttes eloszlásfüggvényük felírható az egyes változók eloszlásfüggvényeinek szorzataként, ezek pedig a gyakorlatban is különböz statisztikai módszerekkel egyszer en becsülhet k. Sok esetben viszont nincs ennyire egyszer dolgunk. Gyakran van szükség ugyanis arra, hogy olyan változók együttes eloszlására adjunk becslést, melyek nem függetlenek egymástól. Összefügg változók esetén ez lényegesen bonyolultabb lehet, és a dimenziószám növekedésével is egyre több akadályba ütközhetünk. Ebben lesznek segítségünkre a kopulafüggvények, melyek az egydimenziós peremeloszlásokat kapcsolják össze az együttes eloszlással egy, a változók közti összefüggésen alapuló paraméteren keresztül. Els ként az összefügg ség leírásához használatos mér számokat mutatjuk be, majd bevezetjük a kopulák denícióját és ismertetjük a leggyakrabban használt fajtáikat [7] és [8] alapján. Mivel a dolgozatban szerepl alkalmazásban két változó közti kapcsolatot vizsgáljuk, a következ deníciókat és tételeket a kétdimenziós esetre mondjuk ki, de magasabb dimenzióra is analóg módon kiterjeszthet k. 7
1.1. Mér számok az összefügg ség vizsgálatára A megfelel kopula kiválasztásához alapvet fontosságú, hogy ismerjük a változók közti kapcsolatot, melyet különböz mér számokkal jellemezhetünk attól függ en, hogy lineáris kapcsolatot, konkordanciát vagy az eloszlás szélein jelentkez farokösszefüggést szeretnénk vizsgálni. 1.1.1. Pearson-féle korrelációs együttható A Pearson-féle korrelációs együttható a leginkább elterjedt mér szám, ami két változó közti lineáris kapcsolat er sségét, valamint irányát mutatja meg. 1.1.1. Deníció. Az X 1 és X 2 valószín ségi változók Pearson-féle korrelációs együtthatója a R(X 1, X 2 ) = cov(x 1, X 2 ) D(X 1 )D(X 2 ), ahol cov(x 1, X 2 ) = E(X 1 X 2 ) E(X 1 )E(X 2 ), továbbá D(X 1 ), D(X 2 ) > 0 rendre X 1 és X 2 szórásai, E pedig a várható értéket jelöli. Amennyiben R(X 1, X 2 ) = 0, X 1 -et és X 2 -t korreálatlannak nevezzük. Normális eloszlású valószín ségi változók esetében a korreálatlanság ekvivalens a függetlenséggel, ellenben más eloszlásoknál ez nincs így. Ha a változók függetlenek, akkor korreálatlanok, viszont a korreálatlanságból nem következtethetünk függetlenségre. A Pearson-féle korrelációs együttható további hátránya, hogy érzékeny a kiemelked en nagy, illetve kicsi értékekre, valamint mivel nem invariáns a monoton transzformációra, az eredeti és a kopulából generált változókra kiszámolva is más-más értéket kapunk. 1.1.2. Rangkorrelációs együtthatók A Pearson-féle korrelációs együttható hátrányainak kiküszöböléséhez érdemes bevezetnünk a rangkorrelációs együtthatók fogalmát. Ha X 1 -et és X 2 -t egy-egy mintának tekintjük, ezek nagyság szerinti sorbarendezésével minden adatnak megfeleltethetünk egy-egy ún. rangszámot, ami azt mutatja meg, hogy a szóbanforgó adat hányadik legnagyobb érték a rendezett mintában. Ezeket a rangszámokat használva nem kell attól tartanunk, hogy a kiugró értékek 8
torzítanak az eredményen. A Spearman- és a Kendall-féle rangkorrelációs együtthatókkal a változók együttmozgását vizsgálhatjuk, utóbbi segítségével pedig egyszer en kifejezhetjük az Arkhimédeszi kopulák összefügg ségi paraméterét is. Kendall-féle τ 1.1.2. Deníció. Legyen (X 11, X 21 ) és (X 12, X 22 ) két független koordinátapár F-b l. Ekkor ρ τ (X 1, X 2 ) = P [(X 11 X 12 )(X 21 X 22 ) > 0] P [(X 11 X 12 )(X 21 X 22 ) < 0] a Kendall-féle rangkorrelációs együttható. A denícióban szerepl P [(X 11 X 12 )(X 21 X 22 ) > 0] az egyez (konkordáns) párok valószín sége, míg P [(X 11 X 12 )(X 21 X 22 ) < 0] az ellentétes (diszkordáns) pároké. A konkordanciából arra következtethetünk, hogy az egyes változók nagy értékei állnak összefüggésben, míg a diszkordancia arra utal, hogy az egyik változó nagy, és a másik kis értékei között tapasztalhatunk összefüggést. Spearman-féle ρ A Spearman-féle rangkorrelációs együttható a rangszámok közti Pearson-féle korreláció. 1.1.3. Deníció. Jelölje d i az X 1i - és X 2i -hez tartozó rangszámok különbségét i = 1, 2,..., n-re n-dimenziós vektorváltozók esetén. Ekkor a Spearman-féle rangkorrelációs együttható a ρ S = 1 6 d 2 i n(n 2 1). Hasonlóan Pearson korrelációs együtthatójához, ρ S és ρ τ értékei is -1 és 1 között helyezkednek el, szimmetrikusak, valamint 0-val való egyenl ségük esetén egymástól függetlennek tekintjük a változókat. 1.1.3. Farok-összefüggés A gyakorlatban sokszor f ként az extrém-értékek között fennálló konkordancia kérdése az érdekes. Ennek vizsgálata azon a feltételes valószín ségen alapul, hogy 9
az egyik változó meghalad-e egy rögzített küszöbértéket azon feltétel mellett, hogy a másikról tudjuk, hogy igen. Jelölje S a változók együttes túlélésfüggvényét, azaz v [0, 1]-re S(v, v) = P (F 1 1 (X 1 ) > v, F 1 2 (X 2 ) > v). Ekkor λ L -el jelölve az alsó és λ U -val a fels farok-összefüggést, λ L = lim v 0 P (F 1 1 (X 1 ) < v F 1 2 (X 2 ) < v), λ U = lim v 1 P (F 1 1 (X 1 ) > v F 1 2 (X 2 ) > v). Amennyiben λ L = 0, nem tapasztalhatunk bal oldali, λ U = 0 esetén jobb oldali farok-összefüggést az adatok közt. Az extrém-érték elmélet biztosítási alkalmazásaiban λ U vizsgálata széles körben elterjedt, ugyanis segítségével felmérhet annak a valószín sége, hogy egy nagy káresemény bekövetkezése más egyéb hasonló mérték károkat von maga után. 1.2. A kopulák és tulajdonságaik 1.2.1. Deníció. Legyen U egy tetsz leges [0, 1] 2 -beli vektorváltozó, melynek U 1 és U 2 marginálisai a [0, 1] intervallumonn egyenletes eloszlást követnek. Azon C : [0, 1] 2 [0, 1] függvényeket, melyek felírhatók C(u 1, u 2 ) = P (U 1 u 1, U 2 u 2 ) (1.1) alakban, (kétdimenziós) kopuláknak nevezzük. Mivel C egy kétdimenziós eloszlásfüggvényt deniál, minden kopulára teljesülnek az alábbi tulajdonságok: 1. C (0, u) = C (u, 0) = 0 2. C (1, u) = C (u, 1) = u, u [0, 1] 3. C (v 1, v 2 ) + C (u 1, u 2 ) C (v 1, u 2 ) + C (u 1, v 2 ), (u 1, u 2 ) [0, 1] 2 ; (v 1, v 2 ) [0, 1] 2 ], 0 u 1 v 1 1; 0 u 2 v 2 1 10
Vegyük észre, hogy minden kétdimenziós eloszlásfüggvényhez rendelhetünk kopulát. Ismeretes ugyanis, hogy tetsz leges folytonos valószín ségi változót integráltranszformációval [0, 1] intervallumon egyenletes eloszlásúvá transzformálhatunk, azaz véve egy F 1 eloszlásfüggvény X 1 és egy F 2 eloszlásfüggvény X 2 változót, j = 1, 2-re: P (F j (X j ) u) = P (X j (F 1 j )(u)) = F j (F 1 j (u)) = u. az általánosított inver- 1.2.2. Megjegyzés. Amennyiben F j nem invertálható, F 1 j zet jelöli. Továbbá C(u 1, u 2 ) = P (F 1 (x 1 ) u 1, F 2 (x 2 ) u 2 ) = = P (X 1 F 1 1 (u 1 ), X 2 F 1 2 (u 2 )) = = F (F 1 1 (u 1 ), F 1 2 (u 2 )), amib l adódóan C(F 1 (x 1 ), F 2 (x 2 )) = F (x 1, x 2 ) (1.2) egy kétváltozós eloszlásfüggvényt deniál F 1 és F 2 marginálisokkal. Ezáltal tehát a kopulák lehet vé teszik számunkra, hogy a peremeloszlásokat külön vizsgáljuk az együttes eloszlástól, valamint magasabb dimenzióban is kényelmes eszközként szolgálnak a változók együttes viselkedésének tanulmányozására. A kopulák elméleti alapjait Wassily Hoeding fektette le 1940-ben, majd Maurice Fréchet kezdte vizsgálni a kapcsolatot többdimenziós eloszlások és azok peremeloszlásai között. Mindezek után Abe Sklar 1959-ben mutatta meg, hogy bármely többváltozós eloszlásfüggvény felírható az (1.2) alakban, továbbá a peremeloszlások folytonossága esetén a kopula egyértelm. Ezt az eredményt foglalja össze az alábbi tétel: 1.2.3. Tétel (Sklar). Legyenek X 1 és X 2 valószín ségi változók, melyek eloszlásfüggvényei rendre F 1 és F 2, együttes eloszlásfüggvényüket pedig jelölje F. Ekkor létezik egy C kopula, melyre F (x 1, x 2 ) = C(F 1 (x 1 ), F 2 (x 2 )). F 1 és F 2 folytonossága esetén C egyértelm. 11
1.3. A kopulák f bb fajtái A leggyakrabban használt kopulákat két nagy családba, az elliptikus és Arkhimédeszi kopulák közé sorolhatjuk. A következ kben ezen kopulacsaládok, és az ezekbe tartozó nevezetes kopulák kerülnek bemutatásra. 1.3.1. Elliptikus kopulák Az elliptikus kopulák sajátosságai, hogy valamely elliptikus eloszlásból származtatjuk ket, ezáltal hasonlóan könnyen tudunk szimulálni is bel lük, mint az elliptikus eloszlásokból. Az elliptikus eloszlások a többváltozós normális eloszlások általánosításai, melyek számos biztosítási és pénzügyi alkalmazásban jelentenek hatékony eszközt különböz kockázatok eloszlásainak vizsgálatára. 1.3.1. Deníció. Az X = (X 1, X 2 ) valószín ségi vektorváltozót (µ, Σ, ζ) paraméter elliptikus eloszlásúnak mondjuk, ha karakteriszikus függvénye φ X (t) = exp(it T µ)ζ(t T Σt) alakú, ahol µ egy kétdimenziós oszlopvektor, Σ egy 2 2-es pozitív denit mátrix, ζ pedig az ún. karakterisztikus generátorfüggvény. A legfontosabb példa elliptikus eloszlásokra a normális és t-eloszlás. Az alábbiakban az ezekb l származtatott kopulákat mutatjuk be. Gauss-kopula 1.3.2. Deníció. Jelölje Φ az egy-, Φ R a kétdimenziós, R korrelációmátrixú standard normális eloszlás eloszlásfüggvényét. Ekkor a C G (u 1, u 2 ) = Φ R (Φ 1 (u 1 ), Φ 1 (u 2 )) a kétdimenziós normális eloszlás kopuláit, a Gauss-kopulákat határozza meg. A pozitív, illetve negatív paraméter Gauss-kopulák közti különbséget az 1.1. ábra szemlélteti, valamint az is jól látszik, hogy az összefügg ség az eloszlás szélein jelentkezik er sebben. 12
1.1. ábra. Gauss-kopula pozitív és negatív paraméterrel Student-féle t-kopula 1.3.3. Deníció. A Student-féle t-kopula a a kétdimenziós t-eloszlásból származtatott kopula, azaz C R,ν (u 1, u 2 ) = t R,ν (tν 1 (u 1 ), t 1 ν (u 2 )), ahol ν a t-eloszlás szabadságfokát, R a változók korrelációmátrixát jelöli. A kopula szélein az összefügg ség er ssége a korrelációtól és ν értékét l függ, valamint ahogy a paraméter -hez közelít, C R,ν (u 1, u 2 ) Φ R (u 1, u 2 ). A t-eloszlás sajátossága továbbá, hogy az eloszlás szabadságfokával megegyez, vagy annál magasabb rend momentumai nem léteznek. 1.3.2. Arkhimédeszi kopulák 1.3.4. Deníció. Legyen ψ : [0, 1] [0, ] folytonos, szigorúan monoton csökken konvex függvény, melyre ψ(1) = 0, ψ(0) =. A ψ [ 1] : [0, ] [0, 1] függvényt ψ pszeudo-inverzének nevezzük, ha { ψ 1 ψ [ 1], ha 0 t ψ(0) (t) = 0, ha ψ(0) t. 1.3.5. Lemma. Legyen ψ a fenti deníció feltételeinek eleget tev függvény, melynek pszeudo-inverze ψ [ 1]. Ekkor ha C felírható C(u 1, u 2 ) = ψ [ 1] (ψ(u 1 ) + ψ(u 2 )) (1.3) 13
alakban, akkor C teljesíti a kopulák határaira vonatkozó feltételeket, azaz u [0, 1] C (0, u) = C (u, 0) = 0 C (1, u) = C (u, 1) = u. Bizonyítás. A határokon vizsgálva (1.3) képlettel felírt függvényt, C(u 1, 0) = ψ [ 1] (ψ(u 1 ) + ψ(0)) = 0, C(u 1, 1) = ψ [ 1] (ψ(u 1 ) + ψ(1)) = ψ [ 1] (ψ(u 1 )) = u 1. A szimmetrikusságot kihasználva pedig adódik, hogy C(0, u 2 ) = 0 és C(1, u 2 ) = u 2, ez pedig pontosan az, amit be szerettünk volna látni. Az alábbi tételben szükséges és elégséges feltételt kapunk annak igazolására, hogy ψ egy, a [0, 1] intervallumon egyenletes eloszlású marginálisokkal rendelkez kétdimenziós eloszlásfüggvényt generál, és az (1.3) alakban felírt C valóban egy kopulát határoz meg. 1.3.6. Tétel. Legyen ψ : [0, 1] [0, ] folytonos, szigorúan csökken függvény, melyre ψ(1) = 0, és legyen ψ pszeudo-inverze ψ [ 1]. Ekkor C : [0, 1] 2 [0, 1], melyre C(u 1, u 2 ) = ψ [ 1] (ψ(u 1 ) + ψ(u 2 )) pontosan akkor deniál egy kétdimenziós kopulát, ha ψ konvex. Bizonyítás. Láttuk, hogy C teljesíti a kopulák határaira vonatkozó feltételeket, továbbá belátható, hogy C(v 2, u 2 ) C(v 1, u 2 ) v 2 v 1. (1.4) pontosan ψ konvexitása esetén áll fenn. Vegyük észre, hogy ezzel a felírással ekvivalens v 1 v 2 -re a v 1 + ψ [ 1] (ψ(v 2 ) + ψ(u 2 )) v 2 + ψ [ 1] (ψ(v 1 ) + ψ(u 2 )), ami a = ψ(v 1 ), b = ψ(v 2 ) és c = ψ(u 2 ) helyettesítéssel ψ [ 1] (a) + ψ [ 1] (b + c) ψ [ 1] (b) + ψ [ 1] (a + c), (1.5) 14
ahol a b és c 0. Tegyük fel, hogy (1.4) fennáll és ψ [ 1] teljesíti (1.5)-öt. Válasszunk egy tetsz leges s és t számot a [0, ] intervallumból, melyekre 0 s < t. Ha a = s+t t s, b = s és c =, akkor 2 2 ψ [ 1] ( s + t 2 ) ψ[ 1] (s) + ψ [ 1] (t). 2 Mivel ψ [ 1] így teljesíti a konvexitás feltételeit, a tétel egyik irányát ezzel beláttuk. A másik irány bizonyításához tegyük fel, hogy ψ [ 1] konvex. Rögzítsük a, b és c értékét a [0, 1] intervallumban úgy, hogy a b és c 0, továbbá legyen γ = Így a = (1 γ)b + γ(a + c) és b + c = γb + (1 γ)(a + c), amib l ψ [ 1] (a) (1 γ)ψ [ 1] (b) + γψ [ 1] (a + c), ψ [ 1] (b + c) γψ [ 1] (b) + (1 γ)ψ [ 1] (a + c). a b. a b+c Az egyenl tlenségeket összeadva pont (1.5)-öt kapjuk, amivel a tétel másik felét is igazoltuk. A ψ által generált, C(u 1, u 2 ) = ψ [ 1] (ψ(u 1 ) + ψ(u 2 )) alakban el álló kopulákat nevezzük Arkhimédeszi kopuláknak, melyek összefügg ségi paraméterét a generátorfüggvény határozza meg. Az Arkhimédeszi kopulák általában - szemben az elliptikusok családjával - felírhatók zárt alakban, valamint nem valamely többváltozós eloszlásból származnak. Alapvet tulajdonságaik közé tartozik a szimmetria és az asszociativitás is, azaz: 1. C(u, v) = C(v, u) 2. C(C(u, v), z) = C(u, C(v, z)) Az Arkhimédeszi kopulákat a generátorfüggvény választásától függ en különböztethetjük meg egymástól, ψ tulajdonságai pedig jelent sen befolyásolják a kopula szélein jelentkez bal és jobb oldali farok-összefüggését. Az alábbiakban a Frank-, Clayton- és Gumbel-kopulákat fogjuk jellemezni és illusztrálni. Frank-kopula ( 1.3.7. Deníció. Az α (, ) összefügg ségi paraméter és ψ(t) = log generátorfüggvény által meghatározott Frank-kopula: C F r (u 1, u 2 ) = 1 α log(1 + (e αu 1 1)(e αu 2 1) ). e α 1 15 ) e αt 1 e α 1
Mivel α (, ), el fordulhat a marginálisok között negatív összefüggés is, valamint meggyelhet, hogy az eloszlás közepe nem szóródik. A Frank-kopula a gyakorlatban olyan adatsorokra alkalmazható, melyeknél mind a kis, és mind a nagy értékek közti összefüggés gyenge. 1.2. ábra. Frank-kopula pozitív és negatív paraméterrel Clayton-kopula 1.3.8. Deníció. Az α (0, ) összefügg ségi paraméter Clayton-kopula generátorfüggvénye a ψ(t) = t α 1, így a kopulát a következ alakban íthatjuk fel: C Cl (u 1, u 2 ) = (u α 1 + u α 2 1) 1/α. Mivel α a pozitív félegyenesen helyezkedik el, nem tapasztalhatunk negatív összefüggést a változók közt, továbbá ahogy α 0-hoz közelít, a marginálisok közti összefügg ség mértéke is csökken. A Clayton-kopulánál a bal oldali farok-összefüggés igen er s, míg ehhez képest a jobb oldali gyenge. Éppen ezért a gyakorlatban jól alkalmazható egymással korreáló kockázatok vizsgálatára, többek között két életre szóló életbiztosítások árazásánál is. Életbiztosításokkal foglalkozó szakemberek számára ugyanis ismert jelenség az ún. "broken heart syndrom", azaz az összetört szív szindróma. Statisztikai eredmények mutatják, hogy egy házaspár egyik tagjának elhalálozása után egy bizonyos id intervallumban a másikuk halálozási valószín sége is megn, ez pedig a két életre szóló életbiztosítások díjkalkulációjánál nem elhanyagolandó tényez, kopulák segítségével pedig jól modellezhet. 16
Gumbel-kopula 1.3.9. Deníció. Ha α [1, ) és a generátorfüggvény ψ(t) = ( log(t)) α alakú, akkor C Gu (u 1, u 2 ) = exp { [( log(u 1 )) α + ( log(u 2 )) α ] 1/α} a Gumbel-kopulát deniálja. Hasonlóan a Clayton-kopulához, nem tapasztalhatunk negatív összefüggést a marginálisok között, viszont vele ellentétben er s a farok-összefüggés a jobb, és gyenge a bal oldalon. Éppen ezért, ha az általunk vizsgált adatsorok nagy értékei er sen korreálnak, míg a kisebbek kevésbé, a Gumbel-kopula jó választásnak bizonyulhat. 1.3.3. A kopulafajták összehasonlítása Láthattuk, hogy különböz kopulához eltér tulajdonságú paraméterek tartoznak, valamint el állításuk is többféleképp történhet. Az alábbi ábrákon ugyanolyan összefügg ségi paraméter mellett ábrázoljuk a bemutatott kopulákat, a Gauss- és t-kopuláknak pedig a ν = 3 szabadságfokot választottuk. Minden típusnál meggyelhet, hogy milyen értékek között jelentkezik az er sebb összefügg ség, valamint az eredeti peremeloszlások által okozott eltérés is. Az 1.3. ábrán már τ = 0.4 esetén is jól látszik az összefüggés er ssége a Clyaton-kopulán a kicsi, míg a Gumbel-kopulán a nagy értékek közt, a Frank-, Gauss- és t-kopulánál viszont magasabb korrelációnál jelentkezik ez szemléletesebben, ahogy azt a további ábrák mutatják. 1.3. ábra. Arkhimédeszi kopulák ρ τ = 0.4 rangkorrelációs együtthatóval 17
1.4. ábra. Arkhimédeszi kopulák ρ τ = 0.6 rangkorrelációs együtthatóval 1.5. ábra. Elliptikus kopulák ρ τ = 0.4 mellett, a t-kopula ν = 3 szabadságfokkal A Gauss- és a t-kopula közti különbség f ként a farok-összefüggésben nyilvánul meg. A t-kopula rugalmas, mert amellett, hogy az eloszlás szélein fellép összefügg séget is mutathatja, az eloszlás közepén fellép összefügg ség modellezésére is alkalmas. 1.6. ábra. Elliptikus kopulák ρ τ = 0.6 mellett, a t-kopula ν = 3 szabadságfokkal 18
1.4. A kopulák és a rangkorrelációs együtthatók kapcsolata Korábban már láttuk, hogy az összefügg ségi mér számok közül a Pearson-féle korrelációs együttható nem invariáns a monoton transzformációra, így nem-elliptikus eloszlású változókra alkalmazva félrevezet eredményeket kaphatunk. Ennek elkerülése érdekében vezettük be a rangkorrelációs együtthatókat. A Spearman-féle ρ és a a Kendall-τ kopulákkal való kapcsolatát ismertetjük a következ kben [8] segítségével, ugyanis mindkét együttható kifejezhet a kopulákból, továbbá utóbbi segítségével az Arkhimédeszi kopulák paramétere is kiszámolható. 1.4.1. Állítás. Tetsz leges C kopulából a Spearman-féle ρ értékét a ρ S (X 1, X 2 ) = 12 integrál kiszámításával kaphatjuk meg. 1 1 0 0 C(u 1, u 2 )du 1 du 2 3 Tegyük fel, hogy X 1 eloszlásfüggvénye F 1, X 2 -é pedig F 2, és legyen F 1 (X 1 ) U 1, F 2 (X 2 ) U 2. Ebb l adódóan ρ S (X 1, X 2 ) = 12 1 1 0 0 = E(U 1, U 2 ) 1 4 1 12 C(u 1, u 2 )du 1 du 2 3 = 12E(U 1, U 2 ) 3 = = Cov(U 1, U 2 ) D(U1 ) D(U 2 ) = = ρ(f 1 (X 1 ), F 2 (X 2 )). Tehát ρ S nem más, mint az X 1 -b l és X 2 -ból integráltranszformációval kapott F 1 (X 1 ) és F 2 (X 2 ) közti korrelációs együttható. Nézzük most meg, mit mondhatunk el a kopulák és a Kendall-τ kapcsolatáról! 1.4.2. Állítás. A Kendall-τ a ρ τ (X 1, X 2 ) = 4 1 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ) 1 formula segítségével fejezhetjük ki tetsz leges C kopulából. 19
Bizonyítás. Láttuk, hogy ρ τ az X 1 és X 2 közti konkordancia és diszkordancia valószín ségének különbsége, azaz ρ τ (X 1, X 2 ) = P [(X 11 X 12 )(X 21 X 22 ) > 0] P [(X 11 X 12 )(X 21 X 22 ) < 0]. Mivel X 1 és X 2 folytonos, P [(X 11 X 12 )(X 21 X 22 ) < 0] = 1 P [(X 11 X 12 )(X 21 X 22 ) > 0], így ρ τ felírható ρ τ (X 1, X 2 ) = 2P [(X 11 X 12 )(X 21 X 22 ) > 0] 1 alakban, melyb l átalakítással P [(X 11 X 12 )(X 21 X 22 ) > 0] = = P [(X 11 > X 12 ), (X 21 > X 22 )] + P [(X 11 < X 12 ), (X 21 < X 22 )]. Ebb l P [(X 11 > X 12 ), (X 21 > X 22 )] = P [(X 12 < X 11 ), (X 22 < X 21 )] = = + + + + ahol u 1 = F 1, u 2 = F 2 transzformációval P [(X 11 > X 12 ), (X 21 > X 22 )] = P [(X 12 x 1 ), (X 22 x 2 )]dc(f 1 (x 1 ), F 2 (x 2 )) = C(F 1 (x 1 ), F 2 (x 2 ))dc(f 1 (x 1 ), F 2 (x 2 )), 1 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ). Hasonlóan, P [(X 11 < X 12 ), (X 21 < X 22 )] = = = + + + + P [(X 12 > x 1 ), (X 22 > x 2 )]dc(f 1 (x 1 ), F 2 (x 2 )) = [1 F 1 (x 1 ) F 2 (x 2 ) + C(F 1 (x 1 ), F 2 (x 2 ))]dc(f 1 (x 1 ), F 2 (x 2 )) = = 1 1 0 0 [1 u 1 u 2 + C(u 1, u 2 )]dc(u 1, u 2 ). Tudjuk, hogy C a [0, 1] intervallumon egyenletes eloszlású U 1 és U 2 változók együttes eloszlása, így E(U 1 ) = E(U 2 ) = 1, amib l 2 P [(X 11 < X 12 ), (X 21 < X 22 )] = 1 1 2 1 2 + 1 20 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ) =
= 1 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ). Tehát P [(X 11 < X 12 ), (X 21 < X 22 )] + P [(X 11 < X 12 ), (X 21 < X 22 )] = P [(X 11 X 12 )(X 21 X 22 ) > 0] = 2 amib l következik, hogy 1 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ), ρ τ (X 1, X 2 ) = 2P [(X 11 X 12 )(X 21 X 22 ) > 0] 1 = = 4 1 1 0 0 C(u 1, u 2 )dc(u 1, u 2 ) 1. Ez pedig pontosan az, ami be szerettünk volna látni. Ahogy már korábban említettük, a Kendall-τ segítségével meghatározhatjuk az Arkhimédeszi kopulák összefügg ségi paraméterét is. Ezt az alábbi táblázat foglalja össze, ahol a Frank-kopula paraméterét kifejez képletben D 1 ( α) = D 1 (α) + α 2, D 1 (α) = 1 α α 0 t e t 1 dt. Kopulacsalád ρ τ α Clayton α+2 Frank 1 4 (D α 1( α) 1) Gumbel 1 1 α 1.1. táblázat. α és ρ τ közti kapcsolat 21
2. fejezet Módszerek kopulák illesztésére Ebben a fejezetben két jól alkalmazható módszert fogunk bemutatni a megfelel kopula kiválasztására, majd teszteljük a becslések pontosságát is. 2.1. A paraméterek maximum likelihood becslése A kopula és a marginálisok paramétereinek becslésére a statisztika területén gyakran használt maximum likelihood (ML) módszert fogjuk alkalmazni, melyben [1] és [4] lesz segítségünkre. Legyen θ a becsülend paraméterekb l álló vektor. Az ML-becslés lényege, hogy adott mintarealizáció mellett a paraméter becsléseként azt a ˆθ-ot fogadjuk el, mely esetén maximális annak a valószín sége, hogy az adott mintarealizációt kapjuk. A módszer az eme valószín séget tükröz ún. likelihood-függvényt maximalizálja, mely alatt a mintaelemek együttes valószín - ségét, illetve s r ségfüggvényét értjük. Sklar tételéb l ismeretes, hogy egy 2-dimenziós F eloszlásfüggvény a hozzá tartozó F 1 és F 2 peremeloszlások, valamint a C kopula segítségével az F (x 1, x 2 ) = C(F 1 (x 1 ), F 2 (x 2 )) alakban írható fel, melyb l adódik, hogy X 1 és X 2 együttes s r ségfüggvénye f(x 1, x 2 ) = c(f 1 (x 1 ), F 2 (x 2 ))f 1 (x 1 )f 2 (x 2 ), ahol c-vel a kopulához tartozó s r ségfüggvényt jelöljük. Tekintsük a θ = (θ 1, θ 2, α) paramétervektort, melyben θ 1 az X 1, θ 2 az X 2 eloszlásának paramétereit tartalmazó vektorok, α pedig a kopula paramétere. 22
Ekkor a loglikelihood-függvény: l(θ) = n log[c(f 1 (X i1 ; θ 1 ), F 2 (X i2 ; θ 2 ); α)] + i=1 n 2 log f j (X ij ; θ j ), i=1 j=1 ahol (X i1, X i2 ) : i = 1,.., n független mintarealizációkat jelönlnek. Ebb l θ becslése: θ =argmaxl(θ) Biztosítók kárkizetéseinek vizsgálatakor gyakran feltételezhetjük, hogy azok lognormális, Pareto-, Weibull- vagy valamely extrém-érték eloszlást követnek. 2.2. Kopula illesztése rangszámok segítségével Bemutatunk egy olyan módszert is [3] alapján, melyben a kopula becslése nem függ a peremeloszlásoktól, így nem kell attól tartanunk, hogy a marginálisok esetleges félreazonosítása módosítana az eredményen. Az egyes adatsorokhoz tartozó rangszámok segítségével írjuk fel az empirikus kopulát, majd kiválasztjuk az ismert Arkhimédeszi kopulák közül a legjobban illeszked t. 2.2.1. Empirikus kopulák Tekintsük az X (i) = (X i1, X i2 ) koordinátapárokat, majd rendezzük nagyság szerinti sorba X 1 és X 2 elemeit. Az így kapott rendezett mintában X ij rangját R ij -vel fogjuk jelölni, és az általuk meghatározott R (i) = (R i1, R i2 ) vektorok segítségével írjuk fel az empirikus kopulát. Mivel a vizsgált kétdimenziós kopulák a [0, 1] 2 egységnégyzeten vannak értelmezve, a rangokhoz hozzárendelünk egy-egy Ũi [0, 1] 2 ún. pszeudo-meggyelést az alábbi módon: mellyel ekvivalens deníció az Ũ ij = Ũ (i) = R(i) n + 1, n n + 1 F j (X ij ), ahol Fj az X j tapasztalati eloszlásfüggvényét jelöli. 23
Ezek alapján már fel tudjuk írni az empirikus kopulát, ami nem más, mint a pszeudo-meggyelések tapasztalati eloszlásfüggvénye, azaz C n (u) = 1 n n χ(ũi < u). i=1 Mivel C n konzisztens becslése a keresend C-nek, így a minta elemszámának növelésével egyre jobb becslését kapjuk a kopulának. A módszer további el nye, hogy C becslése a rangszámokból álló R (i) vektorokon alapul. Ezáltal pedig a kiugró értékekre sem lesz érzékeny, mert nem a konkrét adatokkal számolunk. Érdemes megjegyezni, hogy bár közelíteni tudtuk a kopulát az eredeti marginálisok ismerete nélkül, a gyakorlatban nem kerülhetjük el ezek becslését sem. Ha az eredeti adatokra illesztett eloszlásra vagyunk kíváncsiak, szükség van a peremeloszlásokra is. 2.3. A megfelel kopula kiválasztása és az illeszkedés pontossága Tekintsük a már korábban deniált C n empirikus kopulát, valamint a keresett C- t becsl C θn -t a H 0 : C C θ nullhipotézis mellett. Az empirikust legjobban közelít kopula kiválasztásához az S n = n (C n (Ũi) C θn (Ũi)) 2 i=1 statisztika lesz segítségünkre. Ahogy azt már az el z szakaszban láttuk, minél nagyobb a minta elemszáma, C n annál jobb becslése C-nek. Ezt kihasználva a dolgozatban egy bootstrap-alapú illeszkedésvizsgálati módszert alkalmazunk. A bootstrap eljárás a meglév mintából generál véletlenszer en új mintákat, új információt adva a mintáról a pontosabb becslés érdekében. A vizsgálat a következ képp zajlik: 1. Az Ũ1,..., Ũn pszeudo-meggyelések alapján felírjuk az empirikus kopulát, majd C θ paraméterét becsüljük θ n segítségével. 2. Kiszámoljuk az S n statisztika értékét. 24
3. Veszünk egy nagy n egészt és minden k {1,..., N}-re megismételjük az alábbi lépéseket: A C θn kopulából generálunk egy X (k) 1,..., X n (k) véletlen mintát és kiszámoljuk az ezekhez tartozó Ũ (k) 1,..., Ũ n (k) pszeudo-meggyeléseket. Felírjuk a C n (k) (u) = 1 n n i=1 χ(ũ (k) i u), u [0, 1] 2 empirikus kopulát és Ũ (k) 1,..., Ũ n (k) -ból kiszámoljuk θ n (k) -t. H 0 fennállása mellett megadjuk S n egy közelít realizációját: n S n (k) = (C n (k) (Ũ (k) (k) i ) C (k) θ (Ũ n i )) 2 i=1 A próba p-értékének közelítése: 1 n χ(s n (k) S n ) n i=1 A próbát végrehajtjuk minden szóbajöv kopulára, és végül a p-értékek, az egyes kopulafajták ismert tulajdonságai, valamint az elkészített ábrák segítségével választjuk ki azt a kopulát, amely a legjobban leírja a változók közti összefüggést. A módszer segítségével bár megbízható eredményt kapunk a legjobban illeszked paraméteres kopula kiválasztásához, hátránya, hogy rendkívül lassú, ugyanis minden lépésben véletlen számokat generálunk, emellett pedig szükség van a kopula paramétereinek becsléseire is. Amennyiben nagy elemszámú minta áll rendelkezésünkre, érdemes más illeszkedésvizsgálati módszert alkalmazni, ami nem a bootstrap eljárást veszi alapul. 2.4. Szimuláció Arkhimédeszi kopulákból A kopulák lehet vé teszik számunkra, hogy egyszer en szimuláljunk többdimenziós eloszlásokból. Szükségünk van egy algoritmusra, aminek segítségével el állíthatunk egy olyan X 1 és X 2 változót, melyek együttes eloszlásfüggvénye F (x 1, x 2 ) = C(F 1 (X 2 ), F 2 (X 2 )). Az Arkhimédeszi kopulák esetében láttuk, hogy C(u 1, u 2 ) = ψ 1 (ψ(u 1 ) + ψ(u 2 )). 25
Ismerve X 1 és X 2 együttes eloszlását, X 2 rekurzívan el állítható ennek X 1 -re vonatkozó feltételes eloszlásának segítségével, ahogy ez [2]-ben is olvasható. Az algoritmus a következ : 1. Els ként generálunk egy U 1 és U 2 [0, 1] intervallumon egyenletes eloszlású változót. 2. El állítjuk X 1 -et: X 1 = F 1 1 (U 1 ), és c 0 -t 0-nak tekintjük. 3. Rekurzívan X 2 -t megoldásaként számítjuk ki. U 2 = F 2 (X 2 x 1 ) = ψ 1 (ψ(f 1 (x 1 )) + ψ (F 2 (x 2 ))) ψ 1 (ψ(f 1 (x 1 )) 26
3. fejezet Kopula illesztése a vizsgált adatokra Utalunk már rá korábban, hogy a kopulák jelent s szerepet játszanak a biztosítások területén. A dolgozatban egy nem-élet biztosítási alkalmazást mutatunk be Edward W. Frees és Emiliano A. Valdez Understanding relationships using copulas [2] cím cikke alapján, melyhez rendelkezésünkre áll egy biztosítótársaság 1500 felel sségbiztosításának kárkizetéséb l álló adatsor, valamint az egyes károkhoz tartozó kárrendezési költségek. Ebben a fejezetben ezek együttes eloszlásának meghatározása a célunk, melyhez az el z fejezetben deniált Arkhimédeszi kopulák lesznek segítségünkre. 3.1. Az adatok bemutatása Jelölje ezentúl X 1 a kárkizetésekb l, X 2 a költségekb l álló 1500 elem mintát. Ahogy a 3.1. táblázatból is látszik, ugyanakkora kárkizetési összegekhez tartozhatnak lényegesen eltér költségek, viszont el forfulhat, hogy egyes károknál a kárrendezési költségek sokkal magasabbak, mint maga a kártérítés. Feltételezhet azonban, hogy magas költségek f ként nagy károkhoz tartoznak. A 3.2. táblázat a két minta alapstatisztikáit foglalja össze. Láthatjuk, hogy mind a kártérítések, mind a költségek közt csak pozitív értékek szerepelnek, viszont el fordulhatna akár olyan helyzet is, hogy tartalmaz az adatsor költség nélküli kártérítést vagy éppen költségeket, melyek olyan károk bekövezésekor keletkeztek, amiket végül a biztosító nem zetett ki. Az ilyen esetek vizsgálatát külön kellene elvégeznünk egy speciálisabb modell segítségével. 27
X 1 X 2 24 5658 1974 775 2250 2182 2250 8204 14500 625 3.1. táblázat. Részlet az adatokból X 1 X 2 Minimum 10 15 Maximum 2173595 501863 Átlag 41208 12588 Medián 12000 5471 Szórás 102747,7 28145,64 3.2. táblázat. Alapstatisztikák Az már el zetes vizsgálatok nélkül is sejthet, és a 3.1 ábra is jól mutatja, hogy X 1 és X 2 nem független egymástól. Példaként gondoljunk csak arra, hogy egy nagyobb irodaházban bekövetkezett t zesetkor amellett, hogy a biztosítónak feltehet en igen magas kártérítést kell kizetni, a kárfelmérés is jelent s költségekkel jár. Ahogy már az 1.3. szakaszban is láttuk, a Pearson-féle korrelációs együttható helyett érdemesebb a rangkorrelációs együtthatók segítségével vizsgálni a kárkizetések és költségek közti kapcsolatot. A Kendall-féle τ-t és a Spearman-féle ρ-t meghatározva így azt kapjuk, hogy ρ τ = 0, 315, ρ S = 0, 452, ami egyrészt er s összefügg séget mutat, másrészt arra enged következtetni, hogy f ként a nagyobb károkhoz tartoznak magas költségek. 28
3.1. ábra. A kárkizetések és költségek logaritmikus skálán 3.2. Kopula illesztése Miután megállapítottuk, hogy milyen kapcsolat áll fenn a változók közt, nekiláthatunk a kopulák illesztésének. Erre a 2.2. szakaszban bemutatott rangszámokon alapuló módszert fogjuk alkalmazni, így tehát az X 1 - és X 2 -höz tartozó peremeloszlások ismerete nélkül is becsülhetjük a változók együttes eloszlását. Érdemes megjegyezni, hogy a legtöbbször - mint ahogy jelen dolgozatban sem - nem tudjuk teljesen elkerülni a peremeloszlások vizsgálatát, azt azonban igen, hogy egy kevésbé jó becslés a kopula becslésén is rontson. A marginálisokkal b vebben a következ fejezetben foglalkozunk majd. El ször a rangszámok és pszeudo-meggyelések segítségével elkészítjük az empirikus kopulát, melyhez a [0, 1] intervallumba transzformált adatokat a 3.2. ábra szemlélteti. Jól látszik a nagy értékek közti er s farok-összefüggés, és meggyelhet néhány függ leges sáv is, melyeknek nem érdemes nagy jelent séget tulajdonítanunk, ugyanis jogosan feltételezhetjük, hogy mindez annak következménye, hogy a biztosító törekedett kerek kártérítési összegek meghatározására. 29
3.2. ábra. A [0,1] intervallumba transzformált adatok Ahogy már korábban is láttuk, hogy az Arkhimédeszi kopulák paraméterei kifejezhet k a Kendall-τ-ból, így ρ τ = 0, 315 mellett a Gumbel-, Frank- és Claytonkopulához tartozó α értékek: α Gumbel 1,461 Frank 3,094 Clayton 0,921 3.3. táblázat. ρ τ = 0, 315-höz tartozó α értékek Ezek alapján ki kell választanunk, melyik kopulafajtára a legkisebb az eltérés az empirikus kopulához képest, és ellen riznünk, hogy a legkisebb eltérés elfogadhatóe. Ehhez a korábban bemutatott illeszkedésvizsgálati próbát végezzük el, melynek eredményeit a 3.4. táblázat foglalja össze. Emlékeztet ül, a paraméteres és empirikus kopula közti négyzetes eltérést az S n próbastatisztika értéke mutatja. S n α Gumbel 0,1073 1,442 Frank 0,1906 3,075 Clayton 1,0286 0,506 3.4. táblázat. Illeszkedésvizsgálat eredeményei 30
Láthatjuk, hogy a különbség a Gumbel-kopula esetén a legkisebb, viszont a próba a Frank-kopulára sem mutat rossz illeszkedést. Érdemes mindenesetre megnézni grakusan is, hogyan viszonyulnak egymáshoz a Gumbel-, Frank-, illetve Clayton-kopulából vett minták az egységnégyzeten. Ezt egyszer en megtehetjük, ugyanis a paraméterek ismeretében felírhatjuk a vizsgált kopulákat, és mintavételezhetünk is bel lük. Az ábrán is meggyelhet, hogy míg a Clayton-kopulát teljesen elvethetjük, a Gumbel-kopula illeszkedése valóban jónak bizonyul, tehát elfogadhatjuk a kárkizetések és költségek együttes eloszlásaként. 31
4. fejezet Alkalmazás viszontbiztosítások díjkalkulációjára A fejezet célja egy viszontbiztosítási díjkalkuláció a kapott eredmények segítségével, melyek alapján a biztosító kárkizetéseit és az egyes károkhoz tartozó költségeket összefügg nek tekintjük. Megmutatjuk továbbá Frees és Valdez [2] és Marco Micocci, Giovanni Masala [6] cikkei alapján, hogy mennyivel módosulna a helyzet, ha függetlenséget feltételeznénk. Ejtsünk el ször néhány szót a viszontbiztosításokról [5] segítségével! 4.1. A viszontbiztosítások A biztosítók pénzügyi stabilitását és zet képességét különösen a kis valószín ség nagy károk, valamint a kumulálódó károk sodorhatják veszélybe. Érdemes tehát megfontolni, hogy mekkora kárt tud a biztosító kizetni anélkül, hogy felborulna a pénzügyi egyensúlya, valamint mit lehet tenni a kizetend kárösszeg nem várt növekedése ellen. Mit tesz a felel sségteljes lakástulajdonos, akinek egy esetleges t zeset vagy betörés után keletkezett költségek komoly anyagi problémát jelentenének, de jövedelméb l szívesen áldoz a biztonságérzetre? Biztosítást köt. Ugyanezt teszi egy biztosítótársaság is. A beérkezett biztosítási díj egy részét átengedve egy másik biztosítónak (viszontbiztosító), az kötelezettséget vállal, hogy az el bbinek (direkt biztosító) az általa kizetett szolgáltatások egy részét megtéríti. Ezt nevezik viszontbiztosításnak, melyet gyakran emlegetnek a "biztosítók biztosítása"-ként is. 32
Az árazás és kockázatmegosztás szempontjából megkülönböztethetünk arányos és nem arányos viszontbiztosítási formákat. El bbi lényege, hogy amilyen arányban vállal kockázatot a viszontbiztosító, olyan arányban részesedeik a direkt biztosítóhoz beérkez díjból is. Bár az arányos viszontbiztosítások jelentik a legkisebb kockázatot a direkt és viszontbiztosító számára is, nem mindig el nyös az arányos viszontbiztosítás egyik fél számára sem. A nem arányos viszontbiztosítási formáknál a direkt biztosító megtarthatja magának azokat a kockázatokat, amiket az alacsony maximális kárnagyság miatt pénzügyi kapacitása elbírna, viszontbiztosítást pedig csak egy bizonyos kárösszeg túllépése esetére köt. Ez az ún. kockázati alapú kártöbblet-viszontbiztosítás ( Excess of Loss, XL). Mindez persze a viszontbiztosító számára is kedvez abból a szempontból, hogy mivel csak a ritka károkból vállal egy meghatározott részt, lényegesen alacsonyabbak az adminisztrációs költségei. Hátránya azonban, hogy a direkt biztosító bátrabban vállal nagyobb kockázatokat, mint arányos viszontbiztosítási szerz dés esetén. Erre megoldást jelenthet a kvóta és az XL-viszontbiztosítás kombinálása, melynél a viszontbiztosító azon kárkizetésekb l vállal részt, melyek a direkt biztosító saját megtartásánál magasabbak, viszont megszab egy határt arra, hogy legfeljebb mekkora összegig térít a direkt biztosítónak saját pénzügyi egyensúlya fenntartása érdekében. Ennek matematikai modelljét fogjuk a következ kben ismertetni. 4.1.1. A matematikai modell A korábbi jelölésekkel legyen a kizetend kárösszeg X 1, melynek eloszlását F 1 jelöli. Egy viszontbiztosítónak járó P 1 díj, és egy x kizetend kárigény esetén a direkt biztosító T x összeget zet ki, ez az ún. saját megtartása, a maradék x T x pedig a viszontbiztosító részesedése, ahol T egy mérhet függvényt jelöl. Ha a díjszámításhoz a várható érték elvet használjuk és F v jelöli a viszontbiztosító részesedésének eloszlását, akkor a viszontbiztosítónak járó díj P 1 = xdf v (x) = (x T x)df 1 (x). Érdemes megjegyezni, hogy T mérhet sége miatt az integrál létezik és feltehetjük, hogy véges. Nézzük most azt az esetet, amikor az XL-viszontbiztosítást kombináljuk a kvó- 33
tával. A direkt biztosító saját megtartását jelöljük R-rel. Ekkor a direkt biztosító azokra a kockázatokra köt viszontbitosítást, melyeknél a kárösszeg R-nél magasabb, viszont ezek R feletti részét is -jelen esetben a kárrrendezési költségek arányábanbizonyos mértékben maga téríti, míg a viszontbiztosító is szab egy L összeghatárt (kapacitás), ameddig a kockázatot vállalni tudja, így kárkizetés ezen felüli része is a direkt biztosítót terheli. Tekintsük a korábban bevezetett károkhoz tartozó X 1 és költségekhez tartozó X 2 változót. Könny meggondolni, hogy ez alapján a viszontbiztosítót terhel összeg g(x 1, X 2 ) = X 1 T X 1 = 0, ha X 1 < R X 1 R + X 1 R X 1 X 2, ha R X 1 < L L R + L RX L 2, ha X 1 L, aminek várható értéke adja meg a viszontbiztosítási díj becslését. Ez kiszámolható numerikus integrálással, valamint X 1 és X 2 együttes eloszlásából való szimulációval is. az Ezek segítségével a viszontbiztosítási díj becslése: se(ĝ(l, R)) = ĝ(x 1, X 2 ) = 1 nsim g(x 1i, X 2i ) nsim 1 nsim i=1 nsim i=1 g(x 1i, X 2i ) 2 ĝ(l, R) 2 nsim standard hibával, ahol nsim a szimulációk számát jelöli. 4.2. Peremeloszlások Mivel a viszontbiztosítás szempontjából egy bizonyos küszöb feletti károk az igazán érdekesek, kézenfekv megoldás ezekre az adatokra valamely extrém-érték eloszlást illeszteni. Els ként a vizsgált adatsorokra egymástól függetlenül illesztjük a nagy károk modellezésekor gyakran használatos általánosított Pareto eloszlást, melyre egy u küszöb esetén P (X u < y X > u) 1 (1 + ξỹ 1 σ ) ξ, ha y > 0 és 1 + ξỹ σ > 0, ahol σ = σ + ξ(µ u) és µ, σ, ξ az eloszlás paraméterei. 34
Az eloszlás megfelel illeszkedése esetén tetsz leges u függvényében ábrázolva X u átlaga lineáris függvényhez közelít. A küszöböt mind a kártérítések, mind a költségek esetén a hozzájuk tartozó kvantilisfüggvények segítségével határoztuk meg. Azokat az értékeket tekintjük extrémnek, melyek az adatok 95 százalékánál nagyobbak, így X 1 -nél 170000, X 2 -nél 45945 lett a választott küszöbérték. Az eloszlás paramétereit maximum likelihood módszerrel becsüljük. Ez alapján X 1 eloszlását a ξ 1 =0,18 alak és σ 1 =165324,98 skála paraméter jellemzi, míg X 2 esetén ezek az értékek ξ 2 =0,6 és σ 2 =24777,47. Azt, hogy a feltételezett eloszlás milyen pontosan illeszkedik az adatokra, többféleképpen is ellen rizhetjük. A folytonos eloszlások illeszkedésvizsgálatára gyakran használt Kolmogorov-Smirnov próba helyett egy er sebb, bootstrap-alapú próbát végzünk, ami tesztel nemnegatív, illetve negatív alak paraméterrel egyaránt, és akkor utasít el, ha mind a pozitív, mind a negatív paraméterrel vett próba elutasításra kerül. A próbát az X 1 -re, valamint az illesztett eloszlására alkalmazva a p-érték 0,3253, tehát a ξ 1 =0,18, σ 1 =165324,98 paraméter GPD-t elfogadjuk. Ugyanezt X 2 -re is elvégezve a p-érték 0,8318, így a ráillesztett ξ 2 =0,6, σ 2 =24777,47 paraméter GPD is elfogadásra kerül. Mindezt alátámasztják az alábbi ábrák is, melyeken a tapasztalati, illetve az illesztett eloszlásfüggvények kvantiliseit ábrázoljuk egymással szemben. A kártérítésekhez és költségekhez tartozó QQ-ploton is találunk 1-2 kilógó értéket, ezt viszont elkerülni nem tudjuk, legfeljebb a megfelel eloszlás illesztésével csökkenthetjük a számukat. 4.3. Viszontbiztosítások árazása Miután ismerjük a kárkizetések és költségek egydimenziós, valamint együttes eloszlását is, elvégezhetjük a szimulációt a Gumbel-kopulából. Az erre bemutatott algoritmussal 50000 szimulációt végezve generálunk egy új mintát, majd ennnek segítségével becsülhetjük a viszontbiztosítót várhatóan terhel összegeket annak kapacitása és a direkt biztosító saját megtartása függvényében. Különböz kapacitásokra megvizsgáltuk, várhatóan mekkora díjat kellene legalább el írnia a viszontbiztosítónak, hogy fedezni tudja a kártérítésekb l fakadó kiadásait R és L egymáshoz való arányától függ en. A szimulációkat a 2.4. szakaszban 35
4.1. ábra. Kártérítésekhez tartozó QQ-plot 4.2. ábra. Költségekhez tartozó QQ-plot bemutatott módszer alapján végeztük el, majd számoltuk ki ezek alapján g értékét. El zetesen is sejthet, hogy magasabb kapacitásokhoz magasabb értékek is tartoznak, amik viszont csökkennek, ahogy R és L aránya 1-hez közelít. Ebben az esetben nyilván kisebb tartományban van a viszontbiztosítónak zetési kötelezett- 36
sége, valamint a képletb l is látható, hogy ekkor a kárrendezési költségek is csak csekély mértékben befolyásolják a direkt biztosító számára zetend összeget. Az eredményeket a 4.1. táblázat mutatja. R/L L 0 0,25 0,5 0,75 0,95 10000 75270 56020 37192 18532 3699 50000 108780 78625 51056 25000 4931 100000 141723 98751 62445 29657 5677 500000 239973 119033 58442 23037 3966 1000000 261459 86005 33640 11228 1752 4.1. táblázat. Viszontbiztosítási díjak becslése a Gumbel-kopulából szimulált adatok alapján R Ahogy sejtettük is, növekedésével egyre nagyobb mértékben csökkennek az L értékek, míg L emelkedédésével n nek. Meggyelhet azonban, hogy a 100000 és 500000 kapacitások közt R = 0, 5, míg 500000 és 1000000 között már R = 0, 25- L L t l ugyanazon arányokhoz alacsonyabb értékek tartoznak. Ennek oka az lehet, hogy míg a szimulált adatok 56,11 százaléka nagyobb 100000-nél, 500000-nél már csak 8,67, 1000000-nál pedig 1,5 százaléka nagyobb, tehát a nagy károk bekövetkezésének valószín sége jelent sen kisebb, és mivel kevesebb a kár, magasabb limitnél az egy kárra es díjak is alacsonyabbak lesznek. A limitválasztásban nagy szerepet játszanak a kvantilisek, így érdemes ezekre is vetni egy pillantást. Kvantilisek 0,25 0,5 0,75 0,95 55248,9 123888,3 247166,2 605958,6 4.2. táblázat. A kárkizetések kvantilisei a szimulált adatok alapján Nézzük most meg, miként alakulnának ezek a díjak, ha nem vennénk gyelembe a kárkizetések és költségek közti összefügg séget, és vessük össze a kopula-modell alapján számolt eredményekkel. Ehhez fenti táblázat értékeit fogjuk összehasonlítani azon értékekkel, melyeket pusztán F 1 és F 2 -b l szimulált adatokra kapunk. 37
R/L L 0 0,25 0,5 0,75 0,95 10000 72395 53212 35143 17467 3471 50000 105857 72663 45847 21838 4237 100000 138530 89025 53683 25000 4695 500000 236357 98805 44211 15991 2542 1000000 258195 66811 23362 7632 1111 4.3. táblázat. A becsült viszontbiztosítási díjak az F 1 és F 2 eloszlásokból függetlenül vett szimulációk alapján Látható, hogy bár az így kapott értékek hasonlóak a 4.1. táblázatbeliekhez, mind alacsonyabbak azoknál. A kopulából szimulált adatokra kiszámított díjak a 4.3. táblázat értékeihez viszonyított arányát a 4.4. táblázat tartalmazza, az alábbi ábrán pedig az egyes kapacitásszinteken rajzoltuk ki a az R arányokhoz tartozó viszontbiztosítási L díjakat mind a Gumbel-kopulán, mind a függetlenségen alapuló díjszámítás esetén. Az, hogy az arány minden egyes értékpárnál 1-nél nagyobb, azaz a kopula alapján számolt értékekek magasabbak, arra utal, hogy a változók függetlenként kezelése esetén alulárazottak lennének a viszontbiztosítások. R/L L 0 0,25 0,5 0,75 0,95 10000 1,04 1,05 1,06 1,06 1,07 50000 1,03 1,08 1,11 1,14 1,16 100000 1,02 1,11 1,16 1,19 1,21 500000 1,02 1,21 1,32 1,44 1,56 1000000 1,01 1,29 1,44 1,47 1,58 4.4. táblázat. Összefügg és független változók alapján számolt díjak aránya Jól látszik, hogy ez akkor jelentkezik a leger sebben, ha mind a viszontbiztosító kapacitása, mind a direkt biztosító saját megtartása magas. Ennek f ként az az oka, hogy az eloszlások szélei sokkal érzékenyebbek arra, ha rosszul azonosítjuk az eloszlást. 38
4.3. ábra. Viszontbiztosítási díjak alakulása különböz L értékekre F ként olyan esetekben, mikor a direkt biztosító saját megtartása alacsony, el fordulhat, hogy az arány 1-nél kisebb. Ez túlárazásra utal, így ez f ként a direkt biztosító szempontjából hasznos információ. Az illeszkedésvizsgálatnál láttuk, hogy a Gumbel-kopula mellett a Frank-kopula is egész jól illeszkedik, így érdemes megvizsgálnunk azt is, melyen eredményeket kapunk, ha abból szimulálunk adatokat. Ezt foglalja össze a 4.5. táblázat. Ha összevetjük a Gumbel-kopulából szimulált adatokhoz tartozó táblázattal, láthatjuk, hogy nincs jelent s eltérés az eredmények közt. Meggyelhet azonban, hogy a Frank-kopulából szimulálva alacsonyabbak az értékek, és ehhez az összefügg ségi modellhez viszonyítva kevésbé alulárazottak a viszontbiztosítások, ha függetlennek tekintjük a változókat. Mindemellett L = 1000000 kapacitás esetén túlárazást is tapasztalhatunk, ami egyrészt akkor jelentkezik, amikor a direkt biztosító a teljes kockázatot átadja a viszontbiztosítónak, másrészt mikor a saját megtartása és a viszontbiztosító kapacitása egyaránt magas. 39
R/L L 0 0,25 0,5 0,75 0,95 10000 73183 54464 36138 18008 3592 50000 106691 76795 49669 24177 4745 100000 139081 95731 59736 28168 5390 500000 236792 110028 49978 18106 2889 1000000 257252 72104 23792 7109 1016 4.5. táblázat. A Frank-kopulából szimulált adatok alapján becsült viszontbiztosítási díjak R/L L 0 0,25 0,5 0,75 0,95 10000 1,01 1,02 1,03 1,03 1,03 50000 1,01 1,06 1,08 1,12 1,12 100000 1,001 1,08 1,11 1,13 1,15 500000 1,001 1,11 1,13 1,13 1,14 1000000 0,99 1,08 1,02 0,93 0,91 4.6. táblázat. Frank-kopulából való szimulációval kapott eredmények aránya a függetlenségen alapuló értékekhez Vegyük észre, hogy a Gumbel-kopulánál pont az L = 1000000 és R = 0, 95 L esetben az összefügg ségi modellb l számolt díj 1,58-szorosa volt a függetlenségen alapulónak, míg ez az arány a Frank-kopulánál 0,91. Ennek oka az lehet, hogy a jobb oldali farok-összefüggés lényegesen er sebben jelentkezik a Gumbel-kopulánál, mint a Frank-félénél, éppen ezért érdemesebb is az el bbit illesztenünk a rendelkezésünkre álló adatokra. 40