Biztosítási kárszámok becslése



Hasonló dokumentumok
0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)

L'Hospital-szabály március 15. ln(x 2) x 2. ln(x 2) = ln(3 2) = ln 1 = 0. A nevez határértéke: lim. (x 2 9) = = 0.

1. Példa. A gamma függvény és a Fubini-tétel.

Készítette: Fegyverneki Sándor

Taylor-polinomok. 1. Alapfeladatok április Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Abszolút folytonos valószín ségi változó (4. el adás)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A KroneckerCapelli-tételb l következik, hogy egy Bx = 0 homogén lineáris egyenletrendszernek

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

KOVÁCS BÉLA, MATEMATIKA II.

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

KOVÁCS BÉLA, MATEMATIKA I.

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

Gazdasági matematika II. tanmenet

Mátrixjátékok tiszta nyeregponttal

Markov-láncok stacionárius eloszlása

Sorozatok és Sorozatok és / 18

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

Határozott integrál és alkalmazásai

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

352 Nevezetes egyenlôtlenségek. , az átfogó hossza 81 cm

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

8. Egyenletek, egyenlőtlenségek, egyenletrendszerek II.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

: s s t 2 s t. m m m. e f e f. a a ab a b c. a c b ac. 5. Végezzük el a kijelölt m veleteket a változók lehetséges értékei mellett!

Komplex számok trigonometrikus alakja

9. Tétel Els - és másodfokú egyenl tlenségek. Pozitív számok nevezetes közepei, ezek felhasználása széls érték-feladatok megoldásában

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Skalárszorzat, norma, szög, távolság. Dr. Takách Géza NyME FMK Informatikai Intézet takach/ 2005.

Függvények július 13. f(x) = 1 x+x 2 f() = 1 ()+() 2 f(f(x)) = 1 (1 x+x 2 )+(1 x+x 2 ) 2 Rendezés után kapjuk, hogy:

MBNK12: Permutációk (el adásvázlat, április 11.) Maróti Miklós

Feladatok megoldásokkal a 9. gyakorlathoz (Newton-Leibniz formula, közelítő integrálás, az integrálszámítás alkalmazásai 1.

Függvények határértéke, folytonossága

Komplex számok algebrai alakja

M. 33. Határozza meg az összes olyan kétjegyű szám összegét, amelyek 4-gyel osztva maradékul 3-at adnak!

Analízis I. Vizsgatételsor

A maximum likelihood becslésről

Szinguláris értékek. Wettl Ferenc április 3. Wettl Ferenc Szinguláris értékek április 3. 1 / 28

ismertetem, hogy milyen probléma vizsgálatában jelent meg ez az eredmény. A kérdés a következő: Mikor mondhatjuk azt, hogy bizonyos események közül

Valószín ségszámítás és statisztika

15. LINEÁRIS EGYENLETRENDSZEREK

Szinguláris értékek. Wettl Ferenc április 12. Wettl Ferenc Szinguláris értékek április / 35

A Markowitz modell: kvadratikus programozás

Lineáris egyenletrendszerek

(Diszkrét idejű Markov-láncok állapotainak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezetés. 1. fejezet. Algebrai feladatok. Feladatok

Gauss-Seidel iteráció

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

Bázistranszformáció és alkalmazásai 2.

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Számelmélet I.

Függvények július 13. Határozza meg a következ határértékeket! 1. Feladat: x 0 7x 15 x ) = lim. x 7 x 15 x ) = (2 + 0) = lim.

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

12. előadás - Markov-láncok I.

Matematika A2 vizsga mgeoldása június 4.

Permutációk véges halmazon (el adásvázlat, február 12.)

II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés

4. SOROK. a n. a k (n N) a n = s, azaz. a n := lim

Elemi matematika szakkör

Függvények növekedési korlátainak jellemzése

SHk rövidítéssel fogunk hivatkozni.

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

11. Sorozatok. I. Nulladik ZH-ban láttuk:

Legyen adott egy S diszkrét halmaz. Leggyakrabban S az egész számoknak egy halmaza, például S = {0, 1, 2,..., N}, {0, 1, 2,... }.

1. Determinánsok. Oldjuk meg az alábbi kétismeretlenes, két egyenletet tartalmaz lineáris egyenletrendszert:

Hajlított tartó elmozdulásmez jének meghatározása Ritz-módszerrel

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.

Egészrészes feladatok

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Lineáris algebra 2. Filip Ferdinánd december 7. siva.banki.hu/jegyzetek

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Bevezetés a játékelméletbe Kétszemélyes zérusösszegű mátrixjáték, optimális stratégia

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

9. Előadás. Megyesi László: Lineáris algebra, oldal. 9. előadás Mátrix inverze, Leontyev-modell

Valószínűségi változók. Várható érték és szórás

Végeselem modellezés alapjai 1. óra

Polinomok (el adásvázlat, április 15.) Maróti Miklós

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

CHT& NSZT Hoeffding NET mom. stabilis november 9.

Matematika 8. osztály

Pénzügyi matematika. Vizsgadolgozat I. RÉSZ. 1. Deniálja pontosan, mit értünk amerikai vételi opció alatt!

Komplex számok. Komplex számok és alakjaik, számolás komplex számokkal.

Numerikus módszerek 1.

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

Biztosítási ügynökök teljesítményének modellezése

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

NUMERIKUS SOROK I. A feladat ekvivalens átfogalmazása a következő végtelen sok tagú összegnek a meghatározása ) 1 21

Csődvalószínűségek becslése a biztosításban

Lineáris leképezések. 2. Lineáris-e az f : R 2 R 2 f(x, y) = (x + y, x 2 )

Least Squares becslés

Számelméleti feladatok az általános iskolai versenyek tükrében dr. Pintér Ferenc, Nagykanizsa

Átírás:

Biztosítási kárszámok becslése Diplomamunka Írta: Martinek László alkalmazott matematikus szak Témavezet : Dr. Arató Miklós, egyetemi docens Valószín ségelméleti és Statisztika Tanszék Eötvös Loránd Tudományegyetem, Természettudományi Kar Eötvös Loránd Tudományegyetem Természettudományi Kar 2

Tartalomjegyzék. Bevezet 2. Bónusz-málusz rendszerek 3 2.. Markov-láncok............................... 3 2.2. Várható díj................................ 6 3. Becslések 9 3.. Maximum likelihood becslés....................... 9 3.2. Bayes-i megközelítés........................... 3.3. Az a priori paraméterek becslése..................... 2 3.4. Monte-Carlo típusú módszer....................... 3 3.5. Becslések ismert el z évi kárszám esetén................ 26 3.6. Összehasonlítás.............................. 27 3.7. Jó sof r, rossz sof r - egy diszkrét eset................. 29 4. Gyorsító módszerek 3 4.. Importance Sampling........................... 3 4.2. Gyorsítás................................. 33 4.3. Metropolis-Hastings típusú algoritmus................. 36 5. Zárszó 39 Köszönetnyilvánítás 4 Irodalomjegyzék 42 ii

Ábrák jegyzéke 2.. éves várható díj λ =, 4 mellett.................... 8 2.2. éves várható díj λ =, 5 mellett..................... 8 3.. Φ N tapasztalati szórásnégyzete t = 5 és c = M4 esetén........ 23 3.2. Φ N tapasztalati szórásnégyzete t = 5 és c = B9 esetén........ 24 4.. P (B t = c Λ = λ) ábrázolása λ függvényében t = 5 év esetén a különböz osztályokra. (Az x tengely az ábrákon a [, ] intervallum M4-et kivéve, ahol [, 4].)........................ 34 4.2. Konvergencia Markov-lánc-Monte-Carlo módszerrel (t = 3, c = B7). 38 iii

. fejezet Bevezet A kötelez gépjárm -felel sségbiztosításokban széles körben elterjedt módszer, hogy a szerz d k kockázati besorolását ún. bónusz-, ill. máluszosztályokkal végzik. Nevezetesen minden újonnan szerz d, azaz kezd sof r els évében egy kiinduló osztályban kezd, majd a következ évben átkerül egy másik osztályba attól függ en, hogy balesetmentes éve volt-e vagy sem. Amennyiben nem okozott kárt az adott évben, jobb besorolásba kerül. Ha pedig az hibájából következ en baleset következett be, akkor attól függ en, hogy mennyi, rosszabb kategóriába kerül. A rosszabb osztályokban - melyeket hagyományosan máluszosztályoknak nevezünk - tartózkodó sof rök díja nagyobb, mint a jobb osztályokban - bónuszosztályok - lév knek. Ez természetes gondolat, hiszen a veszélyesebb sof röket célszer magasabb díjszabással büntetni, hiszen a biztosító várhatóan többet fog kizetni kárrendezésre az közlekedésük folyományaként, mint a megbízható, jó vezet k miatt. Emellett persze a díj kiszámításakor gyelembe szoktak venni több paramétert, mint például az autó motorjának lökettérfogatát, használatának célját (magán, ill. üzleti), a biztosított tartózkodási helyét (városi, ill. vidéki), életkorát stb. Ezek a jellemz k mind közrejátszanak a kockázati helyzet felmérésében, így a díjkalkulációban is. Mi most ezekt l eltekintve fogjuk vizsgálni azt a központi kérdést, hogy vajon egy illet biztosított várhatóan mennyi kárt okoz egy év alatt. Ezt a λ értéket az kárgyakoriságának, más néven kárszámparaméterének fogjuk hívni. Fontos feltételezés lesz, hogy ezt az egyénre jellemz számot állandónak tekintjük, azaz életkorának változásával ez a paraméter nem változik. El ször ismertetjük röviden a magyar rendszer szabályait, és ismertetjük szükséges feltételezéseinket, többek között az egy év alatt okozott károk eloszlására, valamint az osztályok közötti mozgás folyamatának Markov-tulajdonságára. A második fejezet a paraméter maximum likelihood, ill. Bayes-i becslésére koncentrál, és a jelent s hangsúlyt ez utóbbi kapja. Ehhez feltételezünk egy a priori eloszlást

. FEJEZET. BEVEZETŽ 2 λ-ra, melynek paramétereit az állományunkból tudjuk becsülni, majd ezzel, és az egyénr l szerzett információval az a posteriori várható értékre vagyunk kíváncsiak, amely λ becslése lesz. Ez az információ esetünkben kétféle lesz, egyrészt ismerhetjük a kártörténetet néhány évre visszamen leg, azaz az elmúlt években okozott kárszámokat. A másik lehetséges információ az lesz, hogy a szerz d ismert számú év alatt egy ismert osztályba kerül. Ennek abból a szempontból van nagy jelent sége, hogy biztosítóváltáskor az új biztosító nem feltétlenül jut hozzá a kártörténethez, csak az eltöltött évek számát és az aktuális osztályt ismeri. Látni fogjuk, hogy ez a minimális információ többet mond, mint amennyire el ször gondolnánk. Ez abban nyilvánul meg, hogy meglep en jó becslést adunk ennek ismeretében az egyén kárgyakoriságára, azaz az a posteriori szórásnégyzet kicsi lesz. A legérdekesebb kérdés ezen utóbbi információ alapján vett feltételes várható érték kiszámítása, hiszen ekkor a feltételes eloszlást nem tudjuk nevezetes paraméteres osztályba besorolni, s t még a közvetlen mintavételezés sem lehetséges. Ezért lemondunk az analitikus megoldásról, és egy lehetséges alternatívát a kés bbiekben ismertetett Monte-Carlo-típusú módszer formájában ismertetünk, mely nem túl gyorsan ugyan, de konvergál a keresett értékhez. Gyakorlati szempontból tekintve ez egy átlagos számítógépen 5 és perc közötti számítási id t igényel. A probléma jellegét tekintve valójában ez még elfogadható, hiszen a már meglév összes szerz d b l kalkulált a priori paramétereket nem kell óráról órára változtatnunk. Utolsó fejezetünkben keressük a lehetséges módokat a Monte-Carlo-típusú módszerünk gyorsításához. Egyrészt megvizsgáljuk, hogy az ún. importance sampling (fontossági mintavételezés) módszerét hogyan alkalmazhatnánk erre az esetre a mintavételi eloszlás és a rá alkalmazott függvény megváltoztatásával, melyb l kés bb átlagot számítunk, közelítve a várható értéket. Ez a gondolat természetes módon adódik abból a megállapításból, hogy bizonyos alacsonyabb osztályokhoz tartozó esetekben a generált mintának csak elenyész hányadát használjuk fel. Másrészt az utolsó alfejezetben egy Markov-lánc-Monte-Carlo típusú módszerrel próbálunk mintát venni az a posteriori eloszlásból. A szokásos, valószín ségszámításban és statisztikában elterjedt jelöléseket fogjuk alkalmazni, ill. ahol szükséges, ott röviden elmagyarázzuk azokat.

2. fejezet Bónusz-málusz rendszerek Mára a világ nagy részén a kötelez gépjárm -felel sségbiztosításban az ún. bónusz-málusz rendszereket vezették be, mint díjszámítási elvet. Lényege abban áll, hogy a biztosítottakat oly módon próbálják óvatosságra bírni, hogy a károkat okozók rosszabb besorolásba kerülnek, a kármentesen vezet ket pedig bónusszal jutalmazzák, azaz kedvezményt kapnak az alapdíjból. Általánosan konstruálhatnánk olyan (végtelen terjedelm ) táblázatot, melyben a függ leges tengely az elmúlt évek számát, a vízszintes pedig az okozott károk számát jelöli, és ebben a t-edik sor k-adik eleme a t év alatt k kárt okozó sof r t + -edik évi díját jelöli. Ennek kezelése kissé - talán feleslegesen - bonyolult lenne, ezért mindenhol véges sok osztállyal számolnak. Általánosan jelöljük a legrosszabb osztályt C -gyel, a második legrosszabbat C 2 -vel stb., a legjobbat pedig C n -nel, ha n osztály van. Mi a magyar rendszerrel fogunk foglalkozni, melyben 5 osztályunk van: 4 málusz- (M,...,M4), egy kiinduló (A) és bónuszosztály (B,...,B). Megjegyezzük emellett, hogy a kés bb ismertetett módszerek kisebb módosítással teljesen hasonlóan alkalmazhatóak más országok rendszereire. Az itthoni szabályok értelmében minden egyes kármentes évvel eggyel jobb osztályba kerül a szerz d, de legfeljebb B-be. Minden kár okozásával 2 osztállyal sorolják vissza, de legalább 4 kár esetén a legrosszabb M4-be kerül. 2.. Markov-láncok Fontos feltételezésünk egyrészt, hogy a t-edik évben az egyén B t osztályba kerülése csak az el z évi osztályától függ, az el történett l nem. Más szóval feltesszük, hogy a különböz díjosztályokban való mozgás Markov-láncként modellezhet, azaz P (B t = C i B t,..., B ) = P (B t = C i B t ). Másrészt feltesszük, hogy a biztosított egy biztosítási évben okozott kárszáma Poisson eloszlású valószín ségi változó 3

2. FEJEZET. BÓNUSZ-MÁLUSZ RENDSZEREK 4 λ paraméterrel. Ez az egyénre vonatkozó ún. kárgyakoriság, az egy év alatt okozott kárszám várható értéke centrális szerepet fog játszani a következ kben. Ugyanis a biztosítónak fontos, hogy minél pontosabb becslést tudjon adni a valódi paraméterre, hiszen ez alapján tudja becsülni a várható károkat, ezzel együtt a kizetéseket. Persze ehhez nem elég a károk számát tudni, hanem a károk, a kizetend összegek mértékét is közelíteni kell, amivel most nem foglalkozunk. További lényeges - a valóságnak nem megfelel - feltételezésünk, hogy a λ kárgyakoriság az id ben állandó, azaz a korral nem lesz sem ügyesebb, sem veszélyesebb a sof r. A változó λ esetét duplán sztochasztikus, ún. Cox-folyamatokkal írhatnánk le, azaz mikor λ(t) maga is sztochasztikus folyamat. A fenti feltételezésekkel kapcsolatban mintegy pontosításként szükségünk van a következ denícióra. 2.. Deníció (Homogén Markov-lánc) Legyen {B n } n diszkrét idej sztochasztikus folyamat megszámlálható állapottérrel. Ha tetsz leges nemnegatív n e- gészre, és i, i,..., i n, i, j állapotokra a P (B n+ = j B n = i, B n = i n,..., B = i ) = P (B n+ = j B n = i) egyenl ség teljesül, akkor ezt a folyamatot Markov-láncnak nevezzük. Homogén a Markov-lánc, ha emellett még P (B n+ = j B n = i) független n-t l. Ez esetben értelmes bevezetnünk erre egy n-t l független jelölést, például p ij = P (B n+ = j B n = i). Így az állapotokon való bolyongásnak deniálhatjuk az átmenetvalószín ségmátrixát, melyben az i-edik sor j-edik eleme annak a valószín ségét mondja meg, hogy az i-edik osztályból milyen valószín séggel kerülünk át következ évre a j- edik osztályba. Rögzített λ-ra az M(λ)-val jelölt sztochasztikus mátrixra M(λ) M 5 (R), és a következ alakot ölti: minden sorban a sorösszeg -gyel egyenl, hiszen bármelyik osztályban is legyünk, valamelyikbe átkerülünk a következ évben

2. FEJEZET. BÓNUSZ-MÁLUSZ RENDSZEREK 5 M(λ) = e λ e λ... e λ e λ... e λ... e λ λe λ... (λ + )e λ λe λ... (λ + )e λ λ 2 e λ /2!... (λ 2 /2! + λ + )e λ λ 2 e λ /2!... (λ 2 /2! + λ + )e λ λ 3 e λ /3!... (λ 3 /3! + λ 2 /2! + λ + )e λ λ 3 e λ /3!...................... (λ 3 /3! + λ 2 /2! + λ + )e λ... e λ (λ 3 /3! + λ 2 /2! + λ + )e λ... λe λ e λ A kezdeti eloszlás világos, hogy π = (,...,,,,..., ) T, ahol az ötödik elem, a többi. Hiszen mindenki az 5. osztályban (A) kezd, más szóval valószín séggel C 5 -ben lesz, valószín séggel máshol. Továbbá π M t azt mondja meg, hogy t év elteltével milyen valószín séggel lesz az egyes osztályokban, azaz t lépés után milyen diszkrét eloszlást kapunk az osztályokon. Itt érdemes egy rövid kitér t tennünk a sztochasztikus mátrixokról: Egy n n-es mátrixot sztochasztikusnak mondunk, ha elemei [, ]-beli valós számok, és minden sorban a sorösszeg -gyel egyenl. Továbbá emlékeztetünk a spektrálelméletb l a mátrixok spektrálfelbontására, mely szerint az M mátrix el állítható UDV T alakban, ahol U és V a bal, ill. jobb oldali sajátvektorokból képezett (unitér) mátrixok, D pedig diagonális mátrix M sajátértékeivel a f átlóban. Ily módon M tetsz leges egész t-edik hatványa felírható M t = n λ t iu i vi T alakban 2, ugyanis minden i j esetén u i vj T =. Mivel pillanatnyi célunk, hogy az átmenetvalószín ségmátrix hatványainak konvergenciájáról mondjunk valamit, ez jelent s mértékben motiválhat minket. Gondoljunk csak arra, hogy λ i -kt l elvárjuk az -nél kisebb abszolút érték séget, máskülönben a hatvány növekedtével λ t i tartana végtelenbe. Ennek tükrében megemlítünk egy fontos tételt, nevezetesen: Tétel 2..2 (Perron-Frobenius) Legyen A r r-es nemnegatív (elemenként nemnegatív), irreducibilis és aperiodikus mátrix. A-nak létezik λ pozitív valós sajátértéke algebrai, és szintén geometriai multiplicitással, és minden j {2,..., r}-re λ > λ j, továbbá a λ -hez tartozó bal és jobb oldali sajátvektor felírható úgy, hogy 2 nagyon vigyázzunk, hiszen itt nem a kárgyakoriságot, hanem M sajátértékeit jelöljük λ i -kel i=

2. FEJEZET. BÓNUSZ-MÁLUSZ RENDSZEREK 6 u T v = teljesüljön. Teljesüljön a sajátértékekre λ > λ 2... λ r, és ha λ 2 = λ j valamely j 3-ra, akkor m 2 m j, ahol m j a λ j algebrai multiplicitása. Ekkor A n = λ n v u T + O(n m λ 2 n ). Továbbá ha A még sztochasztikus is, akkor λ =. 2..3 Megjegyzés ) Az irreducibilitás azt fejezi ki, hogy bármely állapotból el lehet jutni bármely állapotba. A periódus az adott állapotba visszatérés lépésszámainak legnagyobb közös osztója, így egy állapot aperiodikus, ha ez a legnagyobb közös osztó. Erre igaz, hogy osztálytulajdonság, tehát ha irreducibilis Markovláncot tekintünk, melynek egy állapotáról könnyen látható az aperiodikusság, akkor az egész aperiodikus. 2) O(f(n)) olyan függvénye n-nek, melyhez létezik < α β < valós számok, hogy αf(n) O(f(n)) βf(n) teljesül elég nagy n esetén. Könnyen meggondolható, hogy a bónusz-málusz rendszerünk irreducibilis Markovláncot határoz meg. Ugyanis egy lehetséges okoskodás szerint bárhonnan eljuthatunk M 4-be, onnan pedig egyesével a többi osztályba. Az aperiodikusság osztálytulajdonsága miatt elég belátni, hogy M 4 aperiodikus állapot. Ez szintén egyszer, mert például 2, ill. 3 lépésben is visszaérhetünk ide. Az átmenetvalószín ség-mátrix sztochasztikussáíga nyilvánvaló. Ezek szerint teljesülnek rá a Perron-Frobenius-tétel feltételei, így létezik a lim t M t = v u T = π T határérték, ahol v = csupa vektor. Más szóval létezik stacionárius eloszlás, melyet π-vel jelölünk. A konvergencia sebességét pedig a második legnagyobb abszolút érték sajátérték, és annak multiplicitása határozza meg. Be kell látnunk, hogy ez a konvergencia esetünkben nem elég gyors ahhoz, hogy gyelmen kívül hagyhassuk a kisebb hatványok közötti eltéréseket. Tehát M(λ) hatványait szükségszer en külön kell kezelnünk a valószer hatványokra emelés mellett. Ez a valószer ség már szubjektív dolog, de elég arra gondolnunk, hogy a szerz d k nagy része 3 évnél nem régebben lépett be a rendszerbe, és ezalatt a hatvány alatt nagyobb λ-ra (pl., 2-re) még nem stacionarizálódik az eloszlás. Tehát meg kell különböztetnünk egymástól a kés bbi becsléseknél azokat az eseteket, amikor valaki 5 vagy 7 éve van jelen a rendszerben, ezzel szemben már nem érdemes a 45 vagy 5 éve biztosítottak között különbséget tenni. 2.2. Várható díj Természetes kérdés, hogy a szerz d mennyi díjat fog kizetni a biztosítónak az els t évben. Mivel ez t valószín ségi változó összege, ezért csak várható értékkel számolhatunk, ráadásul hallgatólagosan feltesszük, hogy nem változtat biztosítót

2. FEJEZET. BÓNUSZ-MÁLUSZ RENDSZEREK 7 2.. táblázat. Díjak (egységben) M4 d = 2 M3 d 2 =.6 M2 d 3 =.35 M d 4 =.5 A d 5 = B d 6 =.95 B2 d 7 =.9 B3 d 8 =.85 B4 d 9 =.8 B5 d =.75 B6 d =.7 B7 d 2 =.65 B8 d 3 =.6 B9 d 4 =.55 B d 5 =.5 ez alatt az id alatt. A különböz osztályokhoz tartozó díjakat az 2. táblázatban olvashatjuk, ahol A-ban egységnyit zetünk évente. Jelölje P i az i-edik évben zetend díjat, amely egy diszkrét valószín ségi változó, és a fenti díjértékeket veszi fel az évhez tartozó valószín séggel. Kezdetben P = a π eloszlásból adódóan. A következ évben az eloszlást a π T sorvektor és az átmenetvalószín ség-mátrix szorzata adja, majd minden egyes év elteltével egy újabb jobbról szorzással kapjuk π t -t. Ezzel az els t év várható összdíja E(P +... + P t ) = t EP j = j= t π T M(λ) j d = π T j= ( t ) M(λ) j d, j= ahol d oszlopvektor elemei a fent ismertetett díjak. 2.2. Példa Lássunk két példát 3 éves id horizonton a várható díj értékére. Az el z ek miatt a stacionárius eloszlás létezésével kapcsolatban tetsz leges λ paraméterre ezen várható díj értéke konvergens. Az els (2.) példán egy jó (vagy szerencsés) sof r λ =, 4, a másikon (2.2) egy rossz (vagy peches) sof r λ =, 5 kárgyakorisággal látható.

2. FEJEZET. BÓNUSZ-MÁLUSZ RENDSZEREK 8 díj (egység).5.6.7.8.9 5 5 2 25 3 2.. ábra. éves várható díj λ =, 4 mellett év díj (egység).2.25.3.35 5 5 2 25 3 2.2. ábra. éves várható díj λ =, 5 mellett év

3. fejezet Becslések A problémát az okozza, hogy nem ismerjük az egyén kárgyakoriságát, ráadásul arra néha rendkívül csekély mértékben rendelkezésre álló információkból kell becslést adnunk. Erre egy, a gyakorlatban is jelentkez példa, hogy a szerz d teljes kártörténetéhez biztosítóváltáskor az új biztosító nem jut hozzá, tehát csak annyit tudunk, hogy t évet töltött a rendszerben, és ezalatt egy bizonyos C i osztályba jutott el, és persze kihasználjuk, hogy mindenki A-ban kezdett. Egy másik példa, hogy a teljes kártörténet helyett csak az el z néhány évi áll rendelkezésre, ráadásul a rendszerben eltöltött évek száma is ismeretlen lehet. Ezeket a lehet ségeket fogjuk most részletesen vizsgálni. El ször az els információ alapján fogjuk λ-t vizsgálni több szemszögb l. Ehhez egy fontos jelölésünk lesz B t = c annak az eseménynek a kifejezésére, hogy t év elteltével az illet a c osztályba kerül. 3..2 Megjegyzés Néha a B t = C i jelölést fogjuk használni, ha szeretnénk hangsúlyozni, hogy melyik a szóban forgó osztály. 3.. Maximum likelihood becslés Keressük a likelihood-egyenletet λ-ra, ami azzal ekvivalens, hogy a B t osztály valószín ségét szeretnénk maximalizálni λ-ban, azaz a feladat = C i max λ π T M(λ) t e i = max M(λ) t (5,i). λ Itt e i = (,...,,,,..., ) T olyan vektor, melynek i-edik eleme, a többi, tehát az 5. sor i-edik elemét kell maximalizálni. Tegyük hozzá, hogy λ-nak megengedünk tetsz leges nemnegatív értéket. Rögtön felmerül a kérdés, hogy miként lehet jól kezelni ilyen mátrix t-edik hatványát, hiszen λ függvényében formálisan kifejezni a Markov-lánc állapotterén tett t lépéssel, más szóval a t + -edik biztosítási évében 9

3. FEJEZET. BECSLÉSEK nagyobb kitev kre egészen reménytelennek t nik. Ha jobban meggondoljuk, egy f(λ) : R + [, ] 5 5 függvény esetén f t (λ)-t kell maximalizálnunk az (5, i)-edik elemében. Ehhez vesszük a szóban forgó elem λ szerinti deriváltját, melynek értéke a keresett ˆλ-ra egyenl -val. Emlékeztetünk, hogy mátrix deriváltja az eredetivel megegyez méret mátrix, melyben az elemeket úgy kapjuk, hogy a megfelel elemeket egyenként deriváljuk. Állítás 3.. Az n-edik hatvány deriváltjára teljesül az (M n ) = n összefüggés. k= M k M M n k Bizonyítás. Ismert összefüggés, hogy (AB) = A B+AB, így (M n ) = M M n + M(M n ). Ugyanezt M n -re alkalmazva indukcióval kapjuk a fenti állítást. Ezzel a likelihood egyenlet a ( n ) M k M M n k (λ) (5,i) = k= alakot ölti. Egy nem túl el nyös tulajdonsága a módszernek, hogy a legrosszabb osztályra ennek nem létezik maximuma, ami számolás nélkül könnyen meggondolható. Hiszen minél nagyobb a várható kárszám, annál nagyobb valószín séggel lesz valaki a legrosszabb osztályban. Hasonló a helyzet a B legjobb díjosztállyal, ahol a valószín ség maximumát λ = mellett veszi fel. Gondoljuk meg, hogy nem szerencsés kárgyakorisággal venni azokat a szerz d ket, akik akár a biztosítási állomány 7 8%-át is kitehetik. A 3. táblázat a kezdett l számítva t év elteltével a c osztályban található biztosított kárgyakoriságára vonatkozó maximum likelihood becslés értékeit tartalmazza 3 tizedesjegyre kerekítve. Ahol NA található, abba az osztályba annyi id alatt lehetetlen eljutni. 3.2. Bayes-i megközelítés Ebben a részben azzal a Bayes-i feltételezéssel élünk, hogy maga a kárgyakoriság is valószín ségi változó, ezt jelöljük Λ-val. A gyakorlatban el forduló esetek nagy többségében jogosan választjuk ezen a priori eloszlást gamma eloszlásúnak - azaz Λ Γ(α, β) -, ezért mi most erre szorítkozunk. Ezt a gamma eloszlást más néven kever eloszlásnak nevezzük. Rögzített Λ = λ-ra a szerz d X P oisson(λ) számú kárt okoz, így P (X = k Λ = λ) = λk k! e λ. Vajon mi lesz a feltétel nélküli eloszlás? Állítás 3.2. A Γ(α, β) kever j keverék Poisson-eloszlású valószín ségi változó β eloszlása Negatív Binomiális (α, ) paraméterrel. +β

3. FEJEZET. BECSLÉSEK 3.. táblázat. Maximum likelihood becslések -2 éve szerz d kre t\c M4 M3 M2 M A B B2 B3 B4 B5 B6 B7 B8 B9 B NA. NA NA. NA NA NA NA NA NA NA NA NA 2.37 NA.5 NA NA. NA NA NA NA NA NA NA NA 3.857.7 NA.334 NA NA. NA NA NA NA NA NA NA 4.24.542.53 NA.25 NA NA. NA NA NA NA NA NA 5.897.776.45.47 NA.2 NA NA. NA NA NA NA NA 6.87.66.62.34.337 NA.67 NA NA. NA NA NA NA 7.947.524.477.495.289.288 NA.43 NA NA. NA NA NA 8.835.687.44.4.42.252.252 NA.25 NA NA. NA NA 9.824.577.556.352.348.367.223.223 NA. NA NA. NA.873.543.466.473.3.39.325.2.2 NA. NA NA.84.642.429.4.45.279.279.292.82.83 NA.9 NA 2.822.569.53.368.356.37.254.254.266.67.67.84.84 3.837.565.464.46.328.322.336.233.234.88.54.6.77 4.88.68.449.44.4.298.296.32.26.2.62.38.97 5.86.569.56.385.363.37.275.273.272.2.94..28 6.88.579.467.452.344.332.34.255.254.22.87.36.2 7.85.63.467.48.47.35.37.37.239.23.87.64.26 8.8.572.57.42.369.372.29.286.279.222.22.3.54 9.89.585.47.447.36.34.342.272.267.229.28.58.2 2.83.595.48.44.45.329.36.32.255.242.25.79.46

3. FEJEZET. BECSLÉSEK 2 = Bizonyítás. A Gamma-eloszlás s r ségfüggvényét f Λ (λ)-val jelölve P (X = k) = λ α+k β α e (+β)λ dλ = k!γ(α) P (X = k Λ = λ) f Λ (λ)dλ = β α Γ(α + k) k!γ(α)( + β) α+k λ k k! e λ λα β α e βλ dλ = Γ(α) λ α+k ( + β) α+k e (+β)λ dλ =, Γ(α + k) használjuk ki, hogy az integrálban a Γ(α + k, β + ) eloszlás s r ségfüggvénye található, így értéke, továbbá a gamma függvény Γ(z + ) = zγ(z) összefüggését, ezzel tovább = βα (α + k )... α Γ(α) k!γ(α)( + β) α+k = ( ) α + k k ( ) α ( ) k β. + β + β 3.2.2 Megjegyzés A Γ(α, β) eloszlású valószín ségi változó s r ségfüggvénye xα β α e βx Γ(α) f(x) = szórásnégyzete α. β 2 alakú, ahol Γ(α) = t α e t dt, továbbá a várható értéke α β, 3.3. Az a priori paraméterek becslése Ezzel els dleges feladatunk a rendelkezésekre álló η, η 2,..., η K éves kárszámadatok alapján becslést adni az α, β paraméterekre. Err l a mintáról feltesszük, hogy független, és azonos negatív binomiális eloszlásból származik. Fontos az állomány homogenitása, ugyanis ha példaként említve rossz sof rök káradatait a valós aránytól nagyobb százalékban használnánk, akkor az rontana a paramétereken. Két lehet séget mutatunk be, egyrészt a momentum módszert, másrészt a maximum likelihood módszert. Momentum Módszer: Legyen η NegBinom(r, p), melyre ( ) k + r P (η = k) = ( p) r p k Γ(r + k) = r k!γ(r) ( p)r p k (ahol k =,,...). Ezzel Eη = rp és p D2 η = rp. Deniáljuk minden pozitív ( p) 2 egész i-re az M i = j i {η K k = j} tapasztalati momentumokat, ahol {η k = j} j= a j db kárt okozó szerz dések számát jelöli, továbbá legyen S 2 = M 2 M 2. Innen M = rp és p S2 = rp, ami a ˆp = M ( p) 2 és ˆr = M S 2 ˆp = M 2 ˆp S 2 M becslésekhez vezet. Maximum likelihood-módszer: A likelihood-függvény L(r, p) = P r,p (η = n,..., η K = n K ) = K i= Γ(r + n i ) n i! Γ(r) ( p)r p n i,

3. FEJEZET. BECSLÉSEK 3 azaz a loglikelihood K l(r, p) = rk ln( p) + ln p n i + majd a két változó szerint deriválva az i= K n i i= m= ln(r + m) K ln n i!, i= l(r, p) p = rk p + p K n i = és i= l(r, p) r = K ln( p)+ K n i i= m= r + m = egyenletrendszert kell megoldanunk. A likelihood-egyenletnek egyértelm en létezik megoldása, ha S 2 > M. 3.3. Megjegyzés Fontos, hogy végezzünk mindezek után hipotézisvizsgálatot, ezzel ellen rizzük, hogy X valóban negatív binomiális eloszlású. Ugyanis el fordulhat, hogy rossz feltételezésekkel éltünk, és nem jó a modell. (Ehhez megfelel eszközt a χ 2 -próbák között találunk.) 3.4. Monte-Carlo típusú módszer Ezzel konkrét α, β feltételezés birtokában becsüljük λ-t. A rendelkezésre álló információk az ismert B = A, és a t évvel kés bbi B t = c állapot. A Bayes-tétel alapján a feltételes s r ségfüggvény f Λ Bt=c(λ c) = P (B t = c Λ = λ) f Λ (λ). P (B t = c Λ = λ) f Λ (λ)dλ Ezzel λ-ra a becslés Λ feltételes eloszlás szerinti, azaz a posteriori várható értéke lesz, ami λ t jel = λ f Λ Bt=c(λ c)dλ. Írhattuk volna az általánosabb, eloszlással felírt alakot, de a gamma eloszlás abszolút folytonossága miatt nem baj, ha s r ségfüggvényt használunk. A nehézséget az okozza, hogy a P (B t = c Λ = λ) feltételes valószín ség rögzített λ-ra ugyan könynyen számolható mátrixhatványozással, de λ függvényében reménytelennek t nik meghatározni. Hiszen ez egyenl M(λ) t (5, c ) -vel, ahol c a c osztály oszlopához tartozó indexet jelöli, ezért a közvetlen integrálásról le kell mondanunk. Tehát nemhogy a feltételes s r ségfüggvényt nem tudjuk kifejezni, még az általa meghatározott eloszlásból sem tudunk véletlen mintát generálni, amelynek átlagát véve közelíthetnénk a kívánt várható értéket a nagy számok törvényének értelmében.

3. FEJEZET. BECSLÉSEK 4 Ehelyett Monte-Carlo-típusú módszert konstruálunk a következ képpen. Készítsünk egy (ξ n, η n ) párokból álló sorozatot úgy, hogy ξ n értékét Λ eloszlásából, nevezetesen Γ(α, β)-ból generáljuk. Továbbá generáljunk egy Markov-láncot Λ = ξ n szerint, amely egy t lépésb l álló út az állapottéren. Ha ezen ξ n mesterkélt kárgyakoriság mellett B t = c-be jutunk, akkor η n értékét -nek választjuk, különben -nak. A Markov-tulajdonság miatt elég, ha vesszük az M(ξ n ) átmenetvalószín ség-mátrix t- edik hatványának (5, c ) elemét, és ekkora valószín séggel -et, különben -t vesz fel η n. Ezek szerint η n egy ξ n -t l függ Binom(, p) változó, ahol p = M(ξ n ) t (5, c ). A gondolatmenetet az motiválja, hogy a véletlen generált ξ n értékeket, melyeket a valódi λ értékének meghatározásához választunk, megritkítsuk. Méghozzá oly módon, hogy a megmaradók átlaga már jól közelítse az a posteriori várható értéket. Más szóval, a valószín tlenebb ξ n -eket jó eséllyel kidobjuk az átlagolásból. Ne feledkezzünk meg a (ξ n, η n ) és (ξ m, η m ) párok egymástól való függetlenségét l, hiszen a ξ n -eket egymástól függetlenül választottuk a gamma eloszlásból. Ugyanez a függetlenség a párokon belül persze már egyáltalán nem mondható el. Szükségünk lesz a következ két állításra. Állítás 3.4. λ t = E(Λ B t = c) = E(ξ η = ). (Mostantól ha nem szükséges, az indexet elhagyjuk ξ-r l és η-ról, hiszen mint valószín ségi változók, eloszlásuk megegyezik.) Bizonyítás. A teljes várható érték tételével E(ξη) = E(ξη η = ) P (η = ) + E(ξη η = ) P (η = ) = azaz E(ξ η = ) = E(ξη) E(η). Továbbá = E(ξ η = ) P (η = ) = E(ξ η = ) E(η), E(ξη) = E(ξ χ {Bt =c}) = E(E(ξ χ {Bt =c} ξ)) = E(ξ P (B t = c ξ)) = = x P (B t = c ξ = x) f ξ (x)dx, ahol ξ eloszlása megegyezik Λ eloszlásával, ezért f ξ f Λ. Másrészt - ξ és Λ eloszlásának egyez ségét és a teljes valószín ség tételét felhasználva - E(η) = P (η = ) = P (B t = c) = P (B t Λ = x) f Λ (x)dx. Ezzel megkaptuk a kívánt egyenl séget, hiszen a fentieket összevetve E(ξ η = ) = E(ξη) E(η) = λ t.

3. FEJEZET. BECSLÉSEK 5 Állítás 3.4.2 E ξ n η n η n ξ n η n η n = E(ξ η = ) ( ( P (η = )) N ), azaz a Φ N = becslés a feltételes várható értékre aszimptotikusan torzítatlan. Bizonyítás. Az állításban szerepl egyenl ség bal oldala = η i =...=η ij = η ij+ =...=η in = ξ n η n E η i =,..., η ij =, η ij+ =,..., η in = η n P (η i =,..., η in = ). Itt az összegzés η i -k összes lehetséges, értékére történik, azaz 2 N értéket adunk össze. Megjegyezzük továbbá, hogy a pozitív valószín séggel el forduló η =... = η N = eseményre a feltételes várható értékben szerepl hányados értékét -nak tekintjük, hiszen ekkor darab ξ átlagát vesszük, így az átlag is. Ezt a 2 N tagú összegzési feltételt - elhagyva az összes η i = esetet - a továbbiakban az egyszer ség kedvéért R η -val fogjuk jelölni. Ugyanis ki fogjuk használni, hogy létezik legalább egy η i, ami nem. Az egyenl séget folytatva = ( ξi +... + ξ ) ij E η i =,..., η in = P (η i = )... P (η in = ). j R η Felhasználtuk, hogy η i -k egymástól független valószín ségi változók, így a P (R η ) valószín ség szorzatra bomlik. Tovább = ( ξi ) ( ξij )] [E η i = +... + E η ij = P (η i = )... P (η in = ), j j R η ahol a szögletes zárójelben lév feltételes várható értékek nem különböznek egymástól, ezért az egész felcserélhet egy tag j-szeresére, ezzel = R η [E (ξ i η i = )] P (η i = )... P (η in = ) = = E(ξ η = ) P (η i = )... P (η } {{ } in = ) = } {{ } R η =:p =: p ( ) N = E(ξ η = ) p j ( p) N j = E(ξ η = ) ( ( p) N ). j j= A továbbiakban az P (η = ) = P (η = ) valószín séget q-val fogjuk jelölni.

3. FEJEZET. BECSLÉSEK 6 Következmény 3.4.3 Az el z két állításból azt kaptuk, hogy Φ N várható értéke aszimptotikusan megegyezik Λ a posteriori várható értékével, λ t -vel, amit szeretnénk meghatározni. Tehát a Φ N sorozat várható értéke minden N-re megegyezik λ q N t -vel. Alkalmazzuk a sorozatra a Csebisev-egyenl tlenséget: ( ) ( ( ) ( ) Φ N P q E ΦN Φ n > ε) = P N q N q λ D 2 Φ N N t > ε q < N ε 2 tetsz leges pozitív ε esetén. A fels korlátról szeretnénk mondani valamit, ezért számítsuk ki a számlálóban található szórásnégyzetet. Rögtön megjegyezzük, hogy elég Φ N szórásnégyzetét kiszámítani, hiszen az konstans kiemelhet, így a q N számláló az D 2 (Φ ( q N ) 2 N ) alakot ölti. Lemma 3.4.4 D 2 (Φ N ) = D 2 (ξ η = ) J N,p + E 2 (ξ η = ) ( q N )q N. Bizonyítás. E 2 (Φ N ) = ( q N ) 2 E 2 (ξ η = )-et már meghatároztuk. Most vizsgáljuk a 2. momentumot: [(ξ η ) 2 +... + (ξ N η N ) 2 ] + 2 [ξ k η k ξ l η l ] E(Φ 2 k l N) = E η 2 +... + ηn 2 + 2 = η k η l k l = ((ξ η ) 2 +... + (ξ N η N ) 2 + 2 ξ k η k ξ l η l k l E R η j + 2 (j) 2 ) η i =... = η ij =, η ij+ =... = η in = P (η i =... = η ij =, η ij+ =... = η in = ) A szorzat második tagjában az η i =... = η ij =, η ij+ =... = η in = eseményt a rövidség kedvéért csak η f elt.-ként fogjuk feltüntetni. Ezzel = ( ) j ξ [E 2 j 2 η = + R η +2 E i k i l i k,i l {i,...,i j } j 2 ξ ik ξ il ] η i =... = η ij =, η ij+ =... = η in = P (η felt.) Ez utóbbi lépésben kihasználtuk, hogy ξ i -k független, azonos eloszlásúak, így négyzeteik is, ezzel j darabot összeadva feltételesen ξ 2 j-szeresére ( cserélhetjük. Hasonlóan a második feltételes várható érték megegyezik E 2) ) ( j ξ j 2 ξ 2 η = η 2 = =

3. FEJEZET. BECSLÉSEK 7 j E ( ξ 2j ξ η 2 = η 2 = ) -gyel. Vigyázzunk, ugyanis a második feltételes várható értékben implicite feltettük, hogy létezik legalább két η i, amelynek értéke nem, így erre gondolnunk kell az összegzéskor. Vegyük észre, hogy j = esetben nincs gond, hiszen j -vel, azaz -val szorzódik E(ξ 2j ξ 2 η = η 2 = ). Tehát = [ j E(ξ2 η = ) + j j R η j= ] E(ξ ξ 2 η = η 2 = ) P (η felt.) = = R η j E(ξ2 η = ) j E2 (ξ η = ) +E 2 (ξ η = ) P (η felt.) = } {{ } j D2 (ξ η =) ( ) N ( ) N = D 2 (ξ η = ) j j pj ( p) N j + E 2 (ξ η = ) p j ( p) N j j Az el bb ismét kihasználtuk ξ i -k függetlenségét, egyúttal korrelálatlanságát, ugyanis így cov(ξ, ξ 2 ) = -ból adódóan E(ξ ξ 2 η = η 2 = ) = E(ξ η = ) E(ξ 2 η 2 = ) = E 2 (ξ η = ). Bevezetve a J N,p := N j= ( N j ) j pj ( p) N j jelölést Φ N szórásnégyzetére a következ t kaptuk: D 2 (Φ N ) = D 2 (ξ η = ) J N,p + E 2 (ξ η = ) ( q N ( q N ) 2 ) = Következmény 3.4.5 ( ) Φ N P q λ N t > ε j= = D 2 (ξ η = ) J N,p + E 2 (ξ η = ) ( q N )q N. < D2 (ξ η = ) J N,p + E 2 (ξ η = ) ( q N )q N ε 2. Most vizsgáljuk meg a fenti J N,p összeget. Ez majdnem egy X Binom(N, p) eloszlású valószín ségi változó reciprokának várható értéke azzal a módosítással, hogy a értéket nem engedjük meg. Megjegyezzük, hogy ekkor ( p) > miatt a várható érték nem is létezne. El ször anélkül, hogy explicite meghatároznánk J N,p -t, ezen binomiális észrevétel alapján azon sejtésünket próbáljuk igazolni, mely szerint nagy N-re közel lesz -hez. A motiváció abban áll, hogy egy (N, p) paraméter Np binomiális eloszlású valószín ségi változó várható értéke N p. Ezt a heurisztikus elképzelést a következ kben pontosítjuk. Lemma 3.4.6 Az p(n+) 2qN < J N,p < 2 p(n+) alsó és fels becslés érvényes J N,pre. Megj.: Az alsó becslés csak bizonyos, kés bb látott határtól véve igaz.

3. FEJEZET. BECSLÉSEK 8 Bizonyítás. Az alsó becslés J N,p = N + = N + j= j= ( ) N N + p j ( p) N j j j N + ( ) N + p j ( p) N j = j + p(n + ) j= N+ j=2 ( ) N N + j j + pj ( p) N j = ( N + j ) p j ( p) N+ j = = p(n + ) ( ( p) N+ (N + )p( p) N) = p(n + ) qn+ p(n + ) qn, ( ) ( ) q ahol - a szokásos p = q jelöléssel - N+ + p(n+) qn = q N q+p+np = q N +Np < p(n+) p+np 2q N, ha +Np 2p < 2, azaz ha N >. Ezzel J p+np p N,p > p(n+) 2qN. A fels becslésnél felhasználjuk az = + azonosságot: j j(j+) j+ J N,p = = N + = j= j= ( ) N j j(j + ) pj ( p) N j + j= ( ) N + j + j pj ( p) N j + N + p(n + ) N+ j=2 2 p(n + ) ( ) N j j + pj ( p) N j = j= ( ) N + p j ( p) N j = j + ( ) ( N + + ) p j ( p) N+ j j j } {{ } 2 N+ j=2 ( N + j ) p j ( p) N+ j < 2 p(n + ). Ennek felhasználásával egyszer en javíthatunk fels becslésen, mégpedig felhasználva az 3 összefüggést j 2 esetén. j j J N,p = j= = p(n + ) ( ) N j j + pj ( p) N j + N p(n + ) + j= p(n + ) + ( + 3 N+ j=2 p(n + ) p(n + ) ( N + = j j= ( ) N j j(j + ) pj ( p) N j ( ) N + j + j pj+ ( p) (N+) (j+) = N+ j=2 ( N + ) ) j pj ( p) N+ j j ) j pj ( p) N+ j p(n + ) + 6 N(N + )p 2. ( ) 2 + 3 = p(n + ) Np

3. FEJEZET. BECSLÉSEK 9 Következmény 3.4.7 Összefoglalva azt kaptuk, hogy tetsz leges < p < esetén (N+)p 2qN < J N,p < + 6 (az alsó határra vonatkozóan N > 2 (N+)p N(N+)p 2 p N esetén). Más szóval (N + )p J N,p, azaz a J N,p összeg aszimptotikusan Np nagyságrend, amit igazolni akartunk. A fentiek ismeretében szeretnénk adott ε-ra olyan lehet legkisebb N -t választani, hogy az eltérésre vonatkozó valószín ség kisebb legyen egy szintén általunk megadott δ > értéknél. Tehát hány (ξ n, η n ) párt kell generálnunk annak érdekében, hogy a becslésnek az a posteriori eloszlástól vett eltérése abszolútértékben ne haladja meg ezen ε értéket, csak legfeljebb egy kis δ valószín séggel. Miel tt nekikezdenénk, említsünk meg egy lemmát, aminek a kés bbiekben hasznát vesszük: Lemma 3.4.8 J N,p = q N Bizonyítás. = = = j= ( N j n j= n n j= q n nq n. ) j pj ( p) N j = [ N ( ) ] n j j pj ( p) N j = j= n=j ( ) n j j pj ( p) N j = ( n j ) p j ( p) N j = j= ( p)n n n n ( p)n n ( ( p) n ) = ( p) N p=q = q N n qn q n, ( ) n j n pj ( p) N j = n j= ( ) n p j ( p) n j = j ( p)n = n ( p) n ami az állítást igazolja. A könnyebb átláthatóság kedvéért vezessük be a D 2 := D 2 (ξ η = ) és E 2 := E 2 (ξ η = ) jelöléseket. A fenti fels becslésre a D2 J N,p +E 2 ( qn )q N = ε 2 ( q N ) 2 ( ) = egyenl tlenséget kell megoldanunk N-re. ( ) () 4D2 ε 2 D2 J N,p ε 2 ( q N ) + E2 q N 2 ε 2 ( q N ) = δ J N,p + 2E2 q N ε 2 4D2 + 2E 2 ε 2 Ahol kihasználtuk a következ ket: (2) 4D2 + 2E 2 ( Np + 6 N 2 p 2 J N,p ) δ. ε 2 (3)

3. FEJEZET. BECSLÉSEK 2 () Igaz, ha q N, ami pontosan akkor teljesül, ha 2 ( 2 q )n, azaz N log 2 = log 2. log q (2) Ehhez arra van szükségünk, hogy J N,p q N legyen, ami valamely N-re biztosan bekövetkezik, hiszen ez el bbi, míg utóbbi exponenciális nagyságrend- N ben tart -hoz. A lemma alapján tudjuk, hogy elegend q N nq n n N q n nq n q > q N -et belátnunk. Leosztva mindkét oldalt q N -nel és kicsit átrendezve kapjuk, hogy > + N kell. A bal oldal nyilván nem n, ha az összegzésben az tagokat végig -re változtatjuk, ezzel a könnyen összegezhet ( ) n n N q tagok maradnak. Ezzel a bal oldal nem kisebb, mint ( ) n N q = q N. Ha N q N ( q) ez nagyobb + log(n + )-nél, akkor a kívánt egyenl tlenség teljesül, ugyanis log(n + ) felülr l becsüli a pozitív egészek reciprokösszegét N-ig. Tehát elegend olyan N-et választani, amelyre már teljesül az q N > +log(n +) N q N ( q) egyenl tlenség. Ez az egyenl tlenség már jól kezelhet, q ismeretében N alsó korlátját megadhatjuk ezen feltétel mellett. Megjegyezzük azonban, hogy a gyakorlati kérdések többségében a q =, 9999 értéknél nagyobb valószín ség nem jellemz, hogy el forduljon, és ekkor az N = 4 érték kielégít nek bizonyul. (3) J N,p becslésében csak növelünk, ha N + helyett mindenhol N-et írunk. Ezt N szerint másodfokú egyenletté rendezve δ N 2 4D2 + 2E 2 ε 2 p N 6 p 2 = t kell megoldanunk, annak is a nagyobb gyökét keressük. Tehát legyen N := 4D 2 +2E 2 ε 2 p + ( 4D 2 +2E 2 2δ ε 2 p ) 2 + 4 δ 6 p 2 = 4D2 + 2E 2 + (4D 2 + 2E 2 ) 2 + 24δε 2 2ε 2 pδ 6δ εpδ < < < (4D2 + 2E 2 ) + (4D 2 + 2E 2 ) + ε 24δ = 4D2 + 2E 2 + 2ε 2 pδ ε 2 pδ Most használjuk a E(ξ 2 η = ) = D 2 (ξ η = ) + E 2 (ξ η = ) összefüggést, amellyel 2E 2 helyett a kétszeresét véve felülr l becsülhetjük: < 4 E(ξ2 η = ) 6 + ε 2 pδ εp δ Még nem vagyunk készen, hiszen a becslésben szerepl feltételes várható értékr l nem mondtunk semmit. Erre a következ fels becslést adhatjuk: E(ξ 2 η = ) = E(ξ2 η 2 ) P (η = ) E(ξ2 ) P (η = ) = α + α2 β 2 β 2 P (η = ) = α( + α) β 2 p,

3. FEJEZET. BECSLÉSEK 2 amit a ξ Γ(α, β) alapján ismertünk. Az el bbieket összefoglalva N értékére a 4α( + α) 6 + ε 2 δβ 2 p 2 εp δ biztosan megfelel határ lesz. Egy dologgal persze adósak maradtunk, mivel a p értékr l valójában nem tudjuk, hogy pontosan mennyi, azt viszont tudjuk, hogy η η n várható értékével egyenl. A nagy számok er s törvényének értelmében tart a N várható értékhez valószín séggel és L -ben. Ez a konvergencia ráadásul exponenciális sebesség : A Hoeding-egyenl tlenséget használjuk: Tétel 3.4.9 (Hoeding-egyenl tlenség) Legyenek X, X 2,..., X n független, a- zonos eloszlású valószín ségi változók, melyek mindegyikére X i [a i, b i ] valószín - séggel (a i < b i -k valós korlátok). Az S n = n X i jelölés mellett tetsz leges ε > -ra i= P ( S n ES n ε) 2 e n 2ε 2 i=(b i a i ) 2. Ezt felírva X i helyett η n szereposztással minden ε > -ra N η ( ) n P E(η N ) ε = P N η n N E(η ) ε N = 2 e 2 N 2 ε 2 N = 2 e N 2ε 2. Így alkalmasan választott N-re p-nek jó közelítését kapjuk, és ezt használjuk az el bbi becsléshez. Ilyen feltételek mellett megválasztott N -ra, N -re és p-re azt mondhatjuk, hogy P P ξ n η n λ t > ε η < δ ε. n Példaként készítsünk egy táblázatot, amelyben az i-edik sor j-edik eleme azt mondja meg, hogy amennyiben egy - nálunk - új szerz d 9 + i évet töltött el, és ezalatt C j állapotba került, mi lesz a rá vonatkozó kárgyakoriság becslése. Ezzel - t l 28 évig vesszük t értékét. Ehhez be kell állítanunk az állományból származtatott α, β paramétereket, melyekre példánkban az α =, 7 és β = 8 feltételezéssel élünk. Így a táblázat a következ lesz: 3.2 (NA ismét a lehetetlen események helyén áll).

3. FEJEZET. BECSLÉSEK 22 3.2. táblázat. Bayes-féle becslések a kárgyakoriságra t\c M4 M3 M2 M A B B2 B3 B4 B5 B6 B7 B8 B9 B.274.259.26.25.24.69.7.67.3.29 NaN.96 NaN NaN.6.273.25.252.26.2.27.62.6.74.28.26 NaN.93 NaN.59 2.288.256.234.235.96.95.92.59.56.65.22.22.94.89.57 3.286.265.238.223.228.87.86.23.5.53.32.2..84.67 4.299.275.267.225.26.223.8.8.87.49.43.9..95.66 5.36.269.279.248.28.27.23.73.73.62.4.38..8.64 6.297.289.258.245.24.25.23.26.69.66.44.38.6.94.7 7.35.28.272.243.227.236.97.98.84.62.52.3.23.6.69 8.327.275.266.26.23.223.226.9.89.72.57.45.5.8.68 9.36.298.27.255.243.2.27.2.84.8.5.5.4.4.73 2.3.288.276.254.239.24.2.24.94.79.6.43.26..72 2.327.296.27.255.243.226.224.24.99.83.64.54..24.72 22.325.32.28.265.26.228.225.223.94.87.55.59.2.6.74 23.327.32.296.266.246.248.226.25.23.85.7.48.25.3.74 24.322.3.287.272.246.235.237.26.23.93.69.57.5.22.73 25.33.322.296.28.263.24.227.223.23.93.58.64.2..75 26.333.35.297.284.256.254.232.222.2.93.7.47.24.7.75 27.344.32.293.279.256.252.239.228.22.95.73.6.6.22.75 28.345.324.32.284.27.26.24.23.22.94.63.6.23.5.75

3. FEJEZET. BECSLÉSEK 23 A módszer hátulüt je, hogy alacsonyabb osztályok esetén az alacsony α várható β érték miatt nagy lesz Φ N szórásnégyzete, ugyanis kevés η n veszi fel az értéket. Ez a probléma magasabb osztályoknál már nem jelentkezik, hiszen pontosan arról van szó, hogy az a priori eloszlásból generált kárgyakoriságok túlnyomó többségben a jó sof rökre jellemz ek, tehát ott sok η n lesz. Ennek egy lehetséges kiküszöbölésér l a kés bbiekben ejtünk szót, most lássunk két példát a tapasztalati szórásnégyzet alakulására N mintaelemszám függvényében. A 3. ábrán az M 4 osztályhoz és t = 5 évhez tartozó becslés tapasztalai szórásnégyzetét ábrázoltuk, ahol az x tengely beosztásán látható érték -szorosának megfelel mintaelemszámmal dolgoztunk. A 3.2 ábrán ugyanezen év mellett, csak a B9 osztályhoz tartozó tapasztalati szórásnégyzetek láthatóak N = x függvényében. Ez utóbbi abban különbözik az el bbit l, hogy a függ leges tengely tartományát negyedére csökkentettük. Látható, hogy a B9 esetben N = 28-tól már 4 alatti lesz minden érték, majd N = 45-tól a gép számára kezelhetetlenül kicsi szórásnégyzeteket kapunk. (α =, 7 és β = 8) tapasztalati szórásnégyzet..4.8.2 2 4 6 8 N=x* elemu minta 3.. ábra. Φ N tapasztalati szórásnégyzete t = 5 és c = M4 esetén Ugyanezt elvégezhetjük minden osztályra, és azt tapasztaljuk várakozásunknak megfelel en, hogy minél jobb bónuszosztályt veszünk, annál kevesebb minta generálása elég a becslés stabilizálásához. Ne felejtsük el, hogy ezek Φ N -re vonatkozó

3. FEJEZET. BECSLÉSEK 24 tapasztalati szórásnégyzet...2.3 2 4 6 8 N=x* elemu minta 3.2. ábra. Φ N tapasztalati szórásnégyzete t = 5 és c = B9 esetén szórásnégyzetek, a torzítatlan becslésünk a paraméterekre pedig ezt mindig gyelembe kell vennünk a gyakorlati számításoknál. Φ N q N volt, tehát 3.4. Megjegyzés A szórásnégyzeteket a D 2 (Φ N ) = D 2 (ξ η = ) J N,p + +E 2 (ξ η = ) ( q N )q N összefüggés felhasználásával becsültük a következ képpen: η n ξnη 2 n 2 η n ηn 2 2 ξ n η n η n ˆD 2 (Φ N ) = ĴN,p+ ξnη 2 n 2 ηn 2 2 ( ( ˆp) N) ( ˆp) N, ahol a jobb oldal els törtje korrigáló tényez, másrészt ˆp = η n N, és ĴN,p = J N,ˆp. 3.4. Példa Lássunk egy példát az el z ekben hosszan ismertetett módszer szerinti becslésre. R-program segítségével generáltunk egy 5 elem homogén kárszámmintát, melynek segítségével az a priori paramétereket becsültük meg. Mindezt tettük oly módon, hogy legel ször el zetesen megadott α, β értékek által karakterizált Γ-eloszlásból származtattunk 5 elem mintát, azaz a személyre szabott kárgyakoriságok paraméterét. Majd ezeket a λ,..., λ 5 értékeket felhasználva készítettük el

3. FEJEZET. BECSLÉSEK 25 az 5 elem Poisson-eloszlású mintát, melyben minden egyes érték a hozzá tartozó P oisson(λ i ) eloszlásból lett mintavételezve (i =,..., 5). Ebb l a maximum likelihood módszer mellett döntve megkaptuk az ismeretlen ˆα, ˆβ paraméterbecsléseket. Ne felejtsük el, hogy a Gamma-eloszlás β skálaparamétere és a negatív binomiálisnál kapott valószín ség közti összefüggés β +β = p, azaz a kapott p-b l β = p p. Ezzel esetünkben az α =, 7 és β = 8 értékekre jutottunk, melyeket egyébként mindvégig példaként használtunk. Ezután az el z mintát magunk mögött hagyva vettünk újabb, most elem mintát a Γ(.7, 8)-eloszlásból. Az a feltételezésünk, hogy új szerz d vált a mi biztosítónkhoz, akik mind 2 éve biztosítottak a magyar gépjárm -felel sségbiztosítás keretein belül, és ezek az paramétereik személyre szabva, melyeket természetesen nem ismerünk. Majd szimuláltuk 2 év elteltét mindenkinél Markov-láncokkal, melynek következtében a új szerz d a következ arányban került a különböz osztályokba: M4 M3 M2 M A B B2 B3 B4 B5 B6 B7 B8 B9 B 2 8 2 2 43 32 Ennek ismeretében minden egyes ügyfélhez elkészíthet a paraméterének {B t = c} feltétel szerinti becslése, melyet összesítve készítünk, hiszen kíváncsiak vagyunk, hogy erre a f s ügyfélkörre milyen eltérés lesz a valóság és becslésünk között. A t = 2 év mellett minden oszálynak kiolvasható a táblázatunkból a hozzá tartozó a posteriori kárgyakoriság, így ezeket csak összeszorozzuk a fenti létszámokkal, majd összegzünk. Ezzel a példában a következ évre 8, 7 kárt jósoltunk, majd mindenki paraméterével ismét generáltunk Poisson-eloszlású mintát, amik pontosan az elkövetkezend év kárszámait hivatottak reprezentálni. Azt kaptuk, hogy 92 szerz d nem okozott kárt, és 8-an egyet, így -nél többet nem regisztráltunk. Láthatjuk, hogy ebben az esetben ezen kevés információ is megfelel kiindulópontnak bizonyult. 3.4.2 Példa Az el z höz hasonlóan nézzünk még egy esetet, most legyen 5 új szerz d nk 6 éves háttérrel. Az osztályok megoszlása a következ : M4 M3 M2 M A B B2 B3 B4 B5 B6 B7 B8 B9 B 2 2 6 4 4 2 2 7 7 33 24 293 A szimulált következ évben 457-en semmi, 38-an egy és 5-en két kárt okoztak, azaz összesen 48 kár keletkezett. Emellett a becslésünk erre a csoportra 5.

3. FEJEZET. BECSLÉSEK 26 3.5. Becslések ismert el z évi kárszám esetén Új irányban vizsgálódva tegyük fel, hogy az el z ekben látottakkal ellentétben más információ áll a rendelkezésünkre. Nevezetesen a biztosított el z évi kárszáma, melyet k-val jelölünk, és természetesen a jelenlegi osztálya. Ha kétséges lenne a kronológia, szemléljük úgy a helyzetet, hogy éppen ebben a pillanatban váltott biztosítót az illet személy, és a múlt évi produkciójának történetét felhasználva próbálunk következtetni az ideire. Nem ismerjük azonban, hogy hány évet töltött el a bónusz-málusz rendszerben, azaz t ismeretlen. Megjegyezzük, hogy nyilvánvaló következtetéseket természetesen mindig le lehet vonni. Ilyen például, ha B8-ba vettük át a szerz d t, természetesen nem lehet 2 éve biztosítása stb. Ezekr l a kizárható eseményekr l a maximum likelihood becslésnél látott táblázat tanúskodik. A teljesség kedvéért megemlítjük a maximum likelihood módszerrel történ becslést. Az el z, t. évi kárszámot az η t valószín ségi változó jelöli, melynek értékér l ismert, hogy k. Ezzel a P (η t = k) = λk k! e λ valószín séget kell maximalizálnunk λ-ban, azaz log λ k log k! + log e λ deriváltja k =, azaz ˆλ = k. λ Bayes-féle becsléssel ez a következ képpen néz ki. Legyen Λ Γ(α, β) eloszlású valószín ségi változó, azaz s r ségfüggvénye f Λ (s) = βα s α e βs, melynek tartója a Γ(α) pozitív félegyenes és P (X t = k Λ = λ) = λk k! e λ. A becslést ezúttal ˆλ fogja jelölni. Keressük a ˆλ = E(Λ η t = k) a posteriori várható értéket. Ezúttal lényegesen könynyebb dolgunk van, hiszen λ függvényében explicit el állítást ismerünk a feltételes valószín ségekre, így a Bayes-tétel felhasználásával a feltételes s r ségfüggvény f Λ ηt (s k) = P (η t = k Λ = s) f Λ (s) P (η t = k) = = s k k! e s β α s α e βs P (η t = k) = s k+α e (+β)s β α k!p (η t = k). Ennek alakjából rögtön következtethetünk, hogy Γ(k + α, + β) eloszláshoz tartozó a s r ségfüggvény, ugyanis egy ( )-nél nagyobb hatványra emelt s, egy skálaparaméteres exponenciális tag, valamint egy konstans szorzatából tev dik össze. Tehát megvan a konkrét eloszlás a paramétereivel, melynek várható értéke α+k β+. 3.5. Megjegyzés Ugyanezt igazolhattuk volna közvetlen számolással is: E(λ η t = k) = s s α+k e (+β)s β α k!p (η t = k) ds = β α Γ(α + k + ) ( + β) α+k+ k! P (η t = k) s (α+k+) e (+β)s ( + β) k+α+ ds = Γ(α + k + ) } {{ } =

3. FEJEZET. BECSLÉSEK 27 ugyanis = βα k! = α + k β + β α Γ(α + k) = α + k ( + β) α+k k! P (η t = k) β +, } {{ } ( ) P (η t = k) = Γ(α + k) ( + β) α+k s k k! e s β α s α e βs ds = s α+k e (+β)s ( + β) α+k ds. Γ(α + k) } {{ } = Teljesen hasonlóan látható be általánosan, hogy az el z néhány évi kártörténet ismeretében a becslés α+η +...+η t lesz, ahol η β+t,..., η t az el z t év kárszámai (ez nem feltétlenül jelenti azt, hogy t éve van biztosítása a szerz d nek). 3.6. Összehasonlítás Felmerül a kérdés, hogy vajon az eltelt évek és a legutolsó állapot - ezt jelöljük ()-gyel -, vagy az utolsó évi kárszám - (2) - alapján lehet-e jobb becslést adni az illet λ paraméterére. Ezen kérdés megválaszolásához gondoljunk arra, hogy az el z ekben olyan λ R + meghatározásán fáradoztunk, amely minimalizálja az (λ t λ) 2 dq(λ feltétel)-t, ahol a feltétel helyére az el bbi két információ valamelyike helyettesíthet. Más szóval négyzetes veszteségfüggvénnyel dolgozva veszünk várható értéket a feltételes eloszlás szerint. Err l könnyen láthatjuk, hogy a Q(λ feltétel) eloszlás szerint vett szórásnégyzete λ-nak, hiszen λ t = E(λ feltétel). A (2) esetben ez explicite ismert, hiszen a Γ(α +k, β +) valószín ségi változók szórásnégyzete 3.6. Megjegyzés Ha szeretnénk kiszámolni, a következ képpen járunk el: = (λ t λ) 2 dq(λ X t = k) = α+k (+β) 2 ( ) 2 α + k β + λ ( + β)α+k λ α+k e (+β)λ dλ = Γ(α + k) (α + k) 2 2(α + k)( + β)λ + ( + β) 2 λ 2 ( + β)α+k λ α+k e (+β)λ dλ = ( + β) 2 Γ(α + k) = [ (α + k) 2 ( + β) α+k 2 λ α+k e (+β)λ Γ(α + k) 2(α + k)( + β) α+k λ α+k e (+β)λ + ( + β) α+k λ α+k e ]dλ (+β)λ = (α + k)2 = ( + β) (α + k)γ(α + k + ) f 2 Γ(α+k,+β) 2 f ( + β) 2 Γ(α+k+,+β) + Γ(α + k)

3. FEJEZET. BECSLÉSEK 28 Γ(α + k + 2) + ( + β) 2 Γ(α + k) f Γ(α+k+2,+β), ahol az integrálok értéke, hiszen s r ségfüggvényeket integrálunk a teljes tartón. Innen átrendezéssel és az αγ(α) = Γ(α + ) azonosság felhasználásával megkapjuk α+k -et. (+β) 2 Az () esetben pedig láttuk, hogy a D 2 := D 2 (λ B t = c) feltételes szórásnégyzetre nincs explicit formulánk, ezért csak közelíteni tudjuk. Annak eldöntéséhez, hogy melyik becslést tekinthetjük jobbnak a másiknál, el kell döntenünk, hogy az adott esetben a D 2 D 2 2, agy a D 2 2 D 2 egyenl tlenség teljesül-e. Ahol kisebb a szórásnégyzet, azt jobbnak mondjuk. A közelítést a már látott feltételes várható értékhez hasonlóan végezzük, most ξnη 2 n ξ n η n η n η n 2 p D 2. Teljes táblázatok mellékelését l itt eltekintünk, melyek () és (2) összehasonlítását szolgálják. Ellenben egy példán megvizsgáljuk a kett közötti különbséget, és ennek mintájára tetsz leges információ birtokában elvégezhet a szórásnégyzetek összevetése. Az α =, 7 és β = 8 paramétereket használjuk továbbra is. Legyen az () esetben c = B8 rögzített, és az évek száma t =,..., 28 közötti. Hamar kiderül, hogy ekkor minden esetben az () szolgáltatja a jobb becslést, hiszen (2)-ben tetsz leges el z évi kárszám esetén a szórásnégyzet legalább,7+ (+8) 2, 75, ami bármely ()-ben található szórásnégyzetnél nagyobb. Ugyanez történik akkor, ha a (2) esetben az egyén el z 2, 3,..., 6 évi kárszámát ismerjük. Javulást (2) részér l akkor tapasztalunk, amikor 7 évre visszamen leg ismerjük a kártörténetet. A példa teljességéért egy kivonat a szórásnégyzetekr l: (t = ) (t=5) D 2.32.3.34.36.33.37.39.35.4 (t = 2) (t=25) D 2.42.38.42.44.4.43.45.4.44 és a (2) esetben k el z t évi összkár jelöléssel

3. FEJEZET. BECSLÉSEK 29 D 2 2 : k = k = k = 2 k = 3 k = 4 k = 5 k = 6 k = 7 k = 8 k = 9 t =.75.2.3.58.86.23.24.269.296.324 t = 2.68.93.8.42.68.92.27.242.268.292 t = 3.6.84.7.29.52.75.97.22.243.265 t = 4.56.76.97.8.38.59.8.2.22.242 t = 5.5.7.89.8.27.46.64.83.22.22 t = 6.47.64.82.99.6.34.5.68.86.23 t = 7.43.59.75.9.7.23.39.55.7.87 t = 8.4.55.7.84.99.4.29.43.58.73 t = 9.37.5.64.78.92.6.9.33.47.6 t =.34.47.6.73.85.98..24.36.49 3.6.2 Megjegyzés Amennyiben az eltelt évek száma és még néhány el z évi kárszám rendelkezésünkre áll, módosíthatjuk a becslésünket a következ módon. A Monte-Carlo típusú módszerünk során az η i értékét pontosan akkor választjuk -nek, ha t év alatt a c osztályba jutunk, és az ismert j,..., j l -edik évek kárszámai megegyeznek az ismert k j,..., k jl -ekkel. Tehát amikor egy Markov-láncot generálunk véletlenszer en, akkor a megfelel j i -edik lépésekben kapott károk megegyeznek az illet ismert kártörténetében szerepl k ji értékekkel. Ezzel jobb becslést kapunk a kárgyakoriságra, aminek az az ára, hogy jóval kevesebb η i lesz, azaz több véletlen mintavételezést kell szimulálnunk. 3.7. Jó sof r, rossz sof r - egy diszkrét eset Tegyük fel, hogy Λ eloszlása, azaz a kever eloszlás diszkrét. Kezdjük azzal az egyszer példával, hogy pontosan két értéket vehet fel: P (Λ = λ i ) = p i (i =, 2), azaz λ i -t p i valószín séggel, ahol p +p 2 =. Ezt felfoghatjuk úgy is, hogy a szerz d k p hányada jó sof r, viszonylag kicsi λ i kárgyakorisággal, másik p 2 részük pedig rossz sof r, nagyobb λ 2 -vel. Tegyük fel, hogy a vizsgált szerz d re teljesül B t = c, azaz t év alatt A-ból a c osztályba jutott el. Ezzel a Bayes-tételb l adódik P (Λ = λ i B t = c) = P (B t = c Λ = λ i ) P (Λ = λ i ) P (B t = c Λ = λ j ) P (Λ = λ j ) = j=,2 M t (λ i ) (5, c ) p i M t (λ j ) (5, c ) p j a jó, illetve rossz sof r voltának valószín sége az ismert feltétel mellett. Hiszen a {Λ = λ } esemény megegyezik azzal az eseménnyel, hogy az illet jó sof r. Az így kapott két pontra koncentrált feltételes eloszlás szerint várható értéket véve egy lehetséges becslést kapunk az illet következ évi kárszámára, más szóval λ-ra: λ i M t (λ i ) (5, c ) p i i=,2 E(Λ B t = c) =. M t (λ i ) (5, c ) p i i=,2 j=,2