Mortalitás és fertilitás modellezés
|
|
- Sarolta Pappné
- 6 évvel ezelőtt
- Látták:
Átírás
1 Eötvös Loránd Tudományegyetem Természettudományi Kar Mortalitás és fertilitás modellezés Szakdolgozat Készítette: Csuka Viktória Matematika BSc, Matematikai elemző szakirány Témavezető: Prőhle Tamás Valószínűségelméleti és Statisztika Tanszék Matematika Intézet Budapest 2015
2 Tartalomjegyzék Bevezetés Motiváció Alapvető mutatók és alapfogalmak Halálozás és termékenység Magyarországon Mortalitási modellek Termékenységi mutatók Lee-Carter modell A modell elméleti alapjai A modell alkalmazása Paraméterek becslése ˆκ t kiigazítása ARIMA modellek ARMA folyamatok ARIMA folyamatok Yule-Walker-egyenletek Számítások A Lee-Carter modell gyakorlati alkalmazása Lee-Carter modell élettartam adatokra Lee-Carter modell termékenység adatokra Összefoglalás 28 Irodalomjegyzék 29 2
3 Ábrák jegyzéke 1.1. Magyarországon a várható élettartam alakulása A születéskor várható átlagos élettartam alakulása Magyarországon és a Nyugat-Európai országokban Élveszületések és halálozások száma és aránya Magyarországon Élveszületések és halálozások aránya Magyarországon A francia mortalitás adatok α paramétere A francia mortalitás adatok β paramétere A francia mortalitás adatok κ paramétere A Lee-Carter κ paraméterének 50 éves előrejelzése közötti fertilitás adatok Várható gyermekszám előrejelzése Lee-Carter modellel
4 Köszönetnyilvánítás Ezúton szeretném megköszönni témavezetőmnek, Pröhle Tamásnak a rengeteg időt és energiát amit a szakdolgozatom elkészítése során rám szánt, hasznos tanácsaival és észrevételeivel rendszeresen segítette munkámat. Továbbá szeretném megköszönni a családomnak a rengeteg támogatást és azoknak a tanároknak, oktatóknak akik tudásukkal segítették tanulmányaimat. 4
5 Bevezetés 0.1. Motiváció Szakdolgozatom témájának kiválasztásakor arra törekedtem, hogy mindenképp olyan témát válasszak, amely során a matematika olyan gyakorlati területén való alkalmazását tekintsem, amely szorosan kötődik mindennapjainkhoz és, amely olyan kérdésekre ad választ, ami a gazdaságot egyértelműen érinti. A mortalitás és a fertilitás két alapvető demográfiai jelenség. Így esett a választásom a népességstatisztikára. A dolgozatom középpontjában szerepel továbbá a Lee-Carter-modell, hiszen Magyarországon is ezt a modellt alkalmazzák a születéskor várható átlagos élettartam meghatározására és, melyről megmutatom, hogy alkalmazható a fertilitás becslésére is Alapvető mutatók és alapfogalmak 0.1. Definíció. Nyers születési arányszám: az ezer főre jutó élveszületések száma ugyanazon év évközepi népességhez viszonyítva Definíció. Nyers halálozási arányszám: a halálozások ezer lakosra jutó száma, évközepi népességre számítva Definíció. Halálozási arányszám (Nem -és korspecifikus): a nem és kor szerinti halálozások ezer megfelelő nemű és korú népességre jutó száma, évközepi népességre számítva Definíció. Termékenység: a szülőképes korban lévő női népesség, vagy egyes csoportjaira jutó születések száma. 5
6 0.2. Alapvető mutatók és alapfogalmak 0.5. Definíció. Teljes termékenységi arányszám: azt fejezi ki, hogy az adott év-kor szerinti születési gyakorisága mellett egy nő élete folyamán hány gyermeknek adna életet Definíció. Általános termékenységi arányszám: Értéke azt mutatja, hogy az adott év kor szerinti termékenységi viszonyainak tartós megmaradása esetén egy nő élete folyamán hány gyermeknek adna életet Definíció. Korspecifikus termékenységi arányszám: egy adott életkorhoz tartozó nők termékenységét fejezi ki 0.8. Definíció. Várható átlagos élettartam: azt fejezi ki, hogy a különböző életkorúak az adott év halandósági viszonyai mellett még hány évi élettartamra számíthatnak Definíció. Halál: A halálozás az ENSZ Statisztikai Bizottságának ajánlása szerint az élet minden jelének végleges elmúlása az élveszületés megtörténte után bármely idővel. (Demográfia, o) Definíció. Halálozási valószínűség: annak az esélye, hogy az adott (t) évben egy x éves személy már nem lesz életben a következő (t + 1.) évben x + 1 éves korában Definíció. Kitettség: Az x éves g csoporthoz tartozó emberek megélt életéveinek a számát jelenti a t. évben. 6
7 1. fejezet Halálozás és termékenység Magyarországon Az elmúlt évtizedekben a várható élettartam jelentősen megnőtt, mivel a halálozási tendencia az erősen iparosodott országokban a legutóbbi években csökkenő és 2010 között például Magyarországon a férfiak születéskor várható élettartama 65,45- ről 70,50-re, míg a nőké 72,70-ről 78,11 évre nőtt ábra. Magyarországon a várható élettartam alakulása Magyarországon a várható élettartam emelkedése nem volt mindig egyenletes. A nyugateurópai országokhoz képest a halálozási mutatók tekintetében hazánk állandó lemaradásban van. (Lásd az 1.2 ábrát!) A demográfia és a biztosításmatematika területén már több modellt is kidolgoztak, amely reprezentálja a mortalitást. Hagyományosan egy paraméteres görbét használtak 7
8 1.1. Mortalitási modellek éves halálozási arány illesztésére, ezek kidolgozásában Moivre-nek (1725), Gompertznek (1825) és Weibull-nak (1939) volt úttörő szerepe. Az elmúlt 30 évben számos megközelítést dolgoztak ki annak érdekében, hogy sztochasztikus modellek segítségével megbizhatóbb előrejelzést készítsenek a halandóságról. Ilyen volt McNown és Rogers (1989, 1992), Bell és Monsell (1991), és Lee és Carter (1992) munkássága is. A Lee- Carter formula lett az egyik legismertebb és a világon számos helyen használják a korspecifikus halálozási arány előrejelzésére. Másrészről, a Lee-Carter modellt és kiterjesztéseit számos más célra is alkalmazzák. Lényegében a modell feltételezi, hogy a halálozási trendek dinamikáját idővel csak egy paraméter, a mortalitási index szabályozza. A Box-Jenkins modellt, más néven autoregresszív mozgóátlag folyamatot (AR- MA) gyakran használják stacionárius, és differenciálás után stacionárius előrejelzések készítésére ábra. A születéskor várható átlagos élettartam alakulása Magyarországon és a Nyugat-Európai országokban 1.1. Mortalitási modellek Úgy tudjuk a legjobban értékelni a halálozási valószínűségek időbeli alakulását, ha a modellezésük során a halálozást befolyásoló véletlen tényezők szerepét minimalizáljuk az adott évben. Minden halálozási modell alapja az egy főre jutó halálozások száma, vagyis a központi mortalitási ráta. Ezt a következőképpen definiáljuk: m x,t = D x,t /E x,t (1.1) 8
9 1.2. Termékenységi mutatók D x,t azoknak az x éves embereknek a számát jelöli, akik a t. időszakra meghaltak. E x,t jelenti a t. évben az x éves emberek megélt életéveinek a számát, azaz a kitettséget. A központi halálozási rátákat általában éves alapon figyelik meg, 0 éves kortól egy maximális életkorig (x {0, 1,..., 110}). A halálozások számát a Központi Statisztika Hivatal statisztikáiból tudhatjuk meg. A mortalitási rátákból származtathatók az egyéves halálozási valószínűségek. Tegyük fel, hogy a kitettség a kor lineáris függvénye, ekkor a következő összefüggés írható fel: q x,t = m x,t m x,t (1.2) 1.2. Termékenységi mutatók A termékenység demográfiai értelemben az utódok nemzésére és világra hozatalára irányuló képességet, illetve készséget jelenti, ezáltal az emberi élet megújításának és megújulásának alapvető fontosságú tényezője. A születések száma a termékenység egy adott szintje mellett a szülőképes korú női népesség számától és korösszetételétől is függ, a halálozások számát pedig az adott halandósági viszonyok mellett lényegesen befolyásolja a népesség egészének korösszetétele. Egy naptári év termékenységének jellemzésére a legáltalánosabban használt és legismertebb mutató a teljes termékenységi arányszám. A teljes termékenységi arányszám (TFR = Total Fertility Rate) nem más, mint a év közötti, szülőképes korban lévő nőkre számított korspecifikus termékenységi arányszámok (ASFR = Age Specific Fertility Rate) összege. Ez a következőképpen számítható ki: ASF R i = B a E a 1000 (1.3) B a az élve születések évi száma (i. női korosztályban) és E a jelöli az i. női korosztály évközepi számát. A szülőképes korúnak Európában - és Magyarországon is - a éves korcsoport- 9
10 1.2. Termékenységi mutatók ba tartozó nőket tekintik. Ez alapján az általános termékenységi arányszám: GF R = B P n (1.4) GFR az általános termékenységi arányszámot jelöli (General Fertility Rate), B az élveszületések számát és P a megfelelő korú női népességet jelenti. Ezt a mutatót főként a szülőképes nők korösszetételének változása befolyásolja. Pl. jelenleg az összes élveszületések kétharmada a éves nőktől származik, míg a éves nőktől mindössze 1 százalék. A nyers élveszületési arányszám (Crude Birth Rate) és az általános termelékenységi arányszám között a következő összefüggés van: GF R = B P n n (1.5) A magyar lakosságot 1980-ig a természetes szaporodás, 1981-től a természetes fogyás jellemezte és jellemzi az utóbbi években is. Az 1990-es évektől a természetes fogyás fokozatosan gyorsult Magyarországon, aminek elsősorban a magas halálozás miatti veszteség a magyarázata, de hozzájárult a folyamat kialakulásához az élveszületési arányszámban bekövetkezett jelentős csökkenés is. (Lásd az 1.3 és az 1.4 ábrákat!) 10
11 1.2. Termékenységi mutatók 1.3. ábra. Élveszületések és halálozások száma és aránya Magyarországon ábra. Élveszületések és halálozások aránya Magyarországon
12 2. fejezet Lee-Carter modell 2.1. A modell elméleti alapjai A módszert eredetileg halálozási adatokra fejlesztették ki. Azóta a szakirodalomban széles körben elemzik, fejlesztik és használják is gyakorlati alkalmazások során. A neve onnan származik, hogy először az közötti éves amerikai halálozási adatokra alkalmazva Ronald D. Lee és Lawrence R. Carter publikálta 1992-ben. A Lee-Carter modell egy numerikus algoritmus, amit a halálozás és a várható élettartam előrejelzése során használnak. Lee és Carter amerikai mortalitási rátákat modelleztek, amely során egy extrapolatív módszert találtak ki és alkalmaztak. Modelljükben a halálozás három paramétertől függ: két determinisztikus kor- és egy sztochasztikus időparamétertől. A korábbi modellekhez képest az volt az erénye, hogy a halálozási ráták előrejelzéséhez idősor-elemzési módszerekkel kombinált egy egyszerű demográfiai modellt. Ráadásul anélkül, hogy magában foglalta volna a halálozási ráta változását befolyásoló orvosi, életviteli és egyéb tényezőket is. A mortalitás előrejelzéséhez használt módszerek közül a vezető statisztikai modellé vált a demográfiai szakirodalomban. - Deaton és Paxson [2004] A modell: ln(m x,t ) = α x + β x κ t + ε x,t (2.1) 12
13 2.2. A modell alkalmazása ahol m x,t az x éves ember t. időszakra (évre) vonatkozó halálozási rátáját jelenti, κ t halálozási szintre való érzékenység a t. évben, β x mutatja az érzékenységet az x életkorban, α a mortalitási ráta alapértéke, ε x,t pedig a hibatag. A halálozási előrejelzés érdekében Lee és Carter feltette, hogy β x és α x csak a kortól függ, időben állandó marad, ˆκ t nem függ a kortól csak az időszaktól, míg ε függhet a kortól és időtől is. A model hatékonyságának az oka alapvetően az, hogy a megfigyelt adatokhoz viszonyítva kevésszámú paraméterre épül így jól működik. A modellben x a vizsgált személyek kora (korcsoportja) x {0, 1,..., N} és t az időszak (általában évek, de lehetnek negyedévek, illetve hónapok is) t {1,..., T }. Ennek megfelelően a paraméterek (α 0, α 1,..., α N ), (β 0, β 1,..., β N ), (κ 0, κ 1,..., κ N ), így a paraméter száma 2(N +1)+T. Amennyiben m x,t értétek közt nincsen hiányzó érték úgy (N +1) T megfigyelésünk van. Az esetlegesen hiányzó értékekből származó probléma többféleképpen is megoldható. 1. Az egyik lehetséges út, a modell illesztése előtt interpolációval pótolni a hiányzó értékeket. 2. Egy másik lehetséges megoldás a modell α, β és κ paraméterein alapulú klasszikus idősoros technika. Többféle eljárás létezik, de ezekkel most részletesen nem foglalkozunk A modell alkalmazása A modell alkalmazása 3 lépésből áll: 1. A modell paramétereinek becslése. 2. A modellezett halálozások számának a megfigyelt halálozások számához való igazítása (κ t kiigazítása). 13
14 2.3. Paraméterek becslése 3. Előrejelzés készítése a halálozási rátákra vonatkozóan. A Lee-Carter modell túlparaméterezett abban az értelemben, hogy invariáns az alábbi transzformációkra: [8] β x cβ x κ t 1 c κ t c R, c 0 α x α x β x c κ t κ t + c c R Ez nem egy fogalmi akadály, ez csupán azt jelenti, hogy a paraméterek, amiket a modellhez társítottak, végtelen számú ekvivalens maximum helye lehet, amelyek mind azonos előrejelzéseket eredményeznek. A gyakorlatban mi csupán veszünk egy tetszőleges, de következetes paraméterezést, ami elegendő az azonosításhoz. Ezt meg tudjuk tenni azáltal, hogy bevezetünk két korlátot. Lee és Carter a következő két feltételt vezette be a paraméterek egyértelmű meghatározása érdekében: N β x = 1 (2.2) x=1 T κ t = 0 (2.3) t=1 T jelöli az évek számát, N pedig a legmagasabb életkort, ami a megfigyelésben szerepel Paraméterek becslése A formula mátrixos alakban is felírható: M = A + b.k (2.4) M = (M x,t ) (2.5) M x,t = ln(m x,t ) α x (2.6) ahol M egy r n-es mátrix és minden M i,j eleme megfelel a korspecifikus i. halálozási ráta természetes logaritmusával a j. évben. A szintén egy r n-es mátrix. Azok az elemek amelyek ugyanabba a kategóriába tartoznak egyenlőek, így: a 1,j = a 2,j =... = a r,j 14
15 2.3. Paraméterek becslése az azonos j. évre, b egy r 1-es vektor, k pedig egy 1 n-es vektor. A korábban bevezetett két korlát nélkül nem lenne egyetlen megoldása az egyenletnek. Az α x korspecifikus paraméter, az adott paraméterezés és peremfeltételek mellett a halálozási ráták logaritmusának várható értéke. Ezért a megfigyelt halálozási rátákból számolt ˆα x = 1 T ln(m x,t ) (2.7) T x=1 átlag egy a céljainknak megfelelő, torzitatlan becslése. Az A mátrix elemeinek ismeretében, a mátrixos egyenletet átírhatjuk az alábbi formába: M = M A = b.k (2.8) A következőkben az M mártixot fogjuk közeliteni Lee és Carter ajánlásának megfelelően az SVD (szinguláris értékek szerinti felbontás) 1 módszer segítségével. Ezzel a módszerrel az M mátrix legkisebb négyzetekkel vett tetszőleges pontosságú közelitését megkaphatjuk. Ugyanis az SVD felbontás szerinti l = 0,..., N-re vannak olyan B l illetve K l vektorok, amelyekre az M mátrix m x,t eleme N m x,t = B l,x Kl,t T (2.9) l=0 Ráadásul, ha a B l és K l vektorokat a szinguláris értékek csökkenő sorrendjében vesszük figyelembe, akkor az fenti összeg első, például n tagja az M legjobb n-ed rendű közelötése a négyzetes eltérés értelemében. A mondottak miatt a Lee-Carter módszer az M közelitéseként az SVD felbontás első vektorpárját alkalmazza. Vagyis, azt a közelitést veszi, hogy: M B 1 K1 T (2.10) ahol B 1 és K 1 az M mátrix szinguláris felbontás szerinti első faktora. 1 Ez a módszer a pozitív szemidefinit mátrixok spektrálfelbontásának általánosítása nem csak négyzetes mátrixokra. 15
16 2.4. ˆκ t kiigazítása A Lee-Carter módszer szerint az így nyert ˆα x paramétereket időfüggetlen korspecifikus paraméterként; a ˆκ t paramétereket pedig korfüggetlen, időfüggő, látens folyamatként értelmezzük. A ˆβ x paraméter pedig azt fejezi ki, hogy milyen mértékben függ egy adott kor rátája az adott időpontra jellemző ˆκ t értéktől. Az ε x,t a mortalitási ráta véletlen változásainak azt a részét modellezi, amely a többi korra, időpontra jellemző rátától független. Összefoglalva, a becslés kiindulásaként a következő értékeket alkalmazhatjuk. Legyen ˆα x mint korábban: ˆα x = T x=1 ln(m x,t) T (2.11) Legyen az M mátrixnak a v 1 és az u 1 az első szinguláris bázispárja és a σ 1 az első szinguláris értéke. Ekkor, figyelembe véve a peremfeltételeket is: ˆκ t = σ 1 v 1,t u 1,x (2.12) x X ˆβ x = u 1,x x X u 1,x (2.13) A második lépés során a ˆκ t paramétereket kiigazítjuk, hogy a megfigyelt és a modellezett halálozások száma minden egyes évben megegyezzen egymással ˆκ t kiigazítása Erre tulajdonképpen azért van szükség, mert a modell paramétereinek becslésekor a fiatal korok mortalitási rátái ugyanolyan súlyt kapnak, mint az idős korokéi, holott az előbbiek lényegesen kisebb mértékben járulnak hozzá az összes halálozás számához. ˆκ t -t helyettesítjük κ t -vel, melyet a következő egyenlőségból egyértelműen meghatározhatunk: D x,t = x x [E x,t exp(ˆα x,t + ˆβ xˆκ t )] (2.14) 16
17 2.4. ˆκ t kiigazítása Ezek után már csak a harmadik lépés van hátra, melynek során előrevetítjük a mortalitási rátákat a jövőre, és az így kapott értékek alapján becslést készítünk a jövőben várható átlagos élettartamra. Az előrejelzés során az ˆα x és a ˆβ x paramétereket konstansoknak tekintjük és a κ t = [ κ (i) 1, κ (i) 2,..., κ (i) t ] T idősorát standard egyváltozós idősor-elemzési módszert használva extrapoláljuk. Végeredményben ezeket az extrapolált látens faktorokat helyettesítjük vissza a Lee-Carter-egyenletbe, hogy megkapjuk a jövőbeli mortalitási rátákat, majd a valószínűségeket. 17
18 3. fejezet ARIMA modellek Az idősorok egyik alap modellje az ARMA modell (autoregresszív mozgóátlag modell) és annak kiterjesztettje az ARIMA modell (AutoRegressive Integrated Moving Average / Integrált Autoregresszív Mozgóátlag Folyamatok) Definíció. Idősor: Egy valószínűségi változó sorozat, amely általában időben ekvidisztáns időpontokban tett megfigyelések sorozata Definíció. Stacionárius: Egy folyamat, ha valamilyen valószínűségi jellemzője időben eltolásinvariáns Definíció. Bővebb értelemben stacionárius: Abban az esetben, ha a várhatóérték, a szórás és az időben azonos távolságra levő megfigyelések kovarieciája időben eltolásinvariáns Definíció. Szűkebb értelemben stacionárius: Ha a végesdimenziós eloszlásai eltolásinvariánsak Definíció. Végesdimenziós eloszlás: Adott számú egymásutáni megfigyelés együttes eloszlása Definíció. Ha X n a következő alakban írható fel: p X(t) = X t + ϕ 1 X t ϕ p X t p + ε t = c + ϕ i X t i + ε t (3.1) ahol ϕ i -k valós számok, ε pedig fehérzaj. Ekkor X autoregressziós p-ed rendű folyamat. Jelölése: AR(p) 18 i=1
19 3.3. Yule-Walker-egyenletek 3.7. Definíció. q Y (t) = ϑ 0 ε t + ϑ 1 ε t ϑ q ε t q = η + ε t + ϑ j ε t j (3.2) folyamatot q-rendű mozgóátlag folyamatnak nevezzük. Jelölés: MA(q) j= ARMA folyamatok Az ARMA modellek a sztochasztikus idősorelemzés legegyszerűbb és a gazdasági gyakorlatban leginkább elterjedt ágát jelentik, melyeket az AR- és az MA-modellek egyesítéseként állítottak elő. Az ARMA folyamatok jelentősége az utóbbi évtizedekben megnőtt, s a tapasztalatoknak köszönhetően matematikailag jól kezelhetőek és általánosíthatóak. Az autoregresszív jelző arra utal, hogy Y t részben saját véges múltjára vonatkozó lineáris regressziójaként írható fel. A mozgó átlag jelző pedig azt fejezi ki, hogy a lineáris regresszió "hibatagja" az ε t fehérzaj mozgó átlaga, azaz a jelen és a véges múlt lineáris kombinációja Definíció. Legyen ε(t) független, 0 várható értékű, stacionárius zaj. Ekkor ha: p q X t + ϕ i X t i = ϑ j ε t j (3.3) i=1 j=0 ha az X t folyamat a fenti egyenletet elégíti akkor az egy ARMA(p,q) folyamat ARIMA folyamatok 3 fő részből áll: 1. AR(p) 2. I(d) 3. MA(q) p,d,q nem negatív egész számok, p az autoregresszív feltételek száma, d a nem-szezonális különbségek száma, és q az elcsúsztatott becslési hibák száma az előrejelzési egyenletben Definíció. ARIMA: Egy folyamat ARIMA(p,d,q), hogyha a folyamat d-ed rendű differenciálfolyamat egy ARMA(p,q) folyamat. 19
20 3.3. Yule-Walker-egyenletek 3.3. Yule-Walker-egyenletek Udny Yule és Gilbert Walker nevéhez köthető a következő egyenletrendszer: p γ m = ϕ k γ m k + σεδ 2 m,0 (3.4) k=1 Ahol m = 0, 1, 2,.... Itt a γ m az X t folyamat m. autokovarieciája. σ ε a bemeneti zaj eljárás szórása és a δ m,0 a Kronecker-féle delta függvénye 1. Csak akkor 1, ha az m = 0. Ha vesszük az m = 1,..., p egyenleteket, akkor azok egy egyenletrendszert alkotnak. Az egyenletrendszer megoldható az ábrázolt egyenletre m > 0 a mátrixos formulában, így megkapjuk az egyenletrendszert γ p ϕ 1 γ 1 γ 0 γ 1 γ 2... γ 2 γ 1 γ 0 γ 1... ϕ 2 = γ p 1 γ p 2 γ p 3... ϕ p (3.5) Az ismert-becsült γ esetén az egyenlet alapján az autoregresszió ϕ {ϕ m : m = 1, 2,..., p} együtthatói megbecsülhetőek. Ezekből a becslésekből és az m=0 egyenletet felhasználva becslést kaphatunk a zaj σ szórására: m γ 0 = ϕ k γ k + σε 2 (3.6) k=1 Tehát látható, hogy az autokorrelációs függvény első p+1 eleme meghatározza az AR paramétereket. A teljes függvény ezután rekurzív módon kiszámítható. Ugyanis a felső egyenletnek teljesülnie kell, j=p+1-re is. 1 A Kronecker-féle delta matematikai kétváltozós (általában valós számokon értelmezett) függvény és értéke 1, ha a két változó értéke egyenlő, minden más esetben 0. Például δ 12 = 0, de δ 33 = 1. A függvényt Leopold Kronecker ( ) német matematikusról nevezték el. 20
21 3.3. Yule-Walker-egyenletek Például: r=1: Ezért r(j) = r ϕ k r(k j)j = p + 1, p + 2,... (3.7) k=1 γ 1 = ϕ 1 γ 0 r 1 = γ 1 /γ 0 = ϕ 1 p=2 A Yule-Walker egyenletek AR(2) folyamatra γ 1 = ϕ 1 γ 0 + ϕ 2 γ 1 γ 2 = ϕ 1 γ 1 + ϕ 2 γ 0 Tudjuk, hogy γ k = γ k, és az első egyenlet eredményei alapján: A rekurzív formula eredményeit használva: r 1 = γ 1 /γ 0 = ϕ 1 1 ϕ 2 r 2 = γ 2 /γ 0 = γ2 1 γ γ 2 1 γ 2 21
22 4. fejezet Számítások 4.1. A Lee-Carter modell gyakorlati alkalmazása R.D. Lee és L. Carter az amerikai élettartam adatok elemzésekor, a κ t modellezésére számos integrált autoregresszív-mozgóátlag (ARIMA) modellt tesztelt, végül úgy találták, hogy egy egyszerű véletlen bolyongás (random walk) modell illeszkedik legjobban az adataikra. Ugyan elvileg lehetséges, hogy egyéb adatokra más modellspecifikáció alkalmasabb, de a szakirodalomban és az alkalmazásokban szinte kivétel nélkül ezzel a modellel lehet találkozni. Szakdolgozatomban az R program-környezet 1 demography 2 nevezetű kiegészitését használva készítettünk előrejelzést a várható élettartam és termékenység adatokra a Lee- Carter modell segítségével. 1 Az R egy magas szintű programozási nyelv és környezet, melynek legfontosabb felhasználása az adatelemzés és az ahhoz kapcsolódó grafikus megjelenítés. 2 Rob J Hyndman with contributions from Heather Booth, Leonie Tickle and John Maindonald. (2014). demography: Forecasting mortality, fertility, migration and population data. R package version
23 4.2. Lee-Carter modell élettartam adatokra A demography csomag fr.mort adathalmaz a franciaországi népesség számokat és halálozási rátákat tartalmazza 1816 és 2006 közt éves bontásban nemenként. Tehát összesen 191 év adata áll rendelkezésre. Ennek alapján készítettük a modellt az os évekre a korosztály mindegyikére, és egy előrejelzést, az követketkező 50 évre, 2056-ig. A szükséges program lépések egy kivonata az alábbi. library(demography) M <- lca(fr.mort, adjust="e0") F <- forecast(m, 50) plot(m, c ) plot(f, c ) A demogdata osztályú fr.mort tartalmazza a feldolgozott adatokat. Ezek alapján, az lca() program végzi el a Lee-Carter modell illesztését. Létrehoz egy lca osztályú objektumot. A létrejött M modell objektum alapján a forecast.lca() program készíti el az 50 éves előrejelzést. A keletkező F objektum osztálya fmforecast. E lista tipusú változó kt.f eleme tartalmazza a κ t komponens előrejelzését és az előrejelzésnek az alapértelmezés szerint 80%-os konfidencia tartományának határait. 23
24 A programrészlet grafikus eredményei: 4.1. ábra. A francia mortalitás adatok α paramétere 4.2. ábra. A francia mortalitás adatok β paramétere 24
25 4.3. ábra. A francia mortalitás adatok κ paramétere 4.4. ábra. A Lee-Carter κ paraméterének 50 éves előrejelzése 4.3. Lee-Carter modell termékenység adatokra A Lee-Carter modell A demography csomag aus.fert adathalmaza az ausztráliai nők fertilitás adatait tartalmazza 1921 és 2002 között, 7 korcsoportban. E korcsoportok a következők: "<20" "20-24" "25-29" "30-34" "35-39" "40-44" "44<". Előbb a tfr() program segítségével, kiszámítjuk a teljes népességre vonatkozó fertilitás értéket, a rendelkezésre álló 82 évre. Így egy 82 hosszú ts osztályú objektum jön létre. Az fdm() program segítségével, közvetlen az aus.fert adatokból létrehozunk egy fdm és ftsm, azaz egy functional demographic model típusú w2 változót. Ez a lépés jelenti a Lee-Carter modell illesztését. Az illesztett modell alapján az forecast.fdm() készíti el 25
26 a paraméterek előrejelzését. A kapott fmforecast és demogdata osztályú w3 objektum alapján a tfr() program PI=TRUE paraméterezés melletti ismételt meghívása eredményezi a bemutatott előrejelzés konfidencia tartományát. A konfidencia tartomány a κ t komponens 400-szori idősoros szimulációja alapján készül, úgy, hogy a szimulált idősoroknak időpontonként veszi az alapértelmezés szerinti 10-90%-os kvantiliseit. A kvantiliseket stats::quantile() függvény alapértelmezés szerinti, 7-es sorszámú módszerével számolja, amely egy folytonos eloszlásokra érvényes, módusz alapú technika. A szükséges program lépések egy kivonata az alábbi. w1<-tfr(aus.fert) # kiszamoljuk a tfr-t plot(w1) w2<-fdm(aus.fert) # keszitunk egy fdm-et w3 <- forecast(w2) w4 <- tfr(w3,pi=true,nsim=400) plot(w4) A programrészlet grafikus eredményei: 4.5. ábra közötti fertilitás adatok 26
27 4.6. ábra. Várható gyermekszám előrejelzése Lee-Carter modellel 27
28 5. fejezet Összefoglalás Szakdolgozatomban demográfiai kérdésekkel foglalkoztam, hiszen manapság a társadalmat jellemző változások között szerepel a növekvő születéskor várható átlagos élettartam, a született gyermekek számának alakulása és így a populációban bekövetkező változások is. Ezek hatására dolgozatom célja a népességstatisztika vizsgálata volt, melyhez az előrejelzések során a Lee-Carter modellt alkalmaztam. Az eredményeim megbízhatóságának növelése érdekében a számításokat az R programkörnyezetet segítségével végeztem. A bevezetésben a szükséges fogalmakat és mutatókat vezettem be és definiáltam. Ezek után az első fejezetben ismertettem a mortalitást, a születéskor várható átlagos élettartamot és annak alakulását Magyarországon, majd a fertilitást és magyarországi jellemzőit is. A második fejezetben részletesen vizsgáltam a Lee-Carter módszert és alkalmazásait. A negyedik fejezetben pedig az autoregresszív mozgóátlagolású folyamatokat ismertettem. Végül pedig számításokat végeztem az R programkörnyezetben a Lee-Carter módszer segítségével a születéskor várható átlagos élettartam és a termékenység előrejelzésére, majd ezeket dokumentáltam. Összességében elmondható, hogy eredményeim megerősítették a dolgozat kiinduló feltevését, vagyis a Lee-Carter módszer a fertilitás előrejelzésére való alkalmazása sikeres volt. A módszer széleskörűen alkalmazható. 28
29 Irodalomjegyzék [1] Demográfiai adatbázis, elérés időpontja [ ] [2] fogalmak angol-magyar megfeleltetése szempontjából, elérés időpontja [ ] [3] R programkörnyezet, Demográfiai adatbázis, elérés időpontja [2015] [4] Ronald D. Lee, Lawrence Carter: Modeling and Forecasting the Time Series of U.S. Mortality, Journal of the American Statistical Association, 87(419), (Szeptember) , [1992] [5] Májer István, Dr. Kovács Erzsébet: Élettartam-kockázat - ugdíjrendszerre nehezedő egyik teher, Statisztikai szemle, 89. évfolyam 7-8. szám, [2011] [6] Baran Sándor, Gáll József, Ispány Márton, Pap Gyula: A Lee-Carter módszer magyarországi alkalmazása, elérés időpontja [ ] [7] Kamarás Ferenc: Termékenység, népesség-reprodukció, [2006] [8] Federico Girosi, Gary King: Understanding the Lee-Carter Mortality Forecasting Method, Harvard University, [2007] [9] Lucía Anderozzi, María Teresa Blaconá, Nora Arnesi: The Lee-Carter method for estimating and forecasting mortality: an application for Argentina, National University of Rosario, Argentina, [2011] [10] Colin Newell: Methots and Models in Demography, The Guilford Press, New York, [1990] [11] Ádány Róza: Megelőző orvostan és népegészségtan, Debreceni Egyetem, [2011] 29
30 Nyilatkozat Név: Csuka Viktória ELTE Természettudományi Kar, szak: Matematika Bsc Neptun azonosító: F855BK Szakdolgozat címe: Mortalitás és fertilitás modellezés Alulírott Csuka Viktória, az Eötvös Loránd Tudományegyetem hallgatója kijelentem, hogy ezt a diplomamunkát meg nem engedett segítség nélkül, saját magam készítettem, és a diplomamunkában a megadott forrásokat használtam fel. Minden olyan részt, amelyet szó szerint, vagy azonos értelemben, de átfogalmazva más forrásból átvettem, egyértelműen, a forrás megadásával megjelöltem. Budapest, Csuka Viktória hallgató aláírása
A Lee-Carter módszer magyarországi
A Lee-Carter módszer magyarországi alkalmazása Baran Sándor, Gáll József, Ispány Márton, Pap Gyula Alkalmazott Matematika és Valószínűségszámítás Tanszék, Debreceni Egyetem, Informatikai Kar 1 Feladatok:
Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta
Autoregresszív és mozgóátlag folyamatok Géczi-Papp Renáta Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
Autoregresszív és mozgóátlag folyamatok
Géczi-Papp Renáta Autoregresszív és mozgóátlag folyamatok Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Természetes népmozgalom
Természetes népmozgalom Termékenység és halandóság Termékenység fertilitás Nem minden nő ad gyermeknek életet De egy nő élete során több gyermeknek is adhat életet Halandóság mortalitás Mindenki meghal
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
EGER DEMOGRÁFIAI FOLYAMATAINAK ELEMZÉSE ÉS ELŐREJELZÉSE (összegzés) 1995-2024
CSALÁDSEGÍTŐ INTÉZET 3300 EGER, KERTÉSZ ÚT 3. TELEFON / FAX: 06-36/784-825 E-mail: csaladsegito.intezet@upcmail.hu Web: csskeger.hu EGER DEMOGRÁFIAI FOLYAMATAINAK ELEMZÉSE ÉS ELŐREJELZÉSE (összegzés) 1995-2024
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
A Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Valószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
TÁJÉKOZTATÓ BÉKÉS MEGYE NÉPEGÉSZSÉGÜGYI HELYZETÉRŐL
NÉPEGÉSZSÉGÜGYI FŐOSZTÁLY TÁJÉKOZTATÓ BÉKÉS MEGYE NÉPEGÉSZSÉGÜGYI HELYZETÉRŐL 2015. november 2. Tartalomjegyzék Fogalmak... 4 Demográfia népesség, népmozgalom, foglalkoztatottság... 6 Halálozás (mortalitás)
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 11. Előadás Portfólió probléma Portfólió probléma Portfólió probléma Adott részvények (kötvények,tevékenységek,
STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés
Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság
Diagnosztika és előrejelzés
2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának
A MIDAS_HU modell elemei és eredményei
A MIDAS_HU modell elemei és eredményei Tóth Krisztián Országos Nyugdíjbiztosítási Főigazgatóság A MIDAS_HU mikroszimulációs nyugdíjmodell eredményei további tervek Workshop ONYF, 2015. május 28. MIDAS_HU
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49
Matematikai statisztika Gazdaságinformatikus MSc 8. előadás 2018. október 29. 1/49 alapfogalmak Elméleti idősor - valószínűségi változók egy indexelt {X t, t T } családja, avagy időtől függő véletlen mennyiség.
1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)
Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő
Statisztikai módszerek a skálafüggetlen hálózatok
Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1
Megoldott feladatok 00. november 0.. Feladat: Vizsgáljuk az a n = n+ n+ sorozat monotonitását, korlátosságát és konvergenciáját. Konvergencia esetén számítsuk ki a határértéket! : a n = n+ n+ = n+ n+ =
DIFFERENCIAEGYENLETEK
DIFFERENCIAEGYENLETEK Példa: elsőrendű állandó e.h. lineáris differenciaegyenlet Ennek megoldása: Kezdeti feltétellel: Kezdeti feltétel nélkül ha 1 és a végtelen összeg (abszolút) konvergens: / 1 Minden
Adaptív dinamikus szegmentálás idősorok indexeléséhez
Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november
Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika
Bevezetés 1. előadás, 2015. február 11. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Heti 2 óra előadás + 2 óra
Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,
Matematikai statisztika. elıadás, 9.5.. Továbblépés Ha nem fogadható el a reziduálisok korrelálatlansága: Lehetnek fel nem tárt periódusok De más kapcsolat is fennmaradhat az egymáshoz közeli megfigyelések
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON
AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON DR. PAKSY ANDRÁS A lakosság egészségi állapotát jellemző morbiditási és mortalitási mutatók közül a halandósági tábla alapján
ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
A kockázat fogalma. A kockázat fogalma. Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András
Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András A kockázat fogalma A kockázat (def:) annak kifejezése, hogy valami nem kívánt hatással lesz a valaki/k értékeire, célkitűzésekre. A kockázat
Differenciálegyenletek numerikus megoldása
a Matematika mérnököknek II. című tárgyhoz Differenciálegyenletek numerikus megoldása Fokozatos közeĺıtés módszere (1) (2) x (t) = f (t, x(t)), x I, x(ξ) = η. Az (1)-(2) kezdeti érték probléma ekvivalens
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
Demográfiai modellek (folytatás)
Demográfiai modellek (folytatás) 4. A teljesebb anyag 4.1. A megoldás egy változata Alábbiakban az előző gyakorlaton szereplő keretprogramból kapható egy lehetséges megoldást részletezzük. (Ha már a sajátja
Normák, kondíciószám
Normák, kondíciószám A fizika numerikus módszerei I. mf1n1a06- mf1n2a06 Csabai István Lineáris egyenletrendszerek Nagyon sok probléma közvetlenül lineáris egyenletrendszer megoldásával kezelhetı Sok numerikus
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
6. Előadás. Megyesi László: Lineáris algebra, oldal. 6. előadás Bázis, dimenzió
6. Előadás Megyesi László: Lineáris algebra, 37. 41. oldal. Gondolkodnivalók Lineáris függetlenség 1. Gondolkodnivaló Legyen V valós számtest feletti vektortér. Igazolja, hogy ha a v 1, v 2,..., v n V
Matematikai geodéziai számítások 5.
Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
Least Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
egyenlőtlenségnek kell teljesülnie.
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Abszolútértékes és gyökös kifejezések A szürkített hátterű feladatrészek nem tartoznak az érintett témakörhöz, azonban szolgálhatnak fontos információval
Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai
Exponenciális kisimítás Üzleti tervezés statisztikai alapjai Múlt-Jelen-Jövő kapcsolat Egyensúlyi helyzet Teljes konfliktus Részleges konfliktus: 0 < α < 1, folytatódik a múlt, de nem változatlanul módosítás:
Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 9. Előadás Az optimalizálás alapfeladata Keressük f függvény maximumát ahol f : R n R és
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
Matematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.
FŐBB MUTATÓK A regionális GDP adatok minősége alapvetően 3 tényezőtől függ: az alkalmazott számítási módszertől a felhasznált adatok minőségétől a vizsgált területi egység nagyságától. A TERÜLETI EGYENLŐTLENSÉGEK
11. Előadás. 11. előadás Bevezetés a lineáris programozásba
11. Előadás Gondolkodnivalók Sajátérték, Kvadratikus alak 1. Gondolkodnivaló Adjuk meg, hogy az alábbi A mátrixnak mely α értékekre lesz sajátértéke a 5. Ezen α-ák esetén határozzuk meg a 5 sajátértékhez
Ipari matematika 2. gyakorlófeladatok
Ipari matematika. gyakorlófeladatok. december 5. A feladatok megoldása általában többféle úton is kiszámítató. Interpoláció a. Polinom-interpoláció segítségével adjunk közelítést sin π értékére a sin =,
Szezonális kiigazítás az NFSZ regisztrált álláskeresők idősorain. Készítette: Multiráció Kft.
az NFSZ regisztrált álláskeresők idősorain Készítette: Multiráció Kft. SZEZONÁLITÁS Többé kevésbe szabályos hullámzás figyelhető meg a regisztrált álláskeresők adatsoraiban. Oka: az időjárás hatásainak
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
Statisztika II előadáslapok. 2003/4. tanév, II. félév
Statisztika II előadáslapok 3/4 tanév, II félév BECSLÉS ÉS HIPOTÉZISVIZSGÁLAT Egyik konzervgyár vágott zöldbabot exportál A szabvány szerint az üvegek nettó töltősúlyának az átlaga 3 g, a szórása 5 g Az
VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)
VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket
EPIDEMIOLÓGIA I. Alapfogalmak
EPIDEMIOLÓGIA I. Alapfogalmak TANULJON EPIDEMIOLÓGIÁT! mert része a curriculumnak mert szüksége lesz rá a bármilyen tárgyú TDK munkában, szakdolgozat és rektori pályázat írásában mert szüksége lesz rá
BIOMATEMATIKA ELŐADÁS
BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség
Gauss-Seidel iteráció
Közelítő és szimbolikus számítások 5. gyakorlat Iterációs módszerek: Jacobi és Gauss-Seidel iteráció Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 ITERÁCIÓS
LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei
Legkisebb négyzetek módszere, folytonos eset Folytonos eset Legyen f C[a, b]és h(x) = a 1 φ 1 (x) + a 2 φ 2 (x) +... + a n φ n (x). Ekkor tehát az n 2 F (a 1,..., a n ) = f a i φ i = = b a i=1 f (x) 2
Matematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei
A Gauss-Jordan elimináció, mátrixinvertálás Gauss-Jordan módszer Ugyanazzal a technikával, mint ahogy a k-adik oszlopban az a kk alatti elemeket kinulláztuk, a fölötte lévő elemeket is zérussá lehet tenni.
A termékenység és a párkapcsolatok nyitott kérdései
A termékenység és a párkapcsolatok nyitott kérdései Kamarás Ferenc Kohorsz 18 Magyar Születési Kohorszvizsgálat Nyitókonferencia KSH 2017. november 13. A termékenység nyitott kérdései Hogyan és mikor biztosítható
Előfeltétel: legalább elégséges jegy Diszkrét matematika II. (GEMAK122B) tárgyból
ÜTEMTERV Programozás-elmélet c. tárgyhoz (GEMAK233B, GEMAK233-B) BSc gazdaságinformatikus, programtervező informatikus alapszakok számára Óraszám: heti 2+0, (aláírás+kollokvium, 3 kredit) 2019/20-es tanév
Matematikai geodéziai számítások 10.
Matematikai geodéziai számítások 10. Hibaellipszis, talpponti görbe és közepes ponthiba Dr. Bácsatyai, László Matematikai geodéziai számítások 10.: Hibaellipszis, talpponti görbe és Dr. Bácsatyai, László
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Abszolútértékes és gyökös kifejezések
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Abszolútértékes és gyökös kifejezések A szürkített hátterű feladatrészek nem tartoznak az érintett témakörhöz, azonban szolgálhatnak fontos információval
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH
Idősorok Idősor Statisztikai szempontból: az egyes időpontokhoz rendelt valószínűségi változók összessége. Speciális sztochasztikus kapcsolat; a magyarázóváltozó az idő Determinisztikus idősorelemzés esetén
0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles
Matematika szigorlat, Mérnök informatikus szak I. 2013. jan. 10. Név: Neptun kód: Idő: 180 perc Elm.: 1. f. 2. f. 3. f. 4. f. 5. f. Fel. össz.: Össz.: Oszt.: Az elérhető pontszám 40 (elmélet) + 60 (feladatok)
Gauss elimináció, LU felbontás
Közelítő és szimbolikus számítások 3. gyakorlat Gauss elimináció, LU felbontás Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 EGYENLETRENDSZEREK 1. Egyenletrendszerek
Poncelet egy tételéről
1 Poncelet egy tételéről Már régebben találkoztunk az [ 1 ] műben egy problémával, mostanában pedig a [ 2 ] műben a megoldásával. A probléma lényege: határozzuk meg a egyenletben szereplő α, β együtthatókat,
KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység
KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:
Normális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
Korreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Kutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
15. LINEÁRIS EGYENLETRENDSZEREK
15 LINEÁRIS EGYENLETRENDSZEREK 151 Lineáris egyenletrendszer, Gauss elimináció 1 Definíció Lineáris egyenletrendszernek nevezzük az (1) a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
Fodor Péter. Halandósági táblák el rejelzése
Eötvös Loránd Tudományegyetem Természettudományi Kar Fodor Péter Halandósági táblák el rejelzése BSc Szakdolgozat Témavezet : Zempléni András Valószín ségelméleti és Statisztika Tanszék Budapest, 2016
Termelés- és szolgáltatásmenedzsment
Termelés- és szolgáltatásmenedzsment egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék Termelés- és szolgáltatásmenedzsment 13. Előrejelzési módszerek 14. Az előrejelzési modellek felépítése
Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához
Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához Izsák Ferenc 2007. szeptember 17. Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához 1 Vázlat Bevezetés: a vizsgált egyenlet,
Irányításelmélet és technika II.
Irányításelmélet és technika II. Legkisebb négyzetek módszere Magyar Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék amagyar@almos.vein.hu 200 november
Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió
Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió 1. A fizetés (Y, órabér dollárban) és iskolázottság (X, elvégzett iskolai év) közti kapcsolatot vizsgáljuk az Y t α + β X 2 t +
GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén, az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi
Matematika III előadás
Matematika III. - 2. előadás Vinczéné Varga Adrienn Debreceni Egyetem Műszaki Kar, Műszaki Alaptárgyi Tanszék Előadáskövető fóliák Vinczéné Varga Adrienn (DE-MK) Matematika III. 2016/2017/I 1 / 23 paramétervonalak,
Typotex Kiadó. Jelölések
Jelölések a = dolgozók fogyasztása (12. fejezet és A. függelék) a i = egyéni tőkeállomány i éves korban A = társadalmi (aggregált) tőkeállomány b j = egyéni nyugdíj j éves korban b k = k-adik nyugdíjosztály
3. Előadás. Megyesi László: Lineáris algebra, oldal. 3. előadás Lineáris egyenletrendszerek
3. Előadás Megyesi László: Lineáris algebra, 47. 50. oldal. Gondolkodnivalók Determinánsok 1. Gondolkodnivaló Determinánselméleti tételek segítségével határozzuk meg a következő n n-es determinánst: 1
IBNR számítási módszerek áttekintése
1/13 IBNR számítási módszerek áttekintése Prokaj Vilmos email: Prokaj.Vilmos@pszaf.hu 1. Kifutási háromszög Év 1 2 3 4 5 2/13 1 X 1,1 X 1,2 X 1,3 X 1,4 X 1,5 2 X 2,1 X 2,2 X 2,3 X 2,4 X 2,5 3 X 3,1 X 3,2
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Matematika A2 vizsga mgeoldása június 4.
Matematika A vizsga mgeoldása 03. június.. (a (3 pont Definiálja az f(x, y függvény határértékét az (x 0, y 0 helyen! Megoldás: Legyen D R, f : D R. Legyen az f(x, y függvény értelmezve az (x 0, y 0 pont
Markov-láncok stacionárius eloszlása
Markov-láncok stacionárius eloszlása Adatbányászat és Keresés Csoport, MTA SZTAKI dms.sztaki.hu Kiss Tamás 2013. április 11. Tartalom Markov láncok definíciója, jellemzése Visszatérési idők Stacionárius
Elemi statisztika fizikusoknak
1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok