Modellpontok képzése és használata Dr. Kovács Erzsébet egyetemi tanár Budapesti Corvinus Egyetem A jogosultságszerzés modellezése szekció 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 1
Szakmai kihívás és érdekes feladat Murphy szerint Booker törvénye: Egy gramm alkalmazás felér egy tonna elvonatkoztatással. Modellpont= adatbányászat vagy statisztikai elemzés??? 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 2
Előzmények NYIKA Jelentés 2010 (Szerk: Holtzer Péter) Ennek 7. melléklete: A hatásvizsgálat mikroszimulációs modellje (Horváth Gyula) Modellpontok szerinti kalkuláció A jogosultságszerzők és a teljes népesség összevetése (Rétallér Orsolya) Felkérés modellpontok képzésére Modellpontok kialakítása az aktívakra és az ellátottakra (Kovács Erzsébet és Vékás Péter) Forrás: ONYF Adminisztratív adatai és KSH 2015.05.28. 3 MIDAS_HU Workshop: Modellpontok képzése
A feladat kettőssége 2012-ig tartó 9 321 199 adatból a jövőbeni modellpontok? Jogosultság-szerzőkről sok egyedi adat, de Személyi jellemzők kevéssé ismertek Nem reprezentatív része a népességnek életkor szerint nagy eltérések Ellátottakról Korábbi személyi adatok (pl. foglalkozás, szolgálati idő hossza) nem ismertek Részletes adat: az ellátás típusa és a járadék nagysága 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 4
ONYF 5 kohorsz követése: max 80% 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 5
A teljes népesség Sok egyedi adatot (is) tudunk, amit az ONYF nem tart nyilván (pl. iskolai végzettség, családi állapot) Viszonyítási pontot jelent a jogosultságszerzők adatainak és megoszlásának ellenőrzésére az újonnan belépők modellpontjainak képzésében Néhány ábra következik a tendenciák áttekintésére (életkor nemek szerint, családi állapot, szülések száma, stb.) a változás nem ért véget! 2015.05.28. 6 MIDAS_HU Workshop: Modellpontok képzése
Munkakezdők (keveset tud az ONYF róluk) és nyugdíjba vonulók várható száma Magyarországon 2300000 2100000 1900000 1700000 1500000 1300000 15-24 évesek nyugdíjba menők száma 1100000 900000 700000 2000 2002 2004 2006 2008 2010 2012 2014 2016 2018 2020 2022 2024 2026 2028 2030 2032 2034 2036 2038 2040 2042 2044 2046 2048 2050 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 7
A népesség száma nem és kor szerint, hatalmas változás volt 1910. január 1. 2011. január 1. 100 X 100 X Férfi 90 80 Nő Férfi 90 80 Nő 70 70 60 60 50 50 40 40 30 30 20 20 10 10 120 100 80 60 40 Ezer lakos 20 0 0 0 20 40 60 80 100 120 Ezer lakos 120 100 80 60 40 Ezer lakos 20 0 0 0 20 40 60 80 100 120 Ezer lakos 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 8
A népesség száma nem, életkor és családi állapot szerint, 2011. január 1. Nem stabil arány és nem szimmetrikus 100 X Férfi 90 Nő 80 70 60 50 40 30 20 10 100 80 60 40 20 0 Ezer lakos Házas Nőtlen, hajadon 0 0 20 40 60 80 100 Ezer lakos Elvált Özvegy 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 9
40 és 60 éves korban várható átlagos élettartam, 1960 2010 A növekedés (hogyan) folytatódik? Év 40 40 éves korban várható átlagos élettartam (e 0 40 ) Év 23 60 éves korban várható átlagos élettartam (e 0 60 ) 37 21 34 19 31 17 28 15 25 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 Férfi Nő 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 10 13
Az eltérés tartós máshol is: 80 éves angol adatsor EOLB Years 85 80 75 70 65 60 55 50 45 40 Females Males 1911 1921 1931 1941 1951 1961 1971 1981 1991 Year 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 11
Élveszületések az anya életkora szerint (f x ) A szülő nők átlagos életkora 1990 2010 (x) Ezer nőre 180 Év 33 150 31 120 29 90 27 60 25 30 23 0 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Korév 1990 2000 2010 21 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Első Második Harmadik gyermeknél 2008 2009 2010 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 12
Modellpont képzés módszerei 1. Mintavételi módszerek Véletlen, egyszerű vagy rétegzett mintavételi eljárások Gond: A mintába kerülő személyek, családfők száma lényegesen kisebb, mint a modellpontok száma. A kérdőíves megkeresés és adatgyűjtés időigényes és drága. 2. Klaszterező eljárások Struktúrafeltárás Gond: Klaszterek a modellpontok, de jellemzőikhez nem adhatók meg kategória-határok. A változók mérési skálája nagyon különböző. 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 13
Modellpont képzés módszerei 3. Kategória-kombinációk képzése változónként kategóriákat képezünk kategória-összevonásokkal, több változó kategóriáinak lehetséges kombinációból alkotunk csoportokat=modellpontokat, egy-egy csoportban a gyakoriság megfelelő legyen Nem üres kategóriák Egymást át nem fedő csoportok. Statisztikai tulajdonságaikkal írjuk el a MP-ket. 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 14
Életkor szerinti elhatárolás: 16-61 évesek modellpontjai 7 ismert adat:életkor (46 korév), nem (2), régió (3), településtípus (3), jövedelem (5 kvintilis), foglalkozás (4) és foglalkoztatás (10)* E hét változó kategóriáiból képezhető kombinációk száma: 165 600 modellpont. *Foglalkoztatás szerint három főprofil (magasan, közepesen és alacsonyan foglalkoztatottak)+ellátottak és a pszeudó jogviszonnyal rendelkezők: öt főprofil 2011-hez képest változott-e Üresek összevonása után 92 720 aktív modellpont, egy pont átlagosan 58 fő 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 15
Aktívak foglalkoztatása (Vékás Péter előadása) és jövedelme Kvintilis Átlag Szórás Alsó határ 1 250 191 Ft 128 828 Ft 0 Ft 2 673 278 Ft 130 441 Ft 451 321 Ft 3 1 125 859 Ft 132 876 Ft 901 609 Ft 4 1 753 731 Ft 246 260 Ft 1 373 359 Ft 5 4 227 766 Ft 5 053 477 Ft 2 249 233 Ft Teljes állomány 1 606 165 Ft 2 663 972 Ft 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 16
Életkor szerinti elhatárolás: 61 év felettiek modellpontjai 2 elő-lépés Az állomány 2 689 521 főt tartalmaz, benne a passziválási kód szerint: 1=halott és 2=egyéb, 1)a még élő személyek: 2 591 811 fő (96,4%) 2) a 16-61 évesek mind aktív korúak az átfedések elkerülése miatt a nyugellátás modellpontjaiban nem vesszük figyelembe ezt a kortartományt. A 2012-es adatok miatt az 1950-ben és előtte született személyek 62+ évesek, 1 541 981 fő adatai alapján képezhetők modellpontok 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 17
Nyugdíjas modellpontok 1 538 965 fő maradt, akik 62 év felettiek, még élnek (max 104 év), és részesültek is nyugdíjban 3 változó: kor, nem, profil kategória valamennyi lehetséges kombinációja: 43 x 2 x 2= 172 modellpont képezhető Régió és település nem használható, csak 30%-nak ismert a régiós besorolása, a településtípus adat Néhány üres kategóriakombináció 156 modellpont, egy pont átlagosan 9865 egyént tartalmaz 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 18
Nyugdíjkifizetések: átlagok 3016 főnek végig nulla Ft kifizetés férfi nő Összes N Átlag Szórás Std. hiba Minimum Maximum 649332 122984,78 52334,823 64,947 140 1507350 889633 104039,86 41526,253 44,027 175 746965 1538965 112033,25 47328,801 38,151 140 1507350 férfi nő Összes N Átlag Szórás Std. hiba Minimum Maximum 77 149606,34 36791,82 4192,82 92270,00 331035,00 79 116283,98 17415,70 1959,42 91810,00 194882,50 156 132731,55 33101,22 2650,22 91810,00 331035,00 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 19
Belső ellenőrzés problémák kezelése Az alacsony létszámú modellpontok összevonása Hiányzó változó-értékek kezelése feltételes eloszlások szerint A nyilvántartásból hiányzók kezelése KSH adatokból (különösen a fiatalok, pályakezdés előtt állók) 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 20
2011-es Népszámlálás adatainak 10%-os mintája Adatok a KSH Kutatószobájából A 10%-os véletlen minta háromszintű: lakás, háztartás (kiválasztás alapja), ezen belül személy Háztartás és személy szintű anonimizált adatokat használtunk 2011-es népszámlálásból 2012-es ONYF adatok egy évnyi eltérés áthidalása: a népszámlálási adattáblában a személyeket egy évvel megöregítettük Cél: ellenőrzés és teljeskörűsítés 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 21
Az összehasonlítás tanulságai A középső életkorokban és a tipikus foglalkoztatás mellett jól megfelel egymásnak a KSH minta és az ONYF adatbázis. Jelentősebb eltérések: a szélső életkorokban, a fiatalok és a nyugdíj előtt állók korcsoportjaiban, a nem szabályos foglalkoztatási kategóriákban Érdemes lenne a teljes népszámlálás adatait elkérni a KSH-tól 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 22
Teljeskörűsítés lépései Az aktívak teljessé tétele a KSH adatok felhasználásával: az aktívak 92720 modellpontjára négy kategória szerint arányosítottuk az emberek számát: életkor, nem, régió és aktivitás (6,3 millió főt fed le) Az ellátottak teljessé tétele az ONYF állományi adatok felhasználásával: életkor és nem alapján (2 millió fő) 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 23
Források http://www.demografia.hu/index.php/kiadvanyok/mhelytanulmanyok Kamarás Ferenc sok írása, pl. http://www.ksh.hu/docs/hun/xftp/gyor/nep/nep21201.pdf Cragg, R.: The Demographic Investor, Financial Times, Pitman Publishing, 1998. http://www.penzugyiszemle.hu/vitaforum/gyermekvallalas-esnyugdijrendszer-a-reform-10-alaptetele (Botos József és Botos Katalin) Kovács Erzsébet: A nyugdíjreform demográfiai korlátai http://www.bankszovetseg.hu/wpcontent/uploads/2012/10/hsz2_128_149ig.pdf Nyugdíj és gyermekvállalás Tanulmánykötet, Gondolat 2012. (szerk: Kovács Erzsébet, 16 szerző írása) Nyika Jelentés (2010), Szerk: Holtzer Péter, MEH, Budapest Modellpont csoportosítás az ONYF mikroszimulációs modelljéhez (Tanulmány, 2014. december, Kovács Erzsébet) 2015.05.28. 24 MIDAS_HU Workshop: Modellpontok képzése
Köszönöm a modellpontok iránti figyelmet! erzsebet.kovacs@uni-corvinus.hu 2015.05.28. MIDAS_HU Workshop: Modellpontok képzése 25