A Kisterületi Munkaügyi Statisztikai Rendszer (KMSR) Koleszár Kázmér TÁMOP 1.3.1-12/1-2012-0001
Tartalom 2. dia KMSR - történeti bevezetés A projekt - kutatási terv A KMSR leírása Adattartalom adatforrások és mutatók Eljárások, algoritmusok Számítástechnikai megvalósítás A KMSR továbbfejlesztése Adattartalmi változások Új eljárások, algoritmusok Számítástechnikai megvalósítás A rendszer használata Adatbetöltés Elemzés Jelentéskészítés
KMSR történeti bevezetés - 1992 3. dia 1992-től - Munkaügyi adatok A rendszerváltás után megjelent a munkanélküliség Regisztrált munkanélküliség és az ILO meghatározás szerinti munkanélküliség különböző Időbeli és térbeli eloszlás is fontos A kormányzati szervek és az önkormányzatok igénye: Tervezéshez, költségvetéshez Támogatások elosztásához Gazdasági szereplők Beruházások tervezéséhez Adatigény: Lehetőleg havi gyakorisággal Minél nagyobb területi bontásban
KMSR történeti bevezetés 1993-96 4. dia 1993-1996 - Világbanki program 1993 Megalapozó tanulmány Az Egyesült Államokban alkalmazott statisztikai becslési módszereket javasoltuk a KSH direkt becslésével szemben 1994-95 A becslőfüggvényeken alapuló rendszer kidolgozása megyei és munkaügyi körzet szintjén Leosztás, variancia becslés 1996 Idősorelemző módszerek Kalman-szűrő
KMSR történeti bevezetés 1997-99 5. dia 1997 Kísérleti üzem kezdete Havonkénti becslések 1998 Leosztás KSH statisztikai kistérségekre Régiós szintű adatok 1999 Hivatalos adatszolgáltatás kezdete Folyamatosan 2011-ig Rendszeres módszertani revíziók Számítástechnikai fejlesztések
KMSR történeti bevezetés NFSZ weboldal 6. dia
KMSR történeti bevezetés 2000-2011 7. dia Adattartalom Újabb mutatók Gazdasági aktivitás, inaktívak Aktivitási és foglalkoztatási ráták Korosztályos bontás 15-64 és 15-74 Becslési eljárások Kalman-szűrő paramétereinek meghatározása Hibaszámítás javítása Számítástechnikai fejlesztések Gyorsabb és megbízhatóbb Webes jelentések
KMSR a TÁMOP projekt bemutatása - 1 8. dia "Kisterületi Munkaügyi Statisztikai Rendszer felülvizsgálata" TÁMOP 1.3.1-12/1-2012-0001 keretében 2014 július - december A projekt részfeladatai 1. részfeladat: a kisterületi statisztikai becslési rendszer eddig alkalmazott eljárásainak felülvizsgálata az adatok körének leírása az eddig használt becslési eljárások előnyeinek, hátrányainak bemutatása az adatok felhasználhatóságának tapasztalatai az új adatok, mutatók iránti igény indoklása
KMSR a TÁMOP projekt bemutatása - 2 9. dia 2. részfeladat a KMSR optimálisan alkalmas módszerének kidolgozása, amely tartalmazza az új mutatók és területi egységek bevonási lehetőségeinek vizsgálatát tartalmazza a nemzetközi adatszolgáltatási igények felmérését, valamint azt, hogy az új KMSR hogyan fogja tudni ezeket teljesíteni 3. részfeladat A módosított rendszer próbaüzeme Jelentés a modellszámítás eredményeiről 4. részfeladat Egy munkaértekezlet formájában ismertetjük az NMH munkatársaival a rendszer működését és használatát
KMSR Bemenő adatok - 1 10. dia KSH munkaerő-felmérés (MEF) Személyi szintű anonimizált adatok Kb. 33 ezer háztartás, 68 ezer személy Országra és régiókra reprezentatív Negyedéves gyakoriság, havi alminták ILO szerinti munkanélküliség NFSZ regisztrált munkanélküliek Havi gyakoriság Település bontásban
KMSR Bemenő adatok - 2 11. dia KSH népszámlálási adatok Legutolsó népszámláláskori és a továbbvezetett éves népesség adat Településenként Korosztályonként (15-64 és 15-74) Megyénként az intézeti népességgel való korrekció Országos településstruktúra Települések listája éves bontásban Megyei, kistérségi, körzeti és járási hovatartozás
KMSR Kimenő adatok - 1 12. dia Adat Előállítás módja Előállítás módja negyedévre és teljes évre hónapokra Munkanélküliek száma Korrigált regressziós szintetikus becslés Korr. regr. szint. becslés + Kálmán-szűrős idősorelemzés Foglalkoztatottak száma Korrigált regressziós szintetikus becslés Korr. regr. szint. becslés + Kálmán-szűrős idősorelemzés Inaktívak száma Gazdaságilag aktívak (Foglalkoztatottak + Munkanélküliek) Gazdaságilag aktívak (Foglalkoztatottak + Munkanélküliek)
KMSR Kimenő adatok - 2 13. dia Adat Előállítás módja Előállítás módja negyedévre és teljes évre hónapokra Munkanélküliségi ráta Munkanélküliek / Gazdaságilag aktívak Munkanélküliek / Gazdaságilag aktívak Foglalkoztatottsági ráta Foglalkoztatottak / Népesség Foglalkoztatottak / Népesség Aktivitási ráta (Foglalkoztatottak + Munkanélküliek) / Népesség (Foglalkoztatottak + Munkanélküliek) / Népesség
KMSR Kimenő adatok - 3 14. dia EuroOffice Minden adat... Országra, régióra, megyére és kistérségekre Havi, negyedéves és éves összesítésben 15-64 és 15-74 korcsoportokra Standard hibával együtt A számítás módja MEGYE az eljárás centruma Korrigált regressziós szintetikus becslés Kalman-szűrős idősorelemzés Ország és régiók aggregálás Kistérségek (NFSZ körzet, KSH kistérség, járás, ) leosztás
KMSR Becslési eljárás - 1 15. dia EuroOffice Becslőfüggvények Direkt becslés korrekciója Magyarázó változó segítségével regisztrált munkanélküliek száma Pontosabban ismert Hasonló térbeli eloszlású Hasonló rétegződést mutat Torzításviszgálat 26 különböző becslőfüggvényt teszteltünk korrigált regressziós szintetikus becslés bizonyult legjobbnak 2006-os módszertani revízió ugyanaz az eredmény
KMSR Becslési eljárás - 2 16. dia Direkt becslés: yi = 1, ha munkanélküli, = 0, egyébként a továbbvezetett népességre korrigált wi súly Korrigált regressziós szintetikus becslés: Xa = a regisztrált munkanélküliek száma az a megyében Xe,a = a regisztrált munkanélküliek számának direkt becslése Be = a két direkt becslés közötti lineáris regressziós együttható:
KMSR Becslési eljárás - 3 17. dia Foglalkoztatottak száma: Gazdaságilag aktívak direkt becslése Becslőfügvénnyel számolt munknélküliek Hibaszámítás Jacknife módszer Megyei szinten működik Almintákat képezünk PSU alapján vagy random Almintákra számított becslőfüggvények varianciája Régiókra, országra aggregálunk Kisterületekre a leosztási képletek alapján hibaterjedéssel kalkulálunk
KMSR Becslési eljárás - 4 18. dia Kisterületi szintek, leosztási módszerek Munkanélküliek száma A regisztrált munkanélküliek arányában: Foglalkozatottak száma Lakossági igény módszer Kell hozzá a népszámlálási népesség és foglalkoztatottsági adat települési szinten
KMSR Becslési eljárás - 5 19. dia Idősorelemzés Kalman-szűrő Havi gyakoriságnál a becslőfüggvény nem elegendő Szűrés = mintavételi hiba leválasztása Időbeli szabályosságokat használja ki az adatok javítására Trendvonal Ismert periódusú szezonalitás Ismert szerkezető mintavételi hiba Strukturált idősor modellen alapszik Rendszeresen (évente) illeszteni kell a paramétereket
KMSR Becslési eljárás - 6 20. dia Strukturált idősor modell Nem megfigyelhető állapotvektor A mért mennyiség ettől és egy véletlen zajtól függ Megfigyelési egyenlet : Átmeneti egyenlet Stochasztikus folyamattal írja le az állapotvektor időbeli változását
KMSR Becslési eljárás - 7 21. dia Kalman szűrő A megfigyelt idősor alapján kiszámítható az állapotvektor idősora Rekurzív algoritmus Simítás: oda-vissza szűrés Az ismert állapotvektor alapján az összetevők szétválaszthatók Mintavételi hiba kivonható Ismeretlen modellparaméterek becslése is szükséges Maximum-likelihood módszerek
KMSR Becslési eljárás - 8 22. dia A KMSR modellje Trend összetevő Trend + ráta Stochasztikusan változhat mind a szint, mind a meredekség Hosszútávú tendenciákat követi Szezonális összetevő Éves ingadozás pl. nyári idénymunkák hatása Regresszor összetevő Jelenleg nem használjuk instabilitást okoz a paraméterbecslésben ARMA összetevő Mintavételi hibát írja le - jelenleg AR(3): az alminták 3 havonta ismétlődnek Irreguláris összetevő Fehérzaj minimális, ha jó a modell
KMSR Becslési eljárás - 9 23. dia Benchmark Hozzáigazítás más forrásból származó, nagyobb megbízhatóságú, de durvább felbontású adatokhoz Egyidejű benchmark Becslőfüggvénnyel számolt megyei adatok összege meg kell egyezzen a KSH direkt becslésével Arányos igazítás minden időpontban Idősoros benchmark Idősor egy évre összegezve meg kell eggyezzen a KSH direkt becslés éves összesített adatával Denton-módszer
KMSR Számítástechnikai megvalósítás 24. dia Alapelveink: Megbízhatóság Linux operációs rendszer Relációs adatbázis rendszeres automatikus adatmentések Modularitás Az egyes eljárások független programok Adatiokat csak az adatbázisból olvasnak és oda írnak Könnyen módosíthatók, variálhatók Továbbfejleszthetőség Általánosan elterjedt technológiák Nem igényelnek ritka, speciális tudást
KMSR Igényelt környezet 25. dia Igényelt számítástechnikai környezet: Linux operációs rendszer Jelenleg Ubuntu 14.04 MySQL adatbázis-kezelő Bemenő és kimenő adatok tárolása R statisztikai programnyelv értelmezője Adatelemző szkriptek EuroOffice irodai program a MapChart kiegészítővel A jelentések és a térképes diagramok elkészítéséhez
A KMSR továbbfejlesztése - 1 26. dia Az adattartalom változásai Közigazgatási átalakítás Járási szint Újabb leosztási szint, de módszertanilag megegyezik az eddigiekkel Szoftver módosítás volt szükséges Jelentés sablonok módosítása Új korosztályi bontások Módszertani változást nem igényel Szoftvermódosítás + új jelentés sablonok Továbbvezetett népességadatok újabb bontású beszerzése szükséges
A KMSR továbbfejlesztése - 2 27. dia Módszertani változás Paraméterbecslés EM algoritmus lassan konvergált, gyakran kézzel kellett korrigálni Új optimalizáló eljárás (NFGS) gyorsabb, stabilabb Nagy dimenziószámú modellek így is problémásak Számítástechnikai fejlesztések Új adatbázis struktúra Könnyen bővíthető: pl. új leosztási szint, korosztály Elemzőmodulok R nyelvű megvalósítása Garantáltabb a helyes működés Széleskörűen tesztelt algoritmusok
A KMSR használata - 1 28. dia Az adatbázis feltöltése 0. lépés Népszámlálási és településstruktúra adatok bevitele (éves revízió alkalmával) 1. lépés Adatfájlok bemásolása a megfelelő könyvtárakba ( /kmsrdata/ksh/ ill. /kmsrdata/omk/) 2. lépés Beolvasás:./kmsr2beolvas_el.sh TIPUS FILE TIPUS = az adatfile típusa (ksh, kshdbf, kshnew vagy omk) FILE = fájl neve elérési úttal
A KMSR használata - 2 29. dia A KMSR elemzés futtatása 3. lépés a teljes rendszer futtatása R --slave --vanilla --args -ebev -ididotartam < kmsr2_main.r EV = az adott évszám, pl. 2012 IDOTARTAM = 1,2,3,4, negyedévek esetén IDOTARTAM = e, ha az egész évre akarjuk futtatni 4. lépés - exportálás./exportkmsr2kf_mod.sh EV EV = az adott évszám, pl. 2012 Eredmény: txt fájlokat tartalmazó kmsr2_eredmeny.zip archívum 5. lépés - ellenőrzés R --slave --vanilla < compare7464.r
KMSR Jelentéskészítés - 1 30. dia Előfeltételek EuroOffice/OpenOffice/LibreOffice nyílt forráskódú irodai program EuroOffice MapChart kiterjesztés, Magyarország teleülésadatbázisával Bemenet kmsr2_eredmeny.zip-ben található.txt fájlok Időpontonként, korosztályonként és területi bontásonként egy-egy Területi szintnek megfelelő térképes sablon (ods fájl) nyersadat lapra kell másolni az adatokat Településlista a kistérségek megjelölésével Táblázatok és térképes diagramok automatikusan megjelennek Ráták és azok hibái is automatikusan számolódnak
KMSR Jelentéskészítés - nyersadat 31. dia
KMSR Jelentéskészítés - településlista 32. dia
KMSR Jelentéskészítés - táblázat 33. dia
KMSR Jelentéskészítés - térképek 34. dia
Munkaügyi adatok (példa) 35. dia
Munkaügyi adatok (példa) 36. dia
Munkaügyi adatok (példa) 37. dia