Közös s adatbázis és adatfeldolgozó rendszer 2009. május m 7. Édes Marianna KSH VállalkozV llalkozás-statisztikai statisztikai főosztály
Vázlat Előzm zmények SBS adat-el előállítás Nemzeti száml mlák A Közös K s adatbázis célja, c funkciói Adat-el előállítás Adat-ellen ellenőrzés Javítások Üzemeltetés Fejlesztések sek 2
A Közös K s adatbázis és s adatfeldolgozó rendszer Olyan rugalmas informatikai alkalmazás, amely kiinduló adatbázisk zisként szolgál l a vállalkozv llalkozások éves gazdaságszerkezeti gszerkezeti statisztikájának (SBS ) előáll llításához, valamint a nemzeti száml mlák összeállításához. 3
Előzm zmények 1/1. 1. Igény a teljes körűk adatszolgáltat ltatásra, miközben az adatszolgáltat ltatói i terhek nem növekedhetnek. 2. Eltérő EU szabályok ellenére a konzisztencia biztosítása sa a gazdaságszerkezet gszerkezet-statisztikai statisztikai (SBS) adatok, valamint a nemzeti száml mlák adatai között. k 4
Előzm zmények 1/2. 2001. tárgyt rgyévig I. SBS adatok előáll llítása az éves adatgyűjt jtésekből: megfigyelés s 5 főtőlf 5-19 főf reprezentatív v megfigyelése 20 főtől f l teljes körűk megfigyelés a hiányz nyzó adatokat nem pótoltukp az adóadatokat adatokat csak ellenőrz rzésre használtuk az informatikai adat-el előállítás s különfk nféle Oracle táblákban készk szült az adategyeztetés s a nemzeti száml mlákkal utólagosan történt 5
Előzm zmények 1/3. 2001-2003. 2003. tárgyt rgyévek I. Az SBS adatok előáll llítása: éves integrált adatgyűjt jtésből hiányz nyzók k pótlp tlása az adóadatokb adatokból l (egyszerű pótlás, becslési si eljárással pótlp tlás) az informatikai adat-el előállítás s továbbra is különféle Oracle táblákban az adategyeztetés s a nemzeti száml mlákkal utólagosan törtt rtént 6
Előzm zmények 1/4. 2005. tárgyt rgyévtől I. SBS adatok előáll llítása a Közös K s adatbázis és adatfeldolgozó rendszer segíts tségével: az adatgyűjt jtés átalakult 1-44 főf mintavételes, teles, egyszerűsített kérdk rdőív 5-19 mintavételes, teles, részkr szkérdőív 20 főtől f l teljes körű, k, teljes kérdk rdőív hiányz nyzók k pótlp tlása az adóadatokb adatokból adat-el előállítás s vezérl rlése a statisztikusok által történik 7
Előzm zmények 2. II. A nemzeti száml mlák összeállítása 2005 tárgyt rgyévig a Közös K s adatbázison kívül k l törtt rtént az adóadatoknak adatoknak volt prioritása Az éves integrált gazdaságstatisztikai gstatisztikai adatgyűjt jtésből származ rmazó adatokat ellenőrz rzésre használt lták 2006. tárgyt rgyév megkezdődött a Közös K s adatbázis tesztelése se a nemzeti száml mlák összeállításához 2007. tárgyt rgyév első adat-el előállítás s a Közös K s adatbázisb zisból 8
A Közös K s adatbázis funkciói Évenként nt két k t időszakra (előzetes/v zetes/végleges) 1. Adat-el előállítás input adatokból l képletek k segíts tségével output adatok készk szülnek (elemi szinten) 2. Adat-ellen ellenőrzés elemi és aggregált szinten 3. Javítások adatok, képletek, k segédv dváltozók stb. 4. Üzemeltetés futtatás, jogosultságok, gok, lezárás 9
1. Adat-el előállítás Számjel feláll llítása Input adatforrások/adatok Prioritás Éves integrált adatgyűjt jtés s (9 OSAP) Egyéni vállalkozv llalkozók k adóadatai adatai (3 féle) Társas vállalkozv llalkozások adóadatai adatai (5 féle) ÁFA bevallás s 2006-ig 10
Vállalkozások adatai adatforrásonk sonként nt (2007. előzetes adatok) Vállalkozá- sok száma Fforrások szerint (%) Árbevétel (emd Ft) Források szerint (%) Létszám (fő) Források szerint (%) Megnevezés Gazdaságstatisztikai adatgyűjt jtés 15 644 2,09 47 710 66,75 1 436 157 47,02 Adóbevall bevallásból egyéni vállalkozók 341 829 45,63 2 095 2,93 466 382 15,27 Adóbevall bevallásból társas vállalkozások 391 682 52,28 21 673 30,32 1 152 136 37,72 Összesen 749 155 100,00 71 478 100,00 3 054 675 100,00 11
1. Adat-el előállítás Képletek kialakítása forrásonk sonként nt (egy- egytől l az összetettig) Segédv dváltozók k specifikálása sa a becsléshez shez (Hányadosok képzk pzése a TÁSA T és s az éves integrált alapján l-kat és s TEÁOR szerint) Összefüggés-korrekciók k beáll llítása Futtatás 12
2. Adat-ellen ellenőrzés Elemi szinten forrásv sválasztás s 9 közös k s tartalmú mutatónál 15 000 vállalkozv llalkozás prioritások (elsősorban sorban a nagyok ellenőrz rzése) hibahatárok beáll llítása szerint TOP listák k szerint 13
2. Adat-ellen ellenőrzés Aggregált szinten (LÉDA táblt blázóval) Mutatónk nkéntnt TEÁOR 1, 2, 3, 4 jegy szerint Létszám-kategória szerint Források szerint Reláci ciók k szerint Query Builder-rel rel is 14
3. Javítások Adat-jav javítás s az input forrást stáblákban elemi szinten (ADÉL, JAVA adatbázisok) Mutató képletek javítása Segédv dváltozó képletek javítás Összefüggés-korrekciók k módosm dosításasa Segédv dváltozók k szintválaszt lasztásának módosításasa 15
4. Üzemeltetés Futás s indítása (létsz tszám-adat módosm dosítás esetén n 2X) Az adatok jóváhagyj hagyása lezárás (többsz bbszöri futás - ellenőrz rzés - javítás s után) Jogosultságok gok megadása/visszavon sa/visszavonása felhasználói i szintek szerint 16
Fejlesztési si feladatok a pénzp nzügyi vállalkozv llalkozások teljesítm tmény adatainak előáll llítása a közös k s adatbázison belül az üzleti évesek adatainak kezelése elemzéseket követk vetően en a becslési si eljárások finomítása Pl. a különbk nböző vállalattípusok algoritmusainak fejlesztése se és összehangolásasa az egyéni vállalkozv llalkozókra kra vonatkozó adatok becslésének fejlesztése se 17
Köszönöm m szépen a figyelmet.