A mikroszimuláció alkalmazási lehet ő ségei Az adatbányászat eredményeinek gyakorlati felhasználása Csicsman József Budapesti Műszaki és Gazdaságtudományi Egyetem Információ- és Tudásmenedzsment Tanszék Mikroszimulációs Kutatócsoport Új Calculus Számítógép-alkalmazási Bt.
Bevezetés A mikroszimulációs módszertan lényege: a sokaság adatait elemi szinten az idő függvényében továbbírjuk (valószínűség-számítási eszközök, törvények, utasítások) Első hazai alkalmazások a KSH-ban Kutatócsoport a BME ITM tanszékén (2001-) SAS alapú Mikroszimuláció szolgáltató rendszer Csoportos alkalmazásfejlesztés Oktatás támogatás Nagy adatállományok kezelése Széleskörű elemzési lehetőség Adatbányászat 2
A mikroszimuláció Reprezentatív minta Szimuláció Reprezentatív mintára vonatkozó előrejelzés Mintavétel Előrejelzés Alapsokaság (Népesség) Összevetés Népesség a döntések hatásainak elemzése után Adatbányászat 3
Felhasználási területek Statisztikai felvételek adatállományának javítása, korábbi felvétel adatállományának továbbírása Várható eredmények pontosabb előrejelzése Intézkedési tervek demográfiai, társadalmi, illetve gazdasági következményeinek hatásvizsgálata Nemzetközi összehasonlítások (versenyképesség, adó és támogatási rendszerek ) Adatbányászat 4
A szolgáltató rendszerrel szemben támasztott követelmények Többnyelvű végfelhasználói felület és csoportos alkalmazásfejlesztési technológia Jogosultságkezelés Metainformációs rendszer Adatkezelés Mikromodul tervezés Táblázatkezelés, becslési eljárások Futtatórendszer és verziókezelés Adatbányászat 5
Statistical Matching A Mikroszmulációs Rendszer új funkciója Hogyan párosítsunk össze közös kulcs nélküli adathalmazokat? Statisztikai alapon, más változók eloszlása szerint Példa: Házasságkötések szimulációja, Hiányzó, hibás adatok pótlása más adatfelvételekből Adatbányászat 6
A Háztartási költségvetési felvétel 2002-es adatállományának javítása mikroszimulációs módszer alkalmazásával Felvételi hibák és megtagadások korrekciója mikroszimulációval és Statisztical matching eljárással Készítették: a KSH Háztartás-, jövedelem- és fogyasztás-statisztikai osztály és a BME ITM Mikroszimulációs Kutató- csoport munkatársai
Az egy fő re jutó jövedelem fő bb forrásonként a bruttó jövedelem %-ában, 2002 90,0 80,0 70,0 60,0 50,0 Százalék 40,0 30,0 20,0 10,0 0,0 Kereset (főáll.m.v.br.jöv.) Vállalkozásból szárm.jöv. Munkajövedelem össz. Társadalmi jövedelem Egyéb jövedelem Nettó jövedelem J övedelemforrások Kiadvány adat Mikroszimulációs adat Adatbányászat 8
Összes fogyasztási kiadás és a tartós fogyasztási cikkekkel kapcsolatos kiadások Százalék 90 80 70 60 50 40 30 20 10 0 51,2 63,4 Összesen 33,3 83,8 Tartós fogyasztási cikkek Hkf állomány (mikro)/makro adatok, % Szimuláció után mikro/makro adatok, % Adatbányászat 9
Üzemanyaggal és személygépkocsival kapcsolatos kiadások 100 90 80 94,6 85,3 Hkf állomány (mikro)/makro adatok, % Százalék 70 60 50 40 40,9 31,7 Szimuláció után mikro/makro adatok, % 30 20 10 0 Üzemanyag Személygépkocsi Adatbányászat 10
Nőtt a jövedelmi és kiadási egyenlőtlenség a legfelső és a legalsó decilisben élők között Jövedelem és kiadás egyenl ő tlenség, 2002 Megnevezés Egy f ő re jutó nettó jövedelem Kiadvány adat Mikroszimuláció s adat 10. decilis/1. decilis 550,0 969,8 Egy f ő re jutó kiadás 367,6 399,7 Adatbányászat 11
Fogyasztás szerkezet decilisenként a mikroszimuláció előtt (%), 2002 100 90 80 70 60 50 Lakásberuházás Egyéb személyes célú kiadás Művelődés, üdülés, szórakozás Közlekedés, hírközlés Egészségügy, testápolás 40 Háztartásvitel, lakásfelszerelés 30 Lakásfenntartás 20 Ruházkodás 10 Élvezeti cikkek 0 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Élelmiszerek Adatbányászat 12
Fogyasztás szerkezet decilisenként a mikroszimuláció után (%), 2002 100 90 80 70 60 50 40 30 20 10 0 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Lakásberuházás Egyéb személyes célú kiadás Művelődés, üdülés, szórakozás Közlekedés, hírközlés Egészségügy, testápolás Háztartásvitel, lakásfelszerelés Lakásfenntartás Ruházkodás Élvezeti cikkek Élelmiszerek Adatbányászat 13
Adóváltoztatások hatásai az ECOSTAT vállalati adatbázisán alapuló mikroszimulációs lehetőségek Három változat szerinti adóváltoztatási elképzelése a versenyképesség növelésére Készítették: az ECOSTAT és a BME ITM Mikroszimulációs Kutató- csoport munkatársai
Szimulációs adatállomány el ő készítése: A kett ő s könyvvitel ű cégek Törzsszám alapján társasági adó és ÁFA adatok párosítása. 80% céghez találtunk ÁFA adatokat. Az adat-állományokról: 1. adatállomány - 2002. évi társasági adóbevallás, kett ő s könyvvitel (kb. 202000 rekord) 2. adatállomány: 2002. évi ÁFA bevallás (kb. 400000 rekord) Adatbányászat 15
A szimuláció első menete: A vállalkozások adóbefizetésének mértékében 2002-ről 2003. évre bekövetkezett változások szimulálása nemzet-gazdasági ágazatok szerint a tényleges adószintek mellett. Az APEH és VPOP adatai szerint 2002-ről 2003-ra az átlagos növekedés a következők voltak: TB: 1.08 Fizetendő ÁFA: 1,12 Visszaigényelhető ÁFA: 1,1 Import ÁFA: 1,1012 Társasági adóbevételek növekedése egyes nemzetgazdasági ágakban: Gép, berendezés gyártása 1,205 Villamos gép, műszer gyártása 1,335 Járműgyártás 2,170 Adatbányászat 16
2. menetben: Társasági adó és TB változtatás: TASA: TB: 18%-ról 16%-ra csökkentve, 39%-ról 30%-ra csökkentve. A TB változtatás közvetlenül hatással van a társasági adóbevételekre, a személyi jellegű ráfordítások csökkenésével az adózás előtti eredmény nő, ezáltal a társasági adó is. Adatbányászat 17
3. menetben: előzőt kiegészítve az ÁFA változtatással: TASA: 0.18 -> 0.16 TB: 0.39 -> 0,30 25%-os ÁFA 20,5-ra csökkentve. Az ÁFA változtatás nem jelenik meg közvetlenül a társasági adóbevételekben, de közvetett hatásként szimuláltuk, hogy a nettó árbevétele nőhet a cégeknek, hiszen a fogyasztások bruttó értéke nem fog 4%-kal csökkenni. A szimuláció szerint 2%-kal nő a nettó árbevétel, többi pedig a megtakarításokat növeli. Adatbányászat 18
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai főbb adónemenként (Mrd Ft) 1600 1400 1200 1000 800 600 400 Társasági adó TB járulék Fizetendő ÁFA Visszaigényelhető ÁFA Import ÁFA 200 0 2002 tény 2003 becsült 2003* 2003** Megjegyzés: */ Tasa=0.2, TB=0.3 **/ Tasa=0.2, TB=0.3, ÁFA=0.2 Adatbányászat 19
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai ágazatonként, 2002-ről 2003-ra (Mrd Ft) 120 110 100 90 80 70 60 50 40 30 20 10 0 2002 tény 2003 becsült 2003* 2003** MEZŐGAZDASÁG BÁNYÁSZAT FELDOLGOZÓIPAR VILLAMOSENERGIA ÉPÍTŐIPAR Megjegyzés: */ Tasa=0.2, TB=0.3 **/ Tasa=0.2, TB=0.3, ÁFA=0.2 Adatbányászat 20
A MIKROSZIMULÁCIÓ EREDMÉNYEI Vállalati adófizetés változásai ágazatonként, 2002-ről 2003-ra (Mrd Ft) 90 80 70 60 50 40 30 KERESKEDELEM, JAVÍTÁS SZÁLLÁSHELY, VENDÉGLÁTÁS SZÁLLÍTÁS, RAKTÁR, TÁVKÖZL PÉNZÜGYI KÖZVETÍTÉS 20 10 0 2002 tény 2003 becsült 2003* 2003** Adatbányászat 21
Az egységes tőkejövedelemadó bevezetésének hatásvizsgálata mikroszimuláció segítségével 2005 Kutatói adatállomány létrehozása szimulációval (2002->2005) Hipotézisbecslések és társadalmi hatásvizsgálat Készítették: az ECOSTAT és az Új Calculus Bt munkatársai Adatbányászat 22
ECOSTAT felmérés eredménye a megtakarító-képességről 2005 elején Válaszolók megoszlása Eladósodunk 6% Hozzá kell nyúlnunk a tartalékokhoz 17% Éppen csak kijövünk a pénzünkb ő l 48% Minimális összeget (5 10%) tartalékolni tudunk 25% Jelent ő s megtakarítás lesz 2% Nem tudja, nem válaszol 2% Adatbányászat 23
Az állami bevétel becslése különböző adószintek mellett Megtakarítások kamatai(%): 2004 2005 Kp.be betét 8.53 5.4 Részvény 57 10 Kötvény 12.2 8 Tulajd rész 10.8 7.8 Biztosítás 10.2 6 Adatbányászat 24
A 2004. évi Mikrocenzushoz kapcsolódó Jövedelmi felvétel Adatimputálás statistical matchinggel és korrekció mikroszimulációval Készítették: a KSH Háztartás-, jövedelem- és fogyasztás- statisztikai osztály és az Új Calculus Számítógépalkalmazási Bt. munkatársai Adatbányászat 25
Néhány fontosabb jövedelemegyenlőtlenségi mutatók alakulása Egyenlőtlenségi mutatók 1982 1987 1995 2004 A fels ő és az alsó tized átlagjövedelmének aránya A fels ő ötöd és az alsó ötöd átlagjövedelmének aránya A fels ő és az alsó huszad átlagjövedelmének aránya 3,8 4,6 7,5 7,5.... 4,7 4,8.... 11,6 11,6 Éltető-Frigyes-index 1,82 1,99 2,36 2,41 Adatbányászat 26
A 2004. évi Mikrocenzushoz kapcsolódó Kutatói adatállomány létrehozása A 2004-s HKF és jövedelemfelvétel összekapcsolása Az adatállományok aktualizálása, dinamikus mikroszimuláció Az alkalmazhatóság biztosítás Készítik: a KSH Háztartás-, jövedelem- és fogyasztás- statisztikai osztály és a BME ITM Mikroszimulációs Kutató- csoport munkatársai Adatbányászat 27
Jövőkép Mikroszimulációs módszerek alkalmazása a költségvetés előreszámításainál A módszer alkalmazása az üzleti szektorban (telekommunikáció, bank, biztosítás, ) Nemzetközi kooperáció (IST, Norvég alap) cél, hogy legyen egy naprakész módszertan és adatbázis a kutatók, döntéshozók számára Adatbányászat 28
Application development for microsimulation technology SAS based framework systems Real govermental applications (Tax- and social insurance systems, etc.) Generalized framework system for microsimulation (End-user applications, WEB, open source softwares, etc.) Application developers Amadeus UK Calculus HU... Universities Cambridge Univ. UK Budapest Univ. (BME) HU Scandinavian Universities... Research centers Ecostat HU Planning Office NL... Cooperative Partners Statistical Officies (HCSO HU, ) UK Treasury Tax Officies... Results Multi-lingual modelling system Reports, International comparisons,... End-users Local govermental institutions OECD, EUROSTAT,... Adatbányászat 29
A kutatóállomány felhasználása A Diákhitel előrejelzése A Demográfiai változások előrejelzése -ig A Karrier és jövedelem adatok továbbírása Az új adótörvények előreszámítása, a 16%-os személyi jövedelemadó Diplomamunkák a BMEn és az SZTE-n A statisztika és az adatbányászat gyakorlati alkalmazásai kurzusok Adatbányászat 30
Háztartások személyi jövedelemadózottságának mértéke a háztartások jövedelem deciliseinként Románia: szinte mindegyik decilisben ugyanakkora az adózottság mértéke, kedvezmények köre sz ű k, csak a gazdagoknak kedvez Magyarország: az igazán szegény réteg nem fizet adót (adójóváírás, adókedvezmények ) Németország: a háztartások 90%-a jobban járna ezzel az adórendszerrel Adatbányászat 31 Almási Adrienn Nóra: Föbb adónemek nemzetközi összehasonlítása mikroszimulációs módszerrel
Személyi jövedelemadóból származó állami bevételek a háztartási jövedelem decilisenként Adatbányászat 32 Almási Adrienn Nóra: Föbb adónemek nemzetközi összehasonlítása mikroszimulációs módszerrel
Alkalmazások a telefóniában Hiányzó demográfiai adatok pótlása statistical matchinggel Marketing felmérések adatainak korrigálása A lemorzsolódások elkerülésére kidolgozandó marketingstratégiák hatásának előrejelzése A csalók felderítésének támogatása Adatbányászat 33
Pénzintézeti lehetőségek Hiányzó adatok pótlása Üzleti termékek eredményének előrejelzése A Credit Scoring elemzések támogatása A stresszteszt vizsgálatok elkészítése (hirtelen árfolyamváltozás, munkanélküliség növekedés, ) Adatbányászat 34
Köszönöm a figyelmet! www.itm.bme.hu csicsman@itm.bme.hu fenyesc@itm.bme.hu Adatbányászat 35