A nagy adathalmazokkal kapcsolatos kormányzati feladatok. vezetői tájékoztató anyag a big datá -ról

Hasonló dokumentumok
Szeged Megyei Jogú Város Smart City Jövőképe

2010. E-KÖZIGAZGATÁSI ALAPISMERETEK Oktatási segédanyag

A BIZOTTSÁG KÖZLEMÉNYE AZ EURÓPAI PARLAMENTNEK, A TANÁCSNAK, AZ EURÓPAI GAZDASÁGI ÉS SZOCIÁLIS BIZOTTSÁGNAK ÉS A RÉGIÓK BIZOTTSÁGÁNAK

A mezõgazdaság gazdaságstruktúrája és jövedeleminformációs rendszerei

Fehér könyv a nemzeti adatpolitikáról dr. Sántha György, ex-titkár...

GAZDASÁGFEJLESZTÉSI ÉS INNOVÁCIÓS OPERATÍV PROGRAM

A nemzeti energiahatékonysági cselekvési tervek első értékelésének nyomon követése

Helyi Esélyegyenlőségi Program Felülvizsgálata. Mátraterenye Község Önkormányzata

A hierarchikus adatbázis struktúra jellemzői

Helyi Esélyegyenlőségi Program Felülvizsgálata. Táborfalva Nagyközség Önkormányzata

AZ EURÓPAI KÖZÖSSÉGEK BIZOTTSÁGA

Előterjesztés Békés Város Képviselő-testülete december 16-i ülésére

A szolgáltatástervezési koncepciók készítésének gyakorlata. online kutatás elemzése

A munkaanyag készítıi: Dr. Csatári Bálint, kandidátus, geográfus, intézetigazgató, MTA RKK ATI, Kecskemét

Közhasznúsági jelentés 2010.

BUDAÖRS VÁROS IFJÚSÁGPOLITIKAI KONCEPCIÓJA

Környezetvédelmi, Közegészségügyi és Élelmiszer-biztonsági Bizottság JELENTÉSTERVEZET

Hajdúszoboszlói kistérség Foglalkoztatási Stratégia FOGLALKOZTATÁSRA A HAJDÚSZOBOSZLÓI KISTÉRSÉGBEN TÁMOP /

Személyiségi jogok és hálózatok világa TUDOMÁNY A JOG HATÁRÁN

Jászsági fejlesztési koncepció, stratégiai és operatív program

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK. a halászati és akvakultúra-termékek uniós ökocímkerendszerére vonatkozó lehetőségekről

Javaslat A TANÁCS RENDELETE. a Clean Sky 2 Közös Vállalkozásról. (EGT-vonatkozású szöveg) {SWD(2013) 257 final} {SWD(2013) 258 final}

DÉVAVÁNYA VÁROS HELYI ESÉLYEGYENLŐSÉGI PROGRAM FELÜLVIZSGÁLATÁNAK MÓDOSÍTÁSA

Törökszentmiklós Város Akcióterületi terve november

Fejér Megyei Önkormányzat évekre szóló. Megújított. Gazdasági Programja és Fejlesztési Elképzelései

J a v a s l a t a évi Környezetvédelmi Intézkedési Tervről szóló tájékoztató és a évi Környezetvédelmi Intézkedési Terv elfogadására

ÜDE FOLT A HOMOKHÁTSÁGBAN!

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK. Az Europass kezdeményezés értékelése

KIEMELT PROJEKT PÁLYÁZATI FELHÍVÁS a Társadalmi Megújulás Operatív Program

Javaslat: AZ EURÓPAI PARLAMENT ÉS A TANÁCS..././EU RENDELETE AZ IDEGENFORGALOMRA VONATKOZÓ EURÓPAI STATISZTIKÁKRÓL. (EGT-vonatkozású szöveg)

IV. Szakmai szolgáltatások funkcionális tervezése

Dévaványa Város Önkormányzat Képviselő-testületének 9/2004. (III.1.) rendelete Dévaványa Környezetvédelmi Programjáról. Bevezető rendelkezések

A Dél-Dunántúli Régió Információs Társadalom Stratégiája (DD-RITS)

KERKAFALVA TELEPÜLÉS ESÉLYEGYENLİSÉGI PROGRAMJA

A HAZAI INFORMATIKUS- ÉS IT-MÉRNÖKKÉPZÉS HELYZETÉNEK, PROBLÉMÁINAK, GÁTLÓ TÉNYEZŐINEK VIZSGÁLATA

Nemzeti Adó- és Vámhivatal által kiadott. 4.../2013. tájékoztatás

Javaslat A TANÁCS RENDELETE. a 282/2011/EU végrehajtási rendeletnek a szolgáltatásnyújtás teljesítési helye tekintetében történő módosításáról

KONCEPCIÓ. Kutatócsoportok együttműködési és szolgáltatásfejlesztési koncepciójának kidolgozása KEIV 2015.

TERVEZET. Kutatási és Technológiai Innovációs Alap felhasználása. Nemzeti Kutatási és Technológiai Hivatal. tevékenysége

Hajdúsági Kistérség Területfejlesztési Koncepciója és Programja HELYZETÉRTÉKELÉS 2005.

A megváltozott munkaképességű személyek foglalkoztatási helyzete

Első Kötet Közszolgálat 3.2 K ÖZSZOLGÁLAT

A HUMÁNERŐFORRÁS-GAZDÁLKODÁS KÉRDÉSEINEK VIZSGÁLATA A NEMZETBIZTONSÁGI SZOLGÁLATOKNÁL

SZÉKESFEHÉRVÁR MJV ÖNKORMÁNYZAT GAZDASÁGI PROGRAMJA

AZ EURÓPAI KÖZÖSSÉGEK BIZOTTSÁGA A BIZOTTSÁG KÖZLEMÉNYE KONZULTÁCIÓS DOKUMENTUM AZ INNOVÁCIÓS CÉLÚ ÁLLAMI TÁMOGATÁSRÓL

ELEKTRONIKUS HÍRLEVÉL 5. szám

Vasvári Kistérség Szociális Szolgáltatástervezési Koncepciója

Válaszaikat előre is köszönjük!

A BIZOTTSÁG KÖZLEMÉNYE

A migrációs statisztika fejlesztésének lehetőségei

19/2009. (I. 30.) Korm. rendelet. a földgázellátásról szóló évi XL. törvény rendelkezéseinek végrehajtásáról

A BIZOTTSÁG KÖZLEMÉNYE AZ EURÓPAI PARLAMENTNEK, AZ EURÓPAI TANÁCSNAK ÉS A TANÁCSNAK

Energiahatékony iskolák fejlesztése

A SZERENCSI KISTÉRSÉG

A határmenti vállalkozások humáner forrás ellátottsága és -gazdálkodása

A Nemzeti Fenntartható Fejlődési Keretstratégia első előrehaladási jelentésének ( ) 1. sz. melléklete

A környezetvédelmi és vízügyi miniszter feladat és hatáskörét a 165/2006 (VII.28.) Korm. rendelet határozza meg.

Hazai gyógyszerkiadások nagysága

A BIZOTTSÁG KÖZLEMÉNYE AZ EURÓPAI PARLAMENTNEK, A TANÁCSNAK ÉS AZ EURÓPAI GAZDASÁGI ÉS SZOCIÁLIS BIZOTTSÁGNAK

Sulokné Anwar Zsuzsanna HOL TART MAGYARORSZÁG AZ INFORMÁCIÓS TÁRSADALOMHOZ VEZETŐ ÚTON?

TERÜLETFEJLESZTÉSI STRATÉGIA ÉS OPERATÍV PROGRAM

4. NEMZETI KÖRNYEZETVÉDELMI PROGRAM

FELHÍVÁS. A felhívás címe: Integrált térségi gyermekprogramok. A felhívás kódszáma: EFOP

ZÁRÓ TANULMÁNY a "FoglalkoztaTárs társ a foglalkoztatásban" kiemelt projekt (TÁMOP / ) keretében

FELHÍVÁS. A mikro-, kis- és középvállalkozások kapacitásbővítő beruházásainak támogatására. A felhívás címe:

FELNŐTTKÉPZÉSI MINŐSÉGIRÁNYÍTÁSI KÉZIKÖNYV

OTDK-DOLGOZAT

9226/16 ol/ok/kk 1 DG B 3A - DG G 1A

Információbiztonsági jogi ismeretek vezetőknek

Huszárné Lukács Rozália Anna Polgármester Asszony részére

Big Data tömeges adatelemzés gyorsan

A szakképző iskolát végzettek iránti kereslet és kínálat várható alakulása 2011

Innováció és együttm ködési hálózatok Magyarországon

INFORMÁLNI, INTEGRÁLNI, INSPIRÁLNI

Magyar Közgazdasági Társaság Baranya Megyei Szervezete: Pénzügy-politikai elıadássorozat Pécs, április 20. A KÖZPÉNZÜGYEK SZABÁLYOZÁSA

Terület- és településrendezési ismeretek

A Tolna Megyei Önkormányzat Közgyűlésének február 12-i ülése 11. számú napirendi pontja

A BIZOTTSÁG KÖZLEMÉNYE AZ EURÓPAI PARLAMENTNEK, A TANÁCSNAK, AZ EURÓPAI GAZDASÁGI ÉS SZOCIÁLIS BIZOTTSÁGNAK ÉS A RÉGIÓK BIZOTTSÁGÁNAK

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK, A TANÁCSNAK, AZ EURÓPAI GAZDASÁGI ÉS SZOCIÁLIS BIZOTTSÁGNAK ÉS A RÉGIÓK BIZOTTSÁGÁNAK

Hévíz-Balaton Airport Kft.

VESZPRÉM MEGYE TERÜLETFEJLESZTÉSI PROGRAMJA

BIZONYTALAN NÖVEKEDÉSI KILÁTÁSOK, TOVÁBBRA IS JELENTŐS NEMZETKÖZI ÉS HAZAI KOCKÁZATOK

J/4723. számú JELENTÉS

DOKTORI (PhD) ÉRTEKEZÉS TÉZISEI JÓZSA MÁTÉ JÓZSEF MOSONMAGYARÓVÁR

Fejér megye szakképzés-fejlesztési koncepciója Felülvizsgálat Összeállította: Fejér Megyei Fejlesztési és Képzési Bizottság 2014.

KIEMELT PROJEKT ÚTMUTATÓ a Társadalmi Megújulás Operatív Program

Budapest Főváros Települési Esélyegyenlőségi Programja ( ) Munkaanyag Munkaanyag zárása első társadalmi egyeztetés előtt:

BABÓT E G Y E Z T E T É S I D O K U M E N T U M HOSSZÚ TÁVÚ TELEPÜLÉSFEJLESZTÉSI KONCEPCIÓJA MEGBÍZÓ:Babót Önkormányzata

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK

Szabolcs-Szatmár-Bereg megye szakképzés-fejlesztési koncepciója 2015.

Mi a HORIZONT Rendszer?

A.2 HALÁSZAT (1.3) Draft értékelési jelentés - Függelék. Az intézkedés háttere, előtörténete

Stratégiai tervezés a szociális munkában

HAJDÚSÁMSON VÁROSÁNAK INTEGRÁLT VÁROSFEJLESZTÉSI STRATÉGIÁJA január

Áttekintés a magyar fagazdaságról

ÖNKORMÁNYZATI ÉS TERÜLETFEJLESZTÉSI M I NISZTÉRIUM

FELHÍVÁS. Helyi foglalkoztatási megállapodások, paktumok megvalósítására. A felhívás címe: Helyi foglalkoztatási együttműködések

A MAGYARORSZÁGI NATÚRPARKOK FEJLESZTÉSI KONCEPCIÓJA

Hungária Informatikai Kft.

Eingereicht am Submitted 15 July 2013

Átírás:

A nagy adathalmazokkal kapcsolatos kormányzati feladatok vezetői tájékoztató anyag a big datá -ról

1 Összefoglalás Hatalmas gazdasági, foglalkoztatási, életminőség-javítási potenciál rejlik az egyre nagyobb mennyiségben keletkező elektronikus adatokban különösen a gyorsan növekvő méretű adathalmazokban. Az Európai Bizottság legutóbb közleményben hívta fel a tagországok figyelmét, hogy ne menjenek el lehunyt szemmel a big data mellett. (Angol terminológiában így nevezik a különösen nagy adathalmazokat.) Az igen nagy méretű adathalmazok már nem dolgozhatók fel hagyományos módszerekkel, ezért de más okok miatt is nagy kihívást jelent a kormányzatok számára a hasznosításuk. Ráadásul önmagukban nem is kezelhetők e kihívások, mivel ez a szakterület több más területtel is szoros kapcsolatban van. Az alábbi tájékoztató felvázolja a nagy adathalmazokban rejlő lehetőségeket, felsorolja a legfontosabb problémákat, kapcsolódó területeket, és megnevezi a legsürgősebb teendőket. Ez utóbbiak közül elsőként javaslatot tesz egy mélyebb helyzetelemzést, problémafeltárást, valamint egy részletesebb tevékenységi tervet tartalmazó fehér könyv elkészítésére, egyúttal felvetve, hogy akár sor kerülhetne egy olyan, átfogó kormányzati adatpolitikai stratégia kidolgozására is, amelynek részét képezhetné a nagy adathalmazok problematikája. 2 Bevezetés Minden percben 1,7 billiárd (1,7 x 10 15 ) bájt mennyiségű adat keletkezik világszerte, ráadásul az adatforgalom és az adatszolgáltatás volumene évente 40%-kal nő, ami hétszer gyorsabb, mint az információs és kommunikációs piac teljes növekedése. Különösen figyelemreméltó, hogy ennek a gigantikus mennyiségű adatnak köszönhetően jelentős előrelépést sikerült elérni több területen, pl. az egészségügyi diagnosztika, a szélerőműparkok helyszínének kiválasztása, a közlekedési torlódások megelőzése, a terméshozamok előrejelzése, a személyre szabott orvoslás és az élelmiszer-logisztika terén. A nagy adathalmazok technológiája és a kapcsolódó szolgáltatások globális piacának értéke 2015-re el fogja érni a 16,9 milliárd USA dollárt, és várhatóan sok százezer ehhez kapcsolódó munkahely fog létesülni világszerte. A döntéseiket az adatokból nyert ismereteik alapján meghozó vállalkozások 5-6%-kal képesek növelni termelékenységüket, a kormányok pedig lényegesen jobb minőségű döntéseket hozhatnak, ha hatásvizsgálataikhoz felhasználják a kormányzatban keletkezett óriási - 2 -

adatvagyont. 1 Az okos mobileszközök térnyerésével óriási lehetőségek nyílnak meg a valósidejű és a meghatározott földrajzi helyekhez, különösen a felhasználók aktuális tartózkodási helyéhez kapcsolódó információk hasznosítása révén mind a magánemberek, mind a vállalkozások számára. A különlegesen nagy adathalmazokkal, melyek mérete néhány terabájttól akár petabájtokig is terjedhet, két okból is külön kell foglalkozni: egyrészt nemcsak mennyiségileg több információ nyerhető belőlük, mint a kisebb adatbázisokból, nyilvántartásokból, hanem teljesen más, a döntések előkészítéséhez sokkal jobban használható információk is, másrészt speciális technikákat igényel az ilyen adathalmazok kezelése, egymással kombinált felhasználása és a speciális információk kinyerése. 3 Problémák és tennivalók Annak érdekében, hogy az EU tagállamainak kormányai, a polgárok és a vállalkozások minél nagyobb mértékben ki tudják aknázni az adatokban rejlő lehetőségeket, az Európai Bizottság már több közleményben is felhívta a tagállamok figyelmét a nagy adathalmazokban rejlő lehetőségekre és az elhárítandó akadályokra. A legutóbbi, 2014. július 2-án közzétett bizottsági közlemény megállapításait a magyar helyzetre vetítve az alábbiakban fogalmazhatjuk meg, hogy hazánkban mi hátráltatja a technológiának a kormányzati szférában való térnyerését: 1. nincs a témával foglalkozó, kormányzati szintű stratégia, elemzés, koncepció; 2. nincs kellő ismertsége a témának az állami döntéshozók és a potenciális felhasználók szintjén, így nincs kifejezett akár anyagi források elkülönítését is vállaló döntéshozói elkötelezettség sem a témában rejlő lehetőségek kiaknázása mellett; 3. széttagolt és bonyolult a jogi szabályozás; 4. hiányzik a kellő infrastruktúra, és nem elegendők a finanszírozási lehetőségek; 5. nincs elég adatszakértő, illetve megfelelő felkészültségű egyéb szakember; 6. nincs sem országon belüli, sem más országokkal való együttműködés a témában. 1 A 2014. július 2-án közzétett Európai Bizottsági sajtóközlemény: A Bizottság felhívja a tagállamok figyelmét, hogy ne menjenek el lehunyt szemmel a big data mellett European Commission - IP/14/769, 02/07/2014-3 -

Ugyancsak a bizottsági közlemény nyomán az alábbi kormányzati teendők látszanak a legfontosabbaknak a problémák kezelésére: 1. egy könnyen érthető, széles körben megvitatandó stratégiai előkészítő anyag elkészítése; 2. a hazai és nemzetközi adatszabványok feltérképezése, a hiányosságok azonosítása; 3. a vonatkozó szabályozás felülvizsgálata, a gyűjtött adatokhoz fűződő tulajdonjogok és az adatszolgáltatással kapcsolatos felelősségek megfelelő szabályozása; 4. együttműködési formák keresése a köz-, a vállalati, a civil és az akadémiai szféra adattulajdonosai, szolgáltatói, kutatói és felhasználói között hazánkban és külföldön egyaránt; 5. bekapcsolódás a Horizont 2020 kutatási és innovációs program keretében létrehozandó nyíltadat-inkubátor létrehozásába, ami megkönnyíti a kkv-k számára ellátási láncaik kiépítését és a felhőalapú számítástechnika nagyobb fokú kihasználását; 6. szuper-számítástechnikai kiválósági központok ( centers of excellence ) fejlesztése a képzett adatszakértők számának növelése érdekében. Mindehhez hozzátehetjük még, hogy a nagy adathalmazokkal kapcsolatban a kormányzatnak további sokrétű szerepe van, amit célszerű már a stratégiaalkotás fázisában megfelelően kezelni: az ország versenyképessége növelése érdekében a megfelelő jogszabályi és innovációs környezet megteremtésével ösztönöznie, támogatnia kell a nagy adathalmazokhoz kapcsolódó ipar fejlődését; példát kell mutatnia a nagy adathalmazokhoz kapcsolódó termékek felhasználójaként (jobb minőségű döntés-előkészítés, személyre szabott szolgáltatások nyújtása stb.); alap- és üzemanyagot kell biztosítania a nagy adathalmazokhoz kapcsolódó fejlesztések és szolgáltatások számára a közadatok minél nagyobb hányadának nyilvánossá tétele által. Nagyon fontos annak tudatosítása, hogy korunkban az adatok beleértve a nagy adathalmazokat is a munkaerőhöz, a természeti kincsekhez hasonlóan termelőerővé válnak, ráadásul olyan termelőerővé, amely a használata során nem kopik el, újra és újra hasznosul, ha megfelelő környezetbe helyezzük. - 4 -

4 Kapcsolódó területek Az alábbiakban felsorolunk néhány kapcsolódó területet, amit a készítendő stratégiának feltétlenül figyelembe kell még vennie, mivel a nagy adathalmazok problematikáját általában nem lehet önállóan tárgyalni. A. Nyílt adatok, közadatok újrahasznosíthatósága, döntés-előkészítéshez szükséges adatok A világban keletkező, rohamosan növekvő mennyiségű elektronikus adatok különböző halmazokba rendezhetők. Az egyes halmazok kapcsolatát az alábbi ábra szemlélteti: 2 Az egyes adatféleségek közötti összefüggések Az ábrából látható, hogy világon fellelhető valamennyi adatnak csak egy része alkot nagy adathalmazokat ( big data ), vagyis különlegesen nagy volumenű, gyorsan keletkező, digitálisan rögzített adategyütteseket. Vannak és továbbra is lesznek más 2 Forrás: Big data: The next frontier for innovation, competition, and productivity - McKinsey Global Institute, 2011-5 -

jellegű és felhasználású adatok is, pl. papíralapú információk, hagyományos formában rögzített kép és hanganyagok stb. A nyílt adatok ( open data ) jelentős része nagy adathalmaz, de a hagyományos adatok egy része is megfelelhet a nyílt adatállományokkal szemben támasztott követelményeknek, miszerint a kormányzatok, intézmények, vállalatok és magánszemélyek az általuk birtokolt adatokat mások rendelkezésére bocsájtják, úgy, hogy azok újrahasznosítása a felhasználók széles köre számára megengedett. A nyílt adatok gépi felhasználásra, automatikus feldolgozásra alkalmas formában kerülnek nyilvánosságra, ingyen, esetleg elhanyagolható nagyságú díjazás ellenében használhatóak, felhasználásukat, átalakításukat és szétosztásukat jogszabályok nem, vagy csak csekély mértékben korlátozzák. A nyílt adatok halmazának a nyílt kormányzati adatok ( open government data ) egy speciális és igen fontos részét képezik. A nyílt kormányzati adatok lényege abban áll, hogy a közpénzen gyűjtött adatokat újrahasznosítás céljából a kormányzatok a társadalom rendelkezésére bocsássák, ezáltal felpezsdítsék a vállalkozói kedvet, és serkentsék a gazdasági növekedést. Fontos hangsúlyozni, hogy a nyílt adat nem azonos a kormányzati munka átláthatóságát, a közpénzek elköltését nyomon követő adatoknak az információ szabadsága jegyében történő nyilvánosságra hozatalával, bár a két halmaznak vannak közös részei. A MyData halmaz azokat az adatokat, információkat tartalmazza, amelyeket természetes és jogi személyekről gyűjtenek az állami intézmények, pénzügyi és közüzemi szolgáltatók, különféle termékeket és szolgáltatásokat értékesítő cégek, és megosztják azokkal, akikről gyűjtötték ezeket. Pl. az egészségügyi intézmények hozzáférhetővé teszik a pácienseik számára a betegségeikre, kezelésükre, vizsgálataikra vonatkozó információkat, vagy a bankunk lehetővé teszi a számlaforgalmunk ellenőrzését, a mobilszolgáltatónktól hívásinformációkat kérhetünk stb. A nagy adathalmazok jelentős része a közszférában keletkezik (téradatok, statisztikai, egészségügyi, meteorológiai, környezetvédelmi adatok stb.), és többségük közérdekű adatnak vagy közérdekből nyilvános adatnak minősül. Ezen adatok nagy hányada a - 6 -

közadatok újrahasznosítására vonatkozó európai uniós irányelv 3 (az ún. PSI-irányelv) és az azt átültető magyar szabályozás 4 hatálya alá is tartozik. A nagy adathalmazok problematikájának ezért egyik központi kérdése azok elérhetősége, hozzáférésük költsége. Általános elvárás például, hogy a tagállamok gondoskodjanak a közadatok további felhasználhatóságáról, továbbá, hogy minden ilyen adathalmazt a jövőben a további felhasználhatóságuk figyelembevételével készítsenek el. A közadatok ügyének jelentőségét az EU stratégái is felismerték, ezért a Digitális Menetrend I. pillérjének 3. intézkedése a közadatok újrahasznosításának fontosságáról szól. 2011 decemberében a Bizottság egy, a nyílt adatokra vonatkozó csomagtervet 5 fogadott el, aminek sarkalatos pontját képezi, hogy aktualizálni kell a közszféra birtokában lévő információvagyon újrahasznosítására vonatkozó PSI irányelvet. Ez 2013 júniusában történt meg, ekkor adta ki a Parlament és a Tanács a PSI irányelv módosításáról szóló iránylevét. 6 Az ebben foglaltakat a tagállamoknak legkésőbb 2015. június 30-ig kell beilleszteniük a nemzeti jogszabályaikba. Az új PSIirányelv legfontosabb kitétele, hogy alapesetben minden közadat újrahasznosítható, külön kell meghatározni azon adatok körét, amelyekre nem vonatkozik ez a szabály. Megjegyezzük még, hogy a nagy adathalmazok jelentős részére a központi államigazgatási szerveknek döntéseik előkészítéséhez is szükségük van, ezért ezekre az adathalmazokra vonatkozik a döntés-előkészítéshez szükséges adatok hozzáférhetőségének biztosításáról szóló szabályozás is. 7 3 Az Európai Parlament és a Tanács 2003/98/EK Irányelve (2003. november 17.) a közszféra információinak további felhasználásáról 4 2012. évi LXIII. törvény a közadatok újrahasznosításáról 5 COM(2011) 882 A Bizottság közleménye az Európai Parlamentnek, a Tanácsnak, a Gazdasági és Szociális Bizottságnak és a Régiók Bizottságának. Nyílt adatok az innováció, a növekedés és az átlátható kormányzás mozgatórugói 6 Az Európai Parlament és a Tanács 2013/37/EU Irányelve (2013. június 26.) a közszféra információinak további felhasználásáról szóló 2003/98/EK irányelv módosításáról 7 2007. évi CI. törvény a döntéselőkészítéshez szükséges adatok hozzáférhetőségének biztosításáról 335/2007. (XII. 13.) Korm. rendelet a döntéselőkészítéshez szükséges adatok hozzáférhetőségének biztosításáról szóló 2007. évi CI. törvény végrehajtásáról - 7 -

B. Nemzeti adatvagyon, nyilvántartások minősége, együttműködő-képessége A nagy adathalmazok többsége része a nemzeti adatvagyonnak. Egy részük egyúttal olyan nyilvántartás is, amelynek minősége javításra szorul, és amelyek harmonizálását, együttműködő-képességét meg kell teremteni használhatóságuk érdekében. Az előző EU-s költségvetési ciklusban több közfeladatot ellátó szerv nyilvántartásának és információs rendszerének fejlesztése valósult meg az EKOP-ból történő finanszírozással (pl. a KSH elektronikus adatgyűjtési rendszerének fejlesztése és kiszélesítése, a központi szabálysértési nyilvántartás megvalósítása, az integrált nemzeti ingatlankataszter létrehozása, Központi Illetményszámfejtési Rendszer kifejlesztése). C. Adatvédelem Sok nagy adathalmaz tartalmaz személyes adatokat is. Az ilyen jellegű adathalmazok feldolgozása, felhasználása jelentős adatvédelmi aggályokat vethet fel, amelyek megfelelő kezelése akár közbizalmi kérdésként is tekinthető. A meglévő nemzetközi példák (legjobb gyakorlatok) esetében ezért központi kérdés az anonimizálás köre, módja, feltételei. A hazai stratégiaalkotásnál emiatt kiemelten vizsgálandó az adatok felhasználhatósága, az anonimizálás köre és módja, a külföldön az anonimizálásra már létező műszaki megoldások hazai alkalmazhatósága, továbbá az anonimizálással kapcsolatos közbizalom megszerzésének módszertana. D. Felhőtechnika, szuper-számítástehnika Méretüknél fogva a nagy adathalmazokban rejlő lehetőségek a felhőalapú technika és esetenként a szuper-számítástehnika alkalmazásával aknázhatók ki leginkább. Ilyen technikát a nagy nemzetközi cégek már régóta alkalmaznak. Az Európai Unióban úgynevezett kiválósági központokat javasolnak létrehozni ezeken a területeken a nagy hozzáadott értékű feladatok elvégzésére. A kiválósági központokban lehetőség nyílik az emberi és technológiai (számítógépes) erőforrások minél jobb kihasználására, a felhasználók által igényelt alkalmazások fejlesztésére. A szuper-számítástehnikán kívül fontos szerepet kap az adatok menedzselése, tárolása, összekapcsolása és a biztonság. A Horizont 2020 Tudományos Kiválóság fejezetében (Centres of Excellence for computing applications, EINFRA-5-2015) 2015-ös határidővel kiírásra kerülő pályázat ezt a témát hirdette meg. Magyarországon szóba jöhet a szuper- - 8 -

számítástehnikával foglalkozó NIIFI és MTA SZTAKI, továbbá a kiválósági központként működő EIT ICT Labs társult tagjaként az ELTE-BME szerepe is fontos lehet. E. Adatbiztonság, kiberbiztonság A nagy adathalmazok felhasználásához szorosan kapcsolódó adatbiztonság és kiberbiztonság területén nagy hiány mutatkozik a szükséges infrastruktúra és szakértelem tekintetében, amely elengedhetetlen a nagyméretű és bonyolult adatok lehetőségeinek kiaknázásához. A stratégiaalkotás során az adatok tulajdonjogának új értelmezését lehetővé tevő szabályrendszer megalkotása mellett az olyan adatszolgáltatásért viselt felelősségeket is újra kell gondolni, amelynek során a dolgok internetéből (IoT), valamint a gép-gép (M2M) kommunikációból származó adatok jelennek meg. 5 Finanszírozási lehetőségek A stratégiai előkészítő anyag elkészítése, az adatszabványok feltérképezése, a nyíltadatinkubátor létrehozásába történő bekapcsolódás, szuper-számítástechnikai kiválósági központok fejlesztése finanszírozásának vizsgálatakor első körben az operatív programok keretében történő projektnevesítés és elszámolhatóság kérdése vizsgálandó. A szakminisztériumok tájékoztatása alapján nem jelent problémát, hogy jelenleg egyik operatív program sem nevesíti a feladatot, ugyanis pl. a GINOP szerteágazó informatikai és kutatásfejlesztési, innovációs prioritásai és intézkedései lehetőséget biztosítanak arra, hogy a nagy adathalmazok kérdésköre szerepelhessen egyes projektekben. A Horizont 2020 program keretében egyértelmű lehetőség mutatkozik a finanszírozásra, itt az állami szerepvállalás mikéntje lehet kérdéses, mivel direkt EU-s pályázatokról van szó és a jelentkezők az állami szektoron kívülről is indulhatnak. Az állami szerepvállalás a potenciális pályázók azonosítása és ösztönzése lehet, illetve egy többszereplős konzorciumban képzelhető el közigazgatási szerv belépése. Az Európai Hálózatfinanszírozási Eszköz (CEF) 2014-es munkatervéhez jelenleg két pályázati csatorna van nyitva, de ezek nem a nagy adathalmazok témakörére fókuszálnak. Egyeztetés alatt van a tagállamokkal a CEF 2015-ös munkaterve, aminek része lehet a nagy adathalmazok kérdésköre is. - 9 -

Megvizsgálandó továbbá, hogy a Kutatási és Technológiai Innovációs Alap forrásai igénybe vehetők-e ilyen célokra. 6 Javasolt első lépés Javasoljuk, hogy első lépésként készüljön a szakterületre vonatkozóan egy fehér könyv, amely megfelel a kormányzati stratégiai irányításról szóló 38/2012. (III. 12.) Korm. rendelet 34. -ában foglalt követelményeknek. A dokumentum javasolt tartalma: 1) A szakterület bemutatása - elemzések, trendek - kapcsolódó szakterületek 2) Hazai és nemzetközi helyzetelemzés - hazai adatvagyon áttekintése - nagy hazai adattárház-projektek (NAV, OEP stb.), kutatási eredmények (MTA SZTAKI, ELTE, BME, NIIFI stb.), Big Data Public Private Forum, sikeres nemzetközi projektek, legjobb gyakorlatok - az EU páneurópai törekvései, finanszírozási lehetőségek - az EU tagállamai és más országok eredményei, hazai hasznosításra alkalmas jó gyakorlatai - szabályozás, szabványosítás 3) Kormányzati lépéseket igénylő kihívások - vonatkozó kormányzati stratégia elkészítése - hazai és nemzetközi (köztük uniós) együttműködések kialakítása - szabályozás felülvizsgálata - szabványosítás - kiválósági központok fejlesztésének ösztönzése 4) A javasolt beavatkozások területei - szabályozási szint - közpolitikai szint - finanszírozási szint - 10 -

A javasolt fehér könyv az elkészítésére vonatkozó vezetői döntés megszületése után, a szükséges erőforrások megléte esetén és az érintett szervek (az európai uniós források felhasználásáért, a kutatás-fejlesztésért és technológiai innovációért, az informatikáért, az e-közigazgatásért felelős minisztériumok) érdemi együttműködése mellett 4-6 hónap alatt elkészíthető. (Hasonló jellegű, más témájú dokumentum megírása az előző EU-s költségvetési ciklusban az ÁROP források terhére valósult meg pl.: Zöld könyv az infokommunikációs szektor 2014-2020 közötti fejlesztési irányairól.) Javasoljuk továbbá, hogy a fehér könyvön túl készüljön egy átfogóbb stratégiai tervdokumentum a teljes kormányzati adatpolitikáról, amely a nagy adathalmazok felhasználásán túl kiterjedne a nyílt adatokra, a közadatok újrahasznosítására, a nemzeti adatvagyonra és a nyilvántartások kérdéseire is, különös tekintettel a módosított PSIirányelv hazai jogrendszerbe történő beillesztésére. Egy ilyen dokumentum elkészítése természetesen már lényegesen összetettebb feladat lenne. - 11 -

I. melléklet: A témában figyelembe vehető szabályozások, stratégiák, intézkedési tervek Konkrétan a témára vonatkozó szabályozásra nincs példa: valószínűleg ilyenre nincs is szükség. Amint azonban a korábbiakban már szerepelt, a nagy adathalmazok kérdésköre szorosan kapcsolódik más témákhoz (nyílt adatok, közadatok újrahasznosítása, adatvédelem, szellemi tulajdonjogok, adatbiztonság, kiberbiztonság stb.), amelyeknek kiterjedt szabályozásuk van világszerte, így hazánkban is, sőt számos területen uniós szabályozás is van érvényben. Mindezen jogforrásoknak még csak a felsorolása is meghaladja ezen anyag kereteit, de az uniós és a hazai szabályozás fontosabb elemei már szerepeltek a korábbi fejezetek lábjegyzeteiben. Koncepcionális, stratégiai szinten elsősorban az Úton a prosperáló adatközpontú gazdaság felé című bizottsági közleményt érdemes megemlíteni 8. Ez a téma fontosságának, az európai helyzetnek, a problémáknak bemutatásán, kitörési pontok keresésén túl egy nagyon általános, elsősorban a Bizottságot érintő feladattervet vázol fel a közösségépítés és a keretfeltételek kialakítása terén. Egy ennél szélesebb tematikájú anyag is készül az Európai Unióban: az Európai adat értéklánc stratégia, amelynek még csak tervezete ismert Ez célul tűzné ki egy koherens európai adat ökoszisztéma kiépítését, az adatokkal kapcsolatos kutatások és innováció ösztönzését és az adatokban rejlő értékek felszínre hozásához szükséges keretfeltételek megteremtését. A szakterület országos stratégiai szintű kezelésére Ausztráliában láthatunk példát. 9 anyag olyan központi feladatok kijelöléséig jut el, mint útmutató készítése kormányzati intézmények és szakemberek számára, akadályok beazonosítása, ismeretek növelése, adatregiszter létrehozása, műszaki fejlődés monitorozása. Más országok, pl. UK, Franciaország, Ausztria esetében inkább az jellemző, hogy nincs külön stratégiájuk erre a területre, hanem országos adatstratégiájukban kap jelentős szerepel a nagy adathalmazok használata 10. Az 8 Úton a prosperáló adatközpontú gazdaság felé, A Bizottság közleménye az Európai Parlamentnek, a Tanácsnak, az Európai Gazdasági És Szociális Bizottságnak és a Régiók Bizottságának, Brüsszel, 2014.7.2. COM(2014) 442 final 9 The Australian Public Service Big Data Strategy, 2013 10 Pl.: Seizing the data opportunity. A strategy for UK data capability, 2013-12 -

Megemlíthető még az is, hogy a Horizont 2020 uniós keretprogram ICT-15-2014 akciójában is szerepel a nyílt adatok mellett a nagy adathalmazokkal kapcsolatos kutatás, az ICT-16-2015 akció pedig kimondottan a nagy adathalmazokról fog szólni. Az ICT-15-2014-re 88 javaslat érkezett, amiből 9-et fogadtak el. Célszerű lesz figyelemmel kísérni ezeknek a projekteknek az előrehaladását is, mert hasznos információkkal szolgálhatnak a téma fejlődésével kapcsolatosan. - 13 -

II. melléklet: Nagy adathalmazokat elemző termékek A piacon számos olyan eszközt kínálnak, amely alkalmas nagy adathalmazok kezelésére, elemzésére. A jelen dokumentum keretei összehasonlító vizsgálatot nem tesznek lehetővé, ezért csak egy példálózó felsorolásra szorítkozhatunk: 1010data eszközei Actian termékei Cloudera Enterprise EMC Big Data termékei (pl. Big Data Explorer) FICO Big Data eszközei HP HAVEn Hortonworks Data Platform (HDP) IBM Watson Foundation InfiniDB eszközei Infobright termékei Kognitio szoftvere MapR terméke Microsoft Azure HDInsight Oracle Big Data termékei (Big Data Appliance, Big Data SQL, Exadata Database Machine, Big Data Connectors stb.) Pivotal Big Data eszközei SAP HANA Software AG Big Data eszközei TERADATA termékei - 14 -