Adatminőségi kérdések az elméletben és a gyakorlatban Esri Magyarország Felhasználói Konferencia 2014 Lellei László lellei.laszlo@posta.hu Slyuch András andras.slyuch@posta.hu 2014. október 9. 1
Tartalom Postai térinformatika rövid bemutatása Központi Címregiszter Projekt Adatminőségi tényezők az elméletben (a térinformatika szemszögéből) A rossz adatminőségből következő problémák a gyakorlatban - a postai térinformatikában - KCR pilot kapcsán Összefoglalás 2
Postai térinformatika 3
Címproblémák - POCI Kossuth név elírása egy 200.000 tételes ügyfél adatbázisban: Kosssuth Kossth Kossuh Kossuht Kossurh Kossut Kossúth Kosuth Kosuuth Kosúth Kossuth közterületek Cegléden (Referencia címadatbázis): Irányítószám Település Közterület név Típus 2700 Cegléd Kossuth köz 2700 Cegléd Kossuth tér 2700 Cegléd Kossuth Ferenc utca 2700 Cegléd Kossuth Lajos utca 2738 Cegléd Kossuth Zsuzsánna utca Elírások, rövidítések: Frange Pál Dankó Pista Rákóczi Frangepán Dankó István II. Rákóczi Ferenc Az Üllői út 60-62 házszámvariációi a KEK KH adatbázisban: 60 60 62/B 60/62 60/62/A 60/62/B 60/62A 60/62B 60-62 60-62/A 60-62/B 60-62B 4
Térképek Adatvizualizáció Elemzés Üzleti tervezés Terjesztési terv stb. 5
Bejárási sorrendbe rendezett küldemények Címek + kézbesítési adatok Csak címek Rendszerek Postai munkafolyamat támogatás Címazonosítás - geokódolás Geomarketing Címadatbázis-címmenedzsment Logisztika Járástervezés Útvonaltervezés, ellenőrzés Küldemény irányítás támogatása POCI-val Elektronikusan feladó partnerek Adatfogadó rendszerek Referencia címadatbázis POCI Küldemények előállítása, csomagképzés Kézbesítőposta Kézbesítőposta Kézbesítőposta Kézbesítők 6
Központi Címregiszter Projekt 7
Központi Címregiszter Projekt Miért van szükség a KCR-re? Nem létezik az ország összes címét lefedő címadatbázis Mintegy 300 címnyilvántartási rendszer az államigazgatásban Nem egységes a jogszabályi háttér Nincs egységesen kialakított gyakorlat Európai Uniós irányelvek 8
Központi Címregiszter Projekt Központi Címregiszter ÁROP 1.2.12. (pilot) Ingatlannyilvántartás Személyi lakcímnyilvántartás Adatmegfeleltetés POCI segítségével Jegyzői validációs eljárás KCR adatbázis Postai címadatbázis 9
Központi Címregiszter Projekt A validálás három szintje 1. közterület 2. házszám 3. házon belül 10
Adatminőség az elméletben Az adatminőség alatt az adatszabványok általában a következő fontosabb tényezők összhatását értik: 1.) az adatok helyzeti pontossága, 2.) az objektumok attribútumainak tartalmi pontossága, 3.) a következetesség, 4.) adatbázis teljessége, 5.) az adatok aktualitása, 6.) az adatok eredete. (Forrás: Dr. Sárközy Ferenc, Térinformatika) 11
1.) Adatok helyzeti pontossága 12
1.) Adatok helyzeti pontossága Balaton 13
1.) Adatok helyzeti pontossága (KCR - pilot) 2151, Fót Rév út 100 2151, Fót Rév út 11 14
2.) Attribútum adatok pontossága Geomarketing: Hol lakik a potenciális ügyfél? Adatok pl. lakcímnyilvántartó, korosztályokra bontott adatai. Probléma, ha az adatok nem fedik a valóságot. Nem ott lakik, csak a: - gázártámogatás - beiskolázás, óvodai beíratás - segélyek stb. miatt lett oda bejelentve. Kézbesítő által gyűjtött adatok pontosabbak 15
2.) Attribútum adatok pontossága (KCR - pilot) Lenin utca Arany János utca POCI kezeli 16
3.) Következetesség Feldolgozandó címek esetén: Különböző struktúra Azonos címelemek eltérő írásmóddal - Nefelejcs utca Nefelejts utca - II Rákóczi Ferenc utca Rákóczi Ferenc utca Rákóczi utca POCI A feldolgozandó cím megfeleltetése egy referencia-adatbázis címhez 17
3.) Következetesség (KCR - pilot) 1082, Budapest Üllői út 60-62 két épületből álló cím 259 lakással: Házszám Épület Lépcsőház Emelet Ajtó 000060-0062 A 1 7 000060 62/B 1 2 18 000060 FSZ 1 000060 B 4 34 000060-0062 2 3 28 000060/0062 A 4 33 000060/062A 3 24 000060-062B 2 2 21 000060-62/A 3 27 000060-62/B 1 4 35 POCI 18
4.) Adatbázisok teljessége Korábbi állapot: Kézbesítési címadatbázisa Ahova nem kézbesítünk azok a címek hiányoznak Nincs mindenhol koordináta DSM10 ( Térképi címadatbázis) Mindenhol van koordináta Házszámok interpolációval (tól/ig-et nem kezeli) és nincs járás adat POCI-hoz több referencia adatbázis Jelen állapot: OECM (egy központi címadatbázis) POCI-hoz egy referencia adatbázis 19
4.) Adatbázisok teljessége (KCR - pilot) Forrás címadatok teljessége: Személyi és lakcímnyilvántartó (SzL) Az van csak biztosan benne, ahol van (vagy volt) bejelentett lakos, így nem biztos, hogy benne vannak az irodák, cégek, közintézmények stb. Ingatlan-nyilvántartás (Iny) Elméletileg teljes, de a cím csak attribútum adat, sok helyen pontatlan, vagy hiányzik (csak helyrajzi szám van). Postai címadatbázis (OECM) Nincsenek benne az épület utáni szintek (lépcsőház, emelet, ajtó). Központi Címadatbázis 20
5.) Adatok aktualitása Megyetérkép nem volt aktuális 21
5.) Adatok aktualitása (KCR - pilot) 6000,Kecskemét, Nagykőrösi utca 41 Jegyzői validálás Település Közterület név Típus Házszám Épület Lépcsőház Emelet Ajtó Kecskemét Nagykőrösi utca 41 3 Kecskemét Nagykőrösi utca 41 Kecskemét Nagykőrösi utca 41 7 Kecskemét Nagykőrösi utca 41 1 Kecskemét Nagykőrösi utca 41 4 22
6.) Adatok eredete Koordináták kezelése az OECM-ben: Eredeti koordináták a kézbesítési címadatbázisból (DSM10-hez geokódolt) Nagy tömegű kézi geokódolás Új rendszerben térképen bejelölés Kézi készülékkel rögzített koordináták 23
6.) Adatok eredete (KCR - pilot) Címelemek minősége a forrás adatbázisokban: SzL Iny Jó a közterületig (következetes, átnevezések átvezetve), de nem jó (nem következetes) házszám és az után lévő rész. Közterület, irányítószám gyakran nem jó (nem következetes), házszám után rész viszont következetesebb. Jegyzői validálás 24
Még egyszer az adatminőségi mutatók az adatok helyzeti pontossága, az objektumok attribútumainak tartalmi pontossága, a következetesség, adatbázis teljessége, az adatok aktualitása, az adatok eredete. Egységes adatkezelés, központi egységes adatbázisok létrehozása 25
Adatminőségi kérdések az elméletben és a gyakorlatban Köszönjük a figyelmet! Lellei László lellei.laszlo@posta.hu Slyuch András andras.slyuch@posta.hu 26