Ügyfél- és címadatok feldolgozása Talenddel



Hasonló dokumentumok
Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

IRÁNYTŰ A SZABÁLYTENGERBEN

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

Tudásalapú információ integráció

Új komponens a Talend Palettán: Starschema SAP Connector. Csillag Péter, Földi Tamás Starschema Kft.

Oracle GoldenGate Studio Nagyon rövid bemutató. Quick Talk. Gollnhofer Gábor

Microsoft SQL Server telepítése

Az ArcGIS platform bevezetése a MAVIR-ban

Informatikai célrendszertől a komplex oktatási intézménymenedzsmentig

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

A cloud szolgáltatási modell a közigazgatásban

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Banki üzleti szabályok kezelésének támogatása

BISNODE ADATBÁZIS SZOLGÁLTATÁSOK

Térinformatikai támogatás a kistérségi döntés és erőforrás-gazdálkodásban

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Teljes Életút Bázis Adatok

Ingatlan-nyilvántartási megoldás a magyar állami erdőgazdálkodás számára március 18. GIS open 2010 Székesfehérvár Nyull Balázs DigiTerra Kft.

Üzleti architektúra menedzsment, a digitális integrált irányítási rendszer

A Java EE 5 plattform

Adatbázis-kezelés az Excel 2013-ban

DW 9. előadás DW tervezése, DW-projekt

18. századi folyóiratok komplex feldolgozása a Debreceni Egyetemen

Data Vault adatmodellezés.

Oracle Middleware megoldások helye üzleti esettanulmányokon keresztül bemutatva, különböző iparágakban

Áttekintés. Mi a IUCLID felhő? Milyen előnyökkel jár a IUCLID felhő használata? A IUCLID felhő elérése és használata. Milyen funkciók érhetők el?

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

E-CENTRAL SALES AUTOMATION. Tudj mindent ügyfeleidről!

Infor PM10 Üzleti intelligencia megoldás

Felhasználók hitelesítése adatbiztonság szállításkor. Felhasználóknak szeparálása

TANANYAGTÁRHÁZAK SZEREPE AZ ELEARNINGBEN. Vágvölgyi Csaba - Papp Gyula. Kölcsey Ferenc Református Tanítóképző Főiskola Debrecen

Örökölt adattárháztól a CMDB-ig

30 MB INFORMATIKAI PROJEKTELLENŐR

MŰSZAKI KÖVETELMÉNYEK, A KÖRKERESŐ SZOFTVER SPECIFIKÁCIÓJA, KÖLTSÉGVETÉS. A) Műszaki követelmények

Soltész Gábor. Önéletrajz Budapest, Lechner Ödön fasor em 26. a.

TERC V.I.P. hardverkulcs regisztráció

Szolgáltatási szint megállapodás

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

Gyakorlati vizsgatevékenység B

E mail titkosítás az üzleti életben ma már követelmény! Ön szerint ki tudja elolvasni bizalmas leveleinket?

Informatikai projektellenőr szerepe/feladatai Informatika / Az informatika térhódítása Függőség az információtól / informatikától Információs

Szolgáltatás Orientált Architektúra a MAVIR-nál

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

TÁJÉKOZTATÓ SZEPTEMBER 15. ELŐADÓ: DR. SZEPESI GÁBOR OPERATÍV PROJEKTVEZETŐ

Vizuális adatelemzés - Gyakorlat. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

OLK levélfeldolgozó rendszer fejlesztési igénye vonalkód kezelésre, és a levélszolgáltatásokra vonatkozóan

Technológia a gyógyítás szolgálatában. EMMA Integráció az SAP vállalatirányítási rendszerrel. Technológiai ismertető

Integráció az adatok szintjén

Az információ hatalom. adatok. információ

Megoldások a tehergépjárműpihenők parkolóhely előrejelző rendszereire

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

HATÉKONY ETL FOLYAMATOK WORKSHOP

30 MB INFORMATIKAI PROJEKTELLENŐR INFORMATIKAI RENDSZEREK INTEGRÁCIÓJA INTEGRÁCIÓS TECHNOLÓGIÁK (LEGACY RENDSZEREK, ADATOK, TÖRZSADAT MENEDZSMENT)

<Insert Picture Here> Migráció MS Access-ről Oracle Application Express-re

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

Kontrolling támogató rendszer bevezetése a NISZ-ben

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Nyilvántartási Rendszer

Szabálykezelés a gyakorlatban

Szoftver-technológia II. Szoftver újrafelhasználás. (Software reuse) Irodalom

Térinformatikai kihívások a természetvédelem előtt

ITIL V3 ALAPÚ IT SZOLGÁLTATÁSIRÁNYÍRÁSI RENDSZER BEVEZETÉSE A GPITINER SEGÍTSÉGÉVEL. Sztrida Ákos IT ügyvezető igazgató helyettes ITIL Expert

Az Ariba Magyarországon - S2P automatizálás a világ élvonalában

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

Autóipari beágyazott rendszerek. Komponens és rendszer integráció

Szoftver újrafelhasználás

K&H Központosított felhasználó adminisztráció gyakorlati megvalósítása

SUSE Linux Enterprise Server 12 Hargitai Zsolt

Követelmény alapú minőségbiztosítás az államigazgatásban

Közösség, projektek, IDE

Újdonságok. Jancsich Ernő Ferenc

Újdonságok az AX2012-ben! Hauserné Kozák Veronika

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

Self Service szekció. XXVIII. Budapesti Menedzsment és Controlling Fórum. Havas Levente. Budapest, május 26. IFUA Horváth & Partners

Ropogós - Oracle BI EE 12C

Oktatási keretrendszer. Aba 0 perces ügyintézés pilot projekt

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

László Zsuzsanna Vezérigazgató. Integra Zrt. Budapest, 1037 Kiscelli utca

IV/1. sz. melléklet: Vállalati CRM, értékesítési terület funkcionális specifikáció

Az Oracle Fusion szakértői szemmel

Papír helyett elektronikus űrlap. Szabadság és interaktivitás az űrlapkezelésben

Oracle9i Alkalmazás Szerver Üzleti folyamat integráció. Molnár Balázs Vezető értékesítési konzultáns Oracle Hungary

Adatmodellezés adatbázis-kezelés az MS ACCES segítségével

MOBIL TÉRKÉPEZŐ RENDSZER PROJEKT TAPASZTALATOK

esettanulmány minta

Tájékoztató. Használható segédeszköz: -

SABLONOZÓ KERETRENDSZER

Rostás Sándor szds. MH GEOSZ Műszaki és információs osztály térképész főtiszt (ov. h.)

Fogalomtár bevezetése a Magyar Telekomnál

Big Data az ellenőrzésben: Kihívás vagy lehetőség?

LBRA6i integrált rendszer

Mindenki tudja, hogy bizonyos dolgokat. nem lehet megvalósítani, mígnem jön. valaki, aki erről nem tud, és megvalósítja.

IT megoldások a 4F rendszerben

Vállalati adatvédelem

Takács Gábor mérnök informatikus, okl. mérnöktanár

TOGAF elemei a gyakorlatban

Átírás:

Ügyfél- és címadatok feldolgozása Talenddel 2012.október 4. Dr. Miskolczi Mátyás, Kiss György

A Stratisról röviden Jellemzők - Alapítva: 1998 - Tisztán magyar tulajdon - 50 tanácsadó - 140 ügyfél - 500+ projekt 1400 1200 1000 800 600 400 274 377 456 646 874 961 713 1215 1045 1005 1060 200 0 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Szolgáltatások - Üzleti és IT stratégiai tanácsadás - Folyamatmenedzsment - Speciális szakértői szolgáltatások 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 2

Bővült a Stratis szolgáltatáspalettája Adatvagyon-gazdálkodás - Adatintegráció - Adatminőség-javítás - Törzsadat-kezelés - Eszközrendszerek az adatkezelés üzleti folyamatainak szervezéséhez - Kiemelt szállítói technológiák: Alkalmazás-szolgáltatások - Vállalati architektúra (TOGAF) - Alkalmazás modernizáció - Cloud integráció - IT biztonság, kockázatelemzés 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 3

Megközelítés A Stratis hozzáadott értéke - Komplex megoldás a stratégiai szinttől a technikai megvalósításig - Tapasztalatok és kompetenciák az üzleti folyamatok és integrációs műveletek terén - A vállalatvezetés és vezetői információszolgáltatás legjobb gyakorlatának megfelelő eljárások alkalmazása Mit hoztunk? - Esettanulmány általános üzleti problémára - Feladat: adatintegráció és adattisztítás - Cél: mesteradatok előállítása - Konkrét technikai megoldás Talend segítségével - A megoldás alkalmazhatósága: több rendszer ügyféltörzsének / címadatainak integrációja 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 4

Alaphelyzet és Cél Az alap-adatállomány jellemzői - Ügyféladatok (név, vállalati adatok, kontaktadatok) - 9 forrásállomány - 3 séma - Adatbázis, flatfile vegyesen - 25-30.000 rekord A kívánt állapot bemutatása - Tiszta, megbízható adatok - Egységes struktúra - Egy adatállomány (db) - Szabványos és transzparens feldolgozási folyamat 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 5

Szükséges eszköz: Integrált adatkezelési platform Centralizált metaadat-kezelés - Könnyen illeszthető a vállalati architektúrába - Transzparens folyamatok Alacsony fejlesztési költség - Automatikus dokumentációkészítés Gyors, egyszerű - Csoportmunka-támogatás adatkarbantartási folyamatok - Change Data Capture támogatás - Beépített ütemező Intuitív grafikus felület Gyorsabb, olcsóbb ETL fejlesztések Könnyű kezelhetőség - Intuitív grafikus felület Fejlesztői (sql, java) ismeretek nélküli adatműveletek Előre elkészített alkalmazásrészek Jobban kommunikálható technikai folyamatok 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 6

Az adatkezelés folyamata Talenddel

Adatállomásoztatás és adattisztítás Betöltés - 3 eltérő struktúrájú adatforrás - Egyazon egyedhalmazra vonatkozó adatok Előfeldolgozás - Az adatok megfelelőségi szabályok szerinti ellenőrzése - A szabályoktól eltérő adatok tisztítása, vagy a rekord töltésének elvetése Telefonszám Név E-mail cím Cím (településnév validálása/javítása referencia-adatállomány alapján) 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 8

Egységes adatstruktúra kialakítása Parsing - Egy mezőben tárolt névadatok felbontása elemi szintre (parsing) - Egy mezőben tárolt címadatok felbontása elemi szintre Egységes adatállományba való betöltés - A forrásadatokat részletes bontásban tároló struktúra - Az eredeti adatok tisztított és kiegészített (gazdagított) verziója - Csak a megfelelő adattartalmú rekordok betöltése 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 9

Deduplikáció Egyezőségvizsgálat - Egyedi kulcs definiálása - Egyezőségi kritériumok definiálása (súlyozás, scoring) Mesteradatok és duplikátumok szétválasztása - A minőségi kritériumoknak megfelelő adatok áttöltése a mestertáblába - A duplikátumok elkülönítése - A duplikátumok mesteradatok közötti párjának eltárolása 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 10

Adatgazdagítás: geokódok és Google címadatok Címadatok megfelelő átstruktúrálása - Külön mező a geokódoláshoz szükséges címstruktúra létrehozásához - tgooglegeocode éa/vagy tgoogleaddressrow pluginok használata Google címadatok lekérése - A Google ingyenes szolgáltatása (napi 2.500 rekordra) - A Google címadataival pótolhatók az esetleges hiányok, javíthatók a pontatlanságok 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 11

A tisztított adatállomány jellemzői Egységes struktúra - Elemi szintre bontott, mezőszinten azonosított adatelemek - Leíró metaadatokkal kiegészített rekordok és oszlopok - Egységes törzsadat-kezelés céljára előkészített állomány Megbízható adattartalom - Szabályoknak való megfelelés = 100% - Az adatok valós tisztasága > 90% (manuális tisztítást nem végeztünk) - Deduplikált állomány, minden rekord egy példányban szerepel - Gazdagított adatok külső adatforrásból kiegészítve 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 12

A fejlesztői munka támogatása Üzleti felhasználók számára nyújtott előnyök - Intuitív grafikus felület: átlátható, könnyen megtanulható - Automatikus kódgenerálás: az egyszerűbb feladatok nem igényelnek fejlesztői ismereteket (pl: SQL, Regex) - Folyamatszemlélet: az üzleti logika könnyebb implementálása Fejlesztők számára nyújtott előnyök - Előre elkészített konnektorok: több mint 500 rendszerhez kész csatoló - Más alkalmazásokban tárolt logika implementálása: kész eljárások beemelése, meghívása - Komplex operátorok egyszerű paraméterezéssel testre szabhatók - A létrehozott eljárások publikálhatók az üzleti felhasználók számára - Java / Eclipse keretrendszer - Nyílt java/perl kód generálása - Automatikus dokumentációkészítés 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 13

És végül A hazai partnere a 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 14

és most lássuk élőben az adatokat!

Adatállomásoztatás és adattisztítás 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 16

Egységes adatstruktúra kialakítása 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 17

Deduplikáció 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 18

Adatgazdagítás: geokódok és Google címadatok 2012 - Stratis Vezetői és Informatikai Tanácsadó Kft. 19

Köszönjük a figyelmet!