Hogyan teremtsünk értéket strukturálatlan adatokból?

Hasonló dokumentumok
Mennyit ér meg a szervezetnek a gyors, precíz, pontos információ?

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Kővári Attila, BI projekt

Tartalom. Előszó feladat: Fordítás a megszokott eszközökkel A számítógép hatékony használatáról... 18

A webanalitika változó világa 4 felvonásban

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Projekt menedzsment és kontrolling a kormányzati szektorban

Kontrolling támogató rendszer bevezetése a NISZ-ben

Fogalomtár bevezetése a Magyar Telekomnál

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

PROVICE. üzleti és informatikai tanácsadás

Folyamatmenedzsment módszerek a projekt menedzsment eszköztárában

Hogyan többszörözd meg weboldalaid látogatottságát?

Projekt iroda (PMO), mint befektetés

THOTH 2 minőségbiztosítási tanúsítvány Gazdaságfejlesztési Operatív Program (GOP) megfelelési tanúsítványok

E-CENTRAL SALES AUTOMATION. Tudj mindent ügyfeleidről!

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

Jogosultság-monitorozó rendszer kialakítása

Bemutató anyag. Flash dinamikus weboldal adminisztrációs felület. Flash-Com Számítástechnikai Kft Minden jog fenntartva!

AZ IKIR RENDSZER BEMUTATÁSA

MAGYAR BESZÁLLÍTÓK A NEMZETKÖZI ÉRTÉKLÁNCBAN HOGYAN VÁLHAT AZ ÖN VÁLLALKOZÁSA IS SIKERES BESZÁLLÍTÓVÁ?

100% BIO Natur/Bio kozmetikumok és testápolás

Piactérkép Önkiszolgáló marketing adatbázis

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

ÚTMUTATÓ. II. évfolyam Üzleti szakügyintéző szakképesítés Számviteli szakügyintéző elágazás. 2011/2012 II. félév

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

JOOTTHON MÉDIAAJÁNLAT TARIFATÁBLÁZAT (utolsó frissítés: március 25.)

Megjelenési csomagok. Szolgáltatás. Standard megjelenés- éves díj. rendelkező partnerek

A projektvezetési eszköz implementációja hazai építő-, szerelőipari vállalkozásoknál

Egyedi megjelenési és reklám / hirdetési lehet ségek a Gazdivonal.hu portálon

Árajánlat weboldal készítésére a Magyar Könyvvizsgálói Kamara Oktatási Központ ügyfelei részére

A Ligeti Magánklinika Adatvédelmi és Adatbiztonsági Szabályzatának I. sz. Melléklete

Big Data az adattárházban

A hierarchikus adatbázis struktúra jellemzői

DW 9. előadás DW tervezése, DW-projekt

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Cselekvési ütemterv a projekt intézményi megvalósításához. Projektmenedzser, szakmai megvalósítók

Cselekvési ütemterv a projekt intézményi megvalósításához

A kutatás időtartama: március

Projekt-portfólió menedzsment, ahogy mi csináljuk. Az Oracle Primavera megoldásokkal Ulicsák Béla

A MAGYAR NEMZETI MÚZEUM AGGREGÁTORI FELADATAI ÉS DIGITÁLIS SZOLGÁLTATÁS FEJLESZTÉSI TERVEI 2019

Vezetői beszámoló Kerekegyháza Polgármesteri Hivatala ÁROP hivatali szervezetfejlesztésről

Átfogó megoldás a számlafolyamatok felgyorsításához ELO DocXtractor. Laczkó Kristóf ELO Digital Office Kft. Bálint András Prognax Kft.

Kérdések és válaszok az ADVISEról

A tér, ami megtérül...

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Automatizált Marketing Webshopoknak

Az online platform, amely összeköti Európát.

Háry László Általános Iskola 9124 Gyömöre, Rákóczi u

ADATVÉDELMI TÁJÉKOZTATÓ

AZ OFI SZEREPE ÉS FELADATAI A PEDAGÓGUSOK SZAKMAI MUNKÁJÁNAK TÁMOGATÁSÁBAN

Korszerű elektronikus fuvarbörze felépítése, folyamata

Projekt beszámoló. Könyvelési Szakértői Rendszer Kifejlesztése Repetitív Könyvelési Feladatok Szabályalapú Feldolgozására

Fejlesztési specifikációk

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Probléma Menedzsment és a mérhetőség. Suba Péter, Service Delivery Consultant

Adatbányászat és Perszonalizáció architektúra

Vállalkozás Statisztikai Adatbázis

Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest. Networkshop 2004 konferencia Győr, április 4 7.

1. JELENTKEZŐ ADATBÁZIS MODUL

IT ügyfélszolgálat és incidenskezelés fejlesztése az MNB-nél

<Insert Picture Here> Teljeskörűen modernizált HR rendszer a Szerencsjáték Zrt-nél

AZ IGAZI BIG DATA hogyan használják a világban és egyáltalán használják-e hazánkban?

Papp-Karakas Kitti SzEK.org Webshop Start - Budapest

Az előadás célja. Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 1

ONLINE SZAKÉRTŐI RENDSZER KIÉPÍTÉSE ÉS MARKETING TERVE

corinwebshop.com bérelhető webáruház egyszerűen

A Telenor Magyarország Zrt. MOSTVAGYOK játékának Játékszabályzata

Kreatív értékesítési technikák a social media segítségével.

Program verzió:

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

PROFIT HOLDING Hungary Zrt. WEB üzletág

Vízcenter. Mobil alkalmazás

Automatikus feladatok modul

GroupBy. by RÉGENS RÉGENS LOGISTICS GYŰJTŐ DARABÁRU SZÁLLÍTMÁNYOZÁS

Tartalom. Konfiguráció menedzsment bevezetési tapasztalatok. Bevezetés. Tipikus konfigurációs adatbázis kialakítási projekt. Adatbázis szerkezet

Webáruházak és a marketing Az e-kereskedelem új trendjei. Milyen webáruházat építsünk 2014-ben? Webáruház-forgalomnövelés Facebookkal.

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

A tér, ami megtérül...

Webáruház. Tisztelt Partnerünk!

Informatikai projektellenőr szerepe/feladatai Informatika / Az informatika térhódítása Függőség az információtól / informatikától Információs

Online információkeresés. Dr. Nyéki Lajos 2016

Studio 1900 C.A. Kft 1149 Budapest Róna utca

Az Indecs rendszer. Kockázat- és követeléskezelés nagyvállalati környezetben

A helyismereti információszolgáltatás jellemzői és új irányai a könyvtári honlapokon

MÉrnöki szerkezeteket DIagnosztizáló és Nyilvántartó Alkalmazás (MEDINA) Erdődi László MÁV Zrt. PVÜF Híd és Alépítményi Osztály

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

minic studio Melinda Steel Weboldal kivitelezési árajánlat

Adatbázis-kezelés az Excel 2013-ban

Szombathely Város Vezetõi Döntéstámogató Rendszere VDIR-STAT.

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Adattár. Adattár. Elemzések, modellezés. Adatszolgáltatás

Felhasználói kézikönyv

Intelligens partner rendszer virtuális kórházi osztály megvalósításához

Szuper leaderboard. Display hirdetések. A főoldal tetején, a profession fejléc felett megjelenő banner típus. MÉRET (PX): 980x100. HETI ÁR: Ft

Angol szótár V

Data Vault adatmodellezés.

Megfelelőségi nyilatkozat (elektronikus hírközlési szolgáltatás 13/2011. (XII. 27.) NMHH rendelet szerinti megfelelőségéről a 2015.

Információtartalom vázlata

Adatbázismodellek. 1. ábra Hierarchikus modell

Átírás:

Hogyan teremtsünk értéket strukturálatlan adatokból? Nemeth.Zoltan@iqpp.hu

Strukturálatlan adat A Merill Lynch becslése szerint az összes üzleti információ több mint 85%-a strukturálatlan adatok formájában létezik: Belső : elektronikus levelek, emlékeztetők, jegyzőkönyvek, feljegyzések, ügyfélszolgálati válaszok, elektronikus hírek, jelentések, kimutatások, felmérések, munkaanyagok, termékleírások, felhasználói és üzemeltetői kézikönyvek, tenderkiírások, pályázatok, ajánlatok, kutatási és marketing anyagok, prezentációk, intranet és internetoldalak stb. Külső: felügyeleti-, konkurencia-, ügyfél-, partner weboldalak, feketelisták, Facebook, Twitter, Fórum bejegyzések, hírportálok, előfizethető adatbázisok, KSH adatok stb. Az Interneten lévő információ 99%-a szabad formátumú szöveg formájában található meg.

Információk problémás projektekről Strukturált (BI) Kalkulációs lap -terv- tény eltérés: Árbevétel, Költségek, Munkaidő Aktuális / projektvégi várható Költségkategória bontás Taszk bontás (?) Alvállalkozó bontás Projekttag bontás Határidő eltérések Strukturálatlan Kockázatlista Stakeholder kihatás Projektterv kidolgozottság Sikerkritériumok Szerződés kötbér információk Ajánlat-követelmény-teszt eltérés Szemlék eredménye Követelmény kidolgozottság Rendszerterv kidolgozottság Strukturálás

s3-ceg_dw2g01 S3-ceg_dw2g01 kódú projekt Projektprofil Státusz PROJEKT ALAPAATOK: A projekt célkitűzése: Egy új levelezőprogram készítése a vezérigazgató számára A projekt kezdete: 2010. 05.04. A projekt vége: 2011.02.24. KÖLTSÉGEK, RÁFORÍTÁSOK: Költségkalkulációs lap Költségek alakulása: Résztvevők Projektvezető Péter Architekt András Szoftverfejlesztő Szilvia Szoftverfejlesztő Szilárd Projekt előrehaladás Társszervezetek Budapesti Műszaki Egyetem Ügyfelek ABC Kft. EF Zrt. GHI Kft. OKUMENTUMOK: A projekt tervezésére szolgáló dokumentumok A projekthez tartozó szerződés és ajánlat Adminisztrációs dokumentumok: Emlékeztetők Feljegyzések Levelek Státuszriportok Bizonylatok Átadás-átvételi jegyzőkönyvek Időelszámolás Teljesítési igazolások Minőségbiztosítási dokumentumok Ügyféltől kapott dokumentumok Ügyfélnek átadott dokumentumok Egyéb munkaanyagok JELENTÉSEK: Heti jelentések Havi jelentések Kontrolling jelentések HASONLÓ PROJEKTEK: s3-ceg_dw2g02 s3-ceg_dw2g03 s3-ceg_dw2g04 KÉRÉSEK, PROBLÉMÁK: Eszközhiány: 2010.09.12. Szerződésmódosulás: 2010.07.26. Tevékenységek felosztása Projekthez szükséges ismeretek

Cégprofil felület

Strukturálatlan adatokból való értékteremtés

imenzió (ügyfél, projekt, szervezet) Információ szegmens (hír, CV, PI rendszerterv, határozat, kérelem) Szöveg értelmezés Értékteremtés szintjei Parszoló nyelvtan Mondat értelmezés Kivonatkészítés Kézi kategorizálás: metázás Automatikus: szabályok, szótárak Speciális: hangulat Szegmentálás profilozás Tárgyszó Kategória Tezaurusz Adhoc Keresés W töltés Törzsadat kezelés Statisztika TextMining Hírlevél Általános lista Speciális: telefonkönyv, film

Adatmodell BI - csillagséma Strukturálatlan - index Fogalom tár T Invert index oku-tár 5-300 db dimenzió (hosszú rekord) 2-10 db ténytábla (rövid rekord) Ténytábla = 1 millió --- 100millió 1 db dimenzió (500.000 db fogalom) 1 db ténytábla Index tábla = nem Relációs

Adatmodell BI - csillagséma Strukturálatlan - logikai Fogalom (Y/N) Fogalom (Y/N) T oku-tár Fogalom (Y/N) Kategória (Y/N) 5-300 db dimenzió (hosszú rekord) 2-10 db ténytábla (rövid rekord) 500.000 db fogalom 1 db ténytábla Ténytábla = 1 millió --- 100millió

Adatmodell BI - csillagséma Strukturálatlan - mining Tárgyszó T 5-300 db dimenzió (hosszú rekord) 2-10 db ténytábla (rövid rekord) Asszociáció oku-tár Ténytábla = 1 millió --- 100millió

Jövő BI architektúrája W Riport Analízis ETL StructW OLAP Mining Törzsadat ashboard Index TextW Meta??? Kereső felület AVISE mint platform

Mi van kész az Advise-ban? - okumentum-fogalom gyűjtés, tisztítás - Tárgyszó, kategória, osztályzás - Profilozás (prog.) - Törzsadat építés - Törzsadat-> infoszegmens építés - Szövegből strukturált adat kinyerés (prog.) - Szabály-nyelvtan, amivel megtalálható az információ - Mondatértelmezés - Kivonatolás

Szöveges adatok kiaknázása most kezdődik Textmining csak egy részét fedi le az igényeknek. Szöveges adatok kategorizálása, osztályzása, tárgyszavazása megoldott Összefoglaló Nagyon hiányzik egy strukturáló + lekérdező felület. Programozottan már részint megoldjuk Mondat értelmezés hiányzik