NETWORKSHOP 2008 2008. március 17-19. Dunaújváros, Dunaújvárosi Főiskola Projektvezetői döntések támogatása webbányászattal Bóta László Ph.D. hallgató (BME) Eszterházy Károly Főiskola, Eger
BI (Business Intelligence) Eklektika, a tudásportál
Üzleti intelligencia vállalati adatgyűjtő-, tároló-, elemző eljárások és alkalmazások együttese elemei: vállalati- és vezetői információs rendszerek, döntéstámogató rendszerek, adatbányászat, adatmegjelenítés, geográfiai információs rendszerek stb.
Adatbányászat 1990 után intelligens műveletsor cél: adatminták kiemelése, azaz a tudásfeltárás alapja: jelentős adatmennyiség adatbányászati feladatok két osztálya leíró: az adatok általános jellemzőinek feltárása előrejelző: meglévő adatokból prognosztizál
Projektvezetői döntések támogatása adatbányászat részterületei lehetnek hasznosak egy projektnél: webbányászat (web mining) a vizsgálatok a teljes populáción történnek szövegbányászat (text mining)
Webbányászat webtartalom-bányászat (web content mining), kommunikációs stratégia kidolgozása piackutatás webstruktúra-bányászat (web structure mining) webhasználat-bányászat (web usage mining) a fogyasztók szokásainak, magatartásmintáinak tanulmányozása
Webhasználat-bányászat webnapló bányászat webnapló-bejegyzés mezői: a kérés kiindulási helyének IP címe a kérés pontos ideje a kért URL cím még néhány adat 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /index.php HTTP/1.1" 200 70 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /stilus.css HTTP/1.1" 200 4160 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /index_ektf.php HTTP/1.1" 200 26021 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /images/logo_tel.gif HTTP/1.1" 200 12959 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /images/neptun.gif HTTP/1.1" 200 1335 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /hir/zongora.jpg HTTP/1.1" 200 10581 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /kultura/szinhaz.jpg HTTP/1.1" 200 7042 89.133.22.59 - -[11/Mar/2007:07:07:53 +0100] "GET /hir/otdk.gif HTTP/1.1" 200 4779
A feldolgozás iteratív folyamata előfeldolgozás, módszerei: adattisztítás tömörítés transzformálás elemzés, módszerei: statisztikai mutatók tanuló algoritmusok (döntési fa, klaszteranalízis stb. ) az adatok prezentálása táblázat, diagram
Mit érhet el vele a projektvető? a fogyasztók individualizált, online kiszolgálásának tökéletesítése ugyanis a felhasználó elvárása: egyszerű weboldal a perszonalizáció lehető legmagasabb fokán a fogyasztó nagyon kevés mentális erőfeszítést szeretne kifejteni a weboldalon
Piacvezető szoftverek lap-középpontú, és felhasználó-középpontú filozófia SPSS Clementine program + WebMining CAT webbányászati modul CAT (Clementine Application Template) használják: OTP Bank TÁRKI DATA RESEARCH Millward Brown (piackutató) T-Mobile Bi Consulting SAS Enterprise Miner program + webbányászati modul
Clementine - felhasználói felület Eklektika, a tudásportál
WebMining CAT modul streamjei A látogatók leggyakoribb aktivitási sorozatainak azonosítása Activity Sequence Analysis (Most Common Activity Sequences, Eventstream Visualisation) A látogatások és a látogatók szegmentációja Visit and User Segmentation (E-ChannelUser RFM Classifications, User Mode Determination, Visit Branding) Advanced User Segmentation A látogatók viselkedésének elemzése Web Site Activity and User Behavior (Visit Activity Variances, Identifying Undesirable Behavior, Lifetime Conversion Tracking, Points of Abandonment, User Activity Focus, Visit Activity Funnels, Navigational Usage) A látogatók döntési hajlamának meghatározása tanuló algoritmusok segítségével Propensity Analysis
Eklektika tudásportál és a webbányászat minőségi követelmények szoftver-ergonómia valós és látens látogatói igények perszonalizált kielégítése a fejlesztés elősegítése mi érdekli a látogatókat
Hátrányok költségek non-profit szervezetek számára elérhető web 2.0 kapcsán megjelenő ingyenes alkalmazások hosszú betanulási idő