A BDF website elemzése SPSS CLEMENTINE WEB MINING segítségével. Zsiros Péter



Hasonló dokumentumok
BDF WEBSITE ELEMZÉSE AZ SPSS CLEMENTINE WEB MINING SEGÍTSÉGÉVEL MINŐSÉGBIZTOSÍTÁS CÉLJÁBÓL

Az egri Eszterházy Károly Főiskola teljes honlapjának vizsgálata. Bóta László Ph.D. hallgató (BME) május 18.

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Projektvezetői döntések támogatása webbányászattal

Mindenki a WEB2-őn? A KutatóCentrum villámkutatása január

1. hét. Neptun kód. Összesen. Név

AZ ELSŐÉVES HALLGATÓK INFORMATIKA TANULÁSI SZOKÁSAINAK VIZSGÁLATA ADATBÁNYÁSZATI ESZKÖZÖKKEL A BUDAPESTI MŰSZAKI FŐISKOLÁN

Médiaajánlat

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Statisztikai szoftverek esszé

GOOGLE ANALITYCS VS. SPSS CLEMENTINE

A Portfolio Csoport internetes látogatottsági felmérése

Az IDB Analyzer használata

ADATBÁNYÁSZATI MÓDSZEREK AZ ELEKTRONIKUS TANULÁSBAN. 9. elearning Fórum

Web-bányászati technikák alkalmazása webhelyek minőségvizsgálatára

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉP SZINT Függvények

MIDRA. A Miskolci Egyetem repozitóriuma. Espán Edina. Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2012, Veszprém

Ha már fizetsz érte, hozzon pénzt! 1023 Budapest, Zsigmond tér 10. Tel: +36 (1) Fax: +36 (1)

ELMŰ ÉMÁSZ Smart Metering Multi Utility pilot projekt bemutatása

2010_Q

I. A változások összefoglalása

Google Analytics. Miért fontos egy kisebb cég esetén is? Hogyan értsük meg a fontos összefüggéseket? Vajda Éva iwebma Analitikus Marketing

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

A COEDU E-LEARNING KERETRENDSZER HASZNÁLATÁNAK ELEMZÉSE

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kutatásmódszertan és prezentációkészítés

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉP SZINT Függvények

Felhasználói kézikönyv

A Dél-Alföldi régió innovációs képessége

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

TERÜLETHASZNÁLAT VS. HUMÁN KOMFORT VÁROSI KÖRNYEZETBEN Egy szegedi mintaterület igénybevétele

novakhunor.hu Médiaajánlat 2017

Adatmanipuláció, transzformáció, szelekció SPSS-ben

Energiafű ellátási logisztika modellezése a Pannon Hőerőmű Zrt-nél

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

LOKÁLIS IONOSZFÉRA MODELLEZÉS ÉS ALKALMAZÁSA A GNSS HELYMEGHATÁROZÁSBAN

Szezonális kiigazítás az NFSZ regisztrált álláskeresők idősorain. Készítette: Multiráció Kft.

Interneten. MinőségDoktorok.hu - fejlessze vállalkozása minőségszemléletét az Interneten az Internettel! Dr.

WEB-BÁNYÁSZATI MÓDSZEREK ALKALMAZÁSA INTERNET-ALAPÚ TANANYAGOK MINŐSÉGVIZSGÁLATÁRA

A BMF TANÁRKÉPZŐ ÉS MÉRNÖKPEDAGÓGIAI KÖZPONT MOODLE VIRTUÁLIS TANULÁSI KÖRNYEZETE HASZNÁLATÁNAK ELEMZÉSE

Idegen nyelvi mérés 2016

Léteznek nagyon jó integrált szoftver termékek a feladatra. Ezek többnyire drágák, és az üzemeltetésük sem túl egyszerű.

Magánpraxis helye a Facebookon

Táblázatkezelés 5. - Függvények

A természetes szövetségesek: urbanisztika és statisztika MUT50 konferencia

Big Data az adattárházban

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

Validálás és bizonytalanságok a modellekben

Az autorizáció részletes leírása

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

A magyarországi feldolgozóipar exportteljesítményének vizsgálata inputoutput táblák és hozzáadottértékmultiplikátorok

Információs technológiák 2. Gy: CSS, JS alapok

Open Access - tájékoztató, dokumentáció szerzőknek és adminisztrátoroknak

Az új portál használatával kapcsolatos általános ismertet

Mire jó a sok képernyő? Megyeri András

A magyar teljesítménytúra-naptár fejlődése,

Elérhetőségek. Dr. Varga Gabriella K.mf.20. Tanszéki honlap:

Bódulat-marketing (az áru a piacon)

Együttmőködés és innováció

AZ ESZTERHÁZY KÁROLY FŐISKOLA HONLAPJÁNAK ELEMZÉSE WEBBÁNYÁSZATI MÓDSZEREK FELHASZNÁLÁSÁVAL

Dr. SISKA MIKLÓS UTAZÁSI SZOKÁSOK VÁLTOZÁSAI. I. Magyar Közlekedési Konferencia - Eger,

Élő online bemutatók a oldalon v1.0

MOL NYRT - WEB ISA 3.0 FELHASZNÁLÓI KÉZIKÖNYV

Webanalitika a mindennapokban

Kosztyán Zsolt Tibor Katona Attila Imre

MODULO ÖSZTÖNDÍJADATOK MEGTEKINTÉSE ÉS ÁTLAGMÓDOSÍTÁSI KÉRVÉNY ÜGYLEÍRÁS V SZTE HSZI július 17.

Felhasználói kézikönyv

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

MULTIMÉDIÁS TANSEGÉDLET A TV2-117A HAJTÓMŰ ÁLTALÁNOS FELÉPÍTÉSÉNEK BEMUTATÁSÁRA A MULTIMÉDIÁS TANSEGÉDLET FELÉPÍTÉSE, BEMUTATÁSA

Félidőben félsiker Részleges eredmények a kutatásalapú kémiatanulás terén

Csavarda mobil áruház

Polarizáló beruházások és változó gazdasági térszerkezet az átmenet Kínájában

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Autoregresszív és mozgóátlag folyamatok

Alapvető tudnivalók a tanév elején

1. gyakorlat. Mesterséges Intelligencia 2.

Statisztikai táblázatok, kimutatások (Pivot) készítése

Képzési beszámoló április

Nemzetközi tanulói képességmérés. szövegértés

Webtárhely létrehozása a helyen. Lépések Teendő 1. Böngészőbe beírni: 2. Jobb oldalon regisztrálni (tárhelyigénylés).

COOKIE (SÜTI) SZABÁLYZAT

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

1/9. Sunell IP kamerák webes felületének használati útmutatója. Élő kép (Live Video)

Adatelemzés az R-ben április 25.

Feladatsor 2012/13 2. félév a Programozási alapismeretek tárgyhoz

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

DHA VÉDELMI RENDSZER EREDMÉNYEINEK STATISZTIKAI VIZSGÁLATA

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

DOKUMENTUMOK TÖMEGES LETÖLTÉSE ÉTDR-BŐL

Képzési beszámoló március

Korrelációs kapcsolatok elemzése

Képzési beszámoló június - július

MOODLE-ALAPÚ TANTÁRGYAT VÉGZŐ HALLGATÓK TANULÁSI SZOKÁSAINAK ELEMZÉSE ADATBÁNYÁSZATI ESZKÖZÖKKEL

WEBOPAC felhasználói leírás. 1. Keresés az adatbázisban. 2. A találatok megjelenítése

Az AdOcean statisztikai mutatóinak magyarázata

2014. február havi képzési tevékenység minőségbiztosítással és elégedettséggel kapcsolatos tapasztalatainak összesítése

MATEMATIKA HETI 5 ÓRA. IDŐPONT: június 8.

OTP ADLAK Adómentes Lakáshitel-támogatási Szolgáltatáscsomag

Átírás:

A BDF website elemzése SPSS CLEMENTINE WEB MINING segítségével Zsiros Péter 1

2

Az elemzés kiindulópontja, célok Google analízis: heti hullámzás (Grujber Zoltán) Log fájlok vizsgálata: külső és belső IP címek web mining után ezek jelölése egy külső mezőben Regisztrált felhasználók nevei ezek jelölése Eseménydefinícióként minden főlapon szereplő hely, részletesebben saját intézetem eseményei+saját honlap Információgyűjtés saját honlapom látogatóiról Igények eltérnek a kereskedelmi célú demostreamektől -> streamépítés Clementine hatékonyságának bemutatása 3

Bemenő adatok, projekt 2006.08.28 és 2007.05.21. közötti logfájlok Az eseménydefinícióknak megfelelő rekordok száma: 2,9 millió Visitek száma: 712 ezer Userek száma: 217 ezer Téli szünetben belső leállás van, de kívülről elérhető a website BDF_figyel projekt, a lényege 6 db stream 4

Általános uservizsgálat Az idők percben értendők! Itt csak azokra a userekre, akiknek egy óránál rövidebb az átlagos sessionidejük. 5

1. Heti periodicitással kapcsolatos vizsgálatok 1.1 A visitek heti periódusú változásában mely típusú látogatók milyen mértékben vesznek részt? 6

1. Heti periodicitással kapcsolatos vizsgálatok 1.2 Szezonális adatok meghatározása 7

1. Heti periodicitással kapcsolatos vizsgálatok 1.3 Simítás mozgóátlagolással, trendfigyelés 8

2. Visitek kezdeteinek, végeinek vizsgálata 2.1 Mi a visitek legelső eseménye? 9

2. Visitek kezdeteinek, végeinek vizsgálata 2.2 Van-e releváns különbség a külső, a belső és a bennfentes visitek kezdetei között? 10

3. Saját portálom vizsgálata 3.1 Azokat a visiteket figyeltem, melyek tartalmaztak a portálomon való kattintást. Az ilyen visitekben kiszámítottam a portálon való kattintások számát és az összes kattintások számát, továbbá ezek arányát, valamint e visitek sessionhosszát. Statisztikai számításokat végeztettem a Clementine-nal, hogy mennyi e statisztikai változók átlaga, szórása, minimuma és maximuma, illetve korrelációt számítottam e változók és a visitek portálon való kattintásainak száma között. 11

3. Saját portálom vizsgálata 3.2 A portálomon való kattintást tartalmazó visitek esetében ábrázoltam a portálon való napi kattintások és az összes napi kattintások számát a dátum függvényében. visitbeli portálon-kattintások száma a visitkezdet időpontja függvényében 12

3. Saját portálom vizsgálata 3.3 A portálomon való kattintást tartalmazó visitek esetében vizsgáltam a portálon való kattintások számát, arányát - aszerint, hogy milyen napszakban történt. 13

3. Saját portálom vizsgálata 3.4a) Visitek Twostep klaszterezése időpont és kattintási mennyiség szerint 3.4b) Kétféle C5.0 döntési fa, cél, hogy egy visitben mennyi kattintás a portálomon. A mennyi kattintás fogalmát is Twostep modellel alakítottam ki. 14

4. Összefoglalás Fő célom az volt, hogy az SPSS Clementine Web Mining adta lehetőségek sokféleségét egy konkrét példán bemutassam. Tapasztalatom és végső következtetésem, hogy a legbonyolultabb websiteokkal kapcsolatos kérdéshez is lehet arra választ adó streamet írni. Ez arra mutat, hogy a Web Mininggal való kutatásokban a kérdések feltevésén lesz a fő hangsúly. Mivel az oktatásban való felhasználási lehetőségeket kutatom, megpróbáltam bemutatni, hogy érdemes elszakadni az elsősorban kereskedelmi célú beépített demostreamektől. A rendszergazdák felé hasznos jelzést adhatok, a napszakokban és hétvégeken való használat, a leglátogatottabb portálok, a visitkezdetek megoszlása a szakember kezében minőségbiztosítási szemmel nézve is hasznos információ. Saját portálom vizsgálata mutatja, milyen felhasználói szokásaik vannak hallgatóimnak. Ez olyan tanulási szokásokra (pl. ZH előtti kampánytanulás, oktatófájlok hirtelen tömeges letöltése) utal, amin talán változtathatnak a szokásaikkal való szembesítés révén. A kutatást a jövőben újabb adatokkal és újabb kérdésekkel is érdekes lesz folytatni. Köszönöm a figyelmet! 15