GOOGLE ANALITYCS VS. SPSS CLEMENTINE



Hasonló dokumentumok
Keresőmarketing ONLINE MARKETING III. ELŐADÁS KOVÁCS ISTVÁN. BME Menedzsment és Vállalatgazdaságtan Tanszék

ADATKEZELÉSI TÁJÉKOZTATÓ

Adatkezelési Tájékoztató

Adatkezelési tájékoztató

ADATKEZELÉSI TÁJÉKOZTATÓ

Általános szerződési feltételek

Az adatok kezelője a Weboldalt üzemeltető Sárvári Gyógyfürdő Kft. ( Adatkezelő ).

Adatkezelési Tájékoztató

Üzletszabályzat. Bevezető rendelkezések. Árak. Módosítva:

9. Entitás modulok. Nagy Gusztáv: Drupal 7 alapismeretek Fejlesztői verzió: október 6.

Adatvédelmi szabályzat nyereményjátékok és promóciók

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

Adatkezelési Tájékoztató

Adatvédelmi nyilatkozat

AZ ÜLJÜNKBE.HU ADATKEZELÉSI TÁJÉKOZTATÓJA az adatvédelem és adatkezelés elveiről, gyakorlatáról

Nemzeti Alaptanterv Informatika műveltségterület Munkaanyag március

A Szolgáltatás felhasználóira vonatkozó adatok az Üzemeltető bérelt tárhelyeinek szerverein kerülnek tárolásra.

HelpyNet kézikönyv LAKOSSÁGI FELHASZNÁLÓKNAK

Nemzeti Fejlesztési és Gazdasági Minisztérium támogatásával megvalósuló KKC-2008-V számú projekt B2CR ONLINE KOMMUNIKÁCIÓ

Gyorstippek a Webgalamb 4 szoftverhez

Adatkezelési és Adatvédelmi Szabályzat

14 A PROJEKT HONLAPJA A létrehozott rendszer bemutatása

Adatkezelési tájékoztató

BASIC és PRO webáruház csomagok

Adatkezelési tájékoztató

A BMF TANÁRKÉPZŐ ÉS MÉRNÖKPEDAGÓGIAI KÖZPONT MOODLE VIRTUÁLIS TANULÁSI KÖRNYEZETE HASZNÁLATÁNAK ELEMZÉSE

ADATVÉDELMI TÁJÉKOZTATÓ. hatályos: napjától. 4. Személyes adatok, adatkezelés célja, jogalapja, időbeli terjedelme

Az irányelv-alapú elemzés, valamint az ön- és társértékelés módszereinek alkalmazása az informatikus képzésben

Csoport neve: Kisiskolások Feladat sorszáma: 2. Feladat címe: Oktatási intézmény honlapja, oktatási naplóval. E-Project.

ÁLTALÁNOS SZERZÕDÉSI FELTÉTELEK

!!" KÉSZÍTK: ERDÉLYI LAJOS KOLLÁR NÁNDOR WD6OGW BUK8Y7

Budai Attila. Webalapú multimédiás interaktív oktatóprogramok

BALLA és TÁRSA Kereskedelmi és Szolgáltató Korlátolt Felelősségű Társaság

Adatkezelési Tájékoztató

Internet-hőmérő alapkészlet

A Személyes adatok tárolásának módja, az Adatkezelés biztonsága

Kedves Vásárlónk! Általános szerződési, vásárlási és szállítási feltételek. Adatkezelés.

ECP. Site Administration System. Felhasználói kézikönyv. v (1. kiadás a és újabb verziójú ECP SAS rendszerekhez)

Web-bányászati technikák alkalmazása webhelyek minőségvizsgálatára

Adatvédelmi nyilatkozat

AquaZ Natura Kft. Általános Szerződési Feltételek

I. Az internet alapjai

Az Egálnet Honlapvarázsló használati útmutatója

PANAROM ONLINE ÁRUHÁZ ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK (ÁSZF) Hatályba lép:

UNILEVER ADATVÉDELMI ELVEK ADATVÉDELMI NYILATKOZAT

11. Tétel. A színválasztásnak több módszere van:

Adatkezelési Szabályzat

Moodle tanulói kézikönyv

Adatkezelési tájékoztató

Hallgatói motivációs vizsgálat

Adatkezelési tájékoztató

Tájékoztató és szabályzat a sütik alkalmazásáról. (Tájékoztató letöltése ITT)

HomeManager - leírás. advix software solutions.

8. Hálózatbiztonsági alapok. CCNA Discovery 1 8. fejezet Hálózatbiztonsági alapok

Adatkezelési Szabályzat

ADATKEZELÉSI SZABÁLYZAT

MARION CARAMELLE Kft. H-1055 Budapest, Szt István krt. 15. I május 8. ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK

Adatkezelési Tájékoztató

ADATVÉDELMI NYILATKOZAT. A Viky Kft. által üzemeltetett honlapokhoz. Érvényes az alábbi oldalakon:

BDF WEBSITE ELEMZÉSE AZ SPSS CLEMENTINE WEB MINING SEGÍTSÉGÉVEL MINŐSÉGBIZTOSÍTÁS CÉLJÁBÓL

Általános Szerződési és Felhasználási Feltételek startuzlet.hu

11. Balra zárt igazítás A bekezdés sorai a bal oldali margóhoz igazodnak. 12. Beillesztés

Általános Szerződési és Felhasználási feltételek

Preambulum WORLD TOURS Idegenforgalmi és Szolgáltató Kft. II. Értelmező rendelkezések

ADATKEZELÉSI TÁJÉKOZTATÓ Személyes adatot csak a törvénynek megfelelően gyűjtünk és kezelünk.

printerfair.hu Adatkezelési Tájékoztató 2016 Adatkezelési tájékoztató

Tárgyszavak: mobilmarketing; marketingkampány; reklámüzenet; fogyasztói szokások; internet; SMS; MMS.

NETFIT modul Tanári felület Felhasználói útmutató. Magyar Diáksport Szövetség

ÁLTALÁNOS SZERZŐDÉSI ÉS FELHASZNÁLÁSI FELTÉTELEK

Nagy Bor Teszt Adatkezelési nyilatkozat

ATM hálózatra épülő Interaktív Televízió Szolgáltatás

Általános szerződési feltételek

Adatkezelési tájékoztató

Az egri Eszterházy Károly Főiskola teljes honlapjának vizsgálata. Bóta László Ph.D. hallgató (BME) május 18.

ADATKEZELÉSI SZABÁLYZAT

Adatkezelés: Adatkezelési tájékoztató:

A HBONE projekt. Martos Balázs MTA-SZTAKI/ASZI

1. Az Általános Szerződési Feltételek célja

Egy iskola honlapjának tervezése, kivitelezése

Adatkezelési tájékoztató

Adatkezelési Tájékoztató

On-line értékelési módszerek II. Lengyelné Molnár Tünde

IV. Szakmai szolgáltatások funkcionális tervezése

Az Orbis adatbáziskezelő

A digitális kompetencia értelmezésének európai keretrendszere

Adatkezelési tájékoztató

Adatkezelési Tájékoztató

Adatkezelési és adatvédelmi szabályzat

Adatkezelési tájékoztató

Bevezetés és alapfogalmak

Virtuális szemináriumok

Minden egyéb megrendeléssel és kedvezménnyel kapcsolatos problémával, kérjük forduljon gyermeke oktatási intézményéhez.

PC World január Honfoglalás az interneten Ingyenes szolgáltatások Készítette: Móricz Attila

I. Az üzemeltető adatai: Név. Ametiszt 92 Bt. Székhely: 1134 Budapest Kassák L. u.61. Adószám: Cégjegyzékszám:

ÉRTÉKELÉS a villamosipari engedélyesekhez beérkezett fogyasztói reklamációk és panaszok alakulásáról 2004

SZÁMÍTÓGÉPES SZIMULÁCIÓ LEHETŐSÉGEI

Projektvezetői döntések támogatása webbányászattal

Felhasználói kézikönyv

Kiknek szól ez a könyv? Miről szól a könyv? Hogyan épül fel a könyv? Mire van szükség a könyv használatához? Szokások Forráskód Hibajegyzék

Adatkezelési tájékoztató

Átírás:

GOOGLE ANALITYCS VS. SPSS CLEMENTINE Grujber Zoltán Berzsenyi Dániel Főiskola 9700 Szombathely, Károlyi Gáspár tér 4. gzoltan@bdf.hu Absztrakt: A Google Analitycs egy ingyenesen hozzáférhető, meglehetősen okos és látványos webhelylátogatottság elemző alkalmazás. Az alkalmazásának lehetőségein túl szeretném a rendszer szolgáltatásait szembeállítani a Clementine WebMining képességeivel, összehasonlítani a két rendszer tudását, korlátaikat feszegetni. 1. Bevezető A Google Analitycs [1] rendszere ingyenes regisztrációval hozzáférhető. Legnagyobb korlátja a használatának, hogy maximum 5 millió oldalletöltést kezel le havonta. Bár a legtöbb weblapot üzemeltető cég örülne ekkora látogatottságnak. Ennél nagyobb látogatottságú weblapok használatának elemzésére már komolyabb elemző eszközt kell használni, például a Clementine-t [3]. Az alábbi fejezetekben a két eszköz képességeit állítanám szembe egymással, konkrét felhasználási célok figyelembevételével. 2. Adatgyűjtés A látogatás naplózása A Google rendszerének az alapja, hogy minden egyes olyan weboldal forrásába be kell ágyazni egy kis kódrészletet, amelynek a látogatásait naplózni szeretnénk. Emellett támogatja a weboldalon történő egyéb események naplózásait is, például: egy elem kiválasztása egy listából. A technológiai háttérben a JavaScript programozási nyelv alkalmazása áll. A Clementine WebMining az elemzést a weblapot kiszolgáló webszerver napló állományára építi. Többféle formátum szerint is naplózhat a webszerver. A legáltalánosabb ajánlás a W3C konzorcium által kidolgozott. A legtöbb webszerveren konfigurálható, hogy a naplózás milyen mélységű legyen. [1] A Google rendszerének előnyei és hátrányai: Olyan adatokat is szolgáltathat a JavaScript, amelyeket a webszerver nem naplóz, például: képernyőfelbontás, nyelvi beállítás, stb. Weboldalon belüli események rögzítése Nem működik, ha a böngészőben tiltott a JavaScript futtatása, a cookie-k használata, és a képek megjelenítése Nagyon kényelmetlen és sok munka lehet a webhely minden egyes oldalába beépíteni a forráskód részletet A Clementine WebMining előnyei és hátrányai: Nem kell az oldalak forráskódját módosítani, csak be kell kapcsolni a webszerveren a naplózást 23

Grujber Zoltán Google Analitycs vs. SPSS Clementine 2.1. A két rendszer eredményei között mérési különbségek adódhatnak Az látogatottsági elemzések egyik fontos sarokköve a látogatók azonosítása. Ennek két alapvető módszere elterjedt. A süti alapú, vagy az IP + User Agent alapú azonosítás. A Google az internetező számítógépre elhelyezett egyedi sütivel (cookie) azonosítja a visszatérő látogatókat. A Clementine WebMining pedig a naplóállomány alapján az internetező számítógépének IP címe és a naplóban szereplő User Agent bejegyzés alapján. Ez a második fajta módszer nagyobb találatai számot produkál általában a dinamikus IP-cím kiosztás miatt, valamit a keresőrobotok találatai miatt is. További eltérést jelenthet a cach technika megléte. A Google megoldása a JavaScript rutinon keresztül direktben készít naplóbejegyzést. Míg ha a böngésző a saját cache-éből szolgálja ki ismét az oldalt, a webszerver naplóállományában nem jön létre újabb bejegyzés. 2.2. Külső hivatkozások használata A weblapon lévő külső hivatkozásokra kattintva azok is generálnak naplóbejegyzést, csakhogy azok a hivatkozott oldalt kiszolgáló szerveren keletkeznek, amelyekhez valószínűleg nem férhetünk hozzá. Általában elmondható, hogy a webszerver által rögzített naplóból nem kapunk arra vonatkozó információt, hogy mikor és hányszor kattintnak külső hivatkozásokra. A Google Analitycs nyújt megoldást erre a problémára is. Pusztán csak módosítani kell a forrásban a linkre vonatkozó részt. 3. Az adatok tisztítása, szűrése 1. ábra Külső hivatkozások lekövetése a Google Analitycs-ben A naplóállományok a legtöbb esetben rengeteg olyan bejegyzést tartalmazhatnak, amely az elemzések szempontjából felesleges. Például, a webszerver naplóállományába bejegyzés kerül a letöltött weboldalakon túl a weboldalakat felépítő stílus, kép és script állományokról is. Ez azt jelenti, hogy egy kattintás akár nagyon sok felesleges naplóbejegyzést is generálhat. Az adatok kiszűrése, tisztítása elengedhetetlen a tényleges elemzés megkezdése előtt. A Google Analitycs alkalmazása esetén valójában csak azokról az oldalakról és eseményekről készül naplóbejegyzés, amelyek forrásába a naplózást végző kódrészletet elhelyeztük. Így úgymond eleve tiszta adatokat rögzítünk csak. Továbbá a program lehetővé teszi külön szűrők definiálását is, melyekkel az elemzésben résztvevő adatok körét szűkíthetjük, vagy akár transzformációkat is végezhetünk az adatokon. 24

2. ábra Szűrő hozzáadása a Google Analitycs-ben A Clementine WebMining az adatok tisztítását és szűrését a WebMining Node beállításai közül az EventDeffinition fájl megadásával teszi lehetővé. Ebben a fájlban részletesen megadhatjuk, hogy mely mappákra vagy fájlok bejegyzéseit szeretnénk figyelembe venni, különbségeket tehetünk a GET módszerrel átadott paraméterek között, szabadon elnevezett kategóriákba és eseményekbe csoportosíthatjuk a napló bejegyzéseit. Összességében elmondhatjuk, hogy nagyon rugalmasan testre szabható lehetőségről van szó, mely szinte minden igényt kielégíthet, bár hatékony alkalmazásához elengedhetetlen a webhely szerkezetének és működésének részletes ismerete. 4. Általános statisztikák 3. ábra Egy példa részlet az Clementine WebMining Node EventDeffinition fájlból Természetesen a mindkét rendszerben megtalálhatók a leggyakrabban hivatkozott statisztikák, elemzések, melyek a látogatások gyakoriságára, hosszára, eloszlására, hálózati és platform specifikus jellemzőkre, webhely tartalomra, belépési, kilépési, és bejárási utakra, stb. vonatkoznak. Mindkét rendszer támogatja az elemzés tárgyát képező időszak megadását, módosítását. Az eredményeket lementhetjük külön fájlként, de megtekinthetjük akár grafikonok, diagramok formájában is. Amit kiemelnék, mint előnyét a Google Analitycs rendszernek az a következő néhány hasznos funkció: 25

Grujber Zoltán Google Analitycs vs. SPSS Clementine A nagyon kényelmes időintervallum állítás, valamint az, hogy közvetlen módon két tetszőleges időintervallum is összehasonlítható. A Map Overlay funkció, amely földrajzi térképen ábrázolva mutatja a látogatók elhelyezkedését. Languages menüpont, amely nyelvi környezetek szerint csoportosítja a látogatásokat. Connection Speeds menüpont, a látogatók sávszélessége alapján történő megoszlás. Trafic Sources menüpont, mely alatt az oldalunk elérésének módjairól kapunk részletes adatokat. Direkt elérés vagy keresőprogramokból történő elérés, ha kereső program, akkor milyen kulcsszavakra kerestek, stb. Szegmentálási lehetőség: bármely lekért statisztika részadatait tovább bonthatjuk egy tetszőlegesen megadott szempont szerint. Például a szombathely.hu-ról érkező látogatókat további csoportokra bonthatjuk a használt böngészőprogram szerint. A Clementine WebMining beépített streamjei noha talán kicsit több tanulást és szakértelmet kívánnak, rendelkeznek azzal a nagy előnnyel, hogy átalakíthatók és bővíthetők igény szerint. A két rendszer közti különbségek forrása alapvetően a rendelkezésre álló adatok másságából ered. Például: a webszerver ugyan naplózhatja a látogatók IP címeit, de ha nincs ismeretünk az IP címosztályok földrajzi elhelyezkedéséről, vagy az IP címekhez rendelt domain nevekről akkor abból földrajzi elhelyezkedést számolni nagyon nehéz. Ha a webhelyünk, vagy annak csak egy része felhasználói hitelesítés után érhető csak el, akkor a webszerver naplóállományaiból a Clementine WebMining képes visszakövetni a kattintást végző felhasználó azonosítóját. Ez lehetőséget ad arra, hogy további a felhasználóra vonatkozó adatokat vonjunk be az elemzésekbe. Felhasználóinkról számos előismeretünk lehet, akár a regisztrációkor megadott demográfiai adatok formájában, de rendelkezésünkre állhat természetesen a felhasználó eddigi ténykedésével kapcsolatos adathalmaz is. Milyen sűrűn látogatja oldalainkat, mit vásárolt eddig, milyen hozzászólásokat írt, stb. Ezen adatoknak az elemzésbe történő bevonására a Google rendszere alkalmatlan, míg az SPSS rendszerének használata esetén csak itt kezd igazán izgalmassá válni az adatbányászat. 5. Összetettebb elemzések Ide azokat az elemzéseket sorolnám, amelyek túlmutatnak a sima oldalletöltések különböző paramétereinek statisztikai elemzésén. Például olyan kérdések merülhetnek fel, hogy milyen a látogatók lojalitása, vagy miért és hol szakad meg egy a látogatóktól elvárt megtérés, cél. Például ilyen cél lehet, hogy a web áruházban történő tallózás után tényleges vásárlás is történjen. A Google Analitycs-ben is találunk olyan szolgáltatást, amely ezekre a kérdésekre próbál fényt deríteni, de közel sem olyan szinten paraméterezhetőt és sokoldalút, mint amit az SPSS rendszere nyújt. A WebMining beépített streamjei nagyon gazdag tárházát kínálják ezen típusú szolgáltatásoknak. 26

Összefoglaló Összességében láthatjuk, hogy a Google megoldása nagyon kényelmes, felhasználóbarát és látványos, valamint a beépített eszközei jól megtervezettek és valóban hasznosak. Legnagyobb hátránya is pont ez. Tehát arra jó, amit tud, és nem többre. Ha olyan statisztikára van szükségünk, amely nem szerepel a beépített lehetőségeiben, akkor használhatatlan. A weblapok látogatottságának elemzése során a leghasznosabbak és legfontosabbak pont az olyan statisztikák lehetnek, amelyek speciálisak, függnek a webhely felépítésétől, valamint a szolgáltatásaitól. A Google Analitycs általános statisztikáin túl egyéni igényeket kiszolgáló statisztikák nem kérdezhetők le. Ezek elkészítését viszont nagyszerűen meg lehet oldani a Clementine alkalmazásával. Végső soron a Clementine-ra azoknak van szüksége, akiknél a lapletöltések száma meghaladja a Google Analitycs beépített korlátját, vagy egyéni igényeket kiszolgáló statisztikákra van szükségük, és erre tudnak áldozni időt, pénzt, és szakértelmet. Irodalomjegyzék [1] Google Analitycs: http://www.google.com/analytics/ [2] W3C - Extended Log File Format: http://www.w3.org/tr/wd-logfile.html [3] SPSS Webminig for Clementine: http://www.spss.com/web_mining_for_clementine/ 27