ADATBÁNYÁSZATI MÓDSZEREK AZ ELEKTRONIKUS TANULÁSBAN. 9. elearning Fórum

Hasonló dokumentumok

Web-bányászati technikák alkalmazása webhelyek minőségvizsgálatára

WEB-BÁNYÁSZATI MÓDSZEREK ALKALMAZÁSA INTERNET-ALAPÚ TANANYAGOK MINŐSÉGVIZSGÁLATÁRA

Projektvezetői döntések támogatása webbányászattal

Elektronikus oktatástámogató rendszer bevezetésének tapasztalatai. Jókai Erika Vig Zoltán

Az egri Eszterházy Károly Főiskola teljes honlapjának vizsgálata. Bóta László Ph.D. hallgató (BME) május 18.

A COEDU E-LEARNING KERETRENDSZER HASZNÁLATÁNAK ELEMZÉSE

Honlapok használhatóságának ergonómiai szempontjai

A BDF website elemzése SPSS CLEMENTINE WEB MINING segítségével. Zsiros Péter

TÁVOKTATÁSOS HALLGATÓK LMS HASZNÁLATÁNAK ELEMZÉSE. Nyéki Lajos Széchenyi István Egyetem. Összefoglaló

AZ ESZTERHÁZY KÁROLY FŐISKOLA HONLAPJÁNAK ELEMZÉSE WEBBÁNYÁSZATI MÓDSZEREK FELHASZNÁLÁSÁVAL

GOOGLE ANALITYCS VS. SPSS CLEMENTINE

Virtuális tanulási környezet minőségvizsgálata web-bányászati módszerekkel

BDF WEBSITE ELEMZÉSE AZ SPSS CLEMENTINE WEB MINING SEGÍTSÉGÉVEL MINŐSÉGBIZTOSÍTÁS CÉLJÁBÓL

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

PROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL

Adatbányászati módszerek alkalmazása virtuális kurzusok minőségvizsgálatára

Microsoft SQL Server telepítése

Új módszerek és eszközök infokommunikációs hálózatok forgalmának vizsgálatához

MOODLE-ALAPÚ TANTÁRGYAT VÉGZŐ HALLGATÓK TANULÁSI SZOKÁSAINAK ELEMZÉSE ADATBÁNYÁSZATI ESZKÖZÖKKEL

Az elektronikus tanulási környezet pedagógiai kérdéseivel foglalkozó kutatási eredményeink

Az elektronikus tanulás

Webanalitika a mindennapokban

A BMF TANÁRKÉPZŐ ÉS MÉRNÖKPEDAGÓGIAI KÖZPONT MOODLE VIRTUÁLIS TANULÁSI KÖRNYEZETE HASZNÁLATÁNAK ELEMZÉSE

Szolgáltatás mérés/riportolás magas fokon Egy valós megoldás Pepsi berkekben

DIGITAL CONNECTED CONSUMER 2012 MADHOUSE-GfK HUNGÁRIA szeptember

TÁVOKTATÁSI KÉPZÉS ELEMZÉSE ADATBÁNYÁSZATI MÓDSZEREK ALKALMAZÁSÁVAL

A webanalitika változó világa 4 felvonásban

COOKIE KEZELÉSI TÁJÉKOZTATÓ. A HTTP-cookie (köznyelvben csak cookie, vagy süti) egy olyan fájl, (egy adatsor)

Big Data az adattárházban

OKTATÁSI ADATBÁNYÁSZAT

Indikátorok projekt modellhelyszínein. Domokos Tamás szeptember 13.

Minőségkritériumok az elearning oktatásban

Hova tart a cross platform mérés?

Kvalitatív elemzésen alapuló reakciómechanizmus meghatározás

Új utak az értékesítésben avagy mikor váltja be az online értékesítés a hozzá fűzött reményeket?

Használati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban

ELTE, IK, Információs Rendszerek Tanszék

Tipikus konverziós utak - Banki esettanulmány. Media Hungary, május 10. Dunai Zsolt, CIB Bank

Marketing Megfeleljen a vásárlók igényeinek nyereséges módon

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

"A felelős egyetem módszertani aspektusai" Április 21. Budapest, MellearN konferencia

Webapp (in)security. Gyakori hibákról és azok kivédéséről fejlesztőknek és üzemeltetőknek egyaránt. Veres-Szentkirályi András

VEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL AZ INTÉZMÉNY HONLAPVÁLTÁSÁNAK TÜKRÉBEN. Bóta László Eszterházy Károly Főiskola.

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

TANTÁRGYI ÚTMUTATÓ. Szolgáltatás menedzsment. tanulmányokhoz

HÁLÓZATI BEÁLLÍTÁS. Videorögzítőkhöz

MOODLE mobileszközön

Beszerzési és elosztási logisztika. Előadó: Telek Péter egy. adj. 2008/09. tanév I. félév GT5SZV

Mobil Telefonon Keresztüli Felügyelet Felhasználói Kézikönyv

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

ADATVÉDELMI TÁJÉKOZTATÓ

INTEGRÁLT ELEKTRONIKUS TANULÁSI KÖRNYEZET MINŐSÉGVIZSGÁLATA WEB-BÁNYÁSZATI MÓDSZEREKKEL

Integrált Video Kommunikációs Rendszer

A Java EE 5 plattform

Multimédia anyagok szerkesztése kurzus hatékonyságnövelése web alapú projekt módszer alkalmazásával

Technológia és Marketing összefüggése napjainkban. Technológiai eszközök a felhasználói viselkedéskutatás és a mobil marketing szolgálatában

A SEO szerepe egy híroldal életében BUBLIK MÁTÉ

A tér, ami megtérül...

Hogyan lehet a nappali tagozatos hallgatókat éjjel is tanítani?

AZ ELMÚLT HÁROM ÉV TAPASZTALATAI A DUÁLIS KÉPZÉS KIALAKÍTÁSA SORÁN

MINŐSÉGBIZTOSÍTÁS ÉS E- LEARNING. Jelli János Apor Vilmos Katolikus Főiskola

felhasználásra kerül(het)nek online tranzakciók igénybevételekor, vagy

TÁJÉKOZTATÓ PSIDIUM AKKREDITÁCIÓS KÉPZÉS PSIDIUM RENDSZERISMERETI KÉPZÉS DÖNTÉSTÁMOGATÓ MÓDSZEREK A HUMÁNERŐFORRÁS MENEDZSMENTBEN

Hallgatói tájékoztató

Ha már fizetsz érte, hozzon pénzt! 1023 Budapest, Zsigmond tér 10. Tel: +36 (1) Fax: +36 (1)

Fogalomtár Etikus hackelés tárgyban Azonosító: S2_Fogalomtar_v1 Silent Signal Kft. Web:

Az újmédia alkalmazásának lehetőségei a tanulás-tanítás különböző színterein - osztálytermi interakciók

API tervezése mobil környezetbe. gyakorlat

IKT a tudás és tanulás világában:

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

A mobilhirdetések szerepe a marketing mixben

Változó vásárlói szokások nyomon követése 2016 Szeptember SAP Forum. Komjáthy Csaba

Vajda Éva. Bevezetés a keresőmarketingbe

TUDNIVALÓK A WEB-FEJLESZTÉS I. KURZUSRÓL

A 365 Solutions Kft. büszke a teljesítményére, az elért sikereire és a munkatársai képességeire. Kamatoztassa ön is a tapasztalatainkat és a

ADATBÁNYÁSZATI MÓDSZEREK ALKALMAZÁSA A TANULÁSI TEVÉKENYSÉG VIZSGÁLATÁBAN

az MTA SZTAKI elearning osztályának adaptív tartalom megoldása Fazekas László Dr. Simonics István Wagner Balázs

Felhasználói dokumentáció a teljesítményadó állományok letöltéséhez v1.0

Az internet az egész világot behálózó számítógép-hálózat.

InCites bemutató. Tóth Szász Enikő Solution Specialist

A számítástechnika gyakorlata WIN 2000 I. Szerver, ügyfél Protokoll NT domain, Peer to Peer Internet o WWW oftp opop3, SMTP. Webmail (levelező)

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

Adatkezelési nyilatkozat

Teljesítménymodellezés

A jelenlegi és az új szolgáltatás moduljai. Web. Web. Play button. Mobil+app

NYME - SEK Némethné Tóth Ágnes

Informatika 9Ny. Az informatikai eszközök használata

1. gyakorlat. Mesterséges Intelligencia 2.

SACColni pedig kell Szolgáltatás tudatos kontroll és számlázás Service Aware Control and Charging

A mobil nyelvtanár megvalósításának folyamata

OKTATÁSTECHNOLÓGIÁK AZ ÉLETHOSSZIG TARTÓ TANULÁSBAN

EREDMÉNYES DIGITÁLIS MEGOLDÁSOK, MEGALKUVÁSOK NÉLKÜL. Infinety Médiaajánlat

Statisztika oktatása és alkalmazása a mérnöki területen

Marketing Trükkök Szeptember

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

A Népszámlálás infokommunikációs háttere (Miért érdekes a Népszámlálás?) Kópházi József Központi Statisztikai Hivatal

Hálózati szolgáltatások biztosításának felügyeleti elemei

Marketing szolgáltatás tájékoztató

Hogyan lesz adatbányából aranybánya?

Átírás:

ADATBÁNYÁSZATI MÓDSZEREK AZ ELEKTRONIKUS TANULÁSBAN (A minőségbiztosítás új lehetőségei) Izsó Lajos 9. elearning Fórum 2008. június 4. 1

Az előadás vázlata Az adatbányászat (datamining) - és a webbányászat (webmining) - meghatározása A web-bányászat filozófiája a Clementine-ban A WebMining CAT használata A webhelyek minősége Az oktatási webhelyek minősége (példákkal) A módszer alkalmazásának jelenlegi korlátai 2

A web-bányászat bányászat meghatározása Az adatbányászat meghatározása: nagy adatbázisokban rejlő, korábban nem ismert mintázatok, információk felismerése és kinyerése, legtöbbször tanuló algoritmusok segítségével. A web-bányászat az adatbányászatnak az üzleti szférában kidolgozott alkalmazása az interneten vagy adott intraneteken található adatok elemzésére. További tájékoztató anyagok találhatók a Kutatócsoport webhelyén: http:///webmining/ 3

A web-bányászat bányászat meghatározása A web- bányászat területei Web Web Mining Web Web Structure Structure Mining Mining Web Web Usage Usage Mining Mining Web Web Content Content Mining Mining The taxonomy of web mining A felhasználó és az adott webhely interakciójának a jellegzetes mintázatait, szekvenciáit, kapcsolatait és összefüggéseit azonosítja. A továbbiakban ebben az értelemben használjuk a web-bányászat fogalmát. 4

A web-bányászat bányászat filozófiája a Clementine-ban A webhelyek (site-ok) forgalmának hagyományos, lap-középpontú kvantitatív mérése abban állt, hogy valamilyen Web stats programcsomag segítségével olyan standard jelentéseket készíttettek, illetve metrikákat számoltak, mint pl. 50 Most popular Pages (az első 50 legtöbbet látogatott lap), Visits Over Time (az egyes lapok kérésének óránkénti, napi vagy heti száma). Bár ezek az egyszerű leszámlálással kapható jellemzők is fontosak lehetnek, a tapasztalat szerint általában nagyon nehéz a hasznosításuk. 5

A web-bányászat bányászat filozófiája a Clementine-ban A korábbi lap-középpontú megközelítés helyett a Clementine radikálisan új, felhasználó-középpontú elemzési filozófiát dolgozott ki. A kettő közötti különbség, bár igen finom, mégis nagyon jelentős. 6

A web-bányászat bányászat filozófiája a Clementine-ban A két megközelítés közötti különbség lényege a következő. Ha egy felhasználó a másnapi időjárásról kíván tájékozódna, akkor nem így gondolkodik: Felmegyek a kezdőlapra, onnan pedig az időjárás-lapra, hanem így: Felmegyek a CNN-re és megnézem a várható időjárást. 7

A web-bányászat bányászat filozófiája a Clementine-ban Ha valaki a barátjának egy általa éppen olvasott könyvről beszél, nem arról szól, hogy mi van az egyes lapokon, hanem a történet egészéről, összefüggéseiről. A lap fogalma mindkét esetben pusztán technikai, a felhasználótól valójában idegen. Ha meg akarjuk érteni, hogy a felhasználók számára az adott site hogyan jelenik meg, akkor nem egyes lapokban kell gondolkodnunk, hanem tényleges céljaikat és tevékenységüket kell elemezni. 8

A web-bányászat bányászat filozófiája a Clementine-ban Az régóta ismert, hogy a weblog (naplófájl) adatok elvben igen gazdag információ-források a felhasználók tevékenységére vonatkozóan. A problémát sohasem az adatok hiánya okozta, hanem az analízis eszközének a megfelelő megválasztása: az egyszerű (pl. leszámlálással kapható) statisztikai jellemzők csupán a felszínt jelentik, a lényeg mélyen el van temetve a nagy mennyiségű és igen technikai természetű adatban. A lényeget tehát ki kell bányászni web-bányászat 9

A web-bányászat bányászat filozófiája a Clementine-ban A CAT (Clementine Application Templat) megközelítés lényege: az elemző kezébe adnak egy részletesen kidolgozott példa stream-ekből álló gyűjteményt, amelyek az elemző konkrét igényeihez könnyen adaptálhatóak. Az elemzésnek a logfájl adatoktól független fontos támpontja az, hogy az elemző jól ismeri a site rendeltetését, tartalmát, szerkezetét, tipikus látogatóit és saját felhasználói tapasztalatokkal is rendelkezik. 10

A web-bányászat bányászat filozófiája a Clementine-ban A WebMining CAT jellegzetessége, hogy az annak központi eleméül szolgáló Web Mining node a logfájl adatokból egy igen jól elemezhető adatállományt állít elő, amely a további kifinomult elemzések alapja. A WebMining stream-ek többsége minimális módosítások (pl. fájl-nevek, elérési útvonalak aktualizálása, logfájl formátumok kiválasztása, események definiálása) után saját adatainkkal futtatható. 11

A WebMining CAT használata A honlapok üzemeltetőjének a szerverén általában ún. logfájlok formájában automatikusan gyűlnek a forgalomra jellemző következő adatok: a kérelmet intéző távoli gép neve vagy IP címe a látogató bejelentkezési neve a távoli gépen és a kiszolgáló szerveren a kiszolgálás befejezésének dátuma (+időeltolódás) a kérelem metódusa (pl. GET, POST, HEAD) az adott lap (resource) URL címe a kliens által használt HTTP protokoll verziója a kliensnek visszaküldött státusz kód (pl. sikeres ) a letöltött bájtok száma az ún. referrer (annak az oldalnak a címe, ahonnan a kérés jött) BME az ún. APPI Ergonómia user agent és Pszichológia (infók Tanszék a látogató operációs rendszeréről és 12 a kliens programról)

A WebMining CAT használata Ezek az adatok különböző formátumokban kódolva állnak rendelkezésre. A legelterjedtebb logfájl formátumok: CLF (Common Log Format) ECLF (Extended Common Log Format) Combined Log Format Combined Log with User Identifier Combined Log with Session Identifier NetGenesis Extended Log Format A Web Mining node-ban ezeken kívül még választható az Autodetect Log Format (W3C and flexible only) amely felismeri a W3C és a flexible formátumokat. 13

A webhelyek minősége A minőség számos lehetséges definíciója közül talán leginkább lényegre törő: a minőség a vevők (fogyasztók, felhasználók, ügyfelek, stb.) igényei kielégítésének a mértéke. A webhelyek esetén a minőség egyre növekvő fontosságú, az üzleti világban közvetlen gazdasági jelentősége lehet. 14

A webhelyek minősége A barátságtalan azaz gyenge minőségű - webhelyekkel folytatott harc feleslegesen terheli a felhasználót. 15

Az oktatási webhelyek minősége Az interakció professzionális vizsgálata lehetővé teszi a tananyag tényleges használati módjainak az azonosítását, amiből megalapozottan következtetni lehet a tananyag hatékonyságára, illetve a hatékonyság konkrét akadályaira. A web-bányászati bányászati technikák ezért a tananyag fejlesztésének a folyamatában mintegy az ipari gyártásközi minőségellenőrzés analógiájára - az egzakt közbenső mérések lehetőségét nyújtják: : a fejlesztés minden mintavételezés után attól függő irányokat vehet, hogy a tanulók a megelőző lépésben hogyan fogadták a tananyag számukra rendelkezésre bocsátott verzióját. 16

Az oktatási webhelyek minősége Példaként a Clementine web-bányász eszközeivel megoldható néhány olyan feladat, amely oktatási kontextusban előnyösen adaptálható: - A látogatások és a látogatók szegmentációja: Visit and User Segmentation (E-ChannelUser RFM Classifications, User Mode Determination, Visit Branding). - A látogatók viselkedésének elemzése: Web Site Activity and User Behavior (Visit Activity Variances, Identifying Undesirable Behavior, Lifetime Conversion Tracking, Points of Abandonment, User Activity Focus, Visit Activity Funnels, Navigational Usage). 17

Az oktatási webhelyek minősége Példák folytatás : - A látogatók leggyakoribb aktivitási sorozatainak azonosítása: Activity Sequence Analysis (Most Common Activity Sequences, Eventstream Visualisation). -A látogatók vásárlási (döntési/letöltési) hajlamának meghatározása tanuló algoritmusok segítségével: Propensity Analysis. - A látogatók magasabb szintű szegmentációja: Advanced User Segmentation. - Online hirdetési tevékenység hatásvizsgálata: Targeting Online Promotional Activity. - Online hirdetési kampányok hatásvizsgálata: Campaign Performance Measurement 18

Az oktatási webhelyek minősége Oktatási példák :» ha megnézte az A oldalt, mennyire valószínű, hogy megnézi a B oldalt is? (User and Visit Activity Associations)» akik töltöttek ki tesztet, előtte olvasták-e a fejezetet is? (Activity Sequence Analysis module)» korábban megnézett tartalmak, e-learning aktivitás (Pipeline Review, Visit Activity Variances)» minden változót felhasznál a csoport kialakításához (Advanced User Segmentation)» eredményre vonatkozó előrejelzések (pl. viselkedési minta alapján), tananyagfejlesztésre adható tanácsok (Propensity Analysis) 19

Az oktatási webhelyek minősége Oktatási példák folytatás : Mivel mennyi időt töltenek a rendszerben? Honnan lépnek be? Mikor? ( csúcsok ) Tananyag letöltés / Tesztkitöltés gyakoriság Leglátogatottabb oldalak Hol hagyják el a tananyagot? Melyik résszel kezdik a tanulást? Szokásos útvonalak (tanulási stratégiák)? Eredmény és aktivitás közti kapcsolat Tutori aktivitás mérése Tanulási görbék Kommunikációs csatornák használata Kérdőívek eredményei vs. adatbányászat eredményei 20

Példa Felhasználói aktivitás Mely napok frekventáltak? Mely belépési időpontok frekventáltak? Szűrések: Hallgatókra Félévekre 21

Példa - Belépési időpontok 22

Példa - Aktív felhasználók 23

Hallgatói csoportok mélyebb megismerése A rendszer használatát jellemző adatok alapján (belépés időpontja/hossza, gyakorisága, letöltött tananyagok, stb.) egy tanulóalgoritmus csoportosíthatja a látogatásokat (visits) vagy felhasználókat (users). Ezáltal feltérképezhetjük, hogy milyen tanulási stílus jellemzi a hallgatókat Előny, hogy az így azonosított klaszterek személyes megkérdezésekkel validálhatóak. 24

Példaként az Advanced Visit Segmentation stream. 25

26

Példák az alkalmazott tanulóalgoritmusokra: TwoStep (klaszterezés) és C5.0 (döntési fa) TwoStep C5.0 27

Eredmények 28

Eredmények 29

Az oktatási webhelyek minősége A menet közben azonosított szakmai, didaktikai, használhatósági, szoftver-ergonómiai ergonómiai (leggyakrabban a navigációval vagy az információmegjelenítéssel kapcsolatos) stb. problémákra ilyen módon gyors áttervezési, javítási javaslat adható és az így kialakított verzió egy újabb ciklusban tesztelhető. Ez a megközelítés annyiban radikálisan más a korábbiakhoz képest, hogy itt a tanulók és a tananyag vonatkozásában nem egyfajta mintavételezésről van szó, hanem valamennyi tanuló valamennyi interakcióját objektív módon elemezhetjük a teljes tananyagban az z egyes billentyűleütések és egér-kattintások szintjének megfelelő finomságú felbontásban. 30

Az oktatási webhelyek minősége A sikeres web-bányászati bányászati elemzés feltétele, hogy a különböző modellekkel nyert eredményeket az elemző képes legyen a tanulói/felhasználói szintű élményekkel, illetve tapasztalatokkal összekapcsolni ni. Ez azt jelenti, hogy csak az lehet valóban sikeres, aki mind a web-bányászati bányászati elveket és eszközöket,, mind az elemzett konkrét tananyagot és annak pedagógiai célját,, mind pedig a tananyagot használó tanulókat eléggé mélyen ismeri. 31

A módszer alkalmazásának jelenlegi korlátai Végül,, az a előnyök felsorolása után szólni kell ennek a megközelítésnek két jelenleg fennálló akadályáról. Az egyik az adatbányász, illetve web- bányász programcsomagok igen magas ára. A másik pedig az a tény, hogy a technikai elsajátítása komoly szellemi erőfeszítéseket igényel. Hosszabb távon azonban mindkét akadály vonatkozásában optimisták vagyunk. 32

Hivatkozások IZSÓ, L. (2007). Web-bányászati bányászati módszerek alkalmazása internet-alapú tananyagok minőségvizsgálatára. Plenáris előadás. 13. MultiMédia az oktatásban konferencia, Budapesti Műszaki Főiskola. 2007. augusztus 23-24. 24. (http://www.bmf.hu/conferences/multimedia2007/ http://www.bmf.hu/conferences/multimedia2007/) IZSÓ, L. (2007). Applying web-mining methods for quality assurance of internet-based educational materials. Journal of Applied Multimedia,, 2./II./2007.15. (http://www.jampaper.eu/jampaper_e-arc/no.2_ii._2007.html) 33