KOPI K+f projektek World Wide Web Department of Distributed Systems KOPI Plágiumkeresés Dr. Pataki Máté Government Portals Infrawebs Brein E-VOTING E-ADMINISTRATION Web4Groups Workflow Promóció Forum SZTAKI Szótár KOPI GeneSyS StreamOnTheFly EUTIST-AMI Abilities CORES Digitális Könyvtárak HEKTÁR AQUA DELOS NoE 1 DELOS ORG DELOS NoE 2 Collaborative Filtering Csoportmunka Select Rating 3 Elosztott Rendszerek Osztály 1995. óta létezik 13teljes állású munkatárs, és diákok Kutatás, fejlesztés, (online) szolgáltatások Munkák eloszlása: 80% EU-s k+f pályázatok 15% Hazai pályázatok 5% Belső projektek és szolgáltatások Három fő terület: Digitális könyvtárak és archívumok Csoportmunkát támogató technológiák Webes rendszerek A plágium probléma a Felsőoktatás területén Középiskolában is egyre inkább Tudományos életben Digitális könyvtárak számára Könyvkiadóknak Cégek esetében is (pl. honlapok tartalma) Wikipedia 2 4
Miért probléma a plágium? Túl sok diploma, cikk, dokumentum, internetes oldal, senki se ismerheti mindnek a tartalmát Nem elég érezni, hogy az adott mű plágium, be is kell bizonyítani Védekezés Másolás megakadályozása,másolásvédelem Másolás felderítése, plágiumkeresés Dr. Zoe D. Katze, Ph.D., C.Ht. Forrás: http://studio5.ksl.com/index.php?sid=14220824&nid=127 5 7 Másolásvédelem Miért probléma a plágium? Diplomák, szakdolgozatok értéke Mennyit ér egy diploma? Intézmények hírneve Személyek hírneve, karrierje Anyagi kár 6 Előnyei Megnehezíti, és körülményessé teszi a másolást A mű útja és felhasználása is nyomon követő (DRM) Nagyobb bevétel a szerzőknek és eladóknak Hátrányai Megnehezíti a legális felhasználást is Nem nyújt teljes védelmet Esetenként a legális felhasználáshoz is meg kell kerülni Nem minden esetben legális a használata (szoftver) Személyiségi jogokat sérthet (DRM) Gátolja a műnek, illetve ismertségének a terjedését Keresőrendszerek se férnek hozzá 8
Másolásvédelem Szöveges dokumentumok esetében KOPI Plágiumkereső PDF, DOC védelem Egyszerűen és automatizálva megkerülhető Csak online, speciális felületen érhető el Erősen szűkíti a felhasználást Nehezebben, de megkerülhető Nem szabványos formátum használata Csökkenti a felhasználók számát (ebook olvasó) Hozzáférés korlátozása Ha egyszer kikerült a rendszerből már semmi se védi Semmi se véd legépelés, fényképezés + karakterfelismerés ellen Esetleg a fiókba való bezárás 9 11 Plágiumkereső rendszerek KOPI Védelem Vízjel vagy ellenőrzőösszeg (PDF) Írás stílusa alapján azonosítja a szerzőt (authorship attribution, JGAAP) Nyílt keresőszolgáltatások (pl. google) Szöveges összehasonlítás (MS Word) Tesztet generál a dolgozatból (Glatt) Ismeretlen működésű keresők Szövegdarabolással működő rendszerek (KOPI) A KOPI Rendszerbe feltöltött dokumentumok A plagizálás gyorsan kiderül A forrás(oka)t is megjelöli Kisebb akár egy-két mondatnyi rész egyezőségét is kijelzi Megkerülése nehézkes és nem automatizálható A lebukás kockázata jelentősen megnő Másolásvédelemmel együtt is használható 10 12
KOPI Védelem A mű szabadon terjeszthető Nem kell másolásvédelemmel foglalkozni A keresőrendszerek is hozzáférnek (google) Több ember olvashatja Több ember fog rá hivatkozni Jelenlegi rendszer hátrányai egy egységes rendszert érdemes használnia mindenkinek fel kell tölteni a védeni kívánt dokumentumokat a rendszerbe, vagy elérhetővé kell tenni 13 15 14 16
17 19 Hasonlóság és plágiumkereső 18 20
Mekkora hasonlóságot várunk el? 0% nincs idézet 100% plágium 2003: állami támogatással elkezdődött a KOPI Portál fejlesztése ( Elosztott Rendszerek Osztály ITEM pályázat: IHM-OM) 2004: elindult a publikus plágiumkereső szolgáltatás magyar és angol nyelven 2006: számos tanár elkezdi használni a szolgáltatást, több mint 1000 felhasználó 2007: fejlesztések az első három év tapasztalatai alapján 21 23 1. század: plagiarius (lat.) emberrabló, gyermekrabló kézi összehasonlítás 90-es évek: dokumentumpárok összehasonlítása 2000- : dokumentum összehasonlítása adatbázissal 2001: elkezdődtek az alapkutatások, hogy miként lehetne egy nyelvfüggetlen, magyar nyelven is jól működő egynyelvű plágiumkeresőt elkészíteni (BME) 22 2009: felhasználóink száma már több mint 10 000, egyes egyetemi karok használják már a KOPI Plágiumkeresőt rendszeresen 2010: új kutatásba kezdtünk, hogy miként lehetne fordítási plágiumokat felismerni és megtalálni 2011: a világon elsőként beépítettük a KOPI Plágiumkeresőbe fordítási plágiumok megtalálására képes algoritmust, amely a teljes angol Wikipédiában keres 2012: nagy érdeklődés 24
beágyazott képek belső plágiumkeresés szerző azonosítása gondolatolvasás? Köszönöm a figyelmüket! azt holnap megtalálhatjuk Web: http://dsd.sztaki.hu Email: Mate.Pataki@sztaki.hu 25 27 KOPI Portal http://kopi.sztaki.hu 26