KOPI Témakörök Department of Distributed Systems Plagizálás a felsőoktatásban A KOPI Plágiumkereső szoftver bemutatása Pataki Máté Bemutatkozás Plágium, problémák Plágiumkeresés KOPI Plágiumkereső Tapasztalatok 2 K+f projektek Elosztott Rendszerek Osztály 1995. óta létezik 13 teljes állású munkatárs, és diákok Kutatás, fejlesztés, (online) szolgáltatások Munkák eloszlása: 80% EU-s k+f pályázatok 15% Hazai pályázatok 5% Belső projektek és szolgáltatások Három fő terület: Digitális könyvtárak és archívumok Csoportmunkát támogató technológiák Webes rendszerek 3 World Wide Web Government Portals Infrawebs Brein E-VOTING E-ADMINISTRATION Web4Groups Workflow Promóció Forum Collaborative Filtering Csoportmunka SZTAKI Szótár Digitális Könyvtárak KOPI GeneSyS AQUA HEKTÁR StreamOnTheFly EUTIST-AMI DELOS NoE 1 Abilities DELOS CORES Select Rating ORG DELOS NoE 2 4 További információk Probléma http://dsd.sztaki.hu A plágium probléma a Felsőoktatás területén Középiskolában is egyre inkább Tudományos életben Digitális könyvtárak számára Könyvkiadóknak Cégek esetében is (pl. honlapok tartalma) Wikipedia 5 6 1
Probléma Túl sok diploma, cikk, dokumentum, internetes oldal, senki se ismerheti mindnek a tartalmát Nem elég érezni, hogy az adott mű plágium, be is kell bizonyítani Védekezés Másolás megakadályozása,másolásvédelem Másolás felderítése, plágiumkeresés Előnyei Megnehezíti, és körülményessé teszi a másolást A mű útja és felhasználása is nyomon követő (DRM) Nagyobb bevétel a szerzőknek és eladóknak 7 8 Használhatatlan Hátrányai Megnehezíti a legális felhasználást is Nem nyújt teljes védelmet Esetenként a legális felhasználáshoz is meg kell kerülni Nem minden esetben legális a használata (szoftver) Személyiségi jogokat sérthet (DRM) Gátolja a műnek, illetve ismertségének a terjedését Keresőrendszerek se férnek hozzá 9 10 Szöveges dokumentumok esetében Plágiumkereső rendszerek PDF, DOC védelem Egyszerűen és automatizálva megkerülhető Csak online, speciális felületen érhető el Erősen szűkíti a felhasználást Nehezebben, de megkerülhető Nem szabványos formátum használata Csökkenti a felhasználók számát (ebook olvasó) Hozzáférés korlátozása Ha egyszer kikerült a rendszerből már semmi se védi Semmi se véd legépelés, fényképezés + karakterfelismerés ellen Esetleg a fiókba való bezárás 11 Vízjel vagy ellenőrzőösszeg (PDF) Írás stílusa alapján azonosítja a szerzőt (authorship attribution, JGAAP) Nyílt keresőszolgáltatások (pl. google) Szöveges összehasonlítás (MS Word) Tesztet generál a dolgozatból (Glatt) Ismeretlen működésű keresők Szövegdarabolással működő rendszerek (KOPI) 12 2
Szövegdarabolással működő rendszer Töredékek tömörítése szövegfájl Darabolás töredékek Tömörítés (MD5) Hash kódolk doláson alapuló tömörítés, MD5 algoritmus szöveg MD5 szám ujjlenyomat Adatbázis feltöltés adatbázis Lekérdezés eredmény A bemenet bármilyen hosszú lehet Gyors Annak az esélye, hogy két különböző szövegnek ugyanaz a kódja, nagyon kicsi Irreverzibilis, veszteséges kódolás (biztonságos) 13 14 A KOPI Plágiumkereső ismertetése KOPI Védelem KOPI Online Plágiumkereső és Információs Portál -internetes hasonlóság és plágiumkereső szolgáltatás Partner: Monash University, Melbourne 2002 ITEM pályázat (IHM-OM) MTA-SZTAKI Elosztott Rendszerek Osztály http://kopi.sztaki.hu/ A KOPI Rendszerbe feltöltött dokumentumok A plagizálás gyorsan kiderül A forrás(oka)t is megjelöli Kisebb akár egy-két mondatnyi rész egyezőségét is kijelzi Megkerülése nehézkes és nem automatizálható A lebukás kockázata jelentősen megnő mel együtt is használható 15 16 KOPI Védelem A KOPI projekt eredményei A mű szabadon terjeszthető Nem kell másolásvédelemmel foglalkozni A keresőrendszerek is hozzáférnek (google) Több ember olvashatja Több ember fog rá hivatkozni Jelenlegi rendszer hátrányai egy egységes rendszert érdemes használnia mindenkinek fel kell tölteni a védeni kívánt dokumentumokat a rendszerbe, vagy elérhetővé kell tenni Digitális könyvtárak védelme az illegális másolatoktól Tanárok, professzorok, konferenciaszervezők segítése a részben vagy egészében másolt dolgozatok illetve publikációk gyors megtalálásában és leleplezésében Diákok és cikkírók tájékoztatása a szabályos és helyes idézés formájáról és mértékéről (mértékének megállapítását a rendszer el is végzi) Diplomák és szakdolgozatok értékének növelése eredetiségük igazolásával 17 18 3
Hasonlóságkereső szolgáltatások Egyéb szolgáltatások Feltöltött dokumentumok összehasonlítása egymással Hasonló dokumentumok keresése a rendszer adatbázisaiban A felhasználó vagy mások által feltöltött dokumentumok Internetről letöltött oldalak Digitális könyvtárak (MEK) Egyetemi diplomák Portál szolgáltatások Témával kapcsolatos beszélgető-fórumok Privát üzenetküldés FAQ, nyelvváltás Dokumentumok, ismertetők Plágium vagy idézet Jogszabályok (szerzői jogok) Egyetemi szabályzatok 19 20 Tapasztalat Tapasztalat Sok esetben nem szándékos a plagizálás Nem oktatják az egyetemeken a helyes idézés módját Mekkora hasonlóságot várunk el 0% -nincs irodalomkutatás 10% 50% 100% -egyértelműen plágium Diákok és tanárok egyaránt használják a KOPI Plágiumkeresőt Több mint tízezer felhasználó 18 000 dokumentum Több mint 11 000 000 dokumentumrészlet Ebből 10 000 000 magyar BME, 400-500 diák, 5 feladat, 6 év 2007: 9 pár, 2009: 4 pár, 2010: 2 pár Nagy médiaérdeklődés 21 22 Azonosságok Támogató nyilatkozatok Vélemény a mérésről A mérés számomra egész érdekesnek bizonyult, annak ellenére, hogy sok időt vett igénybe. Hasznos dolognak tartom a kategóriákon belüli kereséseket. Vélemény a mérésről A mérés számomra egész érdekesnek bizonyult, annak ellenére hogy sok időt vett igénybe. Hasznos dolognak tartom a kategóriákon belüli kereséseket ésa dinamikus oldalmegvalósításokat. Budapesti Műszaki és Gazdaságtudományi Egyetem, Dr. Péceli Gábor rektor Budapesti Corvinus Egyetem, Dr. Mészáros Tamás rektor Debreceni Egyetem, Dr. Pethő Attila dékán, Dr. Szabadvalvi József dékán Eötvös Lóránd Tdományegyetem, Dr. Hudecz Ferenc rektor 23 24 4
Támogató nyilatkozatok Fejlesztési irányok Debreceni Egyetem Programtervező Informatikus szak, nemzetközi kísérleti akkreditációja (ASIIN) Elosztott rendszer Minden egyetemen saját szerver, de Egymás rendszerében is képesek keresni Biztonságosan, MD5 számok átvitele Adatbázis feltöltése Online és offline adatbázisok Interneten található dokumentumok Forráskódok, programozási nyelvek felismerése Fordítási plágiumok 25 26 KOPI Portal Köszönöm a figyelmüket! http://kopi.sztaki.hu Web: http://dsd.sztaki.hu Email: Mate.Pataki@sztaki.hu 27 28 5