KOPI-Fotó: Plágiumkeresés egy lefotózott oldal alapján KOPI-Photo: Searching for plagiarism via a photo



Hasonló dokumentumok
KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

World Wide DSD Web. Csoportmunka

KOPI. KOPI Plágiumkereső A digitális tartalmak védelmében DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. Plágiumkeresés különböző nyelvek között MTA SZTAKI DSD. Pataki Máté. Department of Distributed Systems

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Department of Distributed Systems MTA SZTAKI DSD

MTA SZTAKI MTA SZTAKI

KOPI. Online Plágiumkereső és Információs Portál

PATAKI MÁTÉ. KOPI Védelem, hogyan védjük digitális dokumentumainkat plagizálás ellen

ELOSZTOTT DIGITÁLIS KÖNYVTÁRI PROJEKT EURÓPÁBAN

Digitális könyvtárak védelme a KOPI plágiumkereső rendszerrel

A plágiumkeresés dilemmái és megoldásai. Nagy István Monguz Kft. Networkshop 2016

DSD DSD. Egy országos méretű orvosi adatbázissal kapcsolatos informatikai kihívások. Kovács László Pataki Balázs Pataki Máté MTA SZTAKI DSD

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

A BCE Entz Ferenc Könyvtár és Levéltár a diplomaszerzéssel és a doktori eljárással kapcsolatos dokumentumok kezelésének szabályzata

Számlaigazoltatás újratöltve. Lázár Péter

Longman Exams Dictionary egynyelvű angol szótár nyelvvizsgára készülőknek

Internetes keresés. Dr. Nyéki Lajos 2019

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Felhasználói segédlet a Web of Knowledge / Web of Science adatbázis használatához

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

Honlap szerkesztés Google Tudós alkalmazásával

MIDRA. A Miskolci Egyetem repozitóriuma. Espán Edina. Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2012, Veszprém

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Felhasználói segédlet a Scopus adatbázis használatához

Etikus publikálás: Plágium

Website review acci.hu

DANS és Narcis. Burmeister Erzsébet. HUNOR találkozó, Budapest március 13.

USER MANUAL Guest user

Az Országos Széchényi Könyvtár

Plágium, vagy mások eredményeinek

Felhasználói segédlet a Scopus adatbázis használatához

A plágiumkereső szoftverek kiskapui

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Szociális hálók mobilon Avagy mi rejlik a hívószó mögött? Dr. Forstner Bertalan. bertalan.forstner@aut.bme.hu

Lázár kollokvium Kutatók a neten. Albert G. ELTE - Térképtudományi és Geoinformatikai Tanszék

Formai követelmények, DOSZ Közgazdász Doktoranduszok és Kutatók V. Nemzetközi Téli Konferenciája

b o o k s 2 e b o o k s. e u

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Új Nemzedék Központ. EFOP pályázatok online beszámoló felülete. Felhasználói útmutató

Hogyan használja az OROS online pótalkatrész jegyzéket?

Zimbra levelező rendszer

Modul 3B: 1. rész Az ingyenes, világméretű adatbázisának használata

Tittel Pál Könyvtár és Médiacentrum Gál Tibor szeptember 12.

Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben

Hogyan küldjünk cikket az Opus et Educatio újságnak?

Open Access - tájékoztató, dokumentáció szerzőknek és adminisztrátoroknak

műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó Munkahelyek: Nokia -Hungary kft Veszprémi Egyetem

PhD dolgozatok repozitóriumi elhelyezése, DOI azonosítóval való megjelölése

Felhasználói kézikönyv

MKE 44. Vándorgyűlés Győr,

Linux Linux rendszeren a Wine segédprogram segítségével telepíthető az Adobe Digital Editions.

Mobil Telefonon Keresztüli Felügyelet Felhasználói Kézikönyv

T Á J É K O Z T A T Ó. A 1108INT számú nyomtatvány a webcímen a Letöltések Nyomtatványkitöltő programok fülön érhető el.

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

Segédlet a szakdolgozatok/portfóliók elektronikus feltöltéséhez

Lopocsi Istvánné MINTA DOLGOZATOK FELTÉTELES MONDATOK. (1 st, 2 nd, 3 rd CONDITIONAL) + ANSWER KEY PRESENT PERFECT + ANSWER KEY

SZOFTVEREK A SORBANÁLLÁSI ELMÉLET OKTATÁSÁBAN

MTMT adatbázis használati útmutató a Széchenyi István Egyetem munkatársai számára

MTMT adminisztrátori felület és teendők. Mátyás Melinda, Szabó Panna november 4. ELTE Egyetemi Könyvtár

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Hallgatói segédlet a diplomadolgozatok/szakdolgozatok/záródolgozatok elektronikus verziójának feltöltéséhez

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Keresés az EBSCO Host adatbázisaiban

Forrás és idéző közlemények felvitele importtal

Hálózati betekint ő program telepítése mobil telefonra. Symbian. alarm shop. Windows mobile Android IPhone Blackberry

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Adatbázisok 2018-ban ADT- ARCANUM DIGITÁLIS TUDOMÁNYTÁR AKADÉMIAI KIADÓ FOLYÓIRATAI AKADÉMIAI KIADÓ MERSZ ADATBÁZIS AKADÉMIAI KIADÓ SZÓTÁRAI CAMBRIDGE

1, A találatok megjelenítése 2, Hol, hogyan találom meg? Milyen adatokra van szükség egy könyv megtalálásához? Avagy a példányinformációk értelmezése

Útmutató az online katalógus használatához

Kiegészítők telepítése Installing Addons

Országos Rendezési Tervkataszter

Alkalmazás-shop (Internet-kapcsolat szükséges)

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

Felsô menü: Jogszabály- és dokumentumtár menüpont. Almenüpontok:

Magyar Nemzeti Bank FELHASZNÁLÓI SEGÉDLET

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

Pályázati útmutató. Magyary Zoltán Posztdoktori Ösztöndíj a konvergencia régiókban

Pedagógiai információforrások, adatbázisok. Tittel Pál Könyvtár és Médiacentrum Gál Tibor március 4.

Mobilizálódó OSZK. A nemzeti könyvtár mobileszközöket célzó fejlesztései az elmúlt időszakban. Garamvölgyi László. Networkshop, 2013.

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

MÉDIAAJÁNLAT ÉRVÉNYES 2019 SZEPTEMBER 30-TÓL VISSZAVONÁSIG.

Digitális kincstár digitális kincskereső Elektronikus szolgáltatások az MTA Könyvtárában

WEBPAC e-corvina. Egyszerő keresés:

Budapest By Vince Kiado, Klösz György

Kitöltési Útmutató az Elektronikus ügyintézés Regisztrált szolgáltató adatbejelentése űrlapcsomag kitöltéséhez

MTMT adatbázis Változásjegyzék *

MTA ATK Talajtani és Agrokémiai Intézet Könyvtárának Használati Szabályzata

Publikáció, tudományos folyóiratok, tudománymetria; parazita folyóiratok

A tankönyvvé nyilvánítás folyamatát elektronikusan támogató rendszer az OKÉV számára

Geotechnika II. (NGB-SE005-2) Geo5 használat

ÚTMUTATÓ ÉVI KIHÍVÁS NAPJA NEVEZÉSEK KITÖLTÉSÉHEZ ONLINE NEVEZÉS

TÁJÉKOZTATÓ fizikus MSc hallgatóknak a. Diplomamunka

Regisztráció a Researcher ID adatbázisban

(Asking for permission) (-hatok/-hetek?; Szabad ni? Lehet ni?) Az engedélykérés kifejezésére a következő segédigéket használhatjuk: vagy vagy vagy

A NEMZETI KÖZNEVELÉSI PORTÁL

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

DocBook útmutató. Jeszenszky Péter Debreceni Egyetem, Informatikai Kar

Átírás:

KOPI-Fotó: Plágiumkeresés egy lefotózott oldal alapján KOPI-Photo: Searching for plagiarism via a photo Pataki Máté a, Micsik András b, Kovács László c, Szabó Mihály MTA SZTAKI a mate.pataki@sztaki.hu b andras.micsik@sztaki.hu c laszlo.kovacs@sztaki.hu Absztrakt: Az MTA SZTAKI közismert, számos felsőoktatási intézményben használt KOPI plágiumkeresője új szolgáltatással bővült: az iphone alkalmazás képes egy lefotózott oldalról megmondani, hogy annak ki az eredeti szerzője. A KOPI Online Plágiumkereső Portál egy egyedülálló, nyílt szolgáltatás az internetező közönség számára, amely lehetővé teszi, hogy a felhasználók saját dokumentumaik valamint mások által feltöltött dokumentumok között azonos részeket, hasonlóságot, esetleg teljes egyezést keressenek. A nyelvfüggetlen algoritmusnak köszönhetően ez bármely európai nyelven megtehető. Ehhez a szolgáltatáshoz kapcsolódik a KOPI-Fotó alkalmazás, amely egy szöveges oldalról mobiltelefonnal készült kép alapján tud keresni a KOPI Plágiumkereső adatbázisában, a magyar weben és az angol Wikipédiában. Használata egyszerű, csak le kell fotózni egy jól olvasható részt egy szövegből, és a program megmondja, hogy az megtalálható-e valamelyik a KOPI által korábban eltárolt dokumentumban, cikkben, oldalon. Amennyiben van találat, a KOPI-Fotó az egyező részeket kijelzi, és lehetővé teszi, hogy a felhasználó a megfelelő oldalra navigáljon. Ha a szöveg vagy annak egyes részei több oldalon is megtalálhatóak, akkor mindegyiket felsorolja, a legtöbb egyezést tartalmazó találattól kezdve. Előadásunkban egy demó keretében is bemutatjuk az új szolgáltatás működését. Kulcsszavak: plágiumkereső, mobil alkalmazás, fotó, OCR, KOPI Abstract: KOPI, the well-known Plagiarism Search Portal in Hungary, developed by the Institute for Computer Science and Control of the Hungarian Academy of Sciences (MTA SZTAKI) came out with a new service called KOPI-Photo: the iphone app is capable to determine the original author of a text using a photo taken from a page of the document. The KOPI Online Plagiarism Search Portal is an open service for web users that enables them to check for identical or similar contents between their own documents and the files uploaded by other authors. This check function works in any European language, due to the language-independent algorithm. The new KOPI-Photo application enables the users of the service to search for the source of a text document by taking a picture of a page. The search is performed in the KOPI database, the English and the Hungarian Wikipedia and on the Hungarian Web. When a match is found the similar texts are displayed to the user so they can navigate to the source found by KOPI. If there are more sources, than all of them are listed, starting with the one that includes the most identical match. During the presentation we demonstrate how KOPI-Photo works. Keywords: plagiarism search, mobile application, OCR, KOPI 1. Bevezetés A KOPI Portál kifejlesztését a volt Informatikai és Hírközlési Minisztérium támogatásával az MTA SZTAKI Elosztott Rendszerek Osztálya (DSD), a Melbourne-i Monash Egyetemmel együtt, annak eredményeit felhasználva végezte. A Portál 2004-ben készült el, és azóta is szabadon hozzáférhető az érdeklődők számára. 880

A KOPI projekt célja elsősorban a tanárok, professzorok, konferenciaszervezők segítése a másolt művek eredetijének felkutatásában, a digitális könyvtárak védelme az illegális másolatoktól, a diákok tájékoztatása a plagizálásról és az idézés helyes módjáról, valamint a cikkek, dolgozatok, diplomamunkák értékének növelése az eredetiségük igazolásával. Érdemes kiemelni ez az összes hasonló szolgáltatásra is igaz, hogy a rendszer maga nem tudja megállapítani, hogy egy adott szövegrész idézet-e vagy plágium; az ilyen rendszer csak arra képes, hogy jelzi a felhasználónak, az adott dokumentumban mely más dokumentumból talált meg részeket, mekkora közöttük az átfedés vagy a hasonlóság. Annak a megállapítása, hogy ez szabályos módon történt idézés-e, és helyesen szerepel a forrás megjelölése, már a felhasználóra van bízva. A KOPI Portál legfőbb célja a plágiumok illetve a plagizálás visszaszorítása, melynek elősegítésére az oldalon több szolgáltatás is található. A legfontosabb közülük az az információgyűjtemény, amely a plágiummal kapcsolatos tudnivalókat gyűjti össze. Mivel sokan nem tudják pontosan, mi számít plágiumnak vagy nem ismerik az idézés pontos szabályait, ezért a KOPI Portálon megtalálható a plágium definícióján kívül egy részletes leírás is arról, mi a plágium és milyen fokozatai vannak, valamint egy útmutató a helyes idézés módjáról. Az ide vonatkozó jogszabályok mellett az egyetemi szabályzatok is helyet kaptak a linkgyűjteményben, nem csak azért, hogy lássák a hallgatók, hogy milyen következménnyel jár a plagizálás, hanem azért is, mert még az idézésnek is pontos szabályai vannak. Egy diplomadolgozatban például nem lehet meghatározott mennyiségnél több idézet, hiába jelöljük meg a szerzőt, hiszen valami újat, valami sajátot is hozzá kell tenni a korábbi ismeretekhez, eredményekhez ahhoz, hogy a diplomamunka önálló, teljes munkának számítson. Hasonló módon, ha két diák közös témában ír diplomát, akkor is a diploma teljes terjedelmének csak megadott százaléka lehet közös, a többinek teljesen egyéni munkának kell lennie. A rendszer lehetővé teszi azt is, hogy ha hasonlóságot vagy esetleg plágiumot talál egy felhasználó, akkor felvegye a kapcsolatot azzal, aki a másik művet feltöltötte, így meg lehet beszélni, hogy pontosan mi is az a mű, melyik az eredeti, ki kiről másolt. A portálnak magyar és angol felhasználói felülete is van, ezzel is elősegítve mind a felhasználói kör, mind az adatbázis bővülését. A KOPI Portál lényegét természetesen a plágiumkereső szolgáltatások adják. Azért, hogy később az adott felhasználó és a többiek által is azonosíthatóak legyenek a dokumentumok, a portálba feltöltött műveknek érdemes megadni a címét és a szerzőjét. Egyéb, részletesebb információk mint például: kiadó, kiadás éve, kulcsszavak, vagy személyes megjegyzés bevitelét is lehetővé teszi a rendszer. 2. Folyamatos fejlődés Az informatika rohamos fejlődésével a KOPI Portálnak is lépést kell tartania, egyfelől hogy minél jobban kielégítse a felhasználók igényeit, emellett kellő visszatartó erő legyen a plágiumok visszaszorításában. Az algoritmusok fejlesztése 2001-ben kezdődött, a KOPI szolgáltatás 2004-ben indult. 2007-ben az első három év üzemeltetési tapasztalatai alapján továbbfejlesztettük a rendszert. 2011-ben a világon elsőként beépítettünk a KOPI Plágiumkeresőbe egy fordítási plágiumok megtalálására képes, saját fejlesztésű algoritmust, amely a teljes angol Wikipédiában keres. 881

2014-ben újabb szolgáltatásokkal bővült a közkedvelt plágiumkereső. Az eddig elfogadott fájlformátumokon (doc, docx, pdf, rtf, html) felül már a nyílt odt formátumot is támogatja a rendszer, valamint megbirkózik a szkennelt dokumentumot tartalmazó pdf fájlokkal is, amelyre erős igény mutatkozott a régebbi, csak papír formátumban meglévő diplomák, dokumentumok nagy száma miatt. A hasonlóságok megtekintését, a másolások és idézetek jobb elkülönítését segíti az ugyancsak idén debütált új szolgáltatásunk, a dokumentum-összehasonlító. Ennek segítségével bármely két, egymással közös részt tartalmazó dokumentum megjeleníthető egymás mellett, az egyező részeket a rendszer színes háttérrel kiemelve mutatja. 1. ábra. Dokumentumok összehasonlítása a KOPI-ban A színes kiemelés segítségével könnyen azonosíthatók a dokumentumok közötti egyezések, és látható az is, megfelelően jelölve van-e az idézet. 3. KOPI-Fotó A KOPI Portál legújabb szolgáltatása az iphone telefonra letölthető applikáció, a KOPI-Fotó, amely egy lefotózott oldal alapján annak eredeti forrását képes megállapítani. Az alkalmazás használata nagyon egyszerű: elindítás után egy fényképet készítünk az adott szövegről (2. ábra), majd a keresés gombbal elindíthatjuk a plágiumkeresést. A telefon előbb átalakítja a képet a megfelelő formátumba és méretre, majd elküldi azt a szervernek. Itt egy előfeldolgozás után egy OCR program segítségével a képet szöveggé alakítja a rendszer, majd ezen a szövegen végez plágiumkeresést. 882

2. ábra. Fénykép készítés 3. ábra. Fut a keresés 883

Az eredmény a szöveg mennyiségétől függően pár másodpercen belül megjelenik. A találatokra kattintva meg lehet nézni az egyező részeket, valamint a Wikipédia esetén lehetőség van a megfelelő Wikipédia oldalra navigálni. 3. ábra. Keresés eredménye Az applikáció a KOPI-ba feltöltött fájlok között, az angol és magyar Wikipédiában, valamint egy internetes adatbázisban keres. Utóbbiban több tíz millió magyar oldal található, főleg olyan honlapokról, amelyeken nagyobb mennyiségű szöveges tartalom van, illetve amelyek témában illeszkednek a KOPI-ba jelenleg feltöltött dolgozatokhoz. 4. Összefoglaló A KOPI-Fotó rendszer jól kiegészíti az online plágiumkeresőt, és alkalmas arra, hogy ha valaki kétes eredetű szöveggel találkozik, akár bírálatra beadott diplomadolgozatban, akár egy 884

újságcikkben, akkor megnézhesse, hogy a KOPI adatbázisában megtalálható-e, vagy nem a Wikipédiából, esetleg az internetről származik a kérdéses szövegrész. Terveink között szerepel, hogy a másik két közkedvelt mobil platformra, Android-ra és Windows-ra is elkészítsük az applikációt, minden felhasználó számára elérhetővé téve a KOPI-Fotó szolgáltatást. Irodalomjegyzék [1] Micsik András, Pataki Máté és Garzó András: A KOPI Plágiumkereső terhelésének elosztása cloud környezetben, Networkshop 2013 Sopron, http://nws.niif.hu/ncd2013/docs/ehu/061.pdf [2] Pataki Máté és Marosi Attila: Searching for Translated Plagiarism with the Help of Desktop Grids, Journal of Grid Computing Vol 11, Issue 1, pp. 149-166, DOI: 10.1007/s10723-012-9224-5 [3] Pataki Máté: Algoritmusok egynyelvű és különböző nyelvek közötti fordítások és plágiumok megtalálására, Pázmány Péter Katolikus Egyetem, PhD disszertáció, 2013 [4] Pataki Máté, Vajna Miklós és Marosi Attila: Wikipedia as Text, ERCIM News 89, April 2012, http://ercim-news.ercim.eu/en89/ri/wikipedia-as-text 885