MTA SZTAKI MTA SZTAKI

Hasonló dokumentumok
World Wide DSD Web. Csoportmunka

Department of Distributed Systems MTA SZTAKI DSD

KOPI. KOPI Plágiumkereső A digitális tartalmak védelmében DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. Plágiumkeresés különböző nyelvek között MTA SZTAKI DSD. Pataki Máté. Department of Distributed Systems

KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

DRM megoldások áttekintése

DSD DSD. Egy országos méretű orvosi adatbázissal kapcsolatos informatikai kihívások. Kovács László Pataki Balázs Pataki Máté MTA SZTAKI DSD

KOPI. Online Plágiumkereső és Információs Portál

DSD. Hibatűrő keresés digitalizált magyar nyelvű szövegekben. Pataki Máté Füzessy Tamás Kovács László Tóth Zoltán MTA SZTAKI DSD

KOPI DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

PATAKI MÁTÉ. KOPI Védelem, hogyan védjük digitális dokumentumainkat plagizálás ellen

Digitális könyvtárak védelme a KOPI plágiumkereső rendszerrel

KOPI-Fotó: Plágiumkeresés egy lefotózott oldal alapján KOPI-Photo: Searching for plagiarism via a photo

A plágiumkeresés dilemmái és megoldásai. Nagy István Monguz Kft. Networkshop 2016

SZÓBELI ÉRETTSÉGI TÉMAKÖRÖK

*Ezen felületet kell kitölteni saját fiók létrehozásáho z

A plágiumkereső szoftverek kiskapui

DRM megoldások áttekintése

A KÖZÉPSZINTŰ ÉRETTSÉGI VIZSGA INFORMATIKA TÉMAKÖREI: 1. Információs társadalom

Fülöp Csaba, Kovács László, Micsik András

Algoritmusok egynyelvű és különböző nyelvek közötti fordítások és plágiumok megtalálására. Pataki Máté MTA SZTAKI

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

Tudásbázis a közgazdasági szférában

NYÍLT HOZZÁFÉRÉS ÉS INTÉZMÉNYI

>>Biztonsági megoldások a nyomtatás-másolás területén >> Eszes Mihály, Üzleti szegmens vezető. Océ-Hungária Kft.

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Algoritmusok egynyelvű és különböző nyelvek közötti fordítások és plágiumok megtalálására. Pataki Máté

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

Az egységes tartalomkezelés üzleti előnyei

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

Informatika szóbeli vizsga témakörök

AZ OFI SZEREPE ÉS FELADATAI A PEDAGÓGUSOK SZAKMAI MUNKÁJÁNAK TÁMOGATÁSÁBAN

Szövetségi (föderatív) jogosultságkezelés

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

Mesterséges Intelligencia Elektronikus Almanach

IMOLA. Integrált MOKKA2, ODR2 és OLA. Vándorgyűlés Szombathely, 2008 július 25. Monguz MTA SZTAKI konzorcium

MKE 44. Vándorgyűlés Győr,

Az Educatio Társadalmi Szolgáltató Nonprofit Kft. infokommunikációs fejlesztései. Koplányi Emil Digitális Pedagógiai Osztály

Az ATON szakfolyóirat indítása

MIDRA. A Miskolci Egyetem repozitóriuma. Espán Edina. Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2012, Veszprém

1. tétel: A kommunikációs folyamat

A PEDAGÓGIAI TUDÁSMENEDZSMENT- RENDSZER ELEMEI

Önálló labor feladatkiírásaim tavasz

Az ELDORADO-projekt. Káldos János Az ELDORADO projekt Magyar Könyvtárosok VII. Világtalálkozója Budapest,

Zimbra levelező rendszer

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

Digitális kiadó Olvasói igények, veszélyek és lehetőségek

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

6. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

A FELSŐOKTATÁSI KÖNYVTÁRAK

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Beszédtechnológia az információs esélyegyenlőség szolgálatában

SZTAKIMemory A DIGITÁLIS INFORMÁCÓK HOSSZÚ TÁVÚ MEGŐRZÉSE ARCHÍVUMRENDSZER INTÉZETI KÖZÖS MEMÓRIA SZÁMÁRA

Könyvtárhasználati kurzusok és kompetenciák. Kristóf Ibolya, Szent István Egyetem Kosáry Domokos Könyvtár és Levéltár

Hozzávalók keresése és csatolása

Szakdolgozat / diplomamunka benyújtásának folyamata (alapképzés, mesterképzés 2018/19/1)

1. tétel: A kommunikációs folyamat

A NEMZETI KÖZNEVELÉSI PORTÁL

Gyermekeink védelme a nemkívánt internetes tartalmaktól. Avagy hogyan fogjuk a kezüket úgy, hogy ne bilincsnek, hanem segítségnek érezzék

I. Felsőoktatási Marketing Verseny Versenyképes honlap kritériumrendszere

Tanári óratartás nyilvántartása a ZMNE-n

Grid Implemented John the Ripper aka GI John. Bucsay Balázs <balazs.bucsay [at] rycon [dot] hu> BB$HT

DSD. Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében. Pataki Máté Tóth Zoltán MTA SZTAKI DSD

Digitális kincstár digitális kincskereső Elektronikus szolgáltatások az MTA Könyvtárában

PEDAGÓGIAI MUNKA TÁMOGATÁSA AZ INNOVÁCIÓ ÉS TUDÁSMENEDZSMENT ESZKÖZEIVEL

DSD. A W3C Magyar Iroda Akadálymentesítési Törekvései Pataki Máté, Kovács László

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

1. Szolgáltatásaink. Adatok feltöltése és elemzése. Digitális feltöltés. Analóg korong feltöltés

A NEMZETI KÖZOKTATÁSI PORTÁL JELENTŐSÉGE A HATÁRON TÚLI ISKOLÁK SZEMPONTJÁBÓL

E-ügyintézés bevezetése Kaposvárott

Web harvesztelés. Automatikus módszerekkel

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika

A KA103-as intézményi mobilitási főpályázat a 2019-as pályázati felhívásban

A könyvtári rendszer

Az információs portáloktól a tudásportálokig

Új Nemzedék Központ. EFOP pályázatok online beszámoló felülete. Felhasználói útmutató

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

Informatikai képzés a BME-n, ahogy mi csináljuk. Dr. Charaf Hassan, hassan@aut.bme.hu

Információs társadalom

EPALE. Európai elektronikus platform a felnőttkori tanulásért. Karvázy Eszter Nemzeti Szakképzési és Felnőttképzési Hivatal december 9.

Multifunkcionális, multimédia elemeket tartalmazó mobil elérésű távoktatási tananyag összeállítása és tesztelése

A szemantikus világháló oktatása

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

EMBERKÖZPONTÚ ONLINE MARKETING A SZEMÉLYRE SZABOTT ÜZENETEK MŰVÉSZETE

Szakdolgozat feltöltése a DEA-ba

A záró rendezvény programja

Miért nem? Miért igen? Sinkó Márta Modell Divatiskola Budapest,

TAKARNET24 szolgáltatásai

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

SZTE Nyílt Forrású Szoftverfejlesztő és Minősítő Kompetencia Központ

Informatika tanterv nyelvi előkészítő osztály heti 2 óra

Üzleti lehetőségek a nyílt forráskódú fejlesztésben

Többnyelvű tezaurusz építése és szolgáltatása webes környezetben

Gyakorlati vizsgatevékenység A

A Miskolci Egyetem Wikije

Evezz a mélyre! Haladó kutatási tippek bölcsészet- és társadalomtudományok témakörben

Átírás:

KOPI Témakörök Department of Distributed Systems Plagizálás a felsőoktatásban A KOPI Plágiumkereső szoftver bemutatása Pataki Máté Bemutatkozás Plágium, problémák Plágiumkeresés KOPI Plágiumkereső Tapasztalatok 2 K+f projektek Elosztott Rendszerek Osztály 1995. óta létezik 13 teljes állású munkatárs, és diákok Kutatás, fejlesztés, (online) szolgáltatások Munkák eloszlása: 80% EU-s k+f pályázatok 15% Hazai pályázatok 5% Belső projektek és szolgáltatások Három fő terület: Digitális könyvtárak és archívumok Csoportmunkát támogató technológiák Webes rendszerek 3 World Wide Web Government Portals Infrawebs Brein E-VOTING E-ADMINISTRATION Web4Groups Workflow Promóció Forum Collaborative Filtering Csoportmunka SZTAKI Szótár Digitális Könyvtárak KOPI GeneSyS AQUA HEKTÁR StreamOnTheFly EUTIST-AMI DELOS NoE 1 Abilities DELOS CORES Select Rating ORG DELOS NoE 2 4 További információk Probléma http://dsd.sztaki.hu A plágium probléma a Felsőoktatás területén Középiskolában is egyre inkább Tudományos életben Digitális könyvtárak számára Könyvkiadóknak Cégek esetében is (pl. honlapok tartalma) Wikipedia 5 6 1

Probléma Túl sok diploma, cikk, dokumentum, internetes oldal, senki se ismerheti mindnek a tartalmát Nem elég érezni, hogy az adott mű plágium, be is kell bizonyítani Védekezés Másolás megakadályozása,másolásvédelem Másolás felderítése, plágiumkeresés Előnyei Megnehezíti, és körülményessé teszi a másolást A mű útja és felhasználása is nyomon követő (DRM) Nagyobb bevétel a szerzőknek és eladóknak 7 8 Használhatatlan Hátrányai Megnehezíti a legális felhasználást is Nem nyújt teljes védelmet Esetenként a legális felhasználáshoz is meg kell kerülni Nem minden esetben legális a használata (szoftver) Személyiségi jogokat sérthet (DRM) Gátolja a műnek, illetve ismertségének a terjedését Keresőrendszerek se férnek hozzá 9 10 Szöveges dokumentumok esetében Plágiumkereső rendszerek PDF, DOC védelem Egyszerűen és automatizálva megkerülhető Csak online, speciális felületen érhető el Erősen szűkíti a felhasználást Nehezebben, de megkerülhető Nem szabványos formátum használata Csökkenti a felhasználók számát (ebook olvasó) Hozzáférés korlátozása Ha egyszer kikerült a rendszerből már semmi se védi Semmi se véd legépelés, fényképezés + karakterfelismerés ellen Esetleg a fiókba való bezárás 11 Vízjel vagy ellenőrzőösszeg (PDF) Írás stílusa alapján azonosítja a szerzőt (authorship attribution, JGAAP) Nyílt keresőszolgáltatások (pl. google) Szöveges összehasonlítás (MS Word) Tesztet generál a dolgozatból (Glatt) Ismeretlen működésű keresők Szövegdarabolással működő rendszerek (KOPI) 12 2

Szövegdarabolással működő rendszer Töredékek tömörítése szövegfájl Darabolás töredékek Tömörítés (MD5) Hash kódolk doláson alapuló tömörítés, MD5 algoritmus szöveg MD5 szám ujjlenyomat Adatbázis feltöltés adatbázis Lekérdezés eredmény A bemenet bármilyen hosszú lehet Gyors Annak az esélye, hogy két különböző szövegnek ugyanaz a kódja, nagyon kicsi Irreverzibilis, veszteséges kódolás (biztonságos) 13 14 A KOPI Plágiumkereső ismertetése KOPI Védelem KOPI Online Plágiumkereső és Információs Portál -internetes hasonlóság és plágiumkereső szolgáltatás Partner: Monash University, Melbourne 2002 ITEM pályázat (IHM-OM) MTA-SZTAKI Elosztott Rendszerek Osztály http://kopi.sztaki.hu/ A KOPI Rendszerbe feltöltött dokumentumok A plagizálás gyorsan kiderül A forrás(oka)t is megjelöli Kisebb akár egy-két mondatnyi rész egyezőségét is kijelzi Megkerülése nehézkes és nem automatizálható A lebukás kockázata jelentősen megnő mel együtt is használható 15 16 KOPI Védelem A KOPI projekt eredményei A mű szabadon terjeszthető Nem kell másolásvédelemmel foglalkozni A keresőrendszerek is hozzáférnek (google) Több ember olvashatja Több ember fog rá hivatkozni Jelenlegi rendszer hátrányai egy egységes rendszert érdemes használnia mindenkinek fel kell tölteni a védeni kívánt dokumentumokat a rendszerbe, vagy elérhetővé kell tenni Digitális könyvtárak védelme az illegális másolatoktól Tanárok, professzorok, konferenciaszervezők segítése a részben vagy egészében másolt dolgozatok illetve publikációk gyors megtalálásában és leleplezésében Diákok és cikkírók tájékoztatása a szabályos és helyes idézés formájáról és mértékéről (mértékének megállapítását a rendszer el is végzi) Diplomák és szakdolgozatok értékének növelése eredetiségük igazolásával 17 18 3

Hasonlóságkereső szolgáltatások Egyéb szolgáltatások Feltöltött dokumentumok összehasonlítása egymással Hasonló dokumentumok keresése a rendszer adatbázisaiban A felhasználó vagy mások által feltöltött dokumentumok Internetről letöltött oldalak Digitális könyvtárak (MEK) Egyetemi diplomák Portál szolgáltatások Témával kapcsolatos beszélgető-fórumok Privát üzenetküldés FAQ, nyelvváltás Dokumentumok, ismertetők Plágium vagy idézet Jogszabályok (szerzői jogok) Egyetemi szabályzatok 19 20 Tapasztalat Tapasztalat Sok esetben nem szándékos a plagizálás Nem oktatják az egyetemeken a helyes idézés módját Mekkora hasonlóságot várunk el 0% -nincs irodalomkutatás 10% 50% 100% -egyértelműen plágium Diákok és tanárok egyaránt használják a KOPI Plágiumkeresőt Több mint tízezer felhasználó 18 000 dokumentum Több mint 11 000 000 dokumentumrészlet Ebből 10 000 000 magyar BME, 400-500 diák, 5 feladat, 6 év 2007: 9 pár, 2009: 4 pár, 2010: 2 pár Nagy médiaérdeklődés 21 22 Azonosságok Támogató nyilatkozatok Vélemény a mérésről A mérés számomra egész érdekesnek bizonyult, annak ellenére, hogy sok időt vett igénybe. Hasznos dolognak tartom a kategóriákon belüli kereséseket. Vélemény a mérésről A mérés számomra egész érdekesnek bizonyult, annak ellenére hogy sok időt vett igénybe. Hasznos dolognak tartom a kategóriákon belüli kereséseket ésa dinamikus oldalmegvalósításokat. Budapesti Műszaki és Gazdaságtudományi Egyetem, Dr. Péceli Gábor rektor Budapesti Corvinus Egyetem, Dr. Mészáros Tamás rektor Debreceni Egyetem, Dr. Pethő Attila dékán, Dr. Szabadvalvi József dékán Eötvös Lóránd Tdományegyetem, Dr. Hudecz Ferenc rektor 23 24 4

Támogató nyilatkozatok Fejlesztési irányok Debreceni Egyetem Programtervező Informatikus szak, nemzetközi kísérleti akkreditációja (ASIIN) Elosztott rendszer Minden egyetemen saját szerver, de Egymás rendszerében is képesek keresni Biztonságosan, MD5 számok átvitele Adatbázis feltöltése Online és offline adatbázisok Interneten található dokumentumok Forráskódok, programozási nyelvek felismerése Fordítási plágiumok 25 26 KOPI Portal Köszönöm a figyelmüket! http://kopi.sztaki.hu Web: http://dsd.sztaki.hu Email: Mate.Pataki@sztaki.hu 27 28 5