A plágiumkeresés dilemmái és megoldásai. Nagy István Monguz Kft. Networkshop 2016

Hasonló dokumentumok
KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

World Wide DSD Web. Csoportmunka

Department of Distributed Systems MTA SZTAKI DSD

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

KOPI. KOPI Plágiumkereső A digitális tartalmak védelmében DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. Plágiumkeresés különböző nyelvek között MTA SZTAKI DSD. Pataki Máté. Department of Distributed Systems

MTA SZTAKI MTA SZTAKI

KOPI. Online Plágiumkereső és Információs Portál



Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

A DALNET24 projekt aktualitásai

Szakdolgozat tartalmi és formai követelményei

Felsőoktatási műszaki digitális tananyagfejlesztés

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

A szóbeli vizsgafeladatot ha a feladat indokolja a szaktanárok által összeállított mellékletek, segédanyagként felhasználható források egészítik ki.

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet MANYE vitaülés február 20.

Videóportálok a felsőoktatásban

Tartalom. Konfiguráció menedzsment bevezetési tapasztalatok. Bevezetés. Tipikus konfigurációs adatbázis kialakítási projekt. Adatbázis szerkezet

Szegedi Tudományegyetem Általános Orvostudományi Kar. Szakdolgozat-konzultációval és szakdolgozat-készítéssel kapcsolatos információk

Multimédiás adatbázisok

A PhysioBank adatmegjelenítő szoftvereinek hatékonysága

Dokumentumok Information kezelése? Management Információ - management. Professzionális dokumentumkezelés hiteles másolat készítés. Offisys Kft.

Könyvtárhasználati kurzusok és kompetenciák. Kristóf Ibolya, Szent István Egyetem Kosáry Domokos Könyvtár és Levéltár

Információs társadalom

ZÁRÓDOLGOZATI TÁJÉKOZTATÓ

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás


Koós Dorián 9.B INFORMATIKA

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása



SCHNETv6 IPv6 a Schönherzben. 5/7/12 Tóth Ferenc - IPv6 a Schönherzben 1

Tisztelt Intézményvezető!



Informatika tagozat osztályozóvizsga követelményei


Műszaki informatikai mérnökasszisztens. Mérnökasszisztens

Online tartalmak konzorciumi beszerzése

Dspace fejlesztési tapasztalatok, problémák és megoldások


Plágium, vagy mások eredményeinek


Faipari terméktervező Mérnökasszisztens

A szóbeli vizsgafeladatot ha a feladat indokolja a szaktanárok által összeállított mellékletek, segédanyagként felhasználható források egészítik ki.


Telepítési és Használati Útmutató


Egységes szolgáltatás kialakítása heterogén forrásokból - a Digitális Irodalmi Akadémia adatforrásainak integrálása portál környezetbe

Mesterséges Intelligencia Elektronikus Almanach

Üzletmenet folytonosság menedzsment [BCM]

icollware szoftver portfolió

A tantárgyelem kódja: KIT0402G

Magyar Lovasterápia Szövetség Alapítvány SZAKDOLGOZATI TÁJÉKOZTATÓ

GIS adatgyűjtés zseb PC-vel

TELE-OPERATOR UTS v.14 Field IPTV műszer. Adatlap

KOPI-Fotó: Plágiumkeresés egy lefotózott oldal alapján KOPI-Photo: Searching for plagiarism via a photo

Gépi tanulás a gyakorlatban. Bevezetés

Történet John Little (1970) (Management Science cikk)

INFORMATIKA TANMENET SZAKKÖZÉPISKOLA 9.NY OSZTÁLY HETI 4 ÓRA 37 HÉT/ ÖSSZ 148 ÓRA

Nyers légifotók feldolgozási lehetőségei ESRI platformon. CSUNDERLIK LÁSZLÓ GDi Esri

9. Képaláírás, kereszthivatkozás, tárgymutató és jegyzékek

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

A Nyilvános Könyvtárak Adatbázisa és a Könyvtári Minerva Gyűjtőköri Adatbázis összevonása, a könyvtárak adatainak önálló adminisztrációja

A plágiumkereső szoftverek kiskapui

Egyetemi Számítóközpont

MIDRA. A Miskolci Egyetem repozitóriuma. Espán Edina. Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2012, Veszprém

Útmutató a szakdolgozat elkészítéséhez a Társadalomtudományi és gazdasági szakfordító és tolmács szakirányú továbbképzési szakon

TÁMOP C-12/1/KONV

iphone és Android két jó barát...

Hosszú távú hiteles archiválás elektronikus aláírás segítségével. Krasznay Csaba BME Informatikai Központ

BUILD YOUR ENGLISH ÉPÍTSD AZ ANGOLOD

Adatbázisok 2018-ban ADT- ARCANUM DIGITÁLIS TUDOMÁNYTÁR AKADÉMIAI KIADÓ FOLYÓIRATAI AKADÉMIAI KIADÓ MERSZ ADATBÁZIS AKADÉMIAI KIADÓ SZÓTÁRAI CAMBRIDGE

A tantárgyelem kódja: KIT0401G. gyakorlat A tantárgyelem jellege: A tantárgyelem oktatásának ajánlott 5. félév

4. Javítás és jegyzetek

MOBIL TÉRKÉPEZŐ RENDSZER PROJEKT TAPASZTALATOK

URKUND MOODLE. oktatói kézikönyv. Tartalom. Segédlet az oktatói feladatokhoz Egyéb oktatói felület Eredményképernyő...

INFORMATIKA TANMENET 9. OSZTÁLY

DIPLOMÁS LOGISZTIKAI SZAKREFERENS SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAK. A szak képzéséért felelős szervezeti egység: Nemzetközi Gazdálkodási Tanszék

Forrásmegjelölés a portfólióban 1.0* Szakál Ferenc Pál

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

Modellek dokumentálása

Az önkormányzati térinformatikai technológia fejlődési irányai

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

Open Access - tájékoztató, dokumentáció szerzőknek és adminisztrátoroknak

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

A SZAKMAI GYAKORLAT KÖVETELMÉNYEI

ITIL alapú IT környezet kialakítás és IT szolgáltatás menedzsment megvalósítás az FHB-ban

Elektronikus kereskedelem

BIRDIE. Business Information Reporter and Datalyser. Előadó: Schneidler József

A sportszervező BSc alapszakon készítendő szakdolgozat követelményei

Táblázatkezelés Excel XP-vel. Tanmenet

Személyügyi nyilvántartás szoftver

MINISZTERELNÖKI HIVATAL. Szóbeli vizsgatevékenység



Átírás:

A plágiumkeresés dilemmái és megoldásai Nagy István Monguz Kft. Networkshop 2016

Qulto - Monguz Kft. Monguz Kft. szakterületek közgyűjteményi informatika tudás-menedzsment kulturális turizmus ~50 fő Qulto platform A közgyűjteményi informatika és a tudásmenedzsment területén szerzett két évtizedes szakértelmünk esszenciája Qulto companies Monguz Kft., Magyarország (Bp, Szeged) Cultware SRL, Románia (Kolozsvár) Cultware Sp. z o.o., Lengyelország (Varsó, Lodz)

Mit nevezünk plágiumnak? Szótár plágium: szellemi alkotás eltulajdonítása * plagizál: (idegen szellemi alkotást) a magáénak tüntet fel * Vizsgált kontextus Szakdolgozatok, disszertációk plágium vizsgálata Emberi kiértékelés Nagy méretű digitális dokumentumtárak Informatikai asszisztáló eszközök * Magyar értelmező kéziszótár

Idézet vagy plágium? Szabályos idézés nem plágium Csak nyilvános mű idézhető Tartalom nem változtatható Idézett szakasz jól láthatóan elkülönül Befogadó szöveg terjedelmével arányos Befogadó szöveg is önálló mű kell hogy legyen Idézési módok Pontos idézés, idézőjelek között, forrás hivatkozással Más szerzőtől származó tartalom újrafogalmazása, forrás megjelöléssel

Hivatkozások Hivatkozási módok Zárójelezett alak az idézett szöveg után Lábjegyzetben, felső indexszel összekötve A szövegkörnyezet által hordozva Kiegészítő hivatkozás az irodalomjegyzékben Hordozott információk a forrás műről a mű szerzője/szerzői pontos cím megjelenési dátum megjelenési hely forrás oldalszám(ok)

Plágiumkereső működése Nem plágiumot keres, csak gyanús hasonlóságokat A döntést továbbra is a felhasználó hozza Lépések Forrásdokumentum elemzése és feldolgozása Összevetés a céladatbázissal Talált hasonlóságokról interaktív és nyomtatható riport készítése Célok Fals pozitívek redukálása Minél több tényleges plágium észrevétele Hasznos riport generálás

Példa (TurnItIn)

Forrás dokumentum kezelés Szükséges funkciók Elterjedt dokumentum formátumok támogatása Nyelv detekció Egységes szövegformátumra konvertálás Dokumentum felrobbanthatósága Reprodukálható pozícionálás Könnyű megjelenítés Repozitóriumi szoftver integráció (pl. OAI-ORE) Internetes források kezelése Hozzáférhetőség kezelés (dokumentum szövege)

Dokumentum elemzés Hasonlóságkereső algoritmusok Elemzési fázis Dokumentumjellemzők kinyerése Forrásnyelvfüggő konfiguráció Köztes reprezentáció tárolása Számítási gyorsítótár építés Összevetési fázis Dokumentum jellemzők összevetése Találatok generálása (mű és pozíció adatok, pontszám)

Algoritmus követelmények Technikai követelmények Reális kiszámítási idő Reális erőforrásigény (processzor- és tárhelyigény) Működésbeli követelmények Következetes működés Adatvédelem (nem reverzibilis tárolás) Kijátszhatatlanságra törekvés

Feldolgozó algoritmusok Átfedő szöveg keresés (substring matching) A dokumentum egészének vagy részének egzakt előfordulását vizsgálja Előnyök Felismeri a direkt másolásokat Egyszerű implementáció Hátrányok Nagy tárhelyigény Számításnál nagy IO igény Rugalmatlan Gyenge adatvédelem

Feldolgozó algoritmusok Bag of words (szózsák) Dokumentumot feldolgozási egységekre bontja és jellemző vektorokat generál, majd összevetésnél koszinuszos hasonlóságot számol Előnyök Könnyen indexelhető Hatékony összevetés Irreverzibilis tárolás Hátrányok Zaj érzékeny Felbontási határokon átívelő plágiumok

Feldolgozó algoritmusok Citációs összevetés A dokumentum szövege helyett a szabványosan elhelyezett hivatkozásokat keressük és ezek között keres hasonlóságokat és egyezéseket Előny Több nyelv között is működik Hátrány Természetes nyelvi elemzést igényel Tanulóadatbázis tartalmától és minőségétől függ Kevés tapasztalat Nem egyértelmű hasznosság

Feldolgozó algoritmusok Stylometry (stílus metrika) Statisztikai módszereket felhasználva meghatározza az író jellegzetes stílusjegyeit és azon szakaszokat keresi, amelyek elütnek ettől. Előnyök Észreveszi a rejtett plágiumot Hátrányok Nehezen megvalósítható Alacsony felismerési arány

Feldolgozó algoritmusok Forrás: Wikipedia

Összehasonlító adatbázis Kulcsfontosságú a minősége Gyakori másolási forrásokkal kell feltölteni Felsőoktatási repozitóriumok dokumentumai (adat védelem) Cikkek Könyvek Internetes források Legitimitás vizsgálat Struktúrált metaadat elérhetősége

Célközönség, hasznosíthatóság Szakdolgozat írója Önellenőrzés Irodalomjegyzék készítés segítése Felsőoktatási intézmény Automatikus vizsgálat beadáskor Döntéstámogatás dokumentumok elbírálásakor Oktatási rendszer integráció (LTI)

Piacon lévő megoldások Forrás: http://plagiat.htw-berlin.de/software-en/test2013/report-2013/

Qulto plágiumkereső Pilot partnerek számára elérhető és tesztelhető Források Partnerek repozitóriumai Internetes források Jogi problémák feloldása Intézményi és központi modulok Teljes szöveg az intézménynél marad Repozitóriumi szoftver integráció Bővíthetőség (algoritmusok, források) Webes alkalmazás a kiértékeléshez Interaktív eredmény feldolgozás Riport készítés

Köszönöm a figyelmet! Nagy István inagy@monguz.hu A Qulto Plágiumkeresővel kapcsolatban keressék Czoboly Miklóst: mczoboly@monguz.hu