18. századi folyóiratok komplex feldolgozása a Debreceni Egyetemen Koltay Klára, DEENK kkoltay@lib.unideb.hu 1
Cél A DE Nyelvtechnológia és bioetika kutatási program alprogramja A 18 19. századi sajtónyilvánosság feltárása program számára korabeli szövegek kutathatóvá tétele egy kiindulási pontból Megbízható folyóirat- és hírlapszövegek elérhetőségének biztosítása Könnyen kezelhető elrendezés(ek)ben Hozzáférési pontok megteremtése Meglévő szövegkiadások integrálása 2
Feladat A program honlapján elérhetővé tenni a már rendelkezésre álló anyagokat, szövegkiadásokat (Magyar Museum, Orpheus, Uránia) Az eddig fel nem dolgozott periodikák digitalizálása, repertorizálása Meglévő eszközök használata illeszkedjen a Digitális Könyvtár elemei közé meglévő infrastruktúra és kompetenciák használata 3
Alapstruktúra DEA (D-SPACE) Digitalizált szövegek tárolása 1. metaadatok folyóiratfüzetenként böngészhető füzetlista 2. kétrétegű pdf, durva felismertetéssel teljes szövegű kereshetőség (nem megbízható) KÖNYVTÁRI RENDSZER Cikk-leírások (külön adatbázisban) MARC leírások tárgyszavazás + besorolási rekordok Katalógus jellegű keresések LINK -- a DEÁ-ban tárolt cikkekhez HONLAP Repertórium = cikkrekordokból automatikusan képződő időrendi listák, rövid leírásokkal LINK a DEÁ-ban tárolt füzetekhez; cikkekhez -- a cikkleírásokhoz 4
Digitalizált oldalak Digitalizálás: 600 dpi, minolta PS7000 Vízjelezés: Több helyről, példányból összefésült digitális példányok tulajdonos, kutató igénye: minden oldalon legyen látható a forrás 5
Felismertetés javítás nélkül Illeszkedjen a DEA gyakorlatához Lehetőség teljes szöveges keresésre Felismertetés eredménye nem elég jó Javítás jelentős élő munka ráfordítását igényelné; ezt a munkát inkább a cikkrekordok által biztosított keresési szempontok gazdagítására fordítjuk 6
Felismertetés eredményessége 7
bulgakow 8
DEÁ-ba töltés füzetenként Füzetekről készülnek metaadatok Szolgáltatott fájlok: füzet pdf-ek Eredeti szkennelt oldalak illetve a munkafolyamatokhoz különböző fázisaihoz tartozó fájlok füzet metaadatokhoz betöltve (nem láthatóak a felhasználók számára) 9
Metaadatok a DEA-ban Füzetek címe számozási adatokkal: Nem következetes a dokumentumon Formalizált számozási adatok: sorbarendezés azonosíthatóság Eredeti állapot a kapcsolt digitalizált állományban 10
Böngészés a DEÁ-ban Kategória: Régi magyar folyóiratok Gyűjtemények: egy-egy folyóirat Kategória és gyűjtemény kezdőoldalak felöltöztetése folyóiratra vonatkozó információk link az adatbázishoz a cikkszintű kereséshez 11
Cikkfeldolgozás könyvtári adatbázisban Célok: Cikk szintű kereshetőség a DEA-ban tárolt anyagokhoz + link a DEÁ-ban tárolt pdf megfelelő oldalára Nyersanyag egy honlapon böngészhető repertóriumhoz Teljes szövegű keresés pontatlanságainak kiegyensúlyozása Katalógus pontosságú keresések biztosítása Közös adatbázisban minden feldolgozott folyóirat A könyvtári adatbázishoz létrehozott besorolási rekordokból 18. századi névadatbázis 12
Leírás alapelvei, kérdéses pontjai Azonosíthatóság Cikkhatárok Címek Összefoglaló/ jellemző mondat Szerzőségi adatok Füzetek számozási adatai Kereshetőség Nevek (személy, földrajzi) egységesítés, besorolási rekordok Ismeretlen nevek is Művek, fordítások, Tárgyszavak 13
14
15
Besorolási rekordok Modern névalakok Folyóiratokban előforduló névváltozatokkal Ismeretlenek életrajzi megjegyzésekkel Bibliográfiai és besorolási rekordok kapcsolatán alapuló globális javítás lehetősége két fázisú feldolgozás: Besorolási rekordok képzése nem mindig pontos azonosítással (gyorsaság, hallgatók által készített leírások) Utólagos azonosítások, egységesítések 16
Besorolási rekordok 17
Részlegesen azonosított nevek 18
Ismeretlenek későbbi azonosításra hozzájuk tartozó előfordulásokkal 19
A szolgáltatás a DEENK digitális könyvtárában 1. Böngészés a digitalizált tartalmakban DEA Régi böngésző 2. Cikk-keresés Keresés az adatbázisban Visszatérés a megtálált tételhez a DEÁ-ba 20
Repertóriumok a program honlapján Automatikusan generálódnak a bibliográfiai rekordok alapján Egy karbantartási pont: minden javítás a bibliográfiai rekordokban történik Listák adattartalma szükség szerint utólag alakítható 21
Folyóirat kötet/ szakasz füzet Füzet pdf letölthető Füzetek cikklistája megjeleníthető 22
Füzet számozása formalizált kezdőlap kép szemlélteti az eredeti számozást Cikkről címétől link a pdf megfelelő oldalára Szerző/cím, rezümé linkek a cikkhez, a teljes leíráshoz 23
Teljes leírás besorolási adataival további keresések a katalógusban 24
A program állása Már elérhető elemek folyamatosan bővülő tartalommal: Korábban digitalizált anyagok: Magyar Múzeum, Mindenes Gyűjtemény, Orpheus, Regélő ( Digitális könyvtár DEA) (http://www.lib.unideb.hu/hu/digitalis_konyvtar_folyoiratok ) Jelenleg digitalizált anyagok folyamatosan hozzáférhetővé válnak a DEÁ-ban: Magyar Hírmondó, Hadi és Más Nevezetes Története, Pozsonyi Magyar Múzsa, bétsi Magyar Múzsa (http://ganymedes.lib.unideb.hu:8080/dea/handle/2437/97458 ) Elérhető cikk-leírások: Regélő, folyamatban: Magyar Hírmondó, Hadi és Más Nevezetes Történetek, Pozsonyi és bétsi Magyar Múzsa (http://webpac.lib.unideb.hu/rege/ ) Hamarosan megjelennek: folyóiratlisták első verziói a már elkészült bibliográfiai rekordok alapján 25
Köszönet Digitalizált anyagok illetve az eredeti dokumentumok rendelkezésre bocsátásával jelentősen hozzájárultak a programhoz: Debreceni Református Kollégium Nagykönyvtára Ráday Gyűjtemény Fővárosi Szabó Ervin Könyvtár Magyar Tudományos Akadémia Könyvtára Pannonhalmi Főapátsági Könyvtár 26