Múzeumi könyvtárak a digitális korban Félcédulás tapasztalatok avagy retrokonverzió szakkönyvtári környezetben Dr. Andaházi Szeghy Viktor andaszegi.viktor@mailmilitaria.hu MKE 44. Vándorgyűlése 2012. 07. 13. Győr
Retrospektív konverzió 1. Mi is a retrospektív konverzió? 2. Munkafolyamat, eszközök, lehetőségek 3. Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 Múzeumok a digitális korban 1. Cédula típusok I. - Szabvány 2. Cédula típusok II. Nem szabvány 4. Feldolgozói tapasztalatok 5. Összegzés 6. Idő - pénz
1. Mi is az a retrospektív konverzió? - Cél és módszer - Gyűjtemény - nyilvántartás Rekatalogizálás Újrakatalogizálás (autopszia) Retrokonverzió Visszatekintő átalakítás (katalóguscédula) Könyvtári dokumentumok kereshető adatbázisa
2. Munkafolyamat, eszközök, lehetőségek A retrokonverziós munkafolyamat elvi ábrája Elvárt nagy pontosság Manuális Automatizált Szkennelés OCR XML IKR konverzió Adattisztítás Betöltés TIFF XML MARC Adatok TIFF Mutató a képhez Teszt adatbázis Éles adatbázis
3. Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 Múzeumok a digitális korban Döntés előkészítési szempontok: Adottságok: Nagyon heterogén állomány (1534-1996, régi könyvek, kevés ISBN és ISSN, sok külföldi anyag, speciális dokumentumok) Adat-teljes master katalógus Csak helyben használható adatforrás (katalógusok) Lehetőségek: Szabvány cédulák, részben szabvány leírások feldolgozás gyorsítása Cédulakép felhasználása az adatkorrekciónál Egynemű gyűjteményi részek leválogatása (szabályzat, zárt, stb.) Kockázatok: Többféle leírási forma OCR és konverziók hatásfoka (vs. manuális munka)
Egy modell: Hadtörténeti Könyvtár TÁMOP 3.2.4/1/KMR/09 Múzeumok a digitális korban Rekat. Retro. Idő munkaidőben 0-24 - távmunka Költség manuális munka gépesíthetőség Minőség kézi adatbevitel gépi feldolgozás + kézi adatbevitel
Fázisok A Hadtörténeti Könyvtár retrokonverziós munkafolyamatának elvi ábrája Elvárt: 90% fölötti pontosság Manuális: Rekord import Cédulakép alapján Szkennelés OCR XML HunTéka konverzió Korrektúra Betöltés Alap katalógus TIFF Jelzet, szerző, egyéb szöveg TIFF Mutató a képhez XML HUNMARC Teszt adatbázis Éles adatbázis
Cédula típusok I. Szabvány Raktári jelzet Leltározási adatok Elkülöníthető adatok: Szerzőség Cím Kiadás Terjedelem Egyéb adatok Fő jellemzők: Példány adatok Jól elkülönülő információk (MSZ 3424/1 szerint:. - ) Könnyen felismertethető szövegrészek
Elsődleges MARC rekord: (Eredeti értékek, szkennelés után) 856 (Elektronikus hely és hozzáférés) 852 (Elhelyezés) 65161 6e99c3e8c0cf4d38ac4306b1e65816d1.tif 500 (Általános megjegyzés) Teleki Sámuel albuma / Kisérő tanulmánnyal közread. Jankrovics. József. Szeged : JATE Pedagógiai tanszéké,. 1991, - 59 p. : ill, 7948 ; 8 ) Perearinatio Hungarorum, ISSN 0238 Névmutató. - Bibliogr. a jegyzetekben ISBN 963 481 859 5 1 pld. Jankovics József (közread.) Teleki Sámuel
Másodlagos MARC rekord: (HUNMARC adatcsoportok értékei a konverzió után) 009 3709 005 (A rekorddal végzett utolsó művelet dátuma és időpontja ) 20110808135231.0 008 (Meghatározott jellemzők és információs adatok) 110808s 1 022 (ISSN) ISSN 0238Névmutató 040 a, b (A leírás forrása) HM, hun 245 a, b, c (Cím és szerzőségi közlés) 260 (Megjelenés) 1991 Teleki Sámuel albuma, Jankrovics, Kisérő tanulmánnyal közread 300 (Terjedelem) 991, - 5 500 (Általános megjegyzés) Teleki Sámuel albuma / Kisérő tanulmánnyal közread. Jankrovics. József.? Szeged : JATE Pedagógiai tanszéké,. 1991, - 59 p. : ill, 7948 ; 8 ) Perearinatio Hungarorum, ISSN 0238 Névmutató. - Bibliogr. a jegyzetekben ISBN 963 481 859 5 1 pld. Jankovics József (közread.) Teleki Sámuel 599 (Helyi használatú megjegyzés) hm_1 852 a, b, i, k, m, s, x (Elhelyezés) HM, Retrospekív feldolgozás, 65161, nem_kolcsonozheto, 65161, 65161, feldolgozas_alatt 856 (Elektronikus hely és hozzáférés) 6e99c3e8c0cf4d38ac4306b1e65816d1.tif
Katalógusba töltve Korrigálandó adatok
Katalógusba töltve vs. korrektúrázva
Cédula típusok II. nem szabvány Raktári jelzet ETO szám Egyéb besor. cím Cím és egyéb adatok Leltározási információk Fő jellemzők: Kevés elkülöníthető adatcsoport Nehezen felismertethető szövegrészek Nehezen importálható dokumentumok Példány adatok
Elsődleges MARC rekord: (Eredeti értékek, szkennelés után) 856 (Elektronikus hely és hozzáférés) afa058c43df64225a4238ecc1f7af57d.tif 852 (Elhelyezés) sz 3493 500 (Általános megjegyzés) Fegyverzeti teljességi utasítás a 10.5 cm 40/43 M. roham tarack és a 7.5 cm 43 M. rohamágyú részére. Bp. ny.n. 1944. 13 p. 28 cm.f-23
Másodlagos MARC rekord: (HUNMARC adatcsoportok értékei a konverzió után) 009 243831 005 (A rekorddal végzett utolsó művelet dátuma és időpontja ) 20110808143540.0 008 (Meghatározott jellemzők és információs adatok) 110808s 1 040 a, b (A leírás forrása) HM, hun 245 a, b, c (Cím és szerzőségi közlés) Fegyverzeti teljességi utasítás a 10 260 a, b, c (Megjelenés) Bp., 5 cm 40/43 M, 1944 300 a, c (Terjedelem) 13 p., 0.5 cm 500 (Általános megjegyzés) Fegyverzeti teljességi utasítás a 10.5 cm 40/43 M. roham tarack és a 7.5 cm 43 M. roham-ágyú részére. Bp. ny.n. 1944. 13 p. 28 cm.f- 23 599 (Helyi használatú megjegyzés) hm_db 852 a, b, i, k, m, s, x (Elhelyezés) HM, Retrospekív feldolgozás, sz 3493, nem_kolcsonozheto, sz 3493, sz 3493, feldolgozas_alatt 856 (Elektronikus hely és hozzáférés) afa058c43df64225a4238ecc1f7af57d.tif
Betöltve, korrektúrázva Javított adatok Manuálisan hozzáadható, egyéb információk: ETO szám Leltározási adatok Példányszám Tárgyszavak
4. Feldolgozói tapasztalatok Adat típus 245 a, b, c (Cím és szerzőségi közlés) Gépi arány Megjegyzés 100% fő- alcím, egyéb címadat szétválasztása: manuál 260 a, b, c (Megjelenés) 90% nagyobbak, elterjedtebbek esetében jó arány, egyébként manuális 300 a, c (Terjedelem) 90-100% p-p. esetében a második szám került be 852 a, b, i, k, m, s, x (Elhelyezés) 98-100% Retrospektív feldolgozás, feldolgozás alatt manuál 856 (Elektronikus hely és hozzáférés) 99%
Feldolgozói tapasztalatok Címadatok karakter egyezése közel 100% (aláhúzás, â, è, ş) A címadatok szétválasztása: fő- alcím, egyéb címadat manuál Kiadás helye: Budapest, Bp. Wien, Paris, Kolozsvár, stb. 90 %-os megfelelés, ritkábbak manuálban Kiadó: nagyobbak: 90%, többi manuál Terjedelmi adatok: oldalszám 90%, melléklet megléte közel 100% (értelmezése: manuál), méret (cm esetén) 100% Sorozat adatcsoport: a legproblémásabb - pl. többkötetes könyv közös főcíme került a sorozati adat helyére manuál Személynevek segédállománya jól használható (I. V. Stalin legalább 40-féle formában volt megtalálható) egységesítés: manuál Testületi név segédállomány teljesen üres manuális felvétel egységesítés utólag Rendezvény név szintén, Földrajzi név szintén Leltári szám: közel 100%, néhol karaktertévesztés, Kötelező HURF összefoglaló nézet a rekord mentése előtt
5. Összegzés: - Csodák pedig nincsenek Hátrány (elvárástól való eltérés): Minden rekordhoz hozzá kell nyúlni (kb. 0.5 % volt tökéletes) Előny: Platform-független megoldás (Java) Szerver-kliens rendszer: 24 órás elérhetőség Mobilitás (szkennelt adatok) Nincs újragépelés (további szövegromlás lehetősége) Lehetőség: Alapkatalógus kiegészítő adatai (leltár, ETO, stb.) Rekord import kiterjesztése (pl. 1976-ra szűrés a magyar kiadványoknál) Adatpontosság növelése költségcsökkentés Egyebek: Online hibabejelentő felület gyors technikai segítség Folyamatos, jól működő kapcsolat alapfeltétel
6. Idő pénz Munkafázis Időtartam* Bekerülési költség/db** Szkennelés 2 nap OCR 4 hét 25 Ft Konverzió 2 hét 60 Ft Korrektúra 5 hónap*** 80 Ft * Nettó idők: betöltéseken, tesztüzemen, próba szériákon túl ** Nagyságrendi, kerekített összegek *** Heti átlagok: 124-5778 (!) db. között
Partnerek Képfeldolgozás: pont IT Üzletviteli Tanácsadó és Szolgáltató Kft. Konverzió: Monguz Információtechnológiai Kft. Korrektúra: Katatár Könyvtári és Ügyviteli Adatfeldolgozó Kft.
Köszönöm szíves figyelmüket! Dr. Andaházi Szeghy Viktor - andaszegi.viktor@mail.militaria.hu MKE 44. Vándorgyűlése 2012. 07. 13. Győr