Dr. Pajor Enikő főiskolai docens. Vincze Andrea III. évfolyamos hallgató informatikus könyvtáros szak levelező tagozat



Hasonló dokumentumok
Hatóságok csatlakozása az ÉTDR-hez

EGYSZERŰ ELJÁRÁS AJÁNLATTÉTELI FELHÍVÁSA A

Word 2010 magyar nyelvű változat

BEFOGADÓI TÁJÉKOZTATÓ V 1.0. Tájékoztató anyag az elektronikus számlabefogadó oldal számára

FELHÍVÁS a XXXIII. Országos Tudományos Diákköri Konferencia Testnevelés- és Sporttudományi Szekciójában való részvételre

FELHÍVÁS a XXXIII. Országos Tudományos Diákköri Konferencia Állam- és Jogtudományi Szekciójában való részvételre

KIBOCSÁTÓI TÁJÉKOZTATÓ V 1.0. Tájékoztató anyag az elektronikus számlakibocsátói oldal számára

12. tétel. Lemezkezelés

AZ EURÓPAI KÖZÖSSÉGEK BIZOTTSÁGA

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

AJÁNLATTÉTELI DOKUMENTÁCIÓ

PENTA UNIÓ Zrt. A nemzetközi munkaerő-kölcsönzés személyi jövedelemadó kérdésének vizsgálata Magyarországon és egyes tagállamokban NÉV: SZABADOS ÉVA

Integrált ügyviteli rendszer: Kettős könyvelés modul

ELŐTERJESZTÉS. Egyszerű többség. Dombóvár Város Önkormányzata Képviselőtestületének április 7-i ülésére. Tárgy:

MUNKATERV DEÁK FERENC MEGYEI ÉS VÁROSI KÖNYVTÁR 2013.

Felhasználói leírás v1.0

Javaslat AZ EURÓPAI PARLAMENT ÉS A TANÁCS RENDELETE

TERC V.I.P. Összevont Épít ipari Költségvetés-készít Programrendszer

INFORMATIKA Helyi tantárgyi tanterv

ERserver. iseries. Szolgáltatási minőség

FELHÍVÁS a XXXIII. Országos Tudományos Diákköri Konferencia Had- és Rendészettudományi Szekciójában való részvételre. A Szekció honlapja:

Az információs társadalom lehetőségeivel csak azok a személyek tudnak megfelelő módon élni, akik tudatosan alkalmazzák az informatikai eszközöket,

Gyarmati Dezső Sport Általános Iskola. Informatika HELYI TANTERV 6-8. ÉVFOLYAM. KÉSZÍTETTE: Oroszné Farkas Judit Dudásné Simon Edit

BESZÁMOLÓ. A Magyar Mozgókép Közalapítvány Alapítói számára

feladatok meghatározása során elsősorban az eszközök ismeretére, az eszközökkel megvalósítható lehetőségek feltérképezésére és az alkotó

oda egy nagy adatbázisba: az eszközök nincsenek egy koncentrált helyre begyűjtve, azaz minden egyes eszközt külön-külön kell megszerezni egy

J e g y z ı k ö n y v

KÖNYVTÁRHASZNÁLATI SZABÁLYZATA

Pályázati lehetőségek. civil szervezetek részére május 20.

S Z E R V E Z E T I É S M Ű K Ö D É S I

/Márai Sándor: Az igazi/

Szakdolgozat GYIK. Mi az a vázlat?

Az informatika tantárgy fejlesztési feladatait a Nemzeti alaptanterv hat részterületen írja elő, melyek szervesen kapcsolódnak egymáshoz.

ZÁRÓ PROJEKT ELŐREHALADÁSI JELENTÉS Kérjük, az űrlap kitöltését megelőzően olvassa el az útmutatót!

A Nyíregyházi Fıiskola Informatikai Szolgáltató Központ Ügyrendje

AZ EGYETEMI KÖNYVTÁR RÉGI NYOMTATVÁNYAINAK DIGITALIZÁLÁSI TERVE ÉS A VIRTUÁLIS KIÁLLÍTÁSOK, ESETTANULMÁNNYAL

AJÁNLATTÉTELI FELHÍVÁS

Informatikai eszközök és anyagok

10193/12 KH/md DG E2

INFORMATIKA 5. évfolyam

Adóigazgatási szakügyintéző

EURÓPAI PARLAMENT C6-0040/2007 HU PART.1. Közös álláspont. Ülésdokumentum 2003/0153(COD); 29/11/2006

Partnerség erősítésének lehetőségei az Önkormányzat és a település lakossága között TANULMÁNY

Város: Szentendre NUTS-kód:HU102 Postai irányítószám:2000 Ország:Magyarország. Kapcsolattartó személy: Werner Ákos igazgató Telefon:

SZOLNOKI FŐISKOLA Ú T M U T A T Ó

Általános Műszaki Ajánlat

Külső Határok Alap IGAZSÁGÜGYI ÉS RENDÉSZETI MINISZTÉRIUM KÜLSŐ HATÁROK ALAP PÁLYÁZATI ÚTMUTATÓ AZ IRM/EUTAMO/33-3/2008. SZ. PÁLYÁZATI FELHÍVÁSHOZ

Munkaterv a évre

MISKOLCI VÁROSI KÖNYVTÁR

A szakdolgozat készítésének folyamata, tartalmi és formai követelményei

xha attól eltérő, kérjük töltse ki az A.III mellékletet

PÁLYÁZATI FELHÍVÁS az Akkreditált Innovációs Klaszter cím elnyerésére. Kódszám: AIK-2011

Asztali PC-k, notebookok beszerzése

A Dél-Dunántúli Régió Információs Társadalom Stratégiája (DD-RITS)

PEDAGÓGUSOK ÉS AZ IKT KOMPETENCIATERÜLET

Pályázati lehetőségek. civil szervezetek részére február 18.

Budapesti Gazdasági Főiskola KÜLKERESKEDELMI FŐISKOLAI KAR GAZDASÁGDIPLOMÁCIA ÉS NEMZETKÖZI MENEDZSMENT SZAK Nappali tagozat EU-kapcsolatok szakirány

STATISZTIKAI MÓDSZERTANI FÜZETEK, 45 A KULTURÁLIS STATISZTIKA MÓDSZERTANA ÉS FOGALMAI

EGYENLŐ BÁNÁSMÓD HATÓSÁG Elnök

Beszámoló az Arany János Városi Könyvtár évi tevékenységér l. Szakmai tevékenységünket az évi CXL. törvényben el írtak szerint végezzük.

FELHÍVÁS. A mezőgazdasági üzemek összteljesítményének és fenntarthatóságának javítására. A felhívás címe:

A MISKOLCI EGYETEM BELSŐ ELLENŐRZÉSI KÉZIKÖNYVE

Adataink biztonságos tárolása és mentése

Minden jog fenntartva, beleértve bárminemű sokszorosítás, másolás és közlés jogát is.

PÁLYÁZATI FELHÍVÁS a Környezet és Energia Operatív Program KEOP-1.1.1/ Települési szilárdhulladék-gazdálkodási rendszerek fejlesztése

Közbeszerzési Értesítő száma: 2016/65. Eljárás fajtája: Közzététel dátuma: Iktatószám: 6345/2016 CPV Kód:

ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK. az Opten Informatikai Kft. Törvénytár, EU Törvénytár, Cégtár és APAFI szolgáltatásának igénybevételére

PENTA UNIO OKTATÁSI CENTRUM

ÁLTALÁNOS SZOLGÁLTATÁSI FELTÉTELEK I. ÁLTALÁNOS RENDELKEZÉSEK

ELŐTERJESZTÉS a Magyar Tudományos Akadémia 185. közgyűlésére május 6.

Asztali PC-k, notebookok

AJÁNLATTÉTELI FELHÍVÁS

BESZÁMOLÓ FERTŐD VÁROSI KÖNYVTÁR ÉVI TEVÉKENYSÉGÉRŐL. 1. Szervezeti keretek, feltételek

RENDKÍVÜLI HARDVER ÉS SZOFTVER VÁSÁRLÁSI AKCIÓ

Papír irodaszerek, irodai fogyóanyagok, irodaszerek, irodatechnikai eszközök beszerzése

Közigazgatási szerződés

Kitöltési útmutató a muzeális intézményekről szóló OSAP 1444-es adatgyűjtő kérdőívhez

Microsoft Office 2010

J e g y z ı k ö n y v

194/2005. (IX. 22.) Korm. rendelet

Kiegészítő melléklet a Szentes Városi Könyvtár Nonprofit Közhasznú Kft évi beszámolójához

BVK Budapesti Városüzemeltetési Központ Zártkörűen Működő Részvénytársaság : az

Károli Gáspár Református Egyetem

32. szám 125. évfolyam november 5. TARTALOM. 69/2010. (XI. 05. MÁV Ért. 32.) EVIG számú elnök-vezérigazgatói

ÜDE FOLT A HOMOKHÁTSÁGBAN!

ÁLTALÁNOS TÁJÉKOZTATÓ

a készülék gyártója között, aki a szoftvert a készülékkel terjeszti; vagy a szoftver telepítője között, aki a szoftvert a készülékkel terjeszti.

Útmutató új vizsgahely létesítését vagy meglévő vizsgahelyszín módosítását, bővítését kérő beadvány benyújtásához

8/2010. (I. 28.) Korm. rendelet. a vis maior tartalék felhasználásának részletes szabályairól

AZ EURÓPAI UNIÓ TANÁCSA. Brüsszel, április 7. (14.04) (OR. en) 8159/10 EUROPOL 13 ENFOPOL 89 JAIEX 33 COWEB 95

Hordozható TETRA rádiók és tartozékaik, valamint programozó szettek beszerzése

Dr. Pétery Kristóf: CorelPHOTO-PAINT 12 Kezdő lépések

Penta Unió Zrt. Az Áfa tükrében a zárt illetve nyílt végű lízing. Név:Palkó Ildikó Szak: forgalmi adó szakirámy Konzulens: Bartha Katalin

A MÉLIUSZ JUHÁSZ PÉTER KÖNYVTÁR ÉVI MUNKATERVE

Pályázati lehetőségek. civil szervezetek részére június 17.

2016 a külhoni fiatal magyar vállalkozók éve program keretében

A SOMOGYI KÁROLY VÁROSI ÉS MEGYEI KÖNYVTÁR ÉVI MUNKATERVE

Útmutató. a szakdolgozat elkészítéséhez. Szegedi Tudományegyetem Egészségtudományi és Szociális Képzési Kar

Optikai karakterfelismerés

FELHÍVÁS. A mezőgazdasági üzemek összteljesítményének és fenntarthatóságának javítására. A felhívás címe:

Átírás:

Szegedi Tudományegyetem Juhász Gyula Tanárképző Főiskolai Kar Könyvtártudományi Tanszék SZAKDOLGOZAT A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása Konzulens: Dr. Pajor Enikő főiskolai docens Készítette: Vincze Andrea III. évfolyamos hallgató informatikus könyvtáros szak levelező tagozat Szeged, 2005.

Tartalomjegyzék Bevezetés 3 1. A könyvtárak szerepe kulturális kincseink digitalizálásban 4 1.1. Digitalizálási projektek a világban 4 1.2. Magyarországi digitalizálási kezdeményezések, projektek 8 2. A Békés Megyei Könyvtár digitalizálási projektjei 9 2.1. A pályázat megírása 11 2.2. A pályázat megvalósítása 13 2.2.1. Előkészületek 13 2.2.2. A digitalizáló műhely kialakítása 14 2.2.2.1. Szerverek beszerzése 14 2.2.2.2. Munkaállomások beszerzése 16 2.2.2.3. Szkennerek beszerzése 18 2.2.2.4. A műhely elhelyezése a könyvtár épületében 20 2.2.3. Digitalizálás 22 2.2.3.1. A dokumentumok digitális formátumának létrehozása 22 2.2.3.1.1. A kötetek digitális formátumának létrehozása 24 2.2.3.1.2. Mikrofilmen lévő dokumentumok digitális formátumának létrehozása 25 2.2.3.2. A dokumentum digitális formátumának feldolgozása 26 2.2.3.2.1. A Haan kötetek szöveges formátumának létrehozása 26 2.2.3.2.2. A Békésmegyei Közlöny szöveges formátumának létrehozása 30 2.2.3.2.3. A dokumentumok publikálásra kerülő kép formátumainak létrehozása 32 2.2.3.3. A digitalizált dokumentumok közzététele 33 2.2.3.4. Fejlesztési lehetőségeink, terveink 47 3. Összegzés 49 Irodalomjegyzék 50 Függelék 53 A Békés Megyei Könyvtár 2003-2007. évi digitalizálási koncepciója (2003) 53 Bevezetés 53 1

Előzmények 53 Békés Megyei Könyvtár digitalizálási koncepciója 54 A Békésmegyei Közlöny 3 oldala 58 Website tervezés és megvalósítás lépései (általánosságban) 61 A website alkotóelemeinek listája 61 A website tervezésének lépései 62 Téma átgondolása 62 Megvalósítás 63 Fogalmak 64 JaDoX editor használati útmutatója 65 Bejelentkezés 65 Dokumentum 65 Módosítás 65 Fájl 65 Megnyitás 65 Mentés 66 Kilépés 66 Nézet 66 2

BEVEZETÉS BEVEZETÉS A szakdolgozati téma választása számomra nem okozott gondot, magától adódott, hogy arról írjak, amin dolgozom, amiben részt veszek. Munkahelyem, a Békés Megyei Könyvtár 2003-ban benyújtott egy digitalizálási pályázatot, melyet meg is nyert. Abba a szerencsés helyzetbe kerültem, hogy ennek a projektnek a megszületésében, megvalósításában bábáskodhattam. Egy ilyen projekt megvalósítása komoly csapatmunkát igényel. A munka során különféle tapasztalatokra, új ismeretekre tettem szert. Úgy gondolom ezeknek a tapasztalatoknak, ismereteknek, a munka során elért sikereknek és elkövetett hibáknak a leírása egy szakdolgozat keretében elsősorban önmagam számára hasznos, hiszen a dolgozat megírása az egész projekt megvalósításának átgondolására késztet. Így könnyebben vonhatom le a tanulságokat, s egyben megoldódik a szakdolgozati téma kérdése is. A dolgozat az én szemszögemből íródott, a saját és munkatársaim tapasztalatait, a munkám és a tanulás során megszerzett ismereteimet jegyeztem le. A teljességre és tárgyilagosságra való törekvésem tehát csak viszonylagos lehet. Talán dolgozatom segítséget nyújthat néhány kíváncsi, érdeklődő embernek is alapvető digitalizálási ismereteik megszerzéséhez, vagy bővítéséhez. A megvalósított projekt munkahelyem történetében jelentős mérföldkőnek számít. Így ez a dolgozat, könyvtárunk történetét (egy lehetséges, jövőbeni) összefoglaló munka egyik forrásául is szolgálhat. Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani konzulensemnek, Dr. Pajor Enikőnek a dolgozat megírásához nyújtott hasznos tanácsaiért, támogatásáért, töretlen bizalmáért. Továbbá köszönettel tartozom a projekt vezetőjének Toldi Klárának és a digitalizálásban, a projekt megvalósításában résztvevő valamennyi munkatársamnak, hogy készséggel megosztották velem tapasztalataikat, valamint az ikron Kft valamennyi munkatársának, (akikkel élmény volt együtt dolgozni) de legfőképpen Kármán Lászlónak és Sóti Róbertnek, akik nagymértékben hozzájárultak ismereteim gyarapításához és a dolgozat megírásához szükséges szakmai információk pontosításához. Utoljára, de nem utolsó sorban férjemnek és gyermekeimnek támogatásukért, belém vetett hitükért. 3

A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN 1. A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSBAN A XIX-XX. század technikai fejlődése magával hozta a számítástechnika létrejöttét és rohamos fejlődését. Az informatika fejlődése szorosan kapcsolódik ennek a tudományterületnek, iparágnak a fejlődéséhez, hisz a számítástechnikai, modern távközlési eszközöknek köszönhetően az információs folyamatok földrajzi határai kitágultak. Az információ átadásának, megszerzésének ideje ugrásszerűen lecsökkent. A könyvtárak szerepe nem változott, csupán az információ hordozó eszközök száma gyarapodott. Valamennyi információ hordozó eszköznek meg van a maga előnye és hátránya, még a legkorszerűbbeknek is. A könyvtáros feladata többek között ezen eszközök előnyeinek lehető legnagyobb mértékű felhasználása - hátrányainak figyelembe vételével - tevékenysége során. A könyvtáros munkája az új technikai eszköznek köszönhetően egyrészt könnyebbé vált, másrészt a könyvtárosnak újabb kihívásokkal, problémákkal kell megbirkóznia. Napjainkban a különféle dokumentumok létrehozásakor egyre nagyobb mértékben kap szerepet a digitális technika. Az így létrejött digitális dokumentumok tárolása, megőrzése, hozzáférhetővé tétele szintén a könyvtárak feladata. Az utóbbi 1-2 évtized új technikai eszközeinek segítségével lehetővé vált a régi, rossz állapotban lévő, illetve a ritkaságnak számító dokumentumok digitalizálása. A digitalizálás (digitization) a számítástechnikai szemszögből analóg adatok átalakítását jelenti digitális adatokká. Az informatika jelenlegi fogalomrendszerében és gyakorlatában ez az eredetileg nem számítástechnikai eszközökkel készült dokumentumok konvertálást, vagyis a számítógépes tárolásra, feldolgozásra, visszakeresésre alkalmas digitális formátumának létrehozását jelenti. 1.1. Digitalizálási projektek a világban A XX. század utolsó évtizedeiben szerte a világon számtalan digitalizálási projekt indult el például a Gallica projekt, a Gutenberg projekt, amely az emberi kultúra írott műveinek megőrzését tűzte ki célul. Kialakultak a digitális könyvtárak szinonim néven az elektronikus könyvtárak. Az egyedi kezdeményezéseket követően a digitalizálással foglalkozó intézmények, szakemberek viszonylag hamar rájöttek az összefogás, a közös módszerek, a szabványok kialakításának szükségességére. Az egyik ilyen sikeres 4

A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN kezdeményezés a sok közül a DLF. Az Egyesült Államokban a Digitális Könyvtári Szövetség megalakulása az 1995. május 1-jén az USA tizennégy legnagyobb kutatói könyvtárának és két másik szervezet vezetői által aláírt egyezménnyel kezdődött. Az aláírók a Digitális Könyvtári Szövetség (Digital Library Fedaration = DLF) létrehozásában állapodtak meg. A DLF hivatalosan 1996-ban alakult meg. Célja, a nemzeten belüli és azon kívüli, Amerika örökségét és kultúráját dokumentáló digitális anyagok összegyűjtése, hozzáférhetővé tétele a hallgatók, az oktatók és a polgárok számára. A szövetség saját website-ja (www.diglib.org) bárki számára hozzáférhető. A szövetség tevékenysége sokrétű (elektronikus folyóirat-archiváló program, tanulmányok kiadása, szabványok és irányelvek kidolgozása, LIBLICENSE modell létrehozása az elektronikus hozzáféréshez, a Nyílt Archívum Kezdeményezése stb.). A DLF azért sikeres, mert a könyvtárosok készek közös erőfeszítéssel, szakértelemmel, elhivatottsággal jobbá tenni nemcsak saját intézményüket, hanem az egész könyvtári digitális világot. A Bibliotheca Universalis ötlete a művészetpártolásáról, könyvszeretetéről és műveltségéről híres Francois Mitterand volt francia kormányfőtől származik. 1994. júliusában a G7-ek országainak nápolyi csúcstalálkozójának egyik kiemelt témája a világméretű információs társadalom fejlesztésének támogatása volt. 1995. február 25 26- án Brüsszelben rendezett miniszteri konferencián megszülettek a támogatást érdemlő nemzetközi együttműködési projektek, a részvevők meghatározták a megoldandó feladatokat. 11 konkrét kísérleti program született meg, közöttük az egyetemes világkönyvtár, a Bibliotheca Universalis életre hívása, melynek felelőse Franciaország és Japán lett. A Bibliotheca Universalis program legfontosabb célja a világ tudományos és kulturális örökségének hozzáférhetővé tétele közös multimédiás technológiák által. A világ digitalizálási programjait egyetlen nagy, osztott virtuális ismeretgyűjteménybe, könyvtárba kívánják szervezni... 1 IFLA 1997 szeptemberében Koppenhágában megrendezett Bibliotheca Universalis konferenciáján született döntés a digitalizációs programok információcseréjéről, az európai nemzeti könyvtárak webszerverén, a GABRIEL-en való Bibliotheca Universalis honlap elkészítéséről, a virtuális világkönyvtár tartalmának közös feltöltéséről olyan témakörökkel, amelyek minden tagországot egyformán érdekelnek, érintenek. 1 Pajor Enikő: Conrad Gesnertől a virtuális Bibliotheca Universalisig In: Könyvtári Figyelő [online] 48. évf. 2002. 4. szám [2004.12.11.] <http://www.ki.oszk.hu/kf/2002/4/pajor.html> 5

A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN A program eddig elkészült részei 2002 augusztusától országonkénti csoportosításban, látványos virtuális történelmi séták, irodalmi alkotások kíséretében már várják a látogatóikat a világhálón 2, a http://www.bl.uk/gabriel/bibliotheca-universalis URL címen. A másik hasonlóan sikeres kezdeményezés a MINERVA 3 projekt. Az együttműködésnek tagjai az Európai Uniós országok vonatkozó minisztériumai vagy egyéb központi állami intézményei. Célja, hogy elősegítse a közös gondolkodás és módszerek létrejöttét az európai kulturális értékek digitalizálásában. A projekt célja az európai kulturális örökség egyedül álló értékének megőrzése, és annak a stratégiai szerepnek a felismerése, amelyet betölthet a növekvő európai digitális tartalomiparban. Fontosnak tartja, és nagyra értékeli a nemzeti kormányok és kulturális szervezetek erőfeszítéseit, amelyek a digitalizálási munkákban való együttműködés minél magasabb szintű megvalósítására irányulnak. 4 A projekt jelentősége abban áll, hogy összefogja és koordinálja a különböző országok digitális projektjeit. A MINERVA project előzménye a 2001 áprilisában Lundban, az európai országok képviselőinek a soros svéd elnökség és az Európai Bizottság égisze alatt megtartott találkozó volt, ahol a résztvevők elkötelezték magukat amellett, hogy őrködni fognak a Lundi alapelvek eszméje felett a kulturális és tudományos tartalom digitalizálása során. Erre a célra létrehozták az országos főhatóságok képviselőinek állandó csoportját (OKCS), továbbá kialakították a digitalizálási koncepciók és programok koordinációs mechanizmusainak megvalósítási keretét, a Lundi akciótervet. A Minerva projekt 2002 márciusában az Európai Bizottság támogatásával indult el az Olasz Kulturális Örökség és Tevékenységek Minisztériuma koordinálásával. A projekt a Lundi akcióterv megvalósításának operatív kereteit adja. A projektet az OKCS titkársága működteti. A Pármai charta azoknak a feltételeknek és cikkelyeknek az összessége, melyekben 2003. november 19-én állapodott meg Pármában az Európai Unió országos kulturális főhatóságai által kinevezett országos képviselők csoportja. 2 Pajor i.m. 3 Ministerial Network for Valorising Activities in Digitisation 4 Sikeres digitalizálás lépésről lépésre In: Magyar Elektronikus Könyvtár [online] Bp. : OSZK, 1995. [2005.01.22.] <http://www.mek.oszk.hu/minerva/html/dok/goodpractice_hun.pdf> 6

A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN A tagállamoknak az a felismerése, hogy a rendkívül gazdag európai kulturális és tudományos örökség védelmére és értékének megőrzésére nagy figyelmet kell fordítani, meghatározta a kulturális és tudományos örökséggel kapcsolatos kezdeményezésekre vonatkozó politikáját. Ebben a politikában megmutatkozik az információs társadalom beköszöntének és az új információs és kommunikációs technológiák elterjedésének hatása. A tagállamok fontosnak tartják, hogy Európa közös kulturális örökségének védelméről, és értékeinek megőrzéséről gondoskodjanak, fenntartsák a sokszínűséget, a polgárok számára biztosítsák az ehhez az örökséghez való jobb hozzáférést, fellendítsék az oktatást és idegenforgalmat, és részt vegyenek az új, a digitális tartalommal és a digitális szolgáltatással foglalkozó iparágak fejlesztésében. Ezen célok eléréséhez szükséges, a chartában megfogalmazott feltételek lényege: erőteljes igény a koncepcionális és intézményi stratégiák létrehozására és összehangolására; irányelvek és a bevált gyakorlatból vett példák szükségessége a digitalizálási kezdeményezések költséghatékonyságának és minőségének javítása érdekében; a közös működtetést támogató szabványok alkalmazása, ezáltal a hozzáférés javítása a digitális erőforrásokhoz; központ létrehozása a kulturális tartalom országos digitalizálási koncepcióinak európai szintű koordinálására; tapasztalatok megosztása a tagállamok között, a további együttműködésen alapuló fejlesztések, problémamegoldások és kutatási teendők meghatározásának céljából. A Pármai charta cikkelyei: 1. Az új technológiák intelligens felhasználása 2. Hozzáférhetőség 3. Minőség 4. A szellemi tulajdonjog és a személyes adatok védelme 5. Közös működtetés (interoperabilitás) és szabványok 6. Nyilvántartások és többnyelvűség 7. Benchmarking 7

A KÖNYVTÁRAK SZEREPE KULTURÁLIS KINCSEINK DIGITALIZÁLÁSÁBAN 8. Országos, európai és nemzetközi együttműködés 9. Bővítés 10. A jövő közös építése: a tudástársadalom élvonalában A 2004 elején beindult Minerva Plus projekt, a Minerva az újonnan csatlakozott országokkal, valamint Olaszországgal és Izraellel 2003 áprilisában benyújtott nyertes pályázata. A projekt célja a Minerva-hálózat kibővítése. 1.2. Magyarországi digitalizálási kezdeményezések, projektek A szegedi egyetemi könyvtár Magyarországon úttörőként a 90-es évek első felében az interneten is megjelentette az első magyar nyelvű digitalizált műveket. 1994 tavaszán Drótos László, Kokas Károly és Moldován István a munkáját ajánlotta fel annak érdekében, hogy megalapítsa a Magyar Elektronikus Könyvtárat (a MEK-et). A kulturális kormányzat már az 1997-ben hatályba lépett kulturális törvényben előírta a Neumann János Digitális Könyvtár és Multimédia Központ létrehozását. Az új intézmény küldetése az volt, hogy az audiovizuális dokumentumok nemzeti gyűjtő- és szolgáltató helyévé váljon. 1998 tavaszán a kultuszminiszter megalapította a Digitális Irodalmi Akadémiát (DIA), azzal a mecanatúrai szándékkal, hogy az összes Kossuth-díjjal és babérkoszorúval kitüntetett író és költő teljes életművét fel kell dolgozni és ingyenesen közzé kell tenni az interneten. A Bibliotheca Hungarica Internetiana (BHI) gyűjteményben azok a klasszikus magyar szépirodalmi művek találhatók, amelyeket a Magyar Tudományos Akadémia Textológiai Bizottsága, illetve az Eötvös Loránd Tudományegyetem szakértői javasoltak hálózati közzétételre. Az országos kezdeményezések mellett számos megyei és városi intézmény is folytat digitalizálási tevékenységet (Szolnokon, Hódmezővásárhelyen, Szentendrén stb.) 8

2. A Békés Megyei Könyvtár digitalizálási projektjei A Békés Megyei Könyvtár 2002-ben a NKÖM 5 digitalizálási pályázat támogatásával kezdte meg digitalizálási tevékenységét. A pályázat révén kapott támogatás csak arra volt elegendő, hogy a könyvtár elkészítesse az OSZK Mikrofilmtárával a Békés c. megyei folyóirat 32 évfolyamának elektronikus változatát, melyet a Mikrofilmtár PDF formátumban nyújtott át a könyvtár részére. Ezzel csak a folyóirat archiválása történt meg, a dokumentum szöveges visszakeresésének biztosítása nélkül. Az IHM 6 2003-ban hirdette meg IHM-ITP-8-as kódszámon a 24. óra Kulturális kincseink digitalizálása című pályázatát, melyhez a pályázó intézménynek csatolnia kellett digitalizálási koncepcióját. A Békés Megyei Könyvtár ekkor fogalmazta meg és fektette írásba digitalizálási koncepcióját 7. A könyvtár koncepciójában az alábbi célokat határozta meg: a nemzeti kulturális örökség részét képező helytörténeti és kulturális értékek archiválása, a digitalizált dokumentumok és azok tartalmának visszakereshetősége, új szolgáltatási módszer létrehozása, az interneten jó minőségben megjelenített dokumentumok, információk hozzáférésének biztosítása a felhasználók számára. A koncepció négy területet határoz meg a dokumentumok tartalmi és formai sajátosságai alapján: helyismereti monográfiák: Karácsonyi János: Békésvármegye története. Gyula, 1896. (2003-ban folyamatban levő digitalizálás) Haan Lajos: Békés vármegye hajdana. Békéscsaba, 1870. Oláh György: Békésvármegye, 1848-1849. Gyula, 1889-1892. 5 Nemzeti Kulturális Örökség Minisztériuma 6 Igazságügyi és Hírközlési Minisztérium 7 A Békés Megyei Könyvtár koncepciója teljes terjedelemben a függelékben található 9

helyismereti időszaki kiadványok Békés c. társadalmi, politikai hetilap 1904-1910. évfolyamai A Békésvármegyei Régészeti és Művelődéstörténelmi Társulat évkönyvei, 1874-1893. Nemzeti Kultúra pedagógiai folyóirat 1911-1914. évfolyamai mikrofilmek Békésmegyei Közlöny társadalmi hetilap 1874-1914. évfolyamai Csaba és Vidéke városi hetilap 1883-1884. évfolyamai Békéscsaba és Vidéke városi hetilap 1909-1913. évfolyamai értékes, kuriózumnak számító művek Márki Sándor: A Fekete-Körös és vidéke. 1877. Tessedik Sámuel önéletírása. 1873. Békés megye sajtóbibliográfiája, 1855-1973. 1974. Zsilinszky Mihály: Árvízveszély és vízszabályozás Békésmegyében. 1880. Haan Lajos: Békés megye hajdana. Kézirat. 1862. Karácsonyi János: A magyar nemzetségek a XIV. század közepéig. 1900. Karácsonyi János: Magyarország egyháztörténete. 1906. A felsorolt dokumentumok digitalizálását helytörténeti vonatkozásain kívül keresettségük, körülményes hozzáférésük vagy kevés, illetve egyedi példányszámuk indokolja. Jellemzően szerzői jog hatálya alá már nem eső művek kerültek be a koncepcióba. A könyvtár a digitalizálási koncepciójában célul tűzte ki egy digitalizáló műhely létrehozását, s törekvését, arra hogy az eredeti dokumentummal megegyező minőségi elektronikus dokumentumokat hozzon létre és azokat a szerzői jogok figyelembe vételével az interneten vagy az intraneten elérhetővé tegye. Az IHM-ITP-8-as kódszámú pályázaton elnyerhető vissza nem térítendő támogatás összeg maximuma 10 millió forint volt, melyhez a pályázónak a támogatás összegének legalább 10%-át kitevő önrészt kellett biztosítania. A könyvtár a maximális támogatási összegre nyújtotta be pályázatát. A pályázat eredményhirdetésére 2003 őszén került sor. A Békés 10

Megyei Könyvtár által elnyert támogatási összeg 6,6 millió volt. A támogató által 2003. december 12-én aláírt pályázati szerződést azonban csak 2004. januárjában postázták a könyvtár részére. Így az ÁFA törvény változása miatt az eredetileg nettó 10 millió forint helyett 6,6 millió forint bruttó összegű támogatás állt a könyvtár részére. A pályázatban vállalt feladatok megvalósításának határideje a szerződés szerint a szerződés aláírásától számított 6 hónap, vagyis 2004. június 12. A pályázat végső célja a Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása és annak a pályázat során létrehozott digitalizált dokumentumokkal való feltöltése volt. 2.1. A pályázat megírása A pályázat a szokásosnál jóval nagyobb körültekintést, tájékozódást igényelt mivel a könyvtár munkatársai e területen még nem rendelkeztek tapasztalatokkal. Első körben olyan könyvtárak, intézmények megkeresésére került sor, melyekről köztudott volt, hogy e területen már jócskán rendelkeznek tapasztalatokkal. A legkészségesebbnek a Debreceni Egyetemi Könyvtár és Németh László Városi Könyvtár (Hódmezővásárhely) bizonyult. A két intézménynél tett látogatás és azt ott szerzett tapasztalatok egyaránt hatással voltak a pályázat megírására és annak későbbi megvalósításra. Az egyetemi könyvtár nem törekedett a digitalizált dokumentumok teljes szövegű feldolgozására, az NLVK 8 viszont igen. A tapasztalatcserék során kipróbálásra kerültek különböző gyártmányú, típusú szkennerek is. Néhány oldalnyi anyag digitalizálásának és feldolgozásának megtekintése, nyomon követése átláthatóbbá tette számunkra a munkafolyamatokat, a munka nagyságát, s megtervezhetőbbé a munka elvégzéséhez szükséges időt. A kötegelt szkennelési módszerrel az egyetemi könyvtárban ismerkedtünk meg (erről a módszerről még a későbbiekben lesz szó, mivel a pályázat megvalósításánál jól tudtuk alkalmazni). Az ikron Kft által kifejlesztett JaDoX XML szerkesztőről és szerverről az NLVK-ban hallottunk. A szerkesztő működését Szepesi Judit (a könyvtár digitalizálással foglalkozó könyvtárosa) be is mutatta. Dr. Ambrus Zoltán, a könyvtár igazgatója a projekt felelősének Toldi Klára feldolgozási osztályvezetőt jelölte ki. A pályázat megírásában az én feladatom a pályázat megvalósításához szükséges számítástechnikai eszközökre, szoftverekre, a megvalósítás 8 Németh László Városi Könyvtár (Hódmezővásárhely) 11

során alkalmazandó fájltípusok, szabványok alkalmazására történő javaslat előterjesztése, az árajánlatok bekérése, majd a jóváhagyást követően mindezek írásban történő megfogalmazása volt. A pályázat keretében az alábbi a digitalizálási koncepcióban szereplő dokumentumok digitalizálását vállalta a könyvtár: A megyei történelmi információk egyik kiemelkedő jelentőségű kézikönyve az 1870-ben Pesten kiadott Haan Lajos monográfiája, Békés vármegye hajdana címmel, két kötetben, 636 oldalon jelent meg. A hiteles történelmi okmányokon alapuló mű első kötete a vármegye általános története mellett a megyei települések létrejöttét, fejlődését, esetleg megszűnését mutatja be. A második kötet a szerzőnek a monográfia megírásához felhasznált hiteles okmányait ismerteti. A gyakran forgatott, egyébként már átkötött könyv védelmét kívántunk megoldani a digitalizálással. A helyismereti információk nagyon fontos elemei a történelmi adatok, információk. Az első, eredeti kiadású, történelmi monográfia digitalizálásával a helyismereti általános és magasabb szintű (kutatói) igények kielégítését tűztük ki célul. A második kötetben lévő források többsége 1067-1808 között keletkeztek latin nyelvű dokumentum. Az akkor használt latin nyelv is fejlődésen, változáson ment keresztül, mely az okmányokban jól nyomon követhető. A Békésmegyei Közlöny című társadalmi, ismeretterjesztő, gazdasági hetilap 1874-1939 között jelent meg Békéscsabán. Ebben az időben Gyulán is jelent meg megyei lap, de a közlemények, cikkek eltérőek, így mindkettő a helytörténeti kutatás fontos forrása. Állományunkban mikrofilmen a folyóirat egésze, nyomtatott formában hiányosan található meg (több évfolyam is hiányzik). A papíralapú újság lapjai a lapozgatások következtében beszakadoztak, sok helyen bepiszkolódtak. Bizonyos számok olyan mértékben károsodtak, hogy a másolást sem engedélyezzük belőle. A mikrofilm digitalizálásával a hiányzó évfolyamok, számok elérhetőségét akartuk biztosítani, lehetővé téve a kívánt anyag nyomtatását is, s így az újság mentesül az igénybevételtől. A projekt keretén belül az első három évfolyam digitalizálását vállaltuk. A feltárást és digitalizálást indokolja, hogy a megye több településének könyvtárában nincs meg ez a monográfia. A folyóirat esetében a Békés Megyei Könyvtáron kívül csak az 12

OSZK 9 rendelkezik a folyóirat példányaival, így a helyi, regionális érdeklődők számára kizárólag a könyvtárunkban nyílik lehetőség a kutatómunkára. 2.2. A pályázat megvalósítása A pályázat megvalósítását egyaránt nehezítette a lekurtított összeg, a késedelmes postázás miatt lecsökkent határidő és a digitalizálásban való járatlanság. 2.2.1. Előkészületek A megvalósításhoz szükséges legelső lépés a könyvtár munkatársainak képzése volt a digitalizálás és az elektronikus könyvtárak kialakításának témakörében. Ilyen képzéseket a könyvtárosok számára az INKA 10 szervez. 2003 novemberében-decemberében szervezett tanfolyamokon könyvtárunk 3 dolgozója vett részt (Toldi Klára, Benyó Barbara és jómagam). A képzések nagyon hasznosak voltak, de az előttünk álló munkához nem elegendőek. A képzéseket nagyrészt általános és elméleti jellegű ismeretátadás / ismeretszerzés jellemezte. Az itt megszerzett ismeretek nélkül azonban nehezebben, lassabban birkóztunk volna meg a ránk váró feladattal. A pályázat eredményének kihirdetése (2003. szeptember) és az aláírt szerződés postázása (2004. január) között több hónap telt el. Az eszközök beszerzését az intézmény csak az aláírt szerződés birtokában kezdheti meg, hiszen csak ekkor realizálódik az anyagi fedezet. Ez alatt az idő alatt csak tájékozódni lehet, hogy hol, milyen áron szerezhetők be a szükséges eszközök. A konkrét árajánlatkérésekre, megrendelésekre csak az aláírt szerződés kézhezvétele után került sor. 9 Országos Széchényi Könyvtár 10 Informatika a Nemzetvédelmi Képzésben Alapítvány 13

2.2.2. A digitalizáló műhely kialakítása Az anyagi nehézségek ellenére a könyvtár ragaszkodott a digitalizáló műhely létrehozásához, mivel csak a munka elvégzéséhez szükséges eszközök megléte biztosíthatja azt a folyamatos digitalizáló tevékenységet, melyet a könyvtár a koncepciójában célul tűzött ki. Az OSZK az eszköz beszerzések megkezdésekor még nem tudott pontos tájékoztatást adni arról, hogy mikorra készül el az elemek 11 moduláris könyvtári rendszer elektronikus dokumentumgyűjteményekhez. Ez a tény, a tapasztalatok hiánya és a rövid határidő indokolta azt, hogy az ikron Kft szakértőit vontuk be a projektbe. A választás nem véletlenül esett rájuk. A hódmezővásárhelyi városi könyvtárban tett tapasztalatcsere alkalmával jó referenciát kaptunk róluk. 2.2.2.1. Szerverek beszerzése Az interneten történő publikáláshoz szükségünk volt egy, a célnak megfelelő webszerverre is. Egy IBM xseries205 (Pentium4 2.8 GHz FSB 512 Kbyte cache, 1 GB ECC DDR RAM, 2X36 GB SCSI 12 HDD) webszerver és egy megvétele mellett döntöttünk. Ez a hosszú távú céljainkat ugyan nem fogja kielégíteni, de mivel kevesebb támogatást nyertünk a pályázaton, mint amennyire szükségünk lett volna, így be kellett érnünk ezzel a konfigurációval. A szerverre a Linux operációs rendszer (Debian disztribúció) került telepítésre. A digitalizált anyag publikálását az ikron Kft-től vásárolt JaDoX dokumentumkezelő rendszerrel, a lekérdezést, a teljes szövegű visszakeresést a Monguz szerverrel kívántuk megoldani. A webszerver üzemeltetésénél a szerver gép sebessége mellett az internet kapcsolat sávszélessége a másik meghatározó tényező. A Békés Megyei Könyvtár a HBONE egyik végpontjaként 34 Mbps sávszélességgel rendelkezik, amely megfelelő sávszélességet biztosít egy webszerver üzemeltetéséhez. 11 Moduláris könyvtári rendszer elektronikus dokumentumgyűjteményekhez részletes információ található a következő URL címen: <http://elemek.oszk.hu> 12 SCSI (Small Computer System Interface = kisméretű számítógéprendszerek interfésze) A SCSI csatlakozások gyors és megbízható adatátvitelt tesznek lehetővé. SCSI interfész esetén több perifériát és kiszolgáló adaptereszközt is csatlakoztathatunk egyetlen PC porthoz. 14

HBONE, a NIIF IP gerinchálózata 13 A beszkennelt dokumentumokat tömörítetlen TIFF formátumban kívántuk lementeni és archiválni. Ehhez azonban egy nagy teljesítményű, nagy merevlemez kapacitással rendelkező fájlszerverre volt szükségünk. A hosszabb távú terveinkhez és a fejleszthetőség miatt erre a célra egy nagy teljesítményű, nagy kapacitású eszközt lett volna célszerű beszerezni (pl. Apple Xserve Raid). A szűkös anyagi keretek miatt erről az elképzelésről le kellett mondanunk. Egy IBM xseries205 (Pentium4 2.66 GHz FSB 512 Kbyte cache, 1 GB ECC DDR RAM, 4X250 GB SATA HDD) fájlszerver beszerzése mellett döntöttünk. A szerverre is a Linux operációs rendszer Debian disztribúcióját telepítettük. A szervereken tárolt állományok mentése az egyik legfontosabb teendő, melyet célszerű egy archiváló szerverrel, vagy a szerverekbe épített szalagos archiváló eszközzel megoldani. A rendelkezésünkre álló összegből ezt nem tudtuk megvalósítani. Az adatbiztonságot jobb híján a winchesterek tükrözése (RAID1 14 ) és egy másik gép winchesterére illetve egyes anyagok rendszeres időközönként DVD lemezre történő mentése jelenti. Ez korántsem nevezhető ideális megoldásnak. 13 Nemzeti Információs Infrastruktúra Fejlesztési Program [online] BP. : Nemzeti Információs Infrastruktúra Fejlesztési Iroda, 2001. [2005.03.15.] <program http://www.iif.hu/images/magyarorszaghbone-fi-iiinagy.gif 2001> 14 Redundant Array of Independent Disks RAID1 a lemez tükrözése, vagyis az adatokat egyszerre két lemezre visszük fel, s ha az egyiken hiba támad, akkor a másikról még elérhetjük az adatokat. Ez egyszerű módszer, de a hasznos kapacitás csak fele a lemezek összkapacitásának. 15

JaDoX szerver A JaDoX rendszer nyílt szabványokon alapuló, platform-független dokumentumkezelő rendszer. A szerver programra az adatkezelési is tárolási munkákhoz szükséges. Monguz, JaDoX plugin-nal A Monguz egy nyílt szabványokon alapuló platform-független keretrendszer amely távoli információforrások közös felületen való lekérdezésére szolgál. 2.2.2.2. Munkaállomások beszerzése A munka elvégzéséhez nem csak jó szerverekre, hanem jó munkaállomásokra is szükség volt. Erre a célra 4 munkaállomást vásároltunk (ASUS A7N8X Deluxe alaplap, AMD XP 2500+ processzor, 512 Mbyte DDR RAM, 80 GB HDD, 17 Samsung Magicbright monitor). Ezek közül kettőbe került DVD író az archiválások elvégzésére. A munkaállomásokhoz a Windows XP Home operációs rendszert vásárolta meg a könyvtár. A feladatok elvégzéséhez Microsoft Office 2003 Basic irodai csomagot, FineReader karakterfelismerő, Paint Shop Pro képszerkesztő, Adobe Acrobat programokat vásároltuk meg. Microsoft Office 2003 Basic irodai csomag A legelterjettebb és legismertebb irodai alkalmazás. Az irodai, szövegszerkesztési munkákhoz szükséges eszköz. E miatt a digitalizáló műhelyben is ugyanolyan szükséges, alapvető szoftvernek számít, mint a Windows operációs rendszer. FineReader legújabb (magyar) 7.0-ás verziója Az IPA technológiának köszönhetően a FineReader egyedülálló felismerési pontossággal rendelkezik a karakterfelismerő programok között. Bár hasonló jellegű szoftverből sok van, a tesztek alapján, a FineReader minden konkurensét megelőzi, beleértve a Magyarországon elterjedt Recognitát is. Nem csak a felismerés minőségében nyújt kimagasló teljesítményt, de formátum megtartásban is. Az új intelligens háttér kiszűrési eljárás segítségével, amely eltávolítja a zavaró háttér színeket és más zavaró tényezőket, a felismerés pontossága most még azoknál a dokumentumoknál is jelentősen megnő, amelyek hagyományosan mindig is nagy kihívást jelentenek az OCR programoknak. A Corporate Edition kiadása a hálózatos munkamegosztást (a kötegelt feldolgozást) is lehetővé teszi. Akárhány gépre telepíthető, de egyidőben csak két gépen használható. 16

A FineReader előnyei: Közvetlen mentés HTML, PDF, Winword, RTF, TXT, Excel, CSV, DBF, XML formátumokba; Könyvnél az oldalak automatikus szétválasztása (nem kell oldalanként szkennelni!); Háttérszűrési technológia, a színes hátterű vagy gyűrött anyagok jobb felismerése érdekében; Kötegelt módban, egyszerre többen dolgozhatnak ugyanazon az anyagon. Tehát például az egyik PC csak szkennel, a másiknál a szövegfelismerés történik, a harmadik, pedig az eredményt ellenőrzi, véglegesíti; Multiprocesszoros PC-k támogatása. Még nagyobb feldolgozási sebesség; 177 felismerési nyelv között választhatunk; 34 nyelvhez (köztük a magyarhoz is) tartalmaz beépített helyesírás ellenőrzőt; Képek és/vagy szöveg nyomtatása közvetlenül a FineReader-ből; Megnövelt grafikus konverzió; Latin, görög és cirill karakterek kezelése; Programozási (Java, Basic, stb.) és mesterséges (pl. Eszperantó) nyelvek felismerése; Kémiai képletek felismerése; ODMA-n keresztüli export támogatása. Paint Shop Pro 8.0 Képszerkesztő program. Bármely felhasználási területen állandó, kiváló minőséget garantál. Számos képformátumot ismer és kezel (többek között a TIFF és a JPG formátumot is). A programmal nem csak a képhibákat javíthatjuk hatékonyan, de más formátumokba történő konvertálást (pl. TIFF-ből JPG), valamint a képek megfelelő méretre történő igazítását is elvégezhetjük. Beszerzését továbbá az is indokolja, hogy a programmal a kialakítandó internetes felületre a szükséges grafikákat is elkészíthetjük. 17

JaDoX szerkesztő A beszkennelt, vagy digitális kamerával lefényképezett dokumentumok szöveg felismerési és korrektúrázási eljárások után szöveges dokumentumként állnak rendelkezésre. A JaDoX szerkesztő grafikus felülete segítségével a szöveges dokumentumokat a TEI 15 szabványon alapuló strukturált, XML formátumú szöveggé lehet alakítani. Adobe Acrobat 6 Standard A platform független kommunikáció és a hálózati, internetes adattovábbítás elengedhetetlen eszköze. Az Adobe Acrobat segítségével bármely dokumentum PDF 16 (Portable Document Format) formátumba konvertálható, függetlenül attól, hogy milyen programban íródott. A PDF fájl platformtól és operációs rendszertől függetlenül megőrzi a dokumentumok eredeti arculatát, így azok bárhol eredeti minőségben tekinthetők meg. A digitalizálási munkák során ez fontos szempont. 2.2.2.3. Szkennerek beszerzése A digitalizálás legfontosabb eszköze. A számítógép szeme a szkenner. Segítségével a számítógép rajzokat és fotókat tud olyan kódokká változtatni, melyeket a képszerkesztő, - megjelenítő programok vagy kiadványszerkesztő programok képesek megjeleníteni. A szkennerek kifinomultsága azon a képességen alapul, hogy az analóg feszültségszintek korlátlan sávját digitális szintekké tudja alakítani. A szkennereknek három fő típusát különböztetjük meg: kézi lapolvasók síkágyas lapolvasók film szkennerek A digitalizálandó dokumentumok fajtája eleve meghatározta a feladat elvégzéséhez szükséges szkennerek típusát. A könyvek digitalizálásához síkágyas lapolvasóra, a mikrofilm digitalizálásához viszont a filmszkennerek egyik speciális fajtájára a mikrofilm szkennerre volt szükségünk. Ennek az 15 A Text Encoding Initiative hardver-, szoftver- és alkalmazás-független, bármilyen nyelvű és korú szöveg elektronikus rögzítésére alkalmas nemzetközi szabvány. 16 Portable Document Format (hordozható dokumentumformátum), Acrobat Reader-rel olvasható nyomtatható csereformátum formázott dokumentumokhoz 18

eszköznek az ára határozta meg a projekt költségvetését. Az előzetes ár- és termékajánlatok 4-6 milló Ft áron forgalmazott mikrofilm szkennereket tartalmaztak. Mivel ez az ár számunkra megfizethetetlen volt a projekt költségvetéséből, így alaposabban utána kellett néznünk a lehetőségeknek, a termék- és árajánlatoknak. Mivel ilyen illetve hasonló eszközből Magyarországon nem sok létezik, sok utánajárással járt a megfelelő eszköz megtalálása. Hosszas kutakodás után, a megszerzett információk alapján a Cannon MS-300 mikrofilm szkennert találtuk megfelelőnek. Ez felelt meg legjobban anyagi lehetőségeinknek, és alkalmasnak bizonyult a 35 mm-es mikrofilm feldolgozásához. Ilyen típusú szkennerrel addig még nem találkoztunk. Az országban sem sikerült egy ilyen típusú működő szkennert találnunk, viszont tudomásunkra jutott, hogy a szegedi egyetemi könyvtár szintén egy ilyen szkennert rendelt meg, de az eszköz leszállítására akkor még nem került sor. Az OSZK-ban lehetőséget kaptunk arra, hogy megnézzünk, kipróbáljunk egy MINOLTA mikrofilm szkennert. A Cannon magyarországi képviseleténél sikerült kieszközölnünk egy bemutatót (természetesen várni kellett, rá). A szkennerbe a mikrofilm típusától, a mikrofilmen lévő felvételek méretétől függően kell a megfelelő a lencsét kiválasztani. A bemutatón próba szkennelést végeztünk a saját mikrofilmünkkel. Csak a szkennelés minőségét tudtuk leellenőrizni, mert a feldolgozandó mikrofilmünk típusához, a filmkockáink méretéhez szükséges lencsét a Cannon képviseletének nem sikerült a bemutató idejére beszereznie. A szkennelés minősége a munka elvégzéséhez megfelelő volt, viszont kiderült, hogy a digitalizálandó anyag minősége (a felvételek) a legtöbb helyen rossz minőségűek, ami az elvégzendő munka nehézségét előre vetítette. A Cannon MS-300-as mikrofilm szkenner megvétele mellett döntöttünk. A kiszállításra a megrendeléstől számítva kb. 4-5 hetet kellett várnunk. A könyv digitalizálásához egy kötegelt módban is üzemelni képes szkennerre volt szükségünk. A kötegelt feldolgozással a szkennelésre szánt idő nagymértékben lerövidíthető, a művelet könnyen betanítható, komolyabb számítástechnikai szakértelmet nem igényel. A könyvtár már rendelkezett egy korábbi pályázat keretében beszerzett EPSON GT-1000+ A3-as szkennerel, de az kötegelt feldolgozásra nem alkalmas és meglehetősen lassú. Az A4-es HP ScanJet 4400C szkenner szintén alkalmatlan kötegelt feldolgozásra, ráadásul huzamosabb ideig nem is képes működni (a hardveres szakemberek szerint állítólag ez egy rossz széria egyik példánya). 19

A pályázat költségvetéséből A3-as szkennerre már nem futotta. A probléma szerencsére sikeresen megoldódott, a nemrég (más forrásból, eredetileg jó minőségű és színes fénymásolatok készítéséhez) vásárolt Xerox DocuColor 1632 fénymásolóval, hálózati nyomtatóval és szkennerrel. Xerox Docucolor 1632 fénymásoló és szkenner 17 Sok utánajárással sikerült beszereznünk azokat az eszközöket, amelyek ennek a feladatnak a végrehajtásához elegendőek voltak. (Hosszú távú fejlesztési céljainkhoz nagyobb tudású, nagyobb kapacitású, színvonalasabb eszközökre lett volna szükségünk.) 2.2.2.4. A műhely elhelyezése a könyvtár épületében A Megyei Könyvtár nem rendelkezik üres helyiségekkel, az épület bővítéséről pedig anyagi okok miatt le kellett mondani. Az egyetlen járható út az átszervezés, költöztetés volt. A műhely az emeleten, az informatikai osztály melletti iroda helyiségében került kialakításra. A digitalizálók a munkafolyamatok során felmerülő problémák megoldásához segítségért, tanácsért, a szomszéd helyiségben dolgozó informatikusokhoz fordulhattak. Három számítógépet, a meglévő A3 szkennert (mely meglehetősen lassú - egy korábbi projekt során került beszerzésre) és a Cannon MS 300-as mikrofilm szkennert itt helyeztük el. A negyedik gép a helyszűke miatt átkerült az informatikai osztály irodájába. A fájl- és a webszerver a router 18 szobában, a földszinten kapott helyett, mivel ez az egyetlen légkondicionált helyiség. A légkondicionálás (a megfelelő hőmérséklet biztosítása) az eszközök zavartalan működéséhez feltétlenül szükséges. 17 A szerző felvétele 2004. 18 útválasztó; hálózati csomópontok közötti forgalmat irányító, az adatcsomagok útját kiválasztó eszköz 20

Digitalizáló műhely 19 A két IBM (file és web) szerver a router szobában 20 19 A szerző felvétele, 2004. 20 A szerző felvétele, 2005.03.18. 21

2.2.3. Digitalizálás A jó szervezési munka alapvető feltétele a projekt sikeres lebonyolításának. Toldi Klára a feldolgozó osztály vezetője, a projekt felelőse és irányítója már az eszközbeszerzések ideje alatt hozzá fogott a munka megszervezéséhez. Kolléganőm végig járta a könyvtár valamennyi osztályát és önként jelentkezőket keresett a munkára. A pályázaton elnyert összeget csak az eszközbeszerzésekre és szakértői díjra lehetett fordítani, tehát a munkát munkaidőben, az intézmény osztályainak kooperációjával, jó szervezéssel kellett megvalósítani. A belső átszervezések miatt a digitalizáló műhelynek lett egy félállású állandó munkatársa (aki gépíró). Annak ellenére, hogy szinte kivétel nélkül minden osztályról többen is részt vettek a projektben, a munka jelentős részét a feldolgozó osztály munkatársai végezték. A digitalizálás során az én feladatom a hardver és szoftver eszközök beüzemelése és használatuk betanítása volt. Természetesen a hibaelhárítás és a segítségnyújtás is a feladataim közé tartozott. A digitalizálás három fő lépése: a digitális formátum létrehozása, a kép formátumok feldolgozása (képek konvertálása igény szerinti állomány formátumokba, karakterfelismertetés, a karakterfelismertetés során létrejött szöveges állomány korrektúrája stb.) a feldolgozás eredményeképpen létrejött digitális dokumentumok közzététele. 2.2.3.1. A dokumentumok digitális formátumának létrehozása A szkennerek az általuk letapogatott dokumentumokat képként kezelik. A szkenner eszközvezérlő programjával (driver) végezhetjük el a dokumentum letapogatását vagyis digitális képernyőelemekké alakítását. A képernyőn megjelenített képet a mentéshez a szkenner újra letapogatja, majd az általunk kiválasztott / megadott képformátumban elmenti. A szkenner legfontosabb része - amely a készülék minőségét is meghatározza - az adatok beolvasásáért és konvertálásáért felelős a CCD (Charge Coupled Device; töltéscsatolt áramkör), ami egy olyan elektromos egység, ahol több különálló félvezetőt úgy kapcsolnak össze, hogy az egyik kimenete a következő bemenetét képezi. Ez a töltéskapcsolt eszköz parányi érzékelők, vagy fényérzékeny cellák csoportja. A CCD minőségét általában pont/hüvely (dpi) értékkel jellemzik. Ezen kívül szokták még 22

jellemezni a pixel/hüvelyk (ppi), színminta/hüvelyk (spi) értékekkel. A felbontás kifejezés arra szolgál, hogy megmondja, hogy az adott optikai eszköz mennyire képes a képrészletek megragadására. Ez egy univerzális szakkifejezés a képminőség jellemzésére. A szkenner esetében alapvetően kétféle felbontást különböztetünk meg: optikai felbontás kifejezi, hogy a szkenner szenzorai (érzékelői) hüvelyenként (inchenként) hány pixel, pont vagy minta detektálására képesek, interpolált felbontás szoftverrel növelt felbontás matematikai algoritmust használ ahhoz, hogy további pixeleket adjon a szkenner által mintavételezett képpontokhoz (nagy képméreteket eredményez). Digitalizálási munkánk során optikai felbontást alkalmaztunk. A projekt technikai-műszaki követelményeinek megfelelően a beszkennelt anyagot tömörítetlen TIFF formátum mentettük, archiváltuk. Ennek a formátumnak ugyan nagy a helyigénye (ami a nagy tárolókapacitású szerver beszerzését indokolta), viszont nincs információvesztés. TIFF: a Tag Image File Format-ot (TIFF) az Aldus cég definiálta DTP 21 -terméke, a Page-maker számára. E formátumot használják főleg a szkenerrel bevitt képek tárolására. A TIFF képformátum lehetővé teszi a képet leíró kiegészítők (tag) hozzáfűzését a képfájlhoz. Így leírható a kép mérete, felbontása, tömörítési módja, stb. A formátumnak azonban van különböző gyártók által specifikált változata is, melyek nem teljesen kompatibilisek egymással. A TIFF formátum tetszés szerinti képméreteket és színmélységet támogat 24 bitig. Az eredetileg kompresszió nélkül tárolt képadatokat nagy méretük miatt LZW (Lempel-Ziv-Welch féle tömörítő algoritmus) eljárással tömörítik. 22 A digitalizálás során nem minden esetben szokták tárolni a képformátumot. Előfordulhat, hogy csupán a szöveges formátumra van szükség. Bizonyos esetekben, helyeken csak képformátumot tárolnak, a teljes szövegű feldolgozás igénye nélkül. Esetünkben, mivel régi anyagokról, a mikrofilm esetén elég rossz minőségű anyagról volt szó mind a képformátum, mind a szöveges formátum létrehozása, tárolása indokolt volt. 21 Desktop Publishing / asztali kiadványszerkesztés 22 Máté István: A multimédia alapjai és feltételrendszere PC környezetben. In.: Magyar Elektronikus Könyvtár [online] Budapest : OSZK, 1995. [2005.03.06.] <http://mek.oszk.hu/01200/01235> 23

2.2.3.1.1. A kötetek digitális formátumának létrehozása A mikrofilm szkenner szállítására várnunk kellett, ezért először a két kötet digitalizálását kezdtük el. A Haan kötetek igen keresettek a helytörténeti kutatásokat végzők körében. Az elhasználódás következtében újra kellett őket köttetni. A könyvek gerince hagyományos lapolvasóval történő szkennelése alkalmával gyakran sérül. Digitalizálás során egyik lehetőség, hogy lapjaira szedik a könyvet - csak akkor, ha a könyv állapota, vagy példányszáma megengedi -, majd a szkennelést követően újrakötik. Jelen esetben mivel újrakötött példányokról volt szó, ezt nem tartottuk jó megoldásnak. A speciális könyvszkenner alkalmazása az anyagi korlátaink miatt nem jöhetett szóba. Lehetőségként merült fel az oldalak fotózása, de a munkához szükséges tükörreflexes, nagy felbontású digitális fényképezőgéppel nem rendelkeztünk. Beszerzésére nem volt anyagi fedezetünk. A munka elvégzéséhez beüzemeltük a Xerox DocuColor 1632 fénymásoló, hálózati nyomtató, szkenner szkenner szolgáltatását. Az eszközt a 10 BASE-T/100 BASE-T Ethernet interfész és a TCP/IP hálózati protokoll segítségével kötöttük be lokális hálózatunkba. Az eszközhöz egyaránt hozzárendelhető dinamikus vagy statikus IP cím. A szkennelés során a letapogatott kép pontjai egy nagykapacitású beépített háttértárolóra kerülnek, melynek révén lehetővé válik a kötegelt feldolgozást. Az eszköz képes 200, 300, 400, 600 DPI felbontásban, max. A3-as méretű dokumentumok szkennelésére tömörítetlen TIFF, vagy JPG formátumban (a következő beállítható színmélységekkel a kezelőpulton: full color, grayscale, black). A próba szkennelések eredményeképpen úgy döntöttünk, hogy a könyvek oldalait párosával (mivel nem szedtük lapjaira a példányokat), 300 DPI felbontásban, szürkeárnyalatos színmélységben szkenneljük be. Így kb. 4-4, 5 méretű állományokkal kellett számolnunk kétoldalanként. A kötegelt feldolgozásnak köszönhetően a két könyv szkennelésével másfél nap alatt végeztek a kolléganőim, annak ellenére, hogy időnként fénymásolások, vagy nyomtatási munkák miatt meg kellett szakítaniuk a munkájukat. A munka egyszerű volt, hiszen miután kikísérleteztük a megfelelő beállítást, a szkennelés megkezdésekor az eszköz konzolján meg kellett adni a szükséges beállításokat. Ezt követően egyszerűen csak a könyvet kellett a szkenner üveglapjára helyezni, majd a start gombot megnyomni, az oldal szkennelését követően, lapozni, és ismét pontosan ráhelyezni a könyvet a szkennerre, s újra megnyomni a start gombot. Ez így ment egészen addig, míg valami miatt meg nem szakították a munkafolyamatot, vagy amíg nem végeztek a kötettel. 24

A szkenner háttértárolóján lévő állományokat a hálózat azon gépéről, melyre feltelepítettük az eszköz eszközkezelő és segédprogramjait, letöltöttük a fájlszerverre a tömörítetlen TIFF állományokat. Az állományok letöltése szintén megoldható volt kötegelt módszerrel. A kötegelt letöltés lényege, hogy nem kell minden egyes állományt külön elnevezni, hanem a program automatikusan végzi el az állomány nevek generálását. A letöltést követően az állományokat CD lemezre archiváltuk, de természetesen 1 példányuk a fájlszerveren maradt a munka folytatásához. 2.2.3.1.2. Mikrofilmen lévő dokumentumok digitális formátumának létrehozása Az 1874-ben indult folyóirat első évéből 48 szám, 1875-ben 101 szám és 1876-ban 105 szám került digitalizálásra. A folyóirat sajnos eredetileg sem teljes, de a meglévőket 2 kivételével hiánytalanul digitalizáltuk 1035 A3 méretű oldal, 3410 cikk terjedelemben. A közel harminc éves mikrofilmet az elmúlt évek folyamán gyakran használták, több mikrofilm leolvasót túlélt. A 35 mm-es mikrofilm már kopottá vált az erős igénybe vételtől, és úgy gondoltuk, a digitalizálással állományvédelmét is megoldjuk. A Haan kötetek feldolgozása már javában folyt, amikor leszállították és beüzemelték a mikrofilm szkennert. A szkenner egy SCSI 23 kártyán keresztül csatlakozik a számítógéphez. A próba szkennelések során még inkább bebizonyosodott, hogy a mikrofilmen lévő felvételek minősége rossz. Hosszas kísérletezgetések ellenére se sikerült az OCR program számára megfelelő minőségű képállományokat beolvasni. A különböző beállítások (fényerő, kontraszt, méret, igazítás, felbontás mivel ez mindig a szkennelendő anyag minőségétől függ, ezt nem részletezem, az eszköz használati útmutatója tartalmazza a beállítási lehetőségeket) kipróbálását és a projekt vezetőjével történt konzultációt követően közösen úgy döntöttünk, hogy a mikrofilmen lévő anyagot 600 DPI felbontásban fogjuk beszkennelni. Ezt a nagy optikai felbontást az indokolta, hogy a rossz minőségű felvételeket A3-as méretben kellett kinyomtatnunk az olvashatóság miatt, hogy a korrektúrázási munkát, illetve a gépelést el tudjuk végezni. Már ekkor látszott, hogy a karakterfelismerő program a rosszminőségű felvételek miatt nem tud jó eredményt produkálni és kénytelenek leszünk gépelni. Néhány esetben azonban még ez a felbontás sem biztosította az olvashatóságot. 23 SCSI (Small Computer System Interface = kisméretű számítógéprendszerek interfésze) A SCSI csatlakozások gyors és megbízható adatátvitelt tesznek lehetővé. SCSI interfész esetén több perifériát és kiszolgáló adaptereszközt is csatlakoztathatunk egyetlen PC porthoz. 25

A képállományok mentése szintén tömörítetlen TIFF formátumban történt. A 600 DPI felbontás miatt 32-33 Mbyte körüli képmérettel kellett számolnunk. A mikrofilm szkennelése lassabban haladt, mint a könyvé. E miatt a mentés, archiválás itt még fontosabb volt, mint a könyvek esetén. Mikrofilm szkennelése 24 (számítógép + Cannon MS 300-as mikrofilm szkenner) 2.2.3.2. A dokumentum digitális formátumának feldolgozása A szkenneléssel a digitalizálási munka leglátványosabb és leghaladósabb részén túl voltunk. A szkennelési munka az elvégzendő munkánknak kb. 0,5 %-át tette ki, vagyis a munka java, neheze ezután következett. 2.2.3.2.1. A Haan kötetek szöveges formátumának létrehozása A két kötet digitális formátumának létrehozását követően rögtön hozzáfogtunk feldolgozásukhoz, mivel a mikrofilm szkennert akkor még nem szállították le, a munkával viszont haladni kellett. A következő lépés a szöveges formátum létrehozása volt. A TIFF kiterjesztésű állományokból az optikai karakterfelismerő (OCR = Optical Character Recognition) program segítségével hoztunk létre a szöveges (TXT) formátumot. A munkánk során alkalmazott FineReader karakterfelismerő program számos 24 A szerző felvétele, 2004. 26

formátumban képes elmenteni a felismertetett szöveget. Mi a TXT 25 választottuk, mert a további feldolgozáshoz erre volt szükségünk. formátumot Korábban már dolgoztunk, a Recognitával amely egy magyar fejlesztésű karakterfelismerő program -, de a teszteléseket követően a FineReader megvétele és használata mellett döntöttünk, mert a régi dokumentumoknál egyértelműen jobb eredményt produkált, mint a Recognita. Az OCR programok feladatai: szövegek képként való beolvasása a szkenner segítségével; képként rögzített karakterek összehasonlítása a program adatbázisában tárolt karakterformákkal a betűk, írásjelek és egyéb szimbólumok azonosításához; szerkeszthető szövegkimenet létrehozása. Az első feladatot mi nem az OCR programmal hajtattuk végre. Ennek két oka volt: TIFF formátumban archiválni kívántuk a könyv illetve újság oldalakat; a kötegelt szkenneléssel és karakterfelismertetéssel időt takarítottunk meg. A TIFF állományokat a fájlszerveren helyeztük el kötetenként külön mappában (könyvtárban). Biztonsági okok miatt a mappákat átmásoltuk munkamappákba, amelyekben a tényleges munka folyt. A Haan kötetek esetén egy képállomány két könyv oldalt tartalmazott. Mivel az OCR program hatékonysága nem csak a program tudásától, hanem a képminőségtől is függ, ismét tesztelés következett. Meg kellett nézni, hogy milyen retusálásra van szükség, ahhoz hogy az OCR program minél jobb eredményt produkáljon. Az, hogy éppen milyen módszert kell alkalmazni mindig a beszkennelt kép minőségétől függ. Jelen esetben a karakterfelismertetés szempontjából viszonylag jó minőségű anyag állt a rendelkezésünkre. Pusztán egy kis korrekcióra volt szükség (fényerősséget és kontrasztot állítottunk). Ezt követően a FineReaderrel megnyitottuk a TIFF állományainkat és megkezdtük a karakterfelismertetést, a két oldalt tartalmazó képeket a program korrektül kezelte. A kötegelt feldolgozás alkalmazása miatt ezzel a művelettel is viszonylag gyorsan végeztünk. 25 Csak (ASCII Amerikai Szabványos Információcsere Kódrendszer - kódban szereplő) megjeleníthető jeleket tartalmazó állomány; formázást leíró kódokat nem foglal magában. 27