MARC szintaktikai ellenőrző program - MARCEL 1.1 Kocsis Ferenc Völfinger Réka feri@oszk.hu vreka@oszk.hu Országos Széchényi Könyvtár



Hasonló dokumentumok
1. MELLÉKLET. Távhasználat biztosítása azonosító bróker (AAI) közreműködésével

A FSZEKintegrált könyvtári rendszerének

Multiscript rekordok az ALEPH integrált könyvtári rendszerben: közös katalógus építése az ELTE Egyetemi Könyvtári Szolgálatában

BÉRSTATISZTIKAI PROGRAM HASZNÁLATI ÚTMUTATÓJA

Tanulmányi eredmények kommunikációs rendszere

INFORMATIKAI ALAPISMERETEK

Felhasználói kézikönyv HostLogic SAP EKAER 1.0 megoldáshoz

INFORMATIKAI ALAPISMERETEK

Széchenyi István Szakképző Iskola

Karbantartás. Az ESZR Karbantartás menüjébentudjuk elvégezni az alábbiakat:

Felhasználói Útmutató egyesületi tenyészetek részére

NÉHÁNY GONDOLAT A MAGYARORSZÁGI DEMOGRÁFIAI KUTATÁSOK JÖVŐJÉRŐL1

Diákigazolvány Elektronikus Igénylési Rendszer Oktatási Hivatal által biztosított igénylő felület. Felhasználói kézikönyv. v 4.1

A Magyar Digitális Képkönyvtár projekt (MDK)

SEGÉDLET MARC FORMÁTUMÚ REKORDOK KÉSZÍTÉSÉHEZ

Információk rendszerezése a könyvtárban


Tevékenységadminisztrációs pillér

Az e-közigazgatás irányításának megújítása

Rovás segéd 1.8. Segédalkalmazás szövegek (át)rovásához

14. előadás: Az adatbázis kezelő szoftver

A évi integritásfelmérések céljai, módszertana és eredményei

SLA Suite. Új generációs informatikai és kommunikációs megoldások

Az informatika tantárgy fejlesztési feladatait a Nemzeti alaptanterv hat részterületen írja elő, melyek szervesen kapcsolódnak egymáshoz.

Quantometer 2.0 Fogyasztásmérő program és illesztőkészülék

PÁLYÁZATI FELHÍVÁS a Társadalmi Megújulás Operatív Program

Elektronikus közhiteles nyilvántartások Megvalósítási tanulmány

Informatika. Középszintű érettségi vizsga témakörök. 1. Információs társadalom. 2. Informatikai alapismeretek hardver

AZ ÚJGENERÁCIÓS TANKÖNYVEK

Új gépjármű beérkeztetés modul

Tevékenységadminisztrációs pillér

ELŐTERJESZTÉS. a Kormány részére. a felsőoktatásról szóló évi CXXXIX. törvény módosításáról. Budapest, március

Blonde. Szépségszalon, Szolárium, Spa, Fitness. Ügyviteli Rendszer. Funkcionális Specifikáció. Verzió 1.1

Adatbázisok I Adatmodellek komponensei. Adatbázis modellek típusai. Adatbázisrendszer-specifikus tervezés

FELHASZNÁLÓI KÉZIKÖNYV

Számítógépvezérelt rendszerek mérnöki tervezése

A TAKARNET célja és felépítése 1

A Szekszárdi I. Béla Gimnázium Helyi Tanterve

SZÁMLÁZÁSI ÉS KÉSZLETEZÉSI PROGRAM

Informatika-érettségi_emelt évfolyam Informatika

Adattár. Adattár. Elemzések, modellezés. Adatszolgáltatás

SA-GSMALL GSM ipari GSM átjelző. Telepítési leírás. Dokumentum verzió szám:

Közlemény az online pénztárgépek által szolgáltatott adatok során alkalmazott naplóállományok adatszerkezetének bővítéséről

Stratégiai Fttx hálózat tervező. Smart Strategic Planner

Az Ügyfélkapu és a magyarorszag.hu

Bánkeszi Katalin: A MOKKA-ODR egyesítésének előkészületei

KSHXML2 adatgyűjtési rendszer

részvétel a kulturális, társadalmi és/vagy szakmai célokat szolgáló közösségekben és hálózatokban. Az informatika tantárgy fejlesztési feladatait a

Dr. Pétery Kristóf: Excel 2007 feladatok és megoldások 2.

Töltőfunkció Kezelési Utasítás

BI FÓRUM Üzleti Intelligencia Osztály Motto: szenvedélyünk az adat

Közigazgatási kutatások megvalósítása a TÁMOP számú projekt

Dr. Pétery Kristóf: Word 2003 magyar nyelvű változat

AdviseSoft Hírlevél nyár

NETFIT modul Tanári felület Felhasználói útmutató. Magyar Diáksport Szövetség

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Nagy Gábor. Informatika 16. INF16 modul. Az OpenOffice.org

Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése

Történeti áttekintés

INTEGRÁLT ÖNKORMÁNYZATI RENDSZER

Az egyszer keres felületen sz kíthetjük a keresést adott mez re a legördül lista segítségével.

ADAFOR Iskolai adatforgalmazó program Kezelési útmutató

Az RFID bevezetésének kérdései

HÍRLEVÉL HASZNÁLATI ÚTMUTATÓ

3./ A évi NY29/NY30 nyilatkozat, az M30-as és egyéb igazolások

Optikai szövegfelismerő program. ABBYY FineReader. 9.0 változat Felhasználói kézikönyv ABBYY. Minden jog fenntartva.

KÖNYVEKRÕL, FOLYÓIRATOKRÓL MURÁNYI ISTVÁN

FELHASZNÁLÓI KÉZIKÖNYV. eanim.com

HÍRLEVÉL HASZNÁLATI ÚTMUTATÓ

Összefüggő szakmai gyakorlat témakörei évfolyam. 9. évfolyam

Összefüggő szakmai gyakorlat témakörei. 13 évfolyam. Információtechnológiai gyakorlat 50 óra

WEBCAPS alkalmazás magyar nyelvű kezelési útmutatója

A First Businesspost Sender Cockpit használata

10. évfolyam 105 óra azonosító számú Hálózatok, programozás és adatbázis-kezelés 105 óra Adatbázis- és szoftverfejlesztés gyakorlat tantárgy

A szelektív utánzás mint a kulturális tanulás eszköze

Karbantartás. Az ESZR Karbantartás menüjébentudjuk elvégezni az alábbiakat:

TERC-ETALON Online Építőipari Költségvetés-készítő és Kiíró programrendszer Felhasználói kézikönyv

Széchenyi István Szakképző Iskola

12. előadás: Az ingatlan-nyilvántartás korszerűsítése

Tisztelt Ügyfelünk! Cégek / Cég törzsadatai / Cég törzsadatainak módosítása / TB fül

Az MS Access adatbázis-kezelő program

Adminisztrátori kézikönyv (Ver: )

Atudásalapú társadalom új kihívások elé állítja az iskolát, amelyre az az oktatás folyamatos

5. MODUL ADATBÁZIS-KEZELÉS

KID verzióváltás Felhasználói kézikönyv

NYILVÁNOS KÖNYVTÁRI KATALÓGUSOK

S z o l g á l t a t á s i

Budapest Főváros XI. Kerület Újbuda Önkormányzata TELJESÍTMÉNYÉRTÉKELÉSI KONCEPCIÓ - JAVASLAT

Szoftver-ergonómiára vonatkozó szabvány, avagy ISO 9241

Elektronikus Pénztárgép DATECS DP-25 EU. Felhasználói Kézikönyv

CellCom. Szoftver leírás

Intézményi interface technikai dokumentáció

Korszerű raktározási rendszerek. Szakdolgozat

A szótárról. 1. Mi ez?

UniPoll Feedback. Intézményi integrált kérdőívkészítő rendszer vélemény és visszajelzés gyűjtéshez.

ESZTERHÁZY KÁROLY FŐISKOLA, EGER. Beszámoló könyvtári szakmai gyakorlatról

A Hexium AZBEST/AVAX és a HA-PON/sGTC alállomás szoftverének frissítése

A DOBBANTÓ PROGRAM TANULÁSSZERVEZÉSI KERETEI Munkaanyag. Tartalomjegyzék

int azt az elõzõ részbõl megtudtuk, a rétegeknek az a feladatuk, hogy valamiféle feladatot végezzenek

Horgász Napló V Bemutató Verzió. Felhasználói Kézikönyv. Intelligens Fogási Napló Program

ADATBÁZIS-KEZELÉS ALAPOK I.

Átírás:

MARC szintaktikai ellenőrző program - MARCEL 1.1 Kocsis Ferenc Völfinger Réka feri@oszk.hu vreka@oszk.hu Országos Széchényi Könyvtár Az előadás célja a Kocsis Ferenc által fejlesztett MARC szintaktikai ellenőrző program bemutatása, ami a MARCEL fantázianevet kapta. A következőkben szó lesz a MARCEL -t életre hívó igényekről, a program tervezésekor fellépő nehézségekről és a felhasznált mintákról, eszközökről. Röviden ismertetésre kerül a program működési elve, majd felhasználói nézőpontból is megvizsgáljuk, kitérve a szabálygyűjtemény természetére. Végül tájékoztatást nyújtunk a fejlesztések irányáról. Néhány mondat a program létrehozásának körülményeiről. MARC állományt bogarászni, hibák után vizslatni, esetleg kézzel belejavítani emberpróbáló feladat. Ez nem is csoda, hiszen egy géppel olvasható formátumról van szó. Korábban már születtek alkalmazások, amelyek képesek szekvenciálisról strukturált formára alakítani a rekordokat és vissza. Olyan szoftvereket is ismerünk, amelyek szintaktikai ellenőrzést végeznek MARC21 szabvány szerint, pl. a Marc Report. A projekt beindításához az utolsó lökést az OSZK állományán végzendő retrospektív konverzió tervezése adta, melynek során nyilvánvalóvá vált, hogy nem nélkülözhetjük tovább az említett feladatokat ellátó HUNMARC, illetve ahogy a betöltéshez szükséges előírásainkkal kiegészítettük MIGRAMARC specifikus eszköztárat. Ekkor kapta meg Kocsis Ferenc a megbízást egy felhasználóbarát, grafikus keretbe illeszkedő program megírására, amit MARCEL névre kereszteltünk. Már a tervezés során felmerült néhány alapvető kérdés, amiket nehéz pontosan megválaszolni: Mi a MARC szabvány? Milyen változatai vannak? Hogyan változnak a változatok... Mit is kell tulajdonképpen ellenőrizni? Az ISO 2709 Információ és dokumentáció. Információs csereformátum című szabvány írja le a MARC rekord általános szerkezetét, teret engedve az egyéni megvalósításoknak, például a lehetséges indikátorok számában vagy az almezőhatárjel használatában. A rekordfej elemzéséből nyilvánvaló, hogy milyen megvalósítással van dolgunk, ehhez viszont feltételeznünk kell a rekordfej érvényességét, ami nem lehet az alapja egy ellenőrzésre hivatott program működésének. Különféle MARC -ok léteznek nemzeti, nyelvi, hálózati vagy intézményi szempontok szerint kialakítva, amelyek változásai a legtöbb adatbázisban jól nyomon követhetők a különböző korszakokban létrehozott rekordokban. Milyen szabályrendszer alapján kellene ezeket ellenőrizni? Egy MARC szabályzat hány szabályból, előírásból áll? Például, a 100 hívójelű mezőben az első indikátor 4, a második 1 és az almezőazonosító 7 értéket vehet föl. Ez 1, 4, 7 vagy 28 szabály? Mennyi és milyen összefüggések vannak egy állományon belül két rekord között, illetve egy rekordon belül annak elemei között. Nemcsak a szintaktikát, hanem a belső logikát is ellenőrizni kellene. Ez katalogizáló rendszerenként, szabványonként változhat. Erre jó példa a "099" es mező, ami az OSZK ban használt Amicus betöltője miatt kell. Mitől lesz egy file MARC állomány? Ha beolvasol egy XML file-t, akkor most az egy nagyonnagyon hibás MARC állománynak számít vagy nem? Az ISO 2709 szabvány mágnesszalagos tároláshoz készült, csak annyit mond: a rekord rekordhatárjellel zárul. A beolvasás szekvenciálisan történik, karakterről karakterre haladunk a file -ban. Mikor mondhatjuk azt, hogy 1

ez már biztos nem MARC állomány, meddig keressük a rekordhatárjelet? Egy szabályt hányféle ravaszabbnál ravaszabb módon lehet megszegni? Például, tekintsük a következő szabályt! "A rekord utolsó adatmezője rekordhatárjel karakterrel (hex 1D) zárul." (Legyen a rekordhatárjel karakter röviden: RH ) Elvileg bármi előfordulhat: az is hiba, ha nincs RH, az is, ha van, de rossz helyen, esetleg egy RH -t egy újabb követ. A legnagyobb probléma csak a végén derült ki. A szabványok helyi alkalmazása változatos formákat ölthet. Például a HUNMARC csak annyit mond, hogy "A rekordazonosító a bibliográfiai rekordot az adott adatállományon belül azonosító egyedi karaktersorozat." Így aztán találkozhatunk vele nullákkal vagy szóközökkel feltöltve, szöveges előtaggal, szóközökkel tagolva, csak az értékes számjegyeivel ábrázolva és ezek valamely keverékével egyaránt. Sőt, egy rekordon belül a különböző mezőkben sem egységes az előfordulásuk gondoljunk csak a 001 -es és a rekordkapcsolati mezők $w almezőjére. Így esett, hogy az első bátor nekirugaszkodás után, amikor a szabályrendszer általánosítása és teljes testreszabhatósága volt a cél ez volt az 1.0 változat - jelenleg egy kevésbé rugalmas, de stabilan megvalósítható verzió kidolgozásánál tartunk. A program megírását megkönnyítették az alábbi eszközök és minták. MARC4J projekt, ahol technikai eszközkészlet található a MARC XML konverzióhoz Java API (Application Programming Interface) formájában (http://marc4j.tigris.org) MARC Report MARC21 szerinti ellenőrző program (http://www.marcofquality.com), amiből megvalósítási ötletek meríthetők. A MARCEL program végül a következő működési elvvel valósult meg. MARC fájl MARCEL MarcReader strukturált MARC fájl MarcValidator RulesReader Riportok A program három modulból áll, amelyek funkcionálisan jól elkülöníthetők. A MarcReader beolvassa a MARC formátumú állományt, értelmezi és alapvető formai ellenőrzést végez rajta. Felderíti a rekordok határait és szerkezeti elemeit egészen az almezők szintjéig. A feldolgozás eredményéről, ha szükséges hibariportot készít. A RulesReader feladata az XML file -ben tárolt szabályok feldolgozása, értelmezése és előkészítése a validáló program számára. A szabályok egy része bele van égetve a programba, más része pedig kibe kapcsolható. Később részletesebben tárgyaljuk a szabályrendszert. A MarcValidator a MarcReader által beolvasott rekordok ellenőrzését végzi a RulesReader által megadott szabályok alapján és a megtalált hibákat egy riportban mutatja ki. Indítható parancssorból vagy a MARCEL rendszerből. Tekintsünk most a programra felhasználói szemmel! Történjék ez egy példa ellenőrzésen keresztül! Készítettünk egy állományt, amiben elrontottunk néhány értéket. A program grafikus változatával beolvastattuk, és elvégeztettük rajta a szintaktikai ellenőrzést. A grafikus programokban megszokott ablakos menüsoros szerkezet fogadja a felhasználót, ahonnan megnyitható az ellenőrizendő MARC állomány és kiválasztható a kívánt szabálygyűjtemény illetve ellenőrzési szempont. A marc állomány strukturált formában jelenik meg, ha nem nagyobb, 2

mint 10000 rekord. Erre a korlátra a memória használat és a megjelenítési idő kézbentarthatósága miatt volt szükség. A rekordok illetve mezőik között gördítő sáv segítségével fa szerkezetben is tallózhatunk, de nagyobb lépésekre kényelmesebb az ugrás funkciót használni. A vizsgálandó file megnyitása utána meghatározhatjuk az ellenőrzés módját: mit és milyen szempontok alapján szeretnénk tesztelni. Példánkban teljes HUNMARC szerinti kontrollt kértem. A végrehajtás után újabb ablakrész jelenik meg a képernyőn, amely a hibaüzeneteket tartalmazza rekordazonosítóhoz rendelve, mint például 1500007 040 kötelező hívójel hiányzik. Az ellenőrzés eredménye egy szöveg file -ba is beíródik, ahonnan célszerű elmenteni, mert minden ellenőrzéskor fölülíródik. Tervezünk még a riport elejére egy rövid statisztikai kimutatást, ami tartalmazná a beolvasott rekordok számát, az ellenőrzés időtartamát, a hibák számát, esetleg típusonként összegezve. A szabálygyűjtemény a HUNMARC előírásait képezi le logikai állításokká, oly módon, hogy viszonylag könnyen behelyettesíthetők legyenek a konkrét értékek. A szabályok öt csoportra oszthatók: rekordfej, hívójelek, indikátorok, almezőkódok értékeire vonatkozók és az egyéb szabályok, pl. ha..., akkor típusúak, mint ha van a rekordban 1XX as mező, akkor 245 ös mező első indikátora 1. Egy- egy csoporton belül a szabályok különféle típusúak lehetnek, pl. Kötelező hívójelek, Lehetséges indikátorok, Nem ismétlődő almezőkódok. Az egyéb szabályok csoportjában a legkülönfélébb kikötések fogalmazódnak meg a rekordkapcsolatok ellenőrzésétől kezdve az azonosítók érvényességéig ezért nincs is hozzájuk típus meghatározva. 3

csoport típus Módosítható értékek hozzáadása törlése Használat Csoport mentése más néven Csoport törlése Rekordfej Lehetséges igen nem nem igen igen igen Hívójelek Kötelező Lehetséges Nem ismétlődő Egymást kizáró igen nem nem igen igen igen Indikátorok Lehetséges igen igen igen igen igen igen Almezőkód Lehetséges Nem igen igen igen igen igen igen ismétlődő Egyéb - nem nem nem igen igen igen A felhasználó kap bizonyos mozgásteret az előírások saját kezű módosításában, és változtatásait el is mentheti mint saját szabálycsoportját. A legszorosabb megkötés az egyéb szabályok esetén van: csak a használatuk ki- és bekapcsolására van lehetőség. Ennek az az oka, hogy ezek a programba égetett ellenőrzések. Azokat a szabályokat kellett ily módon kódolni, amelyek egyediek a szabálykészítés szempontjából, ezért nincs szükség a paraméterezésükre, pl. duplikált rekordazonosító vizsgálata vagy olyan bonyolultak, hogy nehézséget okozna a felhasználónak a változók beállítása. Ilyen például a rekordkapcsolatok ellenőrzése. A beállítások egy könnyen kezelhető panelon keresztül történnek meg. Beállítható továbbá a program feliratainak, üzeneteinek nyelve, a rekordmegjelenítés és a 4

kimenetek karakterkészlete. Az 1.0 változat jó szolgálatot tett az 1950 1975 között az OSZK állományába került könyvek cédulakatalógusainak retrospektív konverziója nemrég befejeződött első szakaszában, amikor mintegy 400 000 rekord került be a számítógépes integrált rendszerünkbe. A régi és a bemutatott 1.1 verzió között a legnagyobb különbség a szabályok szerkeszthetőségében van: a felhasználó szabadságából valamennyit fel kellett áldozni a megbízható és kiszámítható működés érdekében. Néhány további funkciót tervezünk még kialakítani a programban, hogy valóban komplex MARC eszközkészletté válhasson. Ezek az állományok darabolása, keresés bennük és a szerkesztésük lennének. Mindenekelőtt, azonban a fő célkitűzésünk megfeleltetni MARCEL -t a HUNMARC bibliográfiai formátumnak, és közzé tenni szabad felhasználásra. 5