Adatbázis-migrálás : tanulságokkal Koltay Klára DEENK Networkshop, 2009. április 15.
MOKKA irányváltások 1996-2009 A MOKKA szállítójának megváltozása osztott katalogizálás funkciók 16 könyvtár minden fontos könyvtári rendszer Hangsúlyos funkció: jó bibliográfiai rekordok szolgáltatása Legyen az ODR lelőhely-nyilvántartás alapadatbázisa Résztvevők körének jelentős szélesítése Új könyvtári rendszerek, új katalogizálási szokások Hangsúlyeltolódás: lelőhelyadatok minél szélesebb körből TÁMOP újabb irányváltás vagy továbbépítkezés az eddigi tanulságok alapján?
MOKKA eredmények Először látható egy adatbázisban hogyan működik együtt: Több millió bibliográfiai rekord minden dokumentumtípusra (kivéve folyóirat) Több millió besorolási adat rekord Több millió állományadat Több mint 30 forrásból 6 könyvtári rendszer Tanulságok alapján lehetőség a rendszer jelentős utóhangolására, új szolgáltatásokkal, új kapcsolatrendszerekkel kk l való kiegészítésre, lehetőséget adva a résztvevő rendszereknek az összehangoló fejlesztésre
Tanulság -- MOKKA által tárolt adatok négy szintje 1. Bibliográfiai leíró információk 1d dokumentum =1 1leírás; íá csak egyszer szerepeljen; mindegy ki adja a rekordot A leírás elég jó legyen ahhoz, hogy A dokumentum azonosítható legyen A duplumellenőrzés elvégezhető legyen FRBR megjelenítés kialakítható legyen
2. Hozzáadott információ = hozzáadott érték Analitikus információk (tanulmánykötetek, szerzői gyűjtemények stb.) Együttműködés egy munkaigényes szolgáltatás létrehozásában Adatszolgáltató nem feltétlenül azonos az alap leíró adatok szolgáltatóival Analitikus feltárás eltérő mélysége, eltérő formái Possessorok, dedikált kötetek, bejegyzések Közös adatbázisban egymás mellé kerülve igazán izgalmas adatok Példánymegjelölés Minden könyvtár új adatokkal szolgálhat Dokumentum elérhető kapcsolatai a weben Munkamegosztás karbantarthatóság
3. Authority információk: nevek, tárgyszavak besorolási rekordjai Kevés könyvtár az adatszolgáltató Változáskövetés Besorolási rekordok és bibliográfiai rekordok kapcsolataira építő rekordkarbantartás Különböző forrásból érkező nevek egységesítése (FRBR követelmények) ek) Tárgyszórendszerek, tezauruszok egymástól megkülönböztett kezelése Besorolási adatok szolgáltatása : Kereséstámogatás Bibliográfiai rekordokban pontos névalakok, azonosítható tárgyszavak MARC authority rekordok szolgáltatása
4. Lelőhely és példányinformációk Legszélesebb szolgáltató kör; minden könyvtár lelőhely-információja fontos lehet Tárolandó információk vs. aktuálisan lekérdezendő információk Eltérő begyűjtési módok: Közvetlen szolgáltatás Közvetítő adatbázisok rekordjaihoz csatlakozva ISBN alapú gyűjtés Állandó változás követés Kapcsolat l t kölcsönzési ö rendszerekkel ODR szolgáltatások
A MOKKA adatbázis átköltöztetése t té az új szerverre lehetőség arra, hogy az alapvető struktúrát megtartva t a az azon belüli továbbfejlesztéssel es tésse kísérletezzen, bizonyítsa a jelenlegi struktúrában rejlő fejlődési lehetőségeket lehetőség arra, hogy létrehozza azokat az új kapcsolódási pontokat, amelyekhez a helyi rendszerek illeszkedve könnyebben tudnak a központi rendszer számára információkat küldeni, és hatékonyabban tudják szolgáltatásaikat felhasználni
Az új MOKKA adatbázis néhány Duplumellenőrzés újdonsága Analitika Példányspecifikus információk Kötetkezelés Besorolási adatok Lelőhelyek
Duplumellenőrzés Az új duplumellenőrzés a MOKKA adattartalmának vizsgálatán alapult Az utóbbi időben zajló kurrens feltöltések már tesztelték ezt a módszert. Most a teljes visszamenőleges állományra megtörtént. Eredmény: monografikus rekordok száma a korábbi 4,7 millióról 2,9 millióra csökkent Ha az egyes dokumentumokat vizsgáljuk azt látjuk, hogy a korábbi hat-nyolc duplum rekord helyett egy-három rekord vált jellemzővé. Különösen a könyvek esetében javult jelentősen a korábbi helyzet, kevésbé a hangfelvételek, audiovizuális dokumentumok esetében.
Duplumellenőrzés 000 00622nam 2200193 ir4500 001 MOKKAN0004652238 005 20070521170549.0 008 851209s1985 hu 00000 hun d 020 $a963 05 4021 5 035 $abibjgyx34307 040 $aszte 1001 $abarta János$c(id.)$d(1901-1988) 24512$aA pálya ívei :$bkemény Zsigmond két regényéről /$cbarta János 260 $abudapest :$bakad. K.,$c1985 300 $a112 p. ;$c20 cm 4901 $a(irodalomtörténeti füzetek,$x0075-0840 ;$v115.) 6001 $akemény Zsigmond$d(1814-1875) 830 0$aIrodalomtörténeti füzetek 852 $asz1$xbibjgyx34307 999 $amokk
Azonosított duplumok kezelése Többszintű kezelés: - Leíró adatok - érintetlenek maradnak vagy a - hiteles könyvtár adataival lecserélődnek - Hozzáadott érték - ETO jelzetek beírása, de csak ha új témát jelöl meg - Analitikus adatok hozzáadása, de csak ha még nincsen teljes szintű analitika - Példány-specifikus információk (possessor stb.) - Csak ha van pontos forrásmegjelölés (legalább könyvtár); - A könyvtár a saját mezőit ő karbantarthatja t atja
Kötetkezelés eredeti koncepció MOKKA adatbázisban kapcsolt rekordos kötetkezelés Tagkönyvtárak eltérő kötetkezelését engedélyezi és alakítja kapcsolt rekordos kezeléssé a kapcsolt rekordokat alkalmazó kötetkezelés kizárólag a rekordazonosítók használatán alapul rekordazonosítókon túl cím és szerzői adatokat is megismételnek egy bibliográfiai rekordon belül történik a többkötetes dokumentum összefoglaló leírása és a kötetadatok részletezése. a MOKKA a kapcsoltan érkező kötetadatok esetében a helyi és a MOKKA közötti eltérő rekordazonosítók miatt kell átalakításokat végeznie. Elvárás: a kötet rekord mindig csak összefoglaló rekorddal együtt érkezzen. egy rekordos leírás darabolja összefoglaló és kötetrekordokra a könyvtáranként konfigurálta, hogy melyik eljárást kell alkalmaznia elvárta a kapcsolt rekordokat felküldő könyvtártól, hogy kötetrekordokat soha ne küldjön egyedül, mindig érkezzen vele a hozzátartozó összefoglaló rekord is.
Kötetkezelési újdonságok DE: Nem tételezhető fel, hogy egy adatbázis csak egyféleképpen kezeli a többkötetes műveket. magáról a felérkező rekordról dönti el, mi a teendő vele. Közös és kötetrekord nem érkezik együtt a MOKKÁ nem az eredeti rekordkapcsolatok megtartására törekszik, hanem eltárolt információk alapján maga építi fel a kapcsolatokat. Azoknak a kötetrekordoknak a betöltését pedig, amelyek kapcsolata nem építhető fel, a küldő könyvár számára látható hibaüzenettel megszakítja. Az új kötetkezelési mechanizmus kiterjeszthető lesz majd egyéb típusú kapcsolatok követésére is, lehetővé téve például a kapcsolt rekordokban feltárt analitikus tartalmak befogadását.
Besorolási rekordok MOKKA alapkoncepció: bibliográfiai és besorolási rekordok kapcsolatát tételezi fel Fogadja a beérkező besorolási rekordokat Ha nem kap, automatikusan tik hoz létre authority rekordokat Nevek, tárgyszavak, egységesített címek
Besorolási rekordok következetes begyűjtése Kevés forrás, de következetes begyűjtés: Személy- és testületi név rekordok: OSZK FSZEK DEENK SZTE A tárgyszórendszerek közül a Köztaurusz (2008.12.19-i verzió), a szegedi tárgyszavak a MeSH és Library of Congress angol és magyarra fordított tt tárgyszavainak az a szegmense, amelyet a debreceni katalógus használ.
Nevek kezelése A névalakok formája a forrástól független Az elsőként bekerülő auth. rekord mögé gyűlik minden bibl. rekord Névrekordok kiegészíthetősége, változtathatósága hozzá tartozó bibl. rekordok automatikus módosulása Továbbra is szükség van automatikus keletkezésű besorolási rekordokra később beküldöttre cserélődhetnek
Tárgyszavak kezelése Megkülönböztetett tárgyszórendszerek indikátorokkal és tárgyszórendszer kódokkal tesz különbséget a MOKKA új adatbázisa mindig csak egy-egy rendszeren belül kell érvényesíteni azokat a MOKKA adatbázisban is futó ellenőrzéseket, amelyek az egyes alakok egyediségére és az utalórendszerek következetességére vigyáznak. kiegészíthetőség Meg nem különböztetett tárgyszavak ~ nevekhez hasonló kezelés Automatikus keletkezésű tárgyszórekordok > később beküldöttre cserélődhetnek
Besorolási rekordok használata Böngésző keresések feldúsítása utalókkal Utalók beforgatása a kulcsszavas keresésekbe Hiteles(ebb) név és tárgyszóalakok a bibliográfiai rekordokban nagyobb esély élvezhető FRBR megjelenítésre Rekordot letöltő könyvtár azonosíthatja az általa használt forrásból származó tárgyszavakat MARC authority rekordok letöltése a MOKKÁ-ból
Lelőhelykezelés Eredeti koncepció: rekordforrás alapján a MOKKA tölti ki a lelőhelyet Integrációval létrejött összetett intézményi struktúra számára nem megfelelő A könyvtárak helyi lelőhely-információit is tárolja a MOKKA a nem szabványos kódok cserélődtek le, a helyi lelőhelykód nélküli rekordokba visszamenőleg bekerültek a 852 $a tartalma alapján képzett lelőhelyek. Felküldött lelőhelykódok automatikus kitöltésének mechanizmusa a kurrens feltöltésekre is működni fog azoknak a könyvtáraknak a kedvéért, akik nem küldenek helyi lelőhely-információkat a rekordjaikban. a lelőhelyek szerinti keresés ez alapján az index alapján történjen a helyi állományokban bekövetkezett változások jelentése a MOKKÁ-nak. A MOKKÁ-ba ismételten felérkező helyi rekord aktualizálja a MOKKA rekord rá mutató lelőhelyadatait, így a helyi lelőhelyek közötti állománymozgások, esetleges állományból való kivonások miatt helyi lelőhely módosulások is követhetővé válnak a MOKKA számára.
Lelőhelykezelés ODR funkciók A lelőhelykezelés további finomítása, funkcionalitásának kiterjesztése az ODR fejlesztések részeként várhatóak a továbbiakban.
Összegzés Javult a helyzet a sokszor kárhoztatott MOKKA hiányosságok á terén Új tendencia bibliográfiai információk módosítások elleni védelme de növeli a MOKKA rekordok azon tartományait, amelyekre a tagkönyvtárak hatással lehetnek, amelyek az egyes tagkönyvtárakhoz mint feltöltőkhöz köthetőek és amelyeket így időről időre aktualizálhatnak mint például a lelőhely-információikat, vagy amelyekkel kiegészíthetik mások leírásait, mint például a tárgyi vagy tartalmi feltárás illetve a példányspecifikus adatok esetében.