Visszamenőleges konverzió támogatása informatikai eszközökkel Simon András Networkshop 2009, Szeged
Emberésgép Az emberi értelmet nem lehet mindenhol szoftverrel kiváltani. Hatékony együttműködésre van szükség. Nap mint nap szembesülünk a gépi adatkeresők esetlenségével. Mesterséges intelligencia - olyan okos mint az ember és olyan gyors mint a gép? VAGY Olyan lassú mint az ember és olyan buta mint a gép?
Cédula > szöveg > rekord? A szövegfelismerés a beszkennelt katalóguscédulákról igen nehézkes. Minél régebbi, minél rosszabb minőségű a cédula annál több a hiba. Öntanuló rendszerek - a magyar anyag egyszerűen fizikailag kevés ahhoz hogy jó öntanuló rendszer jöhessen létre. A könyvtári katalógus ma már komplex adatbázis, feltöltése nem egyszerű technikai feladat.
Boldogok kik még azt hiszik a tudás a zűrzavart apasztja /Goethe/ A felismert cédula szöveg konvertálása az integrált rendszerbe, ugyancsak hibák forrása. Elromlanak a besorolási állományok, a szerzői nyilvántartások és a tárgyszó rendszerek. A retrospektív feltárásnak az integrált rendszer adatbázisával konzisztensnek kell lennie. Mű szintű nyilvántartás: közös katalógusokban duplum ellenőrzés mind nehezebbé lesz, ha újabb meg újabb cédulákról újabb meg újabb címváltozatok kerülnek be az integrált rendszerekbe.
Helyi feldolgozás helyett - rekord import Változások: A közös keresők jobbak lettek, letöltési lehetőségek, a Z letöltés, OAI letöltés, szabványok elterjedtsége, rendszerek átjárhatósága javult. Hatalmas saját katalógusok jöttek létre az elmúlt évtizedekben, jelentős bibliográfiai és besorolási adatállománnyal, korábbi részleges visszamenőleges konverziók, és az évek során a könyvtári katalógusba felvitt adatok miatt. Csak a PICA pl. évi 750 000 tétellel bővült. Az angol, német, francia anyag gyakorlatilag teljes körűen gépen van, és a magyarnál is az arány évről évre jobb. Ez a négy nyelv jelenti a magyar bibliográfiai rekord állomány 90 %-át. A rekordok jó része így valahonnan már letölthető lenne, már jelen van valamelyik integrált rendszer katalógusában
Munkaerő Növekedő költségek (a bér jellegű kiadások növekedése a rájuk rakódó közterhek miatt) Csökkenő létszámú könyvári személyzet, túlterhelt munkatársak. Munkaerő toborzás nehézségei munkanélküliséggel párosulva Van szabad munkaerő, csak nehéz mozgósítani, mert vagy rossz helyen van és rosszkor, vagy pedig drága. A letöltéshez nem kell feltétlenül címleírási szaktudás, csekély könyvtárosi ismeret mellett az általános humán műveltség elég.
Megvalósítás kérdései Kiindulási alap: a katalóguscédulák vagy autopszia. Hálózati vagy lokális munka Szkennelés során képfájl készülhet a cédulából ezek tárolhatók, és önmagukban is értékes dokumentumok. Ha a dolgozó távolról, akár otthonról is végezheti munkáját, akkor könnyebb munkaerőt találni, olcsóbb illetve szükség esetén tömegesen áll rendelkezésre, akár a jelenlegi l országhatárokon túlról is.
Hálózati munka központi szolgáltatásként. Nincs gond kliens telepítésével, tűzfalakon való átjutással Kényelmes a használata Állandóan és biztonságosan üzemel 24 órában és elérhető, mindenhonnan ahol Internet van Osztott tt felhasználást biztosít.
Z Források Z39.50 adatforrások nyelvenként illetve tárgycsoportonként hierarchiába rendezendők, értékük, használhatóságuk nem egyforma. Alkalmi kiválogatásuk, a keresés megismétlése időrabló. Z Forrás rangsorhoz: Nyelv ( angol, német mellett gyűjtőként pl. szláv is) Tárgycsoport (pl. orvostudomány) Ha mód van rá, szerencsés egyetlen adatforrást kiválasztani és mindent attól átvenni. Ez sok helyen bevált, a Düsseldorfi Városi könyvtár pl. minden rekordját Frankfurtból vette át.
Keresőszempontok: ISBN/ISSN Cím, teljes vagy csonkolt Szerző: teljes vagy csonkolt Kiadás, kiadó, kiadás éve
Tippek Mark Twain: Tom Sawyer kalandjai - itt ehhez kiadási évszám kell, szerző felesleges Halász Zoltán: A Matterhorn nem ér az égig a cím itt elég önmagában Görgey Guidó mint szerző jó keresőszempont Kovács Lajos mint szerző, rossz kereső szempont Átlagos műveltségű ember könnyedén dönt, hogy mit válasszon keresési szempontnak.
Az Intelli Z Éjszaka fut A keresőszempontok, és a Z Forrás preferencia sorrend szerint végiglátogatja az adatforrásokat. Rangsorol, és a rangsor szerinti első néhánnyal tér vissza Új próba másnap ha: A keresés sikertelen A Z források közül a legpreferáltabbakat nem tudta elérni
A rangsorolás szempontjai: Adatfeltöltöttség, 245, 100, 700, 260 MARC mezők kitöltöttsége Z39.50 adatforrás hierarchia Relevancia a keresőszemponthoz Duplum ellenőrzés során minden duplumból csak egyet választ ki
Honosítás a saját könyvtári rendszerben Az integrált rendszer megszokott eljárásaival, MARC import illetve Z39.50 szerverként való letöltéssel, vagy közvetlen kapcsolattal az új alkalmazás és a könyvtár integrált rendszere között. Könyvtáranként helyi feladat marad mindenképpen, az elérési információ, jelzetek, lelőhely adatok, kölcsönzési kategóriák beállítása, illetve a helyi tárgyszavazási, osztályozási elvek érvényesítése. Problémás esetek megoldása, többkötetes t dokumentumok, k analitikák és anya rekordjaik összekapcsolása. A besorolás egységesítés már a helyi rendszerben zajlik.
Tárjuk fel a láthatatlant! - Kell ez egyáltalán? Ma már alig használják a cédulakatalógust, így egy tételre ott már rá sem találnak. Ma már ugyan az érdeklődés homlokterében a teljes szöveges adatállományok és elektronikus képtárak vannak, de ha a rekord bekerül a gépi katalógusba legalább végre az olvasók látókörébe kerül. Egyes elavult állományrészek esetében elhalasztható, de távlati cél, minden metaadat legyen elérhető az Interneten!
Köszönjük megtisztelő figyelmüket!