LIDO formátum előállítása MARC forrásból az Europeana számára A Petőfi Irodalmi Múzeum fejlesztése az Europeana Inside projekt keretében Készítette: Csáki Zoltán, Kómár Éva Petőfi Irodalmi Múzeum e-mail: csakiz@pim.hu Networkshop 2013 - Sopron
Europeana Inside (2012-2014) http://www.europeana-inside.eu Europeana Connection Kit (The Europeana Connection Kit - What is it...?) LIDO export Miért készítünk LIDO-t? LIDO (Lightweight Information Describing Objects) 2010-ben jelent meg: http://lido-schema.org Kidolgozó: ICOM-CIDOC Working Group Data Harvesting and Interchange (német, brit, egyesült államokbeli múzeumi szakemberek csoportja) Célja: Közgyűjteményekben előállított leíró adatok publikus részének továbbítása online szolgáltatások számára (pl.: Europeana, Google Art...)
Huntéka-M Miért MARC-ból? Jelenleg HUNMARC alapú rendszerre épül A HUNMARC szerkezeti logikáját megtartva a múzeumi igényeknek megfelelően új mezőkódokkal kiegészített adatszerkezet A múzeumban a műtárgy történetének követése és az egyediségek leírása áll középpontban, A könyvtárban dokumentum adatainak leírása, amelynek fő forrása maga a dokumentum Bánki Zsolt és Kómár Éva előadásai a témában megtekinthetők a Videotoriumban http://videotorium.hu
Egyediségek tükrözése a 2002-ben kiadott HUNMARC szabványban: A dedikáció szövegét (c562) és a kötéstáblára vonatkozó információkat (c588) a HUNMARC megjegyzés típusú mezőben tárolja. (A Huntéka M-ben ezen mezők speciális használatát az intézményi gyakorlat szabályozza.) LIDO-ban lehetőség van a dedikációra és a kötéstáblára vonatkozó információk számára specifikus mezőt létrehozni. (Műtárgyként nyilvántartott egyedi dokumentum leírása látható a képen.)
A LIDO múzeumok számára kidolgozott formátum Bármely múzeumi objektum leírására alkalmas Természeti tárgyak Biológiai tárgyak Mesterséges tárgyak könyvtári dokumentumok is... Múzeumi logika Rugalmas séma, kreatívan alakítható elemkészlet Kevés a minimálisan kötelező adat (azonosító, megnevezés, technikai információk)
A LIDO publikálási formátum Nem ad lehetőséget az érzékeny adatok elkülönítésére Az intézmény és a szakmai szabályozások által publikusnak tekintett adatok befogadására szolgál Válogatott adatokat tartalmaz
A LIDO harvesztálási formátum Addig funkcionál amíg az adat utazik a provider (adatgazda intézmény) és az aggregátor (adatokat szolgáltatási céllal összegyűjtő partner, szakmai vagy kulturális portál) között Adattárolás nem történik LIDO-ban, jobban mondva adattárolás modellezésére nem használják (ellenpélda: http://museum-digital.de) Többnyelvűség támogatása Megjegyzés: aggregációs szolgáltatások készen átvehetik az adatok begyűjtéséhez használható LIDO formátumot hazai szakemberek egyre több tapasztalatra tesznek szert ezen a területen az Europeana projekteknek köszönhetően
A LIDO eseményorientált (Event Oriented) formátum A műtárgy v. múzeumi objektum életútjának kitüntetett pontjaihoz (eseményeihez) rendelhetünk leíró adatokat (az eventset nevű elemkészlet segítségével) Sokféle kontextus leképezhető személyek, tárgyak és fogalmak között (HUNMARC-hoz szokott szakembernek elsőre furcsa lehet vö. múzeumok számára kidolgozott formátum)
Dokumentum szerzője Példa eseményre Creation (Létrehozás) típusú eventset Amin belül lehetőségünk van szereplőket felvenni és a szerepkört definiálni Kiadási és közreműködői adatok Production (Gyártás) típusú eventset Amin belül lehetőségünk van szereplőket felvenni és a szerepkört definiálni
ICOM-CIDOC CRM kompatibilis LIDO terminológia A Linked Heritage projekt keretében készül, már használható: http://terminology.lido-schema.org/lidoterminologysearch.php Többnyelvű, magyarul is közli a fogalmakat Pl.: Category elem Itt definiálhatjuk, hogy természeti, biológiai vagy mesterséges objektumot írunk le. A PIM esetében az átadásra kerülő objektum- leírások kivétel nélkül az E22 Man-made object / mesterséges tárgy kategóriába kerülnek. Mivel az Europeana használja az ICOM-CIDOC CRM névteret, ezért a kategória besorolás alapján gépi úton lesz képes rekordjainkat besorolni a mesterséges objektumok rekordjai közé. (Ilyen szintű besorolást a 20/2002. (X.4.) NKÖM rendelete a muzeális intézmények nyilvántartási szabályzatáról nem ír elő.)
Az ontológia használata az eventsetben is Maga az Event is a ICOM-CIDOC CRM-ből jön E5 Event az objektum állapotában történő változást jelenti Alárendeltje az E63 Beginning of Existence létezés kezdete Amely alatt megtalálható a létrehozás E65 Creation a szerzőségi adatok felvételére szolgáló Event típus (eventtype)
A LIDO már a szemantikus web jegyében született Minden fogalom esetében ajánlja a szótárhasználatot Az ICOM-CIDOC CRM-et a specifikáció név szerint is ajánlja Felkínálja a fogalomazonosítók bevitelét A fogalomazonosítók arra szolgálnak, hogy a rekordon kívüli, a szakmai közösség által elfogadott, publikus ismeretszervező rendszerekhez, szótárakhoz, ontológiákhoz kapcsolják a fogalmakat
Fogalomazonosítók <lido:category> <lido:conceptid lido:type="uri"> http://www.cidoc-crm.org/crm-concepts/e22</lido:conceptid> <lido:conceptid lido:type="uri"> http://terminology.lido-schema.org/lido00096</lido:conceptid> <lido:term xml:lang="eng">man-made Object</lido:term> </lido:category> Technikai elvárások a fogalomtárakkal szemben: Lexikai egységek ellátása egyedi azonosítóval (URI) Szótárak publikálása a szemantikus weben
Mapping eszközök XML (extensible Markup Language) technológiát használunk http://www.lido-schema.org/schema/v1.0/lido-v1.0.xsd XSLT (extensible Stylesheet Language Transformations)... <?xml version="1.0" encoding="utf-8"?> <?xml-stylesheet type="text/xsl" href="c:/users/user/documents/jegyzetek/mintmentes/kepzomuveszeti_eles/kepzomuveszeti_alkotas.xsl"?> <PIM-HUNMARC_rekord>...
MINT (Metadata Interoperability Services) Europeana Best Practice Network része (Europeana tudásbázis) Használta, használja az Athena, Linked Heritage, Athena+projektek és az ICOM Mire jó? Grafikus mapping eszköz = grafikus XSLT szerkesztő Ingestion tool / beadó eszköz (Az Europeana-Inside projektben nem használják beadásra. Itt az ECK látja majd el ezt a feladatot.)
Szabadon kipróbálható (bárki regisztrálhat) itt:http://oreo.image.ntua.gr:8080/cidoc/login_input.action
A LIDO szerkezeti felépítése [ Fejléc : lidorecid, category] Leíró adatok: descriptivemetadata Osztályozás információ az objektum típusáról: objectclassificationwrap Azonosítás alapvető információ az objektumról: objectidentificationwrap Életút események, amelyekben az objektum részt vett: eventwrap Kapcsolódó témakörök/tárgyszavak: objectrelationwrap Adminisztratív adatok: administrativemetadata Jogi információk az objektumról: rightsworkwrap Leíró adatokra vonatkozó információk (benne jogi info. is): recordwrap Digitális másolat adatai (benne jogi info. is): resourcewrap
Nézőképek a LIDO rekordból Az előző dián található leírókarton LIDO formátuma egy pár száz soros XML fájl, ebből láthatók részletek alább: