Hozzáférés és újrahasznosítás A TEL és az Europeana a tudományos kutatás szolgálatában Kovácsné Koreny Ágnes Fővárosi Szabó Ervin Könyvtár
Kutatók a virtuális térben 10 évnyi kutatás a virtuális kutatók információ-keresési és olvasási szokásairól Centre for Comparative and International Business Research (CIBER), UK Virtuális környezetben rendkívül aktívak, de a munka nagy részét robotokkal végeztetik. Mit szeretnének? Közvetlen és drótnélküli hozzáférést. Még több digitalizálást és a digitális anyagok elérését, hozzáférhetőségét - lehetőleg mindent digitálisan. Mobil eszközöket, s rajtuk a tartalmat.
Szeretnek ugrálni, minél többet, innen oda A több ezer elérhető oldalból egyet vagy kettőt néznek meg. 40%-uk nem megy vissza többé egy egyszer már használt oldalhoz. Hogy miért ugrálnak? Mert keresőmotort használnak, ami (túl) sok (nem releváns) találatot és rengeteg linket ajánl fel, amelyek között élvezet ugrálni. gyenge a keresési kompetenciájuk (Google - max. 2,2 szvas keresőkifejezés). kevés az idejük.
Másképp olvasnak A horizontális felváltotta a vertikálisat Gyorsan olvasnak - keresik a kulcsszavakat a szövegben Cím, heading, összefoglaló (abstract) és a linkek fontossága. Olvasás helyett rápillantás Néhány percet töltenek a kereséssel, illetve egy oldalon - 15 perc már sok. Cikkre 3-4 percet szánnak - a rövidebb cikkeknek nagyobb esélyük van arra, hogy valaki elolvassa őket. Ha mégis hosszú, csak az összefoglalást olvassák el. Vagy letöltik, s elteszik maguknak máskorra.
Gyors információ információs falatkák Kis adagokban, mindent, gyorsan. A hátsó/oldalsó bejáratokon jönnek be (linkek). Nem használják a szépen kialakított, rájuk szabott keresőfelületeket. Mi alapján választanak? Megnézik az első találatot (ált. egy Wikipedia szócikk). Vagy megkérdezik a témában egy barátjukat, ismerősüket a Facebook-on, Twitteren. Ma fontosabb, ha valamit sokat ajánlanak, mint egy lektorált (peer reviewed) cikk. http://ciber-research.eu/download/20120627-tartu_ciber.pdf
TEL vs. Europeana A könyvtári aggregátor Közgyűjtemények digitális tára 1997 GABRIEL közös portál létrehozása Európa nemzeti könyvtárai számára Kezdete 2005 EP-kezdeményezés az Europeana létrehozására 2005 március Indulása 2008 november CENL, LIBER, CERL 48 nemzeti könyvtár és a vezető európai szakkönyvtárak bibliográfiai rekordjai és digitális objektumai Üzemeltetője Tartalma Europeana Foundation vezető európai könyvtárak, múzeumok, levéltárak és archívumok digitális forrásai több mint 25.866.737 digitális objektum és 157.878.956 bibliográfiai rekord Főbb adatok 39.276.880 digitális objektum 23.213.500 kép, 15.129.531 szöveg, 507.463 hang, 408.553 videó, 17.833 3D
A könyvtári aggregátor Közgyűjtemények digitális tára A közös cél: Lehetővé tenni a felhasználók számára az információkeresést és a tudáshoz való hozzáférést Európa valamennyi nyelvén közvetlenül, a portálokon keresztül és közvetetten, az adatokra épített különböző alkalmazások révén.
A könyvtári aggregátor Közgyűjtemények digitális tára A közös kihívás: a rendkívül heterogén adatok integrációja. A megoldás: saját fejlesztésű infrastruktúra és munkafolyamat az adatbevitelre, az indexálásra, az adatnormalizációra és az adatok közzétételére. European Data Model (EDM): a szemantikus web elveit, megoldásait kihasználva képes a legkülönbözőbb adatok nyílt környezetben való integrálására és újrahasznosítására.
Hogyan lehet a kor követelményeinek és a felhasználók elvárásainak megfelelő, homogén tárgyszó alapú hozzáférést, soknyelvű keresést, illetve a leírt források közötti szemantikai kapcsolatokra is építő szolgáltatásokat biztosítani?
Knowledge Organisation Systems (KOS) Tudásszervezési rendszerek a dokumentumok és fogalmak összerendezését, rendszerré szervezését végzik; plusz tartalommal gazdagítják az objektumokat soknyelvű szótárak, tezauruszok, authority listák, névterek, osztályozási rendszerek, ontológiák, taxonómiák Kiválasztási szempontok technikailag elérhető (Linked Data-n keresztül vagy dedikált repozitóriumban) jól dokumentált, jól rendezett open access soknyelvű
Adatkonszolidáció Kiindulási alap Kihívás Megoldás Eredmény A TEL óriási mennyiségű besorolási adattal rendelkezik az általa aggregált bibliográfiai adatoknak köszönhetően. Sokféle rendszer, sokféle nyelv, sokféle gyakorlat. A könyvtárak többsége helyi, nyelvfüggő rendszereket használ a szerzőségi adatok és a tartalom leírására. Szerzőségi adatok konszolidációja Tárgyszó-normalizálás Nemzetközi és nyelvfüggetlen rendszerek használata Virtual International Authority File (VIAF) International Standard Name Identifier (ISNI) Common European Research Classification Scheme használata (CERIF) LCSH, RAMEAU, SWD tárgyszavak kapcsolatrendszere (MACS) 2012-végére 120.000 linket sikerült bekötni a francia, brit, német és svájci nemzeti könyvtárakból származó tárgyszavak közé Tárgyszó- és névadat normalizáció minden bibliográfiai adatra Mára a nyelveket átszövő tárgyszó-bázis
GeoNames DBpedia GEMET Semium Time Adatgazdagítás az Europeana-ban WHERE WHO WHAT WHEN a világhálón szabadon hozzáférhető földrajzi névtér több mint 8 millió földrajzi név a Wikipédia adatait tartalmazza rendezett, strukturált formában jelenleg több, mint 4,58 millió bejegyzés 125 nyelven GEneral Multilingual Environmental Thesa urus általános, többnyelvű környezetvédelmi tezaurusz alkalmazás: 10,2M objektum esetében DublinCore mezők: date, coverage, year alkalmazás: 7M objektum esetében alkalmazás: 144K objektum esetében alkalmazás: 9,1M objektum esetében DublinCore mezők: spatial, coverage DublinCore mezők: creator, contributor, subject, type DublinCore: subject, type
WHERE?
WHAT?
WHEN?
Szolgáltatások kutatóknak 1) Portál egyszerű tárgyszavas keresés és böngészés találatok elemzése, szűkítése idő, hely és tárgy szerint 2) Open Search API regisztrált felhasználóknak a) The European Library Open Search API A TEL portálon elérhető, a nemzeti és szakkönyvtárak gyűjteményeit leíró adatokhoz való hozzáférés. b) The European Library Open Dataset Hozzáférés több mint 82 millió bibliográfiai rekordhoz Creative Commons CC0 1.0 licensz alapján. c) RLUK - Research Libraries UK database Közel 20 millió bibliográfiai rekord 34 UK könyvtárból 3) Linked Open Data
Szolgáltatások kutatóknak Portál Speciális kutatások, fejlesztések Europeana Research APIk projekt és portál a kutatás szolgáltában REST-API az adatok dinamikus visszakereséséért OIA-PMH adatok aratása Linked Open Data 20 millió objektum letölthető RDF-ben Hogyan lehet az Europeana Newspapers projekt teljes szövegeit és képeit újrafelhasználásra elérhetővé tenni? Az Europeana Newspapers-re alapuló full-text API kifejlesztése További gyűjteményrészek kiemelése a kutatók számára Kutatói elvárások, igények és szükségletek folyamatos feltérképezése Tartalomfejlesztési stratégia kidolgozása a kutatói igények alapján Ösztöndíjprogram kidolgozása kutatók számára
Köszönöm a figyelmet! Kovácsné Koreny Ágnes Fővárosi Szabó Ervin Könyvtár