INTERNETES KERESŐRENDSZEREK MŰKÖDÉSE. Bóta László



Hasonló dokumentumok
2. 3. Keresés az Interneten. Navigáció az Interneten: Megoldások. Internetes keresés buktatói. 1. Keresőmotorok. Webes keresési lehetőségek

9. ADATBÁZISOK ÉS ONLINE KATALÓGUSOK. Összeállította: Dr. Pálvölgyi Mihály tanév I. félév

Online információkeresés. Dr. Nyéki Lajos 2016

KERESÉS A NETEN DR. KÓNYA LÁSZLÓ: KERESÉS A NETEN KERESÉS MÓDSZERE, KERESŐPROGRAMOK

A helyismereti információszolgáltatás jellemzői és új irányai a könyvtári honlapokon

NYILVÁNOS KÖNYVTÁRI KATALÓGUSOK

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

KÖNYVTÁRI KATALÓGUS HASZNÁLATI ÚTMUTATÓ

MŰSZAKI KÖVETELMÉNYEK, A KÖRKERESŐ SZOFTVER SPECIFIKÁCIÓJA, KÖLTSÉGVETÉS. A) Műszaki követelmények

INTERNETES KERESÉS. Szórád László Óbudai Egyetem TMPK

Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest. Networkshop 2004 konferencia Győr, április 4 7.

A SZAKIRODALOM HASZNA ÉS SZERKEZETE

A szellemi munka technikájának tanítása Zenei gyűjtemény felhasználásával

Evezz a mélyre! Haladó kutatási tippek bölcsészet- és társadalomtudományok témakörben

Savaria Egyetemi Könyvtár Katalógusa. Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók

TextLib könyvtári integrált rendszer WebOPAC keresőfelülete

Önálló labor feladatkiírásaim tavasz

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Könyvtárhasználati kurzusok és kompetenciák. Kristóf Ibolya, Szent István Egyetem Kosáry Domokos Könyvtár és Levéltár

1. tétel. A kommunikáció információelméleti modellje. Analóg és digitális mennyiségek. Az információ fogalma, egységei. Informatika érettségi (diák)

MS ACCESS 2010 ADATBÁZIS-KEZELÉS ELMÉLET SZE INFORMATIKAI KÉPZÉS 1

Digitális kincstár digitális kincskereső Elektronikus szolgáltatások az MTA Könyvtárában

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

KÖNYVTÁR-PEDAGÓGIA A FŐBB TARTALMI VÁLTOZÁSOK ÁTTEKINTÉSE

A FELSŐOKTATÁSI KÖNYVTÁRAK

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

Adatbázis rendszerek. dr. Siki Zoltán

18. századi folyóiratok komplex feldolgozása a Debreceni Egyetemen

Feladataink, kötelességeink, önkéntes és szabadidős tevékenységeink elvégzése, a közösségi életformák gyakorlása döntések sorozatából tevődik össze.

Digitális tartalombővítés és távmunka bevezetése a Veszprémi Egyetemi Könyvtárban

АZ ISKOLAI KÖNYVTÁR ELEKTRONIKUS KATALÓGUSÁNAK FELHASZNÁLÓI UTASÍTÁSA - SZIRÉN ADATBÁZISÁNAK KERESÉSE

Tanuljunk együtt! Ajánlás

FEJLETT INFORMÁCIÓKERESÉSI TECHNOLÓGIA A FELSŐOKTATÁSBAN

6. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Online világ. Oroszi Katalin. KSZR Szakmai nap augusztus 29. Ostoros

Kétféle ismeret van: magunk rendelkezünk a szükséges információval, vagy tudjuk, hogy az hol lelhető fel. Samuel Johnson

Mesterséges Intelligencia Elektronikus Almanach

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

Informatika szóbeli vizsga témakörök

Kovácsné Garamszegi Marianna vezető könyvtáros Veszprém, MKE Jogi Szekció július 8.

Informatika tagozat osztályozóvizsga követelményei

Használd jól a könyvtári katalógust!

ADATBÁZIS = az információk logikai kapcsolataikkal együtt tárolt (visszakeresésre alkalmas) halmaza

Adatkeresés az interneten. Cicer Norbert 12/K.

Váci Mihály Kulturális Központ Cím: Telefon: Fax: Web: Nyilvántartásba vételi szám:

Digitális írástudás március 13. TÁMOP C-09/ Trambulin

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK

5. INDEXELÉS. Összeáll. dr. Pálvölgyi Mihály. BDF KIT, tanév, 1. félév

Az információs műveltség fejlesztése A könyvtárak szemléletváltása és feladatai a 21. században

Digitális írástudás kompetenciák: IT alpismeretek

Közigazgatási informatika tantárgyból

HELYI TANTERV. Informatika

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

alap közép felső angol német francia orosz

Információk rendszerezése a könyvtárban

Google AdWords és AdSense A Google hirdetési rendszere

2 Access 2016 zsebkönyv

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

ECDL Információ és kommunikáció

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Informatika tanterv nyelvi előkészítő osztály heti 2 óra

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

ALEPH Elektronikus Katalógus rövid útmutató

INFORMATIKA TANMENET SZAKKÖZÉPISKOLA 9.NY OSZTÁLY HETI 4 ÓRA 37 HÉT/ ÖSSZ 148 ÓRA

Térinformatikai támogatás a kistérségi döntés és erőforrás-gazdálkodásban

A KÖZÉPSZINTŰ ÉRETTSÉGI VIZSGA INFORMATIKA TÉMAKÖREI: 1. Információs társadalom

Informatika. Magyar-angol két tanítási nyelvű osztály tanterve. 9. évfolyam

Tudásalapú információ integráció

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

TOP SEO Trendek 2015-ben. We understand, we deliver.

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

HÁLÓZATI FORRÁSOK A VEGYÉSZKÉPZÉSBEN Meskó Eszter, Pálinkó István SZTE Szerves Kémiai Tanszék, Szeged, Dóm tér 8. (mesko@chem.u-szeged.

Bemutatkozik az MTA Könyvtára

INFORMATIKA - VIZSGAKÖVETELMÉNYEK. - négy osztályos képzés. nyelvi és matematika speciális osztályok

Bevezetés A harmadik szoftverkrízis korát éljük! Szoftverkrízisek: 1. nincs elég olcsó: hardver, szoftver, programozó 2. nincs elég olcsó: szoftver, p

Hozzávalók keresése és csatolása

Pedagógiai információforrások, adatbázisok. Tittel Pál Könyvtár és Médiacentrum Gál Tibor március 4.

Egy könyvtár három alapfunkció. Dippold Péter

Témaválasztástól a publikálásig:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép.

Szakirodalom-kutatás. Szakmai közösség: eredetiség. nem lehet egyedül megalapozni és elkészíteni egy tudományos művet

A szemantikus világháló oktatása

PIAC_ Nemzetközi Határozatkereső rendszer fejlesztése. Szakmai fórum február 29.

Internet és világháló

Információs társadalom

A könyvtári rendszer

Informatika 9Ny. Az informatikai eszközök használata

Az ErdaGIS térinformatikai keretrendszer

A SZAKDOLGOZAT KÉSZÍTÉSE ÉS A VÉDÉS

kodolosuli.hu: Interaktív, programozást tanító portál BALLA TAMÁS, DR. KIRÁLY SÁNDOR NETWORKSHOP 2017, SZEGED

ADATSZOLGÁLTATÁS központi honlap használata esetén

Adatbázisok 2018-ban ADT- ARCANUM DIGITÁLIS TUDOMÁNYTÁR AKADÉMIAI KIADÓ FOLYÓIRATAI AKADÉMIAI KIADÓ MERSZ ADATBÁZIS AKADÉMIAI KIADÓ SZÓTÁRAI CAMBRIDGE

Felsőoktatási műszaki digitális tananyagfejlesztés

3.1 Jövőkép. 3.2 Átfogó cél

Microsoft Access alapok

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika

Kézikönyv. Szelekciós operátorok használata

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

A könyvtárak fejlesztési lehetőségei. a TÁMOP-ban és a TIOP-ban

Átírás:

Bóta László

MÉDIAINFORMATIKAI KIADVÁNYOK

INTERNETES KERESŐRENDSZEREK MŰKÖDÉSE Bóta László Eger, 2011

Lektorálta: CleverBoard Interaktív Eszközöket és Megoldásokat Forgalmazó és Szolgáltató Kft. A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. Felelős kiadó: dr. Kis-Tóth Lajos Készült: az Eszterházy Károly Főiskola nyomdájában, Egerben Vezető: Kérészy László Műszaki szerkesztő: Nagy Sándorné Kurzusmegosztás elvén (OCW) alapuló informatikai curriculum és SCORM kompatibilis tananyagfejlesztés Informatikus könyvtáros BA, MA lineáris képzésszerkezetben TÁMOP-4.1.2-08/1/A-2009-0005

Tartalom 1. Bevezetés... 11 1.1 Célkitűzés... 11 1.2 A kurzus tartalma... 11 1.3 A kurzus tömör kifejtése... 11 1.4 Kompetenciák és követelmények... 11 1.5 Tanulási tanácsok, tudnivalók... 12 2. Információ szolgáltató eszközök fejlődése a könyvtáros szakmában... 13 2.1 Célkitűzés... 13 2.2 Tartalom... 13 2.3 A tananyag kifejtése... 13 2.3.1 Az információfeltáró eszközök története... 13 2.3.2 A könyvtári adatbázisok típusai... 18 2.3.3 Az információfeltárás intellektuális eszközei... 19 2.3.4 Az információfeltárás informatikai háttere... 21 2.3.5 Az online tájékoztatás jellemzői... 22 2.3.6 Az információfeltárás új eszközei... 23 2.4 Összefoglalás... 26 2.5 Önellenőrző kérdések... 26 3. A keresőszolgáltatásokkal kapcsolatos alapismeretek... 27 3.1 Célkitűzés... 27 3.2 Tartalom... 27 3.3 A tananyag kifejtése... 27 3.3.1 A webes adatelérés története... 27 3.3.2 Keresőrendszer fogalma... 28 3.3.3 Webes keresőszolgáltatások... 29 3.3.4 Webes keresőszolgáltatások osztályozása... 31 3.3.5 Rejtett web... 34 3.3.6 Az online hálózati keresés közvetített módszertana... 34 3.3.7 A keresés önkiszolgálás modellje... 35 3.3.8 Napjaink népszerű keresőrendszerei... 35 3.3.9 Keresés a jövőben... 36 3.4 Összefoglalás... 36 3.5 Önellenőrző kérdések... 36 4. Keresőrobotok... 37 4.1 Célkitűzés... 37 4.2 Tartalom... 37 4.3 A tananyag kifejtése... 37 4.3.1 A keresőrobotok története... 37 4.3.2 A keresőrobotok fogalma... 38 4.3.3 A keresőrobotok működése... 39 5

6 4.3.4 Miért a Google a vezető indexelt kereső?... 41 4.3.5 PageRank algoritmus... 42 4.3.6 A PageRank képlete... 43 4.3.7 A keresőoptimalizálás... 45 4.4 Összefoglalás... 46 4.5 Önellenőrző kérdések... 46 5. A kulcsszavas keresés technikái... 47 5.1 Célkitűzés... 47 5.2 Tartalom... 47 5.3 A tananyag kifejtése... 47 5.3.1 Az online keresés jelentősége... 47 5.3.2 Kulcsszavas keresés... 48 5.3.3 Online keresés lépései... 48 5.3.4 Az 1. lépés: a keresőkérdés értelmezése... 48 5.3.5 A 2. lépés: a keresőfelület kiválasztása... 49 5.3.6 A 3. lépés: A keresőkérdés összeállítása... 52 5.3.7 A 4-5. lépés: Stratégia és válasz... 53 5.3.8 Keresés és szimbólikus logika... 53 5.3.9 Online keresési stratégiák... 59 5.4 Összefoglalás... 63 5.5 Önellenőrző kérdések... 63 6. Google, mint kereső eszköz... 64 6.1 Célkitűzés... 64 6.2 Tartalom... 64 6.3 A tananyag kifejtése... 64 6.3.1 A Google keresőrobot háttértörténete... 64 6.3.2 A Google indexelő része... 66 6.3.3 Kucsszavas keresési alapok... 68 6.3.4 Összetett kulcszsvas keresés... 70 6.3.5 Vertikális Google keresők... 75 6.3.6 Legyőzni a Google-t... 77 6.3.7 Google, mint a jövő... 78 6.4 Összefoglalás... 79 6.5 Önellenőrző kérdések... 79 7. Metakeresők... 80 7.1 Célkitűzés... 80 7.2 Tartalom... 80 7.3 A tananyag kifejtése... 80 7.3.1 Metakeresők bemutatása... 80 7.3.2 Metakeresők csoportosítása... 81 7.3.3 Idegen nyelvű metakeresők... 82 7.3.4 Az Ariadnet bemutatása... 83 7.3.5 Az Ariadnet használata... 84 7.3.6 Az Ariadnet keresőmotor... 85

7.3.7 A PolyMeta bemutatása... 86 7.3.8 A PolyMeta keresőmotor... 86 7.3.9 A Miner bemutatása... 88 7.3.10 A Miner keresőmotor... 89 7.3.11 Egyéb magyar metakeresők... 90 7.4 Összefoglalás... 90 7.5 Önellenőrző kérdések... 90 8. Speciális keresők... 91 8.1 Célkitűzés... 91 8.2 Tartalom... 91 8.3 A tananyag kifejtése... 91 8.3.1 A speciális keresők előnyei a könyvtáros számára... 91 8.3.2 Vertikális magyar indexelt keresők... 91 8.3.3 Tudományos keresők... 92 8.3.4 Termékkeresők... 94 8.3.5 Felhasználói vélemények keresése... 95 8.3.6 Kép- és mozgókép keresők... 95 8.3.7 Személykeresők, cégkeresők, településkeresők... 96 8.3.8 Tudástárak... 97 8.3.9 Humán alapú keresők... 98 8.4 Összefoglalás... 100 8.5 Önellenőrző kérdések... 100 9. Katalógusok... 101 9.1 Célkitűzés... 101 9.2 Tartalom... 101 9.3 A tananyag kifejtése... 101 9.3.1 Az internetkatalógus fogalma... 101 9.3.2 Horizontális katalógusok... 102 9.3.3 Vertikális katalógusok... 103 9.3.4 Digitális könyvtárak... 103 9.3.5 Magyar Elektronikus Könyvtár (MEK)... 104 9.3.6 Neumann ház és a Webcat... 104 9.4 Összefoglalás... 105 9.5 Önellenőrző kérdések... 105 10. Szemantikus web... 106 10.1 Célkitűzés... 106 10.2 Tartalom... 106 10.3 A tananyag kifejtése... 106 10.3.1 Tudásmenedzsment, tudásprezentáció... 106 10.3.2 A szemantikus web... 108 10.3.3 A szemantikus web üzleti oldalról... 111 10.3.4 Ontológia... 112 10.3.5 Az RDF ontológia fogalma... 114 10.3.6 Webszolgáltatások... 114 7

10.3.7 Tématérképek és RDF... 115 10.3.8 Az RDF ontológia... 116 10.3.9 Az RDFS ontológia... 117 10.3.10 OWL (Web Ontology Language)... 118 10.4 Összefoglalás... 123 10.5 Önellenőrző kérdések... 123 11. Intelligens rendszerek... 124 11.1 Célkitűzés... 124 11.2 Tartalom... 124 11.3 A tananyag kifejtése... 124 11.3.1 Üzleti intelligencia... 124 11.3.2 Üzleti intelligencia az információellátás folyamatában... 125 11.3.3 Az üzleti intelligencia és a könyvtár... 126 11.3.4 Az üzleti intelligencia jövője... 126 11.3.5 Adatbányászat... 126 11.3.6 Az adatbányászat irányzatai... 128 11.3.7 Az iteratív folyamat... 128 11.3.8 Webbányászat... 129 11.3.9 Szövegbányászat... 131 11.4 Összefoglalás... 132 11.5 Önellenőrző kérdések... 132 12. Összefoglalás... 133 12.1 A kurzusban kitűzött célok összefoglalása... 133 12.2 Tartalmi összefoglalás... 133 12.3 A tananyagban tanultak részletes összefoglalása... 133 12.3.1 Információ szolgáltató eszközök fejlődése a könyvtáros szakmában... 133 12.3.2 A keresőszolgáltatások alapismeretei... 133 12.3.3 A kulcsszavas keresés technikái... 134 12.3.4 Google, mint kereső eszköz... 134 12.3.5 Keresőrobotok... 134 12.3.6 Metakeresők... 134 12.3.7 Speciális keresők... 134 12.3.8 Katalógusok... 134 12.3.9 Szemantikus web... 135 12.3.10 Intelligens rendszerek... 135 13. Kiegészítések... 136 13.1 Irodalomjegyzék... 136 13.1.1 Hivatkozások... 136 13.1.2 Külső URL hivatkozások... 139 14. Ábrajegyzék... 141 15. Médiaelemek... 143 8

16. Tesztek... 144 16.1 Próbateszt... 144 16.2 Záróteszt A.... 148 16.3 Záróteszt B.... 152 16.4 Záróteszt C.... 156 9

1. BEVEZETÉS 1.1 CÉLKITŰZÉS A kurzus célja, hogy megismertesse a hallgatókat az interneten fellelhető adatok keresésének lehetőségeivel, az online keresés alapvető fogalmaival, a webes keresőszolgáltatások, azon belül a webes keresőrendszerek működési mechanizmusával, a felhasználói felület felépítésével. A tantárgy kiemelten kezeli az online keresés adekvát eszközének kiválasztását, rámutatva arra milyen esetben, és miként érdemes igénybe venni az internetes keresést. Kiemelt figyelmet kap a keresés korszerű, a könyvtáros szakemberek számára nélkülözhetetlen ismeretet jelentő, tudásalapú internet tárgyalása az online keresés vonatkozásában. A jelenlegi és a jövő technológiáit egy bizonyos határig szükséges megmutatni, ugyanakkor nem szerepelnek a tananyagban mély informatikai ismeretek. Cél továbbá a technológiák várható hatásainak ismertetése, hiszen a folyamatos és gyors változás miatt a hallgatóknak néhány év után már egy egészen más közegben kell kiszolgálniuk a könyvtár látogatóit. 1.2 A KURZUS TARTALMA 2. Információ szolgáltató eszközök fejlődése a könyvtáros szakmában 3. A keresőszolgáltatásokkal kapcsolatos alapismeretek 4. A kulcsszavas keresés technikái 5. Google, mint kereső eszköz 6. Keresőrobotok 7. Metakeresők 8. Speciális keresők 9. Katalógusok 10. Szemantikus web 11. Intelligens rendszerek 1.3 A KURZUS TÖMÖR KIFEJTÉSE A jegyzet gerincét az internetes keresőrendszerek széles közösség által használt részének leírása alkotja. A jegyzetben a hallgató megismeri a keresőrendszerek kapcsolatát a könyvtári tájékoztatással, a mai keresők fajtáit, azok használatát, működési mechanizmusait, valamint kitekintést nyújt a következő évtizedek várható technológiai változásaira. 1.4 KOMPETENCIÁK ÉS KÖVETELMÉNYEK Megérti a hallgató a könyvtári információ feltárás eddigi szakaszait, nehézségeit, fejlődését, tisztában lesz a keresés új tendenciáival, valamint eszközeivel. A hallgató képes lesz a kurzus elsajátítása után a webes keresőrendszerek előnyeinek figyelembe vételével a keresőkérdéshez a megfelelő keresési stratégiát kidolgozni, az online kereső szolgáltatásokat kiválasztani. A konkrét keresők használatával tisztában lesz, képes lesz azok kezelésére, valamint az összetett keresőkérdés kialakítására. 11

A hallgató megtanulja a jövő évtized várható változásait a keresési technológiában, képessé válik a későbbiekben bekövetkező változások nyomon követésére. 1.5 TANULÁSI TANÁCSOK, TUDNIVALÓK A leckék teszőleges sorrendben dolgozhatók fel, bár az első két lecke alapozó jellegű, de az előzetes ismeretek birtokában bármelyik lecke feldolgozható a többi nélkül is. A leckék legtöbbjénél a hallgató próbáljon meg a példákhoz újabbakat keresni, mivel így lesz képes a keresőrendszerek összehasonlítására, ugyanakkor a példák önmagukban értéktelenek, azokat mindenképpen érdemes a gyakorlatban is megtekintenie. A példák mellett a hallgatónak szükséges az új, a jegyzetben nem szereplő keresési lehetőségeket is megnéznie, erre azért kell képesnek lennie, mert az itt leírtak csak 2010-ben maradéktalanul aktuálisak. Az utolsó két lecke jövőbe mutató, azok témakörein el kell gondolkodnia, bár hozzá kell tenni a szemlélet kialakításának kedvéért, hogy a hallgató tanulmányai alatt nem, de munkája során valószínűleg találkozik azokkal. 12

2. INFORMÁCIÓ SZOLGÁLTATÓ ESZKÖZÖK FEJLŐDÉSE A KÖNYVTÁROS SZAKMÁBAN 2.1 CÉLKITŰZÉS A könyvtáros szakma információszolgáltató eszközeinek megismerése, átalakulásának nyomon követése. A hallgató megtanulja, hogy az információkeresés és -szolgáltatás eszköze, lehetősége, tárgya, módszere állandóan változik, ugyanakkor a korábbi, hagyományos apparátus egyes elemei részben megmaradnak, és a korszerű rendszerek kisebbnagyobb mértékben azokra építenek. 2.2 TARTALOM Az információfeltáró eszközök története Könyvtári adatbázisok típusai Az információfeltárás intellektuális eszközei Az információfeltárás informatikai háttere Az online tájékoztatás jellemzői Az információfeltárás új eszközei 2.3 A TANANYAG KIFEJTÉSE 2.3.1 Az információfeltáró eszközök története A feltárás hagyományos eszközei A régi korok emberéhez ugyan a mainál jeletősen kevesebb információ jutott el, ennek ellenére már az ókortól beszélhetünk azinformáció rendszerezésének igényéről, nyilvánvalóan a későbbi hozzáférés megkönnyítése érdekében. Az ókorból teljes egészében egyetlen könyvtári szakrendszer sem maradt fenn, de katalógustöredékek alapján mégis nyerünk némi betekintést. A sumér fővárosnak, Ur városának romjai között találták meg a legrégebbi ékírásos emléket. A sumérok égetett agyagtáblákból készítették könyveiket. A világ első könyvtári katalógusát Ninivében találtak meg. Az első rekonstruálható ókori könyvtár az asszír birodalom uralkodójának, Asszurbanipálnak agyagtábla-gyűjteménye volt. A könyvtár katalógusa két részből állhatott, az egyik a szerzői, míg a másik a szakrendi felsorolást tartalmazta, az agyagtáblákat témakörök szerinti csoportosították. Az ókori görög filozófusok nemcsak könyvgyűjtéssel foglalkoztak, hanem jelentős szerepük van az osztályozással kapcsolatos alapelvek kialakításában. Példaként említhető Platón hármas tudományfelosztása, melyet a lelki képességekre alapozva vázolt fel: dialektika-értelem, fizika-érzékelés, etika-érzelem és akarat. Ez a hármas felosztás nagy hatással volt a tudományok osztályozására. Arisztotelész tudományfelosztása Platón gondolatain alapszik, de azt részletesebben tagolja, csoportosítja. Osztályozása alapjául a tudomány célját emelve ki, elméleti és gyakorlati tudományokat különböztetett meg. Az alexandriai könyvgyűjtemény megteremtését az ókori könyvtártörténet legjelentősebb eseményének tekinthetjük a rendszerezés szempontjából is. A gyűjtemény kb. 13

700 000 papirusztekercset tartalmazhatott. Az alexandriai gyűjtemény vezetését a tudomány fő embereire bízták, elsőként a grammatikus-filológusra, az epheszoszi Zenodotoszra, ő kezdte meg a könyvállomány rendezését. A történelem első, név szerint ismert könyvtárosa Kallimakhosz volt (i.e. 310 240), aki Pinaches (táblácskák) címmel katalógust készített. Anyagát két fő csoportra osztotta: költőkre és prózaírókra. Ezeken belül hat-hat alcsoportot állapított meg aszerint, hogy az adott szerző mely műfajban jeleskedett (pl. elégikusok, szatírikusok, epikusok, illetve történetírók, filozófusok, orvosok stb.). A leíró katalogizálás módszereinek kialakulása szempontjából is kiemelkedő jelentőségű Kallimakhosz műve: felvette a könyvek szerzőjének nevét, címét, megadta a terjedelmet. Az egyes szerzőkről életrajzi adatokat is közölt. A Pinaches hosszú ideig az ókor későbbi bibliográfiáinak alapjául szolgált. A történeti vonatkozásokat az évszázadokon keresztül hosszasan lehetne még sorolni, lépjünk előre az időben, és következzen egy jelentős mérföldkő, a papír alapú katalógusok széles kürű elterjedése. A papír alapú katalógusok közül elsőként kötetkatalógust használtak, majd ezt követte a cédulakatalógus. Azóta ugyan mindkettő penetrációja, így szerepe is folyamatosan csökkent, de még 2000 után találunk példát az alkalmazásukra. A cédulakatalógus az 19. század végén vált a könyvtárakban a másodlagos információk feltárásának és keresésének fő eszközévé, és ezt a szerepet az 1990-es évekig töltötte be, de egyes kiskönyvtárak a mai napig ezt használják. A cédulakatalógus egy-egy könyvtár állományát tükröző szurrogátumok rendszerezésére, azon keresztül az állomány rendszerezett áttekintésére szolgálnak, szerkesztésének szabványai 1980 86 között jelentek meg. A katalógusok használatának szabályaival sokan, többek között elsőként az ókori görögök is foglalkoztak. Példaként tekintsük át Cutter (1876) megfogalmazásában a katalógusok alapján történő keresés elveit: tegye lehetővé, hogy az olvasó megtaláljon egy könyvet, amelynek a szerzője, a címe, a tárgya ismert, mutassa meg a felhasználónak, hogy a könyvtár milyen dokumentummal rendelkezik: adott szerzőtől, meghatározott témában, és egy bizonyos irodalomban, segítsen az olvasónak egy könyv kiválasztásában annak bibliográfiai, tartalmi jellemzői szerint. Ma az online keresés alapelvei hasonlóak, ugyanis ma is keresünk konkrét elektronikus dokumentumot, objektumot ismert adatok alapján, valamint keressük a dokumentumok, objektumok listáját egy témakörrel kapcsolatban. Az információkresés formai szempontjairól a Bibliográfiai adatfeldolgozás tanegységen belül, míg a tartalmi szempontjairól az Információkereső nyelvek (IKNY) tanegység keretében tanultak részletesebben. Feltárás mágnesszalagon tárolt adatbázisból A mai adatbázisok történeti előzményei az egy-egy szakterület primér irodalmát feldolgozó, bibliográfiai-referáló folyóiratokra épülő adatbázisok, amelyek a kezdetektől fogva kereskedelmi vállalkozásokként indultak az 1960-as években. Az adatbázis a számítógépes adatfeldolgozó rendszer működéséhez szükséges, egymással logikai kapcsolatban levő adatok szervezett halmaza. Segítségével összetett szerkezetű adatmodellt valósíthatunk meg. 14

A mágnesszalagos bibliográfiai adatcsereformátum szabványa (ISO 2709) 1973-ban, míg az ezen alapuló magyar szabvány 1983-ban jelent meg. Az adatbázisok egyedi nevet kaptak, ami egyértelművé tette a keresés lehetőségeit. Példa: Chemical Abstracts CAS, ERIC. A referáló lapok többségét már számítógéppel állították elő, és innen már csak egy lépés volt, hogy egy-egy referátum adataiból és a hozzá kapcsolódó információkeresést segítő keresőnyelvi eszközökből kialakuljanak a rekordok, a referáló lapok számítógépes változataiból az adatbázisok. Elsőként az American Chemical Society referálólapja, a Chemical Abstracts (1961-től) és a National Library of Medicine (Bethesda, Wa.) Index Medicusa (1963-tól) éltek az új technikai lehetőséggel. Adatbázisokat a könyvtári munka könnyítése érdekében készítettek, és az adatbázisok neve volt kiemelt jelentőségű. Ejtsünk néhány szót végre magáról a keresésről is. Az adatbázisokban való keresés jellemzői a mai szemmel nézve igen sajátosak a kezdeti mágnesszalagos adattárak közvetített kereséséhez képest. A felhasználó ugyanis a keresésben közvetlenül nem vett részt. A keresést a professzionális kereső szakemberek végezték el, ők fogalmazták meg a keresőkérdést. A keresőkérdés a felhasználó eredeti, feltett kérdésének a számítógépes keresőrendszer szintaktikája szerint átírt karakterlánca. A keresőkérdés lehet egyszerű vagy összetett. Kezdetben a keresőprogram számára kezelhető formában átalakított, természetes nyelvű keresőkérdést a keresőprofil jelentette, de napjainkban a keresőkérdéshez társítjuk ezt a jelentést. Öszszetett keresőkérdés beírásakor általában több szót adunk meg, és Boole-operátorokkal (logikai operátorokkal) kapcsoljuk össze a keresőkérdés szavait. Az összetett keresés számos könyvtári rendszerben parancsszavas formában történik (például CCL nyelven). A keresőprofil használatát az adatbázisok specifikus, bonyolult, elágazó, paranccsal vagy menüvel vezérelt keresőrendszerei indokolták, illetve az, hogy a gépidő és a hálózati kapcsolódás igen drága volt. A keresőprofil szerkesztése a felhasználó által megadott szempontok alapján, a megfelelő segédeszközök (tárgyszójegyzékek, tezauruszok stb.), parancsnyelv és kereséstechnikai eszközök (Boole-operátorok, csonkolás stb.) segítségével történt. Ezt a keresőprofilt hasonlította össze a gép az adatbázisban levő dokumentumok profiljával. A gyakorlatias olvasók számára íme egy konkrét segédlet a keresőprofil összeállításához: http://gep.dialog.com/instruction/workbook/2005_labwb_bluesheets.pdf. Az offline mágnesszalagos adatszolgáltatások a szelektív információterjesztés (SDI) leggyakribb példáinak minősültek. A beszerzett mágnesszalagok alapján a szelektív információterjesztési rendszer munkafolyamatai a következők voltak: a szolgáltatás szervezése, infrastruktúraépítés, az információk számítógépes szelektálása, a felhasználók kiértesítése, a találatok értékelése, a felhasználókkal való folyamatos kapcsolattartás, és igény esetében dokumentumok, másolatok szolgáltatása. E szolgáltatási formának alapvető szerepe volt a nemzetközi információcsere szabványosításában, az egységes szabványos rekordszerkezetek használatában, a szolgáltatási 15

rendszerkoncepció elterjesztésében. Az 1970-es években Magyarországon 25 mágnesszalagos szolgáltatás honosodott meg (pl. Veszprémi Vegyipari Egyetem Központi Könyvtára, OMIKK). A matematikai logikai alapokon nyugvó, adatbázisban történő keresés az adatbáziskezelő rendszerek része volt, magát a keresést különösebben nem írták körül, hiszen maga az adatbázis csak a keresővel együtt használható, vagyis az adott adatbázishoz egy kereső volt, és az általában csak egy adatbázisban tudott keresni. 1. kép Az információfeltárás eszközeinek fejlődése Feltárás mágneslemezen és optikai tárolón rögzített adatbázisból Az 1980-as évek második felében hazánkban is megjelentek a CD-ROM-os adatbázisok, volt olyan, amelyet például témafigyelésre alkalmaztak (lásd MTA). A témafigyelséhez kapcsolódó példa a PRESSDOK, ami az Országgyűlési Könyvtár hazai politikai, gazdasági és részben jogi témájú sajtófigyelése. Másik példa a HUNDOK, ahol az Országgyűlési Könyvtár állományában megtalálható, hozzávetőleg 50 mértékadó külföldi sajtóorgánum Magyarországról szóló cikkeinek gyűjteménye. Az 1990-es években bontakozott ki a helyi hálózaton keresztül történő keresés, és megjelentek a weben az online könyvtári katalógusok (OPAC). Az online szolgáltatások az ezredfordulóra erőteljes fejlődésnek indultak. Online hálózati szolgáltatóközpontok jöttek létre, amelyek biztosították az online adatbázisok hálózati használatát. A szolgáltatók (pl.: Dialog, DataStar, STN) a szolgáltató-központokban retrospektív adatbázis építés folytattak, ezekben az adatbázisokban parancsnyelv alapján kerestek. Az interneten erősödik az önkiszolgálás, és a keresés technikai eszközei a felhasználó oldalán egyszerűsödnek. Az ezredfordulón a láthatatlan vagy mélységi web keresési 16

lehetőségeit tárták fel, ami az altalános, automatikus keresőszolgáltatás által nem indexelt tartalmakra terjed ki, tehát a weben keresztül lekérdezhető adatbázisok adatainak feltérképezését jelenti. A jövőben az intelligens webes keresés fejlődése várható, melynek előszelei már most is megmutatkoznak. Az utóbbi témákról a későbbiekben részletesen is szólunk. A fenti gondolatmenet vázlatosan az 1. ábrán látható. Az alsó szaggatott vonal alatt a papír alapú keresést segítő eszközöket, míg a felső szaggatott vonal felett a keresés hatókörének, illetve a használók körének érdemi változását láthatjuk. A keresés hatóköre a formai adatokról áthelyeződik a tartalmi jellemzőkre. A használók köre pedig egy szűk szakmai réteg (könyvtáros, kutató stb.) helyett egyre inkább hazánk és a világ teljes lakosságának a digitális írástudással rendelkező hányadát jelenti. A felhasználó szempontjából az adatelérés fokozatosan vált nyitottabbá. A felhasználó kezdetben csak a keresőkérdést tehette fel, később maga is használhatta az adatbázishoz kapcsolódó keresőrendszereket. Az internetnek köszönhetően ez kiteljesedett, hiszen az adatok elképesztően nagy tömegéből az egyes kutatóműhelyek, illetve később a cégek egy adatbázist készítettek, amelyben lehetett keresni, és ezekre épültek az online keresőrendszerek, majd ezek egy része később nyitott keresőszolgáltatássá vált. Az említetteken túl, az utóbbi évtizedben váltak jelentőssé az automatikus indexelőmotorra épülő általános keresőszolgáltatások, például a Google, Yahoo, Bing. Az interneten tárolt információk elérése Valaha a könyvtárosok a keresőkérdésre informatikusok nélkül nem kaptak volna választ, mivel a választ általában csak az adatbázishoz tartozó keresővel kaphatták meg. Az informatikusok szerepe a későbbikeben háttérbe szorult, és a könytáros közvetlenül kereshetett az adatbázisokban. Az interneten fellelhető számos keresőrendszer azonban már nem egységesen, nem azonos céllal, és időben is eltérő módon használható. Ennek következménye, hogy az ezredforduló után a könyvtárosok szaktájékoztató eszközei évről évre jelentős változáson mennek keresztül, emiatt a hatékony keresés érdekében érdemes elsajátítani, majd állandóan frissíteni a használatukhoz szükséges ismereteket. Az adatbázisban tárolt és kereshető adatok aktualizálása, frissítése az adatbázisok típusától, illetve a szakterülettől függően változik. Az adatbázisokban először megjelentek a korábban is használt deszkriptorok, tárgyszavak, de később az ún. szabad keresőszavak vagy más néven kulcsszavak is rendelkezésre álltak. A keresés igénybe vehető módszerei, és egyben eszközei az adatbázis keresőfelületén a következők: két fokozat: egyszerű keresés, haladó (összetett) keresés, böngészés, tezaurusz-üzemmód (az adatbázisok számottevő részében). A jelenlegi webes technológia az állandó átalakulás következtében öt tíz év távlatában jelentős mértékben változik, lehetőségei kibővülnek. A hagyományos és számítógépes technológiák lehetőségeinek kiaknázásával a korszerű könyvtárosi feladatkör kiegészül a tudásfeltárással. Az átláthatatlanul nagy adattömegben a könyvtárosnak nem csupán egy releváns információt kell megtalálnia, hanem a lehető legalaposabb információt kell átadnia a kívánt mélységig. Ehhez elengedhetetlen az új webes technológiák megismerése, a web átalakulásának, fejlődésének megértése, és lehetőségeinek gyakorlati készség szintű elsajátítása. 17

18 2.3.2 A könyvtári adatbázisok típusai A könyvtárakban az adatelérés szemszögéből a legnagyobb változást elsőként az adatbázisok jelentették. Adatbázisok nélkül nem beszélhetünk elektronikus keresésről sem. Az adatbázisokat a szolgáltatott információk szempontjából a Carlos A. Cuadra által kialakított taxonómia alapján csoportosítjuk. Ez a csoportosítás azért is fontos, mivel az itt felsorolt adatbázis-típusok kezdetben meghatározták a keresés tárgyát. Az adatbázisoknak két jelentős ága ismert: a referensz (másképpen bibliográfiai vagy forrástájékoztató) adatbázisok, valamint a forrás adatbázisok. Referensz adatbázisok Jellemző rájuk, hogy az eredeti, elsődleges forrásokra vonatkozó ún. másodlagos információkat tartalmaznak. A referensz adatbázisoknak két fajtája van: a bibliográfiai adatbázisok és a forrástájékoztató adatbázisok. A bibliográfiai adatbázisok elsődleges forrásai a kiadott vagy meg nem jelentetett dokumentumok (könyvek, időszaki kiadványok, folyóiratcikkek, szabadalmak, térképek, zeneművek stb.). A másodlagos információk a rájuk vonatkozó leírások (bibliográfiai tételek, referátumok, annotációk, tömörítvények stb.). Példa a bibliográfiai adatbázisokra: könyvtári online katalógusok, online módon elérhető bibliográfiák (pl.: MNB), cikkadatbázisok (pl.: MANCI, PRESSDOK), online szakterületi adatbázisok (pl.: ERIC, MEDLINE). A forrástájékoztató adatbázisok (referral-databases) személyek, szervezetek, szolgáltatások, folyó kutatások adatait tartalmazzák és teszik kereshetővé. A bennük található másodlagos információk a forrásokra vonatkozó rekordok (leírások), amelyek alapján azok elérhetők. Példa forrástájékoztató adatbázisokra: cím- és céginformációs adatok (név- és címtárak, cégkatalógusok), például a KSH cégnyilvántartása telefonkönyvek, pl.: Arany Oldalak szakmai telefonkönyv a weben termékinformációs adatbázisok, wapon (mobiltelefonon) és CD-ROM-on elérhető adatbázisok. Megjegyzés: a könyvtári adatbázisok leírásához használt forrással ellentétben a forrástájékoztató adatbázis fogalma azonos a referensz (bibliográfiai) adatbázissal és tovább nem bontható. Ez a három kifejezés: referensz-, bibliográfiai-, forrástájékoztató adatbázis ugyanazt jelenti: csak bibliográfiai adatokat tartalmaz. Forrástájékoztató ugyanis az az adatbázis, azaz bibliográfiai (referensz) adatbázis, amelyekben csak bibliográfiai adatokat lehet keresni. Így a címtárak, telefonkönyvek stb. nem tekinthetők referensz adatbázisnak. Forrás adatbázisok A forrásadatbázisok elsődleges adat- vagy információforrások, amelyek önmagukban tartalmazzák a keresett információt (számszerű, szöveges adat, vagy teljes szöveg formájában). Közvetlen választ adhatnak kérdéseinkre, ezért nevezik forrás típusú adatbázisoknak is. Fajtái: numerikus, szöveges-numerikus, teljes szövegű adatbázisok.

A numerikus adatbázisok eredeti statisztikai vagy más numerikus adatokat (például termelési, ipari, fogyasztási, költségvetési, pénzügyi, választási, demográfiai adatokat) tartalmaznak a legkülönfélébb (például idősoros, területi) rendezettségben. Adatbankoknak is nevezzük őket, melyeknek egy része nem nyilvános. Kérdéseinkre közvetlen választ adhatnak. Példák a numerikus adatbázisokra: a statisztikai hivatalok adatbázisai, a demográfiai adatbankok, a lakossági címnyilvántartás, az igazgatási (miniszteriális és önkormányzati) adatbázisok (például a Defense Data Bank). Az ipari termelés és szolgáltatás adatait tartalmazó adatbankok (például az USA mezőgazdasági adatait heti, havi és negyedéves idősorokban szolgáltató National Agricultural Statistical Service, a termelési, fogyasztási és népességi adatokat tartalmazó PTS Time Series). A szöveges-numerikus adatbázisok eredeti szöveges és számszerű adatokat felváltva tartalmaznak. Életrajzi, vállalati, politikai stb. adatbázisok, olykor kézikönyvként nyomtatott formában is léteznek. llyen adatbázisok, például a Pályázatfigyelő, a CompAlmanach Kft. Ki mit gyárt? vállalati katalógusa, a vegyi anyagokról szóló információkat szolgáltató CHEMSEARCH. A teljes szövegű adatbázisok eredeti szöveges dokumentumokat tartalmaznak, továbbá kiegészülnek keresőnyelvi eszközökkel. A teljes szövegű adatbázisok esetében a dokumentum teljes tartalma, s nem a róla szóló híradás, leírás kerül az adatbázisba, ezután annak minden elemét visszakereshetővé teszik. Példák a teljes szövegű adatbázisokra: jogi adatbázisok (LEXIS), gyógyszerészeti, orvosi (Drug Information Fulltext stb.), gazdasági és műszaki adatbázisok, elektronikus-digitális könyvtárak (például a Magyar Elektronikus Könyvtár), a digitalizált enciklopédiák (például azencyclopedia Britannica), az elektronikus folyóiratok és lapok cikkeinek adatbázisai (például a Népszabadság, a Figyelő, a Lakáskultúra, a Times archívumai). A multimédiás adatbázisok a teljes szövegű körébe tartoznak, természetesen a szöveg fogalmát tágabban értelmezik. 2.3.3 Az információfeltárás intellektuális eszközei A könyvtári adatbázisok alkalmazásainak kezdeteitől (1960-as évek) azok élen jártak mind az információkereső nyelvek (aspeciális osztályozási rendszerek, tárgyszó rendszerek, tezauruszok) fejlesztésében, mind pedig az igénybe vehető keresési lehetőségek bővítésében (Boole-operátorok, helyzeti operátorok, csonkolás, felhasználói preferencia szerint keresés, mezők szerinti keresés és szűkítés, böngészés lehetősége). A keresés elősegítésére szavas, kifejezéses, kijelöléses, összetett és speciális (programozható) indexelési típusokat fejlesztettek ki. Az indexgenerálásnak köszönhetően sokféle adattípus (szerzők neve, tárgykörök, földrajzi helyek, intézmények neve, nyelv stb.) szerinti keresést tesznek lehetővé, elősegítve a nagyobb pontosság elérését. Az adatbázisok jellegzetessége, hogy többféle kereső nyelv használatát teszik lehetővé, melyek az alábbi alapeseteket jelentik vagy ezekre épülnek: szabadszavas (kulcsszavas, szövegszavas) keresés, kötöttszavas (tárgyszavas) keresés, deszkriptor (tárgyszavak hiearchiájának leírása) szerinti keresés. A szabadszavas keresés természetes nyelven alapuló, nem szabványosított, azaz bármilyen szó szerepelhet a keresőkérdésben, sőt annak a ragozott vagy csonkolt alakjai is. 19

Az online keresőrendszerek a szabadszavas keresést biztosítják, melyek a keresés kulcsszavai, ezért a kulcsszvas kereső elnevés is igen gyakori. A kötöttszavas keresés szabványosított, így csak a szerkesztési szabályoknak megfelelő (például csak alany esetben álló, egyes számban lévő főnév) szavak szerepelhetnek a keresőkérdésben, esetleg azok szinonimái. A deszkriptor szerinti keresésnél csak a megfelelő jelzetek szerepelhetnek a keresésben. Az online könyvtári rendszerek mindhárom keresést, és azok kombinációját is használják, de a tananyagunkban csak a szabadszavas vagy a gyakrabban emlegetett kulcsszavas keresés jelenik meg. A kulcsszavas keresésről, a tárgyszavazásról, a deszkriptorszerkesztés szabályairól tanultakat érdemes felidézni az Információkereső nyelvek (IKNY) tanegység tananyaga alapján. Kereséstechnikai eszközök A bibliográfiai és referáló adatbázisoknál a kereséstechnikai eszközök széles palettája áll rendelkezésre, természetesen a felsoroltak mindegyike nem vonatkozik minden adatbázisra: a keresőkérdésben fogalmi csoportok (fogalomkörök) kialakítása, megfelelő segédletek alapján (tezauruszok, tárgyszójegyzékek, osztályozási táblázatok), ezek egymáshoz kapcsolása a Boole-operátorok segítségével (a teljesség növelésére szolgál az OR, a pontosság növelésére az AND és NOT operátor), a keresőkérdésben helyzeti operátorok használata a keresőszavak egymáshoz viszonyított előfordulásának meghatározására, a pontosság növelésére a keresőkérdésben a szó csonkolásának különféle változatai (szóvégi egy vagy több karakter, szóközi, szókezdeti stb.) a teljesség növelésére, a keresés körének, helyének, tárgyának korlátozása stb. a pontosság növelésére (például nyelvi korlátozás). A felsoroltak mindegyike jellemző az online keresésre is, bár az első eszköz még nagyon kevés online kulcsszavas kereső sajátja. Keresési segédeszközök A korábban offline elérhető segédeszközök a keresőrendszer dokumentumai, például parancsnyelv kézikönyve, adatbázisok dokumentumai, az adatbázis információkereső nyelvének dokumentumai napjainkra online hozzáférhetővé váltak. Az online szolgáltatók által a rendszerekhez biztosított help üzenetek; weblapjukról lekérhető információk; kezdetekben hirdetőtáblák (BBS) stb. Az adatbázisokhoz megbízható, gyakorlatias tájékoztató felületek (súgó, GYIK Gyakran Ismételt Kérdések). A tájékoztató felületek jó példa az ERIC adatbázis (http://www.eric.ed.gov/), amelyhez a blue sheet segédlet kapcsolódik, amelyek segítséget nyújtanak a felületéről elérhető, de éltérő keresési stratégiákról. 20