5. INDEXELÉS Összeáll. dr. Pálvölgyi Mihály. BDF KIT, 2006-07. tanév, 1. félév
TARTALOMJEGYZÉK 5. 1. AZ INDEX FOGALMA, TIPIZÁLÁSA 5.2. AZ INDEXEK RÉSZLETES TIPIZÁLÁSA 5.3. A KULCSSZÓINDEX FOGALMA, TÖRTÉNETE, TÍPUSAI 5.4. SAJÁTOS INDEX-ALKALMAZÁSOK: PRECIS INDEX ÉS HIVATKOZÁSI INDEX 5.5. INTERNETES KERESSZOLGÁLTATÁSOK
5.1. Az index fogalma, tipizálása 5.1.1. Az index fogalma 5.1.2. Az indexek tipizálási szempontjai
5.1.1. Az index fogalma Az index latin eredet szó. Jelentései: egyetemi, fiskolai leckekönyv, jármn irányjelz kar vagy villogó lámpa, tiltott könyvek jegyzéke. A Magyar értelmez kéziszótár a szónak összesen 8 jelentését különbözteti meg. A jelentései közül egyik: név-, tárgy-, és szómutató, azok a mutatók, melyek a könyvek, repertóriumok, bibliográfiák végén találhatók és lehetvé teszik, hogy azokban szerepl /személy, testületi, földrajzi stb./ neveket, tárgyszavakat stb. gyorsan és kényelmesen visszakereshessük.
5.1.1. Indexelési alapfogalmak: a könyvvégi index A könyvvégi index /back of the book index) az angolszász kiadványokban már évtizedek óta a szakkönyvek, tankönyvek szerves tartozéka és gondos indexkészítési, indexelési folyamat eredménye. Magyarországon ez a gyakorlat napjainkban kezd csak általánossá válni. IKNY-jegyzetünkben már ezt alkalmaztuk 1998-ban. Az indexelésnek e jelentése egyedi dokumentumokban rögzített információik feltárásával kapcsolatos.
5.1.1.Indexelési alapfogalmak: indexel nyelv Angolul Indexing language A természetes nyelvbl származó ellenrzött fogalmak halmaza, mely a dokumentumok tartalmának tömör kifejezésére, képviseletére szolgál. [ISO 2788:1986; and ISO 5964:1985]- A szabvány hozzáteszi: a posztkoordinált rendszerben e kifejezéseket a keresési célt szolgáló kulcszavaknak nevezik, melyek esetében általában nem tesznek kísérletet arra, hogy a köztük lev szintaktikai kapcsolatokat jelöljék. NOTE [from ISO 5964:1985]
5.1.1. Indexelési alapfogalmak: indexek Az indexek - különböz osztályozási mveletek végtermékei, a dokumentum tartalmát és egyéb jellemzit leíró szóláncok indextételek rendezett gyjteményei, (Környei, 1990. 55. p.) melyek funkciója, hogy elvezessenek bennünket a számunkra releváns dokumentumokhoz /kognitivumokhoz.
5.1.2. Az indexek tipizálási szempontjai Az indexeket, különösen, ha önállóan jelennek meg, indexmveknek is szokták nevezni. Mi a továbbiakban az index kifejezést részesítjük elnyben. Az indexeket négy f szempont szerint csoportosítjuk: az alkalmazott nyelv szabályozottsága szerint az indexben kereshet ismérvek szerint az index elállítási módja szerint az indexben feldolgozott és kereshet anyag idkorlátai szerint A felosztási szempontok megválasztását információfeldolgozási, információkeresési szempontok egyaránt indokolják
5.2. AZ INDEXEK RÉSZLETES TIPIZÁLÁSA 5.2.1. a keresnyelv szabályozottsága szerint 5.2.2. a kereshet ismérvek szerint 5.2.3. a feldolgozás idspektruma szerint 5.2.4./5. az elállítás és alkalmazás módja szerint
5.2.1. Indextípusok az alkalmazott keresnyelv szabályozottsága szerint 5.2.1.1. Kulcsszóindexek 5.2.1.2. Tárgyi indexek Ld. táblázatosan a következ lapon!
5.2.1. Indextípusok az alkalmazott keresnyelv szabályozottsága szerint folyt. Típus neve kulcszszavas KWIC-index, KWOCindex Kulcsszóindex címindex Tárgyi index /tárgyszóindex/ Szabályozottság mértéke kötetlen szókészlet, nem vagy alig ellenrzött Kötött szókészlet, szabályozott IKNY-szótár alapján kiválasztva Példák Permutált tárgyi index, Lánceljárásos tárgyi index PRECIS-index
5.2.2. Indextípusok a kereshet ismérvek szerint 5.2.2.1. A kereshet ismérvek köre Lényegében a forrásokban szerepl bármilyen típusú adatok, ismérvek, információk kereshet: személynevek (mint szerzk, v. mint a forrásban tárgyalt személyek), intézmény-, földrajzi nevek, tárgyi-tematikus megnevezések stb. 5.2.2.2. A hivatkozási index sajátosságai egyaránt kereshetk benne a szerzk, illetve azok a személyek, akikre a munkájukban hivatkoztak, valamitn azok, akik a szerzkre a késbbiek során hivatkoztak, s természetesen kiegészülve tematikus-tárgyi stb. keresési lehetségekkel a tudományos elismertség szempontjából is
5.2.3. Indexek a feldolgozás idspektruma szerint 5.2.3.1. Rövid történeti áttekintés A múltban általában külön vált az ujdonságokat bemutató kurrens indexek (melyek bizonyos idközökben hetente, havonta, stb. jelentek meg), és a hosszabb idszakokra vonatkozó visszamenleges keresést biztosító retrospektiv indexek köre. 5.2.3.2. A kurrens és retrospektív keresés integrációja Az elektronikus források és szolgáltatások fejldésnek köszönheten a kétféle keresés (csak az újdonságok keresése, illetve a teljes forrásbázison alapuló keresés) integrált, azonos felületen jelenik meg, kialakulnak a kurrens anyagra való korlátozott keresés módszerei és eszköze
5.2.4. Indextípusok az elállítás módja szerint 5.2.4.1. Kézi és gépi indexek és jellemzik 5.2.4.2. Az adatbázisok indexei a készítés és használat módja szerint 5.2.5. Indextípusok az alkalmazás módja szerint
5.2.4.1. Kézi és gépi indexek és f jellemzik, példáik Index típusa Kézi indexek Gépi indexek Automatizált Indexek Jellemzés Manuális munka, nagy idés munkaigény Gépi munka, Kisebb idigény, automatizált vagy félig automatizált Példák könyvindexek, pl. szerzi mutató, tárgymutató címindex, tárgyszóindex, hivatkozási index internetes indexel rendszerek
5.2.4.2 Adatbázisok indexei készítés módja szerint Készítés Az egyes indexek készítése során az adatbázis-kezel program azokból a szavakból, amelyek az adatbázis formájára, tartalmára és egyéb jegyeire utalnak (pl. a szerznevek, címek, kulcsszavak, tárgyszavak, nyelvek, kiadási évek stb.) betrendbe rendezett listákat készít minden szó mellé odaírja, hogy hányszor fordul el, hányadik rekordban és azon belül pontosan hol található. Ez az információ teszi lehetvé a gép számára, hogy a program azonnal, sorbaolvasás nélkül ráálljon a kért rekordra.
5.2.4.2 Adatbázisok indexei keresés módja szerint Használat, keresés feltételei, módja: Az index segítségével a program több millió rekord közül is képes rövid id alatt megtalálni a szükségeseket. A keresés alkalmával beírt szerznév, tárgyszó, kulcsszó stb. mellett eredményként elször az elfordulás száma jelenik meg a képernyn. Ez alapján az megjeleníthet, vagy a találati lista más index kombinált alkalmazásával szkíthet. Példák: magyar: MANCI, angol: ERIC
5.2.5. Indextípusok az alkalmazás módja szerint Az indexek alkalmazásában korábban az önálló indexmveknek, a nyomtatott indexeknek volt domináns szerepe, ma már inkább a nagy adatbázisok, vagy az OPAC-ok keresrendszerének fontos összetevi, a kialakított komplex indexrendszerekkel (kulcsszó, tárgyszó, deszkriptor, név, kiadás éve, stb.). Ezekben élni lehet mind az egyszer, mind az összetett (haladó) keresés lehetségeivel, mind pedig gyakran a böngészés lehetségével.. Legsikeresebb alkalmazásaikban jól ötvözdnek az intellektuális emberi munka és az automatizálás adta lehetségek. Példák: Thompson Dialog keretében hozzáférhet indexek http://support.dialog.com/searchaids/essentials.shtml H. W. Wilson Company indexei, http://www.hwwilson.com/ftabsind_alpha.htm A nemzetközi adatbázis-szolgáltatók indexel szolgáltatásai kiegészülnek referátumokkal, recenziókkal, melyeket szakemberek készítik, és ez garancia a jó minségre. Egyre szélesebb körben nyújtanak lehetséget a teljes szöveg elérésére.
5.3. A KULCSSZÓINDEX FOGALMA, A KWIC-INDEX, ÉS EGYÉB KULCSZAVAS INDEXEK 5.3.1. A kulcsszóindex fogalma 5.3.2. KWIC-index 5.3.3. Egyéb kulcszavas indexek: KWOC-index, permuterm-index
5.3.1. A kulcsszóindex fogalma, története, válfajai 5.3.1.1. A kulcsszóindex fogalma, megjelenése 5.3.1.2. A kulcsszóindex jellegzetességei, válfajai
5.3.1.1. A kulcsszóindex megjelenése, fogalma 1. - A kulcsszóindex olyan index, melynél az indexelés során közvetlenül a dokumentum címébl, szövegébl vagy referátumának szavaiból választjuk ki az osztályozási kifejezéseket /keresnyelvi szavakat esetünkben a kulcsszavakat/. - Ezeket mellérendel módon kombináljuk, s az indexsor végén megadjuk a vonatkozó forrás lelhelyét. - A kulcsszóindex esetében fontos a szövegkörnyezet: a kulcsszavak a betrendes keresést biztosító indexkiadványokban nem önmagukban, önállóan állnak, hanem együtt, egy sorban a kulcsszavas indextétel többi szavával, tehát szövegkörnyezetben. Ld. még 5.3.1.2
5.3.1.1. A kulcsszóindex megjelenése, fogalma 2. A kulcsszóindexek megjelenésének két f tényezje: /1/ az a II. világháborút követen terjed mozgalom, mely jelszavául tzte ki, hogy az indexelés és keresés céljára a kötött nyelv IKNY-ek helyett a kötetlen természetes nyelvet használják, /2/ a technikai feltételeket biztosító számítógép kifejlesztése. Mortiber Taube 1953-ban kifejlesztette uniterm rendszerét, amelynek egyik lényegi jellemzje az volt, hogy indexel kifejezésnek a szerzk által az eredeti dokumentumokban használt szavakat tekintette. /2/ a fenti elveknek megfelel indextípus készítéséhez szükséges számítógépek kifejlesztése.
5.3.1.2. A kulcsszóindex jellegezetességei, válfajai A kulcsszóindexeknek az a közös jellegzetessége, hogy a feltárni kívánt dokumentumok tartalmának leírására (1), a dokumentum eredeti címét, (2), vagy/és részben módosított, kiegészített címét, (3), vagy/és mesterségesen alkotott mcímét/ tartalmi cím/ használják fel. A kulcsszóindexek két f formája a KWIC-index és a KWOC-index. A KWIC-indexben a kulcsszavak közvetlenül szövegkörnyezetbe ágyazva találhatók meg a betrendben, a KWOC-index esetében kiemelten, majd ezt követen a teljes szövegkörnyezetet biztosító indextételben. Mindkét típus viszonylag olcsón készíthet és gyors keresést, böngészést tesz lehetvé. Jellegzetességeikre, különbségekre a szemináriumokon utalunk.
5.3.2. A KWIC-index lényege, szerkezete, jellemzi 5.3.2.1 A KWIC-index lényege 5.3.2.2. Az indexsor szerkezete
5.3.2.1. A KWIC-indexe jellemzése Módszerét Hans Peter Luhn 1958-ban dolgozta ki és 1960-ban tette közzé az IBM megbízásából. A KWIC betszó az angol KeyWord-In-Context rövidítése, magyarul Kulcsszó szövegkörnyezetben, szövegkörnyezetes kulcsszó index. Magyarországi alkalmazására jó példa a Tudományos és Mszaki Tájékoztatás c. folyóirat éves indexe, melyben tematikusan a KWIC-index alapján lehet keresni. Alkalmazásának fázisai: (1) szellemi elkészítés: az indexel a cím, referátum, szöveg alapján megalkotja a kulcsszavas indextételt, a kiegészít adatokkal ( a hivatkozott forrás típusa, helye a folyóiratévfolyam száma, a lapszámok). Mindezt a folyóiratban megjelent összes tanulmányra, referátumra stb. vonatkozóan el kell készíteni. (2) gépi indexgenerálás: a fentiek alapján elkészített kulcsszavas indextételekbl a gép elállítja a KWIC-indexet. Eközben stoplistát is igénybe vesz, melyben azok a szavak szerepelnek, melyek alatt a tételek semmi esetre sem kerülnek beosztásra az indexbe, mert nincs tárgyi-tematikus keresértékük (pl. névelk, töltelékszavak stb.) (3) Használat/ keresés a használó a számára releváns témaköröket/kulcsszavakat a keresoszlopok segítségével a betrendes indexben megkeresi, a szövegkörnyezetüket megnézi, és eldönti, hogy számára érdekes-e az adott tétel
5.3. Permutáció a KWIC-indexben A permutáció véges számú dolog, tárgy, általában elem valamilyen sorrendben való elrendezését jelenti. Legyenek az indextétel szavai a permutálandó elemek : a, b, c, d. Ezek a legkülönfélébb sorrendben rendezhetk egymással, pl. abcd, acdb, badc, dcba - az összes permutációk száma 24 lenne. Kapacításokok miatt általában a permutációnak egy, speciális esetét vesszük igénybe, az un. ciklikus permutációt / rotációt / - eszerint a sorrend változatlanul marad, de a rotáció következtében mindig más elem kerül elre: abcd, bcda, cdab, dabc
5.3.3. Egyéb kulcsszavas indexek 5.3.3.1. A KWOC-index lényegi jellemzi 5.3.3.2. A KWOC-index tétel felépítése 5.3.3.3. Permuterm /subject / index
5.3.3.1. A KWOC-index lényegi jellemzi A címindexek másik, széles körben ismert, de kevésbé elterjedt típusa. A KWOC jelentése: Key-Word-Out of Context, azaz Kulcsszó a szövegkörnyezetbl kiemelve. Lényegesen késbb alakul ki, illetve vált népszervé, mint a KWIC: Kiküszöböli a KWIC f hátrányait ( a korlátozott sorhosszúságot, illetve azzal összefüggésben a teljes indextétel egyben látásának hiányát. A KWOC-indexben a kulcsszót els lépésben kiemelik a szövegkörnyezetbl, közvetlen az indextétel felett található. Ezt követi a következ sortól a teljes indextétel a teljes szövegkörnyezettel, az eredeti sorrendben
5.3.3.2. A KWOC-index tétel felépítése Kiinduló indextétel: Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés Ahogy a KWOC-indexben megjelenik Információkeresés Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés Könyvtári katalógusok Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés Online könyvtári katalógusok Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés Természetes nyelv információkeresés Az online könyvtári katalógusok /OPAC/ és a természetes nyelv információkeresés stb.
5.3.3.3. Permuterm /subject/ index Egyesek a kulcsszavak közé sorolják a Permuterm /subject / indexet, mely kulcsszópárokkal operál. Legegyszerbb esetben a kulcsszavak a dokumentum szövegébl /ritkábban szövegébl/ származnak. Ez a fajta index ugyanakkor közel áll/hat/ a tárgyi indexekhez, mivel a cím szavait bizonyos szabályozásnak vet/het/ik alá, pl. ragozott alakok helyettesítése, szinonimák egységesítése. A permuterm subject index alkalmazhatja lásd típusú utalókat is.
5.4. SAJÁTOS INDEX-ALKALMAZÁSOK, PRECIS, HIVATKOZÁSI INDEX 5.4.1./3 A PRECIS lényegi jellemzi 5.4.4. A hivatkozási index fogalma, jellemzi
5.4.1./3 A PRECIS-index lényegi jellemzi A PRECIS a tárgyi indexek közé tartozik. A PRECIS betszó a Preserved Context Indexing System rövidítése, amely szövegösszefüggést megtartó indexelési rendszer -t jelent. Az angol Austin dolgozta ki 1971-tl kezdden. Lényegében grammatikai szabályok összesége, és az indextétel felépítése a természetes nyelv mondat szerkezetére hasonlít. Magyarországon az Országos Pedagógiai Könyvtár és Múzeum /OPKM/ alkalmazta 1986-tól a magyar pedagógiai szakirodalom feltárására az 1990-es évek végéig.
5.4. 5.4.1./3 A PRECIS-index lényegi jellemzi folyt. - A PRECIS szerinti elemzés során rövid tárgyi kijelentéseket kell megfogalmazni a dokumentumokról. Ezeket nyelvi-logikai elemzésnek vetjük alá, sorra megvizsgálva, hogy mi a kijelentés mondat állítmánya /cselekvés/, tárgya, alanya, idhatározója, helyhatározója... - Az alapvet fogalmakat kijelölésük után a program a rekordokban megforgatja, mely során azok vezet, módosító, vagy kiegészít pozicióba kerülhetnek. Az egyes kielemzett mondatrészek jelentik az összetevket, amelyeket a gép kidolgozott szabályrendszerrel kódok, operátorok stb. révén kezel.
5.4. 5.4.1./3 A PRECIS-index lényegi jellemzi folyt. indexelési példa A dokumentum tárgya: Az informatika tanulása CD-ROM-mal Mi a cselekvés, mi történik? Tanulás. Mi a cselekvés tárgya? Informatika Mivel tanulnak? - CD-ROM Az indexelés eredménye: (1) informatika (2) tanulás (3) CD-ROM
5.4.4. A hivatkozási index fogalma, jellemzi folyt. A hivatkozási index az az indextípus, mely a dokumentumok tartalmi jellemzésére nem azoknak a címét, vagy szövegét használja fel, hanem áttételesen azokat a dokumentumokat, amelyekre az /bibliográfiákban, lábjegyzetekben, vagy másutt / hivatkozik. Ha ismerem egy szerz nevét, aki az engem érdekl témáról írt, és meg tudom nézni, hogy rá kik hivatkoztak, valószín, hogy a hivatkozó szerzk dokumentumai is érdekesek számomra. Természetesen számolni kell azzal, hogy a hivatkozási indexbe csak a szigorú szelekciós követelményeknek megfelel tudományos folyóiratokban megjelent cikkek kerülnek be.
5.4.4. A hivatkozási index fogalma, jellemzi folyt. A hivatkozási index számítógéppel készül, munkafolyamatai nagyrészt automatikusak. Adottak a szerzk, a dokumentumok, a bennük lev hivatkozások, s adottak más dokumentumokban a rájuk való hivatkozások. Mindezt gépbe kell vinni, és sokféle szempont (hivatkozó szerz, hivatkozott szerz, témakör, intézmény stb.) szerint kereshetvé tenni. Az indextípus els képviselje: a Science Citation Index /természettudományi hivatkozási index/ 1964-tl jelenik meg az ISI /Institute for Scientific Information/ nyomtatott kiadásában. Napjainkban adatbázis / Web of Science (WoS) keretében férhet hozzá sokkal kényelmesebben. A keresés 1975-ig visszamenen a teljes bázison (több mint 25 millió dokumentum) nyugszik. Fiskolai hallgatóként regisztráció után használhatja az adatbázist az Oktatási Minisztérium EISZ honlapján: http://www.om.hu/eisz
5.5. INTERNETES KERESSZOLGÁLTATÁSOK 5.5.1. Az internetes keresszolgáltatások kialakulása, fejldése 5.5.2.Az indexel szolgáltatás fogalma, sajátosságai 5.5.3. Igények, használók, szolgáltatók és típusok 5.5.4. A feltárás dokumentumbázisa 5.5.5. A feltárás stratégiája, módszerei és eszközei, metaadatok 5.5.6. A keresés jellemzi, szintjei, módszerei 5.5.7. Az értékelés, fejlesztés kérdései
5.5. INTERNETES KERESSZOLGÁLTATÁSOK e témakör tömör feldolgozásához, kérem, egyénileg használják az elektronikus tananyagot.
KÉRDÉSEK Tanulmányozza az elektronikus anyagban szerepl 21 kérdést, és legyen képes azokra választ adni!
Jó felkészülést kíván A szerz