Omegawiki egy multifunkciós, közösség által szerkesztett szótári adatbázis, és annak magyar vonatkozásai Gaál Péter 1. Bevezetés Mielőtt szótárhasználóként egy szótárat veszünk a kezünkbe, optimális esetben tudatában vagyunk annak, hogy milyen jellegű szótári információra van szükségünk. Nyilvánvalóan más-más típusú szótárat kell fellapoznunk akkor, ha részletes enciklopédikus ismeretekre, egy adott szó idegen nyelvű ekvivalenseire vagy éppen definíciójára van szükségünk. A hagyományos (papíralapú) szótárak korában a különböző jellegű szótári információt általában csak több, különböző típusú és funkciójú szótárkötetből gyűjthettük össze. Az elektronikus, majd az online szótárak megjelenésével kezdetben ez a tendencia nem változott, köszönhetően többek között annak is, hogy az elektronikus szótárak tulajdonképpen nem voltak mások, mint a papírszótárok változatlan, elektronikus verziói. Az e-lexikográfia fejlődésével azonban már egyre több olyan (főként online szótárral) találkozhatunk, amelyek újfajta struktúrájukból és a tárolt adatmennyiség korlátlanságából fakadóan egyesítik magukban a különböző típusú és jellegű szótárak jellemzőit és feldolgozott szótári adatait. Megvalósulhatnak tehát azok az univerzális, multifunkciós szótárak, amelyek magukban foglalják például köznyelvi, tájnyelvi, terminológiai stb. szótárak anyagát, funkcióit, akár több nyelven is, és amelyek közül a felhasználó választhatja ki a számára szükséges információkat. Tanulmányomban egy a fentiekben vázolt szótártípusba sorolható közösség által szerkesztett online szótári adatbázist, az OmegaWikit vizsgálom. Tanulmányom első szakaszában rövid, általános jellemzést adok az OmegaWikiről, majd egy konkrét szócikk bemutatásán keresztül szemléltetem működését és felépítését, végül pedig kitérek a szótárprojekt magyar vonatozásaira, bemutatva, hogy milyen minőségű és mennyiségű magyar nyelvű adatot tartalmaz a vizsgált online szótár. 2. Az OmegaWikiről általában Az OmegaWiki egyike a számtalan nagy népszerűségnek örvendő wiki projektnek, melyek közül a legismertebb talán a szabadon szerkeszthető online enciklopédia, a Wikipédia. Az OmegaWiki ugyan számos jellemzőjében hasonlít a Wikipédiára, legközelebbi rokonának azonban mégsem a Wikipédiát, hanem a Wiktionaryt (magyar nevén Wikiszótár) tekinthetjük. A Wiktionary egy többnyelvű szótárprojekt, 83
amely 2002-ben indult és fejlődése a mai napig töretlen (részletesebben lásd: Olivera:2009 és Gaál:2010). Az OmegaWiki indulásának előzményei (a Wikipedia adatai szerint) 2004-ig vezethetőek vissza, amikor is a Wiktionary néhány hibájának kiküszöbölése érdekében felmerült egy új szótárprojekt megvalósításának a gondolata. A projekt először a WiktionaryZ, később Ultimate Wiktionary néven futott, majd 2006. december óta OmegaWiki néven működik. A szerkesztők céljaikat a következőkben határozták meg: projektünk célja, hogy egy olyan szótárat hozzunk létre, amely a világ összes nyelvének, összes szavát tartalmazza, és lexikai, terminológiai és ontológiai információkat is magában foglal. Az adatok egy összefüggő adatbázison keresztül hozzáférhetőek, és ebből kifolyólag többféle célra is felhasználhatók. (omegawiki.org) Az OmegaWiki megalkotásának egyik fő célja a fentieken túl az volt, hogy kiküszöbölje a Wiktionary egyik fő hibáját, azaz, hogy a különböző wiki projektek között nagymértékű átjárhatóságot tapasztalhatunk. Ez a gyakorlatban azt jelenti, hogy a Wiktionarybe számos információ más projektekből került át, és így ugyanaz az információ több különböző nyelvű Wiktionaryben is felbukkan. Ez önmagában még nem jelentene problémát, viszont ha valamelyik adatban frissítés, változtatás történik ami a wiki projektek egyik fő jellemzője akkor az csak az adott nyelvű Wiktionaryben történik meg, a többi helyen változatlan marad. Az OmegaWiki célja tehát, hogy egy adott információ frissítése egy időben az összes helyen végbemenjen. Fontos jellemzője az OmegaWikinek, hogy a benne található kifejezéseket (expression) kötelezően egy adott nyelvhez kell társítani a biztos azonosítás érdekében. Az elérhető nyelvek listája (kis változtatásokkal) az ISO 639-2 szabványon alapszik, amely szabvány egy kóddal azonosítja a világon ma ismert nyelveket (a szabvány több mint 7600 nyelvet sorol fel). Mint arról már volt szó, az OmegaWiki a közösség által, szabadon szerkeszthető online szótárak közé tartozik. A szótár szerkesztésében bárki részt vehet, erre két mód kínálkozik. Akár regisztráció nélkül is szerkeszthetünk szócikkeket, ilyenkor azonban csak új adatok felvitelére van lehetőségünk, a már rendelkezésre álló információk módosítására nem. Ha valamilyen létező adatot szeretnénk módosítani, ahhoz mindenképpen regisztrálnunk kell a rendszerbe, amelynek során a felhasználónevünk megadása után az úgynevezett Babel Template -et kell kitöltenünk. Ez az adatlap szolgál arra, hogy a szerkesztők megadják az általuk ismert nyelveket, illetve nyelvtudásuk szintjét. A regisztrált szerkesztők a nyelvtudásukat a következő szintek szerint osztályozhatják: alapszint, középszint, haladó szint, közel anyanyelvi szint, professzionális szint 84
és anyanyelvi szint. A korábbiakban már említett ISO 639-2 szabványhoz kapcsolódóan ezek a nyelvi adatok egy kód formájában is megjelennek, amely kód tartalmazza egyrészt az adott nyelv rövidítését és 1-től 5-ig számozva (illetve N-nel jelölve az anyanyelvi szintet) a szerkesztő nyelvtudásának szintjét. Ennek megfelelően például egy magyarul anyanyelven, és angolul haladó szinten tudó szerkesztő adatlapján a hu-n és az en-3 kódok jelennek meg. Ez, a szerkesztő nyelvtudásának szintjét megjelenítő táblázat a regisztrált szerkesztők adatlapjának egyetlen kötelező eleme, ezen kívül azonban tetszés szerint megadhatnak magukról egyéb, általuk fontosnak vélt információkat is. Egy szótár jellemzői esetében mindig rendkívül fontos adat, hogy hány szócikket, kifejezést tartalmaz. Az OmegaWikiben, a legfrissebb statisztikák alapján jelenleg 317 különböző nyelven több mint 450000 kifejezés érhető el. A kifejezések nyelvek szerinti megoszlása természetesen nem egyenletes, hiszen az olyan nagy nyelvek, mit például az angol vagy a spanyol reprezentációja jóval magasabb, mint más, kisebb nyelveké. 3. Az OmegaWiki felépítése Az OmegaWiki angol nyelvű főoldala a www.omegawiki.org internetes címen érhető el. A főoldal felépítése sokban hasonlít más wiki szótárprojekthez. Az oldal jobb felső sarkában van módunk bejelentkezni, illetve regisztrálni, középen a szótár rövid bemutatása és néhány alapvető szerkesztési tanács olvasható. A bal oldali sávban számos menü érhető el, a navigáció főmenühöz tartoznak a következő almenük: a kezdőlap, véletlenszerű szócikk, a friss változtatások jegyzéke és a legfrissebb újdonságokról beszámoló OmegaWiki blog. A szerkesztőknek szóló menü alatt a szerkesztési lépésekhez kapcsolódó útmutatókat, tippeket találhatjuk meg. Az eszközök menüpontban a legfontosabb talán a speciális lapok almenüpont, ahonnan a szerkesztőkről, friss változtatásokról, különböző statisztikákról, állapotjelentésekről olvashatunk aktuális adatokat. A bal oldali menüsáv alsó részében a különböző nyelvű OmegaWiki portálokra válthatunk át, amire nem csak itt, hanem a főoldal alján található lista segítségével is lehetőségünk van. A főoldal jobboldalán helyezkedik el a nap szava menü, ahol minden nap más és más szót és annak definícióját olvashatjuk, valamint szintén elérhetjük innen a már említett help menüt és a szerkesztőknek szóló információkat. Az OmegaWiki kezdőlapjának legfontosabb eleme a keresőmező, aminek segítségével a szótári keresés zajlik. Ebbe a mezőbe kell begépelnünk a keresett szót, aminek ha elkezdjük bevinni az első karaktereit, máris javaslatokat 85
kapunk, az automatikus kiegészítés funkció által, hogy melyik szót is kereshettük (hasonlóan például a Google keresőmezőjéhez). Hiányosság viszont, hogy elgépelés esetén nem kapunk javaslatokat a találati listában, hogy melyik szóra is gondolhattunk valójában. Miután begépeltük a keresett szót (és az szerepel is az adatbázisban) rózsaszín fejléccel megjelenik, hogy mely nyelvekben fordul elő az adott kifejezés. (Az OmegaWiki kifejezésnek-expression nevezi mindazokat a különböző nyelvű karaktersorokat, amelyek címszót alkotnak.) Ha begépeljük például a mouse szót (1. ábra), akkor megkapjuk, hogy az OmegaWiki adatbázisa szerint az angol és az olasz nyelvben fordul elő ez a szó. Ha kiválasztjuk az angol megfelelőt és a rózsaszín fejlécet legördítjük, megjelenik a mouse szó kétféle jelentésében, azaz mint számítógépes periféria, és mint emlősállat. 1.ábra: az OmegaWiki mouse szócikke Az első jelentést kiválasztva további legördülő menüket kapunk. Elsőkét kilistázhatjuk a különböző nyelvű, rendelkezésre álló definíciókat példánk esetében az angoltól a szlovákig. A második legördülő menüben találjuk a szinonimákat és a más nyelvű ekvivalenseket. (Megjegyzendő, hogy a különböző nyelvű definíciók száma egyelőre jóval csekélyebb, mint az ekvivalenseké.) Ebben a menüben nem csak szimplán az ekvivalenseket találjuk meg, hanem amennyiben rendelkezésre áll a hozzájuk tartozó annotációkat is. Az annotációban szerepelhet egy adott szó szófaji osztálya, neme, elválasztása, de itt találhatunk a szó Wikipédiás szócikkére mutató linket is. A következő almenüben az osztály tagságot tekinthetjük meg, azaz, hogy a szó milyen kategóriába, nyelvi rétegbe sorolható. (A mouse esetében ez az osztály az 86
informatika.) Az utolsó menü a jegyzetek, ahol megtalálható például egy ábra, vagy fotó a Wikimedia Commons adatbázisából az adott szóról. Az OmegaWiki struktúrája három fő építőelemen alapszik: az első a már említett expression (kifejezés), a második a definition (definíció), a harmadik pedig az ún. DefinedMeaning (definiált jelentés). Ez utóbbi egy bármilyen nyelvű kifejezéshez rendelt bármilyen nyelvű definíciót takar, amelyhez a későbbiekben újabb fordítások és ekvivalensek kapcsolhatók, és amelyekből kialakulnak a tulajdonképpeni szócikkek. A DefinedMeaning fontos tulajdonsága, hogy kap egy bizonyos osztályba sorolást is, ami azért fontos, mert bizonyos attribútumokat csak bizonyos osztályokhoz rendelhetünk hozzá (Meijssen: 2010). 4. Az OmegaWiki magyar vonatkozásai A magyar nyelvű OmegaWiki portál az eredeti portál indulása után nem sokkal, már 2006 márciusában megkezdte működését (elérési útja: http://www.omegawiki.org/portal:hun). Amint betöltjük a magyar nyelvű oldalt egy üdvözlőképernyő fogad minket és rövid ismertetőt kapunk a regisztráció menetéről és feltételeiről. Szintén a főoldalon olvashatunk magyar nyelvű tudnivalókat a már említett babel template-ről. Amennyiben azonban további magyar nyelvű információra lenne szükségünk, csalódnunk kell: a magyar nyelvű portál kezdőlapját a laptörténet tanúsága szerint 2006 decemberében módosították utoljára, azóta nem történt rajta változtatás. A további magyar nyelvű adatokról az OmegaWiki statisztikáiból tájékozódhatunk. Eszerint az adatbázisban (2011. augusztusi adatok szerint) 8139 magyar kifejezés található, ebből 8087-hez kapcsolódik (nem feltétlenül magyar nyelvű) definíció is. Ami viszont roppant kevésnek mondható az előző számokhoz képest, az a magyar nyelvű definíciók elhanyagolhatóan kevés száma, ami mindössze 22. Összehasonlításképpen: angol nyelvű definícióból közel 40000 áll rendelkezésre, de szlovén és bolgár nyelvűből is közel 5000. Ezek az adatok sajnos egyértelműen azt tükrözik, hogy a magyar nyelvű szerkesztők gyakorlatilag nem járulnak hozzá a magyar nyelvű definíciók megalkotásához és az OmegaWiki szerkesztéséhez. Az OmegaWiki vizsgálata során mindössze két magyar anyanyelvű szerkesztőt találtam, de a bejegyzések tanúsága szerint ők is 2006-ban voltak utoljára aktívak. Az, hogy mégis több mint 8000 magyar kifejezés található az ekvivalensek között, abból adódhat, hogy ezeket nem magyar nyelvű (esetleg nem regisztrált szerkesztők) készíthették. Ha összehasonlítjuk például a Wikipédia, vagy a Wikiszótár magyar nyelvű változataival, akkor általánosságban elmondhatjuk, hogy hozzájuk képest az OmegaWiki még rendkívül alacsony fejlettségi szinten áll. 87
5. Összegzés Tanulmányomban egy viszonylag kevéssé ismert közösségi online szótárt, az OmegaWikit mutattam be. Összegzésként elmondható, hogy a vizsgált wiki projekt mind lexikográfiai, mind terminológiai szempontból figyelemreméltó kezdeményezés. Alapötletében, szerkezetében, használatában számos olyan jellemzőt mutat, amelyekkel egy mai modern online szótári adatbázisnak rendelkeznie kell. Ami azonban szembetűnő, hogy fejlődése korántsem töretlen. Hiába van ugyanis összesen kb. 2700 regisztrált felhasználója, közülük a friss adatok szerint az elmúlt harminc napban, csupán tizenhatan voltak aktívan, azaz csak ennyien hajtottak végre szerkesztést egy már meglévő szócikkben, vagy alkottak meg egy új szócikket. A magyar változat helyzete az előbbi fejezetben említett okok miatt még rosszabbnak mondható, de úgy tűnik tehát, hogy ez egy általános tendencia részeként is felfogható. A jövőre nézve reménykedjünk benne, hogy az OmegaWiki fejlődése a közeljövőben új lendületet kap és számos új (és akár régi) felhasználó csatlakozik a szerkesztőgárdához, hiszen a közösség által szerkesztett szótárak minden hátrányát figyelembe véve is egy struktúrájában jól átgondolt és rendkívül hasznos, modern online szótárról van szó, amely rendkívül nagy mennyiségű és változatos típusú szótári információt tartalmaz. Irodalom Fuertes-O., P. 2009. The Function Theory of Lexicography and Electronic Dictionaries: Wiktionary as a Prototype of Collective Free Multiple-Language Internet Dictionary In: Bergenholtz, H., Nielsen, S., Tarp, S. (eds) Lexicogrpahy at a Crossroads Dictionaries and Encyclopedias Today, Lexicographical Tools Tomorrow. Linguistic insights, V90. Bern: Peter Lang AG. 99-135. Gaál P. 2010. Online szótárak a Web 2.0 platformon A Wikiszótár Wiktionary. Magyar Terminológia 3évf. 1.szám, 251-268. és a Meijsen G. 2009. The Philosophy behind Omegawiki and the Visions for the Future In: Bergenholtz, H., Nielsen, S., Tarp, S. (eds.) Lexicography at a Crossroads Dictionaries and Encyclopedias Today, Lexicographical Tools Tomorrow. Linguistic Insights, V.90. Bern: Peter Lang AG. 99-135. Források OmegaWiki: www.omegawiki.org Magyar nyelvű OmegaWiki: http://www.omegawiki.org/portal:hun ISO-639-2 szabvány 88