Online nganaszan történeti-etimológiai szótár

Hasonló dokumentumok
SZEVERÉNYI SÁNDOR. Mire jó egy nganaszan online diakrón kognitív onomasziológiai szótár? 1

Hiányosan dokumentált nyelvek relevanciája a lexikai szemantikai kutatásokban, avagy meddig ér a nganaszan takaró?

Online kérd íves felmérés a Gazdálkodás olvasóinak és szerz inek körében

Az egyetemi publikációs adatbázis

Bevezető. KÁROLY Krisztina FELVINCZI Katalin

Új nemperes eljárások tapasztalatai (HBNYR, VSZNYR) SZKK

Lexikon és nyelvtechnológia Földesi András /

A bölcsődés gyermek és a mese

HIDASNÉMETI KÖZSÉG ÖNKORMÁNYZATA POLGÁRMESTERI HIVATALÁNAK SZERVEZETFEJLESZTÉSE. Informatikai tanulmány

Az információs társadalom lehetőségeivel csak azok a személyek tudnak megfelelő módon élni, akik tudatosan alkalmazzák az informatikai eszközöket,

Magyarajkú, nem-magyar állampolgárságú tanulók nevelésének, oktatásának helyzete a magyar közoktatásban. Készítette: Kováts András és Medjesi Anna

*Ezen felületet kell kitölteni saját fiók létrehozásáho z

SZEMLE. Szemle 89. Cambridge University Press, Cambridge, lap

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Java és web programozás

Lexikológia, lexikográfia a MID oktatásában

Programozás alapjai Bevezetés

Dspace fejlesztési tapasztalatok, problémák és megoldások

Feltáró jellegű kutatás a Pécsi Tudományegyetem tanári, egyéni összefüggő gyakorlatának megvalósulásáról

DIGITÁLIS KÖZTERÜLETI M SZAKI TÉRKÉP

Szegény gazdagok és gazdag szegények ( Vizsgálódások a személyi jövedelmek körében)

A magyar létige problémái a számítógépes nyelvi elemzésben

2001-ben végze Eötvös-kollégistaként. angol nyelv és irodalom szakán, majd 2006 júliusában

Gyarmati Dezső Sport Általános Iskola. Informatika HELYI TANTERV 6-8. ÉVFOLYAM. KÉSZÍTETTE: Oroszné Farkas Judit Dudásné Simon Edit

Cs. Nagy Lajos. Dialektológiai kutatások a PPKE BTK Magyar Nyelvészeti Tanszékén

DIÁKIGAZOLVÁNY. Felhasználói dokumentáció verzió 3.7. Budapest, 2015.

Word 2010 magyar nyelvű változat

Az informatika tantárgy fejlesztési feladatait a Nemzeti alaptanterv hat részterületen írja elő, melyek szervesen kapcsolódnak egymáshoz.

IV. Szakmai szolgáltatások funkcionális tervezése

ÉLETÜNK FORDULÓPONTJAI. Az NKI Társadalmi és Demográfiai Panelfelvételének (TDPA) kutatási koncepciója és kérdőívének vázlatos ismertetése

A teljesítményértékelés és minősítés a közigazgatási szervek vezetésében

SZEGEDI TUDOMÁNYEGYETEM BIZONYLATI SZABÁLYZAT

BMEEOUVAI01 segédlet a BME Építőmérnöki Kar hallgatói részére. Az építész- és az építőmérnök képzés szerkezeti és tartalmi fejlesztése

Jelnyelvi szótár használati útmutató

ABA INTELLIGENS VÁROSSÁ VÁLÁSÁNAK STRATÉGIÁJA ÉS OPERATÍV PROGRAMJA (első változat)

Béta Software számlázó programok adóhatósági ellenőrzési adatszolgáltatása (AEA)

Kiss Krisztina: Közösségi tartalomszolgáltatás a Pécsi Tudományegyetem Benedek Ferenc Jogtudományi és Közgazdaságtudományi Szakkönyvtárában

RÖVID ÁTTEKINTÉS PROF. EM. DR. KOVACSICS JÓZSEF SZAKIRODALMI MUNKÁSSÁGÁRÓL

Vasúti infrastruktúragazdálkodás kontrolling bázisú döntéselőkészítő rendszerek alkalmazásával

Diszlexiások/diszgráfiások anyanyelvi és idegen nyelvi szókincsszerkezete

II. modul Civil szervezetek gazdálkodása, könyvvezetési, beszámolási és adózási szabályok

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

A szakdolgozat készítésének folyamata, tartalmi és formai követelményei

Integrált ügyviteli rendszer: Kettős könyvelés modul

BANKKÁRTYA ÜZLETSZABÁLYZAT ÉS ÁLTALÁNOS SZERZİDÉSI FELTÉTELEK LAKOSSÁGI BETÉTI BANKKÁRTYÁHOZ KIEGÉSZÍTİ MELLÉKLETE PAYPASS FIZETÉSI ESZKÖZÖKHÖZ

Javaslat A TANÁCS RENDELETE. a jövedéki adók területén való közigazgatási együttműködésről

Nyelvi hálózatok és a mentális lexikon

Gyógyszernek nem minősülő kiegészítő termékek adatbázisa (Data base of non medication products)

1. A beszámolókészítés alapjai

A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága

Angol szótár V

Egyetemi adatbázis nyilvántartása és weben

A Szótári Osztály évi jelentése

Önálló labor feladatkiírásaim tavasz

KELE3. Felhasználói kézikönyv

Kommunikatív nyelvi tesztek kritériumai 1

BarAck.Net. Internetes csomagkezel. Felhasználói kézikönyv V 1.0. (2011. július 20.)

KÖZIGAZGATÁSI SZAKVIZSGA KÖZSZOLGÁLTATÁSOK SZERVEZÉSE ÉS IGAZGATÁSA

A megváltozott munkaképességű személyek foglalkoztatási helyzete

ELEKTRONIKUS KÖZBESZERZÉS

STEPP-SCIENCE, TECHNOLOGY AND EDUCATION PLATFORM FOR PHOTONICS, HUNGARY KLASZTER

A kármegosztás és a munkáltató kárfelelősség alóli mentesülésének szabályai az új Munka Törvénykönyvében tekintettel a bírói gyakorlatra

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

J e g y z ı k ö n y v

1 Kezd lépések. 1.1 Felhasználók azonosítása. 1.2 Menüpontok. 1.3 Bejelentkezés. icard

Penta Unió Oktatási Centrum Zrt. Az elektronikus számlázás alkalmazása Magyarországon napjainkban

22. szám 125. évfolyam július 9. TARTALOM. 42/2010. (VII. 9. MÁV Ért. 22.) EVIG számú elnök-vezérigazgatói

Az építési műszaki ellenőr képzés a gyakorló szakemberek szemével

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

INFORMATIKA. Célok és feladatok évfolyam

AZ ÜZLETI BIZTOSÍTÁS, A NYUGDÍJBIZTOSÍTÁS ÉS AZ EGÉSZSÉGBIZTOSÍTÁS JOGI SZABÁLYOZÁSÁNAK PROBLÉMÁI

VASS LAJOS ÁLTALÁNOS ISKOLA HELYI TANTERVE

A kibővített Magyar történeti szövegtár új keresőfelülete

PÉNZÜGYMINISZTÉRIUM TÁMOGATÁSOKAT VIZSGÁLÓ IRODA június

feladatok meghatározása során elsősorban az eszközök ismeretére, az eszközökkel megvalósítható lehetőségek feltérképezésére és az alkotó

2015/25. SZÁM TARTALOM. 29/2015. (VI. 29. MÁV-START Ért. 25.) sz. vezérigazgatói utasítás a MÁV-START Zrt. Biztonságirányítási Kézikönyvéről...

Zsemlyei János A MAI MAGYAR NYELV SZÓKÉSZLETE ÉS SZÓTÁRAI

Különírás-egybeírás automatikusan

PALATIN KRISZTINA A ZENETANULÁS NEHÉZSÉGEI TANULÁSI ZAVARRAL KÜZDŐ GYERMEKEKNÉL

Adatbázisok. 8. gyakorlat. SQL: CREATE TABLE, aktualizálás (INSERT, UPDATE, DELETE), SELECT október október 26. Adatbázisok 1 / 17

AZ EURÓPAI UNIÓ FOGLALKOZTATÁSI STRATÉGIÁJA FREY MÁRIA

Magyar nyelvű történeti korpuszok

MUNKAERŐ-PIACI ESÉLYEK, MUNKAERŐ-PIACI STRATÉGIÁK 1

Iroda DEMO telepítési útmutató

Dr. Pétery Kristóf: AutoCAD LT 2002 Blokkok, Xrefek

Az Egri Kistérség területfejlesztési koncepciója. és programja

INFORMATIKA 5. évfolyam

Ismertető. A Hajdú-Bihar Megyei és Debreceni Honismereti Egyesület tudományos és közművelődési tevékenysége

Függvények határértéke, folytonossága

Kaszás Tímea: Corvina OPAC az SZTE Mez gazdasági Könyvtárában

SZTE Juhász Gyula Gyakorló Általános Iskolája, Alapfokú Művészetoktatási Intézménye, Napközi Otthonos Óvodája 6725 Szeged, Boldogasszony sgt. 8.

A SZAKIRODALOM HASZNA ÉS SZERKEZETE

3. Állapítsa meg, hogy 1 db. KÖNYV 5. kötete és annak egyes részei szerzői jogvédelem alatt állnak-e.

A rendszer általános áttekintése

Szeged Megyei Jogú Város Integrált Településfejlesztési Stratégiája ( ) 1. sz. módosítással egységes szerkezetben (TERVEZET)

Hivatkozás hagyományos és elektronikus forrásokra

Eötvös Loránd Tudományegyetem Tanító- és Óvóképző Kar. Útmutató a szakdolgozat szerkesztéséhez

INFORMATIKA Emelt szint

A KÖZPONTI KÖLTSÉGVETÉSI SZERVEK ELEMI BESZÁMOLÓJÁNAK PÉNZÜGYI (SZABÁLYSZERŰSÉGI) ELLENŐRZÉSÉNEK MÓDSZERTANA május 001-1

Informatikai alapismeretek Földtudományi BSC számára

Átírás:

378 X. Magyar Számítógépes Nyelvészeti Konferencia Online nganaszan történeti-etimológiai szótár Szeverényi Sándor 1, Tóth Attila 2 1 Szegedi Tudományegyetem, Finnugor Nyelvtudományi Tanszék, 6722 Szeged, Egyetem u. 2. szevers@hung.u-szeged.hu 2 Szegedi Tudományegyetem, JGYPK Informatika Alkalmazásai Tanszék, 6725 Szeged, Boldogasszony sgt. 6. attila@jgypk.u-szeged.hu Kivonat: A bemutatóban a nganaszan nyelv online diakrón kognitív onomasziológiai szótár munkálatairól számolunk be. A szótár diakrón, mert a szókészlet történeti-etimológiai hátterét tárja fel, kognitív, mert az egymással összefügg alakok közötti szemantikai kapcsolatokat is meghatározza, és onomasziológiai, mivel fogalmak fel li keresést, rendszerezést is lehet vé tesz. Mindezt úgy, hogy nem egy kész szótárat digitalizál, hanem olyan webes felületet hozunk létre, amely egyben a kutatás eszköze is. 1 A projekt célja Projektünk újszer sége egy történeti lexikográfiai probléma új típusú számítógépes feldolgozása. A szótár alapja már létezik, nyilvánossá a projekt végén, 2015 tavaszán fog válni. A projekt az OTKA támogatásával valósul meg. 1 A munkálat nyelvészeti célja a nganaszan nyelv kognitív diakrón onomasziológiai szótárának kialakítása, a nganaszan szókincs rendszerezése szinkrón és diakrón szempontból (err l részletesebben [13]), olyan módon, hogy a kés bbiekben a szótár más nyelvek adataival is ki tudjanak egészülni. Éppen emiatt a célkit zések között szerepel a folyamatos javíthatóság és b víthet ség biztosítása.a megvalósításhoz kapcsolódó technikai elvárások a következ kben foglalhatók össze: egy olyan szabad felhasználású, weben elérhet online felület, eszköz létrehozása, amely egyszer módon jeleníti meg egy-egy lexéma formai, szemantikai tulajdonságait, történeti hátterét, valamint kapcsolatait más lexémákkal, és a megjelenített információk között összetett keresési kombinációkat tesz lehet vé. 2 A nganaszan nyelv A nganaszan nyelv szókincsének és annak történetének dokumentáltsága tipikusnak mondható a világ nyelveinek jelent s részéhez hasonlóan kevesen beszélik, hiányosan dokumentált és a beszél i kompetencia gyorsan t nik el. 1 A nganaszan nyelv diakrón kognitív onomasziológiai szótára (K100854).

Szeged, 2014. január 16 17. 379 Már az els lejegyzett nyelvi adatok is viszonylag kés i id kb l, a 18. század végér l származnak, s a módszeres nyelvi gy jtés csak a 20. század utolsó évtizedeire vált általánossá. M. A. Castrén 19. századi gy jtései ugyan történeti szempontból is jelent sek, ám a mennyisége nem teszi lehet vé, hogy külön történeti rétegként jelenítsük meg. Nganaszan írásbeliség nem alakult ki, mindössze egy gyakorlati szótár [10] és egy iskolás könyv [14] jelent meg. A kilencvenes években els sorban Eugene Helimski, majd kés bb tanítványa Valentin Guszev vezetésével történt szisztematikus nyelvi gy jtés, melynek révén a nganaszan anyag mennyisége megsokszorozódott, ehhez magyar kutatók gy jtései is hozzájárultak. Jelenleg a számunkra elérhet anyag mennyisége kb. 40-50 000 mondat. Nem meglep, hogy a nganaszan nyelv nagyon gyorsan halad az elt nés felé. Beszél inek száma a 2010-es oroszországi népszámlálási adatok szerint 125, a nyelvet anyanyelvi szinten beszél ké viszont ennek csak a töredéke lehet. Ez azt jelenti, hogy anyanyelvi kompetencia a projekthez nem áll rendelkezésre, jelent s mennyiség, normalizált írásos korpusz pedig nincsen. A nganaszan szókincs történeti háttere is csak részben feltérképezett, ez els sorban a szókészlet szamojéd, uráli eredet részére vonatkozik. Nincsen olyan korábban megjelent munka, amely a teljes nganaszan szókincs történetét, sajátosságait bemutatná, azaz a mára általánossá váló eljárás egy nyelv vagy nyelvcsalád történeti-etimológiai szótárának digitalizálása, majd annak átdolgozása, frissítése, kiegészítése a mi esetünkben nem lehetséges. Ugyanakkor annak sem látjuk értelmét, hogy napjainkban (csak) papíralapú szótárat készítsünk (noha az elmúlt id szakban a nemzetközi irodalomban van ilyenre példa, például [2, 3, 11]), illetve annak sem, hogy el ször elkészítsünk egy szótárat, s utána végezzük el a digitalizálást. Mi megfordítottuk a sorrendet: el bb készítjük el a digitális verziót, s onnan lehet majd letölteni a kívánt keresési eredményekkel a nyomtatottat. Ehhez viszont olyan szerkezetet kellett kialakítani, amelyet lehet ség szerint a kés bbiekben ne kelljen módosítani, csak finomítani, még akkor sem, amikor új nyelvek adatait dolgozzuk fel. Ennek megfelel en nemcsak az a feladat, hogy a nganaszan nyelvhez passzoló paraméterlistákat dolgozzunk ki, hanem a tipológiai szempontok is érvényesülni tudjanak. 2.2 A nganaszan korpusz A nganaszan nyelvi anyagot zárt korpuszként kezeljük, ennek törzsanyagát az említett szótár adja (kb. 3500 címszó), illetve az azon alapuló angol változat [1]. Ezt az anyagot egészítjük ki olyan szócikkekkel, amelyek más forrásokban fordulnak el. A történeti tárgyú munkák anyagát is külön-külön dolgozzuk fel, ezek legfontosabb forrásai: Janhunen 1976, Janhunen 1981, Helimskij 1997, [5, 6, 7]. Ezért gondoltuk, hogy célszer lenne egy olyan szótár kialakítása, amelybe folyamatosan lehet pakolni az információkat, ha új közlések, publikációk jelennek meg, akkor azok anyagát rögtön be lehessen építeni az adatbázisba.

380 X. Magyar Számítógépes Nyelvészeti Konferencia 3 A szótár szerkezete A szótár sajátos vonása, hogy a hangtörténeti jellemz k helyett a lexikológiai hátteret vizsgálja: definiálja a szóalakok közötti kapcsolatot, és a hozzájuk rendelhet jelentések közötti kapcsolatokat. Ennek megfelel en a szótárnak három fontos felülete van: a paraméterlisták ( data ) felülete, a form-concept felület, és a process-relation felület. 3.1 A paraméterlisták (data) A következ információcsoportok szerkeszthet rendszere található itt: nyelv / nyelvjárások: a rekonstruált (proto) nyelvek és az adatbázisban el forduló természetes nyelvek és nyelvjárások együttes listája; a szófaji rendszer: a jelentéssel együtt tárolt információ, jelenleg a nganaszan szófaji rendszerét tükrözi; irodalomlista: egyfel l az els dleges adatokat tartalmazó munkákat, másfel l a szekunder hivatkozásokat tartalmazza; a szóalakok közötti kapcsolatok rendszere: a szóalkotási módok és azok alcsoportjai (összetétel, képzés, reduplikáció, kölcsönzés, folytonosság); opacitás: a motivációra vonatkozik, azaz átlátszó vagy átlátszatlan-e egy kifejezés; bizonyosság: a megállapított kapcsolat bizonyossága (biztos vs. bizonytalan); a szemantikai kapcsolatok rendszere: a rendszer nagyrészt a tübingeni kutatók által kidolgozott felosztást követi (például [4, 8], lásd lejjebb); jelentéscsoportok rendszere: a jelentéscsoportok rendszerét a Rapid Word Collection módszerét amelyet kifejezetten dokumentációs nyelvészek számára dolgoztak ki a SIL munkatársai [12] követve alakítottuk, illetve alakítjuk ki. Azért döntöttünk e felosztás mellett, mivel egyfel l az anyag szabadon felhasználható és adaptálható, másfel l a kategorizálás során hasonló kérdések merülnek fel, mint amikor terepmunkát végzünk, azaz egy gyakorlati szótári anyagot leginkább ez követ. speciális karakterek: egy újabb nyelv bekapcsolása azt is jelentheti, hogy új karakterre van szükség, itt könnyedén tudjuk el állítani a megfelel karakterek, amelyek rögtön megjelennek a virtuális billenty zeten. Mindegyik csoport egyszer en módosítható (b víthet, ill. törölhet ). Természetesen arra figyelemmel kell lenni, hogy például egy adott paraméter törlése (pl. nyelvjárás) milyen kapcsolatokban okoz változást (pl. az adott nyelvjárásba tartozó lexémák). 3.2 Szóalakok és jelentések (form & concept) Ez a rész szolgál a szóalakok és jelentések bevitelére, katalogizálására és a lexémajelentés kapcsolatok létrehozására. Ez azt jelenti, hogy egy szóalakot csak egyszer tárolunk el, homonímia esetén sem szükséges az alakot újra rögzíteni. A jelentéseknél

Szeged, 2014. január 16 17. 381 hasonló a helyzet, azzal a különbséggel, hogy a jelentéseket minden esetben úgy kell megadnunk, ahogyan a forrásban szerepelnek, így például a mountain jelentés háromszor szerepel jelenleg a szótárban: mountain ridge, mountain range mountain, rock mountain, hill, ridge Egy mountain részleges egyezéses keresés kiadja mindhárom találatot, s ha teljesen biztosak akarunk lenni abban, hogy minden találat megjelent-e, akkor a mountain jelentéscsoportját (jelenleg LAND) is lehet használni. 3.3 Lexémák és szemantikai kapcsolatok Saját szerkeszt i felülete van az egyes lexéma+jelentés párok közötti alaki és szemantikai kapcsolatoknak (process relation), ugyanitt lehet a változás irányát is meghatározni (source target). Ez felveti azt a kérdést, hogy a jelentésváltozás és a szinonímia között megállapítható-e a határ. A szóalkotási eljárások (process) jelenleg a nganaszan szóalkotási módokat tartalmazza (képzés, átvétel, összetétel, lexikai folytonosság stb.), illetve ezek alcsoportjait. A jelentések közötti kapcsolatokat két nagy csoportja a metaforikus (hasonlóságon alapuló), illetve a metonimikus (kontiguitáson alapuló) kapcsolatok. Természetesen egy kapcsolatot több min sítéssel is el lehet látni. Amit pedig a min sítésekkel nem lehet megadni, azt a comment részben lehet megmagyarázni. Fontos, hogy a rendszer a formai és a jelentésbeli változásokat, kapcsolatokat együtt láttatja, a diakrón kognitív onomasziológiai munkálatoknak ez az egyik alapvet célja. Mivel a kapcsolatok meghatározása gyakran nem egyértelm, vagy csak nagyon leegyszer sítve adja vissza a tényleges relációkat, ezért a comment résznél lehet ség van szöveges kiegészítésre. Ezáltal gyakorlatilag szóláncokat tudunk létrehozni, be tudjuk mutatni egy adott szót eredetét, más nyelvekben való megjelenését, származékait, jelentéseit, s azok viszonyait. 3.4. Keresés Az elmondottakat az nt j boat > nduj a kind of boat > tuu nduj steamboat, steamer, steamship szólánccal szemléltetjük. A nganaszan nduj a kind of boat szóra keresünk rá. Els dleges forrása az említett Kosterkina et al. (2003) szótár [10]. A jelentést besoroltuk a TRAVEL és a FISHING kategóriákba. Ha rákeresünk a nduj szó, akkor a következ lényeges információkat kapjuk: a nduj forrása a proto-szamojéd rekonstruált nt j boat. Ennek forrása Janhunen etimológiai szótára; a nduj és a nt j szóalakok között kapcsolat lexikai folytonosság (azaz a nganaszanban egy korábbi nyelvállapotra rekonstruálható alak a hangváltozásokat leszámítva változatlanul meg);

382 X. Magyar Számítógépes Nyelvészeti Konferencia a nduj és a nt j szóalakok közötti kapcsolat leginkább a konceptuális/fogalmi azonosság kategóriájába tartozik, mivel mindkett csónakot jelent; a nduj boat szóalak + jelentés kapcsolat részleges forrása újabb elemeknek, így például a tuu nduj steamboat, steamer, steamship szókapcsolatnak; a tuu nduj steamboat, steamer, steamship szóalak + jelentés forrásai között megjelenik a tuj fire szó is. A tuu nduj összetételt szóalkotási szempontból összetételnek min sítjük. A tuu a tuj szóalak genitívuszi alakja (ezt az információt a comment részben tudjuk tárolni). Természetesen a tuu nduj forrásai között a tuj is megjelenik; A nduj a kind of boat és a tuu nduj steamboat, steamer, steamship közötti szemantikai kapcsolat egyfajta fogalmi hasonlóságon alapuló specializáció, a csónak járm egy speciális fajtájára utal, ezért a metaforikus kapcsolatok közül a fogalmi hasonlóság mellett a taxonomikus alárendelés is szerepel a min sítések között. 4 A technikai háttér Mivel a cél olyan online rendszer kifejlesztése volt, amely adattartalma folyamatosan fejleszthet és felhasználása minél szélesebb kör számára elérhet, így a webes alkalmazás a legkézenfekv bb megoldás. Ezáltal a felhasználói és az adminisztrátori funkciók elvégzéséhez is elég egy böngész. Ez jelent sen megkönnyíti a b vítési, további nyelvekkel való kiegészítési munkafolyamatot. Alapvet elvárás a rendszerrel szemben, hogy az adattartalom dinamikusan változtatható, b víthet legyen úgy, hogy az adatok redundanciáját elkerüljük. Így a rendszer alapját egy olyan SQL adatbázis képezi, amely központi magját a szóalak és jelentés párok alkotják, illetve az ezekb l képezett formális és szemantikai kapcsolatok. Azaz külön egységként tároljuk a szóalakokat és a jelentéseket, az ezek közötti kapcsolatot, valamint az így képzett párok közötti átmeneteket. Ez a modell alkalmas arra, hogy bizonyos szóalakok (illetve jelentések) több jelentéssel (illetve szóalakkal) is párt alkossanak, így a poliszém és a homonim alakok redundanciamentesen jól ábrázolhatók. Továbbá az ezeket jellemz attribútumok lehetséges értékei szintén külön tároltak, így ezek b vítése könnyen elvégezhet. Egy ilyen rendszerben elemi elvárás, hogy az alkalmazás képes legyen a tartalmazott nyelvek speciális karaktereinek a kezelésére, illetve olyan felhasználói felületet nyújtani, ahol az ilyen karakterek könnyen beilleszthet ek. Mivel a szerz k célja a rendszert további nyelvekre is kib víteni, így ennek kezelését rugalmasan kell megoldani. Emiatt egyrészt az adattárolás UTF-8 kódolással történik, valamint az adatbázisban külön tárolásra kerülnek a speciális karakterek és azok kódjai is. Másrészt a speciális karakterek bevitelét a felhasználói felületen egy virtuális billenty zet segíti, amelyen szerepl karakterek dinamikusan állnak össze az adatbázis ilyen karaktereit tartalmazó tábla tartalma alapján.

Szeged, 2014. január 16 17. 383 5 Tervek Szótárunkkal azokhoz a kutatásokhoz kívánunk a jöv ben kapcsolódni, amely leginkább a lexikális tipológia, s annak különösen a diakrón ágához tartozik. Koch és Marzo [9] szerint a lexikalizáció formai és kognitív motivációjának diakrón tipológiai rendszerezése a következ k miatt fontos: (i) lehet vé teszi az egyes nyelvek motivációs profiljának megalkotását; (ii) lehet vé teszi nyelveken átível tendenciák és idioszinkráziák megállapítását (Vannak-e transzparensebb vagy kevésbé transzparens nyelvek? Vannak-e metaforikusabb nyelvek?); (iii) lehet vé teszi nyelveken átível és nyelvspecifikus motivációs preferenciák megállapítását. Ezért célunk, hogy az adatbázis további nyelvekkel, s adatokkal b vüljön, s a munka a projekt lejárta után is folytatódjon. Hivatkozások 1. Bradley, J., Wagner-Nagy, B.: Nganasan English Dictionary. Ms. Wien: Hamburg. (2013) 2. Fortescue, M., Jacobson, S, Kaplan, L.: Comparative Eskimo Dictionary. Alaska Native Language Press, Fairbanks (1994, 20122) 3. Fortescue, M.: Comparative Chukotko-Kamchatkan Dictionary. Trends in Linguistics. Documentation. Mouton de Gruyter, Berlin: New York (2005) 4. Gévaudan, P.: Typologie des lexikalischen Wandels. Stauffenburg, Tübingen. (2007) 5. Helimski, E.: Die matorische Sprache. SUA 41. JATE, Szeged (1997) 6. Janhunen, J.: Samojedischer Wortschatz. Castrenianumin toimitteita 17, Helsinki (1977) 7. Janhunen, J.: Uralilaisen kantakielen sanastosta. JSFOu 77. (1981) 219 274 8. Koch, P.: Lexical typology from a cognitive and linguistic point of view. In Haspelmath, Martin, König, Ekkehard, Oesterreicher, Wulf, Raible, Wolfgang (Hrsg.): Linguistic Typology and Language Universals = Handbook of Linguistics and Communication Science 20/2. Mouton de Gruyter, Berlin. (2001) 1142 1176 9. Koch, P., Marzo, D.: A two-dimensional approach to the study of motivation in lexical typology and its first application to French high-frequency vocabulary. Studies in Language 31:2 (2007) 259 291. 10. Kosterkina, N. T., Momde, A.., Ždanova, T. Ju. [,..,,..,,..]: - -,, - (2001) 11. Nikolaeva, I.: A Historical Dictionary of Yukaghir. Trends in Linguistics. Documentation. Mouton de Gruyter, Berlin: New York (2006) 12. Rapid Word Collection http://www.rapidwords.net/ (2013. november 28.) 13. Szeverényi S.: Mire jó egy nganaszan online diakrón kognitív onomasziológiai szótár? Nyelvtudományi Közlemények 108 (2012) 197 218 14. Žovnickaya, S. N. [,..]:, -, (2001)