Szemantika, lexikográfia: jelentés-egyértelműsítés, wordnetek. Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13.



Hasonló dokumentumok
SZTEREO (3D-S) FOTÓLABOR AZ INFORMATIKATEREMBEN

A szociális szolgáltatásokról

BESZÁMOLÓ. a hajléktalan emberek számára fenntartott, nappali ellátást nyújtó intézmények körében végzett kutatásról

Útmutató. a szakdolgozat elkészítéséhez. Szegedi Tudományegyetem Egészségtudományi és Szociális Képzési Kar. (ápoló szakirány számára)

Földrajz az általános iskolák 7 8. évfolyama számára

Értény Község Önkormányzata Képviselő-testületének 13/2013. (XII. 31.) rendelete a szociális igazgatásról és szociális ellátásokról

K VÁGÓÖRS KÖZSÉG ÖNKORMÁNYZATA KÉPVISEL -TESTÜLETÉNEK. 6/2006.(V.18.) sz. rendelete A STRAND HASZNÁLATÁNAK RENDJÉR L ÉS A BELÉP DÍJAIRÓL

Kálmán Tibor sportreferens Egészségügyi és Szociális Bizottság, Kulturális és Sport Bizottság

E L Ő T E R J E S Z T É S A Képviselő-testület december 12-i ülésére. Décseyné Raposa Mária irodavezető

VENDÉGLÁTÓ ÉS TURISZTIKAI SZAKSZERVEZET. A SZEMÉLYI JÖVEDELEMADÓ FONTOSABB JELLEMZ I ÉS VÁLTOZÁSAI január 1-t l

A látható fény további tartományokra osztható: ibolya (legrövidebb), kék, zöld, sárga, narancs, vörös.

HD 150 HD 200 HD 300 HD 400 HD 500 HD 800 HD 1000 ÁLLÓ ELHELYEZÉSŰ, ZÁRTRENDSZERŰ, TÖBBCÉLÜ FELHASZNÁLÁSRA MELEGVÍZTÁROLÓK

ÜGYFÉLSZOLGÁLATI MONITORING VIZSGÁLAT A FŐTÁV ZRT. RÉSZÉRE MÁSODIK FÉLÉV

B E S Z Á M O L Ó án tartandó Képviselő Testületi Ülésre

KÉRDÉSEK ÉS VÁLASZOK

Mosonszentmiklós Község Esélyegyenlőségi Helyzetelemzése és Intézkedési Terve

ÍRÁSBELI VIZSGAKÉRDÉSEK 2013.

A rendelet célja. A rendelet hatálya

NAGYSZÉNÁS NAGYKÖZSÉG GONDOZÁSI KÖZPONT SZOCIÁLIS ÉTKEZÉS MŰKÖDÉSÉRE VONATKOZÓ SZAKMAI PROGRAM

Bácskay Andrea Gondozási formák az idősellátásban a szociális alapellátás

Új módszer a lakásszellőzésben

Történelmi tanulmányi verseny

JOGI ADATBANK CompLex.hu. Hatalmas adatbázis, hatalmas lehetőségekkel az interneten.

A helyi önkormányzatokról szóló évi LXV. tv. 1. (6) bekezdése alapján a Nógrád Megyei Önkormányzat Közgyűlése az alábbi rendeletet alkotja:

DEMO. Éghajlatok, tájak, élõlények. A közepes szélességek öve és a sarkvidéki régiók. 1. fejezet. 2. fejezet BEVEZETÕ AZ OKTATÓMODUL HASZNÁLATÁHOZ

A hazai munkahelyi étkezés értékrend alapú élelmiszerfogyasztói modellje

TAJ szám: - - Kelt:,...

Hajdúhadház Városi Önkormányzat Ügyrendi, Etikai és Közrendvédelmi Bizottsága Elnökétől

H Á Z I R E N D. (étkeztetés, házi segítségnyújtás, nappali ellátás)

Korpuszok és adatbázisok. Korpuszok a nyelvészeti kutatásban szeptember 29.

FELHÍVÁS a XXXIII. Országos Tudományos Diákköri Konferencia Had- és Rendészettudományi Szekciójában való részvételre. A Szekció honlapja:

MAGYAR AFRIKA TÁRSASÁG AFRICAN-HUNGARIAN UNION

OKTATÁSI TEMATIKA, SEGÉDLET rendszeresítése munkavédelmi oktatásokhoz

Sulokné Anwar Zsuzsanna HOL TART MAGYARORSZÁG AZ INFORMÁCIÓS TÁRSADALOMHOZ VEZETŐ ÚTON?

BALATONCSICSÓ KÖZSÉG ÖNKORMÁNYZATA KÉPVISEL TESTÜLETÉNEk. 16/2009.(XI.26.) R E N D E L E T E a szociális és gyermekjóléti ellátásokról

Szakdolgozati szabályzat

SZABÁLYZAT Reprezentációs kiadásokról

ESETTANULMÁNY II. A nagyváros és környéke területpolitikai sajátosságai a kistérségi rendszer működése szempontjából. című kutatás

AKTUÁLIS POLLENHELYZET SZEKSZÁRDON ÉS KÖRNYÉKÉN HÉTEN

Magyarcsanád Települési Értéktár Bizottságának július 23. napján délelőtt 9 óra 15 perckor tartott nyílt ülésének J E G Y Z Ő K Ö N Y V E

FELHASZNÁLÓI REFERENCIA-ÚTMUTATÓ


Hajdúsági Kistérség Területfejlesztési Koncepciója és Programja HELYZETÉRTÉKELÉS 2005.

HITELESÍTÉSI ELŐÍRÁS HIDEGVÍZMÉRŐK ÁLTALÁNOS ELŐÍRÁSOK

KÖNYVTÁRELLÁTÁSI SZOLGÁLTATÓ RENDSZER

Pécsvárad szociális helyzete

Deborah Hedstrom: Gábriel vagyok Fedezzük fel újra a karácsonyi történetet! Uram, kérlek, tedd újra elevenné történetedet!" Amikor először tanítottam

EN ES-D5A Vezeték nélküli füstérzékelő. TEST ALARM

Tarcal község Önkormányzata Szociális Szolgáltatástervezési Koncepciója. Bevezetés

Vasmegyer Község Önkormányzatának 16/2004. (XI.17.) rendelete

Statisztika gyakorlat

KORÁNYI FRIGYES GIMNÁZIUM ÉS KOLLÉGIUM SZERVEZETI ÉS MŰKÖDÉSI SZABÁLYZATA

Szerelési és szervíz utasítás

A szőlő éves munkái 1.Metszés: metszőolló fűrészre,csákánybaltára,gyökerezőkapára nyesőollókat pneumatikus metszőollók rövid és a hosszúmetszések

Ellend Községi Önkormányzat Képviselő-testületének 4/2015.(II.27.) rendelete A szociális ellátások helyi szabályozásáról

MAGYAR MINT IDEGEN NYELV

PÁLYÁZATI FELHÍVÁS. PÁLYÁZATOT HIRDET Munkahelyteremtés az Ormánság fejlődéséért munkaerő-piaci program keretében történő foglalkoztatásra

NYITOTT KAPU-VÁR Térségi Szociális Szolgáltató Központ

Pécsi Tudományegyetem Természettudományi Kar Földrajzi Intézet Földtudományok Doktori Iskola

Hírlevél. Változások A cikkben összefoglalva megtalálhatók a civil szervezeteket érintő jogi és számviteli változások.

Az állandósult szókapcsolatokról, különös tekintettel a szórendre 1







KEZELÉS. Hővisszanyerős központi szellőztető berendezés LWZ 404 SOL

Igazgatói beszámoló. a tatabányai Árpád Gimnázium között végzett munkájáról

Veresegyházi kistérség

TAPOLCA VÁROS ÖNKORMÁNYZATA KÉPVISELŐ- TESTÜLETÉNEK. 10/2006. (III. 20.) Kt. rendelete 1

A Magyar Kerékpárosklub javaslatai a KRESZ módosítására

E L İ T E R J E S Z T É S

POLGÁRI JOGI ÖSSZEFOGLALÓ A TŐKEPIACI ALAPISMERETEKHEZ

Hajdúszoboszlói kistérség Foglalkoztatási Stratégia FOGLALKOZTATÁSRA A HAJDÚSZOBOSZLÓI KISTÉRSÉGBEN TÁMOP /

INFORMATIKA HELYI TANTERV

A SZEMCSEALAK ALAPJÁN TÖRTÉNŐ SZÉTVÁLASZTÁS JELENTŐSÉGE FÉMTARTALMÚ HULLADÉKOK FELDOLGOZÁSA SORÁN

GYŐRI JÁRÁSI ESÉLYTEREMTŐ PROGRAMTERV

területi Budapesti Mozaik 13. Idősödő főváros

Magyarajkú, nem-magyar állampolgárságú tanulók nevelésének, oktatásának helyzete a magyar közoktatásban. Készítette: Kováts András és Medjesi Anna

Építések egyszerű feltételek szerint

11. NEMZETKÖZI VÁNDORLÁS. Gödri Irén FŐBB MEGÁLLAPÍTÁSOK

I. Fejezet Általános rendelkezések

A fafeldolgozás energiaszerkezetének vizsgálata és energiafelhasználási összefüggései

Műholdmeteorológia. Makra László

A KORMÁNY. rendelete

RÖVID ÁTTEKINTÉS PROF. EM. DR. KOVACSICS JÓZSEF SZAKIRODALMI MUNKÁSSÁGÁRÓL

IDŐSEK KLUBJA SZAKMAI PROGRAMJA. Jóváhagyva: Kálmán Béla polgármester

Külföldi és belföldi kiküldetések és béren kívüli juttatások. Horváthné Szabó Beáta

TARTALOM AZ INFORMATIKA FOGALMA A fogalom kialakítása Az informatika tárgyköre és fogalma Az informatika kapcsolata egyéb

Innováció és együttm ködési hálózatok Magyarországon

Read with Me Bible. A magyar változat az alábbi kiadás alapján készült:

Veresegyház Város Önkormányzat Képviselő-testületének 9/2006. (VI. 21.) ÖR. sz. rendelete a gyermekvédelem helyi rendszeréről (egységes szerkezetben)

Elıterjesztés Békés Város Képviselı-testülete április 30-i ülésére

Salgótarján Megyei Jogú Város Polgármesteri Hivatal Népjóléti Iroda

K I V O N A T. Ercsi Város Önkormányzat Képviselő-testületének február 11-én megtartott nyílt ülésének jegyzőkönyvéből

Veresegyház Város Önkormányzata Képviselő-testületének 6/2007 (V.23.) sz. rendelete

BUDAPEST KŐBÁNYAI ÖNKORMÁNYZAT

Balatonlelle Város Önkormányzata 6/2015.(II.27.) önkormányzati rendelete a szociális ellátások helyi szabályozásáról

FOLYADÉK VÍZ HŐSZIVATTYÚ

Átírás:

Szemantika, lexikográfia: jelentés-egyértelműsítés, wordnetek Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13.

Bevezetés Lexikális szemantika Jelentés-egyértelműsítés Szójelentés megadása Lexikológia: szótártan Szavak jelentésének megadása Mi a jelentés? Hogyan adható meg?

Jelentés-egyértelműsítés Word sense disambiguation: Egy szóalak jelentésének kiválasztása, egy előre megadott (lehetséges jelentés-) halmazból A lehetséges jelentések ált. egy szótárból Osztályozási modellek alkalmazhatók (előre egyértelműsített példák szükségesek) Word sense discrimination: Az adott szóalak különböző használati eseteit (~jelentés) elkülöníteni, anélkül, hogy a lehetséges jelentéseket kívülről megadnánk /és így címkézett példáink sem lehetnek/ Felügyelet nélküli statisztikai modellek

Típusai WSD All words A cél az összes szóalak egyértelműsítése, folyó szövegben Lexical sample A cél bizonyos szóalakok egyértelműsítése, minden szóalakra önálló modell Finom jelentésmegkülönböztetés (min. 6-8 jelentés) Durva jelentésmegkülönböztetés (max. 3-4 jelentés)

JÁR (movement in space, in time, abstract motion) BELONGING TOGETHER REPETITIVE MOVEMENT OTHER occurring together 22 -- consequen ce 23, 24, 25 approaching 15, 16, 18, 19 step by step 1, 33 regular 3, 4, 6, 31 functioning 10, 11, 13, 17, 20 many-toone 32 one-to-one 8, 27, 30 back and forth 2, 12 stage by stage 5, 9, 21 state 7, 14, 29 idioms 26, 28 verbs with prefixes*

WSD magyarra elkészült Szegeden az első (Lexical Sample) tanítókorpusz magyarra (finom jelentésmegkülönböztetés) melléknév: anyagi, élő, erős, képes, pontos, szociális főnév: civil, család, élet, ház, helyzet, intézmény, iskola, kép, képviselő, kormány, nap, oldal, ország, perc, pont, program, század, személy, szervezet, tanár, világ, víz ige: függ, hat, jár, kap, kerül, marad, rendelkezik, szerepel, tart, tartozik, tud, válik

Magyar WSD-statisztikák

Magyar WSD-statisztikák

Példa: nap Hőt, fényt, stb. sugárzó égitest, amely körül a Föld is kering Napfény, napsütés Körülbelül 24 óra Reggeltől estig, pl. munkanap A hét napjai; dátumhoz köthető napok Egyéb: pl. más csillagok, kifejezések, stb.

Szöveg Az éjféli nap a Föld sarkai körül észlelhető jelenség. Az év bizonyos részében a sarkköröknél (66,33 ) magasabb földrajzi szélességeken a Nap még éjfélkor is, azaz 24 órán át a horizont felett marad. Az említett 66,33. szélességi fokon a jelenség minden évben egy-egy nap fordul elő. A jelenség megfigyelhető Alaszkában, Észak-Kanadában, Grönlandon, Izlandon, Észak-Norvégiában, Svédországban és Finnországban, valamint Oroszország északi részén. Minél északabbra haladunk, a jelenség annál tovább tart, például Finnország legészakabbra fekvő pontján a nyár folyamán a Nap 73 napig nem bukik a horizont alá. A Föld két sarkán gyakorlatilag fél évig tart a nappal, és fél évig az éjszaka. Az északi sarkon március 21-e táján kel fel és szeptember 23. környékén nyugszik le a Nap. A délin fordítva. Tehát a sarkokon a Nap évente csak egyszer kel fel, és csak egyszer nyugszik le. A fehér éjszaka a 60. szélességi fok felett az északi és déli féltekén egyaránt megfigyelhető, gyakorlatilag éjszakai alkonynak is nevezhető. Az északi vidékeken a nyári napforduló körüli hetekben a Nap sehol sem süllyed 6 -nál mélyebben a látóhatár alá, ezért a nappali világosság nem oszlik el egészen. A déli féltekén, az Antarktisz táján december 22-e körül fehérlenek az éjszakák.

Szöveg És Isten szólt:»legyen világosság!«és lett világosság. Látta Isten, hogy a világosság jó. Elválasztotta a világosságot a sötétségtől, és elnevezte a világosságot nappalnak, a sötétséget pedig éjszakának. Akkor este és reggel lett: egy nap. Azt mondta ezután Isten:»Legyenek világítók az ég boltozatán! Válasszák el a nappalt az éjszakától, jelezzék az időket, a napokat és az esztendőket, ragyogjanak az ég boltozatán, és világítsanak a földre!«úgy is lett. Megalkotta tehát Isten a két nagy világítót a nagyobbik világítót, hogy uralkodjék a nappalon, meg a kisebbik világítót, hogy uralkodjék az éjszakán és a csillagokat. Az ég boltozatára helyezte őket, hogy világítsanak a földre, s uralkodjanak a nappalon és az éjszakán, és válasszák el a világosságot a sötétségtől. És látta Isten, hogy jó. És lett este és reggel: a negyedik nap.

Lexikográfia Lexikográfia: szókincs (szavak és kifejezések) kutatása, gyakorlati szempontú leírása Szótár: szavak (és jellemzőinek) gyűjteménye Ontológia: Lételmélet? Tudás megosztása? Számítógépes szótár? Fogalmi háló?

Elektronikus szótárak Hagyományos (papír)szótár Elektronikus szótár Könnyebb és gyorsabb a keresés (szófaji információ is) Toldalékolt alakok is megtalálhatók Nincsenek terjedelmi korlátok

Többszavas kifejezések Hol találhatók meg? Alaptagnál, de nem egységes a lexikográfiai gyakorlat Melyik az alaptag? (kutya vagy szalonna) Elektronikus szótárnál nem releváns kérdés

Ontológiák Fogalmi hálók Viszonyok alapján rendezett fogalmak (alá- és fölérendeltség, hierarchiák ) Taxonómiák (pl. biológiai rendszertan) Nyelvi ontológiák: nyelvi információt is tartalmaznak a hálón kívül

WordNet Lexikális adatbázis Fogalmak hálóba rendezve különféle relációk alapján Angol: Princeton WordNet Más nyelvekre is: EuroWordNet stb. Synset: szinonimahalmaz

Princeton Wordnet Eredetileg az emberi agy nyelvi tudásreprezentációjának modellje Ennek szánták (inkább elméleti nyelvészeti / filozófiai indíttatás) Más, mint egy szótár szavak szintjén redundancia A legnagyobb, egységes lexikai adatbázis Ingyenes Gépileg feldolgozható információ Számítógépes nyelvészet egyik alapvető eszköze lett

Szemléltető ábra

A HuWN bemutatása 40000 synset (általános ontológia) + 2000 üzleti nyelvi synset (szakontológia) + 650 jogi nyelvi synset (szakontológia) Főnevek Igék Melléknevek Határozószók Ahol csak lehet, a PWN-nek megfeleltetni a synseteket Szerkesztéshez használt program: VisDic

Szófaji eloszlás Szófaj Synsetek száma Főnév 33.778 Ige 3.310 Melléknév 4.083 Határozószó 1.038 Összesen 42.209

Synsetek Megközelítőleg azonos jelentésű szavak (literálok) alkotnak egy synsetet Synseten belül a fő szervező reláció a szinonímia Jelentésmegkülönböztetés miatt sorszámozott literálok Példa: {zsineg1, zsinór1, madzag1, spárga1}

Szófaj Szinonimák (literálok) Definíció Tipikus használat példamondat ÉKSz.-beli megfelelő Domén Relációk más synsetekkel Synsetek - 2

Relációk a HuWN-ben: főnevek Alapvető rendező reláció a hipernima-hiponima Alá- és fölérendeltségi viszonyokat mutató fák Példa: bicikli Különböző szintű hiponimák: kutyaféle emlős állat entitás

Relációk a HuWN-ben: főnevek - 2 Antonímia (near_antonym): ellentét Példa: férj feleség Holonímia meronímia: rész-egész viszonyok Példa: kalap karima (rész) újság papír (anyag) csatár focicsapat (tag)

Melléknevek a HuWN-ben Alapvető szemantikai kapcsolat: antonímia Hideg meleg, szép csúnya stb. Központi literálok köré vannak összegyűjtve a hasonló jelentésű, specifikusabb melléknevek

Speciális igei relációk a HuWN-ben Példa: FELMELEGSZIK is_preparatory_phase_of: előkészítő folyamat (melegszik) is_telos_of: sikerpont (felmelegszik) is_consequent_state_of: utóállapot (meleg)

Egyéb igei relációk Antonímia: elad 1 megvesz 1 Hipernímia hiponímia: {szerez 4, kap 5, vesz 7 } hiponimái bérel 1, megtalál 2, belebotlik 1, kölcsönvesz 1 stb.

Nyelvek közti relációk eq_xpos_synonym: ha az angolban és a magyarban eltérő szófaj fejezi ki ugyanazt a fogalmat, ezért közvetlenül nem feleltethetők meg egymásnak fél (ige) afraid (melléknév)

Mire jó a WordNet? Szinonimalisták WSD: jelentések előre meg vannak adva Dokumentumosztályozás: szavak közti relációk Többnyelvű IE Gépi(leg segített) fordítás: nyelvek közti megfeleltetések

Aszparágusz Madzag Csirág Zsinór Nyúlárnyék Spárga Zsineg Synsetek építése