A magyar létige problémái a számítógépes nyelvi elemzésben

Hasonló dokumentumok
Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben

Igekötős szerkezetek a magyarban

Hány VAN nincs? A létige zéró váltakozás korpuszvezérelt vizsgálata

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

A Mazsola KORPUSZLEKÉRDEZŐ

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

Anaforafeloldás menet közben névmások egy pszicholingvisztikailag motivált elemzőben

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon

Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.

Szakmai önéletrajz. Főbb tevékenységek elméleti nyelvészeti kutatások alkalmával asszisztensi feladatok ellátása

Klasszikus héber nyelv 4.: Szintaxis

Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés

Klasszikus héber nyelv 4.: Szintaxis

Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

A szótárról. 1. Mi ez?

1. DP is DP: állítmányuk és alanyuk is DP. (Az alanyon nem is csodálkozunk, hiszen a rendes argumentumok DP-k)

A MAGYAR REKURZÍV BIRTOKOS SZERKEZET ELSAJÁTÍTÁSA A NEMZETKÖZI KUTATÁSOK TÜKRÉBEN

YANG ZIJIAN GYŐZŐ 杨子剑

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

E. KISS KATALIN - KIEFER FERENC - SIPTAR PETER ÚJ MAGYAR NYELVTAN

Anaforafeloldás menet közben

Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül

Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben november 13.

Klasszikus héber nyelv 4.: Szintaxis

a Szeged FC Treebankben

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

Számítógépes nyelvészet

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

2001-ben végze Eötvös-kollégistaként. angol nyelv és irodalom szakán, majd 2006 júliusában

SZAKMAI ÖNÉLETRAJZ Farkas Judit

Klasszikus héber nyelv 4.: Szintaxis

Események detektálása természetes nyelvű szövegekben

FŐNÉVI VONZATOK A MAGYAR NYELVBEN

Magyar nyelvű néprajzi keresőrendszer

Szabó Martina Katalin

Klasszikus héber nyelv 4.: Szintaxis

Alkalmazott Nyelvészeti Tanszékek 7. Országos Találkozója

E. KISS KATALIN - KIEFER FERENC - SIPTAR PÉTER ÚJ MAGYAR NYELVTAN

Klasszikus héber nyelv 4.: Szintaxis

Ablak által világosan Vonzatkeret-egyértelműsítés az igekötők és az infinitívuszi vonzatok segítségével

. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6.

Különírás-egybeírás automatikusan

Lexikon és nyelvtechnológia Földesi András /

A birtoklás kifejezése a magyarban és az olaszban W. Somogyi Judit

Klasszikus héber nyelv 4.: Szintaxis

Esetegyeztetés a predikatív fnévi csoportban * Szécsényi Tibor SZTE Általános Nyelvészeti Tanszék

EÖTVÖS LORÁND TUDOMÁNYEGYETEM PEDAGÓGIAI ÉS PSZICHOLÓGIAI KAR EGÉSZSÉGFEJLESZTÉSI ÉS SPORTTUDOMÁNYI INTÉZET 1117 Budapest, Bogdánfy Ödön u.

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

Szintaxis. Tóth Ildikó, PhD. Bevezetés a nyelvtudományba. 5. előadás 2009 Pázmány Péter Katolikus Egyetem

Angol Nyelvészeti Tanszék DELITE március 12. A Lexikai-Funkcionális Grammatikai Kutatócsoport: ParGram > HunGram > Treebank

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

Magyar nyelvtan tanmenet 4. osztály

Adamikné Jászó Anna Hangay Zoltán Nyelvi elemzések kézikönyve. Mozaik Oktatási Stúdió. Szeged.

Klasszikus héber nyelv 4.: Szintaxis

AZ ATTRIBUTÍV KOMPARATÍV TÖRLÉSRŐL

Grammatikalizálódott kopula és prenominális módosítok a magyarban

Félig kompozicionális fınév + ige szerkezetek a számítógépes nyelvészetben *

A két projekt valamelyikét említő előadásaink listája

A Hunglish Korpusz és szótár

EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

Elliptikus listák jogszabályszövegekben

Beszámoló a XI. Alkalmazott Nyelvészeti Doktoranduszkonferenciáról

A szelkup nominális és predikatív birtokos szerkezetekről

Számítógépes Számítógépes Nyelvészet nyelvi nyelvi adatbázisok é s éés használatuk

Klasszikus héber nyelv 4.: Szintaxis

Számítógépes Nyelvészet nyelvi adatbázisok és használatuk

OSZTÁLYOZÓ VIZSGA Orosz, 2. idegen nyelv. 9. évfolyam

Bevezetés az e-magyar programcsomag használatába

A seprűvel is söprögetünk

8. melléklet a 92/2011. (XII. 30.) NFM rendelethez A SZERZŐDÉS TELJESÍTÉSÉRE VONATKOZÓ INFORMÁCIÓK I. SZAKASZ: A SZERZŐDÉS ALANYAI

A nominális mondatok funkcionális szempontból

A számítógépes nyelvészet elmélete és gyakorlata. A számítógépes feldolgozás szempontjából fontos természetes nyelvi jelenségek

PurePos: hatékony morfológiai egyértelműsítő modul

MAGYAR NYELVÉSZETI TÁRGYAK ISMERTETÉSE BA NYELVTECHNOLÓGIAI SZAKIRÁNY

A modalitás. A/ A logikai hagyomány

I. Alkalmazott Nyelvészeti Doktorandusz Konferencia. Budapest,

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Analogikus általánosítási folyamatok a gyereknyelvben c. kutatási projekthez

Logika nyelvészeknek, 12. óra A típuselmélet alapjai. Lehetőség van a kvantorfogalom mellett a funktorfogalom általánosítására is.

28 millió szintaktikailag elemzett mondat és igei szerkezet

NY/NYKK - Nyelvtudományi Doktori Iskola. Interkulturális nyelvészet doktori oktatási program

PÁZMÁNY PÉTER KATOLIKUS EGYETEM BÖLCSÉSZETTUDOMÁNYI KAR

A kibővített Magyar történeti szövegtár új keresőfelülete

A magyar rekurzív szerkezetek elsajátítása

Nyelvtudományi Doktori Iskola - Japán filológia Doktori Program

PROJEKT-TERVEZÉS ÉS FINANSZÍROZÁS A projekt ütemezése. Munkalebontási szerkezet (WBS)

Kaposi Ambrus. Informatikai Kar. Pannonhalmi Bencés Gimnázium november 24.

MTA TANTÁRGY-PEDAGÓGIAI KUTATÁSI PROGRAM

Klasszikus héber nyelv 4.: Szintaxis

PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék

Félig kompozicionális főnév + ige. szerkezetek: elméleti kérdések és. számítógépes nyelvészeti elemzések

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban

Klasszikus héber nyelv 4.: Szintaxis

A csak partikula értelmezése óvodáskorban

Átírás:

A magyar létige problémái a számítógépes nyelvi elemzésben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor Komplex vizsga 2018. jún. 1.

Létige: VAN szótő Vagy: [NS]INCS, LESZ Mi a probléma? Probléma: a VAN néha nincs... Az elemzés kiindulópontja általában az ige és annak vonzatkerete De: vannak (jólformált, nem hiányos, nem elliptikus) mondatok ige nélkül is: Feri Star Wars-rajongó.

Elmélet: Létige semmi váltakozás (Dömötör 2017) A nominális mondatok segédigéje (kopula) jelen idő 3. személyben zéró/nincs. Valóság (a korpuszból): Más létigék is váltakoznak zéróval/semmivel. Lokatív: Hol a macska? Egzisztenciális: Erre semmi szükség. Birtokos: Semmi kedvem ehhez.

Nem tipikus zéró létigék Lokatív itt/ott/hol + VAN Inkább ellipszisszerű (szemantikai ok) Egzisztenciális semmi/sehol + FN.NOM Birtokos semmi + FN.Poss Lexikális? (kollokáció)

Az egzisztenciális típus gyakori főnevei

A birtokos típus gyakori főnevei

Clark-tipológia (Clark 1978) Mennyire valószínű a zérós szerkesztés a világ nyelveiben? Predikatív Azonosító Be-possessive Lokatív Egzisztenciális Birtokos (have-possessive) A magyarban ugyanez a sorrend: A be-possessive-ig kötelező zéró kopula Utána opcionális Lefele a gyakoriság csökken, a megszorítottság nő

A zéró létigék számítógépes kezelése Az egyéb esetek jól kezelhetők, mert behatároltak Mi legyen a tipikus esetekkel? Ezekhez a kulcs az állítmányi szerepű névszók azonosítása

Névszók eset-egyértelműsítése Egy testes esetrag nélküli névszó lehet: Nominativus (alany) Genitivus (jelöletlen birtokos) NP-t módosító elem (jelző) Névutós szerkezet része Névszói állítmány Az 1-4. megkülönböztetése az NP-sítéshez kell

Névszók eset-egyértelműsítése Nom-or-what (Ligeti-Nagy et al. 2018) Szabályalapú algoritmus A nominativust, genitivust, NP-módosítót és a névutó előtti névszót különbözteti meg Ehhez egy +2 token méretű előretekintő ablakot használ Is-pred (Dömötör 2018b) Szabályalapú algoritmus Eldönti, hogy a névszó állítmányi szerepű-e Csak a megelőző mondatrészt (már elhangzott szavakat) használja

Az állítmányi szerep azonosítása Kétfázisú elemzés vö. kolbásztöltő-modell (Frazier-Fodor 1978) 1. fázis: az NP-sítéshez szükséges esetek azonosítása (nom-or-what) 2. fázis: a névszói állítmány azonosítása (is-pred) Nom-or-what kimenet: címke Is-pred kimenet: háromértékű logikai válasz (True, False, Undefined)

Eredmények Pontosság 98.4% Fedés 59.6% F-mérték 74.2% A magas pontosság volt a cél Az itt le nem fedett esetek még pontosíthatók az elemzés során később

További kérdések A névszói állítmány szerkezeti helye Általában igemódosító, de néha fókusz, látszólag indokolatlanul A fókuszálás a releváns alternatívák jelenlétét kódolja (Dömötör 2018a) A névszói állítmány szemantikája Intelligens mondatértelmezés számítógéppel tudjon kérdést feltenni Állítmányi szerepű névszók klaszterezése

További kérdések A DP-k viszonya azonosító mondatokban A tett halála az okoskodás. Van-e itt alany-állítmányi viszony? Speciális esetek Kész van. Tele van. (De: *Kész áll. *Üres van.) Modális segédigékkel azonos disztribúciójú állítmányi névszók (Nem hazamenni.) szabadott, szabadna morfologizálódó kopula? Infinitivus + VAN Feri focizni van.

Hivatkozások Clark, E. V. 1978. Locationals: Existential, Locative and Possessive Constructions. In: Greenberg, J. H. (szerk.) Universals of Human Language IV. Syntax. Stanford: Stanford Univerity Press. 85-126. Dömötör, A. 2017. Hány van nincs? A létige zéró váltakozás korpuszvezérelt vizsgálata. In: Ludányi, Zs. (szerk.) Doktoranduszok tanulmányai az alkalmazott nyelvészet köréből 2017. MTA Nyelvtudományi Intézet, Budapest. 28 38. Dömötör, A. 2018a. Fókusz vagy igemódosító?. In: Scheibl, Gy. (szerk.) Lingdok 17. Nyelvészdoktoranduszok dolgozatai. Szegedi Tudományegyetem, Szeged. 147 158. Dömötör, A. 2018b. Nem mind VP, ami állít - A névszói állítmány azonosítása számítógépes elemzőben. In: Ludányi, Zs. (szerk.) Doktoranduszok tanulmányai az alkalmazott nyelvészet köréből 2018. MTA Nyelvtudományi Intézet, Budapest. publikálás alatt Frazier, L., Fodor, J. D. 1978. The sausage machine: A new two-stage parsing model. Cognition 6/4. 291 325. Ligeti-Nagy, N., Vadász, N., Dömötör, A., Indig, B. 2018. Nulla vagy semmi? Esetegyértelműsítés az ablakban. In: Vincze, V. (ed.) XIV. Magyar Számítógépes Nyelvészeti Konferencia. Szegedi Tudományegyetem, Szeged. 25 37.