Anaforafeloldás menet közben

Hasonló dokumentumok
Anaforafeloldás menet közben névmások egy pszicholingvisztikailag motivált elemzőben

Ablak által világosan Vonzatkeret-egyértelműsítés az igekötők és az infinitívuszi vonzatok segítségével

Igekötős szerkezetek a magyarban

A magyar létige problémái a számítógépes nyelvi elemzésben

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

Magyar nyelvű néprajzi keresőrendszer

Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben

Szakmai önéletrajz. Főbb tevékenységek elméleti nyelvészeti kutatások alkalmával asszisztensi feladatok ellátása

Angol Nyelvészeti Tanszék DELITE március 12. A Lexikai-Funkcionális Grammatikai Kutatócsoport: ParGram > HunGram > Treebank

Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

Szintaxis. Tóth Ildikó, PhD. Bevezetés a nyelvtudományba. 5. előadás 2009 Pázmány Péter Katolikus Egyetem

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

A Mazsola KORPUSZLEKÉRDEZŐ

Számítógépes nyelvészet

a Szeged FC Treebankben

Nyelvészet. I. Témakör: Leíró nyelvtan

KOREFERENCIAVISZONYOK AZ ENYHE KOGNITÍV ZAVARBAN SZENVEDŐK BESZÉDÁTIRATAIBAN. Kovács Viktória SZTE Nyelvtudományi Doktori Iskola

YANG ZIJIAN GYŐZŐ 杨子剑

Félig kompozicionális fınév + ige szerkezetek a számítógépes nyelvészetben *

Különírás-egybeírás automatikusan

MONDATTAN SZEMINÁRIUM A mellérendelő szintagma

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

XIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY Szerkesztette: Vincze Veronika

Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés

Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar. Doktori Disszertáció Tézisei. Recski Gábor. Számítógépes módszerek a szemantikában

Ahhoz, hogy mondatok halmazát érthetô egésszé, szöveggé rakd

Doktori (Ph.D.) értekezés tézisei. A magyar nyelv automatikus szintaktikai elemzése szabályalapú gépi tanulási technikák alkalmazásával.

Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül

Klasszikus héber nyelv 4.: Szintaxis

Mi is volt ez? és hogy is volt ez?

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Domének közti hasonlóságok és különbségek a szófajok és szintaktikai viszonyok eloszlásában

Esetegyeztetés a predikatív fnévi csoportban * Szécsényi Tibor SZTE Általános Nyelvészeti Tanszék

A MAGYAR REKURZÍV BIRTOKOS SZERKEZET ELSAJÁTÍTÁSA A NEMZETKÖZI KUTATÁSOK TÜKRÉBEN

Négy Hét Alatt Alapszinten Angolul. GYAKORLÁS nap

A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága

E. KISS KATALIN - KIEFER FERENC - SIPTAR PETER ÚJ MAGYAR NYELVTAN

LOGIKA ÉS ÉRVELÉSTECHNIKA

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Klasszikus héber nyelv 4.: Szintaxis

magyarlanc 2.0: szintaktikai elemzés és felgyorsított szófaji egyértelműsítés

Intelligens elektronikus szótár és lexikai adatbázis

Analogikus általánosítási folyamatok a gyereknyelvben c. kutatási projekthez

Klasszikus héber nyelv 4.: Szintaxis

Totális Unimodularitás és LP dualitás. Tapolcai János

A szótárról. 1. Mi ez?

Érettségi eredmények 2005-től (Békéscsabai Andrássy Gyula Gimnázium és Kollégium)

A tárgyas egyeztetés ingadozásai a magyarban

Bevezetés az e-magyar programcsomag használatába

ä ä

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Statisztikai alapú tulajdonnév-felismerő magyar nyelvre

Tartalomjegyzék. Tartalomjegyzék

Klasszikus héber nyelv 4.: Szintaxis

Bevezetés a nyelvtudományba. 5. Szintaxis

PÁRHUZAMOS IGEI SZERKEZETEK

ANGOL NYELV, MINT ELSŐ IDEGEN NYELV

E. KISS KATALIN - KIEFER FERENC - SIPTAR PÉTER ÚJ MAGYAR NYELVTAN

MAGYAR NYELV ÉS IRODALOM VIZSGA 8. ÉVFOLYAM

Lokalitás és argumentumöröklés

Teljes visszalépéses elemzés

A nyelvtechnológia alapjai

É. Kiss Katalin: Mit adhat a magyar nyelv és a magyar nyelvészet az általános nyelvészetnek?

2001-ben végze Eötvös-kollégistaként. angol nyelv és irodalom szakán, majd 2006 júliusában

Klasszikus héber nyelv 4.: Szintaxis

NT MAGYAR NYELV ÉS KOMMUNIKÁCIÓ 6. TANMENETJAVASLAT. (heti 2 óra, azaz évi 74 óra)

Korpuszok és adatbázisok. Korpuszok a nyelvészeti kutatásban szeptember 29.

DR. VINCZE VERONIKA. SZEMÉLYES ADATOK Születési idő: július 1. Állampolgárság: magyar

Bevezetés a nyelvtudományba Jelentéstan (szemantika)

Magyarország, 4031, Debrecen szeptemberétől jelenleg is Ph.D. tanulmányok folytatása

Hátrányos helyzet = nyelvi hátrány?

A tudásszint mérésének és mérhetőségének egy lehetőségéről

Mennyire elérhetőek az antecedensek?

Klasszikus héber nyelv 4.: Szintaxis

A MONDAT SZERKEZETE. tagolt tagolatlan alárendelı mellérendelı

A számítógépes nyelvészet elmélete és gyakorlata. A számítógépes feldolgozás szempontjából fontos természetes nyelvi jelenségek

Szemmozgáskövetés: Bepillantás a mondatok megértésének folyamataiba. Káldi Tamás MTA NYTI, BME Pszichológia Doktori Iskola

2 A MAGYAR STILISZTIKA A KEZDETEKTÕL A XX. SZÁZAD VÉGÉIG

Lexikon és nyelvtechnológia Földesi András /

Ismeretlen kifejezések és a szófaji egyértelm sítés

Magyar szövegek pszicholingvisztikai indíttatású elemzése számítógéppel

TestLine - Nyelvtan és irodalom bemeneti mérés Minta feladatsor

A megértés folyamata

28 millió szintaktikailag elemzett mondat és igei szerkezet

Strukturált nyelvi adatbázis létrehozása gépi tanulási módszerekkel. Kutatási terv

1. Korreferencia-kérdések kontrasztív megvilágításban KISS SÁNDOR SKUTTA FRANCISKA

AZ MTA ÉS AZ EGYETEMEK

Korpuszok létrehozása. Korpuszok a nyelvészeti kutatásban szeptember 22.

Adamikné Jászó Anna Hangay Zoltán Nyelvi elemzések kézikönyve. Mozaik Oktatási Stúdió. Szeged.

Csákberényiné Tóth Klára. Mondatolvasás és megértés TANKÖNYV TANESZKÖZ

MAGYAR MINT IDEGEN NYELV TANKÖNYVEK NYELVI ANYAGÁNAK SZÁMÍTÓGÉPES ELEMZÉSE 5

105 ezer diák közül mintegy 72 ezret vettek fel, 72 ezer diákból jutott be állami

MAGYAR NYELV ÉS IRODALOM

MAGYAR NYELV 5 8. Javasolt óraszámbeosztás

Átírás:

Anaforafeloldás menet közben Névmások egy pszicholingvisztikailag motivált elemzőben Vadász Noémi 2017 február 3. Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport

Az előadás felépítése 1. A visszautalás 2. Az AnaGramma 3. Koreferenciafeloldás balról jobbra 4. Problémás esetek és további feladatok 1/27

Visszautalási típusok (Pléh, 1998) ismétlés alá-, fölérendelés szinonimia zéró anafora névmási anafora epitheton valószínű rész szükségszerű rész esetkeret A gyerek meglátta a kutyát. A kutya ugatni kezdett. Laci vett egy pulit. A kutya sokat ugat. Feri meglátta a rendőrt. A zsaru hirtelen megfordult. A gyerek megölelte a tanárt. Leült és elmosolyodott. A gyerek megpuszilta a nénit. Ő meg elmosolyodott. Ede elhagyta Marit. A disznó még el sem köszönt. A rendőr belépett a szobába. Az ablak nyitva volt. Tegnap lerobbant a kocsim. A fék romlott el. A rabló lelőtte a pénztárost. A pisztoly a földön hevert. 2/27

Proformás visszautalás A proformás anaforák feloldásának nyelvtana (Pléh, 1998): (1) A gyerek megpuszilta a tanárt. Leült és elmosolyodott. (2) A lány sürgette a fiút. Az megértette, miről van szó. (3) A hippi átölelte a rendőrt. Ő hozta ide a zenészeket. (4) A kertész meglátta az apácát. Odament hozzá. (5) A kertész meglátta az apácát. Gyorsan megcsókolta. 3/27

Pléh-Radics algoritmus (Pléh and Radics, 1976) az 1. mondat NP-je a 2. mondatban szerep szemantikai jegy szerep megjelenés alany tárgy alany egyéb arg. az alany [-élő] tárgy [+élő] tárgy vagy szem. nm. egyéb arg. többes szem.nm alany tárgy egyéb arg. egyéb arg. szem. nm. 4/27

Az AnaGramma

AnaGramma Az AnaGramma elemző (Prószéky et al., 2016; Prószéky and Indig, 2015) főbb tulajdonságai: pszicholingvisztikailag motivált (Indig et al., 2016) balról jobbra és szavanként elemez függőségi gráf különböző típusú irányított élekkel Működési alapelvei: kereslet-kínálat keretrendszer tározó ablak (Indig and Vadász, 2016) 5/27

NP-k a mondatban: Szereplők Szereplő ID Grammatikai jegyek CAS = Nom/Dat/Acc... szófaj = N/NPMod(Adj/Num/Part)/Pron szám = Sg/Pl birtokos ragozás = PersSg/Pl1/2/3 tul.név = PropN Szemantikai jegyek = [+/- animate] Aktuális jegyek funkció = Subj/Obj/Arg definitség = Def/Indef mondat sorszáma = Sent1... NP sorszáma a mondatban NP1.../null Teljes NP 6/27

Koreferenciák feloldása I.: alanykeresés 1. vonzatkeretlehívás (vonzatkeretegyértelműsítés (Vadász et al., 2017)) 2. alanykeresés esetrag alapján 2.1 default zéró alany kiszámítása a ragozásból, csomópont létrehozása az alanynak, alany-él az igéhez, Subj jegy a csomópontnak Megettem a vajaskenyeret. HA volt előző mondat ÉS a ragozás nem változott koreferencia az előző mondat Subj-jegyű elemével, Subj jegy az alanynak A kisfiú meglátta a bácsit. Odament hozzá. HA van egyező alany alany-él az igéhez, Subj jegy az alanynak Peti ismeri a lányokat, Mari ismeri a fiúkat. HA van egyértelműsített az alany-él az igéhez, koreferenciaél az előző mondat Arg-jegyű elemével, Subj jegy az alanynak A postás bement a házmesterhez. Az odaadta neki a liftkulcsot. 7/27

Problémák a vonzatok koreferenciaviszonyaival (6) a. A szakács odavitte a pincért a cukrászhoz. Az udvariasan meghajolt. b. A szakács odavitte a pincért a vendégekhez. Az udvariasan meghajolt. (7) A pincér odahívta a vendéghez a kenyereslányt. Az megmutatta a süteményeket. 8/27

Koreferenciák feloldása II.: tárgykeresés 3. tárgykeresés esetrag alapján 3.1 default zéró tárgy kiszámítása a ragozásból, csomópont létrehozása az alanynak, tárgy-él az igéhez, Obj-jegy a csomópontnak HA volt előző mondat HA abban volt Subj-jegyű, egyes számú elem, amelynek a jelenlegi mondatban nincs Subj-jegye koreferencia az előző mondat Subj-jegyű elemével, Obj-jegy a tárgynak KÜLÖNBEN az előző mondat egyik nem Subj-jegyű elemével koreferens, Obj-jegy a tárgynak HA van személyes névmás, amely az előző mondat Subj-jegyű elemével számban egyezik, amelynek a jelenlegi mondatban nincs Subj-jegye koreferencia az előző mondat Subj-jegyű elemével, Obj-jegy a tárgynak KÜLÖNBEN az előző mondat egyik nem Subj-jegyű, számban egyező elemével koreferens, Obj-jegy a tárgynak 9/27

Koreferenciák feloldása III.: egyéb vonzatok keresése 4. többi argumentum keresése esetrag alapján HA volt előző mondat HA van személyes névmás, amely az előző mondat Subj-jegyű elemével számban egyezik, amelynek a jelenlegi mondatban nincs Subj-jegye koreferencia az előző mondat Subj-jegyű elemével, Arg-jegy a vonzatnak KÜLÖNBEN az előző mondat egyik nem Subj-jegyű, számban egyező elemével koreferens, Arg-jegy a vonzatnak 10/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, ID. a_gyerek gramm.feat. cas Nom pos N num. Sg sem.feat. anim. + act.feat. role def. Def sent.nr. 1 np.nr 1 11/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, ID. a_gyerek gramm.feat. cas Nom pos N num. Sg sem.feat. anim. + act.feat. role Subj def. Def. sent.nr. 1 np.nr 1 12/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, ID. a_gyerek a_labda gramm.feat. cas Nom Ins pos N N num. Sg Sg sem.feat. anim. + - act.feat. role Subj Arg def. Def Def sent.nr. 1 1 np.nr 1 2 13/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. ID. a_gyerek a_labda gramm.feat. cas Nom Ins pos N N num. Sg Sg sem.feat. anim. + - act.feat. role Subj Arg def. Def Def sent.nr. 1 1 np.nr 1 2 14/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. ID. a_gyerek a_labda gramm.feat. cas Nom Ins pos N N num. Sg Sg sem.feat. anim. + - act.feat. role Subj Arg def. Def Def sent.nr. 2 1 np.nr 0 2 15/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. ID. a_gyerek a_labda az_apja gramm.feat. CAS Nom Ins Dat pos N N N num. Sg Sg Sg sem.feat. anim. + - + act.feat. role Subj Arg Arg def. Def Def Def sent.nr. 2 1 2 np.nr 0 2 1 16/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. ID. a_gyerek a_labda az_apja gramm.features CAS Nom Ins Dat pos N N N num. Sg Sg Sg sem.features anim. + - + act.features role Subj Obj Arg def. Def Def Def sent.nr. 2 2 2 np.nr 0 0 1 17/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. Az bedobta vele az ablakot. ID. a_gyerek a_labda az_apja gramm.features cas Nom Ins Dat pos N N N num. Sg Sg Sg sem.features anim. + - + act.features role Subj Obj Arg def. Def Def Def sent.nr. 2 2 2 np.nr 0 0 1 18/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. Az bedobta vele az ablakot. ID. a_gyerek a_labda az_apja gramm.features cas Nom Ins Dat pos N N N num. Sg Sg Sg sem.features anim. + - + act.features role Subj Obj Subj def. Def Def Def sent.nr. 2 2 3 np.nr 0 0 1 19/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. Az bedobta vele az ablakot. ID. a_gyerek a_labda az_apja gramm.feat. cas Nom Ins Dat pos N N N num. Sg Sg Sg sem.feat. anim. + - + act.feat. role Subj Arg Subj def. Def Def Def sent.nr. 2 3 3 np.nr 0 2 1 20/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. Az bedobta vele az ablakot. ID. a_gyerek a_labda az_apja gramm.feat. cas Nom Ins Dat pos N N N num. Sg Sg Sg sem.feat. anim. + - + act.feat. role Subj Arg Subj def. Def Def Def sent.nr. 2 3 3 np.nr 0 2 1 21/27

Koreferenciafeloldás menet közben A gyerek egy ideig egyedül játszott a labdával, aztán odadobta az apjának. Az bedobta vele az ablakot. ID. a_gyerek a_labda az_apja az_ablak gramm.feat. cas Nom Ins Dat Acc pos N N N N num. Sg Sg Sg Sg sem.feat. anim. + - + - act.feat. role Subj Arg Subj Obj def. Def Def Def Def sent.nr. 2 3 3 3 np.nr 0 2 1 3 22/27

Ami ma sajnos nem fért bele az alany folytonosságának vizsgálata néma alanyváltás a mélyszerkezeti alany felismerése pl. -nak alanyú igék (pl. tetszik) a visszaható- és a kölcsönös névmás visszaható: koreferens az ige alanyával kölcsönös: koreferens az ige többes számú alanyával a homonímia problémája maga 1: egyes szám harmadik személyű visszaható névmás maga 2: egyes szám második személyű személyes névmás az 1: determináns az 2: névmás az infinitívuszi alanya a főige valamelyik vonzatával koreferens emfázis a többi névmás a többi koreferencia-típus 23/27

Köszönöm a figyelmet! ábra 1: https://www.facebook.com/logopedus 23/27

Felhasznált irodalom I Hivatkozások Indig, B., Vadász, N., and Kalivoda, Á. (2016). Decreasing Entropy: How Wide to Open the Window? In Martín-Vide, C., Mizuki, T., and Vega-Rodríguez, M. A., editors, Theory and Practice of Natural Computing: 5th International Conference, TPNC 2016, Sendai, Japan, December 12-13, 2016, Proceedings, pages 137 148, Cham. Springer. 24/27

Felhasznált irodalom II Indig, B. and Vadász, N. (2016). Window in Human Parsing How Far can a Preverb Go? In Tadić, M. and Bekavac, B., editors, Tenth International Conference on Natural Language Processing (HrTAL2016) 2016, Dubrovnik, Croatia, September 29-30, 2016, Proceedings, pages (Elfogadva, nyomtatás alatt), Cham. Springer. Pléh, C. (1998). A mondatmegértés a magyar nyelvben. Osiris tankönyvek. Osiris. Pléh, C. and Radics, K. (1976). Hiányos mondat", pronominalizáció és a szöveg. Általános Nyelvészeti Tanulmányok, 11(1):261 277. 25/27

Felhasznált irodalom III Prószéky, G. and Indig, B. (2015). Magyar szövegek pszicholingvisztikai indíttatású elemzése számítógéppel. Alkalmazott nyelvtudomány, 15(1-2):29 44. Prószéky, G., Indig, B., and Vadász, N. (2016). Performanciaalapú elemző magyar szövegek számítógépes megértéséhez. In Kas, B., editor, "Szavad ne feledd!": Tanulmányok Bánréti Zoltán tiszteletére, pages 223 232. MTA NYTI, Budapest. 26/27

Felhasznált irodalom IV Vadász, N., Kalivoda, Á., and Indig, B. (2017). Ablak által világosan vonzatkeret-egyértelműsítés az igekötők és az infinitívuszi vonzatok segítségével. In XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017). Szeged, 2017.01.26-2017.01.27., pages 3 12, Szeged. Szeged: Szegedi Tudományegyetem Informatikai Tanszékcsoport. 27/27