a Szeged FC Treebankben
|
|
- Elek Kelemen
- 8 évvel ezelőtt
- Látták:
Átírás
1 Szeged, január Többszintű szintaktikai reprezentáció kialakítása a Szeged FC Treebankben Simkó Katalin Ilona 1, Vincze Veronika 2, Farkas Richárd 1 1 Szegedi Tudományegyetem, TTIK, Informatikai Tanszékcsoport, Szeged, Árpád tér 2. kata.simko@gmail.com rfarkas@inf.u-szeged.hu 2 Magyar Tudományos Akadémia, Mesterséges Intelligencia Kutatócsoport, Szeged, Tisza Lajos körút 103. vinczev@inf.u-szeged.hu Kivonat Napjainkban a két leggyakrabban használt szintaktikai reprezentációs elmélet a konstituens és a függőségi nyelvtan. A Szeged Treebank mondatai mindkét leírással manuális annotáltak. E cikkben beszámolunk egy olyan automatikusan átalakított, többszintű reprezentáció kialakításának munkálatairól, amely e két elemzés előnyös tulajdonságait egyesíti a mondatok szintaktikai leírásában. 1. Bevezetés A létező szintaktikai elméletek közül jelenleg a két leginkább elterjedt a konstituens és a függőségi szintaxis. A Szeged Treebank mondatai is ezen reprezentációs elméleteknek megfelelően rendelkeznek manuális konstituens [1] és függőségi [2] elemzésekkel. Mindkét reprezentációnak megvannak az előnyei és a hátrányai is. A kétféle elemzés előnyeinek kihasználása céljából készül jelenleg automatikus átalakítással a Szeged Treebank leírására egy, a konstituens és függőségi fák, valamint a szavak morfológiai elemzéseit felhasználó, összetett szintaktikai reprezentáció. A reprezentáció kialakításakor hangsúlyozottan törekszünk arra, hogy a magyar nyelv szintaktikai sajátságait a lehető legnagyobb mértékben szem előtt tartsuk, ugyanakkor kiemelt szempontként kezeljük azt is, hogy a létrejövő treebank alkalmas legyen magyar nyelvű statisztikai szintaktikai elemzők betanítására is. Ebben a munkában részletesen ismertetjük a többszintű szintaktikai reprezentáció kialakítása során követett irányelveket. Példákon keresztül megmutatjuk, hogyan kezelünk egyes nyelvi jelenségeket, valamint kitérünk arra is, hogy elemzésünk miben különbözik a Szeged Treebank eddigi változataiban követett függőségi, illetve konstituens alapú megközelítésektől, illetve szót ejtünk arról is, hogy elemzésünk hogyan viszonyul a szintén több nyelvi elemzési szinttel operáló LFG nyelvelméleti kerethez [3].
2 68 X. Magyar Számítógépes Nyelvészeti Konferencia 2. Konstituens és függőségi nyelvtanok Bár a konstituens és a függőségi nyelvtanoknak is megvannak a hátrányai, mégis ezek a legelterjedtebben használt szintaktikai reprezentációk. A konstituens reprezentáció a mondatokat összetevőkre bontja, amik összefüggő, jelentéssel bíró alkotóelemei a mondatnak. Tagmondatokra, azokon belül pedig igékre és bővítményeikre osztja a mondatokat. A szigorú konstituens e- lemzési elméletben az összetevők nyelvtani szerepére csak a szórendből következtethetünk, ami kötött szórendű nyelveknél, mint az angol jól működhet, de a magyar esetében kevésbé működőképes megoldás. A számítógépes nyelvészetben léteznek megoldások, amelyek az argumentumok felcímkézésével jelzik a nyelvtani szerepet, de ezek a konstituens nyelvtan szigorúan vett elméleti nyelvészeti hátterébe nem illenek bele. Nehezen elemezhetőek a nem folytonos konstituensek is, azaz azok az egybe tartozó elemek, amelyek nem egymás mellett jelennek meg a mondatban, mint például egyes mondatokban a genitív esetű birtokos és a birtoka. Függőségi elemzésben a mondat szavai közvetlenül egymáshoz kapcsolódnak absztrakt csomópontok nélkül. Ezzel jól reprezentálhatóak a nyelvtani szerepek a mondatban és a nem folytonos összetevők kezelése is egyszerű feladat, elveszítjük viszont az összetartozó szavak egységként való kezelésének lehetőségét. Mindemellett a tagmondatok és mellérendelések kezelése például kevésbé intuitív, mint a konstituens elemzésben. Mivel mindkét reprezentáció tartalmaz fontos információkat a magyar és a hasonlóan gazdag morfológiájú nyelvek szintaxisára vonatkozóan, nem eldöntött, hogy melyik a jobb leírás az ilyen nyelvek esetében. Hasonlóan, léteznek mind konstituens, mind függőségi elemzők a magyar nyelvre, melyek a Szeged Treebank különböző változatain lettek betanítva [4], azonban az automatikus elemzések kiértékelése során használatos mutatók sem teszik le egyértelműen a voksot egyik reprezentáció mellett sem. Ezen okokból döntöttünk egy olyan szintaktikai reprezentáció létrehozása mellett, amely egyesíti a két elmélet által kódolt információkat. A Szeged Treebank mondatai kézzel annotált konstituens és függőségi elemzéssel is el vannak látva. A kétféle reprezentáció részben megegyező, részben az adott reprezentációnak megfelelő információkat kódol a mondat szintaktikai szerkezetével kapcsolatban. Ezeket az információkat egyesítjük egy új, többszintű szintaktikai leírásban. 3. Többszintű szintaktikai reprezentáció A Szeged Treebank többszintű szintaktikai reprezentációja a lexikai funkcionális grammatika [3] elmélethez hasonló szerkezetű és a már létező, kézzel annotált konstituens és függőségi elemzések és morfológiai kódok felhasználásával jön létre. Az LFG-hez hasonlóan a különféle nyelvtani jellemzőket különböző szinteken jelenítjük meg.
3 Szeged, január A LFG reprezentációk több különböző struktúrát rendelnek a mondatokhoz. Ezek különböző szintaktikai szerkezeteken kívül szemantikai, fonológiai és egyéb nyelvi szintekhez kapcsolódó információkat is hozzákapcsolnak a mondat kifejezéseihez. A struktúrák egy többszintű reprezentáció alkotórészeit képezik ebben a keretben, egy-egy kifejezéshez a leírás több különböző szintjéről másmás információk társulnak és ezek együtt, egymással összekapcsolva alkotják az LFG elméletbeli reprezentációját az adott mondatnak. Az LFG struktúrái közül a szintaktikai szempontból legalapvetőbb c- és f- struktúrák létrehozása mellett döntöttünk. A c-struktúra a mondat felszíni szerkezetét tükrözi, azt összetevőkre bontja. Az f-struktúrában a mondat argumentumszerkezete, illetve morfológiai információk jelennek meg attribútum-érték párokként. A két szerkezet szavai és nagyobb összetevői egymással összeindexelve, közösen alkotják ezt a többszintű modellt. A magyar nyelv bizonyos jelenségeinek ebben a modellben való elemzéséről már nagyon sok cikk született [5,6], de a magyart általánosan leíró LFG nyelvtan legjobb tudomásunk szerint nem létezik. Jelen átalakítás alapelveinek lefektetésekor egy átfogó jellegű szabályrendszert igyekeztünk létrehozni, és a kisebb számban előforduló speciális nyelvi jelenségek kezelésére átvesszük a Szeged Treebank előző verzióiban kifejlesztett megoldásokat. 4. Átalakítás 4.1. C-struktúra A c-struktúra átalakítása a Szeged Treebank konstituens elemzéséből indul ki. Ez az átalakítás viszonylag kevés módosítással jár. Megtartjuk a kézzel annotált frázisokat és hozzájuk adunk egy-egy indexet, ami összekapcsolja őket az f-struktúra megfelelő részeivel. Így a konstituensnyelvtan előnye, az összetevős struktúra megmarad ebben az új modellben is, az ebben nehezen reprezentálható nyelvtani szerepek pedig más szinten vannak kezelve F-struktúra Címkék. Az f-struktúra a mondat argumentumszerkezetét tükrözi. Ezen a szinten találhatóak a kifejezésekhez tartozó nyelvtani szerepek, és a nem folytonos összetevők elemzése is megoldható. Leginkább a függőségi nyelvtanban kódolt információval feleltethető meg, ezért a Szeged Dependencia Treebank és a mondatok szavaihoz rendelt morfológiai kódok átalakításával hozzuk létre. Ezen a szinten a szintaktikai információ attribútum-érték párokból álló szerkezetben jelenik meg. Minden kifejezés f-struktúrájában megtalálhatóak a hozzátartozó releváns morfológiai adatok és a kifejezés különböző vonzatainak f- struktúrái. A függőségi nyelvtanban található relációk címkéit itt attribútumok címkéiként jelennek meg, az ezekhez kapcsolódó érték a kapcsolódó kifejezés f- struktúrája.
4 70 X. Magyar Számítógépes Nyelvészeti Konferencia A mondat PRED jegye alatt megtaláljuk a fő elemet és a vonzatait zárójelben. A mondatok fő eleme a függőségi nyelvtan ROOT eleme, vonzatai a függőségi nyelvtanban hozzá csatlakozó szavak. A PRED jegy után a releváns morfológiai jegyek találhatóak, amelyeket a szavak morfológiai kódjából nyerünk. Ezután a predikátum argumentumai következnek a nyelvtani szerepüknek megfelelő címkével. A függőségi nyelvtan SUBJ (alany) és OBJ (tárgy) relációi azonos nevű címkék lesznek az f-struktúrában. A kötelező vonzatok, a függőségi nyelvtanban DAT (részes eset) és OBL (egyéb eset) relációban állók egy közös, OBL címkét kapnak, míg a különböző határozói szerepű vonzatok (MODE, LOCY, FROM, TO, TLOCY, TFROM, TTO függőségi reláció) ADJ (adjunktum) címke alá kerülnek. Az INF, PA és AUX relációkkal rendelkező főnévi igenevek, melléknévi igenevek és segédigék szintén megtartják a függőségi relációjuk nevét az f-struktúra-beli címkéjükben. A vonzatok f-struktúrája hasonló felépítésű: a PRED jegy az adott kifejezést jelöli, utána a vonzatait, módosítóit találjuk. Ezután a szófajának megfelelő morfológiai jegyek értékei következnek. A vonzatokat OBL vagy DAT függőségi relációval módosító, kötelező bővítmények itt is OBL címke alá kerülnek. Az ATT és MODE viszonyúak ADJ címkét kapnak. A névszókat módosító birtokosok POSS címkével kerülnek a birtok f-struktúrájába. A határozott és határozatlan névelők DEF=+ és DEF=- jegyekként jelennek meg a szerkezetben. A névszói predikátumok függőségi PRED relációját az LFG elméletnek megfelelően [7,8] PREDLINK címkével jelöltük az f-struktúrákban. Ennek mintájára a többszavas névelemek kezelésére a függőségi NE viszonyt NELINK-ké alakítottuk, az összetett számnévi kifejezések NUM relációját pedig NUMLINK-ké. Összetett mondatok. Az összetett mondatok kezelésében szintén az LFG-ben használt megoldást választottuk. Alárendelő szerkezetek és vonatkozói mellékmondatok esetén a főmondat PRED elemének egy vonzata az alárendelt mondat fő eleme, a beágyazott mondat f-struktúrája COMP címkével jelenik meg a főmondat f-struktúrájában. Mellérendelés esetén a mellérendelt kifejezések f- struktúrái egymás mellett jelennek meg. A kifejezéseket összekapcsoló esetleges kötőszavak alárendelés esetén az alárendelt mondat f-struktúrájában, mellérendelés esetén a mellérendelt tagok f-struktúrái alatt, CONJ-FORM címke alatt találhatóak. Kötelező jegyek. Az f-struktúrában az egyes kifejezések alatt megtalálható kötelező morfológiai jegyeket az adott kifejezés morfológiai kódjából nyerjük ki. Az, hogy egy szónál milyen jegyeknek kell kötelezően megjelenni, a szó szófajától függ. Az MSD kódban tárolt információk közül a szintaktikailag relevánsakat jelenítjük meg. Az ige altípusa, száma, személye, az igemód, igeidő és határozottság az ige f-struktúrájában jelenik meg. A névszói vonzatok esetében a szám és az eset jelenik meg kötelezően. Melléknevek esetén ezeken felül a fokozás, névmásoknál a személy.
5 Szeged, január Hely- és időhatározók. A Szeged Treebankben található három-három helyés időhatározó típus megkülönböztetését az átalakított többszintű reprezentációba nem vettük át, mivel úgy gondoljuk, hogy ezen megkülönböztetés már túlmutat a szintaxis szintjén. Az irányhármasságot is kifejező hely- és időhatározói címkéket minden esetben ADJ jegyként kezeltük a mondatok f-struktúrájában. A későbbiekben ezt az információt egy újabb struktúrába tervezzük felvenni, amelyben megtennénk ezt a szinte már szemantikai megkülönböztetést a helyés időhatározók típusai között. 5. Virtuális csomópontok A magyar LFG reprezentációjával kapcsolatban ugyanúgy felmerül a virtuális csomópontok problémája, mint a függőségi elemzésben. Mivel mindkét elmélet kerüli a fonológiailag jelen nem levő kifejezések megjelenítését a szintaktikai struktúrákban, a magyarban megjelenő kétféle virtuális összetevő kezelése nehézségeket okozhat. A magyarban előforduló egyik ilyen meg nem jelenő összetevő a van ige harmadik személyű, kijelentő mód, jelen idejű alakja. A Józsi katona mondat esetén például nem jelenik meg az ige, ami más személy, mód vagy igeidő esetén már igen, például Józsi katona volt. A másik típus az ellipszis, az a több nyelvre is jellemző jelenség, amikor egy már elhangzott szót vagy kifejezést nem mondunk ki újra, illetve a több tagmondatban ismétlődő kifejezéseket csak a tagmondatok egyikében szerepeltetjük. A ki nem mondott kifejezés lehet a tagmondat fő igéje, vagy annak bármely argumentuma, illetve az argumentum kisebb része. A Józsi katona volt, Béla pedig pék mondat esetén például a második tagmondatból a volt ige elliptálva van. A virtuális csomópontok mindkét típusánál hasonló megoldás mellett döntöttünk. A virtuális kifejezések a mondathoz tartozó c-struktúrában nem jelennek meg, mivel az szigorúan a mondat felszíni szerkezetét rendezi frázisokba. Ezek a kifejezések csak az f-struktúrában jelennek meg, ami a szigorú LFG elméletben szintén kerüli a ki nem mondott kifejezések reprezentálását, viszont az ott megjelenített viszonyok leírásához fontos, hogy kitöltsük ezeket a csomópontokat is. Az f-struktúrában a PRED jegyben jelöljük, hogy virtuálisról van szó: VAN vagy ELL értéket kap. A további jegyeket csak a VAN kapja meg, azok közül is csak azokat, amelyek biztosak: az igemód, igeidő és személy. 6. Eltérések az LFG-től A Szeged Treebank átalakításakor főként az LFG elméletben [3] használt megoldásokat követtük, így a reprezentáció nagyon hasonló a lexikai funkcionális grammatika c- és f-struktúráihoz. Néhány ponton viszont eltértünk a szigorú LFG elmélettől. A következőkben ismertetünk néhányat ezen eltérések közül.
6 72 X. Magyar Számítógépes Nyelvészeti Konferencia 6.1. C-struktúra Az LFG reprezentációk c-struktúrái a generatív nyelvtanokban használt bináris, X-vonás elméletnek megfelelő fákból állnak [9]. Az általunk átalakított c-struktúrák a Szeged Treebank konstituens fáihoz hasonlóan nem követik a szigorú chomskyánus nyelvtant, hanem a fő elem szófajának megfelelő frázisokra bontják a mondatokat Topik és fókusz pozíciók Az LFG elemzésben a mondatok f-struktúrájában jelölve van a topik és a fókusz pozíció is, főleg a magyarhoz hasonló diskurzuskonfigurációs nyelvek szintaktikai leírása esetén. A Szeged Treebank átalakítása során nem használtuk az f-struktúrában a topik és fókusz pozíciókat, mivel az erre vonatkozó információ sem a meglévő konstituens, sem a meglévő függőségi treebankben nincs kódolva, és így automatikus konvertálásuk nem megoldható. A topik és fókusz jelölése egy későbbi lépésben belekerülhet az f-struktúrákba kézi annotációval Fonológiailag üres névmási kategóriák Bár az LFG kerüli az üres kategóriák felvételét az elemzésbe, pro elemek mégis megjelennek ki nem mondott névmások helyén az f-struktúrában. A magyarban gyakran ki nem tett személyes névmási alany és tárgy helyére például egy pro kerül az LFG elemzés f-struktúrájába. Mivel a Szeged Treebank egyik verziója sem jelöli a fonológiailag üres névmásokat, az átalakítás során az ehhez hasonló esetekben nem vettük fel a pro PRED jegyű elemet, az ehhez tartozó jegyeket egy szinttel feljebb jelenítjük meg. Például egy elhagyott alany esetén annak száma és személye a magyarban megjelenik az igén, így ezeket a jegyeket ott reprezentáljuk ahelyett, hogy egy pro PRED jegyű alanyt vennénk fel az f-struktúrába ezekkel a jegyekkel. 7. A Szeged FC Treebank kialakítása A fentiekben ismertetett elveket a gyakorlatba átültetve kialakítjuk a Szeged Treebank egy újabb verzióját, a Szeged FC Treebanket. Ezt elsődlegesen automatikus konverzió segítségével állítjuk elő a meglévő konstituens- és függőségi reprezentációk alapján, minimálisra csökkentve az utólagos kézi javításokat. A létrejövő új treebank kitűnő lehetőséget teremt arra, hogy létrehozzunk egy olyan statisztikai szintaktikai elemzőt, amely kifejezetten a magyar nyelv szintaktikai sajátságaira van optimalizálva, ugyanakkor egyesíti magában a konstituens és függőségi elemzők nyújtotta előnyöket is. A Szeged FC Treebank kialakítása a Szeged Treebank konstituens és függőségi elemzéseinek automatikus konvertálásával történt a már leírt szabályok mentén. Az alábbiakban bemutatjuk egy példán keresztül az átalakítás különböző lépéseit.
7 Szeged, január A c-struktúrát a konstituens fákból egyszerűen a nyelvtani szerepjelölések eltávolításával nyertük, l. 1. és 2. ábrák. Az f-struktúra és a függőségi nyelvtan között már nagyobb különbség látható, vö. 3. és 4. ábrák. A példamondatban az alá- és mellérendelő szerkezeteken kívül a birtokos szerkezetek kezelése is látható a két különböző elméleti keretben. A Szeged FC Treebank reprezentációi a Szeged Korpusz mondataihoz a fent láthatóakhoz hasonló c- és f-struktúrákat rendelnek. Ez a két leírás együtt alkotja az új treebank elemzését. 8. Összegzés Ebben a munkában bemutattuk a készülő Szeged FC Treebank elméleti alapját képező többszintű szintaktikai reprezentációt, mely egyesíti magában a konstituens és függőségi reprezentációk előnyeit, ugyanakkor kifejezetten a magyar nyelv szintaktikai sajátságaira van szabva. Az LFG elméletéhez hasonlóan, e reprezentáció is c és f-struktúrában jeleníti meg a releváns szintaktikai információkat, azonban attól néhány fontos vonásban eltér. Az újonnan létrejövő treebank reményeink szerint egy új, a magyar nyelvet minden eddiginél hatékonyabban feldolgozni képes statisztikai szintaktikai elemző létrehozásának alapjául szolgálhat. Köszönetnyilvánítás A jelen kutatás a futurict.hu nevű, TÁMOP C-11/1/KONV azonosítószámú projekt keretében az Európai Unió támogatásával és az Európai Szociális Alap társfinanszírozásával valósult meg.
Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.
Szintaxis: elemzések Nyelvészet az informatikában informatika a nyelvészetben 2013. november 6. Bevezetés Múlt óra: mondatrészek Mai óra: Szintaktikai reprezentációs elméletek Ágrajzok Problémás jelenségek
Magyar nyelvű néprajzi keresőrendszer
Szeged, 2013. január 7 8. 361 Magyar nyelvű néprajzi keresőrendszer Zsibrita János 1, Vincze Veronika 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport zsibrita@inf.u-szeged.hu 2 MTA-SZTE Mesterséges
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2015. november 25. Témaválasztás házi dolgozatra (ע "ו ( igeragozás Ismétlés: Mondatok: Arnold & Choi 5. rész A mondat belső
Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül
Szeged, 2016. január 21-22. 251 Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül Kovács Viktória 1, Simkó Katalin Ilona 2, Szécsényi Tibor 3 Szegedi Tudományegyetem, Bölcsészettudományi Kar
Domének közti hasonlóságok és különbségek a szófajok és szintaktikai viszonyok eloszlásában
182 IX. Magyar Számítógépes Nyelvészeti Konferencia Domének közti hasonlóságok és különbségek a szófajok és szintaktikai viszonyok eloszlásában Vincze Veronika 1,2 1 MTA-SZTE Mesterséges Intelligencia
Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola
IGEI VONZATKERETEK AZ MNSZ TAGMONDATAIBAN Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2006 Szeged, 2006.
Lexikon és nyelvtechnológia Földesi András /
Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.
A melllérendelés és az ellipszis nyelvtana
1 Bánréti Zoltán A melllérendelés és az ellipszis nyelvtana a magyarban 2 3 Segédkönyvek a nyelvészet tanulmányozásához 75. Bánréti Zoltán A mellérendelés és az ellipszis nyelvtana a magyarban Tinta könyvkiadó
Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu
VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK
Angol Nyelvészeti Tanszék DELITE március 12. A Lexikai-Funkcionális Grammatikai Kutatócsoport: ParGram > HunGram > Treebank
Angol Nyelvészeti Tanszék DELITE 2014. március 12. A Lexikai-Funkcionális Grammatikai Kutatócsoport: ParGram > HunGram > Treebank http://hungram.unideb.hu/ A csapat (LFGKCS) Tóth Ágoston Laczkó Tibor Rákosi
Tartalomjegyzék. Tartalomjegyzék. A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17
A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17 A főnév szószerkezetekben 20 A névelő 21 Gyakorlatok 26 A hangsúlytalan mutató névmással álló főnév 28 A birtokos
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
Tantárgyi követelmények. Német nyelv. 9. oszt.
Tantárgyi követelmények Német nyelv 9. oszt. Témakörök: Bemutatkozás Az én családom Az én barátom Az én házam/lakásom Az én szobám Az én iskolám Lakóhely bemutatása Napirend Étkezési szokások Szabadidő
Bevezetés a nyelvtudományba. 5. Szintaxis
Bevezetés a nyelvtudományba 5. Szintaxis Gerstner Károly Magyar Nyelvészeti Tanszék Szintaxis Mondattan Hangok véges elemei a nyelvnek Szavak sok, de nyilván véges szám Mondatok végtelen sok Mi a mondat?
Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.
Morfológia, szófaji egyértelműsítés Nyelvészet az informatikában informatika a nyelvészetben 2013. október 9. Előző órán Morfológiai alapfogalmak Szóelemzések Ismeretlen szavak elemzése Mai órán Szófajok
Magyar nyelvtan tanmenet 4. osztály
COMENIUS ANGOL-MAGYAR KÉT TANÍTÁSI NYELVŰ ÁLTALÁNOS ISKOLA Magyar nyelvtan tanmenet 4. osztály 2013/2014 Tanítók: Tóth Mária, Buruncz Nóra Tankönyvcsalád: Nemzeti Tankönyvkiadó Anyanyelvünk világa 4. osztály
Tartalomjegyzék. Tartalomjegyzék
Tartalomjegyzék A főnév 11 Kis és nagy kezdőbetűk 11 A főnevek neme 12 A főnevek többes száma 13 Nem megszámlálható főnevek 15 Csak többes számban használatos főnevek 16 Foglalkozások 17 Címek, rangok,
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2017. november 22. Visszajelzés a beadott házi feladatokkal és a negyedévi zh-val kapcsolatban igék ragozása ע "ו és ל "א
Tartalomjegyzék. Bevezetés Az ige mondatalkotó képessége. 2. Az Objekt"-ek sorrendje főnevek, ill. névmások esetében.
Tartalomjegyzék Bevezetés 13 1. Az ige mondatalkotó képessége 15 2. Az Objekt"-ek sorrendje főnevek, ill. névmások esetében 17 18 3. Néhány gyakori, Prapositionalobjekt"-tel mondatot alkotó ige 23 4. Névmási
Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés
Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés Az egyszerű mondat szerkezete (É. Kiss 1992) a fő összetevők lehetséges sorrendje: Imre ismeri Erzsit. Erzsit ismeri Imre. Imre Erzsit ismeri.
A magyar létige problémái a számítógépes nyelvi elemzésben
A magyar létige problémái a számítógépes nyelvi elemzésben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor Komplex vizsga 2018. jún. 1. Létige:
EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ
EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ SZERKEZETEK KINYERÉSE KORPUSZBÓL Sass Bálint sass.balint@nytud.hu MTA Nyelvtudományi Intézet Budapest, 2011. június 16. 1 / 33 1 MAGYAR IGEI SZERKEZETEK Alapmodell és
Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint
ÉLŐ VAGY ÉLETTELEN? Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2007 Szeged, 2007. december 6 7. 1 KÉRDÉSFELVETÉS
Syllabus. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom
I. Intézmény neve Kar Szak Tantárgy megnevezése Syllabus Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom Mai magyar nyelv V. (Mondattan) A tantárgy típusa DF DD
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2014. november 19. Témaválasztás házi dolgozatra Ismétlés: rendhagyó igék A mondat belső szerkezete Az óra céljai: Emlékeztető
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar 2018 2019-es tanév III. év, II. félév I. Általános információk A tantárgy neve: Szintaxis II. Kódja: LLM6124 (MA), LLM6224 (MB), LLM6024 (MM) Kreditszáma:
Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged
Mazsola mindenkinek Sass Bálint MTA Nyelvtudományi Intézet 2018. január 18. MSZNY 2018, Szeged Példa http://corpus.nytud.hu/mazsola Lekérdezés: iszik + -t 2/15 Háttér adatbázis Ha a város a tárcáktól pénzt
A Mazsola KORPUSZLEKÉRDEZŐ
A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1
magyarlanc 2.0: szintaktikai elemzés és felgyorsított szófaji egyértelműsítés
368 IX. Magyar Számítógépes Nyelvészeti Konferencia magyarlanc 2.0: szintaktikai elemzés és felgyorsított szófaji egyértelműsítés Zsibrita János 1, Vincze Veronika 2, Farkas Richárd 1 1 Szegedi Tudományegyetem,
E. KISS KATALIN - KIEFER FERENC - SIPTAR PETER ÚJ MAGYAR NYELVTAN
E. KISS KATALIN - KIEFER FERENC - SIPTAR PETER ÚJ MAGYAR NYELVTAN Osiris Kiadó Budapest, 2003 TARTALOM Előszó 13 MONDATTAN É. Kiss Katalin 1. A mondattan tárgya és alapfogalmai (Yp) 1.1. A mondattan tárgya
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. november 23. Visszajelzés a beadott házi feladatokkal kapcsolatban Félévközi ZH eredménye (ע "ו ( igeragozás Ismétlés:
Különírás-egybeírás automatikusan
Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia
Korpuszok és adatbázisok. Korpuszok a nyelvészeti kutatásban szeptember 29.
Korpuszok és adatbázisok Korpuszok a nyelvészeti kutatásban 2014. szeptember 29. Angol nyelvű korpuszok British National Corpus (BNC) Brit angol ~100M szövegszó Írott és beszélt nyelv Automatikus annotáció
TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal. A határozott névelő: a gitár, az autó
1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal 2. fejezet TALÁLKOZÁS 17 38. oldal 3. fejezet ISMERKEDÉS AZ IRODÁBAN 39 56. oldal 4. fejezet A VÁROSBAN 57 82. oldal TÉMÁK Néhány nemzetközi szó Köszönések
A LEXIKAI-FUNKCIONÁLIS GRAMMATIKA MONDATTANÁNAK ALAPFOGALMAI
NEM-TRANSZFORMÁCIÓS NYELVTANOK I. A LEXIKAI-FUNKCIONÁLIS GRAMMATIKA MONDATTANÁNAK ALAPFOGALMAI Tankönyv Írta Komlósy András Budapest, 2001 Készült a Soros Alapítvány támogatásával (FEPP 238/60) TARTALOM
A nyelvtani szabályok bemutatási módjai három magyar nyelvkönyvben
Anna Grzeszak, Damian Kaleta A nyelvtani szabályok bemutatási módjai három magyar nyelvkönyvben Dolgozatunk célja, hogy megnézzük, hogyan mutatják be a nyelvtani szabályokat az egyes magyar nyelvkönyvek.
VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete
A számítógépes nyelvészet elmélete és gyakorlata Formális nyelvek elmélete Nyelv Nyelvnek tekintem a mondatok valamely (véges vagy végtelen) halmazát; minden egyes mondat véges hosszúságú, és elemek véges
E. KISS KATALIN - KIEFER FERENC - SIPTAR PÉTER ÚJ MAGYAR NYELVTAN
E. KISS KATALIN - KIEFER FERENC - SIPTAR PÉTER ÚJ MAGYAR NYELVTAN Osiris Kiadó Budapest, 1998 TARTALOM Előszó 13 MONDATTAN (É. Kiss Katalin) 1. A mondattan tárgya és alapfogalmai 17 1.1. A mondattan tárgya
Események detektálása természetes nyelvű szövegekben
Események detektálása természetes nyelvű szövegekben Subecz Zoltán, Nagyné Csák Éva Összefoglalás Az események detektálásának a feladata az esemény-előfordulások azonosítása a szövegekben. Esemény előfordulásnak
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar os tanév III. év, II. félév. I. Általános információk
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar 2015 2016-os tanév III. év, II. félév I. Általános információk A tantárgy neve: Szintaxis II. Kódja: LLM6124 (MA), LLM6224 (MB), LLM6024 (MM) Kreditszáma:
Morfológiai újítások a Szeged Korpusz 2.5-ben
332 X. Magyar Számítógépes Nyelvészeti Konferencia Morfológiai újítások a Szeged Korpusz 2.5-ben Vincze Veronika 1,2, Varga Viktor 2, Simkó Katalin Ilona 2, Zsibrita János 2, Nagy Ágoston 2, Farkas Richárd
Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint
ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori Program
OSZTÁLYOZÓVIZSGA KÖVETELMÉNYEI OROSZ NYELV
OSZTÁLYOZÓVIZSGA KÖVETELMÉNYEI OROSZ NYELV 9. ÉVFOLYAM ÍRÁS OLVASÁS a cirill-betűs írás és olvasás elsajátítása NYELVANI ISMERETEK a főnevek neme személyes névmások (ragozással) birtokos névmások (csak
MORFOLÓGIAI FELÉPÍTÉS
A SZÓÖSSZETÉTEL SZÓÖSSZETÉTEL Két vagy több szóalak összekapcsolásával hozunk létre új lexémát Tudatos szóalkotás és véletlenszerű keletkezés Létrejöttüket nemcsak szintaktikai szabályok, hanem szemantikai,
A szótárról. 1. Mi ez?
A szótárról 1. Mi ez? A szótár, amit az olvasó a kezében tart, a leggyakoribb magyar igei szerkezeteket tartalmazza. Egynyelvű szótár explicit szótári értelmezések nélkül; a szerkezeteket, azok jelentését
MAGYAR NYELV 5 8. Javasolt óraszámbeosztás
MAGYAR NYELV 5 8. Javasolt óraszámbeosztás A tantárgy heti óraszáma A tantárgy éves óraszáma 5. évfolyam 2 72 6. évfolyam 2 72 7. évfolyam 2 72 8. évfolyam 2 72 5. évfolyam Tematikai egység címe Beszédkészség,
Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet 2.2.01.
Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet 2.2.01.1 (A) változatához Magyar nyelv és irodalom az általános iskolák 5 8. évfolyama
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2017. szeptember 13. Informatikusviccek Az informatikus felesége elküldi a férjét a boltba: - Hozzál margarint, és ha van
Számítógépes Nyelvészet nyelvi adatbázisok és használatuk
Számítógépes Nyelvészet nyelvi adatbázisok és használatuk Mesterséges Intelligencia előadás http://www.inf.u-szeged.hu/hlt 5/3/2011 1 Tartalom A számítógépes szövegfeldolgozás célja Nyelvi adatbázisok
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. november 16. Félévközi ZH 45 perc open-book, Arnold-Choi 2 3. Témaválasztás házi dolgozatra Témaválasztás házi dolgozatra
Szintaxis. Tóth Ildikó, PhD. Bevezetés a nyelvtudományba. 5. előadás 2009 Pázmány Péter Katolikus Egyetem
Szintaxis Tóth Ildikó, PhD. Bevezetés a nyelvtudományba 5. előadás 2009 Pázmány Péter Katolikus Egyetem 1 Végesből végtelen Hangok Szavak - véges sok - véges sok rekurzív szabályok (pl. beágyazás, mellérendelés)
Nagy Erika. Nyelvtanból Ötös. A magyar nyelvtan érthetően kicsiknek és nagyoknak. www.magyarnyelvtan.hu
Nagy Erika Nyelvtanból Ötös A magyar nyelvtan érthetően kicsiknek és nagyoknak www.magyarnyelvtan.hu 1 Tartalom 1. Alapfogalmak...6 2. Szófajok...13 3. Névszó......14 4. Főnevek...16 5. Melléknevek...26
MAGYAR NYELVÉSZETI TÁRGYAK ISMERTETÉSE BA NYELVTECHNOLÓGIAI SZAKIRÁNY
MAGYAR NYELVÉSZETI TÁRGYAK ISMERTETÉSE BA NYELVTECHNOLÓGIAI SZAKIRÁNY Tantárgy neve: BBNMT00300 Fonetika 3 A tantárgy célja, hogy az egyetemi tanulmányaik kezdetén levő magyar szakos hallgatókat megismertesse
Adamikné Jászó Anna Hangay Zoltán Nyelvi elemzések kézikönyve. Mozaik Oktatási Stúdió. Szeged.
Hivatkozások Adamikné Jászó Anna Hangay Zoltán 1995. Nyelvi elemzések kézikönyve. Mozaik Oktatási Stúdió. Szeged. A. Jászó Anna (szerk.) 2004. A magyar nyelv könyve. Trezor Kiadó. Ágosoton Mihály 1971.
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer Váradi Tamás varadi@nytud.hu Vázlat A történet eddig Az INTEX rendszer A magyar modul Az INTEX korlátai premier előtt: NooJ konklúziók, további teendők
PÁRHUZAMOS IGEI SZERKEZETEK
PÁRHUZAMOS IGEI SZERKEZETEK KÖZVETLEN KINYERÉSE PÁRHUZAMOS KORPUSZBÓL Sass Bálint sass.balint@nytud.hu MTA Nyelvtudományi Intézet, Budapest MSZNY2010 Szeged, 2010. december 2-3. 1 EGYNYELVŰ IGEI SZERKEZETEK
Francia nyelv középhaladóknak
Francia nyelv középhaladóknak Próbalecke Az ELO Könyvkiadó Kft. Francia nyelv középhaladóknak tananyagsorozatát azoknak ajánljuk, akik az ELO Könyvkiadó Kft. Francia nyelv kezdőknek tananyagsorozatát már
Tanulmányok a középmagyar kor mondattana köréből
Tanulmányok a középmagyar kor mondattana köréből 1 2 3 Segédkönyvek a nyelvészet tanulmányozásához 89. Tanulmányok a középmagyar kor mondattana köréből Szerkesztette Haader Lea Horváth László Tinta könyvkiadó
MINIMÁLIS KÖVETELMÉNYEK NÉMET NYELVBŐL
MINIMÁLIS KÖVETELMÉNYEK NÉMET NYELVBŐL Ahhoz, hogy a tanuló elégséges osztályzatot szerezzen, az alábbi tudásanyag 60 százalékát el kell sajátítania. Vitás esetben vagy osztályozó vizsgánál az alábbi anyagot
Dokumentumformátumok Jelölő nyelvek XML XML. Sass Bálint sass@digitus.itk.ppke.hu. Bevezetés a nyelvtechnológiába 2. gyakorlat 2007. szeptember 20.
XML Sass Bálint sass@digitus.itk.ppke.hu Bevezetés a nyelvtechnológiába 2. gyakorlat 2007. szeptember 20. 1 DOKUMENTUMFORMÁTUMOK 2 JELÖLŐ NYELVEK 3 XML 1 DOKUMENTUMFORMÁTUMOK 2 JELÖLŐ NYELVEK 3 XML DOKUMENTUMFORMÁTUMOK
KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN
KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN Budapest, 2014 TARTALOM ELŐSZÓ...9 1. BEVEZETÉS...15 1.1. A vizsgálat tárgya...17 1.2. Célkitűzések és kutatási kérdések...18 1.3. A vizsgált nyelvek, műfaj
Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint
MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. október 05. Visszajelzés a beadott házi feladatokkal kapcsolatban Melléknevek, névmások, elöljárók: az elsőéves tananyag
2
1 SZÉKELY GÁBOR EGY SAJÁTOS NYELVI JELENSÉG, A FOKOZÁS 2 3 SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ 66. SZÉKELY GÁBOR EGY SAJÁTOS NYELVI JELENSÉG, A FOKOZÁS TINTA KÖNYVKIADÓ BUDAPEST, 2007 4 KÖNYVEM
Osztályozóvizsga 1/13. K ANGOL NYELV
Osztályozóvizsga 1/13. K ANGOL NYELV A. Ruházati Vásárlási szituációk az alábbi témakörökben: 1. Méteráru üzlet 2. Férfi cipők 3. Női cipők 4. Rövidáruk / kemény rövidáru 5. Rövidáruk/ puha rövidáru 6.
11. fejezet A logika nyelvtana. Már az első fejezetben felmerült, hogy a logika nyelvtana nem egyezik meg a szokásos értelemben vett nyelvtannal.
11. fejezet A logika nyelvtana Már az első fejezetben felmerült, hogy a logika nyelvtana nem egyezik meg a szokásos értelemben vett nyelvtannal. A #11.1 Néhány lány énekel és a #11.2 Kati énekel mondatok
HunGram 2.0 és a HG-2 Treebank Nyelvtanfejlesztés, implementáció és korpuszépítés
HunGram 2.0 és a HG-2 Treebank Nyelvtanfejlesztés, implementáció és korpuszépítés Laczkó Tibor & Rákosi György Debreceni Egyetem, Angol Nyelvészeti Tanszék Korpuszok és nyelvtechnológiai eszközök a bölcsészet-
MagyarOK 1. tanmenetek
Szita Szilvia Pelcz Katalin MagyarOK 1. tanmenetek A1.2. Célnyelvi (magyar) környezet Egy 120 órás tanfolyam 61 120. órájára Szita Szilvia és Pelcz Katalin, www.magyar-ok.hu 1 Az alábbiakban a MagyarOK
/10/07 7:42 AM Page 1. A mai magyar formális nyelvtudomány mûhelyei
41287 3/10/07 7:42 AM Page 1 A mai magyar formális nyelvtudomány mûhelyei 1 ❿ 41287 3/10/07 7:42 AM Page 2 2 ❿ 41287 3/10/07 7:42 AM Page 3 A mai magyar formális nyelvtudomány mûhelyei Szerkesztette: Alberti
Bevezetés az e-magyar programcsomag használatába
Bevezetés az e-magyar programcsomag használatába Vadász Noémi 2019. február 7. MTA Nyelvtudományi Intézet vadasz.noemi@nytud.mta.hu Az előadás felépítése 1. szövegelemzés számítógéppel elemzési lépések
LOGIKA ÉS ÉRVELÉSTECHNIKA
LOGIKA ÉS ÉRVELÉSTECHNIKA ELTE TáTK Közgazdaságtudományi Tanszék Logika és érveléstechnika NULLADREND LOGIKA 1. Készítette: Szakmai felel s: 2011. február Készült a következ m felhasználásával: Ruzsa
Tartalom. 19 Jelen idő 19 Múlt idő 28 Jővő idő 37. Feltételes mód 41 Jelen idő 41 Múlt idő 43 Használata 44 Gyakorlatok 46
Tartalom Az ige alakjai 5 A., t' r za anyt es a argyas ragozas 6 K.. Jeen tö o mo'd 19 Jelen idő 19 Múlt idő 28 Jővő idő 37 Feltételes mód 41 Jelen idő 41 Múlt idő 43 Használata 44 Gyakorlatok 46 Felszólító
Intelligens elektronikus szótár és lexikai adatbázis
Intelligens elektronikus szótár és lexikai adatbázis IHM-ITEM 48/2002 Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés a jelenlegi helyzet: nincs az informatikai
Segédanyagok. Formális nyelvek a gyakorlatban. Szintaktikai helyesség. Fordítóprogramok. Formális nyelvek, 1. gyakorlat
Formális nyelvek a gyakorlatban Formális nyelvek, 1 gyakorlat Segédanyagok Célja: A programozási nyelvek szintaxisának leírására használatos eszközök, módszerek bemutatása Fogalmak: BNF, szabály, levezethető,
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.
FŐNÉVI VONZATOK A MAGYAR NYELVBEN
FŐNÉVI VONZATOK A MAGYAR NYELVBEN A doktori értekezés tézisei írta Kiss Margit Budapest 2005 I. Az értekezés témája, célja A vonzatosság kérdése régóta foglalkoztatja a nyelvtudományt. Már az 1800-as évek
dr.xlsx A programról Szövegműveletekhez használható függvények
dr.xlsx A programról A CD struktúrája A CD 9 munkafüzetben mutatja be a Microsoft Excel 2003, 2007 és 2010 függvényeit. Az egyes munkafüzetek a "tartalom" munkafüzetből érhetők el a munkafüzet nevére kattintással.
. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6.
Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László MTA/ELTE Elméleti nyelvészet kihelyezett tanszék MTA Nyelvtudományi Intézet kalmanlaszlo@nytudmtahu 2014 március 6 Kálmán László
Kijelentéslogika I. 2004. szeptember 24.
Kijelentéslogika I. 2004. szeptember 24. Funktorok A természetesnyelvi mondatok gyakran összetettek: további mondatokból, végső soron pedig atomi mondatokból épülnek fel. Az összetevő mondatokat mondatkonnektívumok
MagyarOK 1. tanmenetek
Szita Szilvia Pelcz Katalin MagyarOK 1. tanmenetek A1.2. Forrásnyelvi környezetben (külföldön) Egy 96 órás tanfolyam 49 96. órájára Szita Szilvia és Pelcz Katalin, www.magyar-ok.hu 1 Az alábbiakban a MagyarOK
A tudásszint mérésének és mérhetőségének egy lehetőségéről
HEGEDŰS RITA A tudásszint mérésének és mérhetőségének egy lehetőségéről A magyar nyelv "társtalanságából" eredő elszigeteltsége, nehézsége, bonyolultsága, sőt: megtanulhatatlansága a nagyszámú magyarul
Az adatbázis-alapú rendszerek tervezésének alapvető része az adatok modellezése. Ez legtöbbször két fázisban zajlik:
2. gyakorlat Az adatbázis-alapú rendszerek tervezésének alapvető része az adatok modellezése. Ez legtöbbször két fázisban zajlik: Egyed-kapcsolat diagram szemléletes ábrázolás Relációs adatbázis séma implementáció-közeli
Ungarisch. Grammatische Strukturen/lexikalische Einheiten Nével : Határozott, határozatlan
Ungarisch Die Zuordnung der grammatischen Strukturen und lexikalischen Einheiten zu den Funktionen ist exemplarisch zu verstehen. Die angeführten Strukturen werden auch in anderen Zusammenhängen auftreten
középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő
Nyelvtan Nyelvi jelek o szavak (lexéma o szóelem (morféma: szótő és toldalék) o tovább bonthatók fonémákra (jelelemek) Nyelv 3 szint o hangok o szavak o mondatok o nyelvtan szintek egymásra épülésének
MSc SZINTŰ MŰSZAKI SZAKFORDÍTÓ KÉPZÉS
MSc SZINTŰ MŰSZAKI SZAKFORDÍTÓ KÉPZÉS I. A képzés célja: A mérnöki munka során felmerülő elméleti és gyakorlati problémák megoldásához nélkülözhetetlen idegen nyelvi készségek fejlesztése valamint olyan
Információkereső tezaurusz
Információkereső tezaurusz a magyar leíró szófajtan köréből Bevezető a tezauruszkészítésről. Az ige mediális ige M: Történést, állapotot kifejező ige. H középige F ige A alanytalan ige fakultatív alanyú
Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben
Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola domotor.andrea@itk.ppke.hu Kivonat: A kutatás annak lehetőségeit vizsgálja,
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2014. szeptember 10. Informatikusviccek Az informatikus felesége elküldi a férjét a boltba: - Hozzál margarint, és ha van
Kognitív nyelvészet. Kognitív szemantika Kognitív grammatika
Kognitív nyelvészet Kognitív szemantika Kognitív grammatika Charles Fillmore Leonard Talmy Ronald Langacker George Lakoff Adele Goldberg A formalista nyelvészet és kognitív nyelvészet céljai Formalista,
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2014. szeptember 24. Főnevek, melléknevek, névmások: az elsőéves tananyag ismétlése Tanulság és figyelmeztetés Szintaxis:
HELYI TANTERV NÉMET NYELV. I. idegen nyelv. 4. évfolyam 6. évfolyam 8. évfolyam 10. évfolyam 12. évfolyam. nem A1 A2 B1 mínusz B1 megadható
HELYI TANTERV NÉMET NYELV I. idegen nyelv Első idegen nyelv 4. évfolyam 6. évfolyam 8. évfolyam 10. évfolyam 12. évfolyam KERszintben nem A1 A2 B1 mínusz B1 megadható TANTÁRGYI ÓRASZÁMOK 9. évf. 10. évf.
Zárójelentés a K számú OTKA-projektről
Zárójelentés a K 72983 számú OTKA-projektről Jelentésünket az éves időközi szakmai beszámolókra alapozva, azok lényegi részeit kiemelve és röviden kommentálva állítjuk össze: kutatási ünk és eredményeink
Osztályozó vizsga Angol mint első idegen nyelv
Osztályozó vizsga Angol mint első idegen nyelv Az írásbeli szóbeli vizsga 50-50 %-os arányban számítanak be a vizsga eredményébe. Tanév végi osztályozó vizsgán az éves munka és a vizsgaeredmény 75-25 %-ban
JAVÍTÓVIZSGA TÉMAKÖRÖK NÉMET NYELVBŐL Összeállította: Bischofné Németh Katalin 9. ÉVFOLYAM 10. ÉVFOLYAM
JAVÍTÓVIZSGA TÉMAKÖRÖK NÉMET NYELVBŐL Összeállította: Bischofné Németh Katalin 9. ÉVFOLYAM Tankönyv és munkafüzet: Delfin I., Hueber 1-4. fejezet Formanyomtatvány kitöltése Pályázat írása Levél- és képeslapírás
Lokalitás és argumentumöröklés
SZEGEDI TUDOMÁNYEGYETEM BÖLCSÉSZETTUDOMÁNYI KAR DOKTORI DISSZERTÁCIÓ Szécsényi Tibor Lokalitás és argumentumöröklés A magyar infinitívuszi szerkezetek leírása HPSG keretben NYELVTUDOMÁNYI DOKTORI ISKOLA
Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon
Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon Ligeti-Nagy Noémi Pázmány Doktori Konferencia Budapest, 2016. február 5. Háttér Performancia-alapú elemzés néhány kulcsmotívuma:
Ismeretlen kifejezések és a szófaji egyértelm sítés
Szeged, 2010. december 2 3. 275 Ismeretlen kifejezések és a szófaji egyértelm sítés Zsibrita János 1, Vincze Veronika 1, Farkas Richárd 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport Szeged,