Hunpars: mondattani elemző alkalmazás
|
|
- Adrián Gulyás
- 8 évvel ezelőtt
- Látták:
Átírás
1 Hunpars: mondattani elemző alkalmazás Babarczy Anna 1, Gábor Bálint 1, Hamp Gábor 2, Kárpáti András 3, Rung András 4, Szakadát István 2 1 Kognitív Tudományi Tanszék, BME, 1111 Budapest, Stoczek u. 2. {babarczy, bgabor}@cogsci.bme.hu 2 Szociológia és Kommunikáció Tanszék, BME, 1111 Budapest, Stoczek u. 2. hampg@eik.bme.hu, syi@axelero.hu 3 Klasszika-filológia Tanszék, PTE, 7624 Pécs, Ifjúság útja 6. karpati.andras@t-online.co.hu 4 Nyelvtudományi Intézet, MTA-ELTE, 1068 Budapest, Benczúr Gy. u. 33. runga@artitude.hu Kivonat: A Hunpars-projekt célja egy nyílt forráskódú elemző alkalmazás létrehozása, amely automatikusan végzi el bármilyen értelmezhető magyar mondat szintaktikai elemzését, konkrétan a mondatot alkotó szócsoportok és azok egymáshoz való viszonyának azonosítását. Az elemzőt egy többkomponensű rendszer részeként képzeljük el: a fejlesztés alatt álló modul bemenete egy előzőleg tokenizált mondat, amelyben a szavak morfológiai jegyeikkel felcímkézve szerepelnek. A szintaktikai elemzés szabályalapú: elsősorban egy szintaktikai kategóriákra épülő frázis-struktúra nyelvtan és kiegészítésként különböző lexikális tárak felhasználásával valósul meg. Az alkalmazást irodalmi, jogi, tudományosismeretterjesztő és sajtószövegből származó, kvázi-véletlenszerűen kiemelt mondatokon teszteltük. A tesztmondatok 72%-ára helyes elemzést kaptunk, további 11% elemzésének hibája szótári hiányosságra vezethető vissza. 1 Bevezetés A következőkben egy magyar nyelvre alkalmazható, mondattani elemző működését mutatjuk be. Az alkalmazás fejlesztése 2003-ban kezdődött, és eredetileg egy kérdésmegválaszoló rendszer 1 egyik moduljának készült. Később az elemző fejlesztése függetlenedett az eredeti projekttől, így ma már nem csak egyszerű kérdő mondatok, hanem bármilyen magyar nyelvű mondat elemzésére is használható. Azt a cél tűztük ki tehát, hogy létrehozzunk egy olyan nyílt forráskódú alkalmazást, amely magyar nyelvű természetes mondatok frázisainak és a frázisok közötti viszonyoknak az azonosítását végzi el automatikusan, kézi beavatkozás nélkül. A mondattani elemzés elsődleges feladata, hogy egy mondatban ne csak az összetartozó szócsoportokat azonosítsa, hanem meghatározza a viszonyokat az egyes szavak és a szavakból alkotott szerkezetek közt is. Ez a cél megvalósítható szigorúan 1 Szavak hálójában, Budapest Műszaki és Gazdaságtudományi Egyetem és Axelero Rt. (jelenleg T-Online Rt.) projekt NKFP és OM támogatással.
2 lexikalista alapon is [5], amikor a szintaktikai szerkezetet a szavak közötti kapcsolatok határozzák meg. Erre a megközelítésre példa a magyar GeLexi-projekt, ahol a szintaktikai elemzés alapja a gazdag szóleírásokat tartalmazó lexikon, amely megadja az egyes szavak kapcsolódási lehetőségeit [1]. Egy másik lehetséges és általunk is választott megközelítésben az elemző a frázisstruktúra nyelvtanokhoz hasonlóan a szavakat hierarchikus szerkezetekbe, frázisokba szervezi, és ezt követően a viszonyokat már ezek között a hierarchikus szerkezetek között határozza meg (a módszer áttekintésére lásd [2]). Például az (1) mondat szerkezetét a (2)-es zárójelezett változat jeleníti meg. 1. Az előadás után meglehetősen leverten álltam a lepusztult mozi előtt. 2. [[Az előadás] után] [meglehetősen [leverten]] [álltam] [a [lepusztult [mozi]]] előtt]. Minden frázisnak (zárójelezett egységnek) van feje, amely egy olyan szó, amely meghatározza a frázis viselkedését a mondatbeli hierarchia következő szintjén. A frázisstruktúra nyelvtanok kiegészíthetők lexikális függőségi információval [8]. A mondat szerkezetének helyes elemzéséhez szükségünk van az adott nyelv módosítóinak nyelvtanára is (például hogy az előtt névutó jelölhet egy szabadon előforduló hely- vagy időhatározót), és a régensek szubkategorizációs követelményeire, azaz hogy milyen argumentumai lehetnek egy adott régensnek, amelyek jelenlétében az adott szerkezet jól formált lesz. Egy ilyen típusú komplex nyelvtant meghatározhatunk lexikális és általánosított konstrukciós minták halmazával (Kálmán et al. 2003) vagy frázisstruktúrákat létrehozó szabályok egymás után való rendezésével és lexikális függőségi adattárak alkalmazásával. A Hunpars alkalmazás az utóbbi eljárást használja kisebb módosításokkal, mint azt a következőkben részletezzük. A megközelítésünkhöz hasonló, de csak szócsoportok azonosítására fókuszáló kutatások folynak a Nyelvtudományi Intézetben [9], [10], illetve ide sorolható a szintén szabályokat létrehozó, de automatikus módszereket alkalmazó HumorEsk [6] és Hócza András kutatásai [3]. 2 A Hunpars felépítése Projektünk nem törekszik arra, hogy egy adott elméletet minél hívebben adaptálva hozzon létre egy mondattani elemzőt. A elemző tervezésénél a nagy lefedettség elérése volt az elsődleges cél, azaz hogy egy viszonylag egyszerű szabályrendszer és néhány jól megválasztott algoritmus rugalmas kombinációjával minél többféle természetes nyelvi mondatot tudjunk elemezni, beleértve az esetleg egyedien formált, pontatlan vagy nem teljes mondatokat is. A Hunpars alkalmazás tehát három pilléren nyugszik: Frázis-struktúra nyelvtan
3 Lexikális adattárak Elemzési algoritmusok 2.1 A nyelvtan A nyelvtant kifejezetten a magyar nyelvre fejlesztettük, szem előtt tartva a nyelv gazdag morfológiai rendszerét és az ezzel összefüggésbe hozható variálható szó- és konsztituenssorrendet. A Hunparsnak szüksége van az elemezni kívánt mondat szavainak morfológiai elemzésére, ehhez a Hunmorph morfológiai elemzőt [7] használjuk. A Hunmorph által adott elemzés az egyes szavak szófaji besorolása mellett megadja a szóalakok teljes morfológiai jegyhalmazát is. A dolgoknak szóalakhoz így például a következő elemzés tartozik: dolog/noun<plur><cas<dat>>. Az elemző nyelvtana tehát elsősorban a morfológiai elemzés kimenetére és másodsorban a szavak lineáris elhelyezkedésére épül. A frázisok fejének megválasztásakor a lexikalista hagyományokat követjük. A mondattani elemzés során a zárójelezett frázisok alapértelmezésben öröklik a fej jegyeit, illetve egyes esetekben a frázis más alkotószavainak jegyei is öröklődhetnek. Így például a lepusztult mozi konstrukció nemcsak a tartalmi mozi fej jegyeit, hanem a névelő jegyeit is hordozza. Ha a mondatban szereplő szavak bármelyike morfológiailag többértelmű, akkor az adott mondatnak ennek megfelelően újabb változatait hozzuk létre, és ezek mindegyikére lefut az elemzés. Azaz, ha egy mondatban három kétértelmű és egy háromértelmű szó található, akkor az adott mondatnak akár 2 3 3, azaz 24 különböző elemzése is lehet. A többértelműségek nagy része egy statiszikai egyértelműsítő modullal kiszűrhető. Bár ilyen modul jelenleg nem áll rendelkezésünkre, néhány egyszerű előszűrő szabállyal is jelentősen sikerült csökkentenünk a többértelműségek számát. Az előszűrést követően megmaradt mondatváltozatokat a nyelvtan tovább szűri: a szabályrendszert ki nem elégítő változatokat elvetjük. 2.2 Lexikális adatbázisok A morfológiai jegyeken túl nyelvtanunk lexikális adatbázisokban található információkat is használ. Például melléknevek (egy fiára büszke anya, de *fiának büszke *fiával büszke), névutók (a házzal szembe, *a házra szembe, *a házba szembe) és a későbbiekben majd igék bővítményeire vonatkozó megszorításokat. A Hunpars használja továbbá az igék és igekötők lehetséges kombinációira vonatkozó információs tárat. 2.3 Elemzési algoritmusok Első lépésben az összetett mondatokat az elemző tagmondatokra bontja, melyeket külön elemez a továbbiakban, és a folyamat végén ezeket a részelemzéseket egyesíti. Az elemző algoritmus sorrendezett elemzési fázisokból áll. Mindegyik fázis szabályil-
4 lesztések egy sorozatát és/vagy egyéb algoritmikus lépéseket foglal magában, melyek egy adott frázistipus zárójelezését végzik. A szabályillesztések során a mondatokban jobbról-balra vagy balról-jobbra keresünk olyan szót, mely morfológiai jegyei alapján lehet a keresett frázis feje a mindenkori szabálynak megfelelően. A fej azonosítása után a nyelvtani szabály által meghatározott (kötelező vagy opcionális) egyéb elemeket a fejhez csatoljuk. Ha egy frázis elemeit megtaláltuk, az elemző tovább halad a tagmondatban. Miután az elemző egy fázison belül zárójelezte a lehetséges frázisokat, továbblép a következő fázisra. Az elemzés későbbi lépéseinél az előzőleg lezárt frázisokat egy egységnek kezeljük. A keresés irányát a nyelvtan határozza meg, ez a fázisok szabálycsoportjaiban különbözhet. A keresés irányának meghatározó szerepe van. Az irányváltoztatásnak bizonyos rekurzív tulajdonságokat mutató szerkezetek elemzésénél (pl. birtokos szerkezet) van kiemelt szerepe, amelyekben így elkerülhető volt, hogy vermet igénylő rekurzív szabályillesztéseket használjunk. Az elemző másik fontos eszköze beágyazott szerkezetek kezelésére a lezáratlan frázis funkció. A lezáratlan frázisok elemei az elemzés későbbi lépései során (speciális szabályok segítségével) még bővíthetők. A nyelvtan szükség esetén mint láttuk a lexikai adatbázisokhoz fordul. A Hunpars a következő elemzési fázisokat tartalmazza. Előfeldolgozás: morfológiai egyértelműsítés Előfeldolgozás: tagmondatokra bontás Az igei frázis és a tagmondat régensének felismerése Határozószói frázisok elemzése Számnévi frázisok elemzése Melléknévi frázisok elemzése Főnévi frázisok elemzése Névutói frázisok elemzése Bizonyos fázisokat követően egy mellérendelői szerkezeteket azonosító fázis is lefut az adott szinten lévő mellérendelések azonosítására. Ez a fázis akkor ismer fel egy mellérendelést, amikor a kötőszó előtt és után álló mellérendelő viszonyban frázisok már elemzésre kerültek. Például mellérendelés a piros labda és kék szalag kifejezésben csak a főnévi frázisok azonosítása után jöhet létre, míg a piros és kék labda esetében már a melléknévi szakasz után azonosítható. A fázisok lefutása során az azonosított fejekkel egy frázisba kerülnek módosítóik és bővítményeik egy hierarchikusan szervezett frázisstruktúrát alkotva. A fázisok jellegének szemléltetéséhez az alábbiakban bemutatjuk a szabályok leírására alkalmas formalizmus egy rövid kivonatát és példaként a melléknévi fázis leírását: A ::= B 1 B 2 B n
5 B 1 B 2 B n egymás után alkosson A frázist. A ::= { B 1 B 2 B n } B 1 B 2 B n bárhogy elhelyezkedve alkosson A frázist. Phase(<name>): group: A következő szabályok a <name> nevű elemzési fázishoz tartoznak. Egy szabálycsoport szabályai következnek, a következő group:-ig, vagy a következő fázis kezdetéig. Egy szabálycsoporton belüli szabályokat egy keresés során illeszhetünk, melynek iránya alapértelmezésben jobbról balra. Ha egy szabálycsoporton belül több szabálynak is ugyanaz a feje, és a mondat egy összetevője fejként mind a két szabályillesztést lehetővé tenné, akkor azt az illesztést kell végrehajtani, amelyik hosszabb frázist eredményez. A group kulcsszó után zárójelben a szabályok fejének kereséséről adhatunk meg paramétereket: group(left2right): a keresés balról jobbra haladjon group(unfinal): a fejet lezáratlan frázisokban keresse Szögletes zárójelben ([]) adhatunk meg a szabály használatára vonatkozó feltételeket, ezek lehetnek tokenszintűek vagy szabályszintűek. Tokenszintű esetén a token után rögtön szögletes zárójelben szerepel a rá vonatkozó feltétel, szabályszintű esetén a szabály után található egy több tokenre vonatkozó feltétel. A szabályszintű feltételben úgy hivatkozhatunk a tokenekre, hogy azokat egy / jellel és egy számmal megindexeljük. Pl.: tokenszintű: szabályszintű: AdjP ::= Adv[canModify(Adj)] Adj AdjP ::= Noun/1 Adj/2 [arg(1,2)] Alapértelmezésben a létrejövő frázis feje a jobb oldalon a legszélen lévő elem, egyéb esetben a fejet /HEAD-del jelölhetjük meg. A tokenek számának meghatározására a reguláris kifejezésekben megszokott jelöléseket használjuk. A szabály végén kettőspont után utalhatunk a szabályhasználat mikéntjére vagy következményeire. Ha nem szerepel semmi, akkor a szabályt nem illeszthetjük újra a létrejövő frázisra, ha :repeat szerepel, akkor rekurzívan többször is illeszthetjük, ha :break, akkor ezt és más a fázishoz vagy szabálycsoporthoz tartozó szabályt sem illeszthetünk többet, ha :error akkor az elemzésünk hibajelzéssel leáll. Ha :rel(<reláció>) szerepel a szabály után, akkor a megadott relációt a szabály alkalmazhatósága esetén igazra kell állítanunk. :call(<eljárás>) esetén a megadott a szabály alkalmazása után végre kell hajtanunk a megadott eljárást, :split esetén a szabály illesztésekor két elemzési variánst kell létrehozni: egyikben illesztjük a szabályt, másikban nem.
6 Ha a ::= jel bal oldalán nincs semmi, akkor illesztés esetén nem jön létre új frázis, de a szabályhasználat megadott következményeit végre kell hajtanunk. A melléknévi fázis rövid leírása: Phase('adj'): group: AdjP ::= Adj Az -ú/-ű végű melléknév előtt nem -ú/-ű végű melléknév állhat: AdjP ::= Adj[adjType!=_U] Adj[adjType==_U] :repeat Nem -ú/-ű végű előtt bármilyen melléknév állhat: AdjP ::= Adj Adj[adjType!=_U] :repeat Melléknevet módosító határozószó lehet melléknév előtt, de ez nem ismételhető szabály: AdjP ::= Adv[canModify(Adj)] Adj Ha a melléknév igenév, akkor bármilyen határozószó állhat előtte: AdjP ::= Adv Adj[adjType==PART] Főnév vagy melléknév vonzatkerettár ellenőrzéssel szerepelhet, lezáratlan frázist hoz létre, és ilyenkor más szabályt már nem alkalmazhatunk: AdjP/1 ::= Noun/2 Adj/3 [argcheck(2,3)] :unfinal(1) :break AdjP/1 ::= Num/2 Adj/3 [argcheck(2,3)] :unfinal(1) :break 3. Teszteredmények és továbblépési lehetőségek Mivel jelenleg nem áll rendelkezésre különféle szövegműfajokat jól reprezentáló, kézzel elemzett magyar nyelvi korpusz, az elemző tesztelése nem automatizálható, s ezért ezt kézzel kellett elvégeznünk. Erre a célra egymástól független, magyar mondatokból álló korpuszt állítottunk össze kvázi véletlenszerű módon különböző forrásokból. A források között kortárs irodalmi művek, sajtó-, tudományos-ismeretterjesztő és jogi szövegek szerepeltek. Mivel elemzőnk nyelvtana jelenleg nem terjed ki vonatkozói mellékmondatok elemzésére, így az azokat tartalmazó mondatokat eltávolítottuk a korpuszból. Az elemző a teljes korpusz elemzése során a bemeneti mondatokra illetve ha egy mondathoz több változat is szerepelt, azok mindegyikére az elemzés eredményét tartalmazó annotált text fájlt hoz létre. Az ellenőrzés megkönnyítésére az text fájlok mellett ezekből létrehozott, grafikusan megjelenített elemzési fákat állítottunk elő; az 1-es ábrán egy ilyen elemzési fa látható. Az ellenőrzést egy nyelvészeti
7 szaktudással rendelkező szakértő végezte, akinek nem volt alapos ismeretei a nyelvtan részleteiről és a Hunpars algoritmusairól. Az elemző működésének kvantitatív értékelésékor sikeresnek minősítettünk egy elemzést, amikor az elemző az elemzési folyamat során legalább egy mondatváltozatot nem utasított el. Azonban ezen elemzéseknek csak az a része minősült helyesnek, amelyet a kézi ellenőrzés során is hibátlannak találtunk. A teszt kvantitatív kiértékelését az 1-es táblázat mutatja be: 1. Táblázat: Tesztelési eredmények Bemeneti mondatok száma 309 Sikeres elemzések száma 600 Azon mondatok aránya, amelyeknek legalább egy 97% sikeres elemzése volt Azon mondatok aránya, amelyeknek legalább egy 72% helyes elemzése volt Az eredmények hibáinak kiértékelése során a helytelen elemzéseket a következő csoportokba soroltuk: Helytelen az elemzések lexikális adatbázisok hiányosságai vagy hibái miatt. Ide tartoznak a morfológiai elemző által fel nem ismert vagy rosszul besorolt szavak vagy olyan bővítmények, amelyek a lexikai adatbázisokban nem szerepeltek, illetve idiómák és tulajdonnevek fel nem ismeréséből fakadó hibák (a bemeneti mondatok 11%-a). Helytelen elemzések a nyelvtan hibájából kifolyólag (a bemeneti mondatok 17%-a). Helytelen elemzés implementációs hiba miatt (a bemeneti mondatok kevesebb mint 1%-a). Az elemző hibáinak elemzése azt mutatja, hogy teljesítménye jelentősen javítható lenne a lexikális adatbázisok, különösen a névutók lehetséges bővítménytárának pontosításával. További fejlődést a nyelvtan bővítésétől várunk. A hibák vizsgálata megmutatta, hogy a beágyazott igeneves szerkezetek okozzák a problémák nagy részét. Az alábbi példákban zárójelezéssel emeljük ki a nem helyesen elemzett szerkezeteket: 3. A férfi a szóbeszéd szerint [egy [a felesége telefonjában talált] SMS] miatt kezdett gyanakodni házastársára. 4. A legnagyobb hazai gyorséttermi lánc múlt vasárnaptól [az egyik fizetős wifiszolgáltatóval együttműködve] drótnélküli internettel csalogatja a fizetőképes keresletet. 5. A vipassana meditáció gyakorlása során a meditáló [[[[a testében megjelenő] pszicho-fizikai jelenségek] természetének] helyes megértésére] törekszik.
8 További problémát okoznak azok a többértelmű mondatok, amelyek esetében az anyanyelvi beszélő számára egyértelmű, hogy a lehetséges helyes elemzések közül melyiket kell kiválasztani. A Hunpars jelenleg nem tud szemantikai információt felhasználni. Erre mutat példát a 6-os mondat, amelyben a Hunpars helytelenül azonosította a megjelölt frázist: 6. [Az országos televízió főműsoridőben] legalább húsz perc, országos rádió legalább tizenöt perc önálló hírműsort köteles egybefüggően szolgáltatni. Hosszú távú tervünk, hogy az ilyen ilyen jellegű hibákat egy nagyméretű annotált korpuszon tanított, statisztikai módszereket használó komponens segítségével kerüljük el.
9 1. ábra Az élelem hiánya űzte a különböző közösségeket újabb és újabb területek felkutatására. mondat elemzésének grafikus megjelenítése
10 Bibliográfia 1. Alberti G., Kleiber J., Viszket A.: Főnévi GeLExi projekt: GEneratív LEXIkonon alapuló mondatelemzés. In: In: Magyar számítógépes nyelvészeti konferencia MSZNY2003. Szeged, december Konferenciakötet. SZTE, Szeged (2003) In: MSZNY (2003) Appelt, D.E., Israel D.: ANLP-97 Tutorial: Building information extraction systems. (1997). Available as 3. Hócza A.: Teljes mondatszintaxis tanulása és felismerése. In: In: Csendes D, Alexin Z. (eds.): II. Magyar Számítógépes Nyelvészeti Konferencia. Szeged, december SZTE, Szeged. (2004)MSZNY (2004) Kálmán L., Balázs L., Erdélyi Szabó M.: Tudásalapú természetesnyelv-feldolgozás. In: In: In: Magyar számítógépes nyelvészeti konferencia MSZNY2003. Szeged, december Konferenciakötet. SZTE, Szeged (2003) MSZNY (2003) Karlsson, F., Voutilainen, A., Heikkila, J., Anttila, A. (1995): Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin. 6. Kis B., Naszódi M., Prószéky G.: Komplex (magyar) szintaktikai elemző rendszer mint beágyazott rendszer. In: In: Magyar számítógépes nyelvészeti konferencia MSZNY2003. Szeged, december Konferenciakötet. SZTE, Szeged (2003) In: MSZNY (2003) Németh L., Halácsy P., Kornai A., Trón V.: Nyílt forráskódú morfológiai elemző. In: Csendes D, Alexin Z. (eds.): II. Magyar Számítógépes Nyelvészeti Konferencia. Szeged, december SZTE, Szeged. (2004) Sag, I., Wasow, T.: Syntactic Theory: A Formal Introduction. Stanford : CSLI Publications, (1999). 9. Váradi T., Gábor K.: A magyar Intex fejlesztésről. In: Csendes D, Alexin Z. (eds.): II. Magyar Számítógépes Nyelvészeti Konferencia. Szeged, december SZTE, Szeged. (2004) Váradi T.: Főnévi csoportok annotálása a CLaRK rendszerben. In: Magyar számítógépes nyelvészeti konferencia MSZNY2003. Szeged, december Konferenciakötet. SZTE, Szeged (2003)
Lexikon és nyelvtechnológia Földesi András /
Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.
Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola
IGEI VONZATKERETEK AZ MNSZ TAGMONDATAIBAN Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2006 Szeged, 2006.
Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu
VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer Váradi Tamás varadi@nytud.hu Vázlat A történet eddig Az INTEX rendszer A magyar modul Az INTEX korlátai premier előtt: NooJ konklúziók, további teendők
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
A Hunglish Korpusz és szótár
A Hunglish Korpusz és szótár Halácsy Péter 1, Kornai András 1, Németh László 1, Sass Bálint 2 Varga Dániel 1, Váradi Tamás 1 BME Média Oktató és Kutató Központ 1111 Budapest, Stoczek u. 2 {hp,nemeth,daniel}@mokk.bme.hu
A Mazsola KORPUSZLEKÉRDEZŐ
A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
Különírás-egybeírás automatikusan
Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia
VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
a Szeged FC Treebankben
Szeged, 2014. január 16 17. 67 Többszintű szintaktikai reprezentáció kialakítása a Szeged FC Treebankben Simkó Katalin Ilona 1, Vincze Veronika 2, Farkas Richárd 1 1 Szegedi Tudományegyetem, TTIK, Informatikai
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Témavezető: Prószéky Gábor Bevezetés Előfeldolgozó algoritmusok Napjaink
Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.
Morfológia, szófaji egyértelműsítés Nyelvészet az informatikában informatika a nyelvészetben 2013. október 9. Előző órán Morfológiai alapfogalmak Szóelemzések Ismeretlen szavak elemzése Mai órán Szófajok
A magyar létige problémái a számítógépes nyelvi elemzésben
A magyar létige problémái a számítógépes nyelvi elemzésben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor Komplex vizsga 2018. jún. 1. Létige:
Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint
ÉLŐ VAGY ÉLETTELEN? Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2007 Szeged, 2007. december 6 7. 1 KÉRDÉSFELVETÉS
Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged
Mazsola mindenkinek Sass Bálint MTA Nyelvtudományi Intézet 2018. január 18. MSZNY 2018, Szeged Példa http://corpus.nytud.hu/mazsola Lekérdezés: iszik + -t 2/15 Háttér adatbázis Ha a város a tárcáktól pénzt
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.
Az igekötők gépi annotálásának problémái Kalivoda Ágnes
Az igekötők gépi annotálásának problémái Kalivoda Ágnes Budapest, 2017. február 3. PPKE BTK Bevezetés Mi a probléma? Homográf szóalakok hibás szófaji címkét kaphatnak Mi a megoldás? Szabály alapú javítás
Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint
ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori Program
Magyar nyelvű néprajzi keresőrendszer
Szeged, 2013. január 7 8. 361 Magyar nyelvű néprajzi keresőrendszer Zsibrita János 1, Vincze Veronika 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport zsibrita@inf.u-szeged.hu 2 MTA-SZTE Mesterséges
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény
Igekötős szerkezetek a magyarban
Igekötős szerkezetek a magyarban Kalivoda Ágnes 2018. június 26., Budapest PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor A kutatás célja az igekötős szerkezetek
Magyar nyelvtan tanmenet 4. osztály
COMENIUS ANGOL-MAGYAR KÉT TANÍTÁSI NYELVŰ ÁLTALÁNOS ISKOLA Magyar nyelvtan tanmenet 4. osztály 2013/2014 Tanítók: Tóth Mária, Buruncz Nóra Tankönyvcsalád: Nemzeti Tankönyvkiadó Anyanyelvünk világa 4. osztály
Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.
Szintaxis: elemzések Nyelvészet az informatikában informatika a nyelvészetben 2013. november 6. Bevezetés Múlt óra: mondatrészek Mai óra: Szintaktikai reprezentációs elméletek Ágrajzok Problémás jelenségek
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2015. november 25. Témaválasztás házi dolgozatra (ע "ו ( igeragozás Ismétlés: Mondatok: Arnold & Choi 5. rész A mondat belső
Számítógépes nyelvészet
Számítógépes nyelvészet Babarczy Anna A MESTERSÉGES INTELLIGENCIA KEZDETEI Az intelligens gép Az embert régóta foglalkoztatja az intelligenciával rendelkező gép ötlete. Érdekes, és filozófiai szempontból
PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék
PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék Hasonlóságok és különbözőségek a nyelvben és a nyelvi nevelésben 2019. június 17 18. Program Pécs Program Június 17. hétfő 9:30
1. Mik a szófajok elkülönítésének általánosan elfogadott három szempontja? 2. Töltsd ki a táblázatot az alapszófajok felsorolásával!
Kedves 3.A osztály! A dolgozathoz való gyakorlás elősegítése érdekében küldök egy feladatsort, melyhez megoldókulcsot is csatoltam. Csütörtökön megtaláltok az iskolában, ha bármi kérdésetek van, tudunk
Ismeretlen kifejezések és a szófaji egyértelm sítés
Szeged, 2010. december 2 3. 275 Ismeretlen kifejezések és a szófaji egyértelm sítés Zsibrita János 1, Vincze Veronika 1, Farkas Richárd 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport Szeged,
Syllabus. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom
I. Intézmény neve Kar Szak Tantárgy megnevezése Syllabus Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom Mai magyar nyelv V. (Mondattan) A tantárgy típusa DF DD
Számítógépes Nyelvészet nyelvi adatbázisok és használatuk
Számítógépes Nyelvészet nyelvi adatbázisok és használatuk Mesterséges Intelligencia előadás http://www.inf.u-szeged.hu/hlt 5/3/2011 1 Tartalom A számítógépes szövegfeldolgozás célja Nyelvi adatbázisok
Tartalomjegyzék. Tartalomjegyzék
Tartalomjegyzék A főnév 11 Kis és nagy kezdőbetűk 11 A főnevek neme 12 A főnevek többes száma 13 Nem megszámlálható főnevek 15 Csak többes számban használatos főnevek 16 Foglalkozások 17 Címek, rangok,
PÁRHUZAMOS IGEI SZERKEZETEK
PÁRHUZAMOS IGEI SZERKEZETEK KÖZVETLEN KINYERÉSE PÁRHUZAMOS KORPUSZBÓL Sass Bálint sass.balint@nytud.hu MTA Nyelvtudományi Intézet, Budapest MSZNY2010 Szeged, 2010. december 2-3. 1 EGYNYELVŰ IGEI SZERKEZETEK
Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon
Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon Ligeti-Nagy Noémi Pázmány Doktori Konferencia Budapest, 2016. február 5. Háttér Performancia-alapú elemzés néhány kulcsmotívuma:
Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés
Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés Az egyszerű mondat szerkezete (É. Kiss 1992) a fő összetevők lehetséges sorrendje: Imre ismeri Erzsit. Erzsit ismeri Imre. Imre Erzsit ismeri.
LiLe projekt: Adatbázis mint dinamikus korpusz
LiLe projekt: Adatbázis mint dinamikus korpusz Bódis Zoltán, Kleiber Judit, Szilágyi Éva, Viszket Anita Pécsi Tudományegyetem Bölcsészettudományi Kar Nyelvtudományi Tanszék 7624 Pécs, Ifjúság útja 6.,
Domének közti hasonlóságok és különbségek a szófajok és szintaktikai viszonyok eloszlásában
182 IX. Magyar Számítógépes Nyelvészeti Konferencia Domének közti hasonlóságok és különbségek a szófajok és szintaktikai viszonyok eloszlásában Vincze Veronika 1,2 1 MTA-SZTE Mesterséges Intelligencia
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk
Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar 2018 2019-es tanév III. év, II. félév I. Általános információk A tantárgy neve: Szintaxis II. Kódja: LLM6124 (MA), LLM6224 (MB), LLM6024 (MM) Kreditszáma:
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2017. november 22. Visszajelzés a beadott házi feladatokkal és a negyedévi zh-val kapcsolatban igék ragozása ע "ו és ל "א
2
1 SZÉKELY GÁBOR EGY SAJÁTOS NYELVI JELENSÉG, A FOKOZÁS 2 3 SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ 66. SZÉKELY GÁBOR EGY SAJÁTOS NYELVI JELENSÉG, A FOKOZÁS TINTA KÖNYVKIADÓ BUDAPEST, 2007 4 KÖNYVEM
MORFOLÓGIAI FELÉPÍTÉS
A SZÓÖSSZETÉTEL SZÓÖSSZETÉTEL Két vagy több szóalak összekapcsolásával hozunk létre új lexémát Tudatos szóalkotás és véletlenszerű keletkezés Létrejöttüket nemcsak szintaktikai szabályok, hanem szemantikai,
Tartalomjegyzék. Tartalomjegyzék. A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17
A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17 A főnév szószerkezetekben 20 A névelő 21 Gyakorlatok 26 A hangsúlytalan mutató névmással álló főnév 28 A birtokos
BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA
BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció
Bevezetés az e-magyar programcsomag használatába
Bevezetés az e-magyar programcsomag használatába Vadász Noémi 2019. február 7. MTA Nyelvtudományi Intézet vadasz.noemi@nytud.mta.hu Az előadás felépítése 1. szövegelemzés számítógéppel elemzési lépések
Statisztikai alapú tulajdonnév-felismerő magyar nyelvre
Statisztikai alapú tulajdonnév-felismerő magyar nyelvre Farkas Richárd 1, Szarvas György 1 1 MTA-SZTE, Mesterséges Intelligencia Tanszéki Kutatócsoport, 6720 Szeged, Aradi vértanúk tere 1., Hungary, {rfarkas,
TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal. A határozott névelő: a gitár, az autó
1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal 2. fejezet TALÁLKOZÁS 17 38. oldal 3. fejezet ISMERKEDÉS AZ IRODÁBAN 39 56. oldal 4. fejezet A VÁROSBAN 57 82. oldal TÉMÁK Néhány nemzetközi szó Köszönések
Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése
Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése 1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Természetes nyelv feldolgozás 2 Tudásalapú információ-kereső rendszerek
Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13.
Szemantika: modalitás, kompozicionalitás Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13. Bevezetés Szemantika: jelentéssel foglalkozó nyelvészeti részterület Mi a jelentés?
Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben
Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola domotor.andrea@itk.ppke.hu Kivonat: A kutatás annak lehetőségeit vizsgálja,
. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6.
Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László MTA/ELTE Elméleti nyelvészet kihelyezett tanszék MTA Nyelvtudományi Intézet kalmanlaszlo@nytudmtahu 2014 március 6 Kálmán László
Bevezetés a nyelvtudományba. 5. Szintaxis
Bevezetés a nyelvtudományba 5. Szintaxis Gerstner Károly Magyar Nyelvészeti Tanszék Szintaxis Mondattan Hangok véges elemei a nyelvnek Szavak sok, de nyilván véges szám Mondatok végtelen sok Mi a mondat?
Tájékoztató. Használható segédeszköz: -
A 12/2013. (III. 29. NFM rendelet szakmai és vizsgakövetelménye alapján. Szakképesítés, azonosítószáma és megnevezése 54 481 06 Informatikai rendszerüzemeltető Tájékoztató A vizsgázó az első lapra írja
KÉPZÉSI PROGRAM C képzési kör C képzési kör
KÉPZÉSI PROGRAM C képzési kör C képzési kör 2 KÉPZÉSI PROGRAM C képzési kör C képzési kör 1. A képzési program 1.1. Megnevezése Angol C2 1 1 018 - KER C1/CS30 1.2. OKJ azonosító -- 1.3. Nyelvi programkövetelmény
A HUNGLISH PÁRHUZAMOS KORPUSZ
A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április
SZAKMAI ÖNÉLETRAJZ Farkas Judit
SZAKMAI ÖNÉLETRAJZ Farkas Judit I. Személyi adatok Név: Farkas Judit Születési hely, idő:, 1979. 04. 01. Anyja neve: Mohai Margit Judit Személyi igazolvány száma: 335364SA Munkahely: MTA Nyelvtudományi
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. november 16. Félévközi ZH 45 perc open-book, Arnold-Choi 2 3. Témaválasztás házi dolgozatra Témaválasztás házi dolgozatra
Bánsághi Anna anna.bansaghi@mamikon.net. 2014 Bánsághi Anna 1 of 31
IMPERATÍV PROGRAMOZÁS Bánsághi Anna anna.bansaghi@mamikon.net 9. ELŐADÁS - OOP TERVEZÉS 2014 Bánsághi Anna 1 of 31 TEMATIKA I. ALAPFOGALMAK, TUDOMÁNYTÖRTÉNET II. IMPERATÍV PROGRAMOZÁS Imperatív paradigma
DLM PULSE - PREDIKTÍV TÁRGYALÁS TÁMOGATÓ ALKALMAZÁS DLM PULSE
DLM PULSE - PREDIKTÍV TÁRGYALÁS TÁMOGATÓ ALKALMAZÁS DLM PULSE A DLM Pulse innovatív testbeszéd kiértékelő megoldás virtuális tanácsadóként segíti az értékesítő munkáját az üzleti tárgyalás során. Könnyen
PurePos: hatékony morfológiai egyértelműsítő modul
PurePos: hatékony morfológiai egyértelműsítő modul Orosz György PPKE ITK Interdiszciplináris Műszaki Tudományok Doktori Iskola oroszgy@itk.ppke.hu Kivonat: A szófaji egyértelműsítés a számítógépes nyelvfeldolgozás
A MAGYAR REKURZÍV BIRTOKOS SZERKEZET ELSAJÁTÍTÁSA A NEMZETKÖZI KUTATÁSOK TÜKRÉBEN
A MAGYAR REKURZÍV BIRTOKOS SZERKEZET ELSAJÁTÍTÁSA A NEMZETKÖZI KUTATÁSOK TÜKRÉBEN Tóth Ágnes Pázmány Péter Katolikus Egyetem MTA Nyelvtudományi Intézet KÍSÉRLETI HIPOTÉZIS, MEGVÁLASZOLANDÓ KÉRDÉSEK 1.
NN: Német nemzetiségi tagozat Tantárgyak és óraszámok Tantárgy 9. évfolyam. 10. évfolyam. 11. évfolyam Kötelező tantárgyak Magyar nyelv és irodalom 2
NN: Német nemzetiségi tagozat Tantárgyak és óraszámok Tantárgy 9. 10. 11. Kötelező tantárgyak Magyar nyelv és irodalom 2 12. 13. Irodalom 2 2 4 É 3 É Magyar nyelv 2 2 1 É 1 É Történelem és társadalomismeret
Vezetői információs rendszerek
Vezetői információs rendszerek Kiadott anyag: Vállalat és információk Elekes Edit, 2015. E-mail: elekes.edit@eng.unideb.hu Anyagok: eng.unideb.hu/userdir/vezetoi_inf_rd 1 A vállalat, mint információs rendszer
Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet 2.2.01.
Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet 2.2.01.1 (A) változatához Magyar nyelv és irodalom az általános iskolák 5 8. évfolyama
Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint
MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori
A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel. Rung András BME Fizikai Intézet
A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel Rung András BME Fizikai Intézet Alapelvek Produkció és megértés analógiás alapon szabályok helyett Az analógiás források kiválasztásához
Morfológiai újítások a Szeged Korpusz 2.5-ben
332 X. Magyar Számítógépes Nyelvészeti Konferencia Morfológiai újítások a Szeged Korpusz 2.5-ben Vincze Veronika 1,2, Varga Viktor 2, Simkó Katalin Ilona 2, Zsibrita János 2, Nagy Ágoston 2, Farkas Richárd
Java programozási nyelv
Java programozási nyelv 2. rész Vezérlő szerkezetek Nyugat-Magyarországi Egyetem Faipari Mérnöki Kar Informatikai Intézet Soós Sándor 2005. szeptember A Java programozási nyelv Soós Sándor 1/23 Tartalomjegyzék
EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ
EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ SZERKEZETEK KINYERÉSE KORPUSZBÓL Sass Bálint sass.balint@nytud.hu MTA Nyelvtudományi Intézet Budapest, 2011. június 16. 1 / 33 1 MAGYAR IGEI SZERKEZETEK Alapmodell és
A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok
A számítógépes nyelvészet elmélete és gyakorlata Korpuszok Mi a korpusz? A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye. A szövegeket valamilyen szempont szerint
Egy nyelvjárási szintaxisvizsgálat háttere és eredményei Őrség és Hetés területén
Egy nyelvjárási szintaxisvizsgálat háttere és eredményei Őrség és Hetés területén P P K E N Y D I 2 0 1 5. 0 2. 0 5. B U D A P E S T T E P E R I C S J Ó Z S E F 1 Áttekintés Adatközlők nem, kor és lakóhely
Klasszikus héber nyelv 4.: Szintaxis
Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2014. november 19. Témaválasztás házi dolgozatra Ismétlés: rendhagyó igék A mondat belső szerkezete Az óra céljai: Emlékeztető
Témaválasztás, kutatási kérdések, kutatásmódszertan
Témaválasztás, kutatási kérdések, kutatásmódszertan Dr. Dernóczy-Polyák Adrienn PhD egyetemi adjunktus, MMT dernoczy@sze.hu A projekt címe: Széchenyi István Egyetem minőségi kutatói utánpótlás nevelésének
Tantárgyi követelmények. Német nyelv. 9. oszt.
Tantárgyi követelmények Német nyelv 9. oszt. Témakörök: Bemutatkozás Az én családom Az én barátom Az én házam/lakásom Az én szobám Az én iskolám Lakóhely bemutatása Napirend Étkezési szokások Szabadidő
formalizmusa Egy morfológiai elemző kimeneti formalizmusának három, egymásnak gyakran
Általános célú morfológiai elemző kimeneti formalizmusa Kornai András, Rebrus Péter, Vajda Péter Halácsy Péter, Rung András, Trón Viktor Kivonat Az alábbi írásban egy a szóalakok morfoszintaktikai ábrázolására
A nyelvtani szabályok bemutatási módjai három magyar nyelvkönyvben
Anna Grzeszak, Damian Kaleta A nyelvtani szabályok bemutatási módjai három magyar nyelvkönyvben Dolgozatunk célja, hogy megnézzük, hogyan mutatják be a nyelvtani szabályokat az egyes magyar nyelvkönyvek.
A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete
A számítógépes nyelvészet elmélete és gyakorlata Formális nyelvek elmélete Nyelv Nyelvnek tekintem a mondatok valamely (véges vagy végtelen) halmazát; minden egyes mondat véges hosszúságú, és elemek véges
A melllérendelés és az ellipszis nyelvtana
1 Bánréti Zoltán A melllérendelés és az ellipszis nyelvtana a magyarban 2 3 Segédkönyvek a nyelvészet tanulmányozásához 75. Bánréti Zoltán A mellérendelés és az ellipszis nyelvtana a magyarban Tinta könyvkiadó
Kognitív nyelvészet. Kognitív szemantika Kognitív grammatika
Kognitív nyelvészet Kognitív szemantika Kognitív grammatika Charles Fillmore Leonard Talmy Ronald Langacker George Lakoff Adele Goldberg A formalista nyelvészet és kognitív nyelvészet céljai Formalista,
5. A kiterjesztési elv, nyelvi változók
5. A kiterjesztési elv, nyelvi változók Gépi intelligencia I. Fodor János BMF NIK IMRI NIMGI1MIEM Tartalomjegyzék I 1 A kiterjesztési elv 2 Nyelvi változók A kiterjesztési elv 237 A KITERJESZTÉSI ELV A
MagyarOK 1. tanmenetek
Szita Szilvia Pelcz Katalin MagyarOK 1. tanmenetek A1.2. Célnyelvi (magyar) környezet Egy 120 órás tanfolyam 61 120. órájára Szita Szilvia és Pelcz Katalin, www.magyar-ok.hu 1 Az alábbiakban a MagyarOK
Osztályozóvizsga 1/13. K ANGOL NYELV
Osztályozóvizsga 1/13. K ANGOL NYELV A. Ruházati Vásárlási szituációk az alábbi témakörökben: 1. Méteráru üzlet 2. Férfi cipők 3. Női cipők 4. Rövidáruk / kemény rövidáru 5. Rövidáruk/ puha rövidáru 6.
Nyelvi tudásra épülő fordítómemória
Nyelvi tudásra épülő fordítómemória Hodász Gábor 1, Grőbler Tamás 2 1 Pázmány Péter Katolikus Egyetem Információs Technológiai Kar Budapest hodasz@morphologic.hu 2 MorphoLogic Kft. Budapest grobler@morphologic.hu
Pathy Lívia Seper Judit AZ ÉN VILÁGOM
Pathy Lívia Seper Judit AZ ÉN VILÁGOM Pathy Lívia Seper Judith Az én világom Sodalitas Wien Bécs, 2012 Támogatta az Emberi Erőforrások Minisztériuma Budapest Lektorálta Kovátsné dr. Németh Mária Sántáné
Ember-gép rendszerek megbízhatóságának pszichológiai vizsgálata. A Rasmussen modell.
Ember-gép rendszerek megbízhatóságának pszichológiai vizsgálata. A Rasmussen modell. A bonyolult rendszerek működtetésének biztonsága egyre pontosabb, naprakész gondolati, beavatkozási sémákat igényel
A szótárról. 1. Mi ez?
A szótárról 1. Mi ez? A szótár, amit az olvasó a kezében tart, a leggyakoribb magyar igei szerkezeteket tartalmazza. Egynyelvű szótár explicit szótári értelmezések nélkül; a szerkezeteket, azok jelentését
Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül
Szeged, 2016. január 21-22. 251 Szabályalapú szintaktikai elemző szintaktikai szabályok nélkül Kovács Viktória 1, Simkó Katalin Ilona 2, Szécsényi Tibor 3 Szegedi Tudományegyetem, Bölcsészettudományi Kar
S atisztika 2. előadás
Statisztika 2. előadás 4. lépés Terepmunka vagy adatgyűjtés Kutatási módszerek osztályozása Kutatási módszer Feltáró kutatás Következtető kutatás Leíró kutatás Ok-okozati kutatás Keresztmetszeti kutatás
A vonzatosság alternatív felfogása
A vonzatosság alternatív felfogása Kálmán László MTA Nyelvtudományi Intézet MTA/ELTE Elméleti Nyelvészet Kihelyezett Tanszék kalman.laszlo@nytud.mta.hu 2018. július 5. Kálmán (MTA/ELTE) Vonzatok 2018.
Ahhoz, hogy mondatok halmazát érthetô egésszé, szöveggé rakd
III. SZÖVEGTAN 2. A SZÖVEG SZINTAKTIKAI KAPCSOLÓELEMEI Ahhoz, hogy mondatok halmazát érthetô egésszé, szöveggé rakd össze, szövegösszetartó elemekre van szükség. Amikor szöveget alkotsz, szinte önkéntelenül
Adatbázis rendszerek 6.. 6. 1.1. Definíciók:
Adatbázis Rendszerek Budapesti Műszaki és Gazdaságtudományi Egyetem Fotogrammetria és Térinformatika 6.1. Egyed relációs modell lényegi jellemzői 6.2. Egyed relációs ábrázolás 6.3. Az egyedtípus 6.4. A
Anaforafeloldás menet közben névmások egy pszicholingvisztikailag motivált elemzőben
192 XI. Alkalmazott Nyelvészeti Doktoranduszkonferencia Anaforafeloldás menet közben névmások egy pszicholingvisztikailag motivált elemzőben Vadász Noémi PPKE BTK Nyelvtudományi Doktori Iskola vadasz.noemi@itk.ppke.hu
Szemantikus világháló a BME-n
Szemantikus világháló a BME-n Lukácsy Gergely Szeredi Péter Budapesti Mûszaki és Gazdaságtudományi Egyetem ßÐÙ Ý Þ Ö Ð º Ñ º Ù Számítástudományi és Információelméleti Tanszék ➀ Szemantikus technológiák
Információkereső tezaurusz
Információkereső tezaurusz a magyar leíró szófajtan köréből Bevezető a tezauruszkészítésről. Az ige mediális ige M: Történést, állapotot kifejező ige. H középige F ige A alanytalan ige fakultatív alanyú
Szintaxis. Tóth Ildikó, PhD. Bevezetés a nyelvtudományba. 5. előadás 2009 Pázmány Péter Katolikus Egyetem
Szintaxis Tóth Ildikó, PhD. Bevezetés a nyelvtudományba 5. előadás 2009 Pázmány Péter Katolikus Egyetem 1 Végesből végtelen Hangok Szavak - véges sok - véges sok rekurzív szabályok (pl. beágyazás, mellérendelés)
Tartalomelemzés. Magyar nyelvű előfeldolgozási feladat szövegelemzéshez. Készítették: Halányi Ferenc Paróczi Zsombor Porohnavec József
Tartalomelemzés Magyar nyelvű előfeldolgozási feladat szövegelemzéshez Készítették: Fodor Bálint Halányi Ferenc Paróczi Zsombor Porohnavec József S02ZLO RQNG93 WRVU7O T715ZR TARTALOMJEGYZÉK Feladat ismertetése...
Tanulmányok a középmagyar kor mondattana köréből
Tanulmányok a középmagyar kor mondattana köréből 1 2 3 Segédkönyvek a nyelvészet tanulmányozásához 89. Tanulmányok a középmagyar kor mondattana köréből Szerkesztette Haader Lea Horváth László Tinta könyvkiadó
MagyarOK 1. tanmenetek
Szita Szilvia Pelcz Katalin MagyarOK 1. tanmenetek A1.2. Forrásnyelvi környezetben (külföldön) Egy 96 órás tanfolyam 49 96. órájára Szita Szilvia és Pelcz Katalin, www.magyar-ok.hu 1 Az alábbiakban a MagyarOK
Modell alapú tesztelés mobil környezetben
Modell alapú tesztelés mobil környezetben Micskei Zoltán Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék A terület behatárolása Testing is an activity performed
Milyen a még jobb Humor?
Milyen a még jobb Humor? Novák Attila 1 és M. Pintér Tibor 2 1 MorphoLogic Kft., 1126 Budapest, Orbánhegyi út 5., novak@morphologic.hu 2 MTA Nyelvtudományi Intézete, 1068 Budapest, Benczúr u 33., tpinter@nytud.hu
Az első és az egyetlen. Beszélő fordítógép, beszélő szótár, beszélő kifejezés gyűjtemény
Az első és az egyetlen Beszélő fordítógép, beszélő szótár, beszélő kifejezés gyűjtemény "Újdonság" Áttörés a szövegfordítás technológiájában! Nincs szükség internet kapcsoaltra! Angol-Magyar Beszélő