Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.

Hasonló dokumentumok
Klasszikus héber nyelv 4.: Szintaxis

É Á Á Ö Á

ö ő ü ö ő ő ü ü ő ő ő ü ö ü ü ő ú ő ő ő ü ő ő ő ő ő ú ő ő ü ő ő ő ü ö ü ú ő ő ő ő ü ü ő ő ú

É É Ö

Klasszikus héber nyelv 4.: Szintaxis

ó Ó ú ó ó ó Á ó ó ó Á ó ó ó ó Á ó ú ó ó ó

ú Ó ú ú ú ú ú ú ú É Á

Klasszikus héber nyelv 4.: Szintaxis

ű ő ő ő

ü ü Ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü É ü ü

Á ó ó ó Ü Ü ó ó Ü ó ó ú ú ó ó Ü ó ó ó Ü ó ó

Ú ű É ű ű Ü Ü ű ű Ú É ű ű Ü ű ű ű ű ű ű ű Ú ű ű

Á Ü É Ü Ú Ü É

ű Ö ű Ú ű ű ű Á ű

Á Ó ű ű Á É ű ű ű ű Ú Ú

ű Ú ű ű É Ú ű ű

Á Á ő ő Ö ő ő ö É ö ő ö ő ő ö ő ő ö ő ő ü ö

ü ú ú ü ú ú ú ú

Ó Ó ö ú ö ö ö ö ü ú ú ö ö ö ú ú ö ö ö ú ú ú ű ö ö ú ö ü ö ö ö ö ü ú Á ö ü Á ö ö ö ö ö ö

ű ű ű Ú Ú Á ű Ö ű ű Ú Ő É

Ó é é Ó Ó ő ű Ó Ö ü Ó é Ó ő Ó Á Ö é Ö Ó Ó é Ó Ó Ó Ó ú Ó Ó Ó Ó ű Ö Ó Ó Ó é Ó Ó ö Ö Ó Ö Ö Ó Ó Ó é ö Ö é é Ü Ó Ö Ó é Ó é ö Ó Ú Ó ő Ö Ó é é Ö ú Ó Ö ö ű ő

Á Ö Ö Ö Ö ú ú Ö Ö Ó Ó ú ú Ü ú Ó Ö Ö Ü Ó Ö Ö Á Ó ú ú ú ű Ö Ö Ö Ö Á Ó Ö Ó ú ú Ö

ö ö Á Á Ó Á ö ö ö ö ö ú ű ö ö Á Á ű ű ö ö ö ö ű

ó ő ő ó ő ö ő ő ó ó ó ö ő ó ó ó ö ő ó ő ő ö Ö ő ö ó ő ö ő ő ú ö ö ü ö ó ö ö ö ő ö ö Ö ú ü ó ü ő ő ő ő ó ő ü ó ü ö ő ö ó ő ö ő ö ü ö ü ő ö ö ó ö ő ő ö

Á ű ó ó

ú ö ö ö ö ö ö Á ö ö ö á á á ű Ü ű ö ö Á á Á

é ü ó ö é Ö é ü é é ó ö é ü ü é é ó ó ó é Á é é ü ó é ó ó é ö ö ö é é ü é ü é é ö ü ü é ó é é é é é é ö é é é é é é ö é ó ö ü é é é ü é é ó é ü ó ö é

Ó Ó ó ö ó

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

ü ű í ú ú ü ü ü ű ü ű ü ű ü ű ü í ü ű í í ü í í í í í ü í ű

Magyar nyelv és irodalom Fejlesztési terv

Információkereső tezaurusz

Klasszikus héber nyelv 4.: Szintaxis

A szóképzés. A szóalkotásnak az a módja, amikor a szótőhöz egy képző hozzájárulásával új szó jön létre.

ú ű ú ú ű ú ű ű ú ű ú ű Á ű ű Á ű ű ú ú ú ú ú ú ű ú ú ú ú ú ú ú ú

ő ő Ű ü ú ú Ú ü ű ő ő ő ő Á Á Í ü É ő ő ő ő ő É ő ú ú ú ő Á Ö ő

É Ö Á Í Á Ó Ö ü

É ú É ö ö ű ö ö ö ú ú ú ű ű ú ö ű ö ű ű ü ö ö ü ű ö ü ö ö ö ö ú ü ö ö ö ú ö ö ú ö ö ú ü ú ú ú ű ü ö ö ű ú ű ű ü ö ű ö ö ö ű ú ö ö ü ú ü ö ö ö ü ú ö ű

ő ő ő ő ú É ü ú ú ű ú ű ő ő ő ő Á Á ü ő É É É É É É Á Ú Á Á ő ő ő ő ő É Á Á Á ő ő ő Á ü ő ő ü

ú ú ö ö ü ü ü ü ű ü ü

Ö Ö ű ű ű Ú Ú ű ű ű Ú ű

Ü ű ö Á Ü ü ö ö

ú ú ü ü Á ú ú ü ű ű ú ü ü ü ü

É ő ő ű ú Á ő Á ő ű ő ő ő ő ő ő ő ő ű ú ű ű ő ő ő ű

Í Ú É ő ő ú ö Ö ú ú ú ö ö ú ö ö ű ö ő ö ö ú ö ő ő ö ö ö ő ő ú ő ú ö ö ö ú ö ö ú ő ö ú ö ű ö ő Ó ő Á ö ő ö ö

Ö Ö ú

ü ö ú ö ú ü ö ü Á Ó ö ö ö ö ú ü ú ü ü ú ú ö ö ü ü ú ü ü ö ö ű ö ü ü ü ü ö ö

Á Á Ö Ö Ü É Ö É É Á Ú É É É É Á Á Ö Ö Ő

ú ű ű É ü ű ü ű ű í ü í ő í Ü ő ő ü ú Í ő ő í ú ü ü ő ü

Ó ű ű Á ú ű ű ú ú ú ű ű É ú É Á Á ú ű Ü Á Ü Á ű Ö Ú É Ó É Á Á Á Ű Á úá Á Ö É Ö É Ü

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

Ö Ö Ú Ó Ö ű Ő Ő ű ű Ü Ő Ó Ő

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

ű Á ü ő ö í ö ö ő ő ő ő ö

ü ő ő ü ü ő ő ű í í ű ő ő ő ü ő ő í í ő ő ő ő ő ő ü ü í ő Ö ő ü í ő ü í í ő ü ő í ő ő í í ő ü ü í ő ü í ő í ő í ő ü í ő í ü í í ő

Í ö ö ű ú ö ö Í ö ü ö ü

ő ö ő ú ő ö ö ő ó ő ö ü ú ö ö ó ő ö ü ó ó ó ó ő ő ő ó ó ú ő ü ő ö ö ó ü ö ö ő ű ö ö ő ú ú ó ö ő ű ö ó

é ú é é é é é é é é é é é é ú é ö é é é ö Ő é é é ú é é é é é é é é ö é é é ö é Ö é é ö é ö é é é ű é ö ö é ö é é ö ö é é ö ö é ö é Ö é ú é é é é é é

ő ő ő ő ő ő ú ő ü Á ü ü ő ő ő ő ő ő ő ő ő ő Ö Ó ő ő ő Ö ő ő ő


ö ö ö ö ö ö ö ü ö ü ö ű ö ú ü ű ö ü Í ö ú ü ü ű ö ú ü Á ü

ó ú ú ü ú ő ó ő ő ó ó ó ö ó ü ő ó ő ö ü ü ó ö ő É ó ö ö ö ó ó ö ü ü ö ü ó ó ő ó ü ó ü ü ö ö É ú ó ó ö ú ö ü ü ó ó ó ü Á ö ö ü ó ö ó ö ö ö ö ó ó ö ó ó

É Í ü ú É ü ő ő ő ő ú ő ú ü ü ő ü ú ü ű ú ú ü ü Í ü ű ő ő É ő


ú Ü Í ú ú ú ú ú ú

ü É ö É É ö ö ö ü ö ö Á ű ö ű ű ű Á Í ö ö Ó ö

ű ű ű ű Ü ű ű ű Ó ű Á ű Á Ö É É É Á É É É É Ü Á Á Á ű

í Ó ó ó í ó ó ó ő í ó ó ó ó

ű í ú ü ü ü ü ü Ó í ü í í í É Á

Í Ó ü ü í ü ü ü í Í í É í í Í Í ü ü ü í Í ü

Í Í Ó ű Ü Ó Ó Ü ü Ö Í Ü Í Í ú Ö Ó Í ú ú Ö Ó É Í ű ú

ö ö ó ú ö ö ú ü ó ö ö Í ö ö ö ü ó ö ö ú ú ö ü ó ü ó ü ö ú ü ó ü ö ó Á Á ö ü ú ó ö ü ü ö ó ü ü Á ü ö ü ö ü ö ö ö ü ö ú ö ö ö ü ú ö ú ö ű ú ú ü ö ó ö ö

é ö é Ö é é ő í ó í é ő ö ú é ó é ő ü ü é ó ö é é ó é é ö é ő í é é ő é é ö é ű ö é í ó é é í ö í ó í ó é é ö ó í ó ó í ó é é ö ő í ó ó í ó ü é í ü

Í Í Í Ü Ó Ó Ö Á Ü Ü Ó Ü Ü Ó Ö Í É Ö

ú ü ü ú Ö ú ü ü ü ü ü ú ü ú ü ű Í ü ü ű ü ű Ó ü Ü ű ú ú Á ü ű ű ü ü Ö ü ű ü Í ü ü

É ö Ű ő ű ő ő ű ű

í ó ő í é ö ő é í ó é é ó é í é é í é í íí é é é í é ö é ő é ó ő ő é ö é Ö ü é ó ö ü ö ö é é é ő í ő í ő ö é ő ú é ö é é é í é é í é é ü é é ö é ó í é

í í ü í í í í í Ó ő ő í í í Ú ü Ú í í Ú ő ü Ú ü ő

ö ö Ö ó ó ö ó ó ó ü ö í ü ú ó ó í ö ö ö ó ö ü ú ó ü ö ü ö ö Ö ü ö ö Ö ó

Ü ü Ü Ö Ó ö ü ö Ó Ú Ó ü Ó ö ö Á ö ö ö ö ü

ő ö ő ű ó ö ó ű Í Ö Ö Á Í Ó Ö Ü É Ö Ö Ö Á Á Ö É Á Ö

í ü í ü ő ő ü Í ő ő ő ú í ő ő ö ö ö ű ü í ő ő í ú ö ö ú ő ő ú í ő í ő ö ö í ő ü ü í ő ö ü ü ú í í ü ő í ü Í í í í ö ő ö ü ő í ő ő ü ű ő ő í ő í í ő ő

ű ú ú Ö ó Ö ó ó ó Ö ű ó ű ű ü Á ó ó ó ó ü ó ü Ö ó ó ó Ö ű ű ü Ö ű Á ú ú ú ó ű í í Ő ú Á É Ö í ó ü ű í ó ű ó Ö ú Ő ú ó í ú ó

1. Mik a szófajok elkülönítésének általánosan elfogadott három szempontja? 2. Töltsd ki a táblázatot az alapszófajok felsorolásával!

ö ö ö Ö ö ú Ö í Ö ű ö í Ö í ö ü ö í ú Ö Ö ö í ű ö ö í ö ö Ő ö í ü ö ö í Ö ö ö í ö í Ő í ű ű í Ö Ó í ö ö ö ö Ö Ö ö í ü ö ö Ö í ü Ö ö í ö ö ö ö ö Ö ö í

ö ü ü ú ó í ó ü ú ö ó ű ö ó ö í ó ö í ö ű ö ó Ú ú ö ü É ó í ö Ó Á í ó í í Ú ö ú ö ű ü ó

ö Ó ű ö ó í ó ü ö Ó ó í ö ö ó Ö ó ö í ó í ó Á í ó Á Á Ő ú ü ó Í ü ú ü

Ö ő ü Ö Ö Ő ü ő Ö Ö ü ű Á Í Ö ű ü ő ő ő Ö ü ü ő ő ő Ü ü ő ő ő ü ő ő ü ü

ű ú ü ü ü Í ü ö ü ö ü ö ü Ó ü ö ü ö ö ü ű ű ú ü ö ö ü Ó ö ű ü ö ú ö ö ü ü ű ü ü ö ö ü ü ú ö ö ü ü ú ü

Ü

Ö Ö ö Ó Ó Ó Ó Ü ú ü Ű Ö Ö Ö ö Ü ö Í ü ű

É Í Á Á É Ü Ó É É É É Í Ó Ó Ő Á Á É Á É É É É Á É É Á Á É É Á É Í

ó É ó í ó ó í í ö í ó í ö ö ö ü ö ó ó ó ü ú ö ü ó ó ö ö ü ü ü ö ö ó ö í ó ű Ü ó í ú í ö í ö í Í ó ó í í ö ü ö ö í ö í ö ö ö ü ó í ö ö ó í ú ü ó ö

í ó í ó ó ó í í ü ú í ú ó ó ü ü í ó ü ú ó ü í í ü ü ü ó í ü í ü ü í ü ü í ó ó ó í ó í ü ó í Á

ö ő ő ü ü Ó ü ö ű Á ő ő ö ő Á Ó ű ö ü ő ő ű

í í É í ó ó É ö í ó í ó í ó ó í ó í í ó ó ó í ö ö ö ö í í í ó ó ö ó

ó ö í í ü Ű Ö ó ó ű ö ü Í í í ö Ö Ó ö Ű Ö ú ó ó í í ű ö ö ö ö í ó ö ö í ö ű ö ű ö ö ö ö ö í ó Ö Ö ü ú ö ó ü ö Ö ű ö Ö ü ó ö ö ó ö ö Ó í ű ö ű ö ö ű í

ű ö ú ö ö ö ö í ű ö ö ö ű ö ö ö í ü ú í ű í ö í ú ű í ü ö ö ú ö í ö ű ú ü ö ö í ö ü ö ú ű ö ö ö í Á í ü í ö ü ö í ü ö Ő ü ö í ű ü ö í í í í í

Ö Ö Ö Ö Ö Á Ű É Ö Ö Ö

ű ú ó ó ü í Á Á ú ó ó ó ó ó ó ó ó ó ó ó ó ó ó í ó ü É ű ü ó í ü í í í í í ó í ü í í ó ó Á

Átírás:

Morfológia, szófaji egyértelműsítés Nyelvészet az informatikában informatika a nyelvészetben 2013. október 9.

Előző órán Morfológiai alapfogalmak Szóelemzések Ismeretlen szavak elemzése

Mai órán Szófajok Szófaji egyértelműsítés Mini morfológiai elemző készítése

Szófajok Szavak kategóriái Morfológiai, szintaktikai vagy szemantikai viselkedés alapján csoportok

Főnév (N) Szemantika: meghatározott fogalmat jelöl Morfológia: szám, eset, birtokviszonyok Szintaxis: alany, tárgy.

Ige (V) Szemantika: meghatározott fogalmat jelöl Morfológia: idő, mód, szám, személy, tárgy típusa Szintaxis: (tag)mondat fő eleme

Melléknév (ADJ) Szemantika: meghatározott fogalmat jelöl Morfológia: fokozás, szám, eset, birtokviszonyok Szintaxis: minőség/mennyiség/birtokos jelző, predikatív melléknév

Határozószó (ADV) Nem határozó!!! (vö. szintaxis) Szemantika: meghatározott fogalmat jelöl Morfológia: fokozás(?) Szintaxis: határozó

Számnév (NUM) Szemantika: meghatározott fogalmat jelöl Morfológia: sorszámnév, törtszámnév, szám, eset, birtokviszonyok Szintaxis: mennyiségjelző

Névmás (P) Szemantika: helyettesítő szófaj Morfológia: helyettesített szófajnak megfelelő Szintaxis: helyettesített szófajnak megfelelő

Egyéb szófajok Kötőszó, névelő, névutó, indulatszó Szemantika: fogalmi tartalom nélkül Morfológia: változatlan alakok (kivéve névutók) Szintaxis: szófajfüggő Kötőszó: kapcsolóelem Névutó: határozó Névelő: főnévhez tartozik

Nyílt és zárt szóosztályok Nyílt szóosztályok: Szabadon bővülhetnek Ige, főnév, melléknév (számnév?) Zárt szóosztályok: Nem bővülhetnek szabadon nyelvtani szavak Névelő, kötőszó, névmás

Milyen szófajú szó hiányzik? A ------ kínai állami hírügynökség jelentése közel ------ rendőr, ------ tűzoltó keresi reflektorok fénye ------ éjszaka is a magyar bázisugrót, ------ egy tűhegyes kövekkel teli -- ---- sziklafal fölött ------ szerencsétlenül ------ dél-kínai Hunan tartományban, a Csiangcsiacsie város közigazgatása alá tartozó Tienmen-hegy térségében. Kováts Viktor az ------ pénteken kezdődő világbajnokságra edzett más ------ együtt.

Milyen szófajú szó hiányzik? A Hszinhua kínai állami hírügynökség jelentése közel 200 rendőr, illetve tűzoltó keresi reflektorok fénye mellett éjszaka is a magyar bázisugrót, aki egy tűhegyes kövekkel teli meredek sziklafal fölött járt szerencsétlenül a dél-kínai Hunan tartományban, a Csiangcsiacsie város közigazgatása alá tartozó Tienmen-hegy térségében. Kováts Viktor az itt pénteken kezdődő világbajnokságra edzett más résztvevőkkel együtt.

Szófaji egyértelműsítés POS-tagging POS-tagger A morfológiai elemző által adott kódok közül kiválasztja az adott környezetbe illőt: Megcsípett, a szemét! V DET N-NOM Hol csípte meg? ADV V PREV A szemét. DET N-ACC

Morfológiailag többértelmű szavak A Szeged Korpusz szövegszavainak kb. 50%-a többértelmű Szófaji egyértelműsítés fontossága Várnak Népének Művére Faszék Vámpír

Példamondat Nyomok várnak, s rejtek mélyén vész les. Lehetséges elemzés: N: nyomok, várnak, s, rejtek, mélyén, vész, les V: nyomok, várnak, rejtek, vész, les Tényleges elemzés: N: nyomok, rejtek, mélyén, vész V: várnak, les

Morfológiai elemző gyakorlati példa -val/-vel toldalék Adatok: Ház házzal zal Kéz kézzel zel Fa fával val Eke ekével vel Sün sünnel nel Csoport csoporttal tal Kapu kapuval val Peti Petivel vel

Lépések Adatok csoportosítása Általánosítások Szabályok felírása Szabályok rendezése

1. Adatok csoportosítása Változik-e a rag v-je? Ház házzal Kéz kézzel Sün sünnel Csoport csoporttal Fa fával Eke ekével Kapu kapuval Peti Petivel

1. Adatok csoportosítása Milyen magánhangzó van a toldalékban? Ház házzal Fa fával Csoport csoporttal Kapu kapuval őz őzzel Eke ekével Sün sünnel Peti Petivel

2. Általánosítások Változik-e a rag v-je? mgh után nem msh után igen Milyen magánhangzó van a toldalékban? á, a, o, u után a e, i, ü, ő után e Pótló nyúlás: szóvégi a, e -> á, é

Szabályok Alapértelmezett (default érték választása): Legtöbb esetet leírja A defaulttól való eltérést könnyebb megfogalmazni, mint a defaultot Default: val szó végén msh v -> msh utolsó mgh e, ő, ü vagy i - val -> vel - szóvégi mgh e vagy a - e# ->é# - a# -> á#

Szabályok rendezése 3 szabály, 6 lehetséges sorrend kéz + val eke + val 1. msh-szabály kéz + zal eke + val 2. mgh-szabály kéz + zel eke + vel 3. pótló nyúlás kéz + zel eké + vel 1. mgh-szabály kéz + vel eke + vel 2. msh-szabály kéz + zel eke + vel 3. pótló nyúlás kéz + zel eké + vel

Szabályok rendezése kéz + val eke + val 1. msh-szabály kéz + zal eke + val 2. pótló nyúlás kéz + zal eké + vel 3. mgh-szabály kéz + zel eké + vel 1. mgh-szabály kéz + vel eke + vel 2. pótló nyúlás kéz + vel eké + vel 3. msh-szabály kéz + zel eké + vel

Szabályok rendezése kéz + val eke + val 1. pótló nyúlás kéz + val eké + val 2. msh-szabály kéz + zal eké + val 3. mgh-szabály kéz + zel eké + val 1. pótló nyúlás kéz + val eké + val 2. mgh-szabály kéz + vel eké + val 3. msh-szabály kéz + zel eké + val

Szabályok rendezése Msh-szabály és mgh-szabály sorrendje mindegy Pótló nyúlás a végére!

Házi feladat hoz/hez/höz toldalékolás szabályainak megalkotása az alábbi példák alapján egér, macska, eke, sün, fű, kalap, ördög, kapu, Peti Határidő: október 31.