A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

Hasonló dokumentumok
Automaták és formális nyelvek

A számítógépes nyelvészet elmélete és gyakorlata. Automaták

A digitális számítás elmélete

Chomsky-féle hierarchia

Házi feladatok megoldása. Nyelvek felismerése. Házi feladatok megoldása. Házi feladatok megoldása. Formális nyelvek, 5. gyakorlat

ZH feladatok megoldásai

Formális nyelvek - 5.

Chomsky-féle hierarchia

Formális Nyelvek - 1. Előadás

A Formális nyelvek vizsga teljesítése. a) Normál A vizsgán 60 pont szerezhet, amely két 30 pontos részb l áll össze az alábbi módon:

A Számítástudomány alapjai

Feladatok. 6. A CYK algoritmus segítségével döntsük el, hogy aabbcc eleme-e a G = {a, b, c}, {S, A, B, C}, P, S nyelvtan által generált nyelvnek!

A Formális nyelvek vizsga teljesítése. a) Normál A vizsgán 60 pont szerezhet, amely két 30 pontos részb l áll össze az alábbi módon:

Formális Nyelvek - 1.

Házi feladatok megoldása. Nyelvtani transzformációk. Házi feladatok megoldása. Házi feladatok megoldása. Formális nyelvek, 6. gyakorlat.

ALGEBRAI NYELV- ÉS KÓDELMÉLET. Babcsányi István

Formális nyelvek és gépek (definíciós és tétel lista - 09/10/2)

Formális nyelvek és automaták vizsgához statisztikailag igazolt várható vizsgakérdések

Atomataelmélet: A Rabin Scott-automata


Formális nyelvek Második, javított kiadás

7. előadás Környezetfüggetlen nyelvtanok

Csempe átíró nyelvtanok

5. előadás Reguláris kifejezések, a reguláris nyelvek jellemzése 1.

Automaták mint elfogadók (akceptorok)

Feladatok. BNF,EBNF,szintaxisgráf

Segédanyagok. Formális nyelvek a gyakorlatban. Szintaktikai helyesség. Fordítóprogramok. Formális nyelvek, 1. gyakorlat

Formális nyelvek és automaták

Reguláris kifejezések 1.

A PÁRHUZAMOSSÁG VIZSGÁLATA A KLASSZIKUS FORMÁLIS NYELVEKHEZ KAPCSOLÓDÓAN. Nagy Benedek Debreceni Egyetem Informatikai Kar Számítógéptudományi Tanszék

MintaFeladatok 2.ZH Megoldások

1. előadás Matematikai és nyelvi alapok, Szintaktikai vizsgálat

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1

Házi feladatok megoldása. Nyelvek használata adatszerkezetek, képek leírására

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé.

Algoritmuselmélet 12. előadás

Nagy Gábor compalg.inf.elte.hu/ nagy

Logika és számításelmélet. 10. előadás

Matematika alapjai; Feladatok

Az angol nyelv logikája 6 MONDATSZERKEZET 1. A kijelentés

MintaFeladatok 1.ZH Megoldások

Diszkrét matematika 2. estis képzés

A Turing-gép. Formális nyelvek III.

A valós számok halmaza

MintaFeladatok 1.ZH Megoldások


Formális Nyelvek és Automaták v1.9

Formális nyelvek és automaták előadások

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

6. előadás A reguláris nyelvek jellemzése 2.

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

1. előadás Matematikai és nyelvi alapok, Szintaktikai vizsgálat

Budapesti M szaki és Gazdaságtudományi Egyetem Automatizálási és Alkalmazott Informatikai Tanszék INFORMATIKA 2 AUTOMATÁK ÉS NYELVEK.

Véges automaták, reguláris nyelvek

9. előadás Környezetfüggetlen nyelvek

Formális nyelvek - 9.

HALMAZOK. A racionális számok halmazát olyan számok alkotják, amelyek felírhatók b. jele:. A racionális számok halmazának végtelen sok eleme van.

Nyelv hatványa: Legyen L egy nyelv, nemnegatív egész hatványai,,. (rek. definició) Nyelv lezártja (iteráltja): Legyen L egy nyelv. L nyelv lezártja.

1 2. gyakorlat Matematikai és nyelvi alapfogalmak. dr. Kallós Gábor

2018, Diszkrét matematika

Példa a report dokumentumosztály használatára

A tananyag a TÁMOP A/1-11/ számú projekt keretében készült.

Feladatok: 1. Add meg a következ balreguláris nyelvtannak megfelel jobbreguláris nyelvtant!

Logika es sz am ıt aselm elet I. r esz Logika Negyedik el oad as 1/26

Formális nyelvek és automaták

HALMAZELMÉLET feladatsor 1.

A tananyag a TÁMOP A/1-11/ számú projekt keretében készült.

Halmazok-előadás vázlat

Lexikon és nyelvtechnológia Földesi András /

Matematikai logika és halmazelmélet

Az angol nyelv logikája 2. I. rész Béres Miklós

Kognitív nyelvészet. Kognitív szemantika Kognitív grammatika

Bizonyítási módszerek ÉV ELEJI FELADATOK

Számítástudomány matematikai alapjai segédlet táv és levelező

Metrikus terek, többváltozós függvények

Struktúra nélküli adatszerkezetek

2010. október 12. Dr. Vincze Szilvia

6. előadás A reguláris nyelvek jellemzése 2.

akonyv 2006/12/18 11:53 page i #1 Formális nyelvek és fordítóprogramok

A SZÁMÍTÁSTUDOMÁNY ALAPJAI

Itt és a továbbiakban a számhalmazokra az alábbi jelöléseket használjuk:

6. előadás Környezetfüggetlen nyelvtanok/1.

1. előadás: Halmazelmélet, számfogalom, teljes

Információ megjelenítés Alapok

Halmazelmélet. 1. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Halmazelmélet p. 1/1

1. tétel Halmazok és halmazok számossága. Halmazműveletek és logikai műveletek kapcsolata.

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Vektorok II.

Megjegyzés: A programnak tartalmaznia kell legalább egy felhasználói alprogramot. Példa:

Teljes visszalépéses elemzés

Fogalomtár a Formális nyelvek és

1. előadás Matematikai és nyelvi alapok, Szintaktikai vizsgálat

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit.

Rekurzió. Dr. Iványi Péter

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

MintaFeladatok 2.ZH Megoldások

SZIMBÓLUMSOROZATOK ELEMZÉSE STATISZTIKAI MÓDSZEREKKEL Tudományos diákköri dolgozat, 1997.

Predikátumkalkulus. 1. Bevezet. 2. Predikátumkalkulus, formalizálás. Predikátumkalkulus alapfogalmai, formalizálás, tagadás, logikailag igaz formulák.

Formális nyelvek. Aszalós László, Mihálydeák Tamás. Számítógéptudományi Tanszék. December 6, 2017

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

Genetikus algoritmusok az L- rendszereken alapuló. Werner Ágnes

Átírás:

A számítógépes nyelvészet elmélete és gyakorlata Formális nyelvek elmélete

Nyelv Nyelvnek tekintem a mondatok valamely (véges vagy végtelen) halmazát; minden egyes mondat véges hosszúságú, és elemek véges halmazából épül fel. [...] Valamely L nyelv nyelvészeti elemzésének alapvető célja az, hogy a nyelvtanilag helyes sorozatokat, amelyek L mondatai, különválasszuk a nyelvtanilag helytelen sorozatoktól, amelyek L-nek nem mondatai. [...] L nyelvtana ily módon olyan készülék lesz, amely L valamennyi nyelvtanilag helyes sorozatát létrehozza, azaz generálja, de nem generál egyetlen nyelvtanilag helytelent sem. (Chomsky: Syntactic structures. 1957)

Nyelv Egy természetes nyelv valamilyen objektumok (ezeket szokás mondatoknak nevezni) egyfajta összessége. Ez az összesség halmaz. Minden mondat véges objektum. A természetes nyelveknek véges építőelem-halmazuk (szótáruk) van. Minden L nyelv leírható olyan eszközzel, mely felsorolja L-et. A természetes nyelvek esetében ezt a (véges) eszközt az L természetes nyelv nyelvtanának nevezzük.

Nyelvek és nyelvtanok természetes nyelv: jelsorozatok halmaza (grammatikus/nem grammatikus) grammatika: explicit eszköz ezek megkülönböztetésére kétféle formális eszköz: - automata: absztrakt számítógép - formális nyelvtan: jelsorozat újraíró rendszer

Alapfogalmak ábécé: tetszőleges véges szimbólumhalmaz, elemei betűk/karakterek. jelölés: A ábécé, elemei a, b, c, szó: az A ábécé elemeinek egy tetszőleges véges (de nem korlátos hosszúságú) sorozatát az A ábécé feletti szónak/jelsorozatnak nevezzük. jelölés: u, v, w.

Példa Legyen A ={0, 1} egy ábécé. Ekkor minden bináris szám szó A felett: 0,1,01,10,00,00,,01101, Ha A = {a, b, c, d,..., y, z} egy ábécé (az angol abc), akkor A feletti szavak: cat, incredulous, andsupercalifragilisticexpialidocious, tac, qqq, andkjshdflkwjehr

Alapfogalmak szó hossza: a benne megjelenő ábécébeli betűk előfordulásainak száma két szó azonos, ha ugyanazon betűk ugyanabban a sorrendben szerepelnek bennük. az A feletti összes szavak halmazát jelölje A*. Az e jelölje az üres szót.

Alapfogalmak nyelv: az A* valamely részhalmazát az A ábécé feletti nyelvnek nevezzük. jelölés: L Mj: A* számossága: megszámlálhatóan végtelen P(A*) számossága: kontinuum, akkor is, ha A egyelemű L 0 = (üres nyelv), L e ={e}

Példa angol abc feletti nyelvek: - szavak csupa mássalhangzóból - szavak csupa magánhangzóból - szavak, amelyek hossza kisebb, mint 17 - egybetűs szavak halmaza - {i, you, he, she, it, we, they} - az üres halmaz

go 0 =e, go 1 =go, go 2 =gogo Műveletek konkatenáció: Legyenek u, v szavak egy adott L nyelvből. Ekkor a két szó konkatenációja u v=uv. (A két szó egymás utáni leírásával kapott szó.) master mind=mastermind, mind master=mindmaster, learn s=learns, learn ed=learned. u e=u mit mondhatunk u v hosszáról? hatványozás: v 0 =e, v 1 =v, v n =v n-1 v

Műveletek tükörkép/ megfordítás: v R : v betűit fordított sorrendben írjuk le (vö. palindróma: görög, Komor romok. Indul a görög aludni. Tekerek konok kereket.) részjelsorozat: tetszőleges jelsorozat, ami v betűinek folyamatos sorozata ugyanabban a sorrendben

Alapfogalmak mondat: ha w A* és w L, akkor w L mondata nyelvosztály: nyelvek valamely összességét nyelvosztálynak hívjuk.

Nyelvtanok Axiómák és levezetési szabályok deduktív rendszere, egy nyelv mondatait generálja Részei: - S mondatszimbólum (kezdőszimbólum): axióma - Levezetési szabályok véges halmaza (újraíró szabályok) - Kétféle véges ábécé, melyek diszjunktak: terminális (karakterkészlet)/nemterminális (grammatikai szimbólumok)

Nyelvtanok Levezetés: mondatszerű formáknak nevezett jelsorozatok egymásutánja (nemcsak a nyelv karakterei, hanem a grammatikai szimbólumok is szerepelhetnek) Egy adott G nyelvtan által generált nyelv L(G): a G által generált összes jelsorozat halmaza

Miért nyelvtan a nyelvtan? <mondat> ::= <alanyi rész> <állítmányi rész> <alanyi rész> ::= <főnévi rész> <határozó> <állítmányi rész> ::= <tárgyi rész> <igei rész:> <főnévi rész> ::= <névelő> <jelzők> <főnév> <névelő> ::= ε a az egy <jelzők> ::= <jelző> <jelző> <jelzők> <jelző> ::= ε hideg meleg fehér fekete nagy kis <főnév> ::= kutya macska hús egér sajt tej víz <határozó> ::= ε nappal éjjel reggel este <tárgyi rész> ::= <főnévi rész>t <igei rész> ::= eszik iszik

A Chomsky-féle hierarchia nyelvtanok hierarchiája: a szabályok alakja alapján, egyre szigorúbb megkötéseket teszünk egyetlen kiinduló megkötés: a szabályok bal oldalán mindenképpen szerepelnie kell legalább egy nemterminális jelnek. osztályozás: csökkenő generatív kapacitás

A Chomsky-féle hierarchia 0. típus: frázis-struktúra nyelvtanok (nincs más megkötés) 1. típus: környezetfüggő nyelvtanok minden levezetési szabály A, e alakú (környezetfüggő), azaz nem csökkentő 2. típus: környezetfüggetlen nyelvtanok minden szabály A alakú 3. típus: reguláris nyelvtanok kétféle szabálytípus lehetséges: A a, A ab

A Chomsky-féle hierarchia A különböző típusú nyelvtanok összességét nyelvtani osztályoknak hívjuk és rendre G i -vel jelöljük. Tehát: G i := {i típusú nyelvtanok}. G 3 G 2 G 1 G 0. A nyelvtani osztályozást felhasználva a nyelveket is osztályozhatjuk: i = {L L nyelv, és van olyan G G i, amelyre L(G) = L}. Az előző nyelvtanhierarchia alapján 3 2 1 0.

Példák 3. típus: reguláris nyelvtan S, N={S, A, B}, T={a, b}, szabályok: S aa A aa A bb B bb B e

Példák 2. típus: környezetfüggetlen nyelvtan S, N={S}, T={a, b}, szabályok: S asb S ab

Példák 1. típus: környezetfüggő nyelvtan S, N={S, A, B, C}, T={a, b, c}, szabályok: S asac S abc CA BA BA BC BC AC ba bb C c

A természetes nyelvek Az önbeágyazás olyan természetes nyelvi jelenség, ami nem jellemezhető reguláris nyelvtannal (Chomsky, 1957). Példa: A barátom elment. A barátom, akihez a szomszédja be szokott csöngetni, elment. A barátom, akihez a szomszédja, akinek kölcsönadtam egy százast, be szokott csöngetni, elment.

A természetes nyelvek A természetes nyelvek nem környezetfüggetlenek, az ún. cross-serial dependencies miatt: Dorka, Panni és Kristóf rendre 1988-ban, 1990-ben és 1997-ben születtek.

A természetes nyelvek a környezetfüggetlen nyelvtanok még jól kezelhető bonyolultságának fenntartása, a környezetfüggő nyelvek keretein belül: mildly context-sensitive grammars (enyhén környezetfüggő) Példa: tree-adjoining grammars (TAG) (Joshi, 1985), linear indexed grammars (Gazdar, 1988), head grammars (Pollard, 1984)

Ajánlott irodalom: Alberti Gábor: Matematika a természetes nyelvek leírásában, Budapest: Tinta Könyvkiadó, 2006. Bach Iván: Formális nyelvek. Budapest: Typotext, 2001.