A HUNGLISH PÁRHUZAMOS KORPUSZ

Hasonló dokumentumok
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

A Hunglish Korpusz és szótár

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

A Mazsola KORPUSZLEKÉRDEZŐ

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL

A kibővített Magyar történeti szövegtár új keresőfelülete

2001-ben végze Eötvös-kollégistaként. angol nyelv és irodalom szakán, majd 2006 júliusában

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

PÁRHUZAMOS IGEI SZERKEZETEK

SZÓKINCSBŐVÍTÉS. Lecke (Kezdő 4. / 2.) MELLÉKNEVEK

Korpuszlekérdezők evolúciója

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

REFERENS ÉS FORDÍTÓ SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAKOK FRANCIA NYELVI REFERENS ÉS FORDÍTÓ SZAKIRÁNYÚ TOVÁBBKÉPZÉS

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

ISMÉTLÉS 4. (MÓDBELI) SEGÉDIGÉK

REFERENS ÉS FORDÍTÓ SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAKOK FRANCIA NYELVI REFERENS ÉS FORDÍTÓ SZAKIRÁNYÚ TOVÁBBKÉPZÉS Indított szakirányok:

REFERENS ÉS FORDÍTÓ SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAKOK

A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok

A Tinta e-book könyvtár/lexikontár címei:

Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak

Korpuszok és adatbázisok. Korpuszok a nyelvészeti kutatásban szeptember 29.

Különírás-egybeírás automatikusan

Angol-Amerikai Intézet 3 tanszékbıl áll

Tantárgyfelelős. Kredit pont. tanszék/ intézet. Nyelv és stílusgyakorlatok idegen nyelvből ANF G 3 AN Dr. Dömötör Ildikó x

Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2017-től fölvett hallgatóknak

EXKLUZÍV AJÁNDÉKANYAGOD A Phrasal Verb hadsereg! 2. rész

Önálló labor feladatkiírásaim tavasz

Lexikon és nyelvtechnológia Földesi András /

Ötletek a magyar mint idegen nyelv tanításához feladattípusok szerint

Lopocsi Istvánné MINTA DOLGOZATOK FELTÉTELES MONDATOK. (1 st, 2 nd, 3 rd CONDITIONAL) + ANSWER KEY PRESENT PERFECT + ANSWER KEY

ANGOL NYELVI SZINTFELMÉRŐ 2013 A CSOPORT. on of for from in by with up to at

A franciaoktatas.eu továbbképzés kapcsolata a tanárképzéssel. Pálffy Gabriella Egyetemi adjunktus ELTE Francia Tanszék Módszertan

Differenciált óravezetés a Meixner módszer segítségével November 26. Ungár Ágnes Tanító, intézményvezető

NÉZZÜK, HOGY KI MILYEN?

KONYHABÚTOR FELSŐK ELEMJEGYZÉKE

tolmács szakirány (anyanyelv: ; első választott idegen nyelv: ; második választott

Az első és az egyetlen. Beszélő fordítógép, beszélő szótár, beszélő kifejezés gyűjtemény

BEMELEGÍTÉS. Lecke (Kezdő 2. / 1.) MELLÉKNEVEK. Olyan mellékneveket választottunk, amelyeket a hétköznapokban remekül lehet alkalmazni.

Értékelési szempont. A kommunikációs cél elérése és az interakció megvalósítása 3 Szókincs, kifejezésmód 2 Nyelvtan 1 Összesen 6

EGYSZERŰNEK TŰNIK IV. RÉSZ

EMELT SZINT BESZÉDKÉSZSÉG ÉRTÉKELÉSI ÚTMUTATÓ

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Értékelési útmutató az emelt szintű szóbeli vizsgához

Hasznos tippek és trükkök

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

ANGOL MAGYAR PARBESZEDEK ES PDF

Tantárgyi követelmény Gimnázium 12. évfolyam

Fordítás, többnyelvűség, szótárak

TÁJÉKOZTATÓ A SZÓBELI FELVÉTELIRŐL

Könnyen, Gyorsan Angolul!

Lexikológia, lexikográfia a MID oktatásában

I. Alkalmazott Nyelvészeti Doktorandusz Konferencia. Budapest,

Angol Nyelvvizsga Gyakorló Tesztgyűjtemény

ÉRTÉKELÉSI ÚTMUTATÓ AZ EMELT SZINTŰ SZÓBELI VIZSGÁHOZ. Általános útmutató

Az emelt szintű szóbeli vizsga értékelési útmutatója

Please stay here. Peter asked me to stay there. He asked me if I could do it then. Can you do it now?

Magyar nyelvű történeti korpuszok

Király Linda - Can't Let Go dalszöveg - lyrics

Nemzeti. Tankönyvkiadó. Részvénytársaság

ÉRTÉKELÉSI ÚTMUTATÓ AZ EMELT SZINTŰ SZÓBELI VIZSGÁHOZ

Foglalkoztatás I. tantárgy Idegen nyelv

Tudományos Ismeretterjesztő Társulat

Angol C nyelvi programkövetelmény

2 kultúra. Zétényi Tamás.

Emelt szintű szóbeli érettségi vizsga értékelési útmutatója. Olasz nyelv. Általános jellemzők

Igekötős szerkezetek a magyarban

TANULMÁNYOK MÛHELY A Gramma Nyelvi Iroda tevékenységérõl 1

2006. szeptemberétől

Reported Speech Függő beszéd

IGEI SZERKEZETEK GYAKORISÁGI SZÓTÁRA

TÁRSADALOMTUDOMÁNYI ÉS GAZDASÁGI SZAKFORDÍTÓ ÉS TOLMÁCS (ANGOL, NÉMET, ÉS FRANCIA NYELVŰ SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAK) MINTATANTERV

A azonosító számú Foglalkoztatás I. megnevezésű szakmai követelménymodulhoz tartozó Foglalkoztatás I tantárgy

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

Igei szerkezetek gyakorisági szótára

ANGOL NYELVI SZINTFELMÉRŐ 2012 A CSOPORT. to into after of about on for in at from

ANGLISZTIKA. Oldal 1

EGY KIS ZŰRZAVAR. Lecke (Középhaladó 1. / 1.) SOMETIMES, SOMETIME VAGY SOME TIME?

Countable and uncountable nouns Megszámlálható és megszámlálhatatlan főnevek. Project 2 Unit Get to top 1 5/a-b-c

TANEGYSÉGLISTA (MA) FORDÍTÓ ÉS TOLMÁCS MESTERKÉPZÉSI SZAK (MA)

AZ OFI KÍNÁLATA NÉMET NYELVBŐL

MSc SZINTŰ MŰSZAKI SZAKFORDÍTÓ KÉPZÉS

ÁLLAMOK, NYELVEK, ÁLLAMNYELVEK. Nyelvpolitika a mai Kárpátalja területén ( )

A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága

Értékelési útmutató az emelt szintű szóbeli vizsgához

Osztályozó vizsga Angol mint első idegen nyelv

MODÁLIS SEGÉDIGÉK (Modal Auxiliaries)

Angol-Amerikai Intézet 3 tanszékbıl áll

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

Magyar nyelvű néprajzi keresőrendszer

Szabó Martina Katalin

12. osztály nyelvtan anyaga: Nyelvi szinkrónia és diakrónia; a nyelv eredete és típusai

EGYÜTTHALADÓ. migráns gyermekek az. iskolában. Európai Integrációs Alap

Tudatelmélet. let és s idegen nyelv. rsaság - Budapest

Átírás:

A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.

1 PÁRHUZAMOS KORPUSZ 2 HUNGLISH 3 MIRE JÓ? 4 HASZNÁLATA 5 PÉLDÁK

KORPUSZ KORPUSZ Nagy mennyiségű összegyűjtött szöveg. szöveggyűjtemény, szövegtár

KORPUSZ KORPUSZ Nagy mennyiségű összegyűjtött szöveg. szöveggyűjtemény, szövegtár számítógépes tárolás és feldolgozás: hozzáadott információ (annotáció)

KORPUSZ KORPUSZ Nagy mennyiségű összegyűjtött szöveg. szöveggyűjtemény, szövegtár számítógépes tárolás és feldolgozás: hozzáadott információ (annotáció) Történet 60-as évek: Brown corpus 1 millió szó 90-es évek: British National Corpus 100 millió szó nemzeti korpuszok (német, francia, cseh, magyar... )

KORPUSZ KORPUSZ Nagy mennyiségű összegyűjtött szöveg. szöveggyűjtemény, szövegtár számítógépes tárolás és feldolgozás: hozzáadott információ (annotáció) Történet 60-as évek: Brown corpus 1 millió szó 90-es évek: British National Corpus 100 millió szó nemzeti korpuszok (német, francia, cseh, magyar... ) MAGYAR NEMZETI SZÖVEGTÁR http://corpus.nytud.hu/mnsz

PÁRHUZAMOS KORPUSZ PÁRHUZAMOS KORPUSZ Adott korpusz és annak fordítása.

PÁRHUZAMOS KORPUSZ PÁRHUZAMOS KORPUSZ Adott korpusz és annak fordítása. két vagy több nyelvű illesztett

PÁRHUZAMOS KORPUSZ PÁRHUZAMOS KORPUSZ Adott korpusz és annak fordítása. két vagy több nyelvű illesztett Történet 80-as évek: Hansard Corpus (francia-angol)

ILLESZTÉS

ILLESZTÉS Cél: Azonosítani, hogy melyik mondatnak melyik a fordítása.

ILLESZTÉS Cél: Azonosítani, hogy melyik mondatnak melyik a fordítása. nagy szöveganyag számítógépes program végzi nem egyszerű feladat

ILLESZTÉS Cél: Azonosítani, hogy melyik mondatnak melyik a fordítása. nagy szöveganyag számítógépes program végzi nem egyszerű feladat PÉLDA [m:] Matróz akarsz lenni? S egy nap felmászni az árbócra? [a:] Will you be a sailor and go aloft one day? PÉLDA [m:] Ó, ments meg, Uram! [a:] Oh, my God! Save me!

HUNGLISH Új, nagyméretű, illesztett magyar-angol párhuzamos korpusz.

HUNGLISH Új, nagyméretű, illesztett magyar-angol párhuzamos korpusz. 50 millió szó = 2 millió mondat források szövegtípusok szépirodalom EU joganyagok szoftverdokumentáció filmfeliratok kétnyelvű magazinok pénzügyi jelentések

HUNGLISH Új, nagyméretű, illesztett magyar-angol párhuzamos korpusz. 50 millió szó = 2 millió mondat források szövegtípusok szépirodalom EU joganyagok szoftverdokumentáció filmfeliratok kétnyelvű magazinok pénzügyi jelentések

MIRE JÓ? szótárkészítés, gépi fordítás, kontrasztív nyelvészeti kutatás...

MIRE JÓ? A Hunglish korpusz egy szókapcsolatokat tartalmazó szótár, valódi nyelvhasználatból vett példákkal.

MIRE JÓ? A Hunglish korpusz egy szókapcsolatokat tartalmazó szótár, valódi nyelvhasználatból vett példákkal. Keresés: egyes szavak kifejezések bármilyen szókapcsolat: should have, if I, would rather,...

KORPUSZALAPÚ NYELVTANÍTÁS

KORPUSZALAPÚ NYELVTANÍTÁS szókincs + nyelvtan szókincsfejlesztés szótárként használható nyelvtani struktúrák vizsgálata, megértése

KORPUSZALAPÚ NYELVTANÍTÁS szókincs + nyelvtan szókincsfejlesztés szótárként használható nyelvtani struktúrák vizsgálata, megértése önálló felfedezés motiváció Adott nyelvi elemnek többféle megfelelője lehet, számtalan módon lehet jól fordítani. kollokációkat nyelvtani szabályokat a nyelveket (mindkettőt!)

KORPUSZALAPÚ NYELVTANÍTÁS szókincs + nyelvtan szókincsfejlesztés szótárként használható nyelvtani struktúrák vizsgálata, megértése önálló felfedezés motiváció Adott nyelvi elemnek többféle megfelelője lehet, számtalan módon lehet jól fordítani. kollokációkat nyelvtani szabályokat a nyelveket (mindkettőt!) valódi példák valódi szövegkörnyezettel szókörnyezeti vizsgálatok

KORPUSZALAPÚ NYELVTANÍTÁS szókincs + nyelvtan szókincsfejlesztés szótárként használható nyelvtani struktúrák vizsgálata, megértése önálló felfedezés motiváció Adott nyelvi elemnek többféle megfelelője lehet, számtalan módon lehet jól fordítani. kollokációkat nyelvtani szabályokat a nyelveket (mindkettőt!) valódi példák valódi szövegkörnyezettel szókörnyezeti vizsgálatok kipróbált módszer kezdőknek és haladóknak órai és önálló munkára

HASZNÁLATA HUNGLISH http://szotar.mokk.bme.hu/hunglish/search/corpus Próbálják ki!

HASZNÁLATA

1. PÉLDA - "first of all"

1. PÉLDA - "first of all"

1. PÉLDA - "first of all"

2. PÉLDA - salient

2. PÉLDA - salient

3. PÉLDA - "már"

3. PÉLDA - "már"

4. PÉLDA - "should have"

4. PÉLDA - "should have"

4. PÉLDA - "should have"

5. PÉLDA - "ez király"

6. PÉLDA - "it s kind of"

UTOLSÓ PÉLDA - "nem most jöttem le a falvédőről"

UTOLSÓ PÉLDA - "nem most jöttem le a falvédőről"

ÖSSZEFOGLALÁS Elkészült az első nagy méretű, illesztett magyar-angol párhuzamos korpusz. Alkalmas oktatási segédeszköz korpuszalapú nyelvtanításhoz. Szabadon hozzáférhető: http://szotar.mokk.bme.hu/hunglish/search/corpus

ÖSSZEFOGLALÁS Elkészült az első nagy méretű, illesztett magyar-angol párhuzamos korpusz. Alkalmas oktatási segédeszköz korpuszalapú nyelvtanításhoz. Szabadon hozzáférhető: http://szotar.mokk.bme.hu/hunglish/search/corpus Köszönöm a figyelmet!