Korpusznyelvészet és fordítástudomány

Hasonló dokumentumok
KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN

FT 21 Fordítástudomány ma és holnap. (Budapest, Eötvös Loránd Tudományegyetem, 2014/15 őszi félév)

ELTE Bölcsészettudományi Kar Kutatási adatbázis

Bevezetés a nyelvtechnológiába 7. Fordítástámogatás: szótárak

Nyelvi tudásra épülő fordítómemória

Az aszimmetria hipotézis

A HUNGLISH PÁRHUZAMOS KORPUSZ

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

DOKTORI ÉRTEKEZÉS TÉZISEI FORDÍTOTT SZÖVEGEK SZÁMÍTÓGÉPES ÖSSZEVETÉSE

EXPLICITÁCIÓ A LEKTORÁLT FORDÍTÁSOKBAN. ROBIN EDINA ELTE BTK Fordítástudományi Doktori Program 1088 Budapest, Múzeum körút 4. robin@beltav.

Bevezetés a nyelvtechnológiába 7. Fordítástámogatás: szótárak

Innovation Delivered. Szekeres Csaba. M-Prospect Kft. Fordítási és tolmácsolási üzletágvezető, SDL Trados partner

Bevezetés a nyelvtechnológiába 7. Fordítástámogatás: szótárak

A lexikai kohézió vizsgálata a fordításkutatásban egy korpusznyelvészeti eszközzel végzett kutatás tükrében

A terminológiai adatbázisok gyakorlati haszna a terminológia és a fordító- tolmácsképzésben. Networkshop Április , Pécs

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

Új módszerek az alkalmazott nyelvészeti kutatásban

Az ISO 17100:2015 szabványban szereplő szakkifejezések és meghatározásuk

ELTE Bölcsészettudományi Kar Fordítástudományi Doktori Program

Speciális protokollok a tanfordítások értékelésében

Explicitáció és implicitáció a fordítói kompetencia függvényében. Makkos Anikó Robin Edina ELTE Fordítástudományi Doktori program

ELTE Bölcsészettudományi Kar Kutatási adatbázis


MAGYAR FORDÍTÓKÉPZŐ INTÉZMÉNYEK SWOT-ELEMZÉSE

Empirikus kutatások a fordító láthatatlanságáról Klaudy Kinga

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban

FORDÍTÁSTUDOMÁNY AZ EZREDFORDULÓN

EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

Karoly_Szovegkoherencia_:6.(!)korr :14 Page 1. dc_902_14 KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN

PhD-összegzés A fordító mint terminológus, különös tekintettel az európai uniós kontextusra. Fischer Márta, 2010

FT 21 Fordítástudomány ma és holnap (Budapest, Eötvös Loránd Tudományegyetem, 2016/17 őszi félév)

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

Még mindig a minőség az úr Biztosítsa Ön is!

Tartalom. Előszó feladat: Fordítás a megszokott eszközökkel A számítógép hatékony használatáról... 18

Az ismétlésről a fordítási univerzálék tükrében

DOKTORI DISSZERTÁCIÓ A FORDÍTÁSI KÖRNYEZETEK HATÁSA A FORDÍTOTT SZÖVEG MINŐSÉGÉRE ÁBRÁNYI HENRIETTA

tolmács szakirány (anyanyelv: ; első választott idegen nyelv: ; második választott

PÁRHUZAMOS IGEI SZERKEZETEK

Károly Krisztina SZÖVEGTAN ÉS FORDÍTÁS

FORDÍTÓ ÉS TOLMÁCS MESTERKÉPZÉSI SZAK


2017-től felvett hallgatóknak. A mesterképzési szakon szerezhető végzettségi szint és a szakképzettség oklevélben szereplő megjelölése:

A Mazsola KORPUSZLEKÉRDEZŐ

DOKTORI ÉRTEKEZÉS. Dialektus fordításban. Fordítás dialektusban. Témavezető: Dr. habil. Huszár Ágnes CSc

Félig kompozicionális fınév + ige szerkezetek a számítógépes nyelvészetben *

név a kutatási téma címe jelentkezési tudományág helyszín program neveléstudományok BTK Nyelvpedagógia Brózik-Piniel Idegennyelvi-szorongás

Doktori kutatások Klaudy Kinga tiszteletére II.

Götz Andrea: Az első magyar intermodális korpusz bemutatása Argumentum 13 (2017), Debreceni Egyetemi Kiadó. Tanulmány.

TANEGYSÉGLISTA (MA) FORDÍTÓ ÉS TOLMÁCS MESTERKÉPZÉSI SZAK (MA)

FRANCIA-MAGYAR BÖLCSÉSZETTUDOMÁNYI SZAKFORDITÓ. szakirányú továbbképzési szak

Szakfordítás angolról magyarra: jellegzetes műveletek, a fordított szakszövegek jellemzői és értékelése különböző fordítási szinteken

FORDÍTÓ ÉS TOLMÁCS MESTERKÉPZÉSI SZAK

I. Alkalmazott Nyelvészeti Doktorandusz Konferencia. Budapest,

YANG ZIJIAN GYŐZŐ 杨子剑

FORDÍTÓ ÉS TOLMÁCS MESTERKÉPZÉSI SZAK

DOKTORI ÉRTEKEZÉS TÉZISEI A FORDÍTÓ MINT TERMINOLÓGUS, KÜLÖNÖS TEKINTETTEL AZ EURÓPAI UNIÓS KONTEXTUSRA. Fischer Márta. Budapest

Elektronikus szótár vagy terminológiai adatbázis?

TÁJÉKOZTATÓ A SZAKDOLGOZATRÓL FORDÍTÓ ÉS TOLMÁCS MESTERSZAK FORDÍTÓ SPECIALIZÁCIÓ

Eötvös Loránd Tudományegyetem. Bölcsészettudományi Kar DOKTORI ÉRTEKEZÉS TÉZISEI ROBIN EDINA FORDÍTÁSI UNIVERZÁLÉK A LEKTORÁLT SZÖVEGEKBEN

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

Társadalomtudományi és Gazdasági Szakfordító és Tolmács Szakirányú Továbbképzés

A Hunglish Korpusz és szótár

fordítási univerzálék

MANYE XXII. TÁRSADALMI VÁLTOZÁSOK NYELVI VÁLTOZÁSOK Alkalmazott nyelvészeti kutatások a Kárpát-medencében


Nyelv-ész-gép Új technológiák az információs társadalomban

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

DIPLOMAFORDÍTÁS - KÖVETELMÉNYEK

A fordítástechnológia és az alkalmazott nyelvtudomány

Új változatelemzési útmutató a közép-kelet-európai régióban:

OpenOffice.org mint fejlesztési platform

OLASZ-MAGYAR BÖLCSÉSZETTUDOMÁNYI SZAKFORDITÓ. szakirányú továbbképzési szak

Szövegkoherencia a fordításban

Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak

FÓRIS ÁGOTA. tanszékvezető egyetemi docens (KRE BTK Magyar Nyelvtudományi Tanszék, TERMIK)

Minden tudománynak van önfejlődése, hiszen a megoldandó kérdésekről való

A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok

Teljesítendő kreditek a tárgycsoportban. Tárgyfelvétel típusa. Tárgy kredit

Spanyolországi terminológiai adatbázisok tartalmi és formai jellemzőinek vizsgálata

Budapesti Műszaki és Gazdaságtudományi Egyetem Idegen Nyelvi Központ Tolmács- és Fordítóképző Központ

Útmutató a szakdolgozat elkészítéséhez a Társadalomtudományi és gazdasági szakfordító és tolmács szakirányú továbbképzési szakon

Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2017-től fölvett hallgatóknak

Fordításszolgáltatók Magyarországon Iparági kutatás hazai fordítóirodák körében

XV. Nemzetközi SZOKOE Szaknyelvi Konferencia

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Számítógéppel támogatott fordítás

Iránytű az egyetemi fordítóképzéshez

ÜGYFÉL-ELÉGEDETTSÉG, AJÁNLÁSOK

FORDÍTÁSI UNIVERZÁLÉK A LEKTORÁLT SZÖVEGEKBEN

Párhuzamos (fordított) szövegek többcélú felhasználása Három fő terület: 1. A szöveg előkészítése (mindhárom esetben):

SZAKMAI ZÁRÓJELENTÉS OTKA Nyilvántartási szám: F

Nyelvészet. I. Témakör: Leíró nyelvtan

A retorikai szerkezet újrateremtése a magyar angol sajtófordításban *

Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német nemzetiségi szakirány. a 2015-tól fölvett hallgatóknak

KONYHABÚTOR FELSŐK ELEMJEGYZÉKE

Fischer Márta: Az európai uniós fordítás és terminusalkotás magyar vonatkozásai 385 MAGYAR NYELVİR

Copy Másolás. CCut Kivágás. CPaste Beillesztés. CFind Keresés (szerkesztablakban) CFull Screen Teljes képernyő. FHelp Topics Súgó

Átírás:

Korpusznyelvészet és fordítástudomány

Á"ekintés Töbnyelvű korpuszok - szövegpárhuzamosítás az emberi fordítás gépi támogatása - elektronikus szótárak, terminológiai adatbázis/ terminológia kezelő, fordítómemória, előfordító rendszerek gépi fordítás a fordítástudományban honos korpusz alapú kutatások FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 2

Többnyelvű korpuszok FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 3

A többnyelvű korpuszok haszna a FordTud- ban? terminólógia adatbankok fordítómemória két- és többnyelvű szótárak két- és többnyelvű konkordanciák gépi fordítás fordítók képzése, fejlesztése FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 4

Párhuzamos korpusz autenkkus szövegek + ezek fordítása egyirányú/kékrányú, több nyelvpár párhuzamosítop: mondat/szó szinten FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 5

Párhuzamos korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 6

Párhuzamos korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 7

EUR- Lex ingyenes hozzáférést biztosít az Európai Unió joganyagához és más dokumentumokhoz 23 hivatalos nyelven 2 815 000 dokumentum FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 8

The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 9

The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 10

The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 11

The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 12

FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 13

FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 14

Párhuzamos korpusz The English- Norwegian Parallel Corpus hpp://www.helsinki.fi/varieng/cord/corpora/ ENPC/ szófaj szerint címkézep (tagged for part of speech = POS) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 15

Párhuzamos korpusz English- Norwegian Parallel Corpus Parallel Corpora in Uppsala CroCro Corpus mondakllesztéssel párhuzamosítop korpuszok Aligned Hansards of the 36th Parliament of Canada European Parliament Proceedings 1996-2001 FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 16

MondaKllesztéssel párhuzamosíto" korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 17

Fordítási korpusz két eltérő felfogás: 1. S. Johansson 1998 a párhuzamos korpusz helyep (FNYSZ CNYSZ) 2. Baker 1995 - csak az adop nyelvre fordítop szövegek FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 18

Fordítási korpusz Corpus of Translated Finnish (CTF) The TranslaKonal English Corpus (TEC) hpp://www.monabaker.com/tsresources/ TranslaKonalEnglishCorpus.htm currently (2003) around 10 million words The TEC corpus browser FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 19

Összehasonlító korpusz AutenKkus szövegek több különböző nyelven a szövegek hasonlóak/összehasonlíthatóak - több szempontból nehezen megvalósítható: szövegkpus forma tárgy keletkezési idő FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 20

Összehasonlító korpusz sokszor meglévő 1 nyelvű korpuszok felhasznlása pl. ritkán vagy soha nem fordítop szövegfajták esetében: autenkkus beszlétnyelv rádió adások turiszkkai szövegek céges szórólapok FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 21

Többnyelvű párhuzamos korpusz adop nyelv szövegei lefordítva több különböző nyelvre Pedant Corpus (Danielsson/Ridings 1996) Oslo MulKlingual Corpus (S. Johansson 1997) TripKc Corpus (Paulussen 1999) English- Dutch- French FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 22

Oslo MulKlingual Corpus egyes szövegpárok tanulmányozása egy lexikai elem vagy kifejezés különböző fordításainak tanulmányozása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 23

Fordítástámogatás fully automakc MT teljesen automakkus gépi ford human aided MT ember támogapa gépi ford machine aided HT gép támogapa emberi ford FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 24

Emberi fordítás gépi támogatása elektronikus szótár terminológia kezelő fordítómemória előfordító remdszer CAT- eszközök: a fordítómemória (translakon memory, TM) a terminológiai adatbázis (terminology management) szövegpárhuzamosító eszköz (alingment tool) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 25

Gépi fordítás nyelvtechnológiai alkalmazás, amelynek célja a természetes nyelvek közöo fordítás folyamatának automakzálása a teljes eljárást automakzáló programok / fordítástámogató eszközök = egyes részfeladatok végrehajtása a felhasználó közreműködésével FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 26

Gépi fordítás szabályalapú / korpuszalapú (stakszkkai) hpp://www.webforditas.hu/ hpp://translate.google.hu/# korpuszalapú : mondatonként vagy szavanként megfeleltetep szövegek fordítás = legjobban hasonlító minta célnyelvi megfelelője FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 27

Korpuszalapú fordításkutatás (Corpus- based translakon studies) Baker (1993, 1995, 1996) Laviosa (1997, 1998, 2002) Kennedy (1998) Tymoczko (1998) Stubbs (2001) Kenny (2001) Olohan (2004) Teubert (2007) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 28

Korpuszalapú fordításkutatás Baker (1993) A korpuszban összegyűjtöp szövegek: a ténylegesen használt nyelv megtestesülései a nyelvi viselkedés természetes megvalósulásai a nyelvész beleavatkozása nélkül jöpek létre FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 29

Korpuszalapú fordításkutatás Baker (1993) A korpuszalapú megközelítés empirikusan közelík meg a nyelv leírását ragaszkodik a hiteles használak előfordulások elsődlegességéhez legfontosabb feladata a fordítás eredményeként létrejöp szöveg tulajdonságainak leírása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 30

A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) kulcsfontosságúak a nem angol korpusznyelvészet számára (ázsiai nyelvek) általuk új szempontokra figyel fel a komparakv nyelvészet (ezek nem merülnek föl egynyelvű korposzok vizsgálatakor) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 31

A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) kibővikk a nyelvek kulturális és nyelvi jellemzőire vonatkozó ismereteinket megvilágítják a célnyelvi- és forrásnyelvi, valamint az autenkkus- és fordítop szövegek közöo különbségeket alkalmazásuk számos területen hasznos (lexikográfia, nyelvoktatás, fordítás) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 32

Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) szövegkorpuszok felfedezése a normakv tudományból, deskripkv tudumány a fordítop szöveg: nem rontop szöveg, önmagában is érdekes kutatási tárgy 2 eredmény: a FNYSZ primátusa megszűnik, a CNYSZ mint kutatási tárgy előtérbe kerül FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 33

Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) párhuzamos: megmutatja a ruknos fordítók megoldásait pl. Hansard szó- és mondatkonkordancia többnyelvű: a CNY elemiet természetesebb környezetben lehet vizsgálni, a jellemző lexikai kapcsolódásokat, szerkezek mintákat FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 34

A fordíto" szövegek lexikai jellegzetességének kimutatása Baker 1995: bizonyos szavak gyakrabban a FK- ban bizonyos szavaknak más a jellegzetes környezete a FK- ban a NFK bizonyos szavai nem fordulnak elő a FK- ban idegen szavak használatában eltér a FK és NFK FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 35

A fordíto" szövegek lexikai jellegzetességének kimutatása Klaudy 1986: különbség a mondat grammakkai tagolásában és a szöveg aktuális tagolásában csökken a ford. magyar szövegek kohéziója, megterhelést jelent a mondanivaló kihámozása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 36

Vizsgált kérdések Vannak- e a fordítop szövegeknek olyan ált. tulajdonságai, amelyek megkülönböztekk az autenkkus szöv.produkciótól? Baker 1993, 1996 Vannak- e fordítási univerzálék? konf. 2001 Baker 1993 fordítási univerzálék az intuició és manuális elemzések alapján - ezt kell korpuszokkal bizonyítani v. cáfolni bizonyos nyelvi jellegzetességek eloszlása más, mint az autenkkus szövegekben (kohéziós eszk. Blum- Kulka, 1986) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 37

FordTud kutatások Aijmer/Simon- Vandenbergen (2003) translakons of well into Swedish and Dutch English- Swedish Parallel Corpus Oslo MulKlingual Corpus TripKc Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 38

Aijmer/Simon- Vandenbergen (2004) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 39

FordTud kutatások Heyvaert (1998) non- agenkve deverbal er nominalisakons in English and Dutch (such as bestseller) COBUILD Corpus Dutch INL (InsKtuut voor Nederlandse Lexicologie) Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 40

FordTud kutatások Kenny (1998, 2001) creakvity in translakon, lexical creakvity German- English Parallel Corpus of Literary Texts (GEPCOLT) Holmes (1988); Laviosa (2002) general features of translated texts (explicitakon, simplificakon, normalisakon) The TranslaKon English Corpus (TEC) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 41

FordTud kutatások Doherty 1999: informakon structure in English and German texts Hasselga rd 1998: themakc structure Steiner 2002, 2004: informakon packaging for English- German Fabricius- Hansen 1999: : informakon packaging for German- English and German- Norwegian FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 42

FordTud kutatások Johansson 1995: explicitakon in English and Norwegian parallel texts Hansen- Schirra/Neumann/ Steiner 2006: the relakon between explicitness/explicitakon and cohesion in German- English and English- German translakons Baker 2000, Olohan 2004: translator s style Mauranen 1997: intercultural issues FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 43