Korpusznyelvészet és fordítástudomány
Á"ekintés Töbnyelvű korpuszok - szövegpárhuzamosítás az emberi fordítás gépi támogatása - elektronikus szótárak, terminológiai adatbázis/ terminológia kezelő, fordítómemória, előfordító rendszerek gépi fordítás a fordítástudományban honos korpusz alapú kutatások FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 2
Többnyelvű korpuszok FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 3
A többnyelvű korpuszok haszna a FordTud- ban? terminólógia adatbankok fordítómemória két- és többnyelvű szótárak két- és többnyelvű konkordanciák gépi fordítás fordítók képzése, fejlesztése FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 4
Párhuzamos korpusz autenkkus szövegek + ezek fordítása egyirányú/kékrányú, több nyelvpár párhuzamosítop: mondat/szó szinten FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 5
Párhuzamos korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 6
Párhuzamos korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 7
EUR- Lex ingyenes hozzáférést biztosít az Európai Unió joganyagához és más dokumentumokhoz 23 hivatalos nyelven 2 815 000 dokumentum FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 8
The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 9
The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 10
The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 11
The English- Norwegian Parallel Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 12
FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 13
FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 14
Párhuzamos korpusz The English- Norwegian Parallel Corpus hpp://www.helsinki.fi/varieng/cord/corpora/ ENPC/ szófaj szerint címkézep (tagged for part of speech = POS) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 15
Párhuzamos korpusz English- Norwegian Parallel Corpus Parallel Corpora in Uppsala CroCro Corpus mondakllesztéssel párhuzamosítop korpuszok Aligned Hansards of the 36th Parliament of Canada European Parliament Proceedings 1996-2001 FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 16
MondaKllesztéssel párhuzamosíto" korpusz FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 17
Fordítási korpusz két eltérő felfogás: 1. S. Johansson 1998 a párhuzamos korpusz helyep (FNYSZ CNYSZ) 2. Baker 1995 - csak az adop nyelvre fordítop szövegek FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 18
Fordítási korpusz Corpus of Translated Finnish (CTF) The TranslaKonal English Corpus (TEC) hpp://www.monabaker.com/tsresources/ TranslaKonalEnglishCorpus.htm currently (2003) around 10 million words The TEC corpus browser FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 19
Összehasonlító korpusz AutenKkus szövegek több különböző nyelven a szövegek hasonlóak/összehasonlíthatóak - több szempontból nehezen megvalósítható: szövegkpus forma tárgy keletkezési idő FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 20
Összehasonlító korpusz sokszor meglévő 1 nyelvű korpuszok felhasznlása pl. ritkán vagy soha nem fordítop szövegfajták esetében: autenkkus beszlétnyelv rádió adások turiszkkai szövegek céges szórólapok FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 21
Többnyelvű párhuzamos korpusz adop nyelv szövegei lefordítva több különböző nyelvre Pedant Corpus (Danielsson/Ridings 1996) Oslo MulKlingual Corpus (S. Johansson 1997) TripKc Corpus (Paulussen 1999) English- Dutch- French FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 22
Oslo MulKlingual Corpus egyes szövegpárok tanulmányozása egy lexikai elem vagy kifejezés különböző fordításainak tanulmányozása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 23
Fordítástámogatás fully automakc MT teljesen automakkus gépi ford human aided MT ember támogapa gépi ford machine aided HT gép támogapa emberi ford FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 24
Emberi fordítás gépi támogatása elektronikus szótár terminológia kezelő fordítómemória előfordító remdszer CAT- eszközök: a fordítómemória (translakon memory, TM) a terminológiai adatbázis (terminology management) szövegpárhuzamosító eszköz (alingment tool) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 25
Gépi fordítás nyelvtechnológiai alkalmazás, amelynek célja a természetes nyelvek közöo fordítás folyamatának automakzálása a teljes eljárást automakzáló programok / fordítástámogató eszközök = egyes részfeladatok végrehajtása a felhasználó közreműködésével FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 26
Gépi fordítás szabályalapú / korpuszalapú (stakszkkai) hpp://www.webforditas.hu/ hpp://translate.google.hu/# korpuszalapú : mondatonként vagy szavanként megfeleltetep szövegek fordítás = legjobban hasonlító minta célnyelvi megfelelője FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 27
Korpuszalapú fordításkutatás (Corpus- based translakon studies) Baker (1993, 1995, 1996) Laviosa (1997, 1998, 2002) Kennedy (1998) Tymoczko (1998) Stubbs (2001) Kenny (2001) Olohan (2004) Teubert (2007) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 28
Korpuszalapú fordításkutatás Baker (1993) A korpuszban összegyűjtöp szövegek: a ténylegesen használt nyelv megtestesülései a nyelvi viselkedés természetes megvalósulásai a nyelvész beleavatkozása nélkül jöpek létre FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 29
Korpuszalapú fordításkutatás Baker (1993) A korpuszalapú megközelítés empirikusan közelík meg a nyelv leírását ragaszkodik a hiteles használak előfordulások elsődlegességéhez legfontosabb feladata a fordítás eredményeként létrejöp szöveg tulajdonságainak leírása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 30
A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) kulcsfontosságúak a nem angol korpusznyelvészet számára (ázsiai nyelvek) általuk új szempontokra figyel fel a komparakv nyelvészet (ezek nem merülnek föl egynyelvű korposzok vizsgálatakor) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 31
A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) kibővikk a nyelvek kulturális és nyelvi jellemzőire vonatkozó ismereteinket megvilágítják a célnyelvi- és forrásnyelvi, valamint az autenkkus- és fordítop szövegek közöo különbségeket alkalmazásuk számos területen hasznos (lexikográfia, nyelvoktatás, fordítás) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 32
Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) szövegkorpuszok felfedezése a normakv tudományból, deskripkv tudumány a fordítop szöveg: nem rontop szöveg, önmagában is érdekes kutatási tárgy 2 eredmény: a FNYSZ primátusa megszűnik, a CNYSZ mint kutatási tárgy előtérbe kerül FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 33
Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) párhuzamos: megmutatja a ruknos fordítók megoldásait pl. Hansard szó- és mondatkonkordancia többnyelvű: a CNY elemiet természetesebb környezetben lehet vizsgálni, a jellemző lexikai kapcsolódásokat, szerkezek mintákat FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 34
A fordíto" szövegek lexikai jellegzetességének kimutatása Baker 1995: bizonyos szavak gyakrabban a FK- ban bizonyos szavaknak más a jellegzetes környezete a FK- ban a NFK bizonyos szavai nem fordulnak elő a FK- ban idegen szavak használatában eltér a FK és NFK FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 35
A fordíto" szövegek lexikai jellegzetességének kimutatása Klaudy 1986: különbség a mondat grammakkai tagolásában és a szöveg aktuális tagolásában csökken a ford. magyar szövegek kohéziója, megterhelést jelent a mondanivaló kihámozása FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 36
Vizsgált kérdések Vannak- e a fordítop szövegeknek olyan ált. tulajdonságai, amelyek megkülönböztekk az autenkkus szöv.produkciótól? Baker 1993, 1996 Vannak- e fordítási univerzálék? konf. 2001 Baker 1993 fordítási univerzálék az intuició és manuális elemzések alapján - ezt kell korpuszokkal bizonyítani v. cáfolni bizonyos nyelvi jellegzetességek eloszlása más, mint az autenkkus szövegekben (kohéziós eszk. Blum- Kulka, 1986) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 37
FordTud kutatások Aijmer/Simon- Vandenbergen (2003) translakons of well into Swedish and Dutch English- Swedish Parallel Corpus Oslo MulKlingual Corpus TripKc Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 38
Aijmer/Simon- Vandenbergen (2004) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 39
FordTud kutatások Heyvaert (1998) non- agenkve deverbal er nominalisakons in English and Dutch (such as bestseller) COBUILD Corpus Dutch INL (InsKtuut voor Nederlandse Lexicologie) Corpus FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 40
FordTud kutatások Kenny (1998, 2001) creakvity in translakon, lexical creakvity German- English Parallel Corpus of Literary Texts (GEPCOLT) Holmes (1988); Laviosa (2002) general features of translated texts (explicitakon, simplificakon, normalisakon) The TranslaKon English Corpus (TEC) FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 41
FordTud kutatások Doherty 1999: informakon structure in English and German texts Hasselga rd 1998: themakc structure Steiner 2002, 2004: informakon packaging for English- German Fabricius- Hansen 1999: : informakon packaging for German- English and German- Norwegian FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 42
FordTud kutatások Johansson 1995: explicitakon in English and Norwegian parallel texts Hansen- Schirra/Neumann/ Steiner 2006: the relakon between explicitness/explicitakon and cohesion in German- English and English- German translakons Baker 2000, Olohan 2004: translator s style Mauranen 1997: intercultural issues FTK_PHD 2011. Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány 43