Magyar nyelvjárási adattárak vizsgálata interaktív dialektometriai térképekkel



Hasonló dokumentumok
A MNyA. és a RMNyA. integrált dialektometriai elemzése

Román kölcsönszói hatások A moldvai csángó nyelvjárás atlasza nyelvi hasonlósági viszonyaiban

A romániai magyar nyelvjárások atlasza informatizált térképlapjainak kvantitatív nyelvföldrajzi vizsgálata Vargha Fruzsina Sára

A romániai magyar nyelvjárások atlasza informatizált térképlapjainak kvantitatív nyelvföldrajzi vizsgálata *

Lexikai, fonológiai, fonetikai stabilitás (és relevancia) a magyar nyelvjárásokban

Nyelvatlaszok a szekrényben

A dialektometria alkalmazása és történeti helynevek nyelvföldrajzi vizsgálata a Székelyföldön*

Települések közti nyelvjárási és névföldrajzi hasonlósági viszonyok összevető elemzése Vas és Zala megyében

Nyelvjárási és helynévtörténeti anyagok geolingvisztikai kutatása Részletes kutatási terv

Cs. Nagy Lajos. Dialektológiai kutatások a PPKE BTK Magyar Nyelvészeti Tanszékén

DITRÓI ESZTER. Vas és Zala megyei helynévföldrajzi térképlapok statisztikai alapú összevetése

Élı nyelv 335. Régi nyelvatlaszok új módszerek Nyelvtechnológiai eljárások a nyelvföldrajzban

A dialektológia számítógépes támogatása

1. A nyelvföldrajz és a nyelvföldrajz munkaeszköze : a nyelvatlasz

A TANTÁRGY ADATLAPJA

Nyelvjárási és helynévtörténeti anyagok geolingvisztikai kutatása

A magyar nyelvjárások osztályozása NFJ 2017

A TANTÁRGY ADATLAPJA

Módszertani problémák a szigethelyzetű települések földrajzi köznévi adatainak vizsgálatában*

A hangzó adat szerepe a magyar dialektológiában

VI. DIALEKTOLÓGIAI SZIMPOZION DIALEKTOLÓGIAI KUTATÁSOK AZ EZREDFORDULÓ UTÁN SZOMBATHELY, SZEPTEMBER 2 4. PROGRAM szeptember 2.

Névföldrajzi térképlapok klaszteranalízise Zala megye helynevei alapján*

VI. Dialektológiai Szimpozion

Lokalizálható nyelvtörténeti adatok informatizálása és térképezése

A TANTÁRGY ADATLAPJA

MAGYAR NYELV. A romániai magyar nyelvjárások atlaszának kiadásés recepciótörténetéhez * 112. ÉVF NYÁR 2. SZÁM

Hegedűs Andrea NYELVFÖLDRAJZI VIZSGÁLATOK A ROMÁNIAI MAGYAR NYELVTERÜLETEN AZ EGYESÍTETT ATLASZOK FELHASZNÁLÁSÁVAL

AZ ADATOK KOR ÉS NEM SZERINTI MEGOSZLÁSA A MAGYAR NYELVJÁRÁSOK ATLASZA ELLENŐRZŐ GYŰJTÉSÉBEN

Borsos Balázs, A magyar népi kultúra regionális struktúrája

ÉLŐNYELV. Az á előtti illabiális ȧ-zás a Csallóközben

A méretaránytényező kérdése a földmérésben és néhány szakmai következménye

Hangváltozások és gyakorisági eloszlások

Murádin László, Erdélyi magyar nyelvföldrajz

TÉRINFORMATIKA II. Dr. Kulcsár Balázs Ph.D. adjunktus. Debreceni Egyetem Műszaki Kar Műszaki Alaptárgyi Tanszék

A MAGYAR NYELVVÁLTOZATOK GEOLINGVISZTIKAI KUTATÁSA

Kockázatmenedzsment a vállalati sikeresség érdekében. ISOFÓRUM XXIII. NMK Balatonalmádi, Dr. Horváth Zsolt (INFOBIZ Kft.

Készítette: Molnár Dávid. Beszédadatbázisok. A BUSZI és a nyelvjárási hangarchívumok

Panorámakép készítése

Tukacsné dr. Károlyi Margit publikációs jegyzéke Cikkek, tanulmányok

Merre tovább, magyar nyelvföldrajz? * Juhász Dezső

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

Tukacsné dr. Károlyi Margit publikációs jegyzéke Cikkek, tanulmányok

A magyar dialektológia 1980 utáni történetéhez

Az új magyar Braille-rövidírás kialakítása

DOKTORI DISSZERTÁCIÓ NYELVTERÜLETEN AZ EGYESÍTETT ATLASZOK FELHASZNÁLÁSÁVAL

MAGYAR NYELV. A romániai magyar nyelvjárások atlaszának kiadásés recepciótörténetéhez * 112. ÉVF NYÁR 2. SZÁM

INNOVATÍV TUDOMÁNY. Papp Árpád: Az etnokartográfia számítógépes elemzési. lehetőségei

Pontfelhő létrehozás és használat Regard3D és CloudCompare nyílt forráskódú szoftverekkel. dr. Siki Zoltán

Termék modell. Definíció:

Számítógép és programozás 2

Statisztikai módszerek felhasználási lehetőségei az összehasonlító névtudományban*

Mutatószámrendszer együttműködések hatékonyságának mérésére

NÉVFÖLDRAJZI JELENSÉGHATÁROK ERDÉLYBEN Mutatvány az erdélyi helynévföldrajzi atlaszból

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Szóföldrajzi adalékok egy ételfajta megnevezéséhez Molnár Zoltán Miklós

Tukacsné dr. Károlyi Margit publikációs jegyzéke Cikkek, tanulmányok

A MAGYAR NYELVVÁLTOZATOK GEOLINGVISZTIKAI KUTATÁSA

KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN

A disszertáció szerkezete

Nyugat-Magyarország kapuja. Firbás György - Dr. Vadvári Tibor Oláh Gábor. Óbudai Egyetem, augusztus 30.

A zsírosbödöntől a zsírosbögréig

7. Régió alapú szegmentálás

SZEGED HÓDMEZŐVÁSÁRHELY

Beszámoló a 20. élőnyelvi konferenciáról

EREDMÉNYLAP. 1. Forduló 2. Forduló Forduló Összevetés. Versenyző. Országos "C" Kategóriás Bajnoki döntő IDŐ HP H IDŐ HP H IDŐ HP H IDŐ HP H

Mátrix-alapú projektkockázatmenedzsment

Szakmai zárójelentés A magyar nyelvváltozatok geolingvisztikai kutatása című projekthez

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

MAGYAR NYELV- ÉS NYELVJÁRÁSSZIGETEK ROMÁNIÁBAN

AZ INNOVÁCIÓS POTENCIÁL MÉRÉSE KIS- ÉS KÖZÉPVÁLLALKOZÁSOK SZÁMÁRA

TÁJNYELV, KÖZNYELV, BESZÉLŐK

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

transit TÜKE BUSZ Zrt. menetrend app Felhasználói kézikönyv Verzió: transit t HC LINEAR MŰSZAKI FEJLESZTŐ KFT.

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

A Szállítási feladat megoldása

MTA, Ökológiai Kutatóközpont, Ökológiai és Botanikai Intézet

Magassági kitőzések elve és végrehajtása

PONTFELHŐ REGISZTRÁCIÓ

VÖRÖS FERENC. Mutatvány az 1720-as országos összeírás névföldrajzából

Követéses geolingvisztikai vizsgálat Moldvában

Algoritmusok bonyolultsága

A pályakövetési rendszerek fejlesztésének hazai és nemzetközi irányai

PÁLYÁZATI ADATLAP intézetvezetői, tanszékvezetői, tanszékcsoport-vezetői tisztség betöltésére

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Vezetői számvitel / Controlling XIII. előadás. Eltéréselemzés I.

Hangok helyek. Tanulmányok dialektológiai adattárak és helynévtárak számítógépes feldolgozásáról. szerkesztette Bárth M. János és Vargha Fruzsina Sára

Az automatizáció munkaerőpiaci. Nábelek Fruzsina elemző, MKIK GVI

A dialektusok mai helyzetéről a nyelvjárásgyűjtések tükrében

Mozgásvizsgálatok. Mérnökgeodézia II. Ágfalvi Mihály - Tóth Zoltán

Landorhegyi Általános Iskola,Sportiskola "Pais anyanyelvi verseny" I. korcsoport

Pállné dr. Lakatos Ilona citációs jegyzéke

Country Movers. Cesium alapú planetáris kartográfiai szemléltető eszköz. 5. Nyílt forráskódú térinformatikai munkaértekezlet

R5 kutatási feladatok és várható eredmények. RFID future R Király Roland - Eger, EKF TTK MatInf

Revit alapozó tanfolyam

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

A történeti személynévföldrajz mint a nyelvföldrajz egyik kutatási

Revit alaptanfolyam szerkezettervezőknek

Bevezetés a nyelvtudományba. 2. Fonetika

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Átírás:

Magyar nyelvjárási adattárak vizsgálata interaktív dialektometriai térképekkel Vargha Fruzsina Sára Vékás Domokos A dialektometriai projekt megvalósítását 2007. november 1. és 2008. augusztus 31. között a Bihalbocs támogatása tette lehetővé. A számítógépes dialektológiai projektek jellemzően kiegészítik egymást, egymásra is épülnek. Éppen ezért már előzetesen is köszönetet szeretnénk mondani mindazoknak, akik korábbi, szintén Bihalbocs technológiákat használó projektekben részt vettek, és így közvetve segítették a mostani dialektometriai vállalkozást. Elhangzott a Magyar Nyelvtudományi Társaság felolvasóülésén, 2009. március 24-én 1

A dialektometria helye és súlya a számítógépes dialektológia viszonylag kis területe (Vékás 2007) prioritás a számítógépes dialektológiában: beszéltnyelvi (orális) korpuszok építése dialektometriára jutó erőforrások és erőfeszítések: mintegy 10% 2

Miről lesz szó? a dialektometria kialakulása és mai fogalma kutatópontok nyelvi rokonítása különböző kvantitatív módszerekkel a nyelvföldrajzi perspektíva változása: honnan nézzük a nyelvterületet? nyelvjárások közötti genetikai kapcsolatok vizsgálatának kérdése területek elhatárolásának kérdése 3

Hagyományos nyelvföldrajzi módszerek feladat: nyelvjárások klasszifikációja probléma: nyelvjárási határok kontinuum hagyományos módszerek: izoglosszák (izoglosszanyalábok = határok) vonallal nem mindig választhatók el területek szubjektív, önkényes (fokozatos változásnál) izoglosszák ritkán esnek egybe fonémarendszerek különböző nyelvjárások, azonos fonémarendszer 4

A dialektometria reakció hagyományosabb nyelvföldrajzi módszerek vélt elégtelenségére Magyar dialektológia (Kiss J.) kvantitatív módszerek használata a kritérium nem térképközpontú nyelvjárásiasság/köznyelviesség mértéke Séguy (szomszédos k.pontok összevetése) Mátrix alapú interaktív térképek Goebl (munkatérképek manuális csoportosítással) Nerbonne, Heeringa (Levenshtein algoritmusa) 5

A térképközpontú magyar dialektometria előjelei... térképen vagy más formában ábrázolható elvont jelenségekhez juthatunk, ahol a konkrét adatokhoz való kapcsolódás sokszorosan áttételes. Vékás (1999) Az új nyelvatlaszok adatainak dialektometriai, azaz nyelvjárásmérési elemzése közelebb visz bennünket a dialektológia régi-új problémájának a megnyugtatóbb megoldásához, a nyelvjárások tipizálásához is. Kiss (2001) 6

Eldöntendő: saját fejlesztések szükségessége A fejlesztések roppant erőforrásokat igényelnek, és fenntartásuk nehezen biztosítható (Goebl esete) Van kész módszer! RuG/L04 (http://www.let.rug.nl/~kleiweg/l04/) A saját fejlesztések korlátlan lehetőségeket biztosítanak 7

Kutatópontok összevetése a Somogy zalai nyelvatlaszból, fő- és alkategóriák szerint, Király Lajos csoportosítása alapján KUTATÓP. ADAT (85. TÉRKÉPLAP) KAT. (85.) BÜSSÜHÖZ KÉPEST (85. T.) BÜSSÜHÖZ KÉPEST (ÖSSZES T.) Büssü marasztajja 1.1. 100% 100,0% Ráksi maraszta jja 1.1. 100% 86,1% S.vámos maûraûsztu ja 1.2. 50% 68,7% Gelsesziget marasztâalla 2.1. 0% 43,2% 8

Mátrix kialakítása (S ZA.) Király Lajos csoportosítása alapján % Büssü Ráksi S.vámos Gelsesziget Büssü 100,0 Ráksi 86,1 100,0 S.vámos 68,7 68,3 100,0 Gelsesziget 43,2 43,6 47,4 100,0 9

S ZA. dialektometriai térképek 1. Király Lajos csoportosítása alapján BÜSSÜ 10

Levenshtein algoritmusa távolság mérése két betűlánc között távolság mérése két nyelvváltozat között adatpárok összehasonlításával a betűláncok közötti transzformációhoz szükséges beillesztések, törlések, helyettesítések legkevésbé költséges (legkevesebb lépésből álló) kombinációja első dialektológus alkalmazó: Kessler (1995) tökéletesítők: Nerbonne és Heeringa 11

Adatok összevetése Levenshtein algoritmussal vakondak ES dj0 dj2 dj4 12

S ZA. dialektometriai térképek 2. viszonyítási pont: Büssü, különböző mátrixok 1. Fonetikailag legigényesebb 2. Alapjeleket és mellékjeleket külön is figyelembe vesz 3. Mellékjelbeli eltérés általában nem számít 4. Fonetikai különbségekre szinte érzéketlen 13

S ZA. dialektometriai térképek 3. Király Lajos csoportosítása alapján BÜSSÜ 14

S ZA. dialektometriai térképek 3. Király Lajos csoportosítása alapján BÜSSÜ 3. Mellékjelbeli eltérés általában nem számít 14

Számítási módszerek összevetése Viszonyítási pont: Büssü KL dj0 ES dj2 dj4 Büssü 1000 1000 1000 1000 1000 Ráksi 861 870 870 878 958 S.vámos 687 755 772 774 926 Gelsesziget 432 608 617 673 871 KL: Király Lajos csoportosítása alapján dj0: két hang csak akkor azonos, ha a mellékjelek szintjén is az ES: az alapjelek egyezését figyelembe veszi, de a mellékjelek is számítanak dj2: a mellékjelek nem számítanak, kivéve pl. nyílt e esetén dj4: magánhangzók közti különbségek nem számítanak, több rokon mássalhangzót is összemosunk (pl. ty = gy) 15

MNyA. dialektometria 395 kutatópont mátrix mérete: 156.025 darab számadat 476 felhasznált térképlap gyakorlati (nem nyelvészeti) szempontú válogatás mindegyik térkép sűrű kutatóponthálózatú az újkeletűnek minősített adatok nélkül 16

Nyelföldrajzi kapcsolatok kimutatása különböző mátrixok használatával: Mihályi Mátrix: dj0 17

Nyelföldrajzi kapcsolatok kimutatása különböző mátrixok használatával: Mihályi Mátrix: dj4 17

Nyelföldrajzi kapcsolatok kimutatása különböző mátrixok használatával: Ecseg Mátrix: ES 18

Nyelföldrajzi kapcsolatok kimutatása különböző mátrixok használatával: Ecseg Mátrix: dj4 18

Torontáltorda Mátrix: ES Torontáltorda 100% Rekesz: 26 Földeák 90,1% Tiszasziget 89,9% Algyő 89,9% Újkígyós 89,6% Sövényháza 89,4% Izsák 87,7% Nagykőrös 87,1%... Kórógy 58,7% Lozsád 55,9% 19

Torontáltorda Mátrix: ES Torontáltorda 100% Legközelebbi kutatópontok Földeák 90,1% Tiszasziget 89,9% Algyő 89,9% Újkígyós 89,6% Sövényháza 89,4% Izsák 87,7% Nagykőrös 87,1%... Kórógy 58,7% Lozsád 55,9% 19

Velika Pisanica Mátrix: dj0 20

Velika Pisanica Mátrix: dj4 20

Orosháza (Szentetornya): fonetikailag érzéketlen mátrix Mátrix: dj4 21

Orosháza (Szentetornya): fonetikailag érzéketlen mátrix Mátrix: dj4 szűrés: Kunágota 21

Orosháza (Szentetornya): fonetikailag érzékeny mátrix Mátrix: ES 22

Orosháza (Szentetornya): fonetikailag érzékeny mátrix Mátrix: ES szűrés: Kunágota 22

Kupuszina (Bácskertes) Mátrix: ES 23

Kupuszina (Bácskertes) Mátrix: ES szűrés: Dávod 23

Nagyhind Mátrix: ES 24

Kórógy 1. Mátrix: ES 25

Települések kapcsolatai állandó arányokkal Mátrix: ES; rekesz: 57 Kórógy Szuhogy Mihályi Ecseg 26

Csernátfalu Mátrix: ES 27

Csernátfalu Mátrix: ES szűrés: Kobátfalva 27

Csíkrákos Mátrix: ES 28

Csíkrákos Mátrix: dj4 28

Benkő L. válogatása (1966) Csíkrákos Mátrix: dj4 98 térképlap ritka kutatóponthálózat 29

Benkő L. válogatása (1966) Csíkrákos Mátrix: dj4 98 térképlap ritka kutatóponthálózat 29

Kórógy 2. Mátrix: ES 30

Kórógy 2. Mátrix: ES Benkő Loránd válogatása alapján 30

Kutatópontok csoportosítása, területek meghatározása automatizált csoportosítás hasonlóság alapján, nyelvész közreműködése nélkül klaszteranalízis többdimenziós skálázás félig automatizált csoportosítás (a gócpontokat nyelvész jelöli ki) 31

Nyelvjárási régiók :-) Kiindulási mátrix: ES Mihályi, Gyanógeregye, Z.tárnok Izsap, Csákberény Kaposgyarmat, Old, M.egregy Tiszasziget Ecseg, Tornagörgő, Palást Köröstarcsa, Hosszúpályi Kék Vajdakamarás Kijelölt gócpontok 32

Miből lesz térkép? A dialektometriai térképek feltétele: informatizált nyelvjárási adattár létrehozása MNyA.: Balogh Lajos, Bodó Csanád, Bükkösi Hajnal, Vékás Domokos (és mások) S ZA.: Király Lajos, Vargha Fruzsa, Cs. Nagy Lajos (és mások) 33

Kitekintés adattárak dialektometriai célú integrálása dialektometriai térkép akusztikai adatokból a kiadatlan MNyA.-térképlapok informatizálása Köszönjük a figyelmet! www.bihalbocs.hu 34