A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel. Rung András BME Fizikai Intézet



Hasonló dokumentumok
Rung András. Magyar főnévi alaktani jelenségek analógiás megközelítésben. című doktori értekezéséhez

T ÉZISEK. Rung András. Magyar főnévi alaktani jelenségek analógiás megközelítésben

Rung András. Magyar főnévi alaktani jelenségek analógiás megközelítésben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Korreláció számítás az SPSSben

Kapcsolatháló-elemzés az iskolai közösségek vizsgálatában II.

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Logisztikus regresszió

A Mazsola KORPUSZLEKÉRDEZŐ

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Előrejelzett szélsebesség alapján számított teljesítménybecslés statisztikai korrekciójának lehetőségei

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Az értékelés során következtetést fogalmazhatunk meg a

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

A digitális korszak kihívásai és módszerei az egyetemi oktatásban

A KONFLIKTUS, AMI ÖSSZEKÖT A kirekesztéstől a befogadásig

Korreláció és lineáris regresszió

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Centura Szövegértés Teszt

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Matematikai geodéziai számítások 6.

Diszkriminancia-analízis

Tartalomjegyzék. Köszönetnyilvánítás. 1. Az alapok 1

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

Vajda Éva. Bevezetés a keresőmarketingbe

Térinformatikai algoritmusok Elemi algoritmusok

Számítógépes döntéstámogatás. Statisztikai elemzés

Először éljenek együtt, de azután Az élettársi kapcsolatok megítélése Magyarországon és Európában

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Korrelációs kapcsolatok elemzése

Hatékonyság 1. előadás

A magánhangzók fonológiai rendszere

Automatizált frekvenciaátviteli mérőrendszer

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Hogyan lesz adatbányából aranybánya?

Térinformatikai algoritmusok Elemi algoritmusok

A TANÁROK TANÍTÁSSAL KAPCSOLATOS

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Többváltozós lineáris regressziós modell feltételeinek

Abban a farmerba nem mehetsz színházba. A (bvn) variabilitásának vizsgálata a BUSZI tesz9eladataiban

Szoftver karbantartási lépések ellenőrzése

Nem-lineáris programozási feladatok

S atisztika 2. előadás

Matematikai geodéziai számítások 6.

Vienna Test System Sportpszichológiai méréssel a sikerért

Kísérletek tervezése és értékelése

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

VÁROS- ÉS INGATLANGAZDASÁGTAN

Vizuális nyelv. Olvasás és írás. Ellis, W. (2004) Olvasás, írás és diszlexia október

A MEGÚJULÓ ENERGIAPOTENCIÁL EGER TÉRSÉGÉBEN A KLÍMAVÁLTOZÁS TÜKRÉBEN

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Java-ról Kotlinra. Ekler Péter AutSoft BME AUT. AutSoft

Tények és tévhitek az Országos kompetenciamérés adatairól. Oktatási Hivatal Köznevelési Programok Főosztálya

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Kísérlettervezés alapfogalmak

Bevezetés a Korreláció &

GONDOLKODÁS ÉS NYELV

Fizikailag aktív és passzív szabadidőeltöltési formák néhány összefüggése egymással és a pszichés jólléttel serdülőkorúak körében 2010-ben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

[Biomatematika 2] Orvosi biometria

Lineáris regresszió vizsgálata resampling eljárással

Első egyéni feladat (Minta)

Tartalomjegyzék TARTALOMJEGYZÉK SZÁMOK B MENNYISÉGEK, BECSLÉS, MÉRÉS. A SZÁMOK témakörének sz akmódszertani alapjai

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hő- és füstelvezetés, elmélet-gyakorlat

Mérési hibák

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Dr. Kanyó Ferenc, Bauer Márton. A tűzoltók fizikai állapotfelmérések új alapjai

Vegyszermentes faanyagvédelem A faanyagok hőkezelése A vizsgálati eredmények összegzése

NYEK REÁL JELLEG, KÉT TANÍTÁSI NYELVŰ OSZTÁLY

Visszatérítendő támogatások: lakáscélú, munkaeszközcélú kölcsönök (a kifizetések sorrendjében)

SÜDI ILONA. Bemeneti pillanatkép a 2010/2011. tanévi kilencedikesekről OKM FIT változások

Takács Bence GPS: pontosság és megbízhatóság. Földmérők Világnapja és Európai Földmérők és Geoinformatikusok Napja Budapest, március 21.

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

A spontán beszéd kísérőjelenségei

Kettőnél több csoport vizsgálata. Makara B. Gábor

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

Akusztikai tervezés a geometriai akusztika módszereivel

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Grafikonok automatikus elemzése

Biostatisztika VIII. Mátyus László. 19 October

Témaválasztás, kutatási kérdések, kutatásmódszertan

emberi kivonatolás Lengyelné dr. Molnár Tünde

Osztott paraméterű éghajlat-lefolyás modell építése a Zala vízgyűjtőjén

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Horváth Krisztina Pécsi Tudományegyetem Közgazdaságtudományi Kar Regionális Politika és Gazdaságtan Doktori Iskola, III. évfolyam

11. modul: LINEÁRIS FÜGGVÉNYEK

A dokumentum egy feladatgyűjtemény harmadik fejezetének előzetes változata.

STATISZTIKAI PROBLÉMÁK A

ÓRAREND érvényes október ÉV TANITÓKÉPZŐ. HÉTFŐ KEDD SZERDA CSÜTÖRTÖK PÉNTEK Testnevelés Német ny. 4 8,00-8,45

A pozicionális elit összetétele digitalizált választási jegyzőkönyvekben

Átírás:

A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel Rung András BME Fizikai Intézet

Alapelvek Produkció és megértés analógiás alapon szabályok helyett Az analógiás források kiválasztásához pontos hasonlósági mérce kell A pontos mérce számítógépesen modellezhető A hasonlósági mércének mentálisan reálisnak kell lennie az anyanyelvi beszélők a fonológiailag hasonlónak érzett/tartott elemeket morfofonológiailag hasonlónak hajlamosak venni Rebrus és Törkenczy 2008: 757 Minél hasonlóbb egy szó az analógia forrásául szolgáló szóhoz, annál hasonlóbban fog viselkedni

Célok Megmutatni, hogy a hasonlóság toldalékolás szempontjából a jobb széleken fontosabb Nem csak a legszélső fonéma számít Megmutatni, hogy analógiás algoritmikus modellünkkel modellezhető a viselkedés

Előzmények Lukács Ágnes: Alaktanilag kivételes tövek vizsgálata a magyarban (2002) Hangok hasonlóságának hatása a szóalakok hasonlóságára a pozíció függvényében Nem csak hangkivetőket vizsgált Nem a pozíciók fontosságára volt kiélezve a teszt Alacsony elemszám, nem szisztematikus eltérések, nem tökéletes illeszkedés a sémára Nem volt megfelelő korpuszháttér (gyakoriság számítása)

Módszer Online teszt (30-40 perc), 110 kérdés (4 változatban) Első mondat tesztszó Másodikban kiegészítést vártam Öt/három választási lehetőség Nem közöltem, hogy álszavak

A szopor vállon hordható prém volt. A... főleg nemesasszonyok engedhették meg maguknak. szoprat szoprot szoport szoporot szoporat

Tesztanyag Valódi CVCVC szerkezetű hangkivető főnevekre hasonlító CVCVC szerkezetű álszavak (364 db), mint pl. böcök, purok Fontos, hogy a tesztszavak valódi szavakat is felidézzenek és megfeleljenek a ~VC α (o/e/ö)c β # sémának Minden valódi szónak négy változatát készítettem el: pl. kapor: gapor, kopor, kabor, kapol Lecserélésre használt fonéma a lehető legközelebbi legyen a lecserélthez A tesztben szereplő álszavakat úgy hoztam létre, hogy a valódi szavak 1., 2., 3., illetve 5. fonémáját lecseréltem egy másikra.

Fonémák a pozíciókban 1. pozíció fonémái b, c, cs, d, f, g, gy, h, k, l, m, ny, p, r, s, sz, t, v 2. pozíció fonémái e, i, ö, ü, o, u, a 3. pozíció fonémái b, c, cs, d, g, gy, j, k, l, m, p, r, s, sz, t, ty, z 5. pozíció fonémái cs, g, j, k, l, m, n, ny, r, sz, z

Résztvevők 13% 7% 3% 23% 116 magyar anyanyelvű beszélő 75 nő, 51 férfi 36,8%-os hangkivetés 54% 14-17 18-24 25-39 40-59 60-

GLM ismételt mérések Változtatás helye hangkivetés mértéke Szignifikáns eltérések szórás min. max. leginkább hangkivető szavak 1. fonéma 44,2% > 3. fonéma *** > 5. fonéma *** 21,9 0% 93,1% lücsök, rucsok, böcök, pürök, dücsök 2. fonéma 41,5% > 5. fonéma *** 20,1 0% 86,2% pücök, vücsök, vocok 3. fonéma 39,2% > 5. fonéma *** 22,1 0% 79,3% vöcök, rücök, tücök, tüszök, surom 5. fonéma 22,5% 13,5 0% 58,6% sulyog, hurocs, bögöl

Pozíció és a hangkivetés mértékének korrelációja 1. fonéma változtatás 2. fonéma változtatás 3. fonéma változtatás 5. fonéma változtatás Szószablya tárgyeset 0,320** 0,263* 0,345*** 0,205 (n.sz.) Google tárgyeset 0,279** 0,207* 0,227* 0,185 (n.sz.)

Az algoritmikusan meghatározott leghasonlóbb hangkivető szavak számának (100 leghasonlóbból) és a tesztszavak hangkivetési mértékének együttjárása

A tesztszavak hangkivetését befolyásoló változók (lépésenkénti lineáris regresszió) Béta Szignifikancia Legközelebbi hangkivető szavak száma (komplex tengelymérték) 0,459 p < 0,001 Eredeti szavak hasonlósága a gyakorisági prototípusokhoz (komplex tengelymérték) -0,463 p < 0,001 Hangkivetési mérték (Szószablya) 0,250 p < 0,001 Legközelebbi szó hangkivető-e (komplex jegymérték) 0,174 p < 0,001 Eredeti szó hasonlósága a 0,9-es küszöbérték mellett kiválasztott prototípusokból és a leggyakoribb szavakból létrehozott halmaz szavaihoz Eredeti szó hasonlósága (komplex a 0,7-es tengelymérték) küszöbérték mellett kiválasztott 0,268 p < 0,01 prototípusokhoz (komplex tengelymérték) -0,120 p < 0,01 Tárgyesetű alak hangkivetési mértéke (Google) -0,129 p < 0,05 Legközelebbi hangkivető szavak száma (komplex jegymérték) 0,126 p < 0,05

Köszönöm a figyelmet! rungandras@gmail.com