Implicit tanulás vizsgálata mesterséges nyelvtan-elsajátítással



Hasonló dokumentumok
Az első számjegyek Benford törvénye

Kettőnél több csoport vizsgálata. Makara B. Gábor

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Hipotézis vizsgálatok

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Nemparametrikus tesztek december 3.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

A konfidencia intervallum képlete: x± t( α /2, df )

Centura Szövegértés Teszt

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Kísérlettervezés alapfogalmak

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Adatok statisztikai értékelésének főbb lehetőségei

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Többváltozós lineáris regressziós modell feltételeinek

A korai kéttannyelvű oktatás hatása a kisiskolások anyanyelvi szövegértési és helyesírási kompetenciájára

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

y ij = µ + α i + e ij

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

KÖZELÍTŐ INFERENCIA II.

Szakpolitikai programok és intézményi változások hatásának elemzése

Félidőben félsiker Részleges eredmények a kutatásalapú kémiatanulás terén

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Hipotézis vizsgálatok

KÖZELÍTŐ INFERENCIA II.

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Varianciaanalízis 4/24/12

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Bevezetés a hipotézisvizsgálatokba

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Segítség az outputok értelmezéséhez

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

nem kezelt 1.29, 1.60, 2.27, 1.31, 1.81, 2.21 kezelt 0.96, 1.14, 1.59

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Kísérlettervezés alapfogalmak

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Matematikai statisztika c. tárgy oktatásának célja és tematikája

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

[Biomatematika 2] Orvosi biometria

AZ ESÉLY AZ ÖNÁLLÓ ÉLETKEZDÉSRE CÍMŰ, TÁMOP / AZONOSÍTÓSZÁMÚ PÁLYÁZAT. Szakmai Nap II február 5.

Gyakorló feladatok a 2. dolgozathoz

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Egésznapos iskola vagy tanoda?

DOKUMENTUM. EDUCATlO 1995/3 DOKUMENTUM pp

Feladat. Bemenő adatok. Bemenő adatfájlok elvárt formája. Berezvai Dániel 1. beadandó/4. feladat április 13. Például (bemenet/pelda.

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Iskolai veszélyeztetettség és pályaszocializáció*

Normális eloszlás tesztje

i p i p 0 p 1 p 2... i p i

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

fa drogprevenciós Miért van szükség a drogprevenciós rész (ege ff (létesítésére? A Nemzeti Drogstratégia a büntetésvégrehajtás

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

NEVEZETES FOLYTONOS ELOSZLÁSOK

A kísérletes módszertan térnyerése az elméleti nyelvészetben. Pintér Lilla

Adatelemzés az R-ben április 25.

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Statisztikai módszerek a skálafüggetlen hálózatok

[Biomatematika 2] Orvosi biometria

Több valószínűségi változó együttes eloszlása, korreláció

2. MÉRÉSELMÉLETI ISMERETEK

Függetlenségvizsgálat, Illeszkedésvizsgálat

MÓDSZERTANI ESETTANULMÁNY. isk_4kat végzettségek négy katban. Frequency Percent Valid Percent. Valid 1 legfeljebb 8 osztály ,2 43,7 43,7

V. Gyakorisági táblázatok elemzése

Kérelem kutatásetikai engedélyhez (A kérelmet kitöltés után kérjük kinyomtatni és a kérelmező aláírásával ellátni.)

Biostatisztika Összefoglalás

egyetemi jegyzet Meskó Balázs

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Érettségi feladatok: Függvények 1/9

Iskolai jelentés. 10. évfolyam szövegértés

Kérdıívek, tesztek I. Kérdıívek

AZ ESÉLY AZ ÖNÁLLÓ ÉLETKEZDÉSRE CÍMŰ, TÁMOP / AZONOSÍTÓSZÁMÚ PÁLYÁZAT. Szakmai Nap II február 5.

Jó befektetési lehetőség kell? - Ebben van minden, amit keresel

Osztott algoritmusok

Normális eloszlás paramétereire vonatkozó próbák

Online melléklet. Kertesi Gábor és Kézdi Gábor. c. tanulmányához

Statisztikai módszerek 7. gyakorlat

IV. Változók és csoportok összehasonlítása

A kontrollált kísérlet módszere és alkalmazása a diszkriminációkutatásban. Simonovits Bori Budapest, 2011

Az emberi vér vizsgálata. Vércsoportmeghatározás, kvalitatív és kvantitatív vérképelemzés és vércukormérés A mérési adatok elemzése és értékelése

Irányított TULAJDONSÁGRA IRÁNYULÓ Melyik minta sósabb?, érettebb?, stb. KEDVELTSÉGRE IRÁNYULÓ Melyik minta jobb? rosszabb?

"Úgy nőtt fel egy nemzedék, hogy nem látott senkit dolgozni"

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

HAZAI KÉRDÕÍV-ADAPTÁCIÓK

Átírás:

Implicit tanulás vizsgálata mesterséges nyelvtan-elsajátítással Varga Ádám 1. Bevezetés Az implicit tanulás olyan tanulási folyamat, amely során a személy úgy sajátít el bizonyos ismereteket, hogy a megtanultaknak nincs tudatában, azonban használni, alkalmazni tudja azokat. Ilyen folyamatnak tekinthető például olyan kézségek elsajátítása, mint az úszás, de az anyanyelv-elsajátítás során is hasonló mechanizmusok működnek. Az implicit tanulás vizsgálatának egyik bevett kísérleti paradigmája a mesterséges nyelvtanelsajátítás vizsgálata. A módszer eredetileg Arthur S. Reber nevéhez fűződik, aki az 1960-as években dolgozta ki az eljárást[1]. Én ennek egy egyszerűsített változatát dolgoztam ki és végeztem el a tesztalanyokon. 2. A kísérlet 2.1. Alapkoncepció, feltevések A kísérlet alapfeltevése az, hogy ha az alany bizonyos szabályok alapján felépülő mondatokat lát, akkor implicit módon valamilyen mértékben elsajátítja ezeket a szabályokat, anélkül, hogy erre külön felszólítást kapna vagy hogy azokat explicit módon meg tudná nevezni. Ezt úgy tesztelhetjük, hogy a tanulási szakasz után további mondatokkal szembesítjük, amelyekről grammatikalitási ítéleteket kell hoznia. Ebben a tesztfázisban a mondatok egy része a korábbi szabályoknak megfelel, egy másik részük viszont nem. Mivel feltételezzük, hogy implicit tanulási folyamat játszódik le, ezért a várakozásunk az, hogy a kísérleti alany bizonyos mértékben el fogja tudni különíteni a grammatikus mondatokat az agrammatikusaktól, azaz a teszten a véletlenszerű tippelésnél jobb eredményt produkál. A vizsgálatban egy kontroll-csoport is részt vesz, amely tagjai a tanulási szakaszban is véletlenszerűen generált mondatokat kapnak, így a tesztfázisban a tippelésen túl nincs esélyük eltalálni a mondatok helyességét. Az implicit nyelvtan-elsajátítás meglétét végül a két csoport eredményeinek összevetésével vizsgálhatjuk. 1

2.2 A mesterséges nyelvtan Varga Ádám 2.2. A mesterséges nyelvtan A kísérlet során egy kitalált nyelvet építettem fel. A nyelv tizenhat egyszótagos szóból áll, amelyek öt szófajba lettek kategorizálva: A: dok, zsin, kan, tiz B: von, zev, lot, pod C: laf, rol D: ras, jok, rew, lekk E: kup, heg A nyelv mondatait ezt követően négy újraíró szabály generálja: S AP BP (CP) AP A (D) BP CP D CP C E A zárójeles összetevők opcionálisak, a mondatok generálása során 50%-os eséllyek jelentek meg. A szófaji kategóriákból egyenlő valószínűséggel választottuk a szavakat, azaz az A, B és D típusú szavak közül mindegyik 25%, míg a C és E típusúak közül mindegyik 50% eséllyel lett kiválasztva. 2.3. A kísérlet megvalósítása A kísérleteket egy számítógépes programmal végeztem, amelyet C++-ban írtam meg. A program volt felelős a tesztalanyokkal való kommunikációért, a mondatok előállításáért és az eredmények regisztrálásáért, így a vizsgálatot otthonról, személyes felügyelet nélkül lehetett végezni. A tesztet 22-22 alannyal végeztem el (éles- és kontrollcsoport). A program futtatáskor üdvözölte a vizsgált személyt, és bekérte az életkorát, nemét valamint a beszélt idegen nyelvek számát (bár nem terveztem ezeknek a faktoroknak a vizsgálatát, úgy gondoltam, hogy a jövőben még hasznosak lehetnek). Ezt követően az alany felszólítást kapott, hogy a most következő mondatok közül minél többet próbáljon meg memorizálni. Erre azért volt szükség, hogy fennmaradjon a figyelem, hiszen 2

2.3 A kísérlet megvalósítása Varga Ádám 1. ábra. Részlet a kísérlethez használt program forráskódjából ha mással kezdenek el foglalkozni, az implicit tanulás nem vagy csak rosszul működhetett volna. Gombnyomás után 40 mondat jelent meg egymás után a képernyőn, mindegyik négy másodpercig. Ebben a részben az éles teszt során a mondatok a fent leírt szabályoknak megfelelően lettek előállítva, míg a kontroll-kísérletek esetén véletlenszerűen előállított, de ugyanabból a tizenhat szóból álló mondatok jelentek meg. A véletlenszerű mondatok hossza 4 és 7 szó között változott egyenletes eloszlás szerint, és minden egyes helyre 1 16 valószínűséggel került valamelyik egyszótagos szó. A tanulási fázis következtével a tesztalanyoknak elárulta a program, hogy az eddigi mondatok egy rejtélyes földönkívüli nyelvből a Mortujok nyelvéből származtak, és annak nyelvtani szabályai alapján voltak felépítve. Ez után felszólítást kaptak, hogy a következő negyven mondatról próbálják meg eldönteni, hogy megfelelnek-e ezeknek a szabályoknak. Igen válasz esetén az 1-es, nem esetén a nullás billentyűt kellett lenyomni (más választ nem fogadott el a program). A tesztelési szakaszban 50-50%-os valószínűséggel jelentek meg a szabályoknak megfelelő, illetve véletlenszerű mondatok, amelyek a fentiekkel azonos módon lettek előállítva. A program egy fájlban regisztrálta az eredményeket, amit a kísérletben résztvevőknek vissza kellett küldeniük. A teszt elvégzése nagyjából tíz percet vett igénybe, a résztvevők nem kaptak anyagi ellenszolgáltatást. 3

Varga Ádám 3. Eredmények 2. ábra. A kísérlethez használt program futás közben 3.1. A csoportok összetétele és eredményei Az elemzést az R statisztikai programmal végeztem. A kísérleti csoportot 22 fő alkotta, 15 nő és 7 férfi, átlagéletkoruk 19,27, többségük két idegen nyelven beszél. A kontrollcsoport szintén 22 főből állt össze, 16 nő és 6 férfi, 18,73 év átlagéletkorral. Szintén két idegen nyelvet beszéltek többségben. A kísérlet tesztfázisában a kísérleti csoport átlagosan a mondatok 74,78%-áról tett helyes grammatikaltási ítéletet, míg a kontrollcsoport átlagosan csak 53,05%-os eredményt produkált. A pontos adatok az alábbi táblázatban vannak összefoglalva: Éles Kontroll Életkor x = 19,27 s = 1,58 x = 18,73 s = 1,24 Idegen nyelvek x = 2,09 s = 0,81 x = 2,05 s = 0,49 Eredmény (%) x = 74,78 s = 10,42 x = 53,05 s = 6,9 Az eredmények eloszlása a 3.3 ábrán tekinthető meg; bal oldalon a kísérleti- jobb oldalon a kontrollcsoporthoz tartozó eloszlás látható. 4

3.2 Az eredmények összehasonlítása Varga Ádám 0 1 2 3 4 5 6 0 1 2 3 4 5 6 0.5 0.6 0.7 0.8 0.9 0.40 0.45 0.50 0.55 0.60 0.65 0.70 3. ábra. Az éles- és a kontroll-eredmények 3.2. Az eredmények összehasonlítása A két minta átlagának összevetéséhez a Welch-próbát alkalmaztam, amivel megvizsgálható, hogy van-e szignifikáns különbség az eredmények átlagai között. A próba feltételei közül a valószínűségi változók függetlensége teljesült, valamint az adatok arányskálán vannak mérve. A normális eloszlásnak azonban csak a kontrollcsoport eredményei feleltek meg (Shapiro- Wilk-próba: W = 0,97 p = 0,62), a kísérleti csoport eredményeinek eloszlása eltért ettől (W = = 0,9 p = 0,03). A jobbra való eltolódást az ábrára ránézve is láthatjuk. Ahhoz, hogy a tesztet mégis alkalmazni tudjam, transzformálom az adatokat. Mivel a sztenderd transzformációs eljárások a balra eltolódott eloszlásokat tudják kezelni, ezért előbb tükröztem az adatokat, majd eggyel megnöveltem őket, hogy alkalmazni tudjam a logaritmikus transzformációt (hiszen 0 logaritmusa nincs értelmezve), hogy közelebb kerüljenek a normális eloszláshoz. Ezt követően visszatükröztem őket, hogy visszanyerjem az eredeti sorrendet[2]: t(f(x)) = max{ln(1+max{f(x)} f(x))} ln(1+max{f(x)} f(x)) Ezt követően a Shapiro-Wilk-próba már elfogadható eredményt ad (W = 0,92 p = 0,08). Az adatok összehasonlíthatósága érdekében a kontrollcsoport eredményein is elvégzem ugyanezt a transzformációt. 5

3.2 Az eredmények összehasonlítása Varga Ádám 0 2 4 6 8 0 2 4 6 8 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.00 0.05 0.10 0.15 0.20 0.25 4. ábra. Az éles- és a kontroll-eredmények a transzformáció után éles kontroll 0 1 2 3 4 0.1 0.0 0.1 0.2 0.3 0.4 5. ábra. A két minta transzformált sűrűségfüggvényei 6

Varga Ádám A Welch-próba nullhipotézise, hogy a két minta átlaga megegyezik. A tesztet lefuttatva a következő eredményekhez jutunk: t = 4,08 p = 0,0002. Tehát elutasítjuk a nullhipotézist, és kijelenthetjük, hogy a két mintában az eredmények átlagai szignifikánsan eltérnek egymástól 0,05-ös szignifikanciaszint mellett. 4. Összefoglalás A kísérlet elvégzése és az eredmények összevetése után láthattuk, hogy azok az alanyok, akik a tanulási fázisban a mesterséges nyelvtan alapján generált mondatokkal találkoztak, szignifikánsan jobb eredményt értek el a kontrollcsoport tagjainál. Ezek alapján kijelenthetjük, hogy a teszt kimenetele megfelelt várakozásainknak, azaz feltételezhetjük a szintaktikai szabályok implicit elsajátítását és tudatalatti használatát. Hivatkozások [1] Reber, Arthur S.: Implicit Learning of Artificial Grammars. Journal of Verbal Learing and Verbal Behavior 6:855-863, Providence 1967. [2] Osborne, Jason W.: Notes on the use of data transformations. Practical Assessment, Research & Evaluation 8(6), 2002. 7