Kvantitatív tudásmérés Dr. Balázs Béla LEXINFO Informatikai Nyelvvizsga-központ



Hasonló dokumentumok
6. Előadás. Vereb György, DE OEC BSI, október 12.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hazánkban jelentõs múlttal rendelkeznek a klasszikus tesztelméleti módszerekkel

Exponenciális, logaritmikus függvények

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Többváltozós lineáris regressziós modell feltételeinek

Az objektív mérést a természettudósok már rutinszerûen alkalmazzák. Gondoljunk

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Készítette: Fegyverneki Sándor

1/8. Iskolai jelentés. 10.évfolyam matematika

Biostatisztika VIII. Mátyus László. 19 October

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

EGY IRT-ALAPÚ NYELVI FELADATBANK LÉTREHOZÁSÁNAK MÓDSZERTANI KÉRDÉSEI A német érettségi vizsgafeladatok elemzésének eredményei

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

A PARCIÁLIS KREDIT MODELL EGY ALKALMAZÁSA APPLYING THE PARTIAL CREDIT MODEL. Kontra József Kaposvári Egyetem, Kaposvár, Magyarország

MI VAN A VIZSGAFELADAT MÖGÖTT? A MINŐSÉGBIZTOSÍTÁS ELEMEI A NYELVVIZSGÁZTATÁSBAN VADÁSZ ISTVÁNNÉ

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Pszichometria Szemináriumi dolgozat

Iskolai jelentés. 10. évfolyam szövegértés

Középiskolások olvasás iránti attitűdjeinek vizsgálata klasszikus és modern tesztelméleti eszközökkel

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

2012. ÉVI KOMPETENCIAMÉRÉS

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Teszt elemzési beszámoló

A maximum likelihood becslésről

Normális eloszlás tesztje

Kompetencia MATEMATIKA. Az intézmények átlageredményeinek összehasonlítása

y ij = µ + α i + e ij

A valószínűségszámítás elemei

Számítógépes döntéstámogatás. Statisztikai elemzés

COOPERATION IN THE CEREAL SECTOR OF THE SOUTH PLAINS REGIONS STRÉN, BERTALAN. Keywords: cooperation, competitiveness, cereal sector, region, market.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

1. Gauss-eloszlás, természetes szórás

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

KÖVETKEZTETŐ STATISZTIKA

Biomatematika 2 Orvosi biometria

Mindenkinek ismerősek a fizikai világ mérési skálái, akár a tegnapi minimum hőmérsékletről,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 12. mérés: Infravörös spektroszkópia május 6.

A Markowitz modell: kvadratikus programozás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Iskolai jelentés. 10. évfolyam szövegértés

Kompetencia osztály MATEMATIKA. Az intézmények átlageredményeinek összehasonlítása

HELYZETELEMZÉS A TELEPHELYI KÉRDŐÍV KÉRDÉSEIRE ADOTT VÁLASZOK ALAPJÁN

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

Aszámítógépre alapozott adaptív tesztelés elméleti alapjainak kidolgozása már a

[Biomatematika 2] Orvosi biometria

KÉPI INFORMÁCIÓK KEZELHETŐSÉGE. Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet. Összefoglaló

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

[Biomatematika 2] Orvosi biometria

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

FIT-jelentés :: Rózsakerti Általános Iskola 1223 Budapest, Rákóczi u. 16. OM azonosító: Telephely kódja: 001. Telephelyi jelentés

név a kutatási téma címe jelentkezési tudományág helyszín program neveléstudományok BTK Nyelvpedagógia Brózik-Piniel Idegennyelvi-szorongás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FIT-jelentés :: Szent Imre Katolikus Általános Iskola 6792 Zsombó, Móra Ferenc utca 8. OM azonosító: Telephely kódja: 001

FIT-jelentés :: Avasi Gimnázium 3524 Miskolc, Klapka Gy. u. 2. OM azonosító: Telephely kódja: 001. Telephelyi jelentés

Az értékelés a következők szerint történik: 0-4 elégtelen 5-6 elégséges 7 közepes 8 jó 9-10 jeles. A szóbeli vizsga várható időpontja

Osztályozóvizsga követelményei

Varianciaanalízis 4/24/12

Biomatematika 2 Orvosi biometria

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

A Markowitz modell: kvadratikus programozás

A ÉVI KOMPETENCIAMÉRÉS FIT- JELENTÉSEINEK ÚJ ELEMEI

Valószínűségi változók. Várható érték és szórás

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

A Statisztika alapjai

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

egyenlőtlenségnek kell teljesülnie.

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

FIT-jelentés :: Avasi Gimnázium 3524 Miskolc, Klapka Gy. u. 2. OM azonosító: Telephely kódja: 001. Telephelyi jelentés

Mérési hibák

Átlageredmények a évi Országos Kompetenciamérésen. matematikából és szövegértésből

FIT-jelentés :: Kispesti Deák Ferenc Gimnázium 1192 Budapest, Gutenberg krt. 6. OM azonosító: Telephely kódja: 001. Telephelyi jelentés

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematika. Xántus János Két Tanítási Nyelvű Gimnázium és Szakgimnázium OM azonosító: Telephelyi jelentés Telephely kódja: 001

SZÁMÍTÓGÉP ALAPÚ ADAPTÍV ÉS LINEÁRIS TESZTEK ÖSSZEHASONLÍTÓ

Fazekas Mihály Fővárosi Gyakorló Általános Iskola és Gimnázium

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Abszorpciós spektroszkópia

(Independence, dependence, random variables)

A beruházások döntés-előkészítésének folyamata a magyar feldolgozóipari vállalatoknál

Kutatásmódszertan és prezentációkészítés

Matematika. 9.osztály: Ajánlott tankönyv és feladatgyűjtemény: Matematika I-II. kötet (Apáczai Kiadó; AP és AP )

6. Folytonosság. pontbeli folytonosság, intervallumon való folytonosság, folytonos függvények

FIT-jelentés :: Intézményi jelentés. Összefoglalás

Teszt elemzési beszámoló

Átírás:

Kvantitatív tudásmérés Dr. Balázs Béla LEXINFO Informatikai Nyelvvizsga-központ ÖSSZEFOGLALÁS Az utolsó 25-30 évben a tudásmérés területén végzett kutatások intenzitása exponenciálisan növekedett. Állandó gondot jelent azonban, hogy a vizsgáztatás/tesztelés mindennapos gyakorlata távolról sem fejlődik olyan gyorsan, mint a tesztkészítés elmélete. A gyakorlati szakemberek arra panaszkodnak, hogy az elméleti cikkeket nehéz megérteni, és azok gyakran számukra irrelevánsnak tűnnek, vagy legalábbis napi praxisuktól távol eső témákról szólnak. A kutatók és a gyakorlati szakemberek ritkán kooperálnak. Már érzékelhető azonban, hogy a légkör lassan változik, mindenekelőtt azért, mert a Winsteps programcsomag (és hasonlók) segítségével a Rasch-modell elméleti és gyakorlati előnyei akár nagy adathalmazok esetében már standard PC-n is kihasználhatók. Quantitative Methods in Testing Knowledge Proficiency Dr. Béla A. Balázs LEXINFO Language Examnation Center for Informatics Abstract In the last 25-30 years, research in the field of knowledge testing has grown exponentially. A perennial concern, however, is that the day-to-day practice of examining/testing has not changed as quickly as our understanding of the theory of knowledge testing. Practitioners complain that research reports are hard to understand and often address matters that are irrelevant or at least far removed from their daily concerns. Researchers and practitioners seldom co-operate. We sense, however, that this climate is changing, pre-eminently because now with the aid of Winsteps (or similar programs) the theoretical and practical advantages of the Raschmodel can be easily utilized even for large data sets, with the convenience of using a standard PC. BEVEZETÉS Magyarországon a klasszikus tesztelméleti módszerekkel történő elemzéseknek jelentős múltja van, de az utóbbi évek nemzetközi vizsgálatainak elemzései rávilágítanak egy alapjaiban más módszerekkel, más alapokon nyugvó tesztelmélet fontosságára. 1

Ez a más módszer a tesztelméletek újabb generációját képező, valószínűségszámítási alapozású tesztelmélet (Item Response Theory [IRT], magyarul látens vonás elmélet), amely a vizsgaalanyok és a vizsgaanyagok fundamentális építőkövei -- az itemek -- tulajdonságait valószínűségelméleti eszközökkel jellemzi. A látens vonás elmélet azzal foglalkozik, hogy standardizált pszichometriai tesztek eredményeiből hogyan következtethetünk különböző személyiségparaméterekre (pl. az informatikai staktudásra). Az idevágó modellek közül itt a Georg Rasch (1. ábra) dán matematikus által kidolgozott modell vázlatos ismertetésére kerül sor. 1. ábra LÁTENS VONÁS ELMÉLET I. Egy vizsgánál válasszunk egy átlagos képességű standard személyt. Vegyünk egy átlagos nehézségű standard itemet*. A kiválasztás úgy történjen, hogy a standard személy a standard itemnél 50%- os valószínűséggel sikeres. Adott itemhalmaznál az n-edik személy sikerének valószínűsége az i-edik itemnél: P ni. A valószínűségszámításból tudjuk, hogy az esély valamely esemény bekövetkezési valószínűségének és be nem következési valószínűségének hányadosa. Jelöljük az m személy sikerének esélyét a standard itemen b m -el. Így 1 P m 0 Pm 0 = b m (1) Jelöljük továbbá a standard személy kudarcának esélyét az i itemen d i -vel. Azaz *Az item olyan fundamentális teszt-építőkő, amely egy vagy több kérdést ill. feleletet tartalmaz. 2

1 P 0i = P 0i d i (2) Definíciók: Legyen az m személy m0 képessége, log bm = log = θm (3) p 1 m0 az i item nehézsége, log ( ) 1 p p0i 0i ( di ) = log = i és így a Rasch-modellre: mi log (4) = θm δi P 1 mi P Azaz valamely személy sikerének logaritmikus esélye az i itemen egyenlő a személy képességének és az item nehézségének különbségével. Egyébként az IRT modellek közül csak a Rasch-modellnél független két tesztszemély képességének eltérése attól, hogy melyik itemeket használjuk, és egyedül itt teljesül, hogy az itemek nehézség-különbsége nem függ a tesztelt személyek képességétől. p δ VIZSGAPÁLYA, SZEMÉLY-ITEM TÉRKÉP Mindenegyes vizsgázó számos képességgel rendelkezik, de ezek közül egyszerre egyet tesztelünk. Ezért az eredmény egyenes mentén ún. logit skálán modellezhető. {Az L logit érték a siker esélyének logaritmusa: L = logit(p) = log(p/[1-p]) = log(p) log(1-p).} Képzeljünk el egy fokozatosan nehezedő itemekkel ellátott vizsgapályát, amelyen különböző képességű vizsgázók versenyeznek. Az előbbiek szerint az egyes itemeken való sikeres áthaladás logaritmikus esélye egyenlő a vizsgázó képességének és az item nehézségének különbségével (2. ábra). 3

Gyenge képességű személy, megfelelően könnyű item: 50% esély; Kiváló képességű személy, megfelelően nehéz item: 50% esély; Gyenge képességű személy, közepesen nehéz item ~10% esély; Kiváló képességű személy, közepes nehézségű item: ~10% esély. 2. ábra A várható vizsgázói képesség-eloszlásnak megfelelő itemhalmaz esetén a teljesítmények a 0 nehézségi szint körül szórnak, míg túl könnyű feladatok esetén az értékek szignifikánsan pozitív, túl nehéz tételeknél pedig negatív középértéket mutatnak. Miután a vizsgaszintek előre rögzítettek, és a felkészülésnek, valamint a vizsgatételeknek ezekhez kell alkalmazkodniuk, a b. esetben az átlagosnál jobb, a c. esetben viszont gyengébb felkészültségű vizsgázókkal van dolgunk (lásd a 3. ábrát). jó könnyű nehéz 3. ábra. Személy-item térkép. 4

ITEMNEHÉZSÉGI GÖRBÉK A tudásszintmérő tesztek itemei leggyakrabban logisztikusak. A logisztikus jelleggörbének három szakasza van: a gyenge összpontszámok tartományában a görbe lassan emelkedik, majd valahol hirtelen meredekké válik, végül a magasabb összpontszámoknál ellaposodik. Általános alakja: (5) Itt a, m, n és τ valós paraméterek. A sokféle logisztikus görbe meredekségében, illetve abban különbözik egymástól, hogy melyik képességtartományba esik a meredek szakasz. Az itemjellegfüggvény logisztikus, monoton növekvő, de csak 0 és 1 közötti értékeket vehet fel (mivel a függő változó valószínűség), értelmezési tartománya viszont az egész számegyenes. A legegyszerűbb olyan függvény, amely 0-tól 1-ig nő, ha a független változó 0-tól végtelenig növekszik, az f(x) = x/(1 + x) függvény. Az itemjellegfüggvény is logisztikus, monoton növekvő, de csak 0 és 1 közötti értékeket vehet fel (mivel a függő változó valószínűség), értelmezési tartománya viszont az egész számegyenes. A helyes válasz valószínűsége a Rasch-modellen belül: P = f(θ, δ) = [1 + exp(- (θ - δ))] -1 (6) 1: könnyű item 2: közepes item 3: nehéz item 4. ábra A Rasch-modell három tipikus logisztikus itemnehézségi görbéje 5

ITEM ÉS TESZT INFORMÁCIÓS FÜGGVÉNY A klasszikus eljárásokkal szemben a valószínűségszámítási alapozású tesztelmélet és ezen belül a Rasch-modell módot talált arra, hogy a mérési hiba nagyságát a jelöltek képességeinek függvényében határozza meg. θ két konzisztens becslésének összevetésekor azt tekinthetjük jobbnak, amelyiknek szórása kisebb. Minél kisebb a variancia (szórásnégyzet: σ 2 ), annál kevesebb mintavételre van szükség egy bizonyos pontosságú becslés realizálásához. Így kisebb becslés-variancia esetén a minta pontosabb információt ad, mint nagyobb variancia esetén. Ebben az értelemben a minta információtartalma (melyet az un. információfüggvénnyel fejezünk ki) fordítva arányos a becslés szórásnégyzetével. A Rasch modell esetén az egyes itemek információfüggvénye az I(θ) = P(1 - P) alakot ölti.* Tekintve, hogy az item-információk additívak, az egyes itemek információfüggvényeinek öszszege adja a teszt információfüggvényét: T(θ) = Ii(θ). Az információs függvények leggyakoribb alkalmazását a vizsgák és általában tesztek szerkesztésénél találjuk. TIF IIF 5. ábra Három item információs függvény (IIF) és a teszt információs függvény (TIF) ITEMSZERKESZTÉS, ITEMILLESZTÉS Az információfüggvényen alapuló tesztszerkesztés menetét a következőkben összegezhetjük: * A látens vonás elméletben (és általában a pszichometriában) nem a Shannon-féle információfogalmat használják, hanem a Fisher-félét. 6

Határozzuk meg a teszt-információfüggvény kívánt alakját, tekintetbe véve, hogy milyen pontosságú képességbecslésre van szükségünk az egyes képességszinteken. Eredményül kapjuk az un. cél-információs görbét. Szelektáljunk olyan itemeket, amelyek információs görbéi kielégítően kitöltik a célfüggvény alatt lefedendő területet. Az egymás után kiválasztott itemek információs görbéit rendre adjuk hozzá a korábbiak összegéhez, menet közben értékelve az egyre tökéletesedő teszt információfüggvényét. Mindaddig folytassuk az eljárást, amíg a cél-információs görbe alatti terület nincs elfogadhatóan kitöltve (azaz a teszt-információfüggvény a képességkontínuum minden számbajövő pontján elfogadható becslés-varianciát eredményez). A Winsteps programcsomag használata nélkül olyan mennyiségű élő munkára lenne szükség, ami már csak financiális és időtényező okokból sem engedné meg a látens vonás modell alkalmazását. Segítségével viszont a Rasch-modell alkalmazása problémamentesen megoldható. IRODALOM 1. Baker, F. B.: Item banking in computer-based instructional systems. Applied Psychological Measurement, 10, 405, 1986. 2. Balázs, B.: A Rasch-modell szerepe a kvantitatív nyelvtudásmérésben, Alkalmazott Nyelvtudomány, Vol. VII., No. 1-2., 177, 2007. 3. Horváth, Gy.: A modern tesztmodellek alkalmazása, Akadémiai Kiadó, Budapest, 1997. 4. Linacre, J. M.: A Usr s Guide to Winsteps, Program Manual, Chicago, 2007. 5. Molnár, Gy.: Az ismeretek alkalmazásának vizsgálata modern tesztelméleti (IRT) eszközökkel, Magyar Pedagógia, Vol.103, No. 4, 423, 2003. 6. Müller, H.: Illustrationen zum Rasch-Modell, 2002. http://user.uni-frankfurt.de/~moosbrug/hmvff/rabix/rabix101.pdf 7. Pauen, P., Six, H-W.: Informatikunterstützung für den weltweiten Sprachtest Deutsch als Fremdsprache (TestDaf), 2001. http://www.fernuni-hagen.de/se/pdfs/jahrbuchgffnov2001.pdf 7. Vale, C. D.: Computerized Item Banking. In: Downing, S. M., Haaladyna, T. M.: Handbook of Test Development, Routledge, 2006. 8. Verhelst, N. D.: Az item-válasz-elmélet, KER szintillesztési módszertani segédlet, G. fejezet, 2006. http://www.nyak.hu/nyat/doc/modszertani_segedlet.pdf 7

8