NYELVVILÁG A BUDAPESTI GAZDASÁGI FŐISKOLA IDEGEN NYELVI ÉS KOMMUNIKÁCIÓS INTÉZETÉNEK SZAKMAI KIADVÁNYA

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "NYELVVILÁG A BUDAPESTI GAZDASÁGI FŐISKOLA IDEGEN NYELVI ÉS KOMMUNIKÁCIÓS INTÉZETÉNEK SZAKMAI KIADVÁNYA"

Átírás

1

2

3 A BUDAPESTI GAZDASÁGI FŐISKOLA IDEGEN NYELVI ÉS KOMMUNIKÁCIÓS INTÉZETÉNEK SZAKMAI KIADVÁNYA

4 Szerkesztőbizottság Barthalos Judit, Bihari Györgyi, dr. Hegedűs Gyula, Hukné dr. Kiss Szilvia, dr. Kéri András, Lehr Emma, Szendrői Ildikó Főszerkesztő Dr. Kéri András Technikai szerkesztő Deák Gabriella Szerkesztőség címe: 1054 Budapest, Alkotmány u ISSN Felelős kiadó: Medvéné dr. Szabad Katalin Készült a BGF Külkereskedelmi Főiskolai Kar házi nyomdájában. Formátum: A/4 Ívszám: A/5 Példányszám: 250 Munkaszám:

5 TARTALOM 3 MÉRÉS TUDOMÁNY Lukácsi Zoltán: Illeszkedés és alkalmazhatóság: A modern tesztelméleten alapuló számítógépes programcsomagok képességszint-becslése avagy hogyan mérjünk a nyelvvizsgán (1. rész) 5 NYELVÉSZET Dr. Olasz György József: A magyarországi rromani (cigány) nyelvváltozatok eredetének és felosztásának kérdései 21 [Dr. Mudriczki Judit: Az audiovizuális humor lokalizálásának kihívásai a Shrek the Halls [Shrekből az angyal] (2007) című animációs filmben kontrasztív esettanulmány a német, olasz és magyar fordításról] 28 IRODALOM Dr. Demény Tamás: Az önismeret és önbecsülés útján a szabadság felé: Párhuzamok Richard Wright és Lakatos Menyhért önéletrajzában 33 TÖRTÉNELEM Dr. Hegedűs Gyula: Magyar brit kulturális kapcsolatok [ÉLETÚT] Viziné Sárosdy Edit Dr. Szilfai Annamária Szilfai Annamária: A kétnyelvű Svédország 56 Emlékképek 59 OLVASÓLÁMPA Indián költemények: Mai mexikói költők (Kéri András fordításai) 66 CIVILIZÁCIÓ Szijj Mária: Reklámból ikon az Osborne-bika 69 Dr. Kéri András: Amerika első lovas indiánjai, az uruguayi csarrúák 75 [KONFERENCIA] Dr. Válóczi Marianna: Nyelvoktatás és foglalkoztatottság: egy konferencia margójára 84 [KÖNYVÚJDONSÁGAINK] Kövér Péter Dr. Virágh Árpád: Német pénzügyi-számviteli és üzleti nyelvkönyv a komplexitás jegyében 87 Magyar Gézáné: Színes szaknyelvi ismeretek 90 [KÖNYVISMERTETÉS] Dr. Benyó Marianna: A Külügyi Hivatal és a múlt 92 [AKTUÁLIS] Nagy Orsolya Pethőné Choma Anita: Húsz évvel a rendszerváltás után 96

6 Jelen kiadványunk illusztrációinak forrása: Halzer Györgyi: Válogatás európai díszítő motívumokból a X. századtól a XIX. század elejéig. Budapest, Komáromy Publishing, 2003.

7 MÉRÉS TUDOMÁNY 5 Illeszkedés és alkalmazhatóság: A modern tesztelméleten alapuló számítógépes programcsomagok képességszint-becslése avagy hogyan mérjünk a nyelvvizsgán (1. rész) LUKÁCSI ZOLTÁN KVIK Magyarországon az államilag elismert nyelvvizsga minősítést a Nyelvvizsgát Akkreditáló Testület (NYAT) azoknak a pályázóknak adományozza, amelyek egy összetett vizsgálati eljárás során vizsgarendszerükben, valamint tárgyi és személyi feltételeikben alkalmasnak bizonyulnak arra, hogy a vizsgázók nyelvtudását felmérjék. A mérés saját fejlesztésű tesztekkel történik. Egy vizsgateljesítmény a vizsgázó nyelvtudásából vett mintának felel meg. Ennek a nyelvi megnyilatkozásnak a kiértékelésére a Szintillesztési Módszertani Segédlet (Európa Tanács, 2007) három, módszertanában eltérő méréselméleti eljárást javasol: (a) a klasszikus tesztelméletet (KTE), (b) az általánosíthatósági elméletet, és (c) a modern tesztelméletet (item-válasz elmélet, IRT). A szakma gyakorlatában Hambleton és Jones (1993) szerint ezek közül a klasszikus tesztelmélet és az IRT vált népszerűvé a tesztfejlesztésben, egyenértékűsítésben és elemzésben. Ebben a tanulmányban a modern tesztelmélet alapelveire épülő számítógépes programcsomagok gyakorlati alkalmazhatóságának problémáját vizsgálom. Illeszkedésmutatói alapján azt kívánom feltárni, hogy egy adott szoftver alkalmas-e meghatározott és éles vizsga során felvett vizsgázói válaszminták feldolgozására. Az item-válasz elmélet részletes bemutatása ennek az írásnak nem célja, és nem is lehet az. A modern tesztelméletet könyvtárnyi szakirodalmi forrás tárgyalja; az érdeklődő olvasó részletesen megismerheti a modellt angolul Baker (2001), DeMars (2010), Hambleton, Swaminathan és Rogers (1991), Lord (1980), és Szabó (2008), vagy magyar nyelven Csapó (2000), Horváth (1997), Molnár (2003) és Szabó (2009) írásaiból. Ebben a cikkben csak a probléma tárgyalásához feltétlenül szükséges részletekre térek ki. Amennyiben azt másként nem jelölöm, dichotóm itemekkel foglalkozom: olyan pontszerzési lehetőségekkel, ahol a maximális súlyozatlan pontérték 1. Látens dimenziók Elsősorban is azt kell látnunk, hogy a pszichológiai mérések kvantitatív látens változókat vizsgálnak. A mérendő látens természetű, hiszen a mérés közvetlenül nem megfigyelhető jelenségekre összpontosít, így különbözik például az olyan fizikai mérésektől, amelyek egy személy testsúlyát vagy testmagasságát igyekeznek meghatározni. A látens változó kvantitatív volta pedig abban áll, hogy a szociológiából ismert látensosztály-elemzéssel szemben itt a mért dolog egy számegyenesen jelenik meg. A nyelvi mérésben ez a kvantitatív látens változó a nyelvtudás. Bárdos (2002) mutat rá arra a nyugtalanító problémára, hogy a nyelvtudás mibenléte számunkra jórészt ismeretlen, bár számos kísérlet született a modellálására (Bachman és Palmer, 1996; Canale, 1983; Canale and Swain, 1980; Hymes, 1972). A probléma a ma elfogadott mérési alapelveknek megfelelően a nem integrált, hanem részkészségekre bontott mintavételek esetében is fennáll. Az íráskészség esetében például megismerhettük Bereiter és Scardamalia (1987), Hayes és Flower (1980), valamint Hayes (1996) elsősorban az első nyelvre vonatkozó modelljeit, vagy Grabe és Kaplan (1996) kiegészítéseit, a végső leírás ha ez egyáltalán lehetséges még várat magára. Ilyesformán a vizsgaközpontoknak maguknak kell eldönteniük, hogy a többször módosított 137/2008 (V.16.) Kormányrendeletben meghatározott mérési területeket hogyan kívánják vizsgálni.

8 6 MÉRÉS TUDOMÁNY Valamennyi IRT modell alapvetése, hogy a tesztet felépítő itemekre adott válaszok a látens változó megnyilatkozásai: matematikai függvénnyel jellemezhető a kapcsolat a helyes válasz valószínűsége és a képesség értéke között (Verhelst, 2004:3). Matematikai és filozófiai meggondolásból mára a logisztikus függvények váltak az item-válaszok jellemzésében a legnépszerűbbé. Annak fényében, hogy a mérendőt egyetlen képesség vagy jellemvonás alkotja-e vagy több, a szakmódszertan különbséget tesz egy- és többdimenziós IRT modellek között. A nyelvi mérésben az egydimenziós modellek elterjedtebbek (Hambleton és tsai, 1991:12), bár Howie, Long, Sherman és Venter (2009:9) szerint alkalmazásuk még mindig korlátozott számban valósult meg. Lumsden (1976:276) figyelmeztet arra, hogy az egydimenziósság nem azonos az elméleti egyszerűséggel: a teszt visszavezethető lehet egyetlen attribútumra ennek összetettsége mellett is. Ugyanez Bejar (1983:31) megfogalmazásában úgy hangzik, hogy a vizsgateljesítmény nem feltétlenül egy egyszerű pszichológiai folyamat eredménye, ugyanakkor a folyamatok egységben működése megfigyelhető. Az itemparaméterek száma Az egydimenziós IRT modellek között három rivális narratívát szokás megkülönböztetni az itemparaméterek számától függően (Henning, 1987:116). Az egyparaméteres modellben, melynek sajátos esete a Rasch-modell, az item görbe a látens változó és az item nehézség különbségének függvénye. Ez a függvényszabály a következő: ahol θ a látens változó, esetünkben a nyelvtudás; β i pedig az i item nehézsége. Ez a függvényszabály a görbéknek egy olyan családját határozza meg, melyek egymással párhuzamosak, és a 0 és 1 alsó és felső szélsőérték felé közelítenek. Következésként a probabilisztikus modellekre jellemző módon a látens változó egyik értékénél sem mondhatjuk ki, hogy biztosan helyes vagy biztosan helytelen válasz születik. Egyben azt is látnunk kell, a látens változó nincs keretek közé szorítva: bármilyen értéket felvehet. Mivel az egyenletben a paraméterek különbsége az e szám mint matematikai állandó kitevője, nyilvánvaló, hogy a valószínűség akkor 0,5, azaz 50%, amikor a képesség és a nehézség kioltja egymást. Hambleton és tsai (1991:13) az egyparaméteres modell alkalmazásának érvényességét akkor látják indokoltnak, amennyiben egy homogén bankból egy viszonylag könnyű vizsgát szerkesztünk, különösen kritérium-orientált esetekben, hatékony képzést követően. A Birnbaum (1968) által leírt kétparaméteres modellben a nehézség-paraméter (Verhelst, 2004:3) mellett az item diszkriminációja is szerepel. A diszkrimináció Baker (2001:7) meghatározása szerint megmutatja, hogy adott nehézség mellett az item mennyire képes a jobb képességű válaszadókat megkülönböztetni a gyengébbektől. A függvényszabály egyetlen tényezővel bővül tehát: ahol α i a diszkrimináció-paraméter (Verhelst, 2004:17). A kétparaméteres modell függvényszabálya által leírt görbék eltérhetnek egymástól nehézségükben, és meredekségükben is: keresztezhetik egymást. Továbbra is érvényesek maradnak azonban azok a megállapítások, miszerint (a) a görbék alsó és felső aszimptotája rendre 0 és 1; (b) a valószínűség akkor 50%, ha θ

9 MÉRÉS TUDOMÁNY 7 = β; és (c) a látens változó a - és a + között bármely értéket felvehet. Hambleton et al (1991:16) szerint a kétparaméteres modell jól alkalmazható kompetencia alapú mérések kiértékelésekor. A háromparaméteres modellben Birnbaum (1968) a tippelést kívánta ellensúlyozni: ahol c i a találgatás-paraméter (Verhelst, 2004:17). Lord (1974) ugyanakkor megjegyzi, hogy c i értéke általában kisebb, mint random találgatás esetében volna; jelenléte inkább a kevésbé sikeres item fejlesztésben keresendő, ezért nem helyes találgatás-paraméternek nevezni. A harmadik paraméter bevezetésének ára, hogy így a modell elveszíti logisztikus jellegét (Baker, 2001:28; Verhelst, 2004:17). A függvényszabály által leírt görbék alsó szélsőértéke maga a találgatásparaméter, ami nem a képesség függvénye (Wright és Stone, 1999:192). További következmény, hogy az egy- és kétparaméteres modellekkel ellentétben az item-válasz-görbék nem 50%-nál lokalizáltak, hanem 1 és a találgatás-paraméter középértékénél. A háromparaméteres modell elsősorban az USA-ban népszerű (Verhelst, 2004:17), bár Wright és Stone (1999:194) rámutatnak, a találgatás-paraméter becslésére irányuló kísérletek kivétel nélkül sikertelenek voltak. Item-válasz görbék Lássuk a görbéket összehasonlításban is! Az 1. ábra négy dichotóm item item-válasz-görbéjét mutatja be -3 és +3 képességszint között. 1. ábra Item-válasz görbék az 1, 2, és 3-paraméteres modell szerint A helyes válasz esélye (y-tengely) a látens változó értékével (x-tengely) monoton nő. A folytonos vonallal ábrázolt grafikonok az egyparaméteres modell szerint értelmezett két itemet jelölnek. Vegyük észre, hogy a két görbe a látens változó egyetlen értékénél sem metszi egymást. A világos

10 8 MÉRÉS TUDOMÁNY görbe (jobbra) nehezebb itemet mutat, hiszen a siker azonos esélyéhez magasabb képességszintre van szükség. A görbék θ = -1, illetve θ = +1 értékeknél emelkednek a legmeredekebben, itt lokalizáltak. A pontokkal jelölt görbe item paraméterei α = 2, β = 0. Ez a görbe tehát kétszer olyan meredek, mint a folytonos vonallal jelöltek, és éppen e két item közé esik a nehézsége. Meredekségének különös jelentőségét az adja, hogy a kétparaméteres modellben az item információtartalma minden képességszinten: ahol P a helyes válasz esélye, következésként (1-P) a helytelen válasz esélye (Baker, 2001:109). Mivel az egyparaméteres modellben az itemek diszkriminációja azonos, ami esetünkben történetesen α = 1, a magasabb diszkriminációs paraméterrel rendelkező item minden képességszinten több információt tartalmaz azonos item nehézség mellett. Értelmezési nehézséghez vezet az a tény, hogy a pontokkal jelölt item-görbe metszi a folytonos görbéket. Az a látszólagos paradox helyzet áll elő, hogy a legkönnyebb item (sötét, folytonos) nehezebb, mint a pontokkal jelölt item a θ > 1 képességszinten, és a legnehezebb item (világos, folytonos) könnyebb, mint a pontokkal jelölt item a θ < -1 képességszinten. Ez a tény a modellek fogalmainak önkényességéből fakad: az item nehézség az a pont a látens változó egyenesén, ahol a helyes válasz esélye 0,5 (Baker, 2001:45). Erre a problémára a programcsomagok összehasonlításakor még visszatérek. Az ábrán szaggatott vonallal jelölt item-válasz-görbe abban tér el az összes többitől, hogy az alsó része a 0 helyett a 0,2 értékhez közelít. Item paraméterei α = 2, β = 0, és c = 0,2. Figyeljük meg, hogy bár nehézsége (β) azonos a pontozott vonallal jelölt itemével, ezen a képességszinten a helyes válasz esélye 0,6 a találgatás-paraméternek köszönhetően. Lord és Novick (1968:360) rámutat a paraméter invarianciának nevezett jelenségre: a klasszikus tesztelmélet p-értékével szemben az IRT item nehézség-paraméterei változatlanok maradnak eltérő képességű válaszadók esetében. Ismeretlen item- vagy vizsgázó-paraméterek esetében a paraméter invariancia a becsült értékek hibahatáron belüli mozgását jelenti (Baker, 2001:54; Verhelst, 2004:4). A skála Eddig szándékosan nem tértem ki a paraméterek mértékegységére. A fentiekben a valószínűséget, mint könnyen kezelhető fogalmat vettem alapul. Az IRT egyik hatalmas előnye a klasszikus tesztelmélettel szemben viszont pontosan a skálában rejlik. Ha egy adott feladatsoron Anna 30, Balázs 40, és Csaba 50 pontot ér el, abban biztosak lehetünk, hogy a mintavétel alkalmával Balázs jobban teljesített Annánál, de teljesítménye elmaradt Csabáétól. Fontos látnunk, hogy ezekből a pontokból nem látszik az, hogy pontosan mekkora volt a tudásbeli különbség Anna és Balázs, vagy Balázs és Csaba között. Különösen megalapozatlan azt feltételezni, hogy a Balázs és Anna közötti különbség kétszerese mutatkozott Anna és Csaba között nyelvtudásukban. Ennek oka a skála erősségében keresendő: bár Bachman (2004:22) ezt vitatja, a tesztpontszám sorrendi skálát alkot (DeMars, 2010:17; Wright és Stone, 1999:30) hasonlóan egy tornasorhoz. Roberts (1994: ) logikai hibát lát abban, ha átlagolt tesztpontértékeket vetünk össze. Nem arra utal, hogy a KTE alkalmazásakor a vizsga nehézsége elválaszthatatlanul összefonódik a vizsgázói képességszinttel (Henning, 1987:108), hanem arra, hogy a sorrendi homomorfizmus nem támaszt korlátokat az esetek között megfigyelt különbségekkel kapcsolatosan, csupán azt várja el, hogy a sorrend ne változzon. Következésként értelmes összehasonlítási alapként a mediánt javasolja.

11 MÉRÉS TUDOMÁNY 9 Az IRT megnyugtató megoldása erre, hogy az eredeti rangsorskálából a számítási sor eredményei már intervallum skálát alkotnak (Baker, 2001:5). Egy olyan mércéhez jutunk, ahol biztosak lehetünk abban, a rovátkák közötti távolság azonos. Sajátos módon azonban a léptékállandóság mellett nincs jelen egy természetes eredet, vagy nulla pont. A horgonyzás eredeti fogalma Baker (2001:131) szerint a középpont önkényes kijelölése. Ennek a Verhelst (2004:8) által normalizálási folyamatnak három lehetséges módja, ha (a) egy item nehézségét azonosítjuk nullával, (b) az átlagos item nehézséget azonosítjuk nullával, vagy (c) a célpopuláció képességszintjét azonosítjuk nullával. A kapott intervallum skála egységét logitnak nevezzük. Az elnevezés az esélylatolgatás természetes alapú logaritmusára utal (DeMars, 2010:15). A skála erősségének emelkedésén túl az IRT további előnye, hogy az item nehézség és a képességszint azonos skálára kerül: Ez teszi lehetővé a korábbi függvényekben a θ - β különbséget. Amennyiben akár viszonylag kisszámú, változatlan statisztikai és pszichometrikai tulajdonságokkal rendelkező itemet ismételten használunk, olyan kapcsolatot teremtünk a minták között, amely lehetővé teszi az összes item (és összes válaszadó) azonos skálára helyezését a kalibráció folyamatában (Verhelst, 2004:6). Horgonynak Verhelst (2004:6) azokat az itemeket nevezi, amelyek vizsgaidőszakról vizsgaidőszakra ismételten bevetésre kerülnek. A szakzsargon horgonynak nevezhet akár csupán egyszer ismételt itemeket is (Molnár, 2003:426; Szabó, 2008:59). Az egydimenziós IRT modellek alkalmazhatóságának előfeltételei között a válaszok mögött rejlő igazoltan egyetlen fő komponens és az item-válasz görbék mintafüggetlensége mellett fontos szerep jut az item függetlenség elvének is. Hambleton és Swaminathan (1985:23) szerint ez annyit tesz, hogy az egy meghatározott itemre adott választ nem befolyásolhatja a többi itemre adott válasz eltekintve a konstruktum azonosságából adódó összefüggésektől. Ez azért alapvető elvárás, mivel egy vizsgázói válaszminta valószínűsége adott itemeket alapul véve ebben az esetben egyenlő lesz az egyes itemekre adott válaszok valószínűségeinek szorzatával (Hambleton et al, 1991:10). Becslési eljárások A nyelvi mérés során alkalmazott IRT alapú számítógépes programcsomagok az item- és vizsgázóparaméterek becslésére a legnagyobb valószínűségnek (maximum likelihood) nevezett eljárások egyikét használják. Ezek egyöntetű hibája, hogy nem adnak becsült értéket a teljesen rossz, illetve a hibátlan válaszmintákra (Verhelst, 2004:24). Az együttes maximum likelihood (JML) eljárásban az összes paraméter becslése együttesen, egy iteratív folyamatban történik. Az egyparaméteres modell esetében ekkor k item és N vizsgázó paraméterére kell becsült értéket találni, és a probléma az itemek és vizsgázók számának gyarapodásával nő. Andersen (1973:66-69) igazolta a JML becslések statisztikai következetlenségét. A hibát elismerve Linacre (de Jong és Linacre, 1993: ) azzal érvel, hogy egy kisfokú statisztikai következetlenség elfogadásával lehetőség nyílik a sokoldalú modell bevezetésére, ahol az item nehézség-paraméter elméletben a végtelenségig bővíthető tényezők lineáris kombinációjából határozható meg. Bár a használatával szembeni aggályok súlyosak (Haberman, 2004:2; Verhelst, 2004:4), a JML eljárást alkalmazza a Facets 3.22 szoftver (Linacre, ). A becslésre kerülő paraméterek száma korlátozható úgy, hogy a minta vizsgázóinak képességszintjét normális eloszlásúnak tekintjük (Verhelst, 2004:5). Ebben az esetben a k item nehézség-paraméter mellett a képességszint eloszlás középértékének és varianciájának becslését kell elvégeznünk. A marginális maximum likelihood eljárás (MML) ezt a megoldást alkalmazza.

12 10 MÉRÉS TUDOMÁNY Tovább egyszerűsíti a becslési folyamatot, ha a paramétereket a vizsgázók tesztpont értékének megadása mellett végezzük. A feltételes maximum likelihood eljárásban (CML) minden azonos pontszámot elért vizsgázó becsült képességszintje azonos lesz. Az egyparaméteres modellnél ez viszonylag egyszerű, hiszen itt súlyozatlan nyers pontokkal dolgozunk. A kétparaméteres modellnél azonban a CML eljárás nem alkalmazható, hiszen itt a súlyok a diszkriminációparaméterek, melyek nem ismertek a számítási sor elején. Ha a súlyok nem ismertek, nem ismert a súlyozott tesztpontszám sem, és a feltétel elvész (Verhelst, 2004:5). Az egyparaméteres modell matematikai eleganciáját és a kétparaméteres modell rugalmasságát ötvözi a szoftver nevét viselő OPLM modell (Verhelst, Glas, és Verstralen, 1995:1). Az OPLM a diszkriminációs indexeket ismert természetes számok formájában rendeli az itemekhez. A programcsomagban két alkalmazás áll a felhasználó rendelkezésére (Wopsug és Opcat), melyek használatával a súlyok mértani közepének önkényes kijelölése mellett a diszkriminációs indexek kioszthatóvá válnak. Mivel így a diszkrimináció-paraméterek nem képzik a becslés részét, az OPLM modell megőrzi az egyparaméteres modell matematikai erejét, és a feltételes maximum likelihood eljárás alkalmazható eltérő minőségű itemek mellett is. Ebben az esetben minden azonos súlyozott tesztpontszámot elért vizsgázó becsült képességszintje lesz azonos (Verhelst el al, 1995:9). A Warm-becslőfüggvény, vagy súlyozott maximum likelihood-becslőfüggvény (Verhelst, 2004:26), a nulla, illetve teljes pontértékre is definiálva van. A Warm-becslésben az említett súly az információfüggvény négyzetgyöke. Az OPLM szoftver a vizsgázói képességszint becslésére a Warm-becslőfüggvényt használja. IRT vs Rasch A méréselmélet a látens dimenziók, valamint a paraméterek mellett különbséget tesz az IRT és a Rasch méréselmélet között is (Fisher, 2010:1288). Eszerint az IRT egy leíró jellegű statisztikai módszertan, mely Frederick Lord (1980) munkásságából eredeztethető. Ezzel szemben a Rasch elemzés egy előíró természetű méréselméleti módszertan, mely Georg Rasch dán matematikus munkáján alapszik. Popper demarkációs kritériumát szegi meg Linacre (2009:10-11), amikor azt állítja, a Rasch módszertanban a látens változó az igazság maga, mely amennyiben lineárisan kifejezhető minden esetben leírható a Rasch-modellel. Andrich (1988:61-62) szerint is az adatoknak kell a modellhez illeszkedniük. A modellnek nem megfelelő adatok a valóságról torz képet mutatnak. Fisher (2010:1288) a cáfolhatatlanságot így fogalmazza meg: Az egymást keresztező item-válasz-görbék soha nem a megfelelő modell, hiszen a konstruktum érvényessége megkívánja, hogy az item nehézség változatlan maradjon a képességszint skála valamennyi pontján. Látnunk kell, hogy a diszkrimináció itemeken keresztül ívelő állandósága erősen viszonylagos a Rasch módszertanon belül is. Linacre (2000:743) szerint amennyiben a diszkrimináció-paraméter 0,5 és 1,7 között marad, az adatok még jól illeszkednek a Raschmodellhez. Az illeszkedés Az illeszkedési tesztek a fenti szemléletbeli különbségeket figyelembe véve az adatok és a modell közötti megfelelés fokát vizsgálják. Hambleton et al (1991:53) a minta nagyságának fontosságára hívják fel a figyelmet: kis mintán a statisztikai tesztek ereje alacsony, a túlságosan nagy minta viszont már apró eltéréseket is szignifikánsnak tüntethet fel. A mintavételben rejlő nehézségre mutat rá maga Rasch (2011:1309) is. A dániai Aarhusban megrendezett konferencián 1973-ban jegyzi meg: Minden modell alapvetően rossz, elegendő adat mellett mindenképpen el kell vetni. Ezzel együtt Hambleton et al (1991:55) azt javasolják, hogy a modell megválasztásánál az alapvető feltételek mellett ellenőrizzük, valóban azonosak-e a diszkrimináció-paraméterek, és a tippelés minimális.

13 MÉRÉS TUDOMÁNY 11 A Facets illeszkedés mutatói A Facets 3.22 programban két illeszkedési próba van beépítve: az infit és az outfit. Ezeknek az elvárt (átlagos) értéke 1, és a 0 és a + között mozoghatnak. Az 1-nél kisebb értékek túlzott illeszkedésre utalnak, míg az 1-nél nagyobbak elégtelen illeszkedést jeleznek (Wright és Linacre, 1994:370). Lássunk két példát ezek szemléltetésére! Vegyünk egy pénzérmét, amelyik feldobva mindig az egyik oldalára esik. Ha az érme igazságos, a mintavétel nagyságától függően azt várjuk, a fej és az írás azonos arányban jelenik meg. Tízezer dobás esetén tehát közelítőleg ötezer fej és ötezer írás adódik. Kétely merülhet fel bennünk, amennyiben éppen az első ötezer dobás eredményez fejet, és a második ötezer írást. Ugyanígy nem fogunk hinni a bírálói ponttáblának, ha a fej és az írás ötezerszer ebben a sorrendben váltja egymást. Fontos látnunk, hogy az egyes dobások valószínűségeinek produktuma mindkét esetben ugyanakkora, hiszen egymástól független kísérletekről van szó. A pénzfeldobás során a fejek és írások száma ugyanaz, mennyiségi eltérés nincs. A mintázatot mégis valószínűtlennek tartjuk, tehát minőségi különbséget látunk. A nyelvi mérésben ugyanez akkor nyer értelmet, ha négy eltérő nehézségű dichotóm item esetén egy vizsgázó a két könnyű, míg egy másik a két legnehezebb itemet válaszolja meg helyesen (Verhelst, 2004:21). Ahogy láttuk, a Rasch-modellben azonos tesztpontszámhoz azonos képességszint tartozik, tehát a két vizsgázó becsült nyelvtudása azonos lesz. Azonban sokkal alacsonyabb a valószínűsége annak, hogy egy válaszadó a két nehéz itemet helyesen megoldja, és a két könnyűt elvétse, mint fordítva. Wirght és Stone (1999:49-54) alapján az egyes itemek outfit illeszkedésének mértékét a következőképpen kaphatjuk meg: Az összetett egyenlethez vezető első lépés, hogy feltételezünk egy dichotóm itemet [0,1] lehetséges pontértékekkel. X ni jelöli a megfigyelt item-választ. Ebből kivonjuk a modell, esetünkben a Rasch-modell, által elvárt értéket. A kapott különbséget (reziduális) úgy standardizáljuk, hogy elosztjuk az itemhez tartozó elvárt szórással. A következő lépésben a statisztikából ismert szóráselemzéseknél alkalmazott módon a negatív értékeket négyzetre emeléssel semlegesítjük. Ezt a számítási sort minden vizsgázói item-válasznál elvégezzük, és az eredmények összesítésével eljutunk az egyenletben szereplő számlálóhoz. Az átlagos értékhez végül úgy jutunk, hogy a kapott összeget elosztjuk az esetek számával. Ehhez hasonlóan juthatunk a vizsgázók outfit mutatójához azzal a különbséggel, hogy természetesen ekkor az item-válaszok összegével dolgozunk, és az itemek száma szerepel a nevezőben. Az outfit számítási sorok sajátossága, hogy a megfigyelt és az elvárt értékek közötti nagy eltérésekre érzékenyek. Hasznosak lehetnek tehát pontosan az olyan válaszok vagy itemek kiszűrésére, ahol például egy alacsony képességű vizsgázó helyesen válaszol meg egy nehéz itemet, vagy fordítva (Wright és Stone, 1999:53). Az infit illeszkedés vizsgálatakor az információ mennyiséget használjuk súlyként, amivel a reziduálist megszorozzuk. Az információ ebben az esetben Fisher alapján a variancia reciproka:

14 12 MÉRÉS TUDOMÁNY Az infit és outfit mutatók elfogadhatósága függ a teszt típusától, és felhasználásának céljaitól is. Wright és Linacre (1994:370) szerint általánosságban az mondható el, ha az értékek nagyobbak 2- nél, a mérési rendszer egésze torzul. Az 1,5-nél nagyobb, vagy 0,5-nél alacsonyabb értékek a mérést nem lehetetlenítik ugyan el, de a válaszok nem vezetnek értelmezhető eredményekre. Az OPLM illeszkedés mutatói Az OPLM 3.32 programcsomagban az illeszkedés vizsgálata két síkon zajlik egy időben: (a) a modell-adat illeszkedés átfogó vizsgálatában és (b) a rossz illeszkedés eseteinek kimutatásában (Verhelst és tsai, 1995:13). A Molenaar (1983) által fejlesztett és tiszteletére M i teszteknek nevezett próbák logikája a következő (Verhelst et al, 1995:14-15): A vizsgázó súlyozott tesztpontszáma a szükséges és elégséges statisztika a látens változó CML becslésekor. Adott súlyozott tesztpontszám mellett a helyes válasz valószínűsége nem a látens változó függvénye. A helyes válasz valószínűsége mint a súlyozott tesztpontszám függvénye és ehhez hasonlóan a CML eljárással becsült valószínűség függvénye is jó közelítése az item-válasz függvénynek. A súlyozott tesztpontszámtól függő becsült valószínűségi függvény egy S-alakú görbét mutat, melynek meredeksége a diszkrimináció-paramétertől függ. Amennyiben az α-paraméter túlságosan magas, sajátos eltéréseket figyelhetünk meg a megfigyelt helyes válasz arány és a becsült válasz arány között: Alacsony súlyozott tesztpontszám esetén a megfigyelt érték, magas pontszám esetén pedig a jósolt érték lesz magasabb. Soroljuk a vizsgázókat megfigyelt súlyozott tesztpontjaik alapján L = alacsony, O = közepes, és H = magas csoportokba! Az M i statisztika pozitív értéket vesz fel, ha a diszkrimináció-paraméter túl magas. Az OPLM három M i próbával dolgozik. Az első tesztben az alacsony pontszámú csoport tagjai maximum 0,4 feltételes valószínűséggel adnak helyes választ, míg a magas pontszámú csoport tagjainál ugyanez legalább 0,6. A második próba (M2 i ) két csoportját a válaszadók elfelezésével alkotja a szoftver. Az első csoportba a pontszámok alapján alacsonyabban rangsorolt, míg a másodikba a magasabban rangsorolt válaszadók kerülnek. Végül az M3 i próbában három csoportot vetünk össze, melyek mindegyike a válaszadók közelítőleg egyharmadát tartalmazza. Az S i statisztika (Verhelst et al, 1995:16-17) az M i mutatóhoz hasonlóan az itemek szintjén nyer értelmet, és az elvárt és a megfigyelt válaszok közötti különbségre alapoz. A különböző közös itemekkel kapcsolt vizsgázói csoportok rangsorából kiindulva azonos osztályokat hozunk létre úgy, hogy (a) minden az itemet megkísérlő mintavételi alkalmat egyszerre kezelünk, és legfeljebb nyolc osztályt alkotunk; vagy (b) az egyes vizsgákat legfeljebb négy homogén pontszámú csoportra osztjuk, míg végül maximum 4 8 = 32 osztályt formázunk. Az egyes osztályokon belül az esetek száma azonos és legalább 30, valamint az összpontszám minimálisan 5. A következő lépésben a szoftver az egyes vizsgákon belül kiszámolja az adott tesztpontszámú csoport megfigyelt item-válasz értékének és az elvárt értéknek a különbségét. Az eljárás minden dichotomizáció esetében megismétlődik, és az eredmények összegzésével végződik. Az S i

15 MÉRÉS TUDOMÁNY 13 illeszkedési mutató a reziduális, az összeg és a becsült aszimptotikus kovariancia mátrix általános inverzének szorzata. A statisztika χ 2 eloszlású, és szabadságfoka a csoportok száma mínusz egy. A számítási sor végén grafikus formában egy számegyenesen is megjelenik az összes item: a 0 és 1 közötti skálán szignifikancia szintek jelölik az eloszlást. Az S i különös jelentőséget az ún. eltérő itemműködés feltárásában nyer, amennyiben azt feltételezzük, hogy egy item egy meghatározott csoporttal szemben megkülönböztetést tesz. Az R 1c próba azt vizsgálja, az item-válaszok összessége mennyire illeszkedik az adott modellhez (Fischer és Molenaar, 1995: ; Verhelst et al, 1995:17-21). A statisztika logikája nagyban hasonlít az S i próbáéhoz, ezért nem ismétlem meg. avagy hogyan mérjünk a nyelvvizsgán A kutatás háttere Vizsgálódásaimhoz az adatokat az Euro Nyelvvizsga Kft bocsátotta a rendelkezésemre, mely Magyarországon egyedülálló módon a meghirdetett vizsgaeredmények számításához az IRT elméletét rutinszerűen alkalmazza. Az eredeti elemzések a Facets szoftverrel történnek, a kapott eredmények felhasználása azonban egyelőre nem teljeskörű. Szerepet kap a feladattípusok közötti különbség (Dávid, 2007): egyes feladatok tartalmuktól függetlenül könnyebbek lehetnek másoknál. Szintén vizsgálat tárgyát képezi a szubjektívan vagy szemi-szubjektívan értékelt vizsgarészek esetében a vizsgáztatói szigor. Ahogy azt láthattuk, de Jong (1993:296) kifogást emel a programcsomaggal szemben, mivel az nem tartalmaz globális modell-adat illeszkedési próbát, Verhelst (2004:4) pedig rámutat, hogy a JML becslés helytelen standard hibákhoz vezet. A Rasch-modell elméleti előnyeinek elismerése mellett Verhelst (2011:3) megjegyzi, észre kell vennünk, a megfigyelt valóság súlyos eltéréseket mutathat a modell által elvártaktól; amennyiben ez fennáll, az elméleti előnyök is elvesznek, és következtetéseink inkább vágyakra semmint empíriára alapoznak. Kutatásomban a Facets 3.22 és az OPLM 3.32 programcsomagok illeszkedésmutatóit vetettem össze azzal a céllal, megállapítsam, számítási soraik alkalmasak-e nagy fajsúlyú vizsgák meghirdetett eredményeinek számítására. A minta Számítógépes programcsomagok alkalmazhatóságának megalapozottságát az illeszkedési mutatók alapján vizsgáló elemzésem alapját hét, éles vizsgahelyzetben felvett nyelvvizsgázói válaszminta adta. Az Euro általános angol nyelvvizsga B2 szintjének olvasott szöveg értése feladatsorait rutinszerűen ismételten bevetésre kerülő itemek kapcsolják egymáshoz. Ennek köszönhetően a kalibráció során az összes item, és az összes vizsgázói paraméter is ugyanarra a skálára kerül: közvetlenül összehasonlíthatóvá válik. A kapcsolás eredményeként tehát két olyan vizsgázói teljesítmény is közvetlenül összemérhető, ahol a feladatsorokat teljes egészében eltérő kérdések alkották. A minta nagysága vizsgaidőszakonként eltérő volt, azonban minden esetben elég nagy ahhoz, hogy az elemzések végén értelmes eredményekre vezessen (Crocker és Algina, 1986:322; Henning, 1987:116). A vizsgaidőpontokat, vizsgázói létszámot, és a feladatsorokban szereplő itemek számozását az 1. táblázat tartalmazza.

16 14 MÉRÉS TUDOMÁNY 1. táblázat A kutatás mintavételi időpontjai, vizsgázói létszámok, és item számozás Az Euron az itemek feladatokba ágyazva jelennek meg. (Ebben a cikkben nem kívánok kitérni arra, ennek milyen és mekkora hatása lehet az itemfüggetlenségre). A címsorban szereplő négy feladattípus 2008 után háromra szűkült egy intézményi döntést követően. Az itemek számozása folyamatos. Az ismételt itemek a referencia vizsga számozását viszik tovább az új bevetés alkalmával. A számú itemek tehát mindösszesen három alkalommal szerepeltek nyelvvizsgán, eleget téve a NYAT ismétlésekre vonatkozó megkötéseinek. A táblázatban nyilakkal igyekeztem egyértelművé tenni, hogy minden vizsgaalkalommal volt ismételt feladat. A májusi vizsgasor közvetlenül kapcsolódik a májusihoz a itemeken keresztül, valamint szintén közvetlenül kapcsolódik a szeptemberi feladatsorhoz a itemek segítségével. A szeptemberi és a májusi vizsga egyetlen közös itemet sem tartalmaz, de a májusi vizsgán keresztül közvetetten vannak egymáshoz kapcsolva. Első lépésben az összes itemet a KTE eredményeit is figyelembe vevő elemzésnek vetettem alá. Ennek célja a gyenge minőségű itemek kizárása volt. Nem szerepeltek a későbbi számítási sorokban azok a feladatelemek, amelyek extrém nehézségi mutatókkal rendelkeztek (Verstralen, Bechger és Maris, 2001:21), illetve melyeknek item-teszt és item-többi item korrelációként kifejezett diszkriminációs ereje alacsony volt (Bachman, 2004:138). Ennek megfelelően hat itemet zártam ki. A 40. és 42. itemek az ismételt használatban 10%-ot meghaladó mértékben változtak nehézségükben, így bár fizikailag azonosak voltak, statisztikai tulajdonságaikban eltérést mutattak, szerepük a kapcsolásban problematikussá vált. A 64. item negatív item-teszt korrelációt mutatott: a gyengébb összteljesítményű vizsgázók nagyobb arányban adtak rá helyes választ, mint a jobb képességűek. A 71., 75. és 109. itemek pedig alacsony korrelációs együtthatókkal rendelkeztek. Az IRT szoftvereket vizsgáló elemzésemben végül 105 item szerepelt. A teljes vizsgált minta vizsgázót foglalt magába (M = 1583,71; SD = 311,24). A JML elemzésben nem szerepelt a 209 hibátlan vizsgadolgozat. Minden vizsgázó sikeresen válaszolt meg legalább egy itemet. Kutatási eredmények és tárgyalás A Facets 3.22 program alapbeállításai között nem szerepel illeszkedési próba arra, mennyire megfelelő az alkalmazott modell, a Rasch-modell, az adatok leírására. Ennek oka részben a fent leírt elméleti álláspont. Az elemzésben szereplő mindegyik item infit és outfit mutatója a Wright és Linacre (1994:370) által megjelölt 0,5-1,5 határon belül maradt. Ez tehát azt jelenti, a Raschmodell alkalmazásával a mintavétel 105 iteme alkalmasnak bizonyult a teljesítmények mérésére kisebb minőségi eltérések megengedésével. Másként fogalmazva, az itemek diszkriminációja nem tért el olyan mértékben egymástól, hogy az a modell toleranciaküszöbén kívül esett volna

17 MÉRÉS TUDOMÁNY 15 (Linacre, 2009:151). Az itemek infit értékei 0,8 és 1,2 között, outfit értékei pedig 0,5 és 1, 5 között változtak. A becsült nehézség-paraméterek -2,75 (SE = 0,13) és 2,34 (SE = 0,06) közé estek. A skála normalizációja eredményeként az átlagos item nehézség-paraméter 0 logit (SD = 1,0844). Az OPLM 3.32 programcsomag a Rasch-modellt nem találta érvényesnek a 105 itemből álló feladatcsoport válaszainak leírására: R1c = 2.460,608; df = 436; p < 0,001. Az S-tesztek alapján 49 item illeszkedése volt elégtelen p < 0,001 szinten. Az OPLM modell alkalmazásakor az OPCAT modullal a diszkriminációs indexeket úgy határoztam meg, hogy a mértani középérték 3, a szórás pedig 0,40 legyen. A diszkrimináció azonosság feloldásával a modell-adat illeszkedés markánsan változott: R1c = ; df = 436; p < 0,001. A szignifikancia szint alapján az illeszkedés még így is elégtelen volt, mivel azonban az R1c : df arány a 2 alatt maradt (1,59), Hemker szerint (Tshering, 2006:35) a modell ilyen esetben gyakorlati eredmények meghatározására már alkalmasnak mondható. A 105 itemből már csak a 8. és az 56. illeszkedése maradt az elvárt szint alatt. A 8. item esetében M1 = 0,274; M2 = -3,750; és M3 = -3,167. A természetes számként meghatározott diszkriminációs index 4 volt, és 8 vizsgázói csoport került elkülönítésre. A próbák azt jelezték, az item diszkriminációs paramétere alapján a modell kevesebb helyes választ várt a legjobban teljesítő két vizsgázói csoporttól. Az 56. item esetében M1 = 4,024; M2 = 2,275; és M3 = 3,046. Az item diszkriminációs indexe 2, tehát a megadott átlagtól elmaradt, és ebben az esetben is 8 vizsgázói csoport került elkülönítésre. Mindhárom M i próba eredménye meghaladta az elfogadható szélsőértéket. Az összetett problémát a grafikus item elemzés szemlélteti a legegyértelműbben. 2. ábra Az 56. item elvárt és megfigyelt válaszaránya a képességszint függvényében A 2. ábrán -0,4 és 0,7 logit érték között a középső folytonos vonal jelzi az OPLM modell által elvárt válaszokat. Ezt alul és felül ún. tolerancia-intervallum határolja, ami az elfogadható eltérések határát jelzi. A keresztek a modellnek megfelelően viselkedő vizsgázói csoportokat jelzik, míg a pont a várttól eltérő találati arányt. Az 56. item esetében azt láthatjuk, a legjobb képességű vizsgázók kevésbé voltak sikeresek, mint azt a modell jósolta. Teljesítményük ezen az itemen elmaradt a náluk alacsonyabb képességszintű vizsgázókétól is.

18 16 MÉRÉS TUDOMÁNY Az OPLM modell szerint az itemek becsült nehézség-paraméterei -0,888 (SE = 0,041) és 1,137 (SE = 0,059) között változtak. A skála normalizációja miatt az átlagos nehézség itt is 0 volt (SD = 0,3567). A két programcsomag egyparaméteres modell szerint becsült item paraméter értékei lényegesen eltértek egymástól (r 2 = 0,1681). Hasonlóan nagy eltérés mutatkozott a Facets Rasch-modellje és az OPLM modell becsült nehézség-paraméterei között is (r 2 = 0,1624). A diszkriminációs indexek bevezetése ellenére a CML eljárásban az item nehézség csak kis mértékben változott (r 2 = 0,8570). Összességében tehát a Facets a Rasch-modell által elvártak szerint működőnek ítélte az itemeket, míg az OPLM szoftver ezt a modellt elvetette. A diszkriminációs indexszel kiegészített OPLM modell az itemek viselkedését túlnyomó részben megfelelőnek találta, illetve az itemek összességét is elfogadhatóan írta le. A vizsgázói képességszint eloszlás összevetéséhez a kapott eredményeket lineáris transzformációval azonos skálára hoztam. Az önkényesen választott 100 és 400 szélsőértékeket a látens változó azon legalacsonyabb és legmagasabb becsült értékei képezték, amelyek ténylegesen megfigyelt tesztpontszámon alapultak. A lineáris transzformáció szabálya (van der Schoot, 2009:14-15): V = B*θ + A. A Facets értékei esetében B = 34,3249, és A = 229,4050; az OPLM modell esetében pedig B = 98,5545, és A = 198,0618. Az így összehasonlíthatóvá alakított képességszint eloszlások a 2. ábrán láthatóak. 3. ábra A modellek képességszint eloszlása A 3. ábra x-tengelye tehát a transzformált becsült képességszint, az y-tengely pedig a vizsgázók számát mutatja. A sötét gyémántok a Facets által adott eredmények, az üres négyzetek pedig az OPLM becsült képességszintjei. Az ábra jól mutatja, hogy a Facets kevesebb értékből

19 MÉRÉS TUDOMÁNY 17 gazdálkodott, míg az OPLM több finomabban részletezte a vizsgázói teljesítményeket. Ennek oka az itemek súlyozásában rejlik. Másrészt viszont míg a Facets a skála második harmadába helyezte a legtöbb vizsgázót, az OPLM gyakran rendelt alacsony értékeket vizsgateljesítményekhez. A két szoftver transzformált középértékei rendre M = 252,9576 és 215,2756. A Facets tehát bőkezűbben bánt a képességszint-kiosztással, mint az OPLM. Lássuk a decemberi vizsga teszt-válasz függvényeit a modellek közötti eltérő szigor vagy megkülönböztetett részletesség szemléltetésére (4. ábra). 4. ábra Teszt-válasz görbék a Facets és az OPLM modelljei szerinti item paraméterek alapján A 4. ábrán a folytonos vonal a Facets Rasch-modell által leírt tesztgörbéje, a pontozott görbe pedig az OPLM modell függvénye. A látens változó ebben az esetben a tényleges és nem a becsült értékeket jelöli. Jól látható, hogy az OPLM függvény meredekebben emelkedik kb. -1 és +1 logit között. Elmondható továbbá, hogy a Facets a vizsga egészét könnyebbnek ítélte, mint az OPLM: a 0,5 valószínűség a látens változó alacsonyabb értékéhez társult. A két görbe 0,05 logitnál metszi egymást. Eddig a pontig a Facets szigorúbb, hiszen már extrémen alacsony képességszintnél is közel 10% a helyes válasz elvárt aránya. Az OPLM a metszéspont felett vár többet a vizsgázóktól. A két függvény akkor válik igazán beszédessé, ha mellette figyelembe vesszük azt is, hogy az OPLM becslése alapján az 1277 vizsgázó 60,92%-a esik a metszésponttól jobbra, és rendelkezik a modell szerint azonos valószínűség mellett a látens változón alacsonyabb értékkel, mint a Facets szerint. Mivel az OPLM modellben az azonos súlyozott tesztpontszámú vizsgázók azonos becsült képességszintre kerülnek, nincs értelme egyes vizsgázók illeszkedéséről beszélni. A Facets viszont a JML becslés folyamatában először az egyes vizsgázók, majd az egyes itemek illeszkedését vizsgálja, és ezt a sort ismétli, amíg a számítási sor az elvártnak legmegfelelőbb értékeket el nem éri. Következésként bár adott feladatsoron minden azonos tesztpontszámot elért vizsgázó azonos képességszintre kerül, illeszkedésükben eltérések mutatkoznak. A vizsgált mintában (N = )

20 18 MÉRÉS TUDOMÁNY a vizsgázók 4,31%-a (n = 478) adott olyan válaszmintát, amelynek infit vagy outfit illeszkedése rontotta a teljes modell működését (> 2). További 10,15% (n = 1126) válaszminta nem bizonyult értelemmel bíró eredmények meghirdetésére. A valódi probléma tehát a következő: ha a Rasch-modellhez ragaszkodunk, hogyan ítéljük meg annak az 1604 vizsgázónak a teljesítményét, akik válaszmintáikban súlyosan eltérnek a modell által elvártaktól? Linacre (2011) megoldási javaslatában két példával élt. Az első szerint egy KRESZ vizsgán az a vezető, aki bonyolult helyzetekben tökéletesen ura az autónak, de mindennapos esetekben rosszul reagál, nem kaphat jogosítványt. A második példában egy olyan vizsgázót képzelünk el, aki az egyetemen egy magasabb kreditértékű, haladó csoporthoz szeretne csatlakozni, azonban tudása elmarad a várttól, ezért puskázik. Magas pontszáma ellenére el kell utasítanunk, mivel nem akarjuk, hogy csalással foglalja el egy valóban jó képességű hallgató helyét. Linacre érvelése racionális, azonban felvet két aggályt. Egyrészt, paradox módon éppen a vizsga igazságossága kívánja meg azt, hogy minden egyes vizsgázó valódi, használható eredményt kapjon. Másrészt viszont a gyakorlatban lehetetlen minden hetedik vizsgázó teljes vizsgaproduktumát kielemezni abban a reményben, hogy elfogadható okot találhatunk a furcsa válaszmintára. Összegzés Az IRT elméleti eredményeit és elvárásait figyelembe vevő vizsgálatom célja az volt, hogy illeszkedés próbáik alapján megállapítsam, a Facets 3.22 illetve az OPLM 3.32 szoftver alkalmas-e éles helyzetben felvett és közös itemekkel egymáshoz kapcsolt vizsgázói válaszminták leírására. A két program becsült item- és vizsgázó paraméter értékei nagyban eltértek egymástól. Míg a Facets az itemeket a Rasch-modell szerint leírhatónak találta, az OPLM a diszkriminációban jelentős eltéréseket talált. Az eltérő diszkriminációs indexekkel kiegészített OPLM modell még mindig bizonyos mértékben eltért a válaszmintáktól, azonban Hemker alapján a gyakorlatban alkalmas volt képességszint becslésére. A Facets ezzel szemben a vizsgázók közel 15%-ának válaszmintázatát ítélte aggályosnak, és vetette fel az egyéni elbírálás szükségességét. Felhasznált irodalom Andrich, D. (1988): Rasch models for measurement. Sage Publications, Newsbury Park, Ca. Bachman, L. F. (2004): Statistical analyses for language assessment. Cambridge University Press, Cambridge Baker, F. B. (2001): The basics of item response theory. (2nd ed.).eric Clearinghouse on Assessment and Evaluation, College Park, MD. Baker, R. (1997): Classical test theory and item response theory in test analysis (Special Report No. 2). Language Testing Update. Bárdos, J. (2002): Az idegen nyelvi mérés és értékelés elmélete és gyakorlata. Budapest: Nemzeti Tankönyvkiadó. Bejar, I. (1983): Achievement testing: Recent advances. Sage Publications, Beverly Hills. Crocker, L., & Algina, J. (1986): Introduction to classical and modern test theory. Holt, Rinehart and Winston, New-York. Csapó, B. (2000): Tudásszintmérő tesztek. In: Bevezetés a pedagógiai kutatás módszereibe. Szerk.: Falus Iván. Műszaki Tankönyvkiadó, Budapest Dávid, G. (2007): Investigating the performance of alternative types of grammar items. Language Testing. 24(1).sz de Jong, J., & Linacre, J. M. (1993): Rasch estimation methods, statistical independence, and global fit. Rasch Measurement Transactions. 7(2) sz DeMars, C. (2010): Item response theory. Oxford University Press, New York.

Hazánkban jelentõs múlttal rendelkeznek a klasszikus tesztelméleti módszerekkel

Hazánkban jelentõs múlttal rendelkeznek a klasszikus tesztelméleti módszerekkel Iskolakultúra 2008/1 2 Molnár Gyöngyvér SZTE, Pedagógia Tanszék, MTA-SZTE Képességkutató Csoport A Rasch-modell kiterjesztése nem dichotóm adatok elemzésére: a rangskálás és a parciális kredit modell A

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Teszt elemzési beszámoló

Teszt elemzési beszámoló Teszt elemzési beszámoló Nemzetközi laktációs szaktanácsadók (IBCLC ) minősítő vizsgája 2017. áprilisi vizsgák Készült a Nemzetközi Laktációs Szaktanácsadói Vizsgabizottság (IBLCE ) számára Készítette:

Részletesebben

MI VAN A VIZSGAFELADAT MÖGÖTT? A MINŐSÉGBIZTOSÍTÁS ELEMEI A NYELVVIZSGÁZTATÁSBAN VADÁSZ ISTVÁNNÉ

MI VAN A VIZSGAFELADAT MÖGÖTT? A MINŐSÉGBIZTOSÍTÁS ELEMEI A NYELVVIZSGÁZTATÁSBAN VADÁSZ ISTVÁNNÉ ÁLTALÁNOS VADÁSZ ISTVÁNNÉ MI VAN A VIZSGAFELADAT MÖGÖTT? A MINŐSÉGBIZTOSÍTÁS ELEMEI A NYELVVIZSGÁZTATÁSBAN Egy nyelvvizsgarendszer akkor működik sikeresen, ha mögötte egy szigorú minőségbiztosítási rendszer

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Átlageredmények a 2011. évi Országos Kompetenciamérésen. matematikából és szövegértésből

Átlageredmények a 2011. évi Országos Kompetenciamérésen. matematikából és szövegértésből Átlageredmények a 2011. évi Országos Kompetenciamérésen Általános iskola 8. osztály matematikából és szövegértésből Matematika Szövegértés Iskolánkban Ált. iskolákban Budapesti ált. iskolákban Iskolánkban

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI Statisztikai alapfogalmak a klinikai kutatásban Molnár Zsolt PTE, AITI Bevezetés Research vs. Science Kutatás Tudomány Szerkezeti háttér hiánya Önkéntesek (lelkes kisebbség) Beosztottak (parancsot teljesítő

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Matematikai geodéziai számítások 10.

Matematikai geodéziai számítások 10. Matematikai geodéziai számítások 10. Hibaellipszis, talpponti görbe és közepes ponthiba Dr. Bácsatyai, László Matematikai geodéziai számítások 10.: Hibaellipszis, talpponti görbe és Dr. Bácsatyai, László

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Teszt elemzési beszámoló

Teszt elemzési beszámoló Teszt elemzési beszámoló Nemzetközi Laktációs Szaktanácsadó (IBCLC ) 2018. áprilisi vizsgák 2018. június 19. KÉSZÍTETTÉK: Scott Frohn, Ph.D. pszichometrikus Lawrence J. Fabrey, Ph.D. Vezető pszichometrikus

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

Teszt elemzési beszámoló

Teszt elemzési beszámoló Teszt elemzési beszámoló Nemzetközi laktációs szaktanácsadók (IBCLC ) minősítő vizsgája 2017. októberi vizsgák Készült a Nemzetközi Laktációs Szaktanácsadói Vizsgabizottság (IBLCE ) számára Készítette:

Részletesebben

KÉMIA II. A VIZSGA LEÍRÁSA

KÉMIA II. A VIZSGA LEÍRÁSA KÉMIA II. A VIZSGA LEÍRÁSA A vizsga részei Középszint Emelt szint Írásbeli vizsga Szóbeli vizsga Írásbeli vizsga Szóbeli vizsga 120 perc 15 perc 240 perc 20 perc 100 pont 50 pont 100 pont 50 pont A vizsgán

Részletesebben

Diszkriminancia-analízis

Diszkriminancia-analízis Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz Diszkriminancia-analízis folyamata Feladat Megnyitás: Employee_data.sav Milyen tényezőktől függ a dolgozók beosztása? Nem metrikus Független

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató BGF PÉNZÜGYI ÉS SZÁMVITELI KAR Módszertani Intézeti Tanszéki Osztály TANTÁRGYI PROGRAM Matematikai alapok II. útmutató 2013/2014. tanév II. félév Tantárgyi program Tantárgy megnevezése Tantárgy jellege/típusa:

Részletesebben

Pszichometria Szemináriumi dolgozat

Pszichometria Szemináriumi dolgozat Pszichometria Szemináriumi dolgozat 2007-2008. tanév szi félév Temperamentum and Personality Questionnaire pszichometriai mutatóinak vizsgálata Készítette: XXX 1 Reliabilitás és validitás A kérd ívek vizsgálatának

Részletesebben

A SIOK Beszédes József Általános Iskola évi kompetenciamérés eredményeinek elemzése és hasznosítása

A SIOK Beszédes József Általános Iskola évi kompetenciamérés eredményeinek elemzése és hasznosítása A SIOK Beszédes József Általános Iskola 2011. évi kompetenciamérés eredményeinek elemzése és hasznosítása A jelentésben szereplő tanulók száma 2011. évi méréskor 6. a osztály: 24 fő 6. b osztály: 32 fő

Részletesebben

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének 6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük

Részletesebben

Kvantitatív tudásmérés Dr. Balázs Béla LEXINFO Informatikai Nyelvvizsga-központ

Kvantitatív tudásmérés Dr. Balázs Béla LEXINFO Informatikai Nyelvvizsga-központ Kvantitatív tudásmérés Dr. Balázs Béla LEXINFO Informatikai Nyelvvizsga-központ ÖSSZEFOGLALÁS Az utolsó 25-30 évben a tudásmérés területén végzett kutatások intenzitása exponenciálisan növekedett. Állandó

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Az értékelés során következtetést fogalmazhatunk meg a

Az értékelés során következtetést fogalmazhatunk meg a Az értékelés során következtetést fogalmazhatunk meg a a tanuló teljesítményére, a tanulási folyamatra, a célokra és követelményekre a szülők teljesítményére, a tanulási folyamatra, a célokra és követelményekre

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

11.3. A készségek és a munkával kapcsolatos egészségi állapot

11.3. A készségek és a munkával kapcsolatos egészségi állapot 11.3. A készségek és a munkával kapcsolatos egészségi állapot Egy, a munkához kapcsolódó egészségi állapot változó ugyancsak bevezetésre került a látens osztályozási elemzés (Latent Class Analysis) használata

Részletesebben

Próbaérettségi 2004 MATEMATIKA. PRÓBAÉRETTSÉGI 2004. május EMELT SZINT. 240 perc

Próbaérettségi 2004 MATEMATIKA. PRÓBAÉRETTSÉGI 2004. május EMELT SZINT. 240 perc PRÓBAÉRETTSÉGI 2004. május MATEMATIKA EMELT SZINT 240 perc A feladatok megoldására 240 perc fordítható, az idő leteltével a munkát be kell fejeznie. A feladatok megoldási sorrendje tetszőleges. A II. részben

Részletesebben

A matematika érettségirõl a reform tükrében

A matematika érettségirõl a reform tükrében Tompa XKlára A matematika érettségirõl a reform tükrében A közoktatás megújítási tervének egyik fontos eleme a 2004-re tervezett új érettségi vizsga. Az új vizsgamodell kialakításának előmunkálataiban

Részletesebben

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ Matematika középszint 063 ÉRETTSÉGI VIZSGA 006. február. MATEMATIKA KÖZÉPSZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ OKTATÁSI MINISZTÉRIUM Fontos tudnivalók Formai előírások: A dolgozatot

Részletesebben

A 2014.évi országos kompetenciamérés értékelése Kecskeméti Bolyai János Gimnázium

A 2014.évi országos kompetenciamérés értékelése Kecskeméti Bolyai János Gimnázium A 2014.évi országos kompetenciamérés értékelése Kecskeméti Bolyai János Gimnázium Iskolánkban a 10 évfolyamban mérik a szövegértés és a matematikai logika kompetenciákat. Minden évben azonos korosztályt

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság SZIGNIFIKANCIA Sándorné Kriszt Éva Az MTA IX. Osztály Statisztikai és Jövőkutatási Tudományos Bizottságának tudományos ülése

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás Véletlenszám generátorok és tesztelésük Tossenberger Tamás Érdekességek Pénzérme feldobó gép: $0,25-os érme 1/6000 valószínűséggel esik az élére 51% eséllyel érkezik a felfelé mutató oldalára Pörgetésnél

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg LMeasurement.tex, March, 00 Mérés Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg a mérendő mennyiségben egy másik, a mérendővel egynemű, önkényesen egységnek választott

Részletesebben

Országos kompetenciamérés eredményei Kiskulcsosi Általános Iskola 035857 Telephelyi jelentés 6. 8. évfolyam szövegértés

Országos kompetenciamérés eredményei Kiskulcsosi Általános Iskola 035857 Telephelyi jelentés 6. 8. évfolyam szövegértés Országos kompetenciamérés eredményei Kiskulcsosi Általános Iskola 035857 Telephelyi jelentés 6. 8. évfolyam szövegértés Karcag, 2011. április 4. Horváthné Pandur Tünde munkaközösség vezető Kiskulcsosi

Részletesebben

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak

Részletesebben

NYELVISMERET, NYELVTANULÁSI

NYELVISMERET, NYELVTANULÁSI NYELVISMERET, NYELVTANULÁSI MOTIVÁCIÓ ÉS HARMADIK NYELV A nyelvi és motivációs felmérés néhány tanulsága a BGE turizmus - vendéglátás szakos I. évfolyamos hallgatók leggyengébb csoportjában Fűköh Borbála

Részletesebben

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016 Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

EMELT SZINT BESZÉDKÉSZSÉG ÉRTÉKELÉSI ÚTMUTATÓ. Minta. Feladatonként értékeljük Jártasság a témakörökben Szókincs, kifejezésmód Nyelvtan

EMELT SZINT BESZÉDKÉSZSÉG ÉRTÉKELÉSI ÚTMUTATÓ. Minta. Feladatonként értékeljük Jártasság a témakörökben Szókincs, kifejezésmód Nyelvtan Általános jellemzok EMELT SZINT FELADATTÍPUS ÉRTÉKELÉS SZEMPONTJAI PONTSZÁMOK Bemelegíto beszélgetés Nincs értékelés 1. Társalgási feladat egy témakör részletes megbeszélése interakció kezdeményezés nélkül

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató BGF PÉNZÜGYI ÉS SZÁMVITELI KAR Módszertani Intézeti Tanszéki Osztály TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató 2015/2016. tanév I. félév Tantárgyi program Tantárgy megnevezése Tantárgy jellege/típusa:

Részletesebben

1/8. Iskolai jelentés. 10.évfolyam matematika

1/8. Iskolai jelentés. 10.évfolyam matematika 1/8 2009 Iskolai jelentés 10.évfolyam matematika 2/8 Matematikai kompetenciaterület A fejlesztés célja A kidolgozásra kerülő programcsomagok az alább felsorolt készségek, képességek közül a számlálás,

Részletesebben

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv Mérések, mérési eredmények, mérési bizonytalanság A mérések általános és alapvető metrológiai fogalmai és definíciói mérés Műveletek összessége, amelyek célja egy mennyiség értékének meghatározása. mérési

Részletesebben

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012 Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012 A hatodik osztályban 12 tanulóból 11 írta meg az országos kompetenciamérést. Ebből 1 fő SNI-s, 3 fő BTMN-es tanuló. Mentesítést

Részletesebben

Korrelációs kapcsolatok elemzése

Korrelációs kapcsolatok elemzése Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az

Részletesebben

A Tisza-parti Általános Iskola. angol szintmérőinek. értékelése. (Quick Placement Tests)

A Tisza-parti Általános Iskola. angol szintmérőinek. értékelése. (Quick Placement Tests) A Tisza-parti Általános Iskola angol szintmérőinek értékelése (Quick Placement Tests) Készítette: Hajdú Erzsébet Tóth Márta 2009/2010 Ismertető a szintmérésről Mért tanulók: 8. évfolyam és 6. évfolyam,

Részletesebben

Az értékelés a Móricz Zsigmond Gimnázium 3 gimnáziumi osztályának eredményei alapján készült, 102 tanuló adatai kerültek feldolgozásra.

Az értékelés a Móricz Zsigmond Gimnázium 3 gimnáziumi osztályának eredményei alapján készült, 102 tanuló adatai kerültek feldolgozásra. I. A Gimnáziumi ágazat Az értékelés a Móricz Zsigmond Gimnázium 3 gimnáziumi osztályának eredményei alapján készült, 102 tanuló adatai kerültek feldolgozásra. matematika Az eredmények szerint a 4 évfolyamos

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése

Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése E L E M Z É S Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése 2010. szeptember Balázs Ágnes (szövegértés) és Magyar

Részletesebben

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ GEOSTATISZTIKA II. Geográfus MSc szak 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ Miskolci Egyetem Műszaki Földtudományi Kar Geofizikai és Térinformatikai Intézet A tantárgy adatlapja Tantárgy neve:

Részletesebben

Iskolai jelentés. 10. évfolyam szövegértés

Iskolai jelentés. 10. évfolyam szövegértés 2008 Iskolai jelentés 10. évfolyam szövegértés Az elmúlt évhez hasonlóan 2008-ban iskolánk is részt vett az országos kompetenciamérésben, diákjaink matematika és szövegértés teszteket, illetve egy tanulói

Részletesebben