FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA ÚJ RANGSOROLÁSOS ELJÁRÁSOKKAL*

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA ÚJ RANGSOROLÁSOS ELJÁRÁSOKKAL*"

Átírás

1 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA ÚJ RANGSOROLÁSOS ELJÁRÁSOKKAL* VARGHA ANDRÁS A társadalomtudományokban gyakran találkozunk olyan nem kvantitatív változókkal, amelyek értékskálája csupán az ordinalitás kritériumának tesz eleget. Ilyen változók esetén a nagyságszintek átlag segítségével történő összeasonlítása vitatató. A jelen tanulmány alternatív megoldásként ívja fel a figyelmet a sztocasztikus összeasonlításra, amelynek kulcsfogalmai a sztocasztikus egyenlőség (SZTE) és a sztocasztikus omogenitás (SZTH). Két sokaságot akkor mondunk sztocasztikusan egyenlőnek valamely X változó tekintetében, a P(X 1 > X ) = P(X 1 < X ) teljesül, aol X 1 és X a két sokaságból egymástól függetlenül kiválasztott véletlen megfigyelés. Az SZTH az SZTE általánosítása, segítségével kettőnél több sokaság sztocasztikus ugyanakkoraságát definiáljuk. Tanulmányunkban az SZTH tesztelésével kapcsolatban 15 statisztikai próba előnyeit és átrányait vetjük össze számítógépes szimulációs elemzés segítségével. A TÁRGYSZÓ: Sztocasztikus omogenitás. Rangsorolásos csoport-összeasonlítás. társadalomtudományi kutatások egyik leggyakoribb kérdése, ogy valamely X változó értékei általában ugyanakkorák-e bizonyos csoportokban. Illusztrációul felsorolunk néány ilyen jellegű szakmai kérdést. A magyarországi felnőtt lakosságon belül az olvasásra szánt idő (mondjuk 1 étre vonatkoztatva) ugyanakkora-e különböző iskolázottsági szinteken? Függ-e az ARIEL mosópor ötfokú szimpátiaskálán mért kedveltségi szintje attól, ogy a megkérdezett személy a fővárosban, vidéki városban vagy községben lakik? Van-e különbség a 19 magyar megye között a tekintetben, ogy lakosai mennyire vannak megelégedve a kormánykoalícióval, a a megelégedettséget ismét ötfokú skálán mérjük? Ugyanolyan atékony-e valamely A, B és C terápiás eljárás a doányzás tekintetében, a a atékonyságot azzal mérjük, ogy a terápiában részt vett személy átlagosan ány cigarettát szív el naponta a terápia befejezése után 3 ónappal? Ha X kvantitatív változó, akkor az ilyen típusú kérdésekre megfelelő statisztikai válasz a H 0 : 1 = = = nullipotézis vizsgálata, aol 1,,, az X változó elméleti átlaga (várató értéke) * A tanulmány megírásáoz segítséget nyújtott a T03157 sz. OTKA-pályázat, valamint a 0194/000 sz. FKFP-pályázat. Statisztikai Szemle, 80. évfolyam, szám

2 VARGHA: FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 39 az összeasonlítandó számú csoportban (populációban, statisztikai sokaságban stb.). Ez a nullipotézis közismerten az egyszempontos varianciaanalízis (VA) módszerével tesztelető, a teljesülnek a VA alkalmazási feltételei. (Vincze; old.) A társadalomtudományi kutatásokban gyakran előfordul, ogy a függő változó értékskálája csak legfeljebb az ordinalitás az értékek nagyság szerinti sorba rendezetősége kritériumnak tesz eleget. Ilyen változóoz jutunk például, a arra kérjük a vizsgált személyt, ogy ítélje meg egy ötfokú skálán, mennyire kedvel valamely politikai pártot (bizonyos terméket, ázastársát, főnökét stb.) a következő fokozatokkal: 1 = nagyon ellenszenves, = enyén ellenszenves, 3 = közömbös, 4 = enyén rokonszenves, 5 = nagyon rokonszenves. Hasonlóképpen ordinális skálájúak például az Acenbac-féle Gyermekviselkedési kérdőív (CBCL) áromfokozatú tüneti tételei (1 = soa nem fordul elő, = esetenként előfordul, 3 = gyakran előfordul) és az ezekez asonló változók. Ilyen esetekben az átlag asználatának jogossága az adatok nagyságszintjének jellemzésére vitatató. Alternatív középértékként ordinális skálájú változók esetén szóba jöet a medián is, ez esetben azonban célszerű a folytonosságot megkövetelni, mert diszkrét változóknál a mediánok egyenlősége nem feltétlenül jelenti a változók értékszintjének azonosságát, mint ezt a következő példa is mutatja: Valószínűség P(1) P() P(3) P(4) P(5) X eloszlása 0,51 0,0 0,10 0,10 0,09 Y eloszlása 0,90 0,06 0,0 0,01 0,01 Ebben a példában az X és az Y változó mediánja megegyezik (Med(X) = Med(Y) = 1), mégis, az X változó értékei általában nagyobbak, mint az Y változóé. A továbbiakban egy olyan statisztikai modellt ismertetünk, amelyben tetszőleges akár diszkrét, akár folytonos skálájú változó esetén értelmesen és gyakorlati problémák esetén jól asználató módon definiálató az ugyanakkoraság fogalma mindazon összeasonlításokban, amelyek az egy- és a többszempontos VA-ban előfordulnak. Jelen tanulmány központjában számú független minta egyszempontos összeasonlítása áll tetszőleges > mellett, a modell újszerűsége miatt azonban kitérünk a legegyszerűbb, = esetre is. Ezután definiáljuk a sztocasztikus omogenitás (SZTH) fogalmát, mely az átlagok egyenlőségének egyik alternatívája. Ezzel összefüggésben bemutatunk több statisztikai eljárást, amelyekkel az SZTH nullipotézise tetszőleges > mintaszám esetén tesztelető, majd empirikusan, számítógépes szimulációs vizsgálattal elemezzük ezen próbák érvényességét és atékonyságát. SZTOCHASZTIKUS EGYENLŐSÉG, SZTOCHASZTIKUS KÜLÖNBÖZŐSÉG Két sokaságot (jelölje őket mondjuk az egyszerűség kedvéért Pop 1 és Pop ) valamely X változó tekintetében nemcsak közvetve, valamely középérték (átlag, medián, trimmelt átlag stb.) által asonlítatunk össze, anem elemeik közvetlen összevetésével is. Például a férfiak és a nők a testmagasságuk szerint úgy is összeasonlítatók, ogy az összes leetséges módon összepárosítunk egy férfit és egy nőt, majd megatározzuk, ogy ezen

3 330 VARGHA ANDRÁS összeasonlítások ányad részében magasabb a férfi (P(férfi > nő)) és ányad részében a nő (P(nő > férfi)). Ha ez a két arány megegyezik, akkor azt mondjuk, ogy a férfiak és a nők a testmagasság tekintetében sztocasztikusan egyenlők vagy sztocasztikusan ugyanakkorák. P(férfi > nő) > P(nő > férfi) esetén azt mondjuk, ogy a férfiak sztocasztikusan magasabbak, ellenkező esetben pedig azt, ogy sztocasztikusan alacsonyabbak, mint a nők. Teljes általánosságban a sztocasztikus egyenlőség (röviden SZTE) definiáló feltétele, ogy a Pop 1 sokaságból véletlenszerűen kiválasztott X 1 és a Pop sokaságból ugyancsak véletlenszerűen és az előzőtől függetlenül kiválasztott X véletlen érték tekintetében fennálljon a P(X 1 > X ) = P(X 1 < X ) /1/ egyenlőség (Varga Czigler; 1999, Varga; 000a. 10. fejezet). Analóg módon definiálató az SZTE két tetszőleges eloszlás vonatkozásában is. Ha az SZTE nem áll fenn, akkor sztocasztikus egyenlőtlenségről vagy sztocasztikus különbözőségről beszélünk. A sztocasztikus különbözőség nagyságának mérésére N. Cliff ( old.) a 1 = P(X 1 > X ) P(X 1 < X ) // együttatót, Varga A. és H. D. Delaney (1998, 000) pedig az A 1 = P(X 1 > X ) + 0,5 P(X 1 = X ) /3/ mutatót javasolta. A két mutató egyébként egymással teljesen ekvivalens, mert egymásba egyszerű lineáris transzformációval átalakítatók: A = ( + 1)/ és = A 1. /4/ Az A mutató elnevezésére Varga és Delaney (1998) a valószínűségi fölény mutatója (measure of stocastic superiority), Brunner és Munzel (000) pedig a relatív kezelési atás (relative treatment effect) elnevezést javasolja. Ez utóbbi szerzőpáros a sztocasztikusan egyenlő/kisebb/nagyobb fogalmakra a tendenciózusan egyenlő/kisebb/nagyobb (tendentiously equal/smaller/greater) elnevezéseket asználja. A és az A mutató definíciója alapján nyilvánvaló, ogy az /1/ formulával definiált SZTE ekvivalens a = 0, A = 0,5 /5/ azonosságok fennállásával. E mutatók statisztikai becslésével kapcsolatban lásd: Brunner Munzel; 000, Cliff; old. és Varga; Az SZTE ipotézisének vizsgálatára (a sztocasztikus egyenlőtlenség ellenipotézisével szemben) számos statisztikai próba jöet számításba. a) A jól ismert rangsorolásos csoport-összeasonlító eljárással, a Mann Witney-próbával kapcsolatban már régen kimutatták, ogy az összeasonlított két eloszlás egyenlőségével szembeni bármely ellenipotézisre

4 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 331 vonatkozóan a próba akkor és csakis akkor konzisztens azaz ereje akkor és csakis akkor tart 1-ez az elemszámok növekedésével bármely rögzített szignifikanciaszinten, a ezen ellenipotézis fennállása maga után vonja az összeasonlított két eloszlás sztocasztikus különbözőségét (Mann Witney; 1947, illetve Noeter; 1967). A Mann Witney-próba azonban csak akkor alkalmazató érvényesen az SZTE önálló tesztelésére, a bizonyos mellékfeltételek (például az összevetendő két eloszlás alakjának azonossága) teljesülnek. b) Azzal érvelve, ogy a Mann Witney-próba nagy minták esetén ekvivalens egy rangszámokon végreajtott kétmintás t-próbával, a szórásomogenitás feltételének sérülése esetén a Mann Witney-próba robusztus alternatívájaként D. W. Zimmerman és B. D. Zumbo (199, 1993) a rangszámokon végreajtott Welc-próbát javasolta. c) Elméleti levezetések és számítógépes szimulációs elemzések azonban arra mutatnak, ogy legalább 10- elemű minták esetén az SZTE egy a Fligner és Policello, valamint Cliff nevéez fűződő eljárás (Fligner Policello; 1981, Cliff; 1996) Varga (000b) által javasolt módosításával tesztelető a legmegfelelőbben. Megjegyezzük, ogy a sztocasztikus különbözőség becslése, illetve az SZTE tesztelése igen egyszerűen végreajtató a MiniStat programcsomag (Varga Czigler; 1999) segítségével. KETTŐNÉL TÖBB SOKASÁG ÖSSZEHASONLÍTÁSA: A SZTOCHASZTIKUS HOMOGENITÁS FOGALMA Tételezzük fel, ogy egy legalább ordinális skálájú X változó segítségével akarjuk a Pop 1, Pop,, Pop sokaságokat összeasonlítani, aol > tetszőleges egész szám. Az egyszerűség kedvéért jelöljük az X változót X j -vel Pop j -ben (j = 1,, ). Ha azt kutatjuk, ogy az X változó értékei általában ugyanakkorák-e a vizsgált sokaságokban, akkor kézenfekvő ötlet, ogy megvizsgáljuk: van-e a Pop j sokaságok között olyan, amelyikben az X változó értékei általában nagyobbak vagy általában kisebbek, mint a többi sokaságban. Ha nincs ilyen felülről vagy alulról kilógó sokaság, akkor azt mondjuk, ogy a vizsgált Pop j sokaságok az X változó tekintetében s egyben az X 1, X,, X változók sztocasztikusan omogén együttest alkotnak. Ha a sztocasztikus omogenitás nem áll fenn, akkor sztocasztikus eterogenitásról beszélünk. Matematikailag pontosan a sztocasztikus omogenitás (röviden SZTH) fogalmát a következőképpen definiáljuk. Válasszunk ki először egy sokaságot (Pop j ), s atározzuk meg ennek valószínűségi fölényét a többi sokasággal szemben a /3/ definíció szerint: A ji = P(X j > X i ) + 0,5 P(X j = X i ) (i = 1,, ). /6/ Legyen továbbá A jj = 0,5, iszen bármely sokaság saját magával nyilván sztocasztikusan egyenlő. Ekkor a p 1 j A ji i1 /7/ mennyiség, a Pop j sokaság ún. sztocasztikus kezelési atása (stocastic treatment effect) azt mutatja meg, ogy ez a sokaság a többivel a sztocasztikus összeasonlítások során általában nagyobb vagy kisebb-e. p j = 0,5 esetén a Pop j -beli adatok általában se nem nagyobbak, se nem kisebbek, mint a többiek.

5 33 VARGHA ANDRÁS Emiatt az SZTE általánosításaként kettőnél több sokaság sztocasztikus omogenitását a p 1 = = p = 0,5 /8/ azonossággal definiáljuk. Ezek a p j atások megadatók a következőképpen is. A számú sokaság közül válasszunk ki véletlenszerűen egyet (mindegyiknek 1/ esélyt adva), majd ebből válasszunk ki véletlenszerűen egy X megfigyelést. Ezután e választástól függetlenül válasszunk ki a Pop j sokaságból is véletlenszerűen egy X j megfigyelést. Ekkor igaz, ogy p j = A(X j, X) = P(X j > X) + 0,5 P(X j = X) (j = 1,, ). /9/ Bizonyos esetekben célszerű feltételezni, ogy az X véletlen megfigyelést a Pop j sokaságok összevont együtteséből választjuk ki, melynek során természetszerűleg figyelembe kell venni a sokaságok egymásoz viszonyított arányát. Ilyen esetben célszerű az SZTH-t valamivel általánosabb formában definiálni. Eez csak a sztocasztikus kezelési atásokat kell kicsit általánosabban megatározni, a következőképpen: j wi i1 p A ji (j = 1,,, ), /10/ aol w i a Pop i sokaság súlya (aránya). Természetesen a w i súlyok összege mindig 1, és a /7/-tel definiált azonos súlyozás esetén w i = 1/. A /10/ formulából kiolvasató, ogy a a Pop j sokaságok páronként sztocasztikusan egyenlők (azaz a A ij = 0,5 minden (i, j) párra), akkor az SZTH is fennáll, mégpedig bármilyen {w j } súlyozás mellett. Ennek az állításnak a megfordítása azonban nem igaz, aminek az az oka, ogy a sztocasztikusan egyenlő és a sztocasztikusan kisebb reláció nem tranzitív. Előfordulat például olyan ún. körbeverési szituáció, amikor a Pop 1 sokaság sztocasztikusan kisebb a Pop sokaságnál, a Pop sokaság sztocasztikusan kisebb a Pop 3 sokaságnál, Pop 3 pedig sztocasztikusan nem nagyobb, anem kisebb Pop 1 -nél (lásd például Varga; 000a old.). és A vonatkozásában ez például azt jelenti, ogy 1 > 0 és 3 > 0 nem vonja maga után automatikusan 13 > 0, illetve A 1 > > 0,5 és A 3 > 0,5, az A 13 > 0,5 egyenlőtlenség fennállását. Ha azonban az X j változók mind szimmetrikus eloszlásúak, akkor az SZTE és a sztocasztikusan kisebb/nagyobb relációk tranzitivitása biztosan teljesül. Ez esetben ugyanis az SZTH ekvivalens a páronkénti SZTE-vel, sőt, az elméleti mediánok egyenlőségével, valamint a az átlag értelmes mutató az elméleti átlagok egyenlőségével is. Végül megjegyezzük, ogy = esetén az SZTE és az SZTH ekvivalens relációk, vagyis az SZTH az SZTE egyik bár nem egyetlen leetséges általánosítása. AZ SZTH TESZTELÉSE Az SZTE vizsgálatáoz asonlóan az SZTH tesztelésével kapcsolatban is számos statisztikai eljárás jöet szóba.

6 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 333 A Kruskal Wallis-próba Matematikailag kimutatták, ogy az összeasonlított számú eloszlás egyenlőségével szembeni bármely ellenipotézisre vonatkozóan a jól ismert Kruskal Wallis-próba akkor és csakis akkor konzisztens, a az ellenipotézis fennállása maga után vonja a vizsgált számú eloszlás sztocasztikus eterogenitását, vagyis az SZTH sérülését (Kruskal; 195, Noeter; old.). Ezen összefüggés azonban csak az SZTH egy bizonyos súlyozása esetén érvényes, nevezetesen akkor, a a /10/ formulában a w i súlyokat a következőképpen definiáljuk: w i = n i /n. /11/ E formulában n i az i-edik független minta elemszáma, n =n i pedig az összelemszám. A Kruskal Wallis-próba teát akkor alkalmas az SZTH nullipotézisének tesztelésére, a teljesül a következő két feltétel. 1. Az eloszlások az SZTH-n kívül más tekintetben (szóródás, ferdeség, csúcsosság stb.) nem különböznek. Ez a elyzet áll fenn például abban az esetben, a az eloszlások közötti egyetlen leetséges eltérés egy esetleges szintkülönbség.. A mintaelemszámok legalább aszimptotikusan arányosak az összeasonlított sokaságok nagyságával. Ha ismert az egyes sokaságok összsokaságon belüli aránya, akkor ez a feltétel a mintaelemszámok megfelelő megválasztásával biztosítató. Ha viszont ezek az arányok nem ismeretesek, akkor az egyetlen megoldás az, ogy az összsokaságból egyetlen nagy véletlen mintát választunk ki. Ha az összelemszám elég nagy, akkor a mintaelemszámok arányai legalább közelítőleg tükrözni fogják az általuk képviselt sokaságok valódi arányát. Ha a Kruskal Wallis-próbát az alkalmazási feltételek bármilyen ellenőrzése nélkül alkalmazzuk, akkor szignifikáns esetben csak egyetlen dolgot állítatunk: azt, ogy a vizsgált X változó az összeasonlított sokaságokban nagy valószínűséggel nem ugyanolyan eloszlású. Rangszámokon végreajtott robusztus varianciaanalízisek Válasszunk ki a Pop j (j = 1,,, ) sokaságokból egymástól függetlenül rendre n j nagyságú véletlen mintákat az X változóra vonatkozóan. Rangsoroljuk a kapott adatokat a Kruskal Wallis-próbában előírt módon (Varga; 000a old.), s az egyes minták szerinti csoportok rangszámainak átlagát jelölje rendre R 1, R,, R. Matematikailag igazolató, ogy a vizsgált a Pop j sokaságok a /11/ formulában szereplő w j súlyokkal akkor és csakis akkor képeznek sztocasztikusan omogén együttest az X változó tekintetében, a ezen rangszámátlagok elméleti átlagai (várató értékei) megegyeznek, vagyis a az összeasonlítandó véletlen minták rangtranszformáltjainak elméleti átlagai ugyanakkorák (a bizonyítást illetően lásd Varga Delaney; 1998). Ebből arra következtetetünk, ogy az SZTH tesztelésére szóba jöet a rangszámokon végreajtott VA is, a annak alkalmazási feltételei teljesülnek. Jelen esetben az egyszempontos független mintás VA látszik megfelelőnek, melynek alkalmazási feltételei a következők (Vincze; old.): a) a minták függetlensége; b) a függő változó normalitása; c) a szórásomogenitás.

7 334 VARGHA ANDRÁS E követelményeket a rangszámadatokra vonatkoztatva, a következőket állapítatjuk meg. 1. Tekintve, ogy az r ij (j = 1,,, i = 1,, n j) rangszámok összege n elemű összminta esetén mindig az n-től függő állandó ( ijr ij = n(n +1)/), a rangszámminták sosem függetlenek egymástól, de a rangszámok közötti (r ij, r kl) páronkénti korrelációk az n j mintaelemszámok növekedésével 0-oz tartanak.. A rangszámváltozók eloszlása sosem normális, de a VA képleteiben szereplő négyzetes összeg statisztikák bizonyos feltételek esetén aszimptotikusan normális eloszlásúak (Kruskal; 195, Brunner Puri; 001). 3. A rangszámok megőrzik a nagyságrendi viszonyokat, így a nagyobb szóródású minták rangszámai is általában nagyobb szóródásúak lesznek. Ha teát a szórásomogenitás az eredeti adatokra teljesül, akkor ez a feltétel többnyire a rangszámok esetén sem sérül számottevően. Ha viszont a szórásomogenitás feltétele már az eredeti adatokra sem teljesül, akkor ez általában a rangszámokra is átöröklődik. Mindezek alapján az SZTH nullipotézisének vizsgálatára (a sztocasztikus eterogenitás ellenipotézisével szemben) közelítő érvényességgel javasolatók a következő rangsorolásos eljárások: a szórásomogenitás feltételének teljesülése esetén a agyományos egyszempontos VA végreajtása a rangszámokon (rang VA, röviden rva), mely egyébként aszimptotikusan ekvivalens a Kruskal Wallispróbával (Conover Iman; 1981); a szórásomogenitás teljesülésétől függetlenül bármely robusztus VA végreajtása a rangszámokon (robusztus rang VA-k); a robusztus VA-k közül legismertebb a Brown Forsyte-, a Welc- és a James-féle módszer (Brown Forsyte; 1974, Welc; 1951, James; 1951). Hangsúlyoznunk kell, ogy ezek az eljárások eurisztikus alapelven nyugvó közelítő módszerek, amelyek érvényességének körülményeit még empirikusan igazolni kell. Aszimptotikusan egzakt rangsorolásos eljárások A nemparaméteres összeasonlításokban nagy jelentőségűek az 1990-es évek közepétől megjelenő és leginkább M. G. Akritas, S. F. Arnold, E. Brunner és M. L. Puri nevével fémjelzett tanulmányok. Ezek pontosították a nemparaméteres összeasonlítások egzakt statisztikai nullipotéziseit és felvázoltak egy olyan matematikai statisztikai modellt, amelyben az ilyen jellegű nullipotézisek aszimptotikusan azaz elegendően nagy minták választása esetén érvényesen teszteletők (Akritas Arnold; 1994, Akritas Arnold Brunner; 1997, Brunner Munzel; 000, Brunner Puri; 001). Az előbbiekben kifejtett SZTH nullipotézisének vizsgálatára ebben a matematikai modellben E. Brunner egyik tanítványa, B. Kulle (1999) dolgozott ki doktori disszertációjában aszimptotikusan érvényes eljárásokat. (Ezek közül a kis mintákra jobb közelítést biztosító VA-típusú módszert a Függelékben részletesen ismertetjük.) SZÁMÍTÓGÉPES SZIMULÁCIÓS ELEMZÉS AZ SZTH STATISZTIKAI PRÓBÁIVAL Az előzőkben több statisztikai próbát tekintettünk át, amelyek szóba jöetnek az SZTH nullipotézisének vizsgálatára. Kérdés, ogy melyiket célszerű leginkább alkalmazni, a valamely empirikus vizsgálatban 3-5 nem túl nagy független mintát szeretnénk egy ordinális skálájú változó nagyságszintje tekintetében összeasonlítani. A választás

8 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 335 nem könnyű, mert kis minták esetén az áttekintett próbák egyikének érvényességét sem leet biztosítani, acsak nem kötünk ki olyan szigorú mellékfeltételeket (például a normalitást vagy azt, ogy az összeasonlítandó eloszlások legfeljebb egy eltolási állandóban különbözetnek egymástól), amelyek kis minták esetén megbízatóan nem ellenőrizetők, és a gyakorlatban legtöbbször nem is teljesülnek (Micceri; 1989). Viszonylag kis legfeljebb 30 elemű minták pedig gyakran előfordulnak olyan pszicológiai, biológiai, orvosi, pedagógiai stb. kutatásokban, amelyeknél a megfigyelések költségigénye relatíve magas. Ilyen esetben csak empirikus úton vetetjük össze a szóba jöető statisztikai eljárások előnyeit és átrányait. A matematikai statisztika legfőbb empirikus vizsgáló eszköze a számítógépes szimuláció. Ennek lényege az, ogy a függő változó eloszlására, a szignifikanciaszintre és az elemszámokra vonatkozó rögzített feltételek mellett számítógépes programmal véletlenszerű mintákat alkotunk igen nagy számban (I). Ezeken a mintákon végreajtjuk az elemzésbe bevont statisztikai próbát, döntést ozva előre rögzített szignifikanciaszinten a vizsgált nullipotézis elutasításáról, illetve megtartásáról. Végül megatározzuk, ogy az I számú független mintavétel ányad részében utasítottuk el a próba nullipotézisét. Ha az eloszlást (többmintás összeasonlítások esetén eloszlásokat) úgy állítjuk be, ogy a nullipotézis teljesüljön, akkor a kapott elutasítási arány a próba elsőfajú ibáját (), ellenkező esetben pedig a próba erejét (1 ) becsüli. Ily módon a számítógépes szimulációval leetővé válik a különféle statisztikai próbák érvényességének és atékonyságának összeasonlító elemzése. A szimulációban szisztematikusan változtatott tényezők 1. A minták száma. Jelen szimulációs vizsgálat elsődleges célja olyan általános érvényű összefüggések feltárása volt az SZTH vizsgálatára szóba jöető különböző statisztikai próbákkal (lásd a 7. pontot) kapcsolatban, amelyek a gyakorlatban előforduló tipikus mintaszámértékek ( = 3, 4, 5, ) mindegyikénél fellépnek. Ez okból a szimulációk nagy részét a = 3 mintaszámmal végeztem, majd az egyes következtetések megerősítésére a megfelelő szimulációs elemzést a = 4, = 5 mintaszámokkal is végreajtottam.. A mintaelemszámok. A szimulációs elemzésekben viszonylag kicsi, 10 és 30 közötti mintaelemszámokat választottam, mert a különféle közelítő eljárások érvényessége többnyire 30 alatti elemszámok esetén a legkritikusabb. Az elemzésekben szerepeltek azonos mintalemszámok ( , 0-0-0, ), valamint növekvő ( , ) és csökkenő ( , ) elrendezések. Ez leetővé tette az elemszámok és szórások különböző viszonyainak (például monoton növekvő és monoton fogyó) vizsgálatát is. 3. A szóráseterogenitás mértéke. Az elméleti szórások különbözőségének alapvetően 3 szintjét vizsgáltam: azonos szórások ( 1 = = 3), közepes mértékű szóráskülönbség, nagymértékű szóráskülönbség. E cél megvalósításáoz olyan 1 : : 3 elméleti szórásarányokat választottam, ogy a 1,, 3 szórásértékek Ve variációs együttatója (lásd Varga; 000a old.) azaz

9 336 VARGHA ANDRÁS relatív szórása rendre 0, 0,0, illetve 0,40 legyen. 1 Egyes speciális elrendezésekben szélsőségesen nagy, Ve = 0,60 szóráseterogenitást is alkalmaztam. A Ve variációs együttató teát itt a szórások szóródását méri. J. J. Clinc és H. J. Keselman (198) tanácsát követve ezen szóráseterogenitási szinteket rendre az alábbi i értékekkel értem el: Ve 1 3 3/ ,0 0, ,45 1,65 0,40 0, ,490,9 0,60 0,65 1 1,735 6,55 4. A függő változók eloszlása. A szimulációban az X 1, X, X 3 változók eloszlását külön-külön állítottam be, s itt most csak a folytonos esetre szorítkoztam. A folytonos eloszlások közül az elemzésekben árom szimmetrikus és két ferde eloszlástípust vontam be. A szimmetrikusak képviseletében szerepelt a normális, a normálisnál lényegesen kisebb csúcsosságú egyenletes, valamint a normálisnál atározottan nagyobb csúcsosságú f = 5 szabadságfokú t-eloszlás, t(5). A ferde eloszlásokat egy mérsékelten aszimmetrikus és a normálisnál kismértékben csúcsosabb lambda eloszlás (a lambda eloszláscsaláddal kapcsolatban lásd Ramberg Tadikamalla Dudewicz Mykytka; 1979), valamint az erősen aszimmetrikus és szélsőségesen csúcsos f = szabadságfokú -eloszlás képviselte. Mindezen eloszlások ferdeségi és csúcsossági együttatóját az 1. táblában foglaltuk össze. A szimulációba bevont folytonos eloszlások ferdeségi és csúcsossági együttatói Eloszlástípus Ferdeségi együttató E((X ) 3 )/ 3 Csúcsossági együttató E((X ) 4 )/ 4 Folytonos egyenletes 0 1,8 Normális 0 3 t(5) 0 9 Lambda 0,9 4, () 9 1. tábla A szimuláció során először minden eloszlást standardizált (0 átlagú és 1 szórású) alakban állítottam elő, majd ezeket a 3. pontban részletezett szórásokkal beszorozva kaptam meg a kívánt szórású változóalakokat. Az öt eloszlástípust = 3 esetén az alábbi kombinációkban alkalmaztam. a) normális: nnn; b) folytonos szimmetrikus: az egyenletes (e), a normális (n) és a t(5)-eloszlás (t) következő kombinációi: eee, ttt, eet, enn, ent, nne, nnt, tne, tnn, tte; c) folytonos aszimmetrikus: lambda-lambda-lambda és ()- ()- (). 1 Ve ( ) / N /. i A diszkrét változókkal kapcsolatos elemzésekkel külön tanulmányban foglalkozom.

10 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA Az SZTH versus sztocasztikus eterogenitás. Szimmetrikus eloszlások esetén az SZTH ekvivalens az elméleti átlagok egyenlőségével. Ezért ebben az esetben az SZTH fennállását azonos (mellesleg 0-val egyenlő) elméleti átlagok beállításával értem el minden szóráskombinációban. Azonos ferde eloszlások esetén viszont az SZTH csak akkor teljesül, a az összeasonlított eloszlások átlaga és szórása egyaránt azonos. Ezért ez esetben azonos átlagok és Ve > 0 esetén az SZTH bizonyosan sérül. Emiatt az SZTH fennállását különböző szórású ferde eloszlások esetén (azonos súlyok alkalmazásával) alkalmas eltolási állandók felasználásával értem el, amelyeket egy iterációs algoritmusú számítógépes programmal empirikusan atároztam meg. Ve Az SZTH fennállását azonos súlyokkal biztosító eltolási állandók az 1. táblában szereplő lambda és eloszlás esetén különböző szóráseterogenitási szinteken Lambda eloszlás () eloszlás 1. minta. minta 3. minta 1. minta. minta 3. minta 0,0 0,110 0, ,0 0, ,40 0,115 0, ,4030 0, ,60 0,880 0, ,5450 0, tábla A szimulációban a szignifikáns eredmények aránya az SZTH-t beállítva a próba elsőfajú ibájára ad pontbecslést, míg sztocasztikus eterogenitást beállítva a próba erejéről kapunk tájékoztatást. A sztocasztikus eterogenitást úgy értem el, ogy az SZTH-t biztosító X 1, X, X 3 változóármasban az első változóból kivontam 0,40-ot, a armadikoz pedig ozzáadtam ugyanennyit. Különböző elemszámok esetén megvizsgáltam az ellenkező előjelű 1 = 0,40, = 0, 3 = 0,40 beállítás atását is. Ezen esetekben azonos szórások (azaz Ve = 0) esetén az 1. és a 3. minta elméleti eloszlása közötti különbség szokásos Coen-féle atásmértéke éppen 0,8, amely a Coen-féle konvenció szerint igen jelentősnek tekintető (Coen; old.). Az SZTH szempontjából különösen érdekes ferde eloszlások esetén megvizsgáltam a = 0,5 esetet is, mely J. Coen szerint a közepes szintű eltérés mértéke, s amelyet az X 1 0,40, X 3 + 0,1 eltolásokkal értem el. 6. Szignifikanciaszint. A szimulációs elemzéseket a gyakorlatban legtöbbször előforduló = 0,01, = 0,05, = 0,10 szintek mindegyikére elvégeztem. 7. Statisztikai próbák. A szimulációs elemzésekbe a következő próbákat vontam be. i) Egyszempontos független mintás VA. Ennek érvényessége elméletileg csak az nnn eloszláskombinációra garantált 1 = = 3, azaz Ve = 0 esetén. Más szimmetrikus eloszláskombinációra Ve = 0 esetén a VA legfeljebb csak közelítő pontosságú. Ferde eloszlások esetén az SZTH fennállását csak az biztosítja, a az X 1, X, X 3 változók azonos eloszlástípusba tartoznak, és Ve = 0, így a VA is csak ez esetben jöet szóba az SZTH tesztelésére. ii) Egyszempontos független mintás robusztus VA-k: Brown Forsyte-próba (BF), Welc-próba (W), James-próba (J). E próbák érvényessége a normalitás esetén és nagy mintákra garantált. Más szimmetrikus eloszláskombinációk esetén csak legfeljebb közelítő pontosságra számítatunk. Azonos ferde eloszlások esetén az SZTH tesztelése e próbák kapcsán is csak a Ve = 0 feltétel teljesülése esetén jöet szóba. (Végreajtásuk tec

11 338 VARGHA ANDRÁS nikai részleteire terjedelmi okokból nem térünk ki. A részleteket lásd a BF-fel kapcsolatban: Brown Forsyte; 1974, Dixon; old. vagy Varga; old., a W-vel kapcsolatban: Welc; 1951 vagy Wilcox; old., a J-vel kapcsolatban: James; 1951 vagy Wilcox; old.). Ezeket a robusztus próbákat a agyományos VA alternatíváiként normális eloszlású változókra dolgozták ki az elméleti átlagok egyenlőségének tesztelésére a szórásomogenitás feltételének sérülése esetén. Emiatt normális eloszlású változók esetén segítségükkel az átlagok egyenlőségével ez esetben ekvivalens SZTH is tesztelető. Más szimmetrikus eloszláskombinációkra e próbák legfeljebb csak közelítő pontosságúak. Ferde eloszlások esetén az SZTH fennállását csak az garantálja, a az X 1, X, X 3 változók azonos eloszlástípusba tartoznak, és Ve = 0, így csak ez esetben jöetnek szóba az SZTH tesztelésére. iii) Kruskal Wallis-próba (KW). Végreajtásának lépéseit illetően lásd Kruskal Wallis (195) vagy Varga (000a old.). iv) Rangszámokon végreajtott egyszempontos független mintás VA (rang VA). A rang VA (röviden rva) végreajtásának módja: rangszámok képzése ugyanúgy, mint KW-ben, a rangszámokon egyszempontos független mintás VA végreajtása. v) Rangszámokon végreajtott robusztus egyszempontos független mintás VA-k (rbf, rw, rj). E próbák végreajtásának módja: rangszámok képzése ugyanúgy, mint KW-ben, a rangszámokon végreajtjuk BF-et, W-t, illetve J-t. vi) Kulle-féle próbák. Mintaelemszámmal súlyozott sokaságok/eloszlások esetén az SZTH tesztelése a K s = fˆ F K /1/ próbastatisztika segítségével ajtandó végre (lásd /F4/ és /F5/ formula), mely az SZTH fennállása esetén aszimptotikusan fˆ szabadságfokú eloszlást követ. Ezt a próbát a továbbiakban KKF-fel rövidítjük. Azonos súlyok esetén az SZTH tesztelése a K = ĝ G K /13/ próbastatisztika segítségével ajtandó végre (lásd /F19/ és /F0/ formula), mely az SZTH fennállása esetén aszimptotikusan ĝ szabadságfokú eloszlást követ. Megjegyzendő, ogy azonos mintaelemszámok esetén a két próbastatisztika, valamint a két szabadságfok megegyezik, így a két eljárás ekvivalens. Ezt a próbát a továbbiakban KKG-vel rövidítjük. A normális eloszlású változókkal végzett szimulációs vizsgálatban B. Kulle ( old.) arra az eredményre jutott, ogy előbbi próbái 30-nál kisebb átlagos mintaelemszám esetén liberálisak (azaz elsőfajú ibájuk többnyire számottevően magasabb, mint a szignifikanciaszint). Ez a jelenség gyakori az aszimptotikusan normális eloszlású próba

12 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 339 statisztikák esetén, amelyek kis minták mellett pontosabban közelítetők egy alkalmas szabadságfokú t-eloszlással (Brunner Munzel; 000, Varga; 000b, Varga Delaney; 000). Emiatt a Kulle által javasolt próbák mellett a következő módosított változatokat is bevontam a szimulációs elemzésekbe. a) K s elyett az /F4/ formulával definiált F K próbastatisztikát vettem, s ezt az F- táblázat szerint értékeltem ki az f 1 = ˆf, f = f w szabadságfokokkal, aol fˆ -ot az /F5/, f w - t pedig az alábbi formula segítségével atároztam meg: ˆ j itt c j = n j /, aol 1 3 (1 / ) c j U f w ; /14/ j n j ˆ j az /F11/ képlet segítségével definiált mennyiség és U = c j. E próbát a továbbiakban KF1-gyel jelöljük. Ezen eljárás a következő megfontoláson alapul. Kulle ( old.) matematikai levezetéssel igazolta, ogy /1/ próbastatisztikájú próbája = esetén az SZTE tesztelésére Brunner, Puri és Sun (1995) által javasolt próbára redukálódik, mely egyébként ugyanaz, mint Brunner és Munzel (000) nagy mintákra érvényes eljárása. Ez utóbbiak szimulációs vizsgálattal kimutatták, ogy ennek a kétmintás próbának az érvényessége kis és közepes minták (n j < 50) esetén számottevően javítató, a próbastatisztikáját nem a standard normális, anem a t-eloszlás táblázatával értékeljük ki. Az alkalmazandó szabadságfokot a kétmintás Welc-próba szabadságfokára vonatkozó képlettel atározták meg oly módon, ogy az eredeti adatokból számított mintavarianciák elyett az /F3/ formulával definiált Z j változók /F11/ formulában szereplő ˆ j varianciabecsléseit vették (Brunner Munzel; 000. (5.9) formula). Ennek ana- lógiájára a /14/ formula a Welc-féle VA próbastatisztikájának f szabadságfokát definiáló képlet azzal az eltéréssel, ogy benne az eredeti adatok mintavarianciái elyett szintén a varianciabecslések szerepelnek. ˆ j ˆ~ j b) Hasonló megfontolások alapján a /13/-ban szereplő K statisztika elyett az /F19/ formulával definiált G K próbastatisztikát vettem, s ezt az F-táblázat szerint értékeltem ki az f 1 = ĝ, f = g w szabadságfokokkal; ĝ -ot az /F0/, g w -t pedig a /14/ formula segítségével atároztam meg a c j = n j / beelyettesítéssel, aol ˆ~ j az /F6/ képlete segítségével definiált mennyiség és U = c j. E próbát a továbbiakban KG1-gyel jelöljük. Néány próbaszimulációt elvégezve úgy tűnt, ogy F K és G K esetenként a névlegesnél kissé alacsonyabb elsőfajú ibákat eredményez, ezért a szimulációban kipróbáltam két olyan változatot is, amelyben az f w, illetve a g w szabadságfokot megnöveltem, a következőképpen: f w = min(f w, n ) és g w = min(g w, n ). /15/ Ezen újabb szabadságfok-változatok értéke teát általában a korábbiak kétszerese, de felülről limitáljuk őket a agyományos VA F próbastatisztikájának f = n szabadságfokával. Az így kapott próbaváltozatokat a továbbiakban KF-vel, illetve KG-vel jelöljük.

13 340 VARGHA ANDRÁS A szimulációs elemzés néány tecnikai részlete A szimulációs elemzések programját Turbo Pascal 7.0 programozási nyelven írtam, és a futtatásokat Pentium PC-n végeztem el. E programmal az előbb leírt elemszám-, variancia- és eloszláselrendezések mindegyikében véletlen megfigyeléseket iktattam be, egy-egy elrendezésben egymástól független mintavétellel. Ez az ismétlési szám az elsőfajú iba, illetve a próba erejének legalább 0,0050 pontosságú becslését tette leetővé (a becslés standard ibája egészen pontosan 10 százalékos valódi elsőfajú iba mellett 0,0030, 5 százalékos elsőfajú iba mellett 0,00, 1 százalékos elsőfajú iba mellett pedig 0,0010). Minden mintavétel esetén kiszámítottam az előbbiekben részletezett 15 statisztikai próba mindegyikét, és megnéztem, ogy szignifikánsak-e 1, 5, illetve 10 százalékos szinten, majd megatároztam a szignifikáns eredmények arányát a mintavételben mindárom valószínűségi szintre vonatkozóan. Ezek olyan eloszláselrendezésekben, amelyekben az SZTH fennáll, a vizsgált próbák elsőfajú ibáját, egyébként az erejét becsülik. Az egyenletes eloszlású pszeudovéletlen megfigyeléseket a Turbo Pascalba beépített Random függvénnyel oztam létre. Ez lineáris kongruens véletlen szám generátor, mely egy közelmúltban megjelent tanulmány szerint több vonatkozásban a legjobb eljárások egyikének tekintető (Ongena, 1993). A normális, a t- és a ki-négyzet-eloszlást a W. H. Press, B. P. Flannery, S. A. Teukolsky és W. T. Vetterling (1989) könyvében, a szóban forgó lambda eloszlást pedig a J. S. Ramberg, P. R. Tadikamalla, E. J. Dudewicz és E. F. Mykytka (1979) tanulmányában leírt módon oztam létre az említett módszerrel kapott egyenletes eloszlású pszeudovéletlen számok segítségével. A lambda eloszlásokkal részletesebben Varga A. (1996) írása foglalkozik. A szimulációs elemzések eredményei 1. Normális eloszlás azonos elméleti szórásokkal: a szimulációs eljárás itelessége. Az elemzések csak akkor leetnek itelesek, a a kapott eredmények nem mondanak ellent elméleti ismereteinknek. Esetünkben ez többek között azt jelenti, ogy a VA feltételeinek (normális eloszlás és szórásomogenitás) teljesülése esetén a kapott elsőfajú ibabecslések nem különbözetnek számottevően a szignifikancaszinttől. E feltételek mellett az elsőfajú ibabecslések a árom szinten a következő tartományokba estek: = 0,01: 0,0079 0,011; = 0,05: 0,047 0,054; = 0,10: 0,098 0,105. Ezen értékek közül csak az 1 százalékos szinten kapott 0,0079-es minimális érték különbözik szignifikánsan a névleges 0,01-os értéktől (nagy mintás binomiális próbával z = =,10, p < 0,05). A itelesség ellenőrzésére a szóban forgó elrendezéssel újabb szimulációs elemzést végeztem, de elyett véletlen mintavétellel. Az ekkor kapott 0,0096-es ibabecslés már nem tért el szignifikánsan az = 0,01-os névleges szinttől. Normális eloszlás és 1 = = 3 esetén a VA mellett a KKF és a KKG kivételével teljesen elfogadató elsőfajú ibabecsléseket kaptunk az összes próbára 5 és 10 százalé

14 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 341 kos szignifikanciaszinten; az elsőfajú ibabecslések = 0,05 esetén 0,045 és 0,057, = = 0,10 esetén pedig 0,09 és 0,11 közé estek. 1 százalékos szinten a becslések szóródása nagyobb volt (értéktartomány: 0,0071 0,0170). A KKF és a KKG Kulle eredményeivel összangban végig érezetően liberális, vagyis a névlegesnél magasabb elsőfajú ibákat adott (a kapott elsőfajú ibabecslések tartománya a árom szinten rendre 0,014 0,03, 0,05 0,068, illetve 0,099 0,117). Emiatt a továbbiakban eltekintünk a KKF-re és a KKG-re vonatkozó eredmények ismertetésétől.. Folytonos szimmetrikus eloszlások azonos mintaelemszámokkal. Ha a normalitástól eltekintünk, akkor már nem feltétlenül igaz az, ogy a szimulációba bevont eljárások minden esetben érvényes eljárások lesznek. Ez indokolja leginkább a szimulációs elemzéseket, amelyek segítségével empirikusan győződetünk meg az egyes eljárások érvényességi feltételeiről. Az érvényesség fennállása erősen függ a szóráseterogenitás mértékéről, ezért az eredményeket e szempont szerint bontva ismertetjük. a) Azonos elméleti szórások (Ve = 0). A megvizsgált 11 eloszláskombináció (eee, enn, ent stb.) és a árom azonos elemszám-kombináció ( , 0-0-0, ), vagyis összesen 33 elrendezés esetén nyert minimális és maximális elsőfajú ibabecsléseket 5 százalékos névleges szint mellett a 3. tábla tartalmazza árom szóráseterogenitási szintre vonatkozóan (Ve = 0, Ve = 0,, Ve = 0,4). 33 elrendezés esetén nyert minimális és maximális elsőfajú ibabecslések = 0,05 névleges szint mellett árom szóráseterogenitási szinten azonos mintaelemszámok esetén 3. tábla Próba Ve = 0 Ve = 0, Ve = 0,4 minimum maximum minimum maximum minimum maximum VA 0,045 0,057 0,045 0,058 0,055 0,071** BF 0,043 0,057 0,045 0,057 0,049 0,064* W 0,043 0,057 0,043 0,054 0,044 0,059 J 0,040 0,057 0,038 0,053 0,038 0,053 KW 0,041 0,056 0,043 0,060* 0,053 0,070** RF 0,046 0,057 0,046 0,06* 0,056 0,073** RBF 0,045 0,057 0,046 0,061* 0,055 0,070** RW 0,048 0,058 0,047 0,061* 0,054 0,07** RJ 0,047 0,058 0,047 0,060* 0,053 0,069** KF1=KG1 0,039 0,054 0,041 0,05 0,043 0,051 KF=KG 0,044 0,056 0,044 0,055 0,047 0,059 * Szignifikánsan nagyobb 0,055-nél. ** Szignifikánsan nagyobb 0,060-nél. Megjegyzés. KF1 és KG1, illetve KF és KG itt most az azonos elemszámok miatt egyezik meg. A 3. táblából kiolvasatjuk, ogy a kapott elsőfajú ibabecslések tartománya Ve = 0 és = 0,05 esetén 0,039 0,058, aol a felső atár nem nagyobb szignifikánsan a névleges szint 110 százalékánál (azaz 0,055-nél), mely a szokásosan elfogadott Bradley-féle konvenció szerint a robusztusság szigorú kritériumának tekintető (Bradley; 1978). Ugyanez a tartomány = 0,1 esetén 0,091 0,11, s a felső atár itt sem nagyobb szignifikánsan a névleges szint 110 százalékánál. Mindez azt jelenti, ogy folytonos és szim

15 34 VARGHA ANDRÁS metrikus eloszlások körében Ve = 0 esetén a 3. táblában feltüntetett próbák egyikének sem sérül számottevően az érvényessége a szokásos 5 százalékos szignifikanciaszinten, a azonos mintaelemszámokkal dolgozunk. = 0,01 esetén azonban W és a rangsorolásos eljárások többsége számos elrendezésben érezetően liberális, a névleges szintet néa százalékosan megaladó elsőfajú ibát adva. Emiatt a továbbiakban csak az = 0,05, = 0,1 szintekez tartozó eredményeket részletezzük. Az egyazon nullipotézist tesztelő és nagyjából asonló érvényeségű próbák közül nyilván azt érdemes a gyakorlatban asználni, amelyiknek ereje a legnagyobb. Az erőelemzés esetünkben a következő eredményekre vezetett. 5 és 10 százalékos szignifikanciaszinten a paraméteres próbák (VA, BF, W és J) közül legnagyobb erejű többnyire a VA, de a többi próba ereje sem számottevően kisebb, az erőkülönbség sosem nagyobb 0,0-nál. A rangsorolásos próbák (KW, rva, rbf, rw, rj, KF1 és KF) közül a legerősebb többnyire az rw és a KF, de a KF1 kivételével a többi ereje sem számottevően kisebb. Értető okokból a KF1 ereje általában 0,0-0,03-dal kisebb, mint a KF-é, illetve a többi rangsorolásos próbáé. Ez okból a paraméteres és a rangsorolásos próbák ereje közötti összevetésez elegendő a VA és a KF erejének összeasonlítása. Ez az elemzés a következő összefüggésekre világított rá. i) A ttt eloszláskombináció esetén a KF minden szignifikanciaszinten számottevően erősebb, mint a VA (az 5 százalékos szinttel kapcsolatban lásd az 1. ábra a) grafikonját). Annak ellenőrzésére, ogy ez a jelenség áromnál több minta összeasonlítása esetén is fennáll-e, azonos n = 15 elemszámmal szimulációt végeztem a = 3, 4, 5 mintaszámokkal. A kapott eredmények megerősítették a feltételezést. A KF és a VA ereje közötti különbség 1 = (0,40 + 0,05( 3)), i = 0 (1 < i < ), = 0,40 + 0,05( 3) mellett a árom elemszámszinten rendre 0,06, 0,06, illetve 0,05 volt, KF javára. ii) nnt és tnn esetén VA és KF ereje asonló nagyságrendű, az eltérés sosem nagyobb, mint 0,0. iii) Az összes többi kombinációban (amelyekben az egyenletes eloszlás e legalább egyszer szerepel) a VA számottevően erősebb, mint a KF. Illusztrációként az enn kombinációra vonatkozó összeasonlítás az 1. ábra b) grafikonján látató. Az 1. pontban említettel azonos elemzés megerősítette, ogy ez az összefüggés = 4 és = 5 esetén is fennáll: enn esetében a KF és a VA ereje közötti különbség a árom elemszámszinten rendre 0,04, 0,06, illetve 0,05 volt, VA javára. 1. ábra. Erőbecslések két eloszláskombinációra = 0,05 szinten a) ttt eloszláskombináció b) enn eloszláskombináció 1 0,8 Erőbecslés 0,8 0,6 0,4 KF VA Erőbecslés 0,7 0,6 0,5 0,4 0,3 VA KF 0, n = 10 n = 0 n = 30 Közös mintaelemszám 0, n = 10 n = 0 n = 30 Közös mintaelemszám b) Mérsékelten különböző szórások (Ve = 0,). Közepes mértékű szóráseterogenitás esetén (ekkor max / min = 1,65) az erőre vonatkozó eredmények a következőképpen alakultak. A paraméteres próbák közül a W tűnik a legjobbnak, amelynek ereje több esetben

16 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 343 (főleg nagyobb minták esetén) megaladja a VA erejét. Hasonló szerepváltás figyelető meg az rw és a KF között, bár ez részben abból is fakad, ogy az rw elsőfajú ibaszintje a szóráseterogenitás miatt enyén megemelkedett. (Lásd a 3. táblát.) A paraméteres rangsorolásos összevetésben most a következő összefüggések tűntek ki. i) A ttt eloszláskombinációban ismét a rangsorolásos próbák szerepeltek a legjobban. Például = 0,05 esetén a KF és a W ereje közötti különbség a árom elemszámszinten rendre 0,03, 0,04, illetve 0,05, míg ugyanez a különbség az rw és a W között mindárom elemszámszinten 0,07 lett. ii) A többi olyan eloszláskombinációban, aol t volt a 3. elyen, vagyis a legnagyobb szórással párosítva (nnt, ent, eet), a paraméteres és a rangsorolásos próbák erejének nagysága asonló volt, a rangsorolásos próbák esetenkénti enye fölényével. iii) Azokban az eloszláskombinációkban, aol e volt a legnagyobb szórással párosítva (nne, tne, tte, eee), a paraméteres próbák egyértelmű fölényben voltak a rangsorolásos próbákkal szemben. Például a tte kombinációban = 0,05 szinten az erőkülönbség a árom eloszlásszinten a W rw viszonylatban rendre 0,0, 0,07 és 0,08, a W KF összevetésben pedig rendre 0,05, 0,1 és 0,13 volt. c) Erősen különböző szórások (Ve = 0,4). A 3. tábla utolsó oszlopából kiolvasató, ogy nagymértékű szóráseterogenitás esetén (ekkor max / min =,9) érvényesként az SZTH tesztelésére csak W, J, KF1 és KF jöet szóba. Mivel a két paraméteres próba (W és J) közül mindig W, a két Kulle-féle eljárás közül pedig mindig KF az erősebb, ezért az SZTH tesztelésére legalkalmasabb próba kiválasztásáoz ez esetben a W és a KF erejét kell összevetni. Ez az összeasonlítás a következő eredményre vezetett. i) A ttt eloszláskombinációban W és KF ereje azonos nagyságú. Például 5 százalékos szignifikanciaszinten W becsült ereje a árom elemszámszinten rendre 0,35, 0,64 és 0,8, míg KF-é 0,33, 0,63, illetve 0,8 volt. ii) Mérsékelt W erőfölény figyelető meg azokban az eloszláskombinációkban, aol a legnagyobb szórás magas csúcsossággal jár együtt (nnt, ent, eet stb.). iii) Igen nagy W erőfölény figyelető meg az összes többi eloszláskombinációban (nnn, tte, eee stb.). Például tne kombinációban 5 százalékosos szignifikanciaszinten W becsült ereje a árom elemszámszinten rendre 0,9, 0,59 és 0,79, míg a KF-é 0,19, 0,35, illetve 0,51. Érdekes, ogy ebben az esetben még a megemelkedett elsőfajú ibájú rw is észleletően gyengébb W-nél (rw becsült ereje a árom elemszámszinten rendre 0,7, 0,49, illetve 0,67). Az rw minden elyzetben tapasztalató erőfölénye KF-vel szemben magas szóráseterogenitás esetén azt az ötletet adta, ogy talán leet rw-t konzervatív irányban módosítani (vagyis a névleges szintet többnyire megaladó elsőfajú ibáját mérsékelni) úgy, ogy KF-vel szembeni erőfölénye megmaradjon. Ez okból egyes szimulációs elemzésekben az rw eljárás f szabadságfokát a következőképpen módosítottam: f uj = f (1,1 Ve(s)), /16/ aol Ve(s) az összeasonlított független minták tapasztalati szórásainak variációs együttatója. Emellett f uj értéktartományát felülről f -vel, alulról pedig 0,5f -vel korlátoztam. Minél nagyobb a vizsgált eloszlások szórásai közötti különbség, annál nagyobb általában Ve(s), s annál kisebb az f uj szabadságfok f -öz viszonyítva. rw ezen módosítását a továbbiakban rw-vel jelöljük. Az rw alkalmasságának ellenőrzésére a következő elemzést végeztem. I = véletlen mintavétellel az összes szimmetrikus eloszlásra vonatkozó szimulációs elrende

17 344 VARGHA ANDRÁS zésből (ezek száma 09 volt) kikerestem azt a 5-öt, amelyre W elsőfajú ibabecslése = 0,05 szinten a legnagyobb volt. E becslésértékek 0,064 és 0,07 közé estek. Ezzel a 5 elrendezéssel újabb szimulációt végeztem rw-re és rw-re vonatkozóan, és a következő eredményt kaptam. rw ezen szimulációkban is erősen liberálisnak mutatkozott = 0,05 szinten 0,060 és 0,073 közé eső elsőfajú ibákkal. Ugyanakkor rw elsőfajú ibabecslése a 5-ből csak mindössze két esetben aladta meg a 0,060-et (egy esetben 0,065, egy másikban pedig 0,06 volt). E maradék két esetben újabb, de jóval nagyobb ismétlési számú (I = ) szimulációval becsültem meg rw elsőfajú ibáját, amely most 0,06-nek, illetve 0,059-nek adódott. Mindez azt mutatja, ogy az rw eljárás f szabadságfokának javasolt módosítása elfogadató mértékűre csökkenti az inflációs torzítást. Ugyanakkor rw-vel is lefuttatva a ttt eloszláskombinációban a többi próbával már elvégzett szimulációkat, kiinduló feltételezésemet megerősítő eredményeket kaptam. Ezekben az elrendezésekben ugyanis rw atározottabban nagyobb erejű volt KF-nél és W-nél, s ugyanezt mutatták a > 3 mintaszámokkal végreajtott szimulációk is. Például n = 15 és = 0,05 esetén = 3, 4, 5 értékek mellett W elsőfajú ibabecslése rendre 0,50, 0,63, 0,70, a KF- é 0,49, 0,55, 0,58, az rw-é pedig 0,55, 0,69, 0,75 volt. 3. Folytonos szimmetrikus eloszlások különböző mintaelemszámokkal. Mivel 10 és 30 közötti elemszámok segítségével a szórásomogenitás fennállása, mely feltételre nézve VA, rva és KW különböző mintaelemszámok esetén fokozottan érzékeny (lásd például Sceffé; old.), nem ellenőrizető kellő megbízatósággal, ez esetben csak a robusztus próbák elemzésére szorítkozunk. Az 5 és 10 százalékos szintre vonatkozó elsőfajú ibabecslések minimumát és maximumát a 4. tábla tartalmazza az elemszámok és az elméleti szórások közötti kapcsolat jellege szerinti bontásban. E táblából kiolvasató, ogy a robusztus rang VA-k a szórásomogenitás sérülése esetén gyakran idéznek elő a névlegesnél magasabb elsőfajú ibát, s ugyanez igaz a Kulle-féle próbákra, a az elemszámok és az elméleti szórások negatív kapcsolatban vannak egymással. A paraméteres próbák közül látatóan W és J tartja legjobban a névleges szintet. Tíz robusztus próba minimális és maximális elsőfajú ibabecslése különböző elemszámok esetén az elemszámok és elméleti szórások közötti kapcsolat jellege szerinti bontásban Az elemszámok és az elméleti szórások közötti kapcsolat Próba negatív (k = 44) Ve = 0 (k = ) pozitív (k = 44) minimum. maximum minimum maximum minimum maximum = 0,05 BF 0,045 0,066** 0,044 0,053 0,047 0,064* W 0,04 0,060* 0,045 0,056 0,044 0,056 J 0,038 0,055 0,04 0,05 0,041 0,053 rbf 0,049 0,068** 0,047 0,056 0,049 0,07** rw 0,051 0,069** 0,050 0,059* 0,05 0,070** rj 0,049 0,065** 0,047 0,056 0,050 0,069** KF1 0,044 0,058 0,045 0,05 0,039 0,047 KF 0,053 0,068** 0,05 0,059* 0,044 0,055 KG1 0,046 0,06* 0,046 0,053 0,041 0,049 KG 0,053 0,071** 0,051 0,061* 0,046 0, tábla (A tábla folytatása a következő oldalon.)

18 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 345 Próba (Folytatás.) Az elemszámok és az elméleti szórások közötti kapcsolat negatív (k = 44) Ve = 0 (k = ) pozitív (k = 44) minimum maximum minimum maximum minimum maximum = 0,10 BF 0,093 0,113 0,090 0,103 0,096 0,110 W 0,09 0,108 0,090 0,105 0,091 0,105 J 0,088 0,104 0,089 0,104 0,091 0,105 rbf 0,096 0,117* 0,096 0,106 0,099 0,15** rw 0,098 0,14* 0,098 0,109 0,100 0,19** rj 0,096 0,1* 0,097 0,108 0,099 0,19** KF1 0,089 0,10 0,089 0,098 0,086 0,096 KF 0,098 0,11 0,097 0,107 0,09 0,105 KG1 0,090 0,105 0,090 0,099 0,086 0,100 KG 0,098 0,114 0,098 0,108 0,093 0,107 * Szignifikánsan nagyobb 1,1-nál. ** Szignifikánsan nagyobb 1,-nál. Az előző,. pontban az rw módosított formájával, rw-vel kapcsolatban említett szimulációs elemzések alapján rw-t is a névleges szintet nem számottevően megaladó elsőfajú ibájú eljárások közé kell sorolnunk. Így az SZTH tesztelésére ez esetben legalkalmasabb próba megtalálásáoz leginkább a W, az rw és a Kulle-féle próbák erejét kell összevetnünk különböző elrendezésekben. A legjelentősebb összefüggések a legnagyobb szóráseterogenitási szinten jelentkeztek, melyek szemléltetésére a árom eloszláskombinációval kapcsolatos erőelemzés eredményeit az 5. tábla mutatja be. 5. tábla Négy robusztus próba erőbecslései különböző elemszámok esetén magas szóráseterogenitási szinten (Ve = 0,4) árom eloszláskombinációra vonatkozóan W rw KF KG n 1-n -n 3 próba tnn eloszláskombináció ,50 0,48 0,43 0, ,6 0,60 0,57 0, ,39 0,37 0,8 0, ,46 0,43 0,9 0,30 tnu eloszláskombináció ,49 0,38 0,3 0, ,6 0,49 0,44 0, ,37 0,30 0,0 0, ,43 0,35 0,1 0, ttt eloszláskombináció ,53 0,58 0,54 0, ,64 0,70 0,69 0, ,44 0,47 0,38 0, ,50 0,54 0,40 0,41

19 346 VARGHA ANDRÁS Az 5. táblában bemutatott és a többi eloszláskombinációval kapcsolatban elvégzett erőelemzések alapján a következő megállapításokat teetjük különböző elemszámok esetén magas szóráseterogenitási szinten. i) A rangsorolásos eljárások egyetlen eloszláskombinációban (ttt) atékonyabbak, mint a legjobb robusztus paraméteres próba, W. Minden más eloszláskombinációban W nagyobb erejű, mint a rangsorolásos probák. W fölénye különösen magas, a a magas szórás alacsony csúcsossággal párosul (tnu, tuu, uuu stb.). ii) Az 5. táblában szereplő négy rangsorolásos eljárás közül minden esetben rw a legerősebb. A Kulle-féle próbákkal szembeni erőfölénye különösen szembetűnő abban az esetben, amikor az elemszámok és a szórások kapcsolata negatív, vagyis amikor kis minta nagy szórással, nagy minta kis szórással társul. iii) Szimmetrikus eloszlások esetén az SZTH definíciójában szereplő w i súlyok (lásd /10/) irrelevánsak, mert az SZTH fennállása nem függ tőlük. Emiatt KF1, KF, KG1 és KG, nullipotézise közös. Közülük KF1 és KG1 kissé konzervatívabb, mint KF és KG és ez mérlegelendő előny leet abban az esetben, amikor ez utóbbiak elsőfajú ibája ajlamos megnőni, azaz (negatív szóráselemszám-kapcsolat esetén). (Lásd a 4. táblát.) iv) KF és KG (és asonlóképpen KF1 és KG1) ereje között bár szisztematikus, de elanyagolató mértékű különbség figyelető meg. Ugyanezen elrendezésekben Ve = 0 esetén, a az elemszámok azonosak, a bemutatottakoz asonló mintázatú összefüggések érvényesek (lásd. pont a) eset) rw, KF és KG végig azonos nagyságrendű atékonyságával, Ve = 0, esetén pedig a Ve = 0,4 szintre vonatkozó összefüggések mutatkoznak, csak kevésbé erőteljes formában. 4. Folytonos ferde eloszlások. A két ferde eloszlással végzett szimuláció nagyon asonló eredményekre vezetett, a következő összefüggésekkel. a) Az rw elsőfajú ibája Ve 0,4 esetén teljesen elfogadató volt: 5 és 10 százalékos szinten egyetlen elsőfokú ibabecslés sem aladta meg szignifikánsan a névleges szint 110 százalékát. Az rw érvényessége csak Ve = 0,6 esetén csorbult számottevően. Ez esetben a kapott elsőfajú ibabecslések maximuma 5 százalékos szinten 0,071, 10 százalékos szinten pedig 0,136 volt. b) A Kulle-féle próbák közül KF1 és KG1, illetve KF és KG érvényessége gyakorlatilag azonos szintű volt minden elrendezésben. Esetenként KF1 és KF elsőfajú ibája egy árnyalattal kedvezőbb, mint KG1-é, illetve KG-é. Még különböző elemszámok esetén is. Ez azért figyelemre méltó, mert az SZTH-t azonos w i súlyokkal állítottam be, ami miatt KG1-nek, illetve KG-nek kellett volna elméletileg a névleges szintet jobban tartania. Ennek itt felteetőleg az az oka, ogy a ferde eloszlások az SZTH beállítása után a páronkénti sztocasztikus egyenlőség követelményének is eleget tettek, melynek fennállása esetén nincs különbség az SZTH súlyozott és súlyozatlan fogalma között. A Kulle-féle próbák elsőfajú ibája érdekes összefüggésben van az elemszámok és a szórások közötti viszonnyal. KF és KG szinte csak akkor mutat a névleges szintet lényegesen megaladó elsőfajú ibát, a az (n i, i ) kapcsolat negatív. Például KF elsőfajú ibája = 0,05 esetén az összes ilyen elrendezésben egy kivétellel mindig szignifikánsan nagyobb volt, mint 1,1, míg más elrendezésekben ilyen megemelkedett elsőfajú iba csak egyszer fordult elő. c) Ha a próbák erejét is figyelembe vesszük, akkor a következő kép rajzolódik ki. i) Azonos elemszámú elrendezésekben alacsony szóráseterogenitás (Ve 0,) esetén legtöbbször KF, magasabb szóráseterogenitás esetén viszont rw ereje tűnik a kedvezőbbnek. ii) Pozitív (n i, i) viszony esetén KF mutatkozik az SZTH legjobb próbájának, mert rw csak akkor erősebb KF-nél, a elsőfajú ibája már erőteljesen megaladja a névleges szintet.

20 FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 347 iii) Negatív (n i, i) kapcsolat esetén viszont egyértelműen rw a legjobb próba, mert kedvező 0,06-ot sosem megaladó elsőfajú ibaszint mellett ereje számottevően nagyobb, mint bármely Kulle-féle próbáé. A KF és az rw ereje 5 százalékos szignifikanciaszinten a elemszámkombináció esetén árom szóráseterogenitási szintre vonatkozóan Ki-négyzet-eloszlás Lambda eloszlás Próba Ve = 0, Ve = 0,4 Ve = 0,6 Ve = 0, Ve = 0,4 Ve = 0,6 KF 0,61 0,51 0,36 0,7 0,1 0,19 rw 0,69 0,74 0,68 0,36 0,38 0,39 6. tábla * A jelen tanulmányban független minták összeasonlításának egy új módját mutattuk be. Az ugyanakkoraság átlagok segítségével történő definíciójának alternatívájaként bevezettük a sztocasztikus egyenlőség (SZTE) és a sztocasztikus omogenitás (SZTH) fogalmát. Kissé leegyszerűsítve egy X és egy Y változóval reprezentált sokaságot akkor mondunk sztocasztikusan egyenlőnek, a X < Y ugyanolyan gyakran fordul elő, mint X > Y. Az SZTH az SZTE általánosítása kettőnél több sokaságra. Az SZTH fennállásának feltétele, ogy az összeasonlított sokaságok egyike se legyen sztocasztikusan kisebb vagy nagyobb, mint a maradék uniója. Az SZTH tesztelésével kapcsolatban számos paraméteres és nemparaméteres (rangsorolásos) próbát vettünk szemügyre, s ezek előnyeit és átrányait számítógépes szimuláció segítségével elemeztük 10 és 30 közötti nagyságú mintákkal különböző szóródású és eloszlású elrendezésekben. Az elemzések legfontosabb következtetései a következők. 1. Folytonos szimmetrikus eloszlások esetén, amikor az SZTH azonos az elméleti átlagok egyenlőségével, az SZTH nullipotézisének tesztelésére leginkább a Welc-féle VA (W) a legalkalmasabb. A agyományos VA ugyan némileg atékonyabb W-nél abban az esetben, amikor teljesül a normalitás és a szórásomogenitás feltétele, de ezt kis minták esetén aliga leet megbízatóan ellenőrizni. A paraméteres W elyett egy esetben célszerű más eljárásoz folyamodni: akkor, a a függő változó eloszlása minden sokaságban sokkal csúcsosabb, mint a normális eloszlás. Ilyenkor a paraméteres próbák (köztük W) kisebb erejűek, mint egyes rangsorolásos próbák, amelyek közül egyes esetekben a B. Kulle (1999) által ismertetett eljárás egyik módosítása (KF), legtöbbször pedig a rang Welc-próba egyik módosítása (rw) mutatkozik a legmegfelelőbbnek.. Ferde eloszlások esetén az SZTH és az átlagok egyenlősége két különböző reláció. Emiatt az SZTH tesztelésére ez esetben csak a rangsorolásos eljárások jöetnek szóba. Közülük ismét csak a KF és az rw tűnik a legjobbnak. E két eljárás közötti választás erősen függ az elemszámok és a szórások viszonyától. Pozitív (n i, i ) kapcsolat esetén inkább KF, negatív (n i, i ) kapcsolat esetén viszont inkább rw az ajánlott eljárás. Azonos nagyságú minták esetén a elyzet felemás: kis szóráseterogenitási szinten inkább KF, ellenkező esetben inkább rw asználata a célszerűbb. Végül megjegyezzük, ogy az SZTH tesztelése igen egyszerűen végreajtató a MiniStat programcsomag (Varga Czigler; 1999) segítségével.

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG: STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG: DR. BELYÓ PÁL, ÉLTETŐ ÖDÖN, DR. HARCSA ISTVÁN, DR. HUNYADI LÁSZLÓ (főszerkesztő), DR. HÜTTL ANTÓNIA, DR. KŐRÖSI GÁBOR,

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

IV. Változók és csoportok összehasonlítása

IV. Változók és csoportok összehasonlítása IV. Változók és csoportok összehasonlítása Tartalom Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Eloszlás-független módszerek 13. elıadás ( lecke)

Eloszlás-független módszerek 13. elıadás ( lecke) Eloszlás-független módszerek 13. elıadás (25-26. lecke) Rangszámokon alapuló korrelációs együttható A t-próbák és a VA eloszlásmentes megfelelıi 25. lecke A Spearman-féle rangkorrelációs együttható A Kendall-féle

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

A KÉTSZEMPONTOS SZTOCHASZTIKUS ÖSSZEHASONLÍTÁS MODELLJE* VARGHA ANDRÁS

A KÉTSZEMPONTOS SZTOCHASZTIKUS ÖSSZEHASONLÍTÁS MODELLJE* VARGHA ANDRÁS MÓDSZERTANI TANULMÁNYOK A KÉTSZEMPONTOS SZTOCHASZTIKUS ÖSSZEHASONLÍTÁS MODELLJE* VARGHA ANDRÁS A jelen tanulmányban a kétszempontos varianciaanalízis modelljének egy olyan általánosítását mutatjuk be,

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

statisztikai menürendszere Dr. Vargha András 2007

statisztikai menürendszere Dr. Vargha András 2007 A statisztikai menürendszere Dr. Vargha András 2007 2 tartalomjegyzék 1. Alapok (egymintás elemzések Alapstatisztikák Részletesebb statisztikák számítása Gyakorisági eloszlás, hisztogram készítése Középértékekre

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás. Statsztka próbák Paraméteres. A populácó paraméteret becsüljük, ezekkel számolunk.. Az alapsokaság eloszlására van kkötés. Nem paraméteres Nncs lyen becslés Nncs kkötés Ugyanazon problémára sokszor megvan

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis Hipotézis BIOMETRIA 5. Előad adás Hipotézisvizsg zisvizsgálatok Tudományos hipotézis Nullhipotézis feláll llítása (H ): Kétmintás s hipotézisek Munkahipotézis (H a ) Nullhipotézis (H ) > = 1 Statisztikai

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Centura Szövegértés Teszt

Centura Szövegértés Teszt Centura Szövegértés Teszt Megbízhatósági vizsgálata Tesztfejlesztők: Megbízhatósági vizsgálatot végezte: Copyright tulajdonos: Bóka Ferenc, Németh Bernadett, Selmeci Gábor Bodor Andrea Centura Kft. Dátum:

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018 Hipotézisvizsgálat az Excel adatelemző eljárásaival Dr. Nyéki Lajos 2018 Egymintás t-próba Az egymintás T-próba azt vizsgálja, hogy különbözik-e a változó M átlaga egy megadott m konstanstól. Az a feltételezés,

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Statisztikai becslés

Statisztikai becslés Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,

Részletesebben

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta Nem-paraméteres és paraméteres módszerek Kontingencia tábla, rangtranszformálás, párosított minták, két független minta Az előadások célja bemutatni a hipotézis vizsgálat elveinek alkalmazását a gyakorlatban

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Bevezetés. 1. Helyzetek (változók) egyszempontos összehasonlítása

Bevezetés. 1. Helyzetek (változók) egyszempontos összehasonlítása Vargha András Kísérleti helyzetek és csoportok összehasonlítása új statisztikai módszerekkel (A T047144 sz. OTKA-pályázat összefoglaló szakmai beszámolója) Bevezetés A jelen OTKA-pályázat keretében végzett

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Variancia-analízis (folytatás)

Variancia-analízis (folytatás) Variancia-analízis (folytatás) 7. elıadás (13-14. lecke) Egytényezıs VA blokk-képzés nélkül és blokk-képzéssel 13. lecke Egytényezıs variancia-analízis blokkképzés nélkül Az átlagok páronkénti összehasonlítása(1)

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

Vargha András Károli Gáspár Református Egyetem Budapest

Vargha András Károli Gáspár Református Egyetem Budapest Vargha András Károli Gáspár Református Egyetem Budapest Kötelező irodalom a kurzushoz Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal (2. kiadás). Pólya Kiadó,

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Statisztikai módszerek 7. gyakorlat

Statisztikai módszerek 7. gyakorlat Statisztikai módszerek 7. gyakorlat A tanult nem paraméteres próbák: PRÓBA NEVE Illeszkedés-vizsgálat Χ 2 próbával Homogenitás-vizsgálat Χ 2 próbával Normalitás-vizsgálataΧ 2 próbával MIRE SZOLGÁL? A val.-i

Részletesebben

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15. Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért 2018. november 15. PÉNZ a boldogság bitorlója? A jövedelemegyenlőtlenség természetes határa A boldog ember gondolata a

Részletesebben

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk

Részletesebben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157. Kiváltott agyi jelek informatikai feldolgozása 2018 Statisztika - Gyakorlat Kiss Gábor IB.157. kiss.gabor@tmit.bme.hu Példa I (Vonat probléma) Aladár 25 éves és mindkét nagymamája él még: Borbála és Cecília.

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

V. Gyakorisági táblázatok elemzése

V. Gyakorisági táblázatok elemzése V. Gyakorisági táblázatok elemzése Tartalom Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét változók segítségével Diszkrét változók kapcsolatvizsgálata Példák

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika Bevezetés 1. előadás, 2015. február 11. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Heti 2 óra előadás + 2 óra

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Nemparametrikus tesztek. 2014. december 3.

Nemparametrikus tesztek. 2014. december 3. Nemparametrikus tesztek 2014. december 3. Nemparametrikus módszerek Alkalmazásuk: nominális adatok (gyakoriságok) esetén, ordinális adatok esetén, metrikus adatok esetén (intervallum és arányskála), ha

Részletesebben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN (Babbie) 1. Konceptualizáció 2. Operacionalizálás 3. Mérés 4. Adatfeldolgozás 5. Elemzés 6. Felhasználás KUTATÁS LÉPÉSEI 1. Konceptualizáció 2. Operacionalizálás

Részletesebben

Mátrixjátékok tiszta nyeregponttal

Mátrixjátékok tiszta nyeregponttal 1 Mátrixjátékok tiszta nyeregponttal 1. Példa. Két játékos Aladár és Bendegúz rendelkeznek egy-egy tetraéderrel, melyek lapjaira rendre az 1, 2, 3, 4 számokat írták. Egy megadott jelre egyszerre felmutatják

Részletesebben