FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA ÚJ RANGSOROLÁSOS ELJÁRÁSOKKAL* VARGHA ANDRÁS A társadalomtudományokban gyakran találkozunk olyan nem kvantitatív változókkal, amelyek értékskálája csupán az ordinalitás kritériumának tesz eleget. Ilyen változók esetén a nagyságszintek átlag segítségével történő összeasonlítása vitatató. A jelen tanulmány alternatív megoldásként ívja fel a figyelmet a sztocasztikus összeasonlításra, amelynek kulcsfogalmai a sztocasztikus egyenlőség (SZTE) és a sztocasztikus omogenitás (SZTH). Két sokaságot akkor mondunk sztocasztikusan egyenlőnek valamely X változó tekintetében, a P(X 1 > X ) = P(X 1 < X ) teljesül, aol X 1 és X a két sokaságból egymástól függetlenül kiválasztott véletlen megfigyelés. Az SZTH az SZTE általánosítása, segítségével kettőnél több sokaság sztocasztikus ugyanakkoraságát definiáljuk. Tanulmányunkban az SZTH tesztelésével kapcsolatban 15 statisztikai próba előnyeit és átrányait vetjük össze számítógépes szimulációs elemzés segítségével. A TÁRGYSZÓ: Sztocasztikus omogenitás. Rangsorolásos csoport-összeasonlítás. társadalomtudományi kutatások egyik leggyakoribb kérdése, ogy valamely X változó értékei általában ugyanakkorák-e bizonyos csoportokban. Illusztrációul felsorolunk néány ilyen jellegű szakmai kérdést. A magyarországi felnőtt lakosságon belül az olvasásra szánt idő (mondjuk 1 étre vonatkoztatva) ugyanakkora-e különböző iskolázottsági szinteken? Függ-e az ARIEL mosópor ötfokú szimpátiaskálán mért kedveltségi szintje attól, ogy a megkérdezett személy a fővárosban, vidéki városban vagy községben lakik? Van-e különbség a 19 magyar megye között a tekintetben, ogy lakosai mennyire vannak megelégedve a kormánykoalícióval, a a megelégedettséget ismét ötfokú skálán mérjük? Ugyanolyan atékony-e valamely A, B és C terápiás eljárás a doányzás tekintetében, a a atékonyságot azzal mérjük, ogy a terápiában részt vett személy átlagosan ány cigarettát szív el naponta a terápia befejezése után 3 ónappal? Ha X kvantitatív változó, akkor az ilyen típusú kérdésekre megfelelő statisztikai válasz a H 0 : 1 = = = nullipotézis vizsgálata, aol 1,,, az X változó elméleti átlaga (várató értéke) * A tanulmány megírásáoz segítséget nyújtott a T03157 sz. OTKA-pályázat, valamint a 0194/000 sz. FKFP-pályázat. Statisztikai Szemle, 80. évfolyam, 00. 4. szám
VARGHA: FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 39 az összeasonlítandó számú csoportban (populációban, statisztikai sokaságban stb.). Ez a nullipotézis közismerten az egyszempontos varianciaanalízis (VA) módszerével tesztelető, a teljesülnek a VA alkalmazási feltételei. (Vincze; 1968. 164. old.) A társadalomtudományi kutatásokban gyakran előfordul, ogy a függő változó értékskálája csak legfeljebb az ordinalitás az értékek nagyság szerinti sorba rendezetősége kritériumnak tesz eleget. Ilyen változóoz jutunk például, a arra kérjük a vizsgált személyt, ogy ítélje meg egy ötfokú skálán, mennyire kedvel valamely politikai pártot (bizonyos terméket, ázastársát, főnökét stb.) a következő fokozatokkal: 1 = nagyon ellenszenves, = enyén ellenszenves, 3 = közömbös, 4 = enyén rokonszenves, 5 = nagyon rokonszenves. Hasonlóképpen ordinális skálájúak például az Acenbac-féle Gyermekviselkedési kérdőív (CBCL) áromfokozatú tüneti tételei (1 = soa nem fordul elő, = esetenként előfordul, 3 = gyakran előfordul) és az ezekez asonló változók. Ilyen esetekben az átlag asználatának jogossága az adatok nagyságszintjének jellemzésére vitatató. Alternatív középértékként ordinális skálájú változók esetén szóba jöet a medián is, ez esetben azonban célszerű a folytonosságot megkövetelni, mert diszkrét változóknál a mediánok egyenlősége nem feltétlenül jelenti a változók értékszintjének azonosságát, mint ezt a következő példa is mutatja: Valószínűség P(1) P() P(3) P(4) P(5) X eloszlása 0,51 0,0 0,10 0,10 0,09 Y eloszlása 0,90 0,06 0,0 0,01 0,01 Ebben a példában az X és az Y változó mediánja megegyezik (Med(X) = Med(Y) = 1), mégis, az X változó értékei általában nagyobbak, mint az Y változóé. A továbbiakban egy olyan statisztikai modellt ismertetünk, amelyben tetszőleges akár diszkrét, akár folytonos skálájú változó esetén értelmesen és gyakorlati problémák esetén jól asználató módon definiálató az ugyanakkoraság fogalma mindazon összeasonlításokban, amelyek az egy- és a többszempontos VA-ban előfordulnak. Jelen tanulmány központjában számú független minta egyszempontos összeasonlítása áll tetszőleges > mellett, a modell újszerűsége miatt azonban kitérünk a legegyszerűbb, = esetre is. Ezután definiáljuk a sztocasztikus omogenitás (SZTH) fogalmát, mely az átlagok egyenlőségének egyik alternatívája. Ezzel összefüggésben bemutatunk több statisztikai eljárást, amelyekkel az SZTH nullipotézise tetszőleges > mintaszám esetén tesztelető, majd empirikusan, számítógépes szimulációs vizsgálattal elemezzük ezen próbák érvényességét és atékonyságát. SZTOCHASZTIKUS EGYENLŐSÉG, SZTOCHASZTIKUS KÜLÖNBÖZŐSÉG Két sokaságot (jelölje őket mondjuk az egyszerűség kedvéért Pop 1 és Pop ) valamely X változó tekintetében nemcsak közvetve, valamely középérték (átlag, medián, trimmelt átlag stb.) által asonlítatunk össze, anem elemeik közvetlen összevetésével is. Például a férfiak és a nők a testmagasságuk szerint úgy is összeasonlítatók, ogy az összes leetséges módon összepárosítunk egy férfit és egy nőt, majd megatározzuk, ogy ezen
330 VARGHA ANDRÁS összeasonlítások ányad részében magasabb a férfi (P(férfi > nő)) és ányad részében a nő (P(nő > férfi)). Ha ez a két arány megegyezik, akkor azt mondjuk, ogy a férfiak és a nők a testmagasság tekintetében sztocasztikusan egyenlők vagy sztocasztikusan ugyanakkorák. P(férfi > nő) > P(nő > férfi) esetén azt mondjuk, ogy a férfiak sztocasztikusan magasabbak, ellenkező esetben pedig azt, ogy sztocasztikusan alacsonyabbak, mint a nők. Teljes általánosságban a sztocasztikus egyenlőség (röviden SZTE) definiáló feltétele, ogy a Pop 1 sokaságból véletlenszerűen kiválasztott X 1 és a Pop sokaságból ugyancsak véletlenszerűen és az előzőtől függetlenül kiválasztott X véletlen érték tekintetében fennálljon a P(X 1 > X ) = P(X 1 < X ) /1/ egyenlőség (Varga Czigler; 1999, Varga; 000a. 10. fejezet). Analóg módon definiálató az SZTE két tetszőleges eloszlás vonatkozásában is. Ha az SZTE nem áll fenn, akkor sztocasztikus egyenlőtlenségről vagy sztocasztikus különbözőségről beszélünk. A sztocasztikus különbözőség nagyságának mérésére N. Cliff (1996. 14. old.) a 1 = P(X 1 > X ) P(X 1 < X ) // együttatót, Varga A. és H. D. Delaney (1998, 000) pedig az A 1 = P(X 1 > X ) + 0,5 P(X 1 = X ) /3/ mutatót javasolta. A két mutató egyébként egymással teljesen ekvivalens, mert egymásba egyszerű lineáris transzformációval átalakítatók: A = ( + 1)/ és = A 1. /4/ Az A mutató elnevezésére Varga és Delaney (1998) a valószínűségi fölény mutatója (measure of stocastic superiority), Brunner és Munzel (000) pedig a relatív kezelési atás (relative treatment effect) elnevezést javasolja. Ez utóbbi szerzőpáros a sztocasztikusan egyenlő/kisebb/nagyobb fogalmakra a tendenciózusan egyenlő/kisebb/nagyobb (tendentiously equal/smaller/greater) elnevezéseket asználja. A és az A mutató definíciója alapján nyilvánvaló, ogy az /1/ formulával definiált SZTE ekvivalens a = 0, A = 0,5 /5/ azonosságok fennállásával. E mutatók statisztikai becslésével kapcsolatban lásd: Brunner Munzel; 000, Cliff; 1996. 136 140. old. és Varga; 1999. Az SZTE ipotézisének vizsgálatára (a sztocasztikus egyenlőtlenség ellenipotézisével szemben) számos statisztikai próba jöet számításba. a) A jól ismert rangsorolásos csoport-összeasonlító eljárással, a Mann Witney-próbával kapcsolatban már régen kimutatták, ogy az összeasonlított két eloszlás egyenlőségével szembeni bármely ellenipotézisre
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 331 vonatkozóan a próba akkor és csakis akkor konzisztens azaz ereje akkor és csakis akkor tart 1-ez az elemszámok növekedésével bármely rögzített szignifikanciaszinten, a ezen ellenipotézis fennállása maga után vonja az összeasonlított két eloszlás sztocasztikus különbözőségét (Mann Witney; 1947, illetve Noeter; 1967). A Mann Witney-próba azonban csak akkor alkalmazató érvényesen az SZTE önálló tesztelésére, a bizonyos mellékfeltételek (például az összevetendő két eloszlás alakjának azonossága) teljesülnek. b) Azzal érvelve, ogy a Mann Witney-próba nagy minták esetén ekvivalens egy rangszámokon végreajtott kétmintás t-próbával, a szórásomogenitás feltételének sérülése esetén a Mann Witney-próba robusztus alternatívájaként D. W. Zimmerman és B. D. Zumbo (199, 1993) a rangszámokon végreajtott Welc-próbát javasolta. c) Elméleti levezetések és számítógépes szimulációs elemzések azonban arra mutatnak, ogy legalább 10- elemű minták esetén az SZTE egy a Fligner és Policello, valamint Cliff nevéez fűződő eljárás (Fligner Policello; 1981, Cliff; 1996) Varga (000b) által javasolt módosításával tesztelető a legmegfelelőbben. Megjegyezzük, ogy a sztocasztikus különbözőség becslése, illetve az SZTE tesztelése igen egyszerűen végreajtató a MiniStat programcsomag (Varga Czigler; 1999) segítségével. KETTŐNÉL TÖBB SOKASÁG ÖSSZEHASONLÍTÁSA: A SZTOCHASZTIKUS HOMOGENITÁS FOGALMA Tételezzük fel, ogy egy legalább ordinális skálájú X változó segítségével akarjuk a Pop 1, Pop,, Pop sokaságokat összeasonlítani, aol > tetszőleges egész szám. Az egyszerűség kedvéért jelöljük az X változót X j -vel Pop j -ben (j = 1,, ). Ha azt kutatjuk, ogy az X változó értékei általában ugyanakkorák-e a vizsgált sokaságokban, akkor kézenfekvő ötlet, ogy megvizsgáljuk: van-e a Pop j sokaságok között olyan, amelyikben az X változó értékei általában nagyobbak vagy általában kisebbek, mint a többi sokaságban. Ha nincs ilyen felülről vagy alulról kilógó sokaság, akkor azt mondjuk, ogy a vizsgált Pop j sokaságok az X változó tekintetében s egyben az X 1, X,, X változók sztocasztikusan omogén együttest alkotnak. Ha a sztocasztikus omogenitás nem áll fenn, akkor sztocasztikus eterogenitásról beszélünk. Matematikailag pontosan a sztocasztikus omogenitás (röviden SZTH) fogalmát a következőképpen definiáljuk. Válasszunk ki először egy sokaságot (Pop j ), s atározzuk meg ennek valószínűségi fölényét a többi sokasággal szemben a /3/ definíció szerint: A ji = P(X j > X i ) + 0,5 P(X j = X i ) (i = 1,, ). /6/ Legyen továbbá A jj = 0,5, iszen bármely sokaság saját magával nyilván sztocasztikusan egyenlő. Ekkor a p 1 j A ji i1 /7/ mennyiség, a Pop j sokaság ún. sztocasztikus kezelési atása (stocastic treatment effect) azt mutatja meg, ogy ez a sokaság a többivel a sztocasztikus összeasonlítások során általában nagyobb vagy kisebb-e. p j = 0,5 esetén a Pop j -beli adatok általában se nem nagyobbak, se nem kisebbek, mint a többiek.
33 VARGHA ANDRÁS Emiatt az SZTE általánosításaként kettőnél több sokaság sztocasztikus omogenitását a p 1 = = p = 0,5 /8/ azonossággal definiáljuk. Ezek a p j atások megadatók a következőképpen is. A számú sokaság közül válasszunk ki véletlenszerűen egyet (mindegyiknek 1/ esélyt adva), majd ebből válasszunk ki véletlenszerűen egy X megfigyelést. Ezután e választástól függetlenül válasszunk ki a Pop j sokaságból is véletlenszerűen egy X j megfigyelést. Ekkor igaz, ogy p j = A(X j, X) = P(X j > X) + 0,5 P(X j = X) (j = 1,, ). /9/ Bizonyos esetekben célszerű feltételezni, ogy az X véletlen megfigyelést a Pop j sokaságok összevont együtteséből választjuk ki, melynek során természetszerűleg figyelembe kell venni a sokaságok egymásoz viszonyított arányát. Ilyen esetben célszerű az SZTH-t valamivel általánosabb formában definiálni. Eez csak a sztocasztikus kezelési atásokat kell kicsit általánosabban megatározni, a következőképpen: j wi i1 p A ji (j = 1,,, ), /10/ aol w i a Pop i sokaság súlya (aránya). Természetesen a w i súlyok összege mindig 1, és a /7/-tel definiált azonos súlyozás esetén w i = 1/. A /10/ formulából kiolvasató, ogy a a Pop j sokaságok páronként sztocasztikusan egyenlők (azaz a A ij = 0,5 minden (i, j) párra), akkor az SZTH is fennáll, mégpedig bármilyen {w j } súlyozás mellett. Ennek az állításnak a megfordítása azonban nem igaz, aminek az az oka, ogy a sztocasztikusan egyenlő és a sztocasztikusan kisebb reláció nem tranzitív. Előfordulat például olyan ún. körbeverési szituáció, amikor a Pop 1 sokaság sztocasztikusan kisebb a Pop sokaságnál, a Pop sokaság sztocasztikusan kisebb a Pop 3 sokaságnál, Pop 3 pedig sztocasztikusan nem nagyobb, anem kisebb Pop 1 -nél (lásd például Varga; 000a. 394. old.). és A vonatkozásában ez például azt jelenti, ogy 1 > 0 és 3 > 0 nem vonja maga után automatikusan 13 > 0, illetve A 1 > > 0,5 és A 3 > 0,5, az A 13 > 0,5 egyenlőtlenség fennállását. Ha azonban az X j változók mind szimmetrikus eloszlásúak, akkor az SZTE és a sztocasztikusan kisebb/nagyobb relációk tranzitivitása biztosan teljesül. Ez esetben ugyanis az SZTH ekvivalens a páronkénti SZTE-vel, sőt, az elméleti mediánok egyenlőségével, valamint a az átlag értelmes mutató az elméleti átlagok egyenlőségével is. Végül megjegyezzük, ogy = esetén az SZTE és az SZTH ekvivalens relációk, vagyis az SZTH az SZTE egyik bár nem egyetlen leetséges általánosítása. AZ SZTH TESZTELÉSE Az SZTE vizsgálatáoz asonlóan az SZTH tesztelésével kapcsolatban is számos statisztikai eljárás jöet szóba.
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 333 A Kruskal Wallis-próba Matematikailag kimutatták, ogy az összeasonlított számú eloszlás egyenlőségével szembeni bármely ellenipotézisre vonatkozóan a jól ismert Kruskal Wallis-próba akkor és csakis akkor konzisztens, a az ellenipotézis fennállása maga után vonja a vizsgált számú eloszlás sztocasztikus eterogenitását, vagyis az SZTH sérülését (Kruskal; 195, Noeter; 1967. 51 5. old.). Ezen összefüggés azonban csak az SZTH egy bizonyos súlyozása esetén érvényes, nevezetesen akkor, a a /10/ formulában a w i súlyokat a következőképpen definiáljuk: w i = n i /n. /11/ E formulában n i az i-edik független minta elemszáma, n =n i pedig az összelemszám. A Kruskal Wallis-próba teát akkor alkalmas az SZTH nullipotézisének tesztelésére, a teljesül a következő két feltétel. 1. Az eloszlások az SZTH-n kívül más tekintetben (szóródás, ferdeség, csúcsosság stb.) nem különböznek. Ez a elyzet áll fenn például abban az esetben, a az eloszlások közötti egyetlen leetséges eltérés egy esetleges szintkülönbség.. A mintaelemszámok legalább aszimptotikusan arányosak az összeasonlított sokaságok nagyságával. Ha ismert az egyes sokaságok összsokaságon belüli aránya, akkor ez a feltétel a mintaelemszámok megfelelő megválasztásával biztosítató. Ha viszont ezek az arányok nem ismeretesek, akkor az egyetlen megoldás az, ogy az összsokaságból egyetlen nagy véletlen mintát választunk ki. Ha az összelemszám elég nagy, akkor a mintaelemszámok arányai legalább közelítőleg tükrözni fogják az általuk képviselt sokaságok valódi arányát. Ha a Kruskal Wallis-próbát az alkalmazási feltételek bármilyen ellenőrzése nélkül alkalmazzuk, akkor szignifikáns esetben csak egyetlen dolgot állítatunk: azt, ogy a vizsgált X változó az összeasonlított sokaságokban nagy valószínűséggel nem ugyanolyan eloszlású. Rangszámokon végreajtott robusztus varianciaanalízisek Válasszunk ki a Pop j (j = 1,,, ) sokaságokból egymástól függetlenül rendre n j nagyságú véletlen mintákat az X változóra vonatkozóan. Rangsoroljuk a kapott adatokat a Kruskal Wallis-próbában előírt módon (Varga; 000a. 384 385. old.), s az egyes minták szerinti csoportok rangszámainak átlagát jelölje rendre R 1, R,, R. Matematikailag igazolató, ogy a vizsgált a Pop j sokaságok a /11/ formulában szereplő w j súlyokkal akkor és csakis akkor képeznek sztocasztikusan omogén együttest az X változó tekintetében, a ezen rangszámátlagok elméleti átlagai (várató értékei) megegyeznek, vagyis a az összeasonlítandó véletlen minták rangtranszformáltjainak elméleti átlagai ugyanakkorák (a bizonyítást illetően lásd Varga Delaney; 1998). Ebből arra következtetetünk, ogy az SZTH tesztelésére szóba jöet a rangszámokon végreajtott VA is, a annak alkalmazási feltételei teljesülnek. Jelen esetben az egyszempontos független mintás VA látszik megfelelőnek, melynek alkalmazási feltételei a következők (Vincze; 1968. 164. old.): a) a minták függetlensége; b) a függő változó normalitása; c) a szórásomogenitás.
334 VARGHA ANDRÁS E követelményeket a rangszámadatokra vonatkoztatva, a következőket állapítatjuk meg. 1. Tekintve, ogy az r ij (j = 1,,, i = 1,, n j) rangszámok összege n elemű összminta esetén mindig az n-től függő állandó ( ijr ij = n(n +1)/), a rangszámminták sosem függetlenek egymástól, de a rangszámok közötti (r ij, r kl) páronkénti korrelációk az n j mintaelemszámok növekedésével 0-oz tartanak.. A rangszámváltozók eloszlása sosem normális, de a VA képleteiben szereplő négyzetes összeg statisztikák bizonyos feltételek esetén aszimptotikusan normális eloszlásúak (Kruskal; 195, Brunner Puri; 001). 3. A rangszámok megőrzik a nagyságrendi viszonyokat, így a nagyobb szóródású minták rangszámai is általában nagyobb szóródásúak lesznek. Ha teát a szórásomogenitás az eredeti adatokra teljesül, akkor ez a feltétel többnyire a rangszámok esetén sem sérül számottevően. Ha viszont a szórásomogenitás feltétele már az eredeti adatokra sem teljesül, akkor ez általában a rangszámokra is átöröklődik. Mindezek alapján az SZTH nullipotézisének vizsgálatára (a sztocasztikus eterogenitás ellenipotézisével szemben) közelítő érvényességgel javasolatók a következő rangsorolásos eljárások: a szórásomogenitás feltételének teljesülése esetén a agyományos egyszempontos VA végreajtása a rangszámokon (rang VA, röviden rva), mely egyébként aszimptotikusan ekvivalens a Kruskal Wallispróbával (Conover Iman; 1981); a szórásomogenitás teljesülésétől függetlenül bármely robusztus VA végreajtása a rangszámokon (robusztus rang VA-k); a robusztus VA-k közül legismertebb a Brown Forsyte-, a Welc- és a James-féle módszer (Brown Forsyte; 1974, Welc; 1951, James; 1951). Hangsúlyoznunk kell, ogy ezek az eljárások eurisztikus alapelven nyugvó közelítő módszerek, amelyek érvényességének körülményeit még empirikusan igazolni kell. Aszimptotikusan egzakt rangsorolásos eljárások A nemparaméteres összeasonlításokban nagy jelentőségűek az 1990-es évek közepétől megjelenő és leginkább M. G. Akritas, S. F. Arnold, E. Brunner és M. L. Puri nevével fémjelzett tanulmányok. Ezek pontosították a nemparaméteres összeasonlítások egzakt statisztikai nullipotéziseit és felvázoltak egy olyan matematikai statisztikai modellt, amelyben az ilyen jellegű nullipotézisek aszimptotikusan azaz elegendően nagy minták választása esetén érvényesen teszteletők (Akritas Arnold; 1994, Akritas Arnold Brunner; 1997, Brunner Munzel; 000, Brunner Puri; 001). Az előbbiekben kifejtett SZTH nullipotézisének vizsgálatára ebben a matematikai modellben E. Brunner egyik tanítványa, B. Kulle (1999) dolgozott ki doktori disszertációjában aszimptotikusan érvényes eljárásokat. (Ezek közül a kis mintákra jobb közelítést biztosító VA-típusú módszert a Függelékben részletesen ismertetjük.) SZÁMÍTÓGÉPES SZIMULÁCIÓS ELEMZÉS AZ SZTH STATISZTIKAI PRÓBÁIVAL Az előzőkben több statisztikai próbát tekintettünk át, amelyek szóba jöetnek az SZTH nullipotézisének vizsgálatára. Kérdés, ogy melyiket célszerű leginkább alkalmazni, a valamely empirikus vizsgálatban 3-5 nem túl nagy független mintát szeretnénk egy ordinális skálájú változó nagyságszintje tekintetében összeasonlítani. A választás
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 335 nem könnyű, mert kis minták esetén az áttekintett próbák egyikének érvényességét sem leet biztosítani, acsak nem kötünk ki olyan szigorú mellékfeltételeket (például a normalitást vagy azt, ogy az összeasonlítandó eloszlások legfeljebb egy eltolási állandóban különbözetnek egymástól), amelyek kis minták esetén megbízatóan nem ellenőrizetők, és a gyakorlatban legtöbbször nem is teljesülnek (Micceri; 1989). Viszonylag kis legfeljebb 30 elemű minták pedig gyakran előfordulnak olyan pszicológiai, biológiai, orvosi, pedagógiai stb. kutatásokban, amelyeknél a megfigyelések költségigénye relatíve magas. Ilyen esetben csak empirikus úton vetetjük össze a szóba jöető statisztikai eljárások előnyeit és átrányait. A matematikai statisztika legfőbb empirikus vizsgáló eszköze a számítógépes szimuláció. Ennek lényege az, ogy a függő változó eloszlására, a szignifikanciaszintre és az elemszámokra vonatkozó rögzített feltételek mellett számítógépes programmal véletlenszerű mintákat alkotunk igen nagy számban (I). Ezeken a mintákon végreajtjuk az elemzésbe bevont statisztikai próbát, döntést ozva előre rögzített szignifikanciaszinten a vizsgált nullipotézis elutasításáról, illetve megtartásáról. Végül megatározzuk, ogy az I számú független mintavétel ányad részében utasítottuk el a próba nullipotézisét. Ha az eloszlást (többmintás összeasonlítások esetén eloszlásokat) úgy állítjuk be, ogy a nullipotézis teljesüljön, akkor a kapott elutasítási arány a próba elsőfajú ibáját (), ellenkező esetben pedig a próba erejét (1 ) becsüli. Ily módon a számítógépes szimulációval leetővé válik a különféle statisztikai próbák érvényességének és atékonyságának összeasonlító elemzése. A szimulációban szisztematikusan változtatott tényezők 1. A minták száma. Jelen szimulációs vizsgálat elsődleges célja olyan általános érvényű összefüggések feltárása volt az SZTH vizsgálatára szóba jöető különböző statisztikai próbákkal (lásd a 7. pontot) kapcsolatban, amelyek a gyakorlatban előforduló tipikus mintaszámértékek ( = 3, 4, 5, ) mindegyikénél fellépnek. Ez okból a szimulációk nagy részét a = 3 mintaszámmal végeztem, majd az egyes következtetések megerősítésére a megfelelő szimulációs elemzést a = 4, = 5 mintaszámokkal is végreajtottam.. A mintaelemszámok. A szimulációs elemzésekben viszonylag kicsi, 10 és 30 közötti mintaelemszámokat választottam, mert a különféle közelítő eljárások érvényessége többnyire 30 alatti elemszámok esetén a legkritikusabb. Az elemzésekben szerepeltek azonos mintalemszámok (10-10-10, 0-0-0, 30-30-30), valamint növekvő (10-15-0, 10-0-30) és csökkenő (0-15-10, 30-0-10) elrendezések. Ez leetővé tette az elemszámok és szórások különböző viszonyainak (például monoton növekvő és monoton fogyó) vizsgálatát is. 3. A szóráseterogenitás mértéke. Az elméleti szórások különbözőségének alapvetően 3 szintjét vizsgáltam: azonos szórások ( 1 = = 3), közepes mértékű szóráskülönbség, nagymértékű szóráskülönbség. E cél megvalósításáoz olyan 1 : : 3 elméleti szórásarányokat választottam, ogy a 1,, 3 szórásértékek Ve variációs együttatója (lásd Varga; 000a. 69 70. old.) azaz
336 VARGHA ANDRÁS relatív szórása rendre 0, 0,0, illetve 0,40 legyen. 1 Egyes speciális elrendezésekben szélsőségesen nagy, Ve = 0,60 szóráseterogenitást is alkalmaztam. A Ve variációs együttató teát itt a szórások szóródását méri. J. J. Clinc és H. J. Keselman (198) tanácsát követve ezen szóráseterogenitási szinteket rendre az alábbi i értékekkel értem el: Ve 1 3 3/ 1 0 1 1 1 1 0,0 0,755 1 1,45 1,65 0,40 0,510 1 1,490,9 0,60 0,65 1 1,735 6,55 4. A függő változók eloszlása. A szimulációban az X 1, X, X 3 változók eloszlását külön-külön állítottam be, s itt most csak a folytonos esetre szorítkoztam. A folytonos eloszlások közül az elemzésekben árom szimmetrikus és két ferde eloszlástípust vontam be. A szimmetrikusak képviseletében szerepelt a normális, a normálisnál lényegesen kisebb csúcsosságú egyenletes, valamint a normálisnál atározottan nagyobb csúcsosságú f = 5 szabadságfokú t-eloszlás, t(5). A ferde eloszlásokat egy mérsékelten aszimmetrikus és a normálisnál kismértékben csúcsosabb lambda eloszlás (a lambda eloszláscsaláddal kapcsolatban lásd Ramberg Tadikamalla Dudewicz Mykytka; 1979), valamint az erősen aszimmetrikus és szélsőségesen csúcsos f = szabadságfokú -eloszlás képviselte. Mindezen eloszlások ferdeségi és csúcsossági együttatóját az 1. táblában foglaltuk össze. A szimulációba bevont folytonos eloszlások ferdeségi és csúcsossági együttatói Eloszlástípus Ferdeségi együttató E((X ) 3 )/ 3 Csúcsossági együttató E((X ) 4 )/ 4 Folytonos egyenletes 0 1,8 Normális 0 3 t(5) 0 9 Lambda 0,9 4, () 9 1. tábla A szimuláció során először minden eloszlást standardizált (0 átlagú és 1 szórású) alakban állítottam elő, majd ezeket a 3. pontban részletezett szórásokkal beszorozva kaptam meg a kívánt szórású változóalakokat. Az öt eloszlástípust = 3 esetén az alábbi kombinációkban alkalmaztam. a) normális: nnn; b) folytonos szimmetrikus: az egyenletes (e), a normális (n) és a t(5)-eloszlás (t) következő kombinációi: eee, ttt, eet, enn, ent, nne, nnt, tne, tnn, tte; c) folytonos aszimmetrikus: lambda-lambda-lambda és ()- ()- (). 1 Ve ( ) / N /. i A diszkrét változókkal kapcsolatos elemzésekkel külön tanulmányban foglalkozom.
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 337 5. Az SZTH versus sztocasztikus eterogenitás. Szimmetrikus eloszlások esetén az SZTH ekvivalens az elméleti átlagok egyenlőségével. Ezért ebben az esetben az SZTH fennállását azonos (mellesleg 0-val egyenlő) elméleti átlagok beállításával értem el minden szóráskombinációban. Azonos ferde eloszlások esetén viszont az SZTH csak akkor teljesül, a az összeasonlított eloszlások átlaga és szórása egyaránt azonos. Ezért ez esetben azonos átlagok és Ve > 0 esetén az SZTH bizonyosan sérül. Emiatt az SZTH fennállását különböző szórású ferde eloszlások esetén (azonos súlyok alkalmazásával) alkalmas eltolási állandók felasználásával értem el, amelyeket egy iterációs algoritmusú számítógépes programmal empirikusan atároztam meg. Ve Az SZTH fennállását azonos súlyokkal biztosító eltolási állandók az 1. táblában szereplő lambda és eloszlás esetén különböző szóráseterogenitási szinteken Lambda eloszlás () eloszlás 1. minta. minta 3. minta 1. minta. minta 3. minta 0,0 0,110 0,0575 0 0,0 0,110 0 0,40 0,115 0,1105 0 0,4030 0,067 0 0,60 0,880 0,1500 0 0,5450 0,880 0. tábla A szimulációban a szignifikáns eredmények aránya az SZTH-t beállítva a próba elsőfajú ibájára ad pontbecslést, míg sztocasztikus eterogenitást beállítva a próba erejéről kapunk tájékoztatást. A sztocasztikus eterogenitást úgy értem el, ogy az SZTH-t biztosító X 1, X, X 3 változóármasban az első változóból kivontam 0,40-ot, a armadikoz pedig ozzáadtam ugyanennyit. Különböző elemszámok esetén megvizsgáltam az ellenkező előjelű 1 = 0,40, = 0, 3 = 0,40 beállítás atását is. Ezen esetekben azonos szórások (azaz Ve = 0) esetén az 1. és a 3. minta elméleti eloszlása közötti különbség szokásos Coen-féle atásmértéke éppen 0,8, amely a Coen-féle konvenció szerint igen jelentősnek tekintető (Coen; 1977. 0. old.). Az SZTH szempontjából különösen érdekes ferde eloszlások esetén megvizsgáltam a = 0,5 esetet is, mely J. Coen szerint a közepes szintű eltérés mértéke, s amelyet az X 1 0,40, X 3 + 0,1 eltolásokkal értem el. 6. Szignifikanciaszint. A szimulációs elemzéseket a gyakorlatban legtöbbször előforduló = 0,01, = 0,05, = 0,10 szintek mindegyikére elvégeztem. 7. Statisztikai próbák. A szimulációs elemzésekbe a következő próbákat vontam be. i) Egyszempontos független mintás VA. Ennek érvényessége elméletileg csak az nnn eloszláskombinációra garantált 1 = = 3, azaz Ve = 0 esetén. Más szimmetrikus eloszláskombinációra Ve = 0 esetén a VA legfeljebb csak közelítő pontosságú. Ferde eloszlások esetén az SZTH fennállását csak az biztosítja, a az X 1, X, X 3 változók azonos eloszlástípusba tartoznak, és Ve = 0, így a VA is csak ez esetben jöet szóba az SZTH tesztelésére. ii) Egyszempontos független mintás robusztus VA-k: Brown Forsyte-próba (BF), Welc-próba (W), James-próba (J). E próbák érvényessége a normalitás esetén és nagy mintákra garantált. Más szimmetrikus eloszláskombinációk esetén csak legfeljebb közelítő pontosságra számítatunk. Azonos ferde eloszlások esetén az SZTH tesztelése e próbák kapcsán is csak a Ve = 0 feltétel teljesülése esetén jöet szóba. (Végreajtásuk tec
338 VARGHA ANDRÁS nikai részleteire terjedelmi okokból nem térünk ki. A részleteket lásd a BF-fel kapcsolatban: Brown Forsyte; 1974, Dixon; 1990. 547. old. vagy Varga; 1981. 94 95. old., a W-vel kapcsolatban: Welc; 1951 vagy Wilcox; 1996. 183 184. old., a J-vel kapcsolatban: James; 1951 vagy Wilcox; 1996. 18 183. old.). Ezeket a robusztus próbákat a agyományos VA alternatíváiként normális eloszlású változókra dolgozták ki az elméleti átlagok egyenlőségének tesztelésére a szórásomogenitás feltételének sérülése esetén. Emiatt normális eloszlású változók esetén segítségükkel az átlagok egyenlőségével ez esetben ekvivalens SZTH is tesztelető. Más szimmetrikus eloszláskombinációkra e próbák legfeljebb csak közelítő pontosságúak. Ferde eloszlások esetén az SZTH fennállását csak az garantálja, a az X 1, X, X 3 változók azonos eloszlástípusba tartoznak, és Ve = 0, így csak ez esetben jöetnek szóba az SZTH tesztelésére. iii) Kruskal Wallis-próba (KW). Végreajtásának lépéseit illetően lásd Kruskal Wallis (195) vagy Varga (000a. 384 386. old.). iv) Rangszámokon végreajtott egyszempontos független mintás VA (rang VA). A rang VA (röviden rva) végreajtásának módja: rangszámok képzése ugyanúgy, mint KW-ben, a rangszámokon egyszempontos független mintás VA végreajtása. v) Rangszámokon végreajtott robusztus egyszempontos független mintás VA-k (rbf, rw, rj). E próbák végreajtásának módja: rangszámok képzése ugyanúgy, mint KW-ben, a rangszámokon végreajtjuk BF-et, W-t, illetve J-t. vi) Kulle-féle próbák. Mintaelemszámmal súlyozott sokaságok/eloszlások esetén az SZTH tesztelése a K s = fˆ F K /1/ próbastatisztika segítségével ajtandó végre (lásd /F4/ és /F5/ formula), mely az SZTH fennállása esetén aszimptotikusan fˆ szabadságfokú eloszlást követ. Ezt a próbát a továbbiakban KKF-fel rövidítjük. Azonos súlyok esetén az SZTH tesztelése a K = ĝ G K /13/ próbastatisztika segítségével ajtandó végre (lásd /F19/ és /F0/ formula), mely az SZTH fennállása esetén aszimptotikusan ĝ szabadságfokú eloszlást követ. Megjegyzendő, ogy azonos mintaelemszámok esetén a két próbastatisztika, valamint a két szabadságfok megegyezik, így a két eljárás ekvivalens. Ezt a próbát a továbbiakban KKG-vel rövidítjük. A normális eloszlású változókkal végzett szimulációs vizsgálatban B. Kulle (1999. 70. old.) arra az eredményre jutott, ogy előbbi próbái 30-nál kisebb átlagos mintaelemszám esetén liberálisak (azaz elsőfajú ibájuk többnyire számottevően magasabb, mint a szignifikanciaszint). Ez a jelenség gyakori az aszimptotikusan normális eloszlású próba
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 339 statisztikák esetén, amelyek kis minták mellett pontosabban közelítetők egy alkalmas szabadságfokú t-eloszlással (Brunner Munzel; 000, Varga; 000b, Varga Delaney; 000). Emiatt a Kulle által javasolt próbák mellett a következő módosított változatokat is bevontam a szimulációs elemzésekbe. a) K s elyett az /F4/ formulával definiált F K próbastatisztikát vettem, s ezt az F- táblázat szerint értékeltem ki az f 1 = ˆf, f = f w szabadságfokokkal, aol fˆ -ot az /F5/, f w - t pedig az alábbi formula segítségével atároztam meg: ˆ j itt c j = n j /, aol 1 3 (1 / ) 1 1 1 c j U f w ; /14/ j n j ˆ j az /F11/ képlet segítségével definiált mennyiség és U = c j. E próbát a továbbiakban KF1-gyel jelöljük. Ezen eljárás a következő megfontoláson alapul. Kulle (1999. 36 37. old.) matematikai levezetéssel igazolta, ogy /1/ próbastatisztikájú próbája = esetén az SZTE tesztelésére Brunner, Puri és Sun (1995) által javasolt próbára redukálódik, mely egyébként ugyanaz, mint Brunner és Munzel (000) nagy mintákra érvényes eljárása. Ez utóbbiak szimulációs vizsgálattal kimutatták, ogy ennek a kétmintás próbának az érvényessége kis és közepes minták (n j < 50) esetén számottevően javítató, a próbastatisztikáját nem a standard normális, anem a t-eloszlás táblázatával értékeljük ki. Az alkalmazandó szabadságfokot a kétmintás Welc-próba szabadságfokára vonatkozó képlettel atározták meg oly módon, ogy az eredeti adatokból számított mintavarianciák elyett az /F3/ formulával definiált Z j változók /F11/ formulában szereplő ˆ j varianciabecsléseit vették (Brunner Munzel; 000. (5.9) formula). Ennek ana- lógiájára a /14/ formula a Welc-féle VA próbastatisztikájának f szabadságfokát definiáló képlet azzal az eltéréssel, ogy benne az eredeti adatok mintavarianciái elyett szintén a varianciabecslések szerepelnek. ˆ j ˆ~ j b) Hasonló megfontolások alapján a /13/-ban szereplő K statisztika elyett az /F19/ formulával definiált G K próbastatisztikát vettem, s ezt az F-táblázat szerint értékeltem ki az f 1 = ĝ, f = g w szabadságfokokkal; ĝ -ot az /F0/, g w -t pedig a /14/ formula segítségével atároztam meg a c j = n j / beelyettesítéssel, aol ˆ~ j az /F6/ képlete segítségével definiált mennyiség és U = c j. E próbát a továbbiakban KG1-gyel jelöljük. Néány próbaszimulációt elvégezve úgy tűnt, ogy F K és G K esetenként a névlegesnél kissé alacsonyabb elsőfajú ibákat eredményez, ezért a szimulációban kipróbáltam két olyan változatot is, amelyben az f w, illetve a g w szabadságfokot megnöveltem, a következőképpen: f w = min(f w, n ) és g w = min(g w, n ). /15/ Ezen újabb szabadságfok-változatok értéke teát általában a korábbiak kétszerese, de felülről limitáljuk őket a agyományos VA F próbastatisztikájának f = n szabadságfokával. Az így kapott próbaváltozatokat a továbbiakban KF-vel, illetve KG-vel jelöljük.
340 VARGHA ANDRÁS A szimulációs elemzés néány tecnikai részlete A szimulációs elemzések programját Turbo Pascal 7.0 programozási nyelven írtam, és a futtatásokat Pentium PC-n végeztem el. E programmal az előbb leírt elemszám-, variancia- és eloszláselrendezések mindegyikében véletlen megfigyeléseket iktattam be, egy-egy elrendezésben 10 000 egymástól független mintavétellel. Ez az ismétlési szám az elsőfajú iba, illetve a próba erejének legalább 0,0050 pontosságú becslését tette leetővé (a becslés standard ibája egészen pontosan 10 százalékos valódi elsőfajú iba mellett 0,0030, 5 százalékos elsőfajú iba mellett 0,00, 1 százalékos elsőfajú iba mellett pedig 0,0010). Minden mintavétel esetén kiszámítottam az előbbiekben részletezett 15 statisztikai próba mindegyikét, és megnéztem, ogy szignifikánsak-e 1, 5, illetve 10 százalékos szinten, majd megatároztam a szignifikáns eredmények arányát a 10 000 mintavételben mindárom valószínűségi szintre vonatkozóan. Ezek olyan eloszláselrendezésekben, amelyekben az SZTH fennáll, a vizsgált próbák elsőfajú ibáját, egyébként az erejét becsülik. Az egyenletes eloszlású pszeudovéletlen megfigyeléseket a Turbo Pascalba beépített Random függvénnyel oztam létre. Ez lineáris kongruens véletlen szám generátor, mely egy közelmúltban megjelent tanulmány szerint több vonatkozásban a legjobb eljárások egyikének tekintető (Ongena, 1993). A normális, a t- és a ki-négyzet-eloszlást a W. H. Press, B. P. Flannery, S. A. Teukolsky és W. T. Vetterling (1989) könyvében, a szóban forgó lambda eloszlást pedig a J. S. Ramberg, P. R. Tadikamalla, E. J. Dudewicz és E. F. Mykytka (1979) tanulmányában leírt módon oztam létre az említett módszerrel kapott egyenletes eloszlású pszeudovéletlen számok segítségével. A lambda eloszlásokkal részletesebben Varga A. (1996) írása foglalkozik. A szimulációs elemzések eredményei 1. Normális eloszlás azonos elméleti szórásokkal: a szimulációs eljárás itelessége. Az elemzések csak akkor leetnek itelesek, a a kapott eredmények nem mondanak ellent elméleti ismereteinknek. Esetünkben ez többek között azt jelenti, ogy a VA feltételeinek (normális eloszlás és szórásomogenitás) teljesülése esetén a kapott elsőfajú ibabecslések nem különbözetnek számottevően a szignifikancaszinttől. E feltételek mellett az elsőfajú ibabecslések a árom szinten a következő tartományokba estek: = 0,01: 0,0079 0,011; = 0,05: 0,047 0,054; = 0,10: 0,098 0,105. Ezen értékek közül csak az 1 százalékos szinten kapott 0,0079-es minimális érték különbözik szignifikánsan a névleges 0,01-os értéktől (nagy mintás binomiális próbával z = =,10, p < 0,05). A itelesség ellenőrzésére a szóban forgó elrendezéssel újabb szimulációs elemzést végeztem, de 10 000 elyett 100 000 véletlen mintavétellel. Az ekkor kapott 0,0096-es ibabecslés már nem tért el szignifikánsan az = 0,01-os névleges szinttől. Normális eloszlás és 1 = = 3 esetén a VA mellett a KKF és a KKG kivételével teljesen elfogadató elsőfajú ibabecsléseket kaptunk az összes próbára 5 és 10 százalé
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 341 kos szignifikanciaszinten; az elsőfajú ibabecslések = 0,05 esetén 0,045 és 0,057, = = 0,10 esetén pedig 0,09 és 0,11 közé estek. 1 százalékos szinten a becslések szóródása nagyobb volt (értéktartomány: 0,0071 0,0170). A KKF és a KKG Kulle eredményeivel összangban végig érezetően liberális, vagyis a névlegesnél magasabb elsőfajú ibákat adott (a kapott elsőfajú ibabecslések tartománya a árom szinten rendre 0,014 0,03, 0,05 0,068, illetve 0,099 0,117). Emiatt a továbbiakban eltekintünk a KKF-re és a KKG-re vonatkozó eredmények ismertetésétől.. Folytonos szimmetrikus eloszlások azonos mintaelemszámokkal. Ha a normalitástól eltekintünk, akkor már nem feltétlenül igaz az, ogy a szimulációba bevont eljárások minden esetben érvényes eljárások lesznek. Ez indokolja leginkább a szimulációs elemzéseket, amelyek segítségével empirikusan győződetünk meg az egyes eljárások érvényességi feltételeiről. Az érvényesség fennállása erősen függ a szóráseterogenitás mértékéről, ezért az eredményeket e szempont szerint bontva ismertetjük. a) Azonos elméleti szórások (Ve = 0). A megvizsgált 11 eloszláskombináció (eee, enn, ent stb.) és a árom azonos elemszám-kombináció (10-10-10, 0-0-0, 30-30-30), vagyis összesen 33 elrendezés esetén nyert minimális és maximális elsőfajú ibabecsléseket 5 százalékos névleges szint mellett a 3. tábla tartalmazza árom szóráseterogenitási szintre vonatkozóan (Ve = 0, Ve = 0,, Ve = 0,4). 33 elrendezés esetén nyert minimális és maximális elsőfajú ibabecslések = 0,05 névleges szint mellett árom szóráseterogenitási szinten azonos mintaelemszámok esetén 3. tábla Próba Ve = 0 Ve = 0, Ve = 0,4 minimum maximum minimum maximum minimum maximum VA 0,045 0,057 0,045 0,058 0,055 0,071** BF 0,043 0,057 0,045 0,057 0,049 0,064* W 0,043 0,057 0,043 0,054 0,044 0,059 J 0,040 0,057 0,038 0,053 0,038 0,053 KW 0,041 0,056 0,043 0,060* 0,053 0,070** RF 0,046 0,057 0,046 0,06* 0,056 0,073** RBF 0,045 0,057 0,046 0,061* 0,055 0,070** RW 0,048 0,058 0,047 0,061* 0,054 0,07** RJ 0,047 0,058 0,047 0,060* 0,053 0,069** KF1=KG1 0,039 0,054 0,041 0,05 0,043 0,051 KF=KG 0,044 0,056 0,044 0,055 0,047 0,059 * Szignifikánsan nagyobb 0,055-nél. ** Szignifikánsan nagyobb 0,060-nél. Megjegyzés. KF1 és KG1, illetve KF és KG itt most az azonos elemszámok miatt egyezik meg. A 3. táblából kiolvasatjuk, ogy a kapott elsőfajú ibabecslések tartománya Ve = 0 és = 0,05 esetén 0,039 0,058, aol a felső atár nem nagyobb szignifikánsan a névleges szint 110 százalékánál (azaz 0,055-nél), mely a szokásosan elfogadott Bradley-féle konvenció szerint a robusztusság szigorú kritériumának tekintető (Bradley; 1978). Ugyanez a tartomány = 0,1 esetén 0,091 0,11, s a felső atár itt sem nagyobb szignifikánsan a névleges szint 110 százalékánál. Mindez azt jelenti, ogy folytonos és szim
34 VARGHA ANDRÁS metrikus eloszlások körében Ve = 0 esetén a 3. táblában feltüntetett próbák egyikének sem sérül számottevően az érvényessége a szokásos 5 százalékos szignifikanciaszinten, a azonos mintaelemszámokkal dolgozunk. = 0,01 esetén azonban W és a rangsorolásos eljárások többsége számos elrendezésben érezetően liberális, a névleges szintet néa 50-60 százalékosan megaladó elsőfajú ibát adva. Emiatt a továbbiakban csak az = 0,05, = 0,1 szintekez tartozó eredményeket részletezzük. Az egyazon nullipotézist tesztelő és nagyjából asonló érvényeségű próbák közül nyilván azt érdemes a gyakorlatban asználni, amelyiknek ereje a legnagyobb. Az erőelemzés esetünkben a következő eredményekre vezetett. 5 és 10 százalékos szignifikanciaszinten a paraméteres próbák (VA, BF, W és J) közül legnagyobb erejű többnyire a VA, de a többi próba ereje sem számottevően kisebb, az erőkülönbség sosem nagyobb 0,0-nál. A rangsorolásos próbák (KW, rva, rbf, rw, rj, KF1 és KF) közül a legerősebb többnyire az rw és a KF, de a KF1 kivételével a többi ereje sem számottevően kisebb. Értető okokból a KF1 ereje általában 0,0-0,03-dal kisebb, mint a KF-é, illetve a többi rangsorolásos próbáé. Ez okból a paraméteres és a rangsorolásos próbák ereje közötti összevetésez elegendő a VA és a KF erejének összeasonlítása. Ez az elemzés a következő összefüggésekre világított rá. i) A ttt eloszláskombináció esetén a KF minden szignifikanciaszinten számottevően erősebb, mint a VA (az 5 százalékos szinttel kapcsolatban lásd az 1. ábra a) grafikonját). Annak ellenőrzésére, ogy ez a jelenség áromnál több minta összeasonlítása esetén is fennáll-e, azonos n = 15 elemszámmal szimulációt végeztem a = 3, 4, 5 mintaszámokkal. A kapott eredmények megerősítették a feltételezést. A KF és a VA ereje közötti különbség 1 = (0,40 + 0,05( 3)), i = 0 (1 < i < ), = 0,40 + 0,05( 3) mellett a árom elemszámszinten rendre 0,06, 0,06, illetve 0,05 volt, KF javára. ii) nnt és tnn esetén VA és KF ereje asonló nagyságrendű, az eltérés sosem nagyobb, mint 0,0. iii) Az összes többi kombinációban (amelyekben az egyenletes eloszlás e legalább egyszer szerepel) a VA számottevően erősebb, mint a KF. Illusztrációként az enn kombinációra vonatkozó összeasonlítás az 1. ábra b) grafikonján látató. Az 1. pontban említettel azonos elemzés megerősítette, ogy ez az összefüggés = 4 és = 5 esetén is fennáll: enn esetében a KF és a VA ereje közötti különbség a árom elemszámszinten rendre 0,04, 0,06, illetve 0,05 volt, VA javára. 1. ábra. Erőbecslések két eloszláskombinációra = 0,05 szinten a) ttt eloszláskombináció b) enn eloszláskombináció 1 0,8 Erőbecslés 0,8 0,6 0,4 KF VA Erőbecslés 0,7 0,6 0,5 0,4 0,3 VA KF 0, n = 10 n = 0 n = 30 Közös mintaelemszám 0, n = 10 n = 0 n = 30 Közös mintaelemszám b) Mérsékelten különböző szórások (Ve = 0,). Közepes mértékű szóráseterogenitás esetén (ekkor max / min = 1,65) az erőre vonatkozó eredmények a következőképpen alakultak. A paraméteres próbák közül a W tűnik a legjobbnak, amelynek ereje több esetben
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 343 (főleg nagyobb minták esetén) megaladja a VA erejét. Hasonló szerepváltás figyelető meg az rw és a KF között, bár ez részben abból is fakad, ogy az rw elsőfajú ibaszintje a szóráseterogenitás miatt enyén megemelkedett. (Lásd a 3. táblát.) A paraméteres rangsorolásos összevetésben most a következő összefüggések tűntek ki. i) A ttt eloszláskombinációban ismét a rangsorolásos próbák szerepeltek a legjobban. Például = 0,05 esetén a KF és a W ereje közötti különbség a árom elemszámszinten rendre 0,03, 0,04, illetve 0,05, míg ugyanez a különbség az rw és a W között mindárom elemszámszinten 0,07 lett. ii) A többi olyan eloszláskombinációban, aol t volt a 3. elyen, vagyis a legnagyobb szórással párosítva (nnt, ent, eet), a paraméteres és a rangsorolásos próbák erejének nagysága asonló volt, a rangsorolásos próbák esetenkénti enye fölényével. iii) Azokban az eloszláskombinációkban, aol e volt a legnagyobb szórással párosítva (nne, tne, tte, eee), a paraméteres próbák egyértelmű fölényben voltak a rangsorolásos próbákkal szemben. Például a tte kombinációban = 0,05 szinten az erőkülönbség a árom eloszlásszinten a W rw viszonylatban rendre 0,0, 0,07 és 0,08, a W KF összevetésben pedig rendre 0,05, 0,1 és 0,13 volt. c) Erősen különböző szórások (Ve = 0,4). A 3. tábla utolsó oszlopából kiolvasató, ogy nagymértékű szóráseterogenitás esetén (ekkor max / min =,9) érvényesként az SZTH tesztelésére csak W, J, KF1 és KF jöet szóba. Mivel a két paraméteres próba (W és J) közül mindig W, a két Kulle-féle eljárás közül pedig mindig KF az erősebb, ezért az SZTH tesztelésére legalkalmasabb próba kiválasztásáoz ez esetben a W és a KF erejét kell összevetni. Ez az összeasonlítás a következő eredményre vezetett. i) A ttt eloszláskombinációban W és KF ereje azonos nagyságú. Például 5 százalékos szignifikanciaszinten W becsült ereje a árom elemszámszinten rendre 0,35, 0,64 és 0,8, míg KF-é 0,33, 0,63, illetve 0,8 volt. ii) Mérsékelt W erőfölény figyelető meg azokban az eloszláskombinációkban, aol a legnagyobb szórás magas csúcsossággal jár együtt (nnt, ent, eet stb.). iii) Igen nagy W erőfölény figyelető meg az összes többi eloszláskombinációban (nnn, tte, eee stb.). Például tne kombinációban 5 százalékosos szignifikanciaszinten W becsült ereje a árom elemszámszinten rendre 0,9, 0,59 és 0,79, míg a KF-é 0,19, 0,35, illetve 0,51. Érdekes, ogy ebben az esetben még a megemelkedett elsőfajú ibájú rw is észleletően gyengébb W-nél (rw becsült ereje a árom elemszámszinten rendre 0,7, 0,49, illetve 0,67). Az rw minden elyzetben tapasztalató erőfölénye KF-vel szemben magas szóráseterogenitás esetén azt az ötletet adta, ogy talán leet rw-t konzervatív irányban módosítani (vagyis a névleges szintet többnyire megaladó elsőfajú ibáját mérsékelni) úgy, ogy KF-vel szembeni erőfölénye megmaradjon. Ez okból egyes szimulációs elemzésekben az rw eljárás f szabadságfokát a következőképpen módosítottam: f uj = f (1,1 Ve(s)), /16/ aol Ve(s) az összeasonlított független minták tapasztalati szórásainak variációs együttatója. Emellett f uj értéktartományát felülről f -vel, alulról pedig 0,5f -vel korlátoztam. Minél nagyobb a vizsgált eloszlások szórásai közötti különbség, annál nagyobb általában Ve(s), s annál kisebb az f uj szabadságfok f -öz viszonyítva. rw ezen módosítását a továbbiakban rw-vel jelöljük. Az rw alkalmasságának ellenőrzésére a következő elemzést végeztem. I = 10 000 véletlen mintavétellel az összes szimmetrikus eloszlásra vonatkozó szimulációs elrende
344 VARGHA ANDRÁS zésből (ezek száma 09 volt) kikerestem azt a 5-öt, amelyre W elsőfajú ibabecslése = 0,05 szinten a legnagyobb volt. E becslésértékek 0,064 és 0,07 közé estek. Ezzel a 5 elrendezéssel újabb szimulációt végeztem rw-re és rw-re vonatkozóan, és a következő eredményt kaptam. rw ezen szimulációkban is erősen liberálisnak mutatkozott = 0,05 szinten 0,060 és 0,073 közé eső elsőfajú ibákkal. Ugyanakkor rw elsőfajú ibabecslése a 5-ből csak mindössze két esetben aladta meg a 0,060-et (egy esetben 0,065, egy másikban pedig 0,06 volt). E maradék két esetben újabb, de jóval nagyobb ismétlési számú (I = 100 000) szimulációval becsültem meg rw elsőfajú ibáját, amely most 0,06-nek, illetve 0,059-nek adódott. Mindez azt mutatja, ogy az rw eljárás f szabadságfokának javasolt módosítása elfogadató mértékűre csökkenti az inflációs torzítást. Ugyanakkor rw-vel is lefuttatva a ttt eloszláskombinációban a többi próbával már elvégzett szimulációkat, kiinduló feltételezésemet megerősítő eredményeket kaptam. Ezekben az elrendezésekben ugyanis rw atározottabban nagyobb erejű volt KF-nél és W-nél, s ugyanezt mutatták a > 3 mintaszámokkal végreajtott szimulációk is. Például n = 15 és = 0,05 esetén = 3, 4, 5 értékek mellett W elsőfajú ibabecslése rendre 0,50, 0,63, 0,70, a KF- é 0,49, 0,55, 0,58, az rw-é pedig 0,55, 0,69, 0,75 volt. 3. Folytonos szimmetrikus eloszlások különböző mintaelemszámokkal. Mivel 10 és 30 közötti elemszámok segítségével a szórásomogenitás fennállása, mely feltételre nézve VA, rva és KW különböző mintaelemszámok esetén fokozottan érzékeny (lásd például Sceffé; 1959. 353. old.), nem ellenőrizető kellő megbízatósággal, ez esetben csak a robusztus próbák elemzésére szorítkozunk. Az 5 és 10 százalékos szintre vonatkozó elsőfajú ibabecslések minimumát és maximumát a 4. tábla tartalmazza az elemszámok és az elméleti szórások közötti kapcsolat jellege szerinti bontásban. E táblából kiolvasató, ogy a robusztus rang VA-k a szórásomogenitás sérülése esetén gyakran idéznek elő a névlegesnél magasabb elsőfajú ibát, s ugyanez igaz a Kulle-féle próbákra, a az elemszámok és az elméleti szórások negatív kapcsolatban vannak egymással. A paraméteres próbák közül látatóan W és J tartja legjobban a névleges szintet. Tíz robusztus próba minimális és maximális elsőfajú ibabecslése különböző elemszámok esetén az elemszámok és elméleti szórások közötti kapcsolat jellege szerinti bontásban Az elemszámok és az elméleti szórások közötti kapcsolat Próba negatív (k = 44) Ve = 0 (k = ) pozitív (k = 44) minimum. maximum minimum maximum minimum maximum = 0,05 BF 0,045 0,066** 0,044 0,053 0,047 0,064* W 0,04 0,060* 0,045 0,056 0,044 0,056 J 0,038 0,055 0,04 0,05 0,041 0,053 rbf 0,049 0,068** 0,047 0,056 0,049 0,07** rw 0,051 0,069** 0,050 0,059* 0,05 0,070** rj 0,049 0,065** 0,047 0,056 0,050 0,069** KF1 0,044 0,058 0,045 0,05 0,039 0,047 KF 0,053 0,068** 0,05 0,059* 0,044 0,055 KG1 0,046 0,06* 0,046 0,053 0,041 0,049 KG 0,053 0,071** 0,051 0,061* 0,046 0,056 4. tábla (A tábla folytatása a következő oldalon.)
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 345 Próba (Folytatás.) Az elemszámok és az elméleti szórások közötti kapcsolat negatív (k = 44) Ve = 0 (k = ) pozitív (k = 44) minimum maximum minimum maximum minimum maximum = 0,10 BF 0,093 0,113 0,090 0,103 0,096 0,110 W 0,09 0,108 0,090 0,105 0,091 0,105 J 0,088 0,104 0,089 0,104 0,091 0,105 rbf 0,096 0,117* 0,096 0,106 0,099 0,15** rw 0,098 0,14* 0,098 0,109 0,100 0,19** rj 0,096 0,1* 0,097 0,108 0,099 0,19** KF1 0,089 0,10 0,089 0,098 0,086 0,096 KF 0,098 0,11 0,097 0,107 0,09 0,105 KG1 0,090 0,105 0,090 0,099 0,086 0,100 KG 0,098 0,114 0,098 0,108 0,093 0,107 * Szignifikánsan nagyobb 1,1-nál. ** Szignifikánsan nagyobb 1,-nál. Az előző,. pontban az rw módosított formájával, rw-vel kapcsolatban említett szimulációs elemzések alapján rw-t is a névleges szintet nem számottevően megaladó elsőfajú ibájú eljárások közé kell sorolnunk. Így az SZTH tesztelésére ez esetben legalkalmasabb próba megtalálásáoz leginkább a W, az rw és a Kulle-féle próbák erejét kell összevetnünk különböző elrendezésekben. A legjelentősebb összefüggések a legnagyobb szóráseterogenitási szinten jelentkeztek, melyek szemléltetésére a árom eloszláskombinációval kapcsolatos erőelemzés eredményeit az 5. tábla mutatja be. 5. tábla Négy robusztus próba erőbecslései különböző elemszámok esetén magas szóráseterogenitási szinten (Ve = 0,4) árom eloszláskombinációra vonatkozóan W rw KF KG n 1-n -n 3 próba tnn eloszláskombináció 10-15-0 0,50 0,48 0,43 0,41 10-0-30 0,6 0,60 0,57 0,55 0-15-10 0,39 0,37 0,8 0,9 30-0-10 0,46 0,43 0,9 0,30 tnu eloszláskombináció 10-15-0 0,49 0,38 0,3 0,31 10-0-30 0,6 0,49 0,44 0,4 0-15-10 0,37 0,30 0,0 0,1 30-0-10 0,43 0,35 0,1 0, ttt eloszláskombináció 10-15-0 0,53 0,58 0,54 0,53 10-0-30 0,64 0,70 0,69 0,67 0-15-10 0,44 0,47 0,38 0,38 30-0-10 0,50 0,54 0,40 0,41
346 VARGHA ANDRÁS Az 5. táblában bemutatott és a többi eloszláskombinációval kapcsolatban elvégzett erőelemzések alapján a következő megállapításokat teetjük különböző elemszámok esetén magas szóráseterogenitási szinten. i) A rangsorolásos eljárások egyetlen eloszláskombinációban (ttt) atékonyabbak, mint a legjobb robusztus paraméteres próba, W. Minden más eloszláskombinációban W nagyobb erejű, mint a rangsorolásos probák. W fölénye különösen magas, a a magas szórás alacsony csúcsossággal párosul (tnu, tuu, uuu stb.). ii) Az 5. táblában szereplő négy rangsorolásos eljárás közül minden esetben rw a legerősebb. A Kulle-féle próbákkal szembeni erőfölénye különösen szembetűnő abban az esetben, amikor az elemszámok és a szórások kapcsolata negatív, vagyis amikor kis minta nagy szórással, nagy minta kis szórással társul. iii) Szimmetrikus eloszlások esetén az SZTH definíciójában szereplő w i súlyok (lásd /10/) irrelevánsak, mert az SZTH fennállása nem függ tőlük. Emiatt KF1, KF, KG1 és KG, nullipotézise közös. Közülük KF1 és KG1 kissé konzervatívabb, mint KF és KG és ez mérlegelendő előny leet abban az esetben, amikor ez utóbbiak elsőfajú ibája ajlamos megnőni, azaz (negatív szóráselemszám-kapcsolat esetén). (Lásd a 4. táblát.) iv) KF és KG (és asonlóképpen KF1 és KG1) ereje között bár szisztematikus, de elanyagolató mértékű különbség figyelető meg. Ugyanezen elrendezésekben Ve = 0 esetén, a az elemszámok azonosak, a bemutatottakoz asonló mintázatú összefüggések érvényesek (lásd. pont a) eset) rw, KF és KG végig azonos nagyságrendű atékonyságával, Ve = 0, esetén pedig a Ve = 0,4 szintre vonatkozó összefüggések mutatkoznak, csak kevésbé erőteljes formában. 4. Folytonos ferde eloszlások. A két ferde eloszlással végzett szimuláció nagyon asonló eredményekre vezetett, a következő összefüggésekkel. a) Az rw elsőfajú ibája Ve 0,4 esetén teljesen elfogadató volt: 5 és 10 százalékos szinten egyetlen elsőfokú ibabecslés sem aladta meg szignifikánsan a névleges szint 110 százalékát. Az rw érvényessége csak Ve = 0,6 esetén csorbult számottevően. Ez esetben a kapott elsőfajú ibabecslések maximuma 5 százalékos szinten 0,071, 10 százalékos szinten pedig 0,136 volt. b) A Kulle-féle próbák közül KF1 és KG1, illetve KF és KG érvényessége gyakorlatilag azonos szintű volt minden elrendezésben. Esetenként KF1 és KF elsőfajú ibája egy árnyalattal kedvezőbb, mint KG1-é, illetve KG-é. Még különböző elemszámok esetén is. Ez azért figyelemre méltó, mert az SZTH-t azonos w i súlyokkal állítottam be, ami miatt KG1-nek, illetve KG-nek kellett volna elméletileg a névleges szintet jobban tartania. Ennek itt felteetőleg az az oka, ogy a ferde eloszlások az SZTH beállítása után a páronkénti sztocasztikus egyenlőség követelményének is eleget tettek, melynek fennállása esetén nincs különbség az SZTH súlyozott és súlyozatlan fogalma között. A Kulle-féle próbák elsőfajú ibája érdekes összefüggésben van az elemszámok és a szórások közötti viszonnyal. KF és KG szinte csak akkor mutat a névleges szintet lényegesen megaladó elsőfajú ibát, a az (n i, i ) kapcsolat negatív. Például KF elsőfajú ibája = 0,05 esetén az összes ilyen elrendezésben egy kivétellel mindig szignifikánsan nagyobb volt, mint 1,1, míg más elrendezésekben ilyen megemelkedett elsőfajú iba csak egyszer fordult elő. c) Ha a próbák erejét is figyelembe vesszük, akkor a következő kép rajzolódik ki. i) Azonos elemszámú elrendezésekben alacsony szóráseterogenitás (Ve 0,) esetén legtöbbször KF, magasabb szóráseterogenitás esetén viszont rw ereje tűnik a kedvezőbbnek. ii) Pozitív (n i, i) viszony esetén KF mutatkozik az SZTH legjobb próbájának, mert rw csak akkor erősebb KF-nél, a elsőfajú ibája már erőteljesen megaladja a névleges szintet.
FÜGGETLEN MINTÁK ÖSSZEHASONLÍTÁSA 347 iii) Negatív (n i, i) kapcsolat esetén viszont egyértelműen rw a legjobb próba, mert kedvező 0,06-ot sosem megaladó elsőfajú ibaszint mellett ereje számottevően nagyobb, mint bármely Kulle-féle próbáé. A KF és az rw ereje 5 százalékos szignifikanciaszinten a 10-0-30 elemszámkombináció esetén árom szóráseterogenitási szintre vonatkozóan Ki-négyzet-eloszlás Lambda eloszlás Próba Ve = 0, Ve = 0,4 Ve = 0,6 Ve = 0, Ve = 0,4 Ve = 0,6 KF 0,61 0,51 0,36 0,7 0,1 0,19 rw 0,69 0,74 0,68 0,36 0,38 0,39 6. tábla * A jelen tanulmányban független minták összeasonlításának egy új módját mutattuk be. Az ugyanakkoraság átlagok segítségével történő definíciójának alternatívájaként bevezettük a sztocasztikus egyenlőség (SZTE) és a sztocasztikus omogenitás (SZTH) fogalmát. Kissé leegyszerűsítve egy X és egy Y változóval reprezentált sokaságot akkor mondunk sztocasztikusan egyenlőnek, a X < Y ugyanolyan gyakran fordul elő, mint X > Y. Az SZTH az SZTE általánosítása kettőnél több sokaságra. Az SZTH fennállásának feltétele, ogy az összeasonlított sokaságok egyike se legyen sztocasztikusan kisebb vagy nagyobb, mint a maradék uniója. Az SZTH tesztelésével kapcsolatban számos paraméteres és nemparaméteres (rangsorolásos) próbát vettünk szemügyre, s ezek előnyeit és átrányait számítógépes szimuláció segítségével elemeztük 10 és 30 közötti nagyságú mintákkal különböző szóródású és eloszlású elrendezésekben. Az elemzések legfontosabb következtetései a következők. 1. Folytonos szimmetrikus eloszlások esetén, amikor az SZTH azonos az elméleti átlagok egyenlőségével, az SZTH nullipotézisének tesztelésére leginkább a Welc-féle VA (W) a legalkalmasabb. A agyományos VA ugyan némileg atékonyabb W-nél abban az esetben, amikor teljesül a normalitás és a szórásomogenitás feltétele, de ezt kis minták esetén aliga leet megbízatóan ellenőrizni. A paraméteres W elyett egy esetben célszerű más eljárásoz folyamodni: akkor, a a függő változó eloszlása minden sokaságban sokkal csúcsosabb, mint a normális eloszlás. Ilyenkor a paraméteres próbák (köztük W) kisebb erejűek, mint egyes rangsorolásos próbák, amelyek közül egyes esetekben a B. Kulle (1999) által ismertetett eljárás egyik módosítása (KF), legtöbbször pedig a rang Welc-próba egyik módosítása (rw) mutatkozik a legmegfelelőbbnek.. Ferde eloszlások esetén az SZTH és az átlagok egyenlősége két különböző reláció. Emiatt az SZTH tesztelésére ez esetben csak a rangsorolásos eljárások jöetnek szóba. Közülük ismét csak a KF és az rw tűnik a legjobbnak. E két eljárás közötti választás erősen függ az elemszámok és a szórások viszonyától. Pozitív (n i, i ) kapcsolat esetén inkább KF, negatív (n i, i ) kapcsolat esetén viszont inkább rw az ajánlott eljárás. Azonos nagyságú minták esetén a elyzet felemás: kis szóráseterogenitási szinten inkább KF, ellenkező esetben inkább rw asználata a célszerűbb. Végül megjegyezzük, ogy az SZTH tesztelése igen egyszerűen végreajtató a MiniStat programcsomag (Varga Czigler; 1999) segítségével.