Varanca-analízs (NOV Mért nem csnálunk kétmntás t-próbákat? B Van különbség a csoportok között? Nncs, az eltérés csak véletlen! Ez a nullhpotézs. és B nncs különbség Legyen, B és C 3 csoport! B és C nncs különbség B C és C. Van különbség? C 3 teszt! B és B C valamnt C összehasonlítása. (nem tranztív tévedés esélye Mekkora a tévedés esélye? szükséges tesztek száma nagyon erősen növekedk növekvő csoportszámmal, am elentősen megnövel a tévedés valószínűségét. Mert a tévedés lehetősége nagyon megnőne! Tételezzük fel, hogy mndhárom esetben elvetük a nullhpotézst. csoportok száma próbák száma 3 3 4 6 5 10 p annak a valószínűsége, hogy kívül van (1-p annak, hogy belül van az érték véletlenül. Kérdés: Mekkora az esélye, hogy legalább egy esetben tévedtünk? 1
Mekkora az esélye, hogy legalább egy kívül essen véletlenül? Több csoport Egy próba esetében ez p (legyen 5%. Több próba esetében a bnomáls eloszlás ada meg. csoportokat kezelhetük külön-külön és együtt! Ez ebben az esetben kb. 15%!!! 5% eléréséhez a p értékének kb. 5/3 %-nak kell lenne. 1 (1 p 3 Csoportátlag: a csoport elemeből számolt átlag. Nagyátlag: a teles adathalmazból számolt átlag. varanca összetevő z NOV alapa Emlékeztető: varanca arányos az átlagtól való eltérések négyzetösszegével! Ebben az esetben nem olyan nagy a különbség! teles varanca (a nagyátlagtól vett eltérésekből számolt a csoportokon belül és a csoportok között varancából tevődk össze! Ha a csoportok elentősen különböznek egymástól, a nagyátlagtól való átlagos eltérések óval nagyobbak, mnt a csoporton belül a csoportátlagtól való eltérések!
varanca összetevő 1. csoport. csoport 3. csoport 1 173 170 175 175 163 174 3 169 165 171 4 168 17 5 17 csoportátlag 171,5 166 17,8 nagyátlag = 170, 58 (170-170,58 = (170-166 + (166-170,58 (175-170,58 = (175-17,8 + (17,8-170,58 (Nem kell tudn! varanca felbontása ( ( (, ( ( ( (, ( ( ( ( ( ( ( ( (, csoporton belül (pl. véletlen eltérés csoportok között különbség - nagyátlag - csoportátlag ( ( ( SS T SS E SS a csoporton belül és a csoportok között eltérések kovarancáa. Ezeket függetlennek feltételezve, ez a tag nulla! varancák kszámolása nullhpotézs négyzetösszeg szab. fok varanca csoportok között nncs különbség. csoportok között eltérés csupán a véletlen műve. teles SST N-1 csoportok között csoporton belül nagyátlag -edk csoportátlag SS n SS SS SS E T k-1 N-k SS MS k 1 SSE MSE N k N összes elem száma k csoportok száma a csoportok között és a csoporton belül varancák összehasonlítása alapán. 3
Hogyan hasonlítuk össze? döntés Varancák összehasonlítása? Ilyenről már volt szó! F MS MS Valóban, a kétmntás t-próba esetében. E 1. Ha a véletlen eltérés valószínűsége kcs (p(f F krt a elvetük a nullhpotézst.. Ha a véletlen eltérés valószínűsége nagy (p(f F krt > a megtartuk a nullhpotézst. ( döntés után, ha szükségesnek tartuk, csnálhatunk t-próbákat Példa z NOV feltétele ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Varanca Oszlop 1 4 685 171,5 10,91667 Oszlop 3 498 166 13 Oszlop 3 5 864 17,8,7 VRINCINLÍZIS Tényezők SS df MS F p-érték F krt. Csoportok között 89,36666667 44,68333 5,78171 0,047 4,56495 feladat: több egymástól független csoport összehasonlítása. változó normáls eloszlású legyen. szórás a csoportokban azonosnak teknthető. Csoporton belül 69,55 9 7,77778 Összesen 158,9166667 11 p = 0,04 elvetük a nullhpotézst, a példa alapán a csoportok szgnfkánsan különböznek egymástól. 4
Kruskal-Walls próba Ha a változó nem normáls eloszlású! Rangsorolás 1. csoport. csoport 3. csoport 1 173 170 175 175 163 174 3 169 165 171 4 168 17 5 17 z adatokat a csoportoktól függetlenül rangsoroluk! elem 163 165 168 169 170 171 17 17 173 174 175 175 rang 1 3 4 5 6 7,5 7,5 9 10 11,5 11,5 csoport elemszám rangok összege 1 4 7,5 3 8 3 5 4,5 nullhpotézs Mlyen eloszlást használunk? csoportok között nncs különbség. rangok átlaga között eltérés csupán a véletlen műve. H változó c -eloszlást követ! 1 R H 3N 1 N N 1 n kkor ön az átalakítás! N az elemek száma R a rangok összege az -edk csoportban n az elemek száma az -edk csoportban H értéke 0! 5
c -eloszlás döntés Emlékeztető: c -eloszlás normáls eloszlású változók négyzetösszege esetén lép fel. szabadság fokok száma = csoportok száma -1 1. Ha a véletlen eltérés valószínűsége kcs (p(c c krt a elvetük a nullhpotézst.. Ha a véletlen eltérés valószínűsége nagy (p(c c krt > a megtartuk a nullhpotézst. Példa Hasonlítsuk össze! Csoport Elemszám (n 1 4 7,5 3 8 3 5 4,5 Rangok összege (R 1 7,5 4,97 11 1 4 sz.f. = 3 1 = p = 0,083 8 4,5 3 5 1 R H 3N 1 N N 1 n 31 1 N = 1 megtartuk a nullhpotézst, a példa alapán a csoportok nem különböznek egymástól szgnfkánsan. NOV p = 0,04 elvetük a nullhpotézst. 1. csoport. csoport 3. csoport 1 173 170 175 175 163 174 3 169 165 171 4 168 17 5 17!!! Kruskall-Walls próba p = 0,083 megtartuk a nullhpotézst. 6
Hpotézs vzsgálat? Felállítuk a nullhpotézst. Keresünk egy smert eloszlású változót. z eloszlás alapán kszámoluk a véletlen eltérés valószínűségét. Ha ez ksebb mnt a szgnfkanca sznt elvetük, ellenkező esetben megtartuk a nullhpotézst. Enny! 7