4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól Maradékok leíró statisztikája valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) Vizsgálat: Maradékok leíró statisztikája kezelések szerint a maradékok ábrázolása a megfigyelt és becsült értékek függvényében Maradékok és a megfigyelt értékek közötti függetlenség Maradékok és a becsült értéket közötti függetlenség 1
Maradék normális eloszlású, nulla várható értékű Hisztogram Grafikus normalitás vizsgálat Hisztogram Q-Q plot Numerikus normalitás vizsgálat Kolmogorov-Smirnov Shapiro-Wilk Q-Q ábra Kolmogorov-Smirnov teszt Mintán belüli szórás azonosság tesztelése Levene-teszt H 0 a szórások megegyeznek Amennyiben a Levene-teszt szignifikáns Robusztus tesztek alkalmazása Welch-tesz Brown-Forsythe 2
Robusztus tesztek Post hoc analízisek Középérték összehasonlító tesztek 5. Az F-próba szignifikáns Post hoc analízisek Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: előzetes, un. a priori kontrasztok és az analízis után elvégezhető, un. post hoc analízisek A csoportok szórása megegyezik LSD Bonferroni Student-Newman-Keuls Tukey Duncan Dunett Scheffe A csoportok szórása különbözik Tamhane Az elsőfajú hiba csökkentése holm hochberg bonferroni BH BY fdr Bonferroni-teszt Páronkénti átlagok különbségének vizsgálatára használható, a két csoport elemszáma lehet különböző is. α: α/m (m=független összehasonlítások száma) 3
Carlo Emilio Bonferroni olasz matematikus (1892-1960) Student-Newman-Keuls próba Studentizált terjedelmen alapuló teszt α: összehasonlításonként rögzített, ezért a teljes vizsgálat elsőfajú hibája n-nel együtt nő. A próba teszteli, hogy mely kezelés kombinációk tartoznak egy homogén csoportba. Studentizált terjedelem Student-Newman-Keuls teszt k-1 kritikus tartomány meghatározása x max : legnagyobb csoport átlag x min : legkisebb csoport átlag S: csoporton belüli szórás, a maradékok szórása Egyes vélemények szerint a SNK-teszt a Tukey teszttel áll rokonságban, de annál sokkal kevésbé konzervatív (több eltérést mutat ki). Tukey-eloszlás John Wilder Tukey amerikai matematikus (1915-2000) Tukey-teszt Studentizált terjedelmen alapuló teszt, a p-elemű részcsoportokat ugyanazzal a kritikus értékkel hasonlítja össze. α: a teljes vizsgálatra rögzített, ezért a páronkénti összehasonlítások elsőfajú hibája n növekedésével csökken, s így a másodfajú hiba nő. 4
Duncan többszörös rang teszt Duncan-teszt David B. Duncan, 1955, 1965 Studentizált terjedelmen alapul α: nem a kísérlet egészére rögzített, így a próba nem annyira konzervatív, mint a hasonló tesztek. k-1 kritikus érték ahol k: csoportok száma Dunnett-teszt A Dunnett-teszt (1955) egy kijelölt csoportot (kontroll) hasonlít össze a többivel. Eredetileg egyenlő elemszámokra volt érvényes, de később elkészült az általánosítása különböző elemszámokra is. Lényegét tekintve páronkénti összehasonlítást végez szimultán, de meg kell adni egy kezdő, kontroll csoportot, és ehhez hasonlítja a többi csoport átlagát. Statisztikája: Henry Scheffé amerikai statisztikus (1907-1977) =kontroll csoport Scheffé-teszt A hagyományos tesztek közé tartozik. Ez már valóban a H g hipotéziseket vizsgálja. Az egyszerű F-próba akkor utasítja el a H 0 -hipotézist, ha létezik egy a<>0 vektor, amelynél a konfidencia-intervallum nem tartalmazza a 0-t. Ha k darab összehasonlítandó csoport van, akkor k(k-1)/2 összehasonlítást kell végezni. A statisztikája: Tamhane-teszt Alkalmazhatóság feltételei: 1. A csoportok szórása különbözhet 2. Véletlenszerűen kiválasztott két csoport összehasonlítására jó 5
t q F Összefoglalás, eloszlások Student-féle t-eloszlás Studentizált terjedelem eloszlása Fisher-féle F-eloszlás Az elsőfajú hiba elkövetésének valószínűsége egyetlen pár összehasonlítására (pl. LSD) az összes lehetséges páronkénti összehasonlításra összes kontrasztra Hány páronkénti összehasonlítást akarunk végezni? Összefoglalás egy maximum k-1, amelyet az összehasonlítások dimenziójának nevezzük, és m-mel jelöljük az összes párt, k(k-1)/2 A variancia-analízis ereje A variancia-analízis ereje az elsőfajú hiba függvényében Milyen valószínűséggel lehet kimutatni a csoportok közötti különbségeket? Mi befolyásolja? Csoportok száma Egy csoporton belül a megfigyelések száma Csoportok közötti variancia Csoporton belüli variancia Elsőfajú hiba valószínűsége, alfa 6