Elmélet let BIOMETRIA 7. Előad adás Variancia-anal Lineáris modellek A magyarázat a függf ggő változó teljes heterogenitásának nak két k t részre r bontását t jelenti. A teljes heterogenitás s egyik része r az, amelynek okai a független f ltozók, a másik m heterogenitás-rész sz pedig az, amelynek okait az egyéb, általunk nem vizsgált tényezt nyezők k tartalmazzák. Ez utóbbit sokszor a véletlen v hatásak saként, hibaként is emlegetik. ahol: y ij Lineáris modell y ij = µ + α i + e ij a függf ggő változó értéke µ a kísérlet k főátlaga, f fi hatás α i fi hatás, oka a független f ltozó hiba, vagy eltérés e ij A variancia-anal alkalmazásának feltételei telei a maradék k független f a kezelés és s blokk hatást stól valamint a függf ggő változótól l (véletlen mintavételez telezés, kísérleti k elrendezés) a maradékok (hibák) normális eloszlású,, nulla várható értékű sokaság a maradékok szórásai sai a kezeléskombin skombinációk celláin belül l egyformák Alapfogalmak. Faktor: a vizsgálatba bevont független f ltozókat, pl. különbk nböző kezeléseket, tényezt nyezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és s kvantitatív v faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, v, ellenkező esetben kvantitatív faktorokról l beszélünk. Alapfogalmak. Kezelések (cellák) k): : Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből l előáll lló kombináci ciók k a kezelések. Pl. amikor a faktor műtrm trágyaadagok és öntözési módok, akkor a kezelések a (műtr trágyaadagok, öntözési módok) m összes lehetséges kombináci ciójából áll. Interakció: : Két K t ltozó kapcsolatában akkor áll fenn interakció (kölcs lcsönhatás), ha ltozó hatása függ f az ltozó szintjétől és s fordítva.
Alapfogalmak 3. Egy szempontos variancia-anal : Variancia- zis,, ahol csak egy faktor van. Több szempontos variancia-anal : Variancia- zis,, ahol kettő vagy több t faktor van. Egyváltoz ltozós s variancia-anal : : ANOVA technika, amely egy függf ggő változót t használ. Többváltozós s variancia-anal : : ANOVA technika, amely kettő vagy több t függf ggő változót t használ. Jelölések n: az adatok száma k: csoportok száma r: ismétl tlések száma Csoport átlag: k Egytényez nyezős s variancia-anal H 0 Segíts tségével egy tényezt nyező hatását t lehet vizsgálni a függf ggő változó mennyiségi alakulására. A tényezt nyező,, faktor valamilyen csoportképz pző ismérvvel rendelkezik, a függő változó pedig legtöbbsz bbször r skála típusú adat. A nullhipotézis zis,, hogy az átlagok egyenlők, nincs közöttük k különbsk nbség. Ez a technika a kétmintk tmintás t-teszt teszt általánosítása, sa, kiterjesztése se több t mintára. = K = k Variancia-anal lépéseil. A variancia-anal modell feláll llítása.. Szignifikancia-szint megválaszt lasztásasa 3. A variancia-anal kiszámítása, sa, az F-F próba. 4. A modell érvényességének nek ellenőrz rzése. 5. Amennyiben az F-prF próba szignifikáns, ns, középértékek többszt bbszörös összehasonlítása. sa.. A modell feláll llítása A modellben a mérési, m megfigyelési értékeket összegként képzeljk pzeljük k el. Kísérleti elrendezésnek megfelelő modellalkotás
ahol: y ij Lineáris modell µ a k α i e ij y ij = µ + α i + e ij a függf ggő változó értéke a kísérlet főátlaga, f fi hatás fi hatás, oka a független f ltozó,, faktor hiba, vagy eltérés Példa Egy termesztő k kukorica hibrid termesztése se között k választhat. Jelölj ljük k a fajtákat A, B, C, D-vel. D Döntsük k el, hogy a 4 fajta termesztése se esetén azonos terméseredm seredményre számíthatunk thatunk-e. Fajta Termés (t/ha) A 9,3 7, 8, B 5,4 7, 5,9 C 4,5,9 5,0 D 3,5 0,9,5. Szignifikancia-szint megválaszt lasztásasa 3. A variancia-anal kiszámítása sa Leggyakrabban 0,05 azaz 5% Lehet: 0,; ; 5 és s 0% ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Variancia A 3 4,7 8,33333,03333333 B 3 8,4 6,33333 0,763333333 C 3,4 4,33333,03333333 D 3 6,9,3,7 Elméletileg letileg bármilyen b értéket választhatunk, v ha szakmailag meg tudjuk indokolni. Eredményt nytáblázat Eltérés s négyzetn gyzetösszegek (SS) Tényezők SS df MS F Csoportok között 58,86 3 9,6 6,38 Csoporton belül 9,58 8,975 Összesen 68,44 Csoportok között: k csoportátlagok tlagok eltérés négyzetösszege * r Csoporton belül: l: csoportok eltérés négyzetösszegeinek összege Összes: alapadatok eltérés s négyzetn gyzetösszege 3
Szabadságfokok (df( df) Varianciák Csoportok között: k k-k Az eltérés s négyzetn gyzetösszegek osztva a szabadságfokokkal. Csoporton belül: l: n-k SS csk /3 Összes: n-n SS csb /8 SS össz ssz/ F = F-próba MS MS csk error df(, df = DF, df = DF, ncp = 0) 0.0 0. 0. 0.3 0.4 0.5 0.6 0.7 4.07 0 4 6 8 pf(, df = DF, df = DF, ncp = 0, lower.tail = TRUE) 0.0 0. 0.4 0.6 0.8.0 4.07 0 4 6 8 df(, df = DF, df = DF, ncp = 0) 0.0 0. 0. 0.3 0.4 0.5 0.6 0.7 4.07 0 5 0 5 6.38 4
pf(, df = DF, df = DF, ncp = 0, lower.tail = TRUE) 0.0 0. 0.4 0.6 0.8.0 Mi 4.07 6.38 annak a valósz színűsége? 0 5 0 5 Véletlenül l 6,38 F-értF rtéknél l nagyobbat kapunk egy 3, 8 szabadságfok gfokú F- eloszlás s esetén. P=0,00089 Mikor szignifikáns ns az F-prF próba? 4. A modell érvényességének nek ellenőrz rzése Ha létezik l legalább egy szignifikáns ns kontraszt a csoportok között. k. Függetlenség. Normális eloszlás 3. Azonos varianciák A maradék k független f a kezelés és s blokk hatást stól valamint a függf ggő változótól l (véletlen mintavételez telezés, kísérleti k elrendezés) Vizsgálat: Maradékok leíró statisztikája kezelések szerint a maradékok ábrázolása a megfigyelt és becsült értékek függvf ggvényében Maradékok leíró statisztikája Residual for termes Case Summaries hibrid N Mean Variance A 3,0000,03 B 3,0000,763 C 3,0000,03 D 3,0000,70 Total,0000,87 5
Maradékok és s a megfigyelt értékek közötti függetlensf ggetlenség Maradékok és s a becsült értéket közötti függetlensf ggetlenség R e s i d u a l f o r t e r m e s,5 0,0 0 0,50 0,00-0,50 R e s i d u a l f o r t e r m e s,5 0,0 0 0,50 0,00-0,5 0 -,00 -,0 0 -,50 -,5 0 0,0 0,0 0 4,00 term es 6,00 8,00 0,0 0,00 3,00 4,0 0 5,0 0 6,00 7,0 0 Predicted Value for termes 8,00 9,00 Maradék k normális eloszlású,, nulla várható értékű Hisztogram 3,0 Grafikus normalitás s vizsgálat Hisztogram Q-Q plot Numerikus normalitás s vizsgálat Kolmogorov-Smirnov Shapiro-Wilk F r e q u e n c y,5,0,5,0 0,5 0,0 Mean =,3878E -7 Std. Dev. = 0,9333 N = -,50 -,00-0,50 0,00 0,50,00,50 Residual for termes Q-Q ábra Kolmogorov-Smirnov teszt E p e c t e d N o r m a l V a lu e Normal Q -Q Plot of Residual for termes 0 - - - - 0 Observed Value One-Sample Kolmogorov-Smirnov Test Residual for termes N Normal Mean,0000 Parameters(a,b) Std. Deviation,9333 Most Etreme Absolute,57 Differences Positive,7 Negative -,57 Kolmogorov-Smirnov Z,543 Asymp. Sig. (-tailed),99 a Test distribution is Normal. b Calculated from data. 6
Mintán n belüli li szórás s azonosság tesztelése se Levene-teszt H 0 a szórások sok megegyeznek Test of Homogeneity of Variances termés t/ha Levene Statistic df df Sig. 5.07 4.007 Amennyiben a Levene-teszt szignifikáns ns Robusztus tesztek alkalmazása Welch-tesz Brown-Forsythe Robusztus tesztek Robust Tests of Equality of Means termes Statistic(a ) df df Sig. Welch,34 3 4,404,06 Brown-Forsythe 6,384 3 7,394,00 a Asymptotically F distributed. 7