Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e. 6. Előadás Variancia-analízis Lineáris modellek Elmélet A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai a független változók, Sir Ronald Aylmer Fisher 1890-1962 A másik heterogenitás-rész pedig az, amelynek okait az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik. Ez valójában a maradék hatás. ahol: y ij Lineáris modell y ij = µ + α i + e ij a függő változó értéke (termés t/ha) µ főátlaga, fix hatás (t/ha) α i fix hatás, oka a független változó (t/ha) hiba, vagy maradék (t/ha) e ij A variancia-analízis alkalmazásának feltételei A maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) A maradék (hiba) normális eloszlású, nulla várható értékű sokaság A maradékok szórásai a kezeléskombinációk celláin belül egyformák (homoszkedasztikus) 1
Alapfogalmak 1. Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk. Alapfogalmak 2. Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll. Alapfogalmak 3. Egy-szempontos variancia-analízis: Varianciaanalízis, ahol csak egy faktor van. Több-szempontos variancia-analízis: Varianciaanalízis, ahol kettő vagy több faktor van. Egy-változós variancia-analízis: ANOVA technika, amely egy függő változót használ. Több-változós variancia-analízis: MANOVA technika, amely kettő vagy több függő változót használ. Egytényezős variancia-analízis Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat. Vegyes kapcsolat elemzése n: az adatok száma k: csoportok száma r: ismétlések száma Csoport átlag: Jelölések H 0 A nullhipotézis jelentése, hogy a kezelés átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára. 2
Variancia-analízis lépései 1. A variancia-analízis modell felállítása. 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása, az F- próba elvégzése. 4. A modell érvényességének ellenőrzése. 5. Amennyiben az F-próba szignifikáns, középértékek többszörös összehasonlítása. 1. A modell felállítása A modellben a mérési, megfigyelési értékeket összegként képzeljük el. Kísérleti elrendezésnek megfelelő modellalkotás Lineáris modell y ij = µ + α i + e ij Példa Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a hibrideket A, B, C, D- vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e. ahol: y ij a függő változó értéke µ főátlag, fix hatás α i fix hatás, oka a független változó, faktor hiba, vagy maradék e ij 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása Leggyakrabban 0,05 azaz 5% Lehet: 0,1; 1; 5 és 10% Elméletileg bármilyen értéket választhatunk, ha szakmailag meg tudjuk indokolni. 3
Eredménytáblázat (Excel) Eltérés négyzetösszegek (SS ö ) Összes: alapadatok eltérés négyzetösszege A B C D 9,3 5,4 4,5 3,5 7,2 7,1 2,9 0,9 8,2 5,9 5,0 2,5 Főátlag: 5,2 t/ha Eltérés- négyzetösszeg: 68,44 Eltérés négyzetösszegek (SS csk ) Csoportok között A B C D 8,2 6,1 4,1 2,3 8,2 6,1 4,1 2,3 8,2 6,1 4,1 2,3 Főátlag: 5,2 t/ha Eltérés- négyzetösszeg: 58,86 Eltérés négyzetösszegek (SS) Csoporton belül = Összesen Csoportok között Csoporton belül = 68,44 58,86 = 9,58 Általunk nem vizsgált, egyéb hatások összege a véletlen. Szabadságfokok (df) Varianciák Csoportok között: k-1 Csoporton belül: n-k Összes: n-1 Az eltérés négyzetösszegek osztva a szabadságfokokkal. SS csk /3 SS csb /8 SS össz /11 4
F-próba Mi annak a valószínűsége? Hogy véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F-eloszlás esetén. P=0,00089 5
5. Az F-próba szignifikáns Post hoc analízisek Középérték összehasonlító tesztek Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: előzetes, un. a priori kontrasztok és az analízis után elvégezhető, un. post hoc analízisek Post hoc analízisek A csoportok szórása megegyezik LSD Tukey Bonferroni Scheffe Dunett Student-Newman-Keuls Duncan LSD-teszt (legkisebb szignifikáns differencia) Alkalmazhatóság feltételei: 1. A csoportok szórása egyenlő 2. Véletlenszerűen kiválasztott két csoport összehasonlítására jó Hipotézisek Példa H 0 : A különböző kefirek átlagos fogyasztói ára megegyezik. 6
Szignifikancia szint megválasztása Adatok 5% H 1 : A különböző kefirek átlagos fogyasztói ára nem egyezik meg. Modell felállítása Egytényezős teljesen véletlen elrendezés Számítás 1. Adatbázis rendezése, szűrése Egytényezős variancia-analízis Egytényezős variancia-analízis Eredménytáblázat 1. 7
Eredménytáblázat 2. LSD-teszt (legkisebb szignifikáns differencia) Páronkénti összehasonlítás 8
*** 0,1% ** 1% * 5%. vagy + 10% Jelölések 9