Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre
Varianciaanalízis
A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk össze Alkalmazásával eldönthetjük, hogy a minták közötti különbséget az általunk előidézett tényező hozta-e létre, vagy a véletlennek köszönhető
Alkalmazásának feltételei: -mennyiségi ismérv, -a véletlen biztosítása a minták kiválasztásánál illetve a kísérlet elrendezésénél
Alkalmazási lehetőségek: a független és normális eloszlású valószínűségi változók additív tulajdonságából ered, azaz a valószínűségi változók általános szórásnégyzete egyenlő az egyes valószínűségi változók szórásnégyzetének összegével 2 2 2 2 S S1 + S2 + S3 + + 2... Sn A szórásnégyzetek összege a minták teljes varianciáját adja. Ismert, hogy: 2 2 2 S S B + S K azaz, az általános szórásnégyzet egyenlő a mintán belüli és minták közötti szórásnégyzetek összegével
A szórásnégyzet összetevőkre bontása Szórásnégyzet forrása Külső SQ k Négyzetösszeg SQ v j 1 nj ( Xj X ) 2 Szabadságfok Szf v-1 Szórásnégyzet S 2 (MQ) S 2 K SQ K v 1 Belső SQ v nj ( Xij ) B X j j 1 i 1 2 n-v S 2 B SQB n v Teljes SQ T v nj ( Xij X ) j 1 i 1 2 n-1
ahol : A szórásnégyzet összetevőkre bontása Xij-a j-edik csoport i-edik eleme x - a teljes minta átlaga x j - a j-edik csoport átlaga n- a teljes minta elemszáma v a csoportok száma (j1,2,,v) nj a j-edik csoport elemszáma (i1,2,, nj)
A külső szórás négyzet a kezelés hatásának tulajdonítható Annak eldöntésére, hogy a külső és a belső szórásnégyzet különböznek-e egymástól az F próbát alkalmazzuk F MQ MQ K ; ha F FP % B a nullhipotézist elvetjük,
azaz a külső szórásnégyzet szignifikánsan nagyobb a belső szórásnégyzetnél A vizsgált ismérv csoportonkénti értékei között P% szinten statisztikailag igazolható eltérések vannak SZD t P % p % 2MQ n j B nj a csoportonkénti megfigyelések száma
A kísérletek egyik célja a különböző kezelések hatásainak összehasonlítása Kezelés: a vizsgált jelenségre általunk előidézett ható tényező A varianciaanalízis megmutatja, hogy több minta esetén a kezelések eredményei szignifikánsak-e, vagy a minták közötti különbséget a véletlen okozza
Egytényezős kísérletek: egyetlen tényező különböző változatainak hatását hasonlítjuk össze Többtényezős kísérletek: egyidejűleg kettő vagy több tényező változatait és ezek kombinációit hasonlítjuk össze
Egytényezős, teljesen véletlen elrendezésű kísérlet az ismétlődésből nem képezünk blokkokat (pl. állatok) azonos elemszámú mintákat, illetve csoportokat hasonlítunk össze a kiválasztott minták középértékeit hasonlítjuk össze
Egy tanár 4 tanítási módszert próbál ki. Minden csoportba öt diák kerül. Ugyanazt a vizsgafeladatot oldják meg. A kapott pontok a következők Kezelések Ismétlés Me.: pont Kezelés összeg 1. 2. 3. 4. 5. V I. módszer 75 62 71 58 73 339 II. módszer 81 86 89 67 90 413 III. módszer 72 80 60 74 82 368 IV. módszer 68 70 73 55 64 330 Forrás: saját adatgyűjtés
Töltse ki a varianciatáblázatot! G x 75 + 62 +... + 64 1450 C G r 2 1450 2 105125 v 5 4
Az alapadatok négyzete 1. 2. 3. 4. 5. V 2 I. módszer 5625 3844 5041 3364 5329 114921 II. módszer 6561 7396 7921 4489 8100 170569 III. módszer 5184 6400 3600 5476 6724 135424 IV. módszer 4624 4900 5329 3025 4096 108900
x 2 107028 V 2 529814
A varianciatáblázat szerkezete Tényező SQ FG MQ SQ ö x 2 C n 1 Összes - Kezelés (csoportok között) SQ k V 2 C r v 1 SQ k v 1 Hiba (csoporton belül) SQ h SQ ö SQ k v ( r 1) SQ h v ( r 1)
A számítás menete SQ ö 2 x C 5625+ 3844 +... + 4096 105125 1903 SQ k 2 V C r 114921+ 170569 +... + 108900 5 105125 837,8 SQ MQ h k MQ h SQö SQk SQ v 1 k SQ h v ( r 1) 837,8 3 1065,2 16 1903 837,8 279,3 66,6 1065,2
Az alaptáblázat adataiból számított varianciaanalízis Tényező SQ FG MQ Összes 1903 19 - Kezelés 837,8 3 279,3 Hiba 1065,2 16 66,6
MQ k F MQh F p 5 % F F p 5% 3,24 279,3 66,6 4,19 a számláló Szf3, a nevező Szf16 tehát az egyes kezelések közötti különbség nem a véletlennek köszönthető
Számítsa ki a szignifikáns differenciát P 5% -os szignifikancia szinten t p 5 % 2,12 Szf16 SZD p 5% t p 5% 2MQ r h 2,12 2 66,6 5 133,2 SZD p 5 % 2,12 2,12 2,66 2,12 5,2 11 5
Eredménytáblázat Me.:pontszám Kezelés Tanítási módszerek átlagpontjai I. módszer 67,8 II. módszer 82,6 III. módszer 73,6 IV. módszer 66,0 SZD P5% 11,0 Ahol az átlagok közötti különbség nagyobb, mint az SZD p5%, ott az eltérő tanítási módszer eredménye ez a különbség
Egytényezős, véletlen blokk elrendezésű kísérlet kiértékelése előnyös kísérleti elrendezés bármilyen témakörben a blokkok száma az ismétlések számával azonos
Burgonya műtrágyázási kísérletben a különböző kálium adagok hatását vizsgálták egy adott fajta terméshozamára A kísérlet adatai Me.: t/ha Ismétlés Kezelés 1. 2. 3. 4. Kezelés összeg V Kontroll 30 21 15 30 96 I. adag 40 44 40 45 169 II. adag 46 51 43 52 192 III. adag 60 48 54 60 222 IV. adag 44 52 48 38 182 V. adag 45 53 61 55 214 Ismétlés összeg R 265 269 261 280 1075 Forrás: saját adatgyűjtés
Töltse ki a varianciatáblázatot G x 30 + 21+... + 55 1075 C G r 2 1075 2 v 4 6 48151
Az alapadatok négyzete 1. 2. 3. 4. V 2 Kontroll 900 441 225 900 9216 I. adag 1600 1936 1600 2025 28561 II. adag 2116 2601 1849 2704 36864 III. adag 3600 2304 2916 3600 49284 IV. adag 1936 2704 2304 1444 33124 V. adag 2025 2809 3721 3025 45796 R 2 70225 72361 68121 78400 1155625
x 2 51285 V 2 202845 R 2 289107
A kísérlet varianciatáblázatának szerkezete Tényező SQ FG MQ Összes x 2 C r v 1 - Ismétlés Kezelés R 2 C r 1 v V C r 1 2 SQ k v 1 - v ) Hiba SQ SQ SQ ( r 1) ( v 1) ö i k SQ h ( r 1) ( v 1
A számítás menete SQ ö SQ i 2 x C 2 R C v 51285 289107 6 48151 3134 48151 33,5 2 202845 V SQ K C 48151 2560,2 r 4 SQ SQ SQ SQ 3134 33,5 2560,2 h ö i K 540,3
A számítás menete MQ K v SQ K 1 2560,2 5 512 MQ h ( r SQ 1)( h v 1) 540,3 3 5 36
Az alaptáblázat adataiból számított varianciaanalízis Tényező SQ FG MQ Összes 3134,0 23 - Ismétlés 33,5 3 - Kezelés 2560,2 5 512 Hiba 540,3 15 36
F MQ K MQh 512 14,22 36 Az F-próba táblázatból FG v-1 azaz FG 5, illetve FG (r-1)(v-1) azaz FG15 szabadságfokoknál adott P%-nak megfelelő értéket keressük F P5% 2,9 mivel a számított F-érték nagyobb, mint a táblázatbeli F-érték, a kezelések P5% szinten szignifikáns különbséget okoznak
Számítsa ki a szignifikáns differenciát P5%-os szignifikancia szinten FG (r-1)(v-1) -nél és P5% -nál a t értéke t p5% 2,131 2MQ 2 36 SZD 5 % t h p p 5% 2,131 r 4 9
Eredménytáblázat Me.:t/ha Kezelés Termés átlag Kontroll 24,0 I. adag 42,3 II. adag 48,0 III. adag 55,5 IV. adag 45,5 V. adag 53,5 SZD P5% 9,0 Amely kezelések átlaga között nagyobb a különbség mint 9 t/ha, azok a kezelések szignifikánsan különböznek