Varianciaanalízis. Egytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varianciaanalízis ANOVA)



Hasonló dokumentumok
Esetelemzés az SPSS használatával

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Statisztika feladatok

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

4 2 lapultsági együttható =

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Kísérlettervezési alapfogalmak:

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Nemparaméteres eljárások

Regresszió. Fő cél: jóslás Történhet:

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Varianciaanalízis 4/24/12

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Hipotézis vizsgálatok

Adatelemzés és adatbányászat MSc

Lineáris regresszió. Statisztika I., 4. alkalom

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

ANOVA. Egy faktor szerinti ANOVA. Nevével ellentétben nem szórások, hanem átlagok összehasonlítására szolgál. Több független mintánk van, elemszámuk

Variancia-analízis (folytatás)

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2012. április 18. Varianciaanaĺızis

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

METROLÓGIA ÉS HIBASZÁMíTÁS

A sokaság/minta eloszlásának jellemzése

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Bevezetés a hipotézisvizsgálatokba

Sztochasztikus kapcsolatok

Kettőnél több csoport vizsgálata. Makara B. Gábor

ADATREDUKCIÓ I. Középértékek

Adatsorok jellegadó értékei

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

STATISZTIKA III. Oktatási segédlet

Az elektromos kölcsönhatás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

A bankközi jutalék (MIF) elő- és utóélete a bankkártyapiacon. A bankközi jutalék létező és nem létező versenyhatásai a Visa és a Mastercard ügyek

Jövedelem és szubjektív jóllét: az elemzési módszer megválasztásának hatása a levonható következtetésekre

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ADATREDUKCIÓ I. Középértékek

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

[Biomatematika 2] Orvosi biometria

Statisztikai szoftverek esszé

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

Biostatisztika VIII. Mátyus László. 19 October

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

The original laser distance meter. The original laser distance meter

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

BIOMETRIA_ANOVA_2 1 1

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán):

Biostatisztika Összefoglalás

KISTERV2_ANOVA_

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

/11 Változtatások joga fenntartva. Kezelési útmutató. UltraGas kondenzációs gázkazán. Az energia megőrzése környezetünk védelme

Intelligens elosztott rendszerek

Minősítéses mérőrendszerek képességvizsgálata

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Lineáris regresszió vizsgálata resampling eljárással

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

? közgazdasági statisztika

Az entrópia statisztikus értelmezése

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Laboratóriumi kontrollkártya használata Tananyag. Készítette: Muránszky Géza vegyészmérnök Oktató: Lőrinc Anna minőségirányítási előadó

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Adatok statisztikai értékelésének főbb lehetőségei

A talaj hasznosítható vízkészlete és nitrát-nitrit tartalma

A Ga-Bi OLVADÉK TERMODINAMIKAI OPTIMALIZÁLÁSA

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

ALAKOS KÖRKÉS PONTOSSÁGI VIZSGÁLATA EXCEL ALAPÚ SZOFTVERREL OKTATÁSI SEGÉDLET. Összeállította: Dr. Szabó Sándor

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

NEMPARAMÉTERES PRÓBÁK

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Segítség az outputok értelmezéséhez

Átírás:

Varancaanalízs A varancaanalízs során kettőnél több sokaság középértékenek mnta alapán történő összehasonlítása történk zért nevezk a kétmntás t-próba általánosításának A nullhpotézs eldöntéséhez használuk a szórásnégyzeteket, nnen származk a varancaanalízs elnevezés s Azoknál a problémáknál használhatuk, ahol a valószínűség változó értéke egy vagy több szsztematkus hatástól, valamnt a véletlentől függ lsősorban a mezőgazdaság kísérletek elemzésénél használták, ez a szóhasználatában még mndg fellelhető, de természetesen használhatósága ettől óval általánosabb, mvel a gazdaság élet számos területén s alkalmazható A varancaanalízs-modell alkalmazásának feltétele, hogy a mnták függetlenek legyenek, normáls eloszlású sokaságokból származzanak, valamnt azonos legyen a sokaságok varancáa A mnták függetlenségét legnkább a megfelelő kísérlet elrendezéssel bztosíthatuk A normáls eloszlással kapcsolatban vagy szakma smeretenk lehetnek, vagy a mnta alapán ellenőrzhetük a normaltás telesülését A harmadk feltétellel kapcsolatban a következő megkötést szokták tenn: ha közel azonosak a mnták elemszáma, akkor a legnagyobb varancának ksebbnek kell lenne, mnt a legksebb varanca kétszerese gytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varancaanalízs ANOVA) gytényezős a kísérlet, ha k számú független mntánk van (ezek a kezelések), és mnden mntában r számú mérés vagy megfgyelés található Szokás az r-et smétlésnek s nevezn A következő táblázat a szokásos elölésekről ad táékoztatást A sokaság sorszáma vagy a kezelések száma Mntaelemek A mnta középértéke A mnta varancáa 1 11, 1,, 1r1 1 s 1 1,,, r s k k1, k,, krk s k k Az egyes sokaságok várható értéket µ, szórását σ elöl A nullhpotézs az, hogy az összes kezelés átlaga egyenlő Az alternatív hpotézs pedg azt elent, hogy legalább egy olyan középérték pár van, ahol nem teknthetők a középértékek azonosnak H o : µ 1 µ µ k H 1 : legalább egyszer µ µ, 1,,, k, 1,,, k A varancaanalízs-modell felállítása Az adatokra úgynevezett modellegyenletek állíthatók fel z egy lneárs egyenletrendszer lesz, ahol a kísérletben megfgyelt értékeket egy olyan összegre bontuk fel, melynek egyk taga a mesterséges hatást (kezelést), a másk taga pedg a véletlen hatást (hbát) tartalmazza Kezelés alatt értük azt a szsztematkus hatást, am a valószínűség változónkat befolyásolhata (aráthné, 1996) 1

A modellegyenlet: µ e ahol az -edk mnta -edk mntaeleme, µ az -edk mntához tartozó sokaság várható értéke, e a véletlen (hba) A hbatag normáls eloszlású változó, 0 várható értékkel és σ szórással A szsztematkus különbséget a sokaságok várható értéke tartalmazzák, a véletlen hatásokat pedg a hbatag A H 0 hpotézssel a µ értékere vonatkozóan feltételezzük, hogy azok azonosak A modellegyenlet más formáa: µ α e ahol µ a sokaságok közös várható értéke α az -edk sokaság várható értékének és a µ-nek a különbsége a véletlen (hba) e Mvel µ µ α, a H 0 hpotézs megfogalmazható a következő alakban s: H o : α 0; 1,,,k A modellegyenletet átrendezve: - µ α e A bal oldalon látható - µ az egyes mntaelemek eltérése a közös várható értéktől z két részre bontható: α a szsztematkus hatás okozta eltérésre, e a véletlen okozta eltérésre A modellben a kétféle eltérés várható értéke ( α ) 0, ( e ) 0 (aráthné, 1996) A sokaság µ értéket az egyes mntákból számított feltételezett azonos középértéke (µ) a mnták főátlagával becsülhető ( ) A képletben a - µ α e, ( ) ( ) középértékekkel becsülük A sokaság az egyes mntaelemek összes eltérése a főátlagtól, am az szsztematkus hatás okozta eltérésből és az a véletlen hatás okozta eltérésből áll Az eltérések összege zérusok, ezért négyzetes eltérések összegevel számolunk (aráthné 1996), ( ) 0 ( ) 0 Varancaanalízs táblázat Azt vzsgáluk, hogy a mnták középértéke között kezelés okozta varanca nagyobb-e a mntavételezésből származó véletlen hatás okozta hbavaranca értékénél A döntést F-próba segítségével hozzuk meg Szokásos varancaanalízs táblázat: Tényező Szabadság fok (DF) Négyzetösszeg () Korrgált szórásnégyzet () Kezelés k-1 Véletlen hatás n-k W W Összes n-1 T F W

A kezelés okozta varancát szokás a csoportok között varancának s hívn, és ndexekben az angol between szó alapán b betűvel elöln, hasonlóképpen a véletlen hatás okozta varancánál csoporton belül varancáról beszéln és w-vel hvatkozn rá a wthn szó alapán A táblázatban szereplő értékek kszámítása: ( ) ( ), ( ) r ( ) ( ),, T T W ( ) ( ), r, W T -, DF, W W DF W F-próba a varancák összehasonlítására Ha a sokaság normáls eloszlású, akkor a szórásnégyzet fent két becslése független egymástól, és ha a nullhpotézs gaz, akkor a kezelés okozta varanca ( ) nem lehet nagyobb a véletlen okozta varancánál ( W ) Ha mégs nagyobb, vagys a nullhpotézst elvetük, akkor az azt elent, hogy a vzsgált smérv szempontából a mnta nem homogén F, DF (k-1), (n-k) W Az F próbában mndg a kezelés okozta varanca áll a számlálóban, mert azt vzsgáluk, hogy ez a varanca nagyobb-e a véletlennek tuladonítható hbavarancánál gyoldal próbát kell végezn A H 0 -t elfogaduk, ha F számított érték F táblázatbel érték llenkező esetben elvetük a nullhpotézst Példa: Kísérletet végeztek búzafaták hozamának összehasonlítására 9 db egyhektáros területen folyt a termesztés kísérlet, ahol 3 fatát kívántak összehasonlítan Az alább terméseredmények születtek z alapán vzsgáluk meg, hogy van-e különbség a faták termése között? Fata Termés t/ha I 6, 4,8 3,9 II 5,7 5,9 7,1 III 4, 6,9 5,3 Megoldás Az átlagtermések az egyes fatáknál: 1 4, 8; 6, 3; 3 5, 4 A teles átlag: 5, 5 3

Az alapadatok felbontása aráthné (1996) alapán: alapadat 6,1 4,6 3,7 5,7 6,1 7,1 4, 6,7 5,3 teles átlag összes eltérés 0,6 0,9 1,8 0, 0,6 1,6 1,3 1, 0, szsztematkus eltérés 0,7 0,7 0,7 0,8 0,8 0,8 0,1 0,1 0,1 véletlen eltérés 1,3 0, 1,1 0,6 0, 0,8 1, 1,3 0,1 A varancaanalízs táblázat: Tényező Kezelés Szabadság fok Négyzetösszeg Korrgált (DF) () szórásnégyzet () k-1 3,4 1,71 Véletlen n-k 6 W 7,1 W 1,19 hatás Összes n-1 8 T 10,54 F 1,44 W és 6 szabadság fokokkal A táblázatban szereplő értékek kszámítás móda: ( ) 0,6 ( 0,9) ( 0,) 10, 54 ( ) 3 ( 0,7) 3 0,8 3 ( 0,1) 3, 4 T, r, W T 7,1, 3,4 1,71, k 1 W 7,1 W 1,19 n k 6 Az F táblázatbel érték 95%-os megbízhatóság sznten és 6 szabadság foknál: 4,14 Példánkban 1,44 < 4,14, tehát a nullhpotézst elfogadhatuk, azaz a termések nem különböznek szgnfkánsan egymástól Példa: gy mnőségellenőrzés kísérletben különböző típusú elemek élettartamát vzsgálták Mnden típusú elemből 5-5 darabot választottak k Az élettartam órában van megadva a következő táblázatban Vzsgáluk meg, hogy van-e szgnfkáns különbség a különböző típusú elemek élettartama között! 4

lemek típusa Élettartam (óra) A típus 18, 16, 19, 17, 18 típus 17, 17, 15, 16, 17 C típus 19, 18, 19, 0, 18 D típus 14, 15, 16, 17, 16 Megoldás: Számítsuk k a kezelés átlagokat és a teles átlagot! A 17,6 ; 16, 4 ; C 18, 8 ; D 15, 6 A teles átlag: 17, 1 bben a feladatban a kezelések száma k 4, a mntaelemek száma n 0 A varancaanalízs táblázat: Tényező Kezelés Szabadság fok Négyzetösszeg Korrgált (DF) () szórásnégyzet () k-1 3 9,4 9,8 Véletlen n-k 16 W 16,4 W 1,05 hatás Összes n-1 19 T 45,8 F 9,56 W 3 és 16 szabadság fokokkal A táblázatban szereplő értékek kszámítás móda: T ( ) ( 18 17,1) (16 17,1) ( 16 17,1) 45, 8, ( ) 5 (17,6 17,1) 5 ( 16,4 17,1) 5 ( 18,8 17,1) 5 ( 15,6 17,1) 9, 4 r W T 45,8 9,4 16,4, 9,4 9,8, k 1 3 W 16,4 W 1,05 n k 16, A feladathoz tartozó F krtkus érték 95%-os megbízhatóság sznten 3 és 16 szabadság fokoknál: 3,4 Példánkban 3,4 < 9,56, tehát a nullhpotézst elvetük, vagys a különböző márkáú elemek élettartama szgnfkánsan különbözk Középértékek többszörös összehasonlítása Amennyben szgnfkáns különbségek mutathatók k a kezelés hatására, vagys az alternatív hpotézs bzonyul gaznak, tovább kereshetük, hogy melyk sokaság átlaga tér el elentősen melyktől Azt a legnagyobb különbséget, amely még véletlenszerűen elentkezk szgnfkáns dfferencának nevezünk és SzD α vagy SzD P% -kal elölük Ha két kezelés átlagagának különbsége ( ) ksebb a szgnfkáns dfferencánál, akkor a különbség még a véletlennek, ha nagyobb, akkor pedg a szsztematkus hatásnak (kezeléseknek) tuladonítható (aráthné 1996) A szgnfkáns dfferenca tetszőleges megbízhatóság szntre megadható, de legnkább a 95%-os megbízhatóság sznt használatos 5

( nk ) W SzD % tα, ahol P ( nk ) r tα a Student-féle t-táblázatban az α/ szgnfkanca szntre vonatkozó érték n-k szabadság foknál, W a hbavaranca a varancaanalízs táblázatból, r a mntánként elemszám, P% a tévedés valószínűsége %-ban megadva Példa: Az előző feladatban elentős különbségek mutatkoztak a különböző márkáú elemek élettartama között Számítsuk k a szgnfkáns dfferencát Mely márkák között volt szgnfkáns különbség? Megoldás: 1,05 SzD t t,1 r r 5 A 17,6 ; 16, 4 ; C 18, 8 ; D 15, 6 Az alább táblázat az egyes kezelések átlagának különbségét mutata: P% α 0,05;16 1,36 ( nk ) Me: óra lemek típusa Az elem típusok átlagának különbségének abszolútértéke A és 1, A és C 1, A és D és C,4 és D 0,8 C és D 3, A táblázatból leolvasható, hogy a szgnfkáns dfferenca értékét meghaladó különbség három esetben mutatható k, tehát a véletlen hatásának tudható be az eltérés az A-, A-C, -D között, a típusokból eredő különbség adódk az A-D, -C valamnt a C-D esetek között Kéttényezős kísérletek Példa: Tegyük fel, hogy egy mezőgazdaság kísérletben 4 búzafata hektáronként terméshozamát vzsgálák meg, és mndegyk fatát 5 féle termőföldben termesztk Így összesen 0 parcellát használnak a kísérlethez A parcellákat blokkokba sorolák: 4 parcella kerül egy blokkba bben az esetben két osztályozásról beszélhetünk, hszen a hektáronként terméshozam eltérhet a termesztett búzafata és a blokkok (a különböző talaok eltérő termőképessége) matt eszélhetünk ebben az esetben kezelésről és blokkokról, de beszélhetünk egyszerűen első és másodk tényezőről 6

A kezelések száma lokkok 1 r 1 11 1 1r 1 1 r k k1 k kr k 1 r Matematka modell: µ α β e, ahol µ a sokaság közös várható értéke, α kezeléshatás, β blokkhatás, e a véletlen okozta eltérés α 0, β 0, e 0 Két ellenőrzendő nullhpotézsünk van: H 0 (1) : Mnden kezelés átlaga egyenlő (sorátlag) α 0; 1,,,k H 0 () : Mnden blokk átlaga egyenlő (oszlopátlag) β 0; 1,,,r A varancaanalízs táblázat az előzőhöz hasonló felépítésű: Tényező Kezelés lokk Véletlen hatás Összes Szabadság fok (DF) k-1 r-1 Négyzetösszeg () Korrgált szórásnégyzet () k 1 r ( ) C k ( ) C C r 1 (k-1)(r-1) T - - C ( k 1)( r 1) kr-1 T ( ) F, k-1 és (k-1)(r-1) szabadság fokokkal C, r-1 és (k-1)(r-1) szabadság fokokkal A kapott F értékeket a megfelelő táblázatbel értékekkel összehasonlítva hozhatuk meg döntésünket Példa: Négy cukorrépafata magát vetették el öt blokkba Mnden blokkot négy parcellára osztottak, és ezekhez véletlenszerűen rendelték hozzá a négy fata cukorrépát Határozza meg 5%-os szgnfkanca sznten, hogy statsztkalag kmutatható-e eltérés az egyes cukorrépafaták termésmennysége, vagy az egyes talaok (blokkok) között! A kapott terméseredményeket az alább táblázat tartalmazza q/területegységben mérve 7

Me: q/területegység I blokk II blokk III blokk IV blokk V blokk A fata 1 15 14 11 16 fata 15 19 18 16 17 C fata 10 1 15 1 11 D fata 14 11 1 16 14 Megoldás: Számítsuk k a sor és az oszlopátlagokat, valamnt a teles átlagot! Me: q/területegység I blokk II blokk III blokk IV blokk V blokk Sorátlagok A fata 1 15 14 11 16 13,6 fata 15 19 18 16 17 17 C fata 10 1 15 1 11 1 D fata 14 11 1 16 14 13,4 Oszlopátlagok 1,75 14,5 14,75 13,75 14,5 A teles átlag pedg 14 Készítsük el a varancaanalízs táblázatot! bben a feladatban: k 4, r 5 A több érték kszámítása a táblázat alatt szereplő formulák segítségével történt Tényező Kezelés lokk Véletlen hatás Szabadság fok (DF) k-1 3 r-1 4 (k-1)(r-1) 1 Összes kr-1 19 C Négyzetösszeg () ( ) r 67,6 ( ) k 10 T - - C 46,4 T ( ) 14 Korrgált szórásnégyzet (),53 k 1 C C,5 r 1 3,87 ( k 1)( r 1) F 5,83, 3 és 1 szabadság fokokkal C 0,65, 4 és 1 szabadság fokokkal T ( ) ( 1 14) (15 14) ( 14 14) 14, ( ) 5 (13,6 14) 5 ( 17 14) 5 ( 1 14) 5 ( 13,4 14) 67, 6 k ( ) 4 (1,75 14) 4 ( 14,5 14) 4 ( 14,5 14) 10, r C T C 14 67,6 10 46,4, 67,6,53, k 1 3 C 10 C,5, r 1 4 46,6 3,87, kr 1 1, 8

C,53 5,83, 3,87,5 0,65 3,87 A kezelés (cukorrépafaták) ellenőrzésére szolgáló F táblázatbel érték 95%-os megbízhatóság sznten 3 és 1 szabadság fokoknál: 3,49 Példánkban 3,49 < 5,83, tehát a nullhpotézst elvetük, a faták között szgnfkáns különbségek vannak Mvel a blokkhatás ellenőrzésénél 1-nél ksebb számot kaptunk az F-re, ez azt elent, hogy nncs elentős eltérés a blokkok (földterületek) között Kéttényezős kísérletek smétléssel Az előző példában mnden blokkhoz és kezeléshez csak egy adatot rendeltünk Gyakran több nformácóhoz uthatunk azzal, hogy megsmételük a kísérletet kkor több adat s tartozk egy-egy kezeléshez ll blokkhoz (Legyen most m adat blokkonként és kezelésenként) Matematka modell: l µ α β γ e l, ahol µ a sokaság közös várható értéke, α kezeléshatás, β blokkhatás, γ kezelés-blokk kölcsönhatás, e l a véletlen okozta eltérés (hba) α 0, β 0 γ 0 e l 0 Három ellenőrzendő nullhpotézsünk van: H 0 (1) : Mnden kezelés átlaga egyenlő (sorátlag) α 0; 1,,,k H 0 () : Mnden blokk átlaga egyenlő (oszlopátlag) β 0; 1,,,r H 0 (3) : Nncs kölcsönhatás a kezelések és a blokkok között γ 0; 1,,,k, 1,,,r A már ól smert varancaanalízs táblázat most egy úabb sorral bővült Tényező Kezelés lokk Szabadság fok (DF) k-1 r-1 Négyzetösszeg () Korrgált szórásnégyzet () rm ( ) k 1 Interakcó (k-1)(r-1) I Véletlen hatás Összes ) C km ( C, ( ) m kr(m-1) T - - C - I krm-1 T ( ) l l C r 1 I I ( k 1)( r 1) kr( m 1) F, k-1 és kr(m-1) szabadság fokokkal C, r-1 és kr(m-1) szabadság fokokkal I, (k-1)(r-1) és kr(m-1) szabadság fokokkal lőször a harmadk nullhpotézs telesülését ellenőrzzük le 9

Ha H (3) 0 -at elfogaduk, akkor nncs elentős kölcsönhatás a kezelések és a blokkok között Ha H (3) 0 -at elvetük, akkor arra következtetünk, hogy kölcsönhatás van a kezelések és a blokkok között, ekkor az F értékeket a táblázatban szereplő formula helyett és C módon s szokás I I számoln Példa: gy kísérletben négy csoport (brgád) öt gépsororon, 3 1 órán át termel, és mnden esetben megszámolák a hbás darabok számát Az eredményeket darabban megadva az alább táblázatban lehet megteknten Vzsgála meg 5%-os szgnfkanca sznten hogy van-e eltérés a csoportok, a géptípusok között, és hogy van-e kölcsönhatás az csoportok és a gépsorok között! Me: darab Csoportok Gépsorok I típus II típus III típus IV típus V típus A 18, 19, 1 19,, 3 0, 0, 19 17, 18, 0 16, 0, 0 16, 17, 16 17, 18, 18 19, 17, 16 18, 0, 19 18, 19, 18 C, 0, 3 1, 1, 0, 19, 1 3, 0, 0 19, 1, 0 D 0, 19, 1 18, 17, 1 19, 19, 18, 0, 19 17, 18, 1 Megoldás: Számítsuk k az egyes csoportokhoz (sorok) a gépsorokhoz (oszlopok), ezek metszetéhez (cellákhoz) tartozó átlagokat, valamnt a teles átlagot! Me: darab I típus II típus III típus IV típus V típus Sorátlagok A 19,33 1,33 19,67 18,33 18,67 19,47 16,33 17,66 17,33 19,00 18,33 17,73 C 1,66 1,33 0,00 1,00 0,00 0,80 D 0,00 18,67 18,67 0,33 18,67 19,7 Oszlopátlagok 19,33 19,75 18,9 19,67 18,9 (A dőlt betűs számok a 3-3 parcellához tartozó átlagokat elentk) A teles átlag pedg 19, 3 Készítsük el a varancaanalízs táblázatot! bben a feladatban: k 4, r 5 és m 3 A több érték kszámítása a táblázat alatt szereplő formulák segítségével történt 10

Tényező Kezelés lokk Szabadság fok (DF) k-1 3 r-1 4 Négyzetösszeg () ) rm ( 70,98 ) C km ( 4,77 Korrgált szórásnégyzet () 3,66 k 1 C C 1,19 r 1 Interakcó (k-1)(r-1) 1 I I m (, k 1 r 1 36,43 3,04 Véletlen kr(m-1) 40 T - - C - I hatás 80,79 Összes krm-1 59 T ( ) l l 19,98 I ( )( ) kr ( m 1),0 F 11,7, 3 és 40 szabadság fokokkal C 0,59, 4 és 40 szabadság fokokkal I 1,5, 1 és 40 szabadság fokokkal C T ( ) ( 18 19,3) (19 19,3) ( 119,3) 19, 98, ( ) 15 (19,47 19,3) 15 ( 17,73 19,3) 15 ( 19,7 19,3) 70, 98 ( ) 1 (19,33 19,3) 1 ( 19,75 19,3) 1 ( 18,9 19,3) 4, 77 m ( ) 3 ( 19,33 19,47 19,33 19,3) r m k m 3 I, ( 1,33 19,47 19,75 19,3) 3 ( 18,67 19,7 18,9 19,3) 36,43, T - - C - I 19,98 70,98 4,77 36,43 80,79, 7,98 3,66, k 1 3 C 4,77 C 1,19, r 1 4 I 36,43 I 3,04, ( k 1)( r 1) 1 80,79,0, kr( m 1) 40 3,66 11,71,,0 C 1,19 0,59,,0 I 3,04 1,5,0 lőször a kezelés és a blokkhatás kölcsönhatását vzsgáluk meg Az ehhez tartozó F krtkus érték 95%-os megbízhatóság sznten 1 és 40 szabadság fokoknál:,00 Számításunkban F számított 1,5 bből azt a következtetést vonhatuk le, hogy nem mutatkozott kölcsönhatás a csoportok és a géptípusok között A kezelés (csoportok) ellenőrzésére szolgáló F krtkus érték 95%-os megbízhatóság sznten 3 és 40 szabadság fokoknál:,61 Példánkban,61 < 11,71, tehát a nullhpotézst elvetük, a csoportok között szgnfkáns különbségek mutatkoznak Végül a blokkhatást vzsgáluk meg,, 11

Mvel a blokkhatásnál az F-re 1-nél ksebb számot kaptunk, ez azt elent, hogy nncs elentős eltérés a blokkok (géptípusok) között setelemzés az SP használatával A gepsav fleban négy különböző típusú, összesen 80 db gépkocs üzemanyag fogyasztás adata találhatók Vzsgála meg, hogy befolyásola-e az üzemanyag fogyasztás mértékét a gépkocs típusa Megoldás: A gépárművek típusa négyféle volt: Ford, Opel, Suzuk, Toyota Az előző feladatokban egy- lletve kétmntás t-próba segítségével oldottuk meg a problémát Az összehasonlításokhoz használhatnánk tt s kétmntás t-próbát, de ly módon csak párokat tudunk összehasonlítan Négy mnta esetén hat páronként összehasonlítás kellene végrehatan bben az esetben célszerű alkalmazn az egytényezős varancaanalízst A menüből az ANALYZ / COMPA MANS / ON-WAY ANOVA párbeszédablakot válasszuk k Az ábrán látható módon a függő változónak a fogyaszt (fogyasztást), faktornak pedg a gtp-et (gépármű típust) elölük meg Érdemes még az OPTIONS alpontban a DSCIPTIVS szolgáltatásaval éln, ahol leíró statsztka segítségével egy általános táékoztatást kapunk 1

Descrptves Fogyasztás (l/100km) N Mean Std Devaton Std rror 95% Confdence Interval for Mean Mnmum Maxmum Lower ound Upper ound Ford 0 619 09 047 610 69 6 7 Toyota 0 571 16 048 560 581 5 6 Opel 0 641 51 056 69 653 6 7 Suzuk 0 564 181 041 555 57 5 6 Total 80 599 391 044 590 607 5 7 Az átlagos üzemanyag fogyasztás (Mean) 5,99 l/100 km Az átlagosan legksebb fogyasztású autók a Suzuk gépkocsk, a legnagyobbak az Opelek ANOVA Fogyasztás (l/100km) Sum of Squares df Mean Square F Sg etween Groups 851 3 837 60874 000 Wthn Groups 354 76 047 Total 1055 79 A kapott táblázat az úgynevezett varancaanalízs táblázat Az utolsó oszlopban található 0,000 emprkus szgnfkanca mutata (Sg), hogy elentős különbségek vannak a gépárművek között az üzemanyag fogyasztás tekntetében Ha azt s szeretnénk megtudn, hogy pontosan mely típusok között van szgnfkáns különbség, akkor az ANALYZ / COMPA MANS / ON-WAY ANOVA párbeszédablakon belül a POST HOC gombra kattntva a többszörös összehasonlításhoz használt teszteket találuk meg zek közül a Tukey módszert aánluk, mert a felsoroltak közül ez a legszgorúbb, és háromnál több csoportra már alkalmazható 13

Multple Comparsons Dependent Varable: Fogyasztás (l/100km) Tukey HSD Mean Dfference (I-J) Std rror Sg 95% Confdence Interval (I) Gépármű típus (J) Gépármű típus Lower ound Upper ound Ford Toyota 49 068 000 31 67 Opel - 068 01-39 -04 Suzuk 56 068 000 38 74 Toyota Ford -49 068 000-67 -31 Opel -70 068 000-88 -53 Suzuk 07 068 735-11 5 Opel Ford 068 01 04 39 Toyota 70 068 000 53 88 Suzuk 77 068 000 60 95 Suzuk Ford -56 068 000-74 -38 Toyota -07 068 735-5 11 Opel -77 068 000-95 -60 The mean dfference s sgnfcant at the 05 level A Post Hoc teszt eredmény táblázatában felsorolásra kerül mnden lehetséges párosítás A harmadk oszlopban az átlagok között különbség van feltüntetve Csllaggal azok a párosítások vannak megelölve, ahol a szgnfkanca sznt 0,05 alatt, vagys ahol elentős különbség mutatkozk a csoportátlagok között setünkben csak a Suzuk Toyota párosításnál nncs csllag, közöttük nncs számottevő különbség, az összes több típusra ugyanez már nem mondható el Legkfeezettebb az eltérés a Suzuk és az Opel között A következő táblázatban a gépármű típusokat csoportokba sorolva láthatuk Fogyasztás (l/100km) Tukey HSD N Subset for alpha 05 Gépármű típus 1 3 Suzuk 0 564 Toyota 0 571 Ford 0 619 Opel 0 641 Sg 735 1000 1000 Means for groups n homogeneous subsets are dsplayed a Uses Harmonc Mean Sample Sze 0000 zek szernt a apán gépkocsk (Toyota, Suzuk) egy kategórába sorolhatók üzemanyag fogyasztás tekntetében Külön csoportba került a Ford, és megnt külön csoportba az Opel Most nézzük meg, van-e különbség a fogyasztásban eltérő gumabroncsot használva! Az elárás megegyezk az előzőekben leírtakkal, csak az ANALYZ / COMPA MANS / ON-WAY ANOVA párbeszédablakon belül a faktor a gépármű típus helyett a gumtp (gumabroncs típusa) lesz, a függő változó továbbra s a fogyasztás marad 14

Descrptves Fogyasztás (l/100km) N Mean Std Std 95% Confdence Mnmum Maxmum Devaton rror Interval for Mean Lower ound Upper ound Mcheln 0 603 375 084 586 61 6 7 Matador 0 63 377 084 605 640 6 7 Frestone 0 593 333 074 577 609 6 7 Goodyear 0 576 346 077 559 59 5 6 Total 80 599 391 044 590 607 5 7 ANOVA Fogyasztás (l/100km) Sum of Squares df Mean Square F Sg etween Groups 30 3 773 6039 001 Wthn Groups 9735 76 18 Total 1055 79 A leíró statsztka részben olvasható, hogy mnden gumtípushoz 0-0 fogyasztás adatunk van Átlagosan a legksebb fogyasztást a Goodyear-nél találuk (5,76 l/100 km), a legnagyobbat pedg a Matadornál (6,3 l/100 km) A varanca táblázat alapán láthatuk, hogy az abroncsok s befolyásolák az üzemanyag fogyasztás mértékét, hszen a szgnfkanca oszlopban 0,001-et látunk és az ksebb 0,05-nál Multple Comparsons Dependent Varable: Fogyasztás (l/100km) Tukey HSD Mean Dfference Std rror Sg 95% Confdence Interval (I-J) (I) Gum típus (J) Gum típus Lower ound Upper ound Mcheln Matador -19 113 34-49 11 Frestone 10 113 790-19 40 Goodyear 8 113 07-0 58 Matador Mcheln 19 113 34-11 49 Frestone 9 113 053 00 59 Goodyear 47 113 000 17 77 Frestone Mcheln -10 113 790-40 19 Matador -9 113 053-59 00 Goodyear 17 113 415-1 47 Goodyear Mcheln -8 113 07-58 0 Matador -47 113 000-77 -17 Frestone -17 113 415-47 1 The mean dfference s sgnfcant at the 05 level 15

A többszörös összehasonlítás során vlágossá válk, hogy szgnfkáns különbség csak a Goodyear és a Matador márka között van Az összes többnél a szgnfkanca oszlopban 0,05-nál nagyobb értékeket találunk zt erősít meg a következő táblázat s Fogyasztás (l/100km) Tukey HSD N Subset for alpha 05 Gum típus 1 Goodyear 0 576 Frestone 0 593 593 Mcheln 0 603 603 Matador 0 63 Sg 07 053 Means for groups n homogeneous subsets are dsplayed a Uses Harmonc Mean Sample Sze 0000 A csoportokba sorolásnál két kategórát készített a program, de ezek között most átfedés fgyelhető meg Az egykbe tartozk a Goodyear, a Frestone és a Mcheln, a másk kategórába a Frestone, a Mcheln és a Matador z tehát azt elent, hogy fogyasztás paraméteret tekntve ezek a típusok közel állnak egymáshoz, a Frestone és a Mcheln egyaránt teknthető a felső kategóra alsó szélének, vagy az alsó kategóra felső részének A gépkocsk típusa és a gumabroncs mnősége egyaránt befolyásola tehát az üzemanyag fogyasztást zen kívül még kölcsönhatás s előfordulhat közöttük, hszen elképzelhető, hogy Goodyear gumabroncs eltérő egy Ford vagy egy Suzuk gépkocsn A kérdés megválaszolására a kéttényezős varancaanalízst alkalmazhatuk A szokásos elnevezéseket használva blokkoknak teknthetük a gépkocsk típusát, kezeléseknek pedg az egyes gumabroncs márkákat A kéttényezős varancaanalízs lefuttatásához az ANALYZ / GNAL LINA MODL / UNIVAIAT pontát kell lefuttatn A változókat az ábrán látható módon helyezzük el Függő változó a fogyaszt (fogyasztás), fx hatásokhoz a gtp és a gumtp (gépármű típus és gum típus) kerülnek 16

Az OK gomb lenyomása után az output részben az alább táblázatot kapuk Tests of etween-subects ffects Dependent Varable: Fogyasztás (l/100km) Source Type III Sum of Squares df Mean Square F Sg Corrected Model 10879 15 75 39470 000 Intercept 866815 1 866815 156017150 000 GJTIP 851 3 837 15440 000 GUMITIP 30 3 773 4093 000 GJTIP GUMITIP 461-0 9 515-03 79 978 rror 1176 64 1838-0 Total 878870 80 Corrected Total 1055 79 a Squared 90 (Adusted Squared 880) A varancaanalízs táblázat gtp és gumtp (gépármű típusa és gumabroncs típusa) sorában látható 0,000 emprkus szgnfkanca érték ugyanazt mutata, mnt az előzőekben kapott eredmények, mvel az egytényezős varancaanalízs számítások során már megbzonyosodtunk arról, hogy a gépkocs típusok között s és a gumabroncs típusok között s szgnfkáns eltérés mutatkozk az üzemanyag fogyasztást tekntve A gépkocs gumabroncs kölcsönhatásra vonatkozk a gtpgumtp sor A szgnfkanca oszlopban a sorhoz tartozó P érték 0,978, így bztosak lehetünk benne, hogy nncs kölcsönhatás közöttük A gépkocs típusa és a gumabroncs típusa külön-külön hatnak az üzemanyag fogyasztásra A táblázat alatt látható Squared vagys négyzet értékre érdemes még fgyeln, amelyet magyarázó erőnek szoktak nevezn Értéke 0 és 1 közé eshet, mnél közelebb van az egyhez, annál obban lleszkedk a modell az adott problémára A 0,9-es érték ónak mondható, úgy s fogalmazhatuk, hogy az autók fogyasztásának varancáát 90%-ban az autó és a gumabroncs típusa határozza meg Irodalomegyzék aráth Cs Ittzés A Ugrósdy Gy: ometra Mezőgazda Kadó 1996 Kss A Manczel J Pntér L Varga K: Statsztka módszerek alkalmazása a mezőgazdaságban Mezőgazdaság Kadó 1983 Kovács István: Statsztka Szent István gyetem Gazdálkodás és Mezőgazdaság Főskola Kar egyzete Gyöngyös 000 Krszt Varga Kenyeres: Általános statsztka II Nemzet tankönyvkadó 1997 Fodor János: omatematka http://wwwunvethu/users/fodor/ndex_hhtml Meszéna György Zermann Margt: Valószínűségelmélet és matematka statsztka Közgazdaság és Jog Könyvkadó 1981 Murray Spegel: Statsztka lmélet és gyakorlat Panem McGraw Hll 1995 Szűcs István: Alkalmazott statsztka Agronform Kadó 00 Vargha András: Matematka statsztka pszchológa, nyelvészet és bológa alkalmazásokkal Pólya Kadó 17