Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Hasonló dokumentumok
Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Biomatematika 13. Varianciaanaĺızis (ANOVA)

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hipotézis vizsgálatok

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Hipotézis vizsgálatok

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

2012. április 18. Varianciaanaĺızis

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Biostatisztika VIII. Mátyus László. 19 October

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Bevezetés a hipotézisvizsgálatokba

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Variancia-analízis (folytatás)

Varianciaanalízis 4/24/12

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

[Biomatematika 2] Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Biostatisztika Összefoglalás

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Nemparametrikus tesztek december 3.

Többváltozós lineáris regressziós modell feltételeinek

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Biostatisztika Összefoglalás

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Több valószínűségi változó együttes eloszlása, korreláció

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Statisztika elméleti összefoglaló

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Variancia-analízis (VA)

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Kísérlettervezés alapfogalmak

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Eloszlás-független módszerek 13. elıadás ( lecke)

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

IV. Változók és csoportok összehasonlítása

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Az első számjegyek Benford törvénye

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Valószínűségi változók. Várható érték és szórás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria gyakorló feladatok BsC hallgatók számára

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Korreláció és lineáris regresszió

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Statisztikai módszerek 7. gyakorlat

KÖVETKEZTETŐ STATISZTIKA

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

egyetemi jegyzet Meskó Balázs

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

[Biomatematika 2] Orvosi biometria

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

A konfidencia intervallum képlete: x± t( α /2, df )

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

A solti kísérleti terület talajvizsgálati eredményei. Vizsgálat típusa: Bővített talajvizsgálat (H2) P 2 O 5 K 2 O Na Mg NO 2- NO 3 - N

A kísérleti terület talajvizsgálati eredményei, Solum Zrt, Komárom (adatok: UIS Ungarn Kft. vizsgálati eredményei)

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Átírás:

Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre

Varianciaanalízis

A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk össze Alkalmazásával eldönthetjük, hogy a minták közötti különbséget az általunk előidézett tényező hozta-e létre, vagy a véletlennek köszönhető

Alkalmazásának feltételei: -mennyiségi ismérv, -a véletlen biztosítása a minták kiválasztásánál illetve a kísérlet elrendezésénél

Alkalmazási lehetőségek: a független és normális eloszlású valószínűségi változók additív tulajdonságából ered, azaz a valószínűségi változók általános szórásnégyzete egyenlő az egyes valószínűségi változók szórásnégyzetének összegével 2 2 2 2 S S1 + S2 + S3 + + 2... Sn A szórásnégyzetek összege a minták teljes varianciáját adja. Ismert, hogy: 2 2 2 S S B + S K azaz, az általános szórásnégyzet egyenlő a mintán belüli és minták közötti szórásnégyzetek összegével

A szórásnégyzet összetevőkre bontása Szórásnégyzet forrása Külső SQ k Négyzetösszeg SQ v j 1 nj ( Xj X ) 2 Szabadságfok Szf v-1 Szórásnégyzet S 2 (MQ) S 2 K SQ K v 1 Belső SQ v nj ( Xij ) B X j j 1 i 1 2 n-v S 2 B SQB n v Teljes SQ T v nj ( Xij X ) j 1 i 1 2 n-1

ahol : A szórásnégyzet összetevőkre bontása Xij-a j-edik csoport i-edik eleme x - a teljes minta átlaga x j - a j-edik csoport átlaga n- a teljes minta elemszáma v a csoportok száma (j1,2,,v) nj a j-edik csoport elemszáma (i1,2,, nj)

A külső szórás négyzet a kezelés hatásának tulajdonítható Annak eldöntésére, hogy a külső és a belső szórásnégyzet különböznek-e egymástól az F próbát alkalmazzuk F MQ MQ K ; ha F FP % B a nullhipotézist elvetjük,

azaz a külső szórásnégyzet szignifikánsan nagyobb a belső szórásnégyzetnél A vizsgált ismérv csoportonkénti értékei között P% szinten statisztikailag igazolható eltérések vannak SZD t P % p % 2MQ n j B nj a csoportonkénti megfigyelések száma

A kísérletek egyik célja a különböző kezelések hatásainak összehasonlítása Kezelés: a vizsgált jelenségre általunk előidézett ható tényező A varianciaanalízis megmutatja, hogy több minta esetén a kezelések eredményei szignifikánsak-e, vagy a minták közötti különbséget a véletlen okozza

Egytényezős kísérletek: egyetlen tényező különböző változatainak hatását hasonlítjuk össze Többtényezős kísérletek: egyidejűleg kettő vagy több tényező változatait és ezek kombinációit hasonlítjuk össze

Egytényezős, teljesen véletlen elrendezésű kísérlet az ismétlődésből nem képezünk blokkokat (pl. állatok) azonos elemszámú mintákat, illetve csoportokat hasonlítunk össze a kiválasztott minták középértékeit hasonlítjuk össze

Egy tanár 4 tanítási módszert próbál ki. Minden csoportba öt diák kerül. Ugyanazt a vizsgafeladatot oldják meg. A kapott pontok a következők Kezelések Ismétlés Me.: pont Kezelés összeg 1. 2. 3. 4. 5. V I. módszer 75 62 71 58 73 339 II. módszer 81 86 89 67 90 413 III. módszer 72 80 60 74 82 368 IV. módszer 68 70 73 55 64 330 Forrás: saját adatgyűjtés

Töltse ki a varianciatáblázatot! G x 75 + 62 +... + 64 1450 C G r 2 1450 2 105125 v 5 4

Az alapadatok négyzete 1. 2. 3. 4. 5. V 2 I. módszer 5625 3844 5041 3364 5329 114921 II. módszer 6561 7396 7921 4489 8100 170569 III. módszer 5184 6400 3600 5476 6724 135424 IV. módszer 4624 4900 5329 3025 4096 108900

x 2 107028 V 2 529814

A varianciatáblázat szerkezete Tényező SQ FG MQ SQ ö x 2 C n 1 Összes - Kezelés (csoportok között) SQ k V 2 C r v 1 SQ k v 1 Hiba (csoporton belül) SQ h SQ ö SQ k v ( r 1) SQ h v ( r 1)

A számítás menete SQ ö 2 x C 5625+ 3844 +... + 4096 105125 1903 SQ k 2 V C r 114921+ 170569 +... + 108900 5 105125 837,8 SQ MQ h k MQ h SQö SQk SQ v 1 k SQ h v ( r 1) 837,8 3 1065,2 16 1903 837,8 279,3 66,6 1065,2

Az alaptáblázat adataiból számított varianciaanalízis Tényező SQ FG MQ Összes 1903 19 - Kezelés 837,8 3 279,3 Hiba 1065,2 16 66,6

MQ k F MQh F p 5 % F F p 5% 3,24 279,3 66,6 4,19 a számláló Szf3, a nevező Szf16 tehát az egyes kezelések közötti különbség nem a véletlennek köszönthető

Számítsa ki a szignifikáns differenciát P 5% -os szignifikancia szinten t p 5 % 2,12 Szf16 SZD p 5% t p 5% 2MQ r h 2,12 2 66,6 5 133,2 SZD p 5 % 2,12 2,12 2,66 2,12 5,2 11 5

Eredménytáblázat Me.:pontszám Kezelés Tanítási módszerek átlagpontjai I. módszer 67,8 II. módszer 82,6 III. módszer 73,6 IV. módszer 66,0 SZD P5% 11,0 Ahol az átlagok közötti különbség nagyobb, mint az SZD p5%, ott az eltérő tanítási módszer eredménye ez a különbség

Egytényezős, véletlen blokk elrendezésű kísérlet kiértékelése előnyös kísérleti elrendezés bármilyen témakörben a blokkok száma az ismétlések számával azonos

Burgonya műtrágyázási kísérletben a különböző kálium adagok hatását vizsgálták egy adott fajta terméshozamára A kísérlet adatai Me.: t/ha Ismétlés Kezelés 1. 2. 3. 4. Kezelés összeg V Kontroll 30 21 15 30 96 I. adag 40 44 40 45 169 II. adag 46 51 43 52 192 III. adag 60 48 54 60 222 IV. adag 44 52 48 38 182 V. adag 45 53 61 55 214 Ismétlés összeg R 265 269 261 280 1075 Forrás: saját adatgyűjtés

Töltse ki a varianciatáblázatot G x 30 + 21+... + 55 1075 C G r 2 1075 2 v 4 6 48151

Az alapadatok négyzete 1. 2. 3. 4. V 2 Kontroll 900 441 225 900 9216 I. adag 1600 1936 1600 2025 28561 II. adag 2116 2601 1849 2704 36864 III. adag 3600 2304 2916 3600 49284 IV. adag 1936 2704 2304 1444 33124 V. adag 2025 2809 3721 3025 45796 R 2 70225 72361 68121 78400 1155625

x 2 51285 V 2 202845 R 2 289107

A kísérlet varianciatáblázatának szerkezete Tényező SQ FG MQ Összes x 2 C r v 1 - Ismétlés Kezelés R 2 C r 1 v V C r 1 2 SQ k v 1 - v ) Hiba SQ SQ SQ ( r 1) ( v 1) ö i k SQ h ( r 1) ( v 1

A számítás menete SQ ö SQ i 2 x C 2 R C v 51285 289107 6 48151 3134 48151 33,5 2 202845 V SQ K C 48151 2560,2 r 4 SQ SQ SQ SQ 3134 33,5 2560,2 h ö i K 540,3

A számítás menete MQ K v SQ K 1 2560,2 5 512 MQ h ( r SQ 1)( h v 1) 540,3 3 5 36

Az alaptáblázat adataiból számított varianciaanalízis Tényező SQ FG MQ Összes 3134,0 23 - Ismétlés 33,5 3 - Kezelés 2560,2 5 512 Hiba 540,3 15 36

F MQ K MQh 512 14,22 36 Az F-próba táblázatból FG v-1 azaz FG 5, illetve FG (r-1)(v-1) azaz FG15 szabadságfokoknál adott P%-nak megfelelő értéket keressük F P5% 2,9 mivel a számított F-érték nagyobb, mint a táblázatbeli F-érték, a kezelések P5% szinten szignifikáns különbséget okoznak

Számítsa ki a szignifikáns differenciát P5%-os szignifikancia szinten FG (r-1)(v-1) -nél és P5% -nál a t értéke t p5% 2,131 2MQ 2 36 SZD 5 % t h p p 5% 2,131 r 4 9

Eredménytáblázat Me.:t/ha Kezelés Termés átlag Kontroll 24,0 I. adag 42,3 II. adag 48,0 III. adag 55,5 IV. adag 45,5 V. adag 53,5 SZD P5% 9,0 Amely kezelések átlaga között nagyobb a különbség mint 9 t/ha, azok a kezelések szignifikánsan különböznek