y ij = µ + α i + e ij

Hasonló dokumentumok
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Kettőnél több csoport vizsgálata. Makara B. Gábor

2012. április 18. Varianciaanaĺızis

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Varianciaanalízis 4/24/12

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Variancia-analízis (folytatás)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis vizsgálatok

Statisztika elméleti összefoglaló

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria

Több valószínűségi változó együttes eloszlása, korreláció

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Bevezetés a hipotézisvizsgálatokba

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

6. Előadás. Vereb György, DE OEC BSI, október 12.

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Adatok statisztikai értékelésének főbb lehetőségei

Kísérlettervezés alapfogalmak

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika Összefoglalás

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biostatisztika Összefoglalás

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Többváltozós lineáris regressziós modell feltételeinek

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Populációbecslések és monitoring

Segítség az outputok értelmezéséhez

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslések és monitoring

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Statisztika Elıadások letölthetık a címrıl

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Eloszlás-független módszerek 13. elıadás ( lecke)

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Tantárgy: BEVEZETÉS A TUDOMÁNYOS KUTATÁS MÓD- SZERTANÁBA

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Mérési hibák

Nemparametrikus tesztek december 3.

y ij e ij STATISZTIKA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 12. Előad Variancia-anal Lineáris modell ltozó

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Korreláció és Regresszió

[Biomatematika 2] Orvosi biometria

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

IV. Változók és csoportok összehasonlítása

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

KÖVETKEZTETŐ STATISZTIKA

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Variancia-analízis (VA)

Kísérlettervezés alapfogalmak

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Az első számjegyek Benford törvénye

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószínűségi változók. Várható érték és szórás

ANOVA összefoglaló. Min múlik?

Biomatematika 2 Orvosi biometria

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Átírás:

Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai a független változók, a másik heterogenitás-rész pedig az, amelynek okait az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik. ahol: y ij Lineáris modell y ij = µ + α i + e ij a függő változó értéke µ a kísérlet főátlaga, fix hatás α i fix hatás, oka a független változó hiba, vagy eltérés e ij A variancia-analízis alkalmazásának feltételei a maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) a maradékok (hibák) normális eloszlású, nulla várható értékű sokaság a maradékok szórásai a kezeléskombinációk celláin belül egyformák Alapfogalmak 1. Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk. Alapfogalmak 2. Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll. Interakció: Két változó kapcsolatában akkor áll fenn interakció (kölcsönhatás), ha változó hatása függ az változó szintjétől és fordítva. 1

Alapfogalmak 3. Egy szempontos variancia-analízis: Varianciaanalízis, ahol csak egy faktor van. Több szempontos variancia-analízis: Varianciaanalízis, ahol kettő vagy több faktor van. Egyváltozós variancia-analízis: ANOVA technika, amely egy függő változót használ. n: az adatok száma k: csoportok száma r: ismétlések száma Csoport átlag: Jelölések Többváltozós variancia-analízis: ANOVA technika, amely kettő vagy több függő változót használ. Egytényezős variancia-analízis H 0 Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat. A nullhipotézis, hogy az átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára. Variancia-analízis lépései 1. A variancia-analízis modell felállítása. 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása, az F- próba. 4. A modell érvényességének ellenőrzése. 5. Amennyiben az F-próba szignifikáns, középértékek többszörös összehasonlítása. 1. A modell felállítása A modellben a mérési, megfigyelési értékeket összegként képzeljük el. Kísérleti elrendezésnek megfelelő modellalkotás 2

Lineáris modell y ij = µ + α i + e ij Példa Egy termesztő k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a 4 fajta termesztése esetén azonos terméseredményre számíthatunk-e. ahol: y ij a függő változó értéke µ a kísérlet főátlaga, fix hatás α i fix hatás, oka a független változó, faktor hiba, vagy eltérés e ij 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása Leggyakrabban 0,05 azaz 5% Lehet: 0,1; 1; 5 és 10% Elméletileg bármilyen értéket választhatunk, ha szakmailag meg tudjuk indokolni. Eredménytáblázat (Excel) Eltérés négyzetösszegek (SS) Csoportok között: csoportátlagok eltérés négyzetösszege * r Csoporton belül: csoportok eltérés négyzetösszegeinek összege Összes: alapadatok eltérés négyzetösszege 3

Szabadságfokok (df) Varianciák Csoportok között: k-1 Csoporton belül: n-k Összes: n-1 Az eltérés négyzetösszegek osztva a szabadságfokokkal. SS csk /3 SS csb /8 SS össz /11 F-próba 4

Mi annak a valószínűsége? Véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F- eloszlás esetén. P=0,00089 Mikor szignifikáns az F-próba? Ha létezik legalább egy szignifikáns kontraszt a csoportok között. Post hoc analízisek Középérték összehasonlító tesztek 5. Az F-próba szignifikáns Post hoc analízisek Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: előzetes, un. a priori kontrasztok és az analízis után elvégezhető, un. post hoc analízisek A csoportok szórása megegyezik LSD Bonferroni Student-Newman-Keuls Tukey Duncan Dunett Scheffe A csoportok szórása különbözik Tamhane 5

Szimultán döntés Ha kettőnél több összehasonlítandó minta van. Olyan állításokat fogalmaznak meg, amelyek egyidejűleg érvényesek. Ezek lehetnek: Egyidejűleg érvényes konfidencia intervallumok vagy Szimultán végzett statisztikai próbák. LSD-teszt (legkisebb szignifikáns differencia) Alkalmazhatóság feltételei: 1. A csoportok szórása egyenlő 2. α: páronkénti összehasonlításra vonatkozik 3. Véletlenszerűen kiválasztott két csoport összehasonlítására jó William Saely Gosset angol statisztikus (1876-1937) Sir Ronald Aylmer Fisher angol statisztikus (1890-1962) A pontosság fokozása a kísérlet pontosabb kivitelezésével az ismétlésszám növelésével a parcellák csoportosításával, blokkképzéssel Randomizáció Torzítás az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés (Sváb, 1981) 6

Hipotézisek Példa H 0 : A különböző kefirek átlagos fogyasztói ára megegyezik. Szignifikancia szint megválasztása Adatok 5% H 1 : A különböző kefirek átlagos fogyasztói ára nem egyezik meg. Modell felállítása Egytényezős teljesen véletlen elrendezés Számítás 1. Adatbázis rendezése, szűrése Egytényezős variancia-analízis 7

Egytényezős variancia-analízis Eredménytáblázat 1. Eredménytáblázat 2. 8

LSD-teszt (legkisebb szignifikáns differencia) Páronkénti összehasonlítás *** 0,1% ** 1% * 5%. vagy + 10% Jelölések 9