y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

Hasonló dokumentumok
y ij = µ + α i + e ij

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

y ij e ij STATISZTIKA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 12. Előad Variancia-anal Lineáris modell ltozó

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hipotézis vizsgálatok

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Varianciaanalízis 4/24/12

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

[Biomatematika 2] Orvosi biometria

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

2012. április 18. Varianciaanaĺızis

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Bevezetés a hipotézisvizsgálatokba

Hipotézis vizsgálatok

SPSS ÉS STATISZTIKAI ALAPOK II.

Statisztika elméleti összefoglaló

Statisztika II. feladatok

Statisztikai szoftverek esszé

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Több valószínűségi változó együttes eloszlása, korreláció

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

MÓDSZERTANI ESETTANULMÁNY. isk_4kat végzettségek négy katban. Frequency Percent Valid Percent. Valid 1 legfeljebb 8 osztály ,2 43,7 43,7

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Biostatisztika Összefoglalás

Variancia-analízis (folytatás)

Többváltozós lineáris regressziós modell feltételeinek

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Biostatisztika Összefoglalás

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

BIOMETRIA_ANOVA_2 1 1

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

KISTERV2_ANOVA_

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Biostatisztika VIII. Mátyus László. 19 October

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Normális eloszlás tesztje

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Diszkriminancia-analízis

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kutatásmódszertan és prezentációkészítés

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Segítség az outputok értelmezéséhez

STATISZTIKA. rgykód. beosztás. Oktatók. Időbeoszt. Tematika. 1. előadás MTB Szeptember 15. November 28.

Korreláció és lineáris regresszió

Normál eloszlás. Gyakori statisztikák

Adatok statisztikai értékelésének főbb lehetőségei

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Az első számjegyek Benford törvénye

Esetelemzés az SPSS használatával

Nemparaméteres próbák

Logisztikus regresszió október 27.

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Informatikai ismeretek vizsgálata a 8. osztály végén. Kiss Gábor Óbudai Egyetem kiss.gabor@bgk.uni-obuda.hu

Sztochasztikus kapcsolatok

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Esetelemzések az SPSS használatával

Variancia-analízis (VA)

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Többváltozós Regresszió-számítás

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Átírás:

Elmélet let BIOMETRIA 7. Előad adás Variancia-anal Lineáris modellek A magyarázat a függf ggő változó teljes heterogenitásának nak két k t részre r bontását t jelenti. A teljes heterogenitás s egyik része r az, amelynek okai a független f ltozók, a másik m heterogenitás-rész sz pedig az, amelynek okait az egyéb, általunk nem vizsgált tényezt nyezők k tartalmazzák. Ez utóbbit sokszor a véletlen v hatásak saként, hibaként is emlegetik. ahol: y ij Lineáris modell y ij = µ + α i + e ij a függf ggő változó értéke µ a kísérlet k főátlaga, f fi hatás α i fi hatás, oka a független f ltozó hiba, vagy eltérés e ij A variancia-anal alkalmazásának feltételei telei a maradék k független f a kezelés és s blokk hatást stól valamint a függf ggő változótól l (véletlen mintavételez telezés, kísérleti k elrendezés) a maradékok (hibák) normális eloszlású,, nulla várható értékű sokaság a maradékok szórásai sai a kezeléskombin skombinációk celláin belül l egyformák Alapfogalmak. Faktor: a vizsgálatba bevont független f ltozókat, pl. különbk nböző kezeléseket, tényezt nyezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és s kvantitatív v faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, v, ellenkező esetben kvantitatív faktorokról l beszélünk. Alapfogalmak. Kezelések (cellák) k): : Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből l előáll lló kombináci ciók k a kezelések. Pl. amikor a faktor műtrm trágyaadagok és öntözési módok, akkor a kezelések a (műtr trágyaadagok, öntözési módok) m összes lehetséges kombináci ciójából áll. Interakció: : Két K t ltozó kapcsolatában akkor áll fenn interakció (kölcs lcsönhatás), ha ltozó hatása függ f az ltozó szintjétől és s fordítva.

Alapfogalmak 3. Egy szempontos variancia-anal : Variancia- zis,, ahol csak egy faktor van. Több szempontos variancia-anal : Variancia- zis,, ahol kettő vagy több t faktor van. Egyváltoz ltozós s variancia-anal : : ANOVA technika, amely egy függf ggő változót t használ. Többváltozós s variancia-anal : : ANOVA technika, amely kettő vagy több t függf ggő változót t használ. Jelölések n: az adatok száma k: csoportok száma r: ismétl tlések száma Csoport átlag: k Egytényez nyezős s variancia-anal H 0 Segíts tségével egy tényezt nyező hatását t lehet vizsgálni a függf ggő változó mennyiségi alakulására. A tényezt nyező,, faktor valamilyen csoportképz pző ismérvvel rendelkezik, a függő változó pedig legtöbbsz bbször r skála típusú adat. A nullhipotézis zis,, hogy az átlagok egyenlők, nincs közöttük k különbsk nbség. Ez a technika a kétmintk tmintás t-teszt teszt általánosítása, sa, kiterjesztése se több t mintára. = K = k Variancia-anal lépéseil. A variancia-anal modell feláll llítása.. Szignifikancia-szint megválaszt lasztásasa 3. A variancia-anal kiszámítása, sa, az F-F próba. 4. A modell érvényességének nek ellenőrz rzése. 5. Amennyiben az F-prF próba szignifikáns, ns, középértékek többszt bbszörös összehasonlítása. sa.. A modell feláll llítása A modellben a mérési, m megfigyelési értékeket összegként képzeljk pzeljük k el. Kísérleti elrendezésnek megfelelő modellalkotás

ahol: y ij Lineáris modell µ a k α i e ij y ij = µ + α i + e ij a függf ggő változó értéke a kísérlet főátlaga, f fi hatás fi hatás, oka a független f ltozó,, faktor hiba, vagy eltérés Példa Egy termesztő k kukorica hibrid termesztése se között k választhat. Jelölj ljük k a fajtákat A, B, C, D-vel. D Döntsük k el, hogy a 4 fajta termesztése se esetén azonos terméseredm seredményre számíthatunk thatunk-e. Fajta Termés (t/ha) A 9,3 7, 8, B 5,4 7, 5,9 C 4,5,9 5,0 D 3,5 0,9,5. Szignifikancia-szint megválaszt lasztásasa 3. A variancia-anal kiszámítása sa Leggyakrabban 0,05 azaz 5% Lehet: 0,; ; 5 és s 0% ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Variancia A 3 4,7 8,33333,03333333 B 3 8,4 6,33333 0,763333333 C 3,4 4,33333,03333333 D 3 6,9,3,7 Elméletileg letileg bármilyen b értéket választhatunk, v ha szakmailag meg tudjuk indokolni. Eredményt nytáblázat Eltérés s négyzetn gyzetösszegek (SS) Tényezők SS df MS F Csoportok között 58,86 3 9,6 6,38 Csoporton belül 9,58 8,975 Összesen 68,44 Csoportok között: k csoportátlagok tlagok eltérés négyzetösszege * r Csoporton belül: l: csoportok eltérés négyzetösszegeinek összege Összes: alapadatok eltérés s négyzetn gyzetösszege 3

Szabadságfokok (df( df) Varianciák Csoportok között: k k-k Az eltérés s négyzetn gyzetösszegek osztva a szabadságfokokkal. Csoporton belül: l: n-k SS csk /3 Összes: n-n SS csb /8 SS össz ssz/ F = F-próba MS MS csk error df(, df = DF, df = DF, ncp = 0) 0.0 0. 0. 0.3 0.4 0.5 0.6 0.7 4.07 0 4 6 8 pf(, df = DF, df = DF, ncp = 0, lower.tail = TRUE) 0.0 0. 0.4 0.6 0.8.0 4.07 0 4 6 8 df(, df = DF, df = DF, ncp = 0) 0.0 0. 0. 0.3 0.4 0.5 0.6 0.7 4.07 0 5 0 5 6.38 4

pf(, df = DF, df = DF, ncp = 0, lower.tail = TRUE) 0.0 0. 0.4 0.6 0.8.0 Mi 4.07 6.38 annak a valósz színűsége? 0 5 0 5 Véletlenül l 6,38 F-értF rtéknél l nagyobbat kapunk egy 3, 8 szabadságfok gfokú F- eloszlás s esetén. P=0,00089 Mikor szignifikáns ns az F-prF próba? 4. A modell érvényességének nek ellenőrz rzése Ha létezik l legalább egy szignifikáns ns kontraszt a csoportok között. k. Függetlenség. Normális eloszlás 3. Azonos varianciák A maradék k független f a kezelés és s blokk hatást stól valamint a függf ggő változótól l (véletlen mintavételez telezés, kísérleti k elrendezés) Vizsgálat: Maradékok leíró statisztikája kezelések szerint a maradékok ábrázolása a megfigyelt és becsült értékek függvf ggvényében Maradékok leíró statisztikája Residual for termes Case Summaries hibrid N Mean Variance A 3,0000,03 B 3,0000,763 C 3,0000,03 D 3,0000,70 Total,0000,87 5

Maradékok és s a megfigyelt értékek közötti függetlensf ggetlenség Maradékok és s a becsült értéket közötti függetlensf ggetlenség R e s i d u a l f o r t e r m e s,5 0,0 0 0,50 0,00-0,50 R e s i d u a l f o r t e r m e s,5 0,0 0 0,50 0,00-0,5 0 -,00 -,0 0 -,50 -,5 0 0,0 0,0 0 4,00 term es 6,00 8,00 0,0 0,00 3,00 4,0 0 5,0 0 6,00 7,0 0 Predicted Value for termes 8,00 9,00 Maradék k normális eloszlású,, nulla várható értékű Hisztogram 3,0 Grafikus normalitás s vizsgálat Hisztogram Q-Q plot Numerikus normalitás s vizsgálat Kolmogorov-Smirnov Shapiro-Wilk F r e q u e n c y,5,0,5,0 0,5 0,0 Mean =,3878E -7 Std. Dev. = 0,9333 N = -,50 -,00-0,50 0,00 0,50,00,50 Residual for termes Q-Q ábra Kolmogorov-Smirnov teszt E p e c t e d N o r m a l V a lu e Normal Q -Q Plot of Residual for termes 0 - - - - 0 Observed Value One-Sample Kolmogorov-Smirnov Test Residual for termes N Normal Mean,0000 Parameters(a,b) Std. Deviation,9333 Most Etreme Absolute,57 Differences Positive,7 Negative -,57 Kolmogorov-Smirnov Z,543 Asymp. Sig. (-tailed),99 a Test distribution is Normal. b Calculated from data. 6

Mintán n belüli li szórás s azonosság tesztelése se Levene-teszt H 0 a szórások sok megegyeznek Test of Homogeneity of Variances termés t/ha Levene Statistic df df Sig. 5.07 4.007 Amennyiben a Levene-teszt szignifikáns ns Robusztus tesztek alkalmazása Welch-tesz Brown-Forsythe Robusztus tesztek Robust Tests of Equality of Means termes Statistic(a ) df df Sig. Welch,34 3 4,404,06 Brown-Forsythe 6,384 3 7,394,00 a Asymptotically F distributed. 7