Varianciaanalízis 4/24/12



Hasonló dokumentumok
[Biomatematika 2] Orvosi biometria. Visegrády Balázs

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij

IV. Változók és csoportok összehasonlítása

Hipotézis vizsgálatok

2012. április 18. Varianciaanaĺızis

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 13. Varianciaanaĺızis (ANOVA)

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Kettőnél több csoport vizsgálata. Makara B. Gábor

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biostatisztika Összefoglalás

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Nemparametrikus tesztek december 3.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Ismételt méréses multifaktoriális varianciaanaĺızis (repeated measures MANOVA) szeptember 19.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Variancia-analízis (folytatás)

Adatok statisztikai értékelésének főbb lehetőségei

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

V. Gyakorisági táblázatok elemzése

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Bevezetés a hipotézisvizsgálatokba

Hipotézis vizsgálatok

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

[Biomatematika 2] Orvosi biometria

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Biostatisztika Összefoglalás

Segítség az outputok értelmezéséhez

[Biomatematika 2] Orvosi biometria

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Biostatisztika VIII. Mátyus László. 19 October

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Az első számjegyek Benford törvénye

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Többváltozós lineáris regressziós modell feltételeinek

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Variancia-analízis (VA)

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Többváltozós Regresszió-számítás

Többszempontos variancia analízis. Statisztika I., 6. alkalom

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Korreláció és lineáris regresszió

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Statisztika Elıadások letölthetık a címrıl

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Normális eloszlás paramétereire vonatkozó próbák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Több valószínűségi változó együttes eloszlása, korreláció

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Statisztika elméleti összefoglaló

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Eloszlás-független módszerek 13. elıadás ( lecke)

6. Előadás. Vereb György, DE OEC BSI, október 12.

Diszkriminancia-analízis

Biometria gyakorló feladatok BsC hallgatók számára

A konfidencia intervallum képlete: x± t( α /2, df )

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Centura Szövegértés Teszt

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

Statisztikai szoftverek esszé

[Biomatematika 2] Orvosi biometria

BIOMATEMATIKA ELŐADÁS

Sztochasztikus kapcsolatok

Függetlenségvizsgálat, Illeszkedésvizsgálat

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biomatematika 2 Orvosi biometria

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

SPSS ÉS STATISZTIKAI ALAPOK II.

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Átírás:

1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása véletlenszerűnek tekinthető-e? 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása véletlenszerűnek tekinthető-e? 2. Feladat Treff 404 Kőr 420 Káró 400 Pikk 376 Treff 404 Kőr 420 Káró 400 Pikk 376 2. Feladat Egy Bürker kamrában az egy négyzetbe eső sejtek száma átlagosan 4.68. Milyen valószínűséggel talánk olyan cellát, amelben egy sejt sincs? Egy Bürker kamrában az egy négyzetbe eső sejtek száma átlagosan 4.68. Milyen valószínűséggel talánk olyan cellát, amelben egy sejt sincs? 0.00928 Varianciaanalízis ANOVA: ANalysis Of VAriance Neve félrevezető: nem varianciák, hanem átlagok összevetésére dolgozták ki Lényegében a kétmintás t-próba kiterjesztése kettőnél több alapsokaság ismeretlen várható értékének az összehasonlítására. Mit vizsgálunk az ANOVA-val: egy folytonos változónak vajon eltérőek-e a várható értékei egy nominális változó különböző kategóriáiban, avagy több nominális változó kategóriáiból képezhető kategória-kombinációkban. B faktor B csop 1 B csop 2 B csop 3 A csop 1 A faktor A1B1 A1B2 A1B3 A csop 2 A2B1 A2B2 A2B3 Folytonos változó: függő változó Nominális változó(k): magyarázó változók Faktor (tényező), a kategóriák csoportok. 1

A faktorok számától függően beszélhetünk egyfaktoros (egytényezős, egy szempontos, egy utas, one-way ANOVA) többfaktoros (többtényezős, több szempontos, több utas, multi-way ANOVA) varianciaelemzésről. A csoportokban levő mintavételi objektumok száma ha azonos minden csoportban kiegyensúlyozott (balanced) elrendezésű ANOVA eltérő a csoportokban kiegyensúlyozatlan (unbalanced) elrendezésű ANOVA A varianciaanalízis munkamenete: megvizsgáljuk, hogy van-e hatása a faktoroknak (F-próba) ellenőrizzük, hogy az adatainkra illesztett ANOVA modell teljesíti-e az alkalmazhatósági feltételeket ha a modellünk megfelel a feltételeknek, akkor ún. post-hoc teszteket alkalmazva megvizsgáljuk azt, hogy mely csoportok átlagai különböznek egymástól. Egyfaktoros ANOVA kiegyensúlyozott elrendezéssel A módszer alapgondolata: A függő változó teljes varianciája additív módon felbontható két részre: csoportok közötti varianciára (between group variance) - a csoportátlagoknak az összevont Y adatok átlaga (ún. főátlag) körüli variációja; a magyarázó változó hatását foglalja magába csoporton belüli varianciára (within group variance) - az egyedi yi megfigyeléseknek az adott csoportjuk átlaga körüli ingadozásából eredő variáció; a véletlen eseti hibát foglalja magába. ycl Ha a faktornak van hatása Y-ra: a csoportok közötti variancia rész nagyobb, mint a csoporton belüli variancia. Ha nincs hatása Y-ra: a csoportok közötti variancia megegyezik a csoporton belüli varianciával ez azt jelenti, hogy Y értékét nem befolyásolja az, hogy egy megfigyelés a faktor melyik csoportjába tartozik, az Y értékei között tapasztalt különbségek a véletlen ingadozásnak tudhatók be. Az egyes varianciafrakciók számszerűsítése eltérés-négyzetösszegekkel történik A teljes eltérés-négyzetösszeg (SS total ) a csoportok közötti (SS between ) és csoporton belüli (SS within ) eltérés-négyzetöszeg összege: 2

A függő változó teljes varianciája: A csoportok közötti variancia: A csoporton belüli variancia: A faktor hatásának szignifikanciatesztje Tesztstatisztika: A csoportok közötti és a csoporton belüli eltérésnégyzetösszeget osztva a szabadsági fokaikkal: közepes eltérés-négyzetösszegeket (Mean of Sum of squares). A csoportok közötti és a csoporton belüli közepes eltérés-négyzetösszeg hányadosa az F próbastatisztika (ld. a köv. dián!) H0: a csoportok alapsokaságbeli átlagai azonosak: µ 1 = µ 2 = = µ k H1: van legalább két olyan csoport, melyeknek különbözik az alapsokaságbeli átlaga. (egyoldali hipotézis!) A variancia-felbontás és az F-próba eredménye - ANOVA-táblázat Variancia forrása Csoportok közötti (between groups) Szabadsági fok (df) Eltérésnégyzeösszeg SS (Sum of Squares) közepes eltérésnégyzetösszeg MS (Mean Sum of Squares) k-1 SS between MS between = SS between /k-1 Csoporton k(m-1) SS within MS within = belüli SS within /k(m-1) (within groups) Teljes (total) k m-1 SS total MS total =SS total /k m-1 Próbastatisztika (F-value) F= MS betwen /MS within p-érték p Alkalmazhatósági feltételek: függetlenség: a mintavételi objektumok függetlenek egymástól normalitás: a csoportokon belül a függő változó normál eloszlású homogenitás: a csoportokban a függő változó szórása azonos, vagyis nincs összefüggés Y csoportbeli szórása és a csoport várható értéke között Egyszempontos A varianciaanalízis típusai 2 átlag egyenlőségének vizsgálata összetartozó minták segítségével (egymintás t-próba) - ez még nem VA 2 átlag és variancia egyenlőségének vizsgálata független minták segítségével (kétmintás t-próba /F-próba, t-próba, d- próba/) A. több független minta átlagának és varianciájának összehasonlítása (egyszempontos VA) B. több összetartozó minta átlagának összehasonlítása ( egyszempontos összetartozó mintás VA) 1.. 2.. 3.. Csoport (1 2) 1 1. Csoport (1 2 3) 1 3. DÉLBEN 1... 2... 3... Egyszempontos VA Többszempontos C. 2 szempont szerint független 2-2 minta átlagának összehasonlítása (kétszempontos független mintás VA) D. 2 szempont szerint (1 szempont szerint független, a másik szempont szerint összetartozó) 2-2 minta átlagának összehasonlítása ( vegyes kétszempontos VA) 1. Csoport (1 2) 2. Csoport (1 2) 1 1 1. 2 1 2. 3 Csoport (1 2) 1 1.... 3

A. Egyszempontos VA Csoport (1 2 3) 1 3. Függ-e a kvantitatív változó nagysága a csoportosító változótól? (H 0 : nem függ, az átlagok egyenlők) hatásvariancia (Var k ): a minták közötti variancia (ez a csoportosító változó hatása) hibavariancia (Var b ): a mintákon belüli variancia Q x =Q k +Q b Vizsgálat F-próbával: A függés szorossága: nemlineáris determinációs együttható (e 2, η 2 ), ill. nemlineáris korrelációs együttható (korrelációs hányados: e, η) Figyelem: η XG η GX! (ha a kapcsolat nem szimmetrikus, lineáris) Szóráshomogenitás mérése: Levine-, O Brien-próba B. Egyszempontos összetartozó mintás DÉLBEN VA 1... 2... 3... Függ-e a kvantitatív változó nagysága a mérés időpontjától, a kezeléstől? (H 0 : nem függ, az átlagok egyenlők) hatásvariancia vagy kezelési hatás (Var k ): minták közötti variancia (ez az ismételt méréses szempont hatása) személyvariancia (Var p ): személyek közötti variancia (ez az ismételt méréses szempont hatása) hibavariancia (Var e ): az általunk nem kontrollált tényezők okozta variancia Q x =Q k +Q p +Q e, vizsgálat F-próbával: (a személyvarianciát (Var p ) csak ki akarjuk szűrni) Szfericitás vagy cirkularitási feltétel (a különbségváltozók szóráshomogenitása) mérése: Levine-, O Brien-próba A szívfrekvencia (Hz) változása háromféle antiaritmiás szer hatására Nullhipotézis (nullhipotézis egyenlő átlagokra): nincs különbség a három drog hatása között, az átlagokban tapasztalt eltérés véletlen hatások következménye; a három minta azonos populációból származik Alternatív hipotézis (nem minden átlag egyforma): a drogok között van legalább egy olyan (pl. a harmadik), amely hatásában különbözik a többitől, hatására a szívfrekvencia szignifikánsan csökken: 4

Variancia táblázat F-teszt (Snedecor-féle F-eloszlás ) Tegyük fel, hogy két populációt vizsgálunk, amelyeknek nem ismerjük az átlagát és szórását, viszont tudjuk, hogy a változók követik a normális eloszlást. [ ] = s 2 1 (n) s 2 2 (m) F n,m n és m jelenti a két minta szabadsági fokát F-eloszlás két eltérő szabadsági foknál. - Az F-eloszlás aszimmetrikus eloszlás, ferdesége a szabadsági fokok számától függ. - Ha a minták elemszáma nagy, az eloszlás közelíti a normális eloszlást. - Az F-eloszlás értékei különböző szabadsági fokokra megtalálhatók egy táblázatban. A varianciák egyenlőségére vonatkozó nullhipotézist elutasítjuk, ha a következő egyenlőtlenség teljesül: F [ m,n] P =0,05 P (elméleti adat) F =0,05 m,n (kísérleti adat) [ ] Ellenkező esetben a nullhipotézist fenntartjuk, a szórások (varianciák) egyenlőségére vonatkozó feltétel ebben az esetben teljesül, tehát pl. a t-próba alkalmazható. 5