K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Hasonló dokumentumok
Bevezetés a hipotézisvizsgálatokba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Hipotézis vizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis vizsgálatok

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

[Biomatematika 2] Orvosi biometria

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás tesztje

A konfidencia intervallum képlete: x± t( α /2, df )

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Statisztika Elıadások letölthetık a címrıl

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Biostatisztika Összefoglalás

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

egyetemi jegyzet Meskó Balázs

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biostatisztika Összefoglalás

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

y ij = µ + α i + e ij

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Adatok statisztikai értékelésének főbb lehetőségei

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Nemparametrikus tesztek december 3.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Biostatisztika VIII. Mátyus László. 19 October

Statisztika elméleti összefoglaló

Kettőnél több csoport vizsgálata. Makara B. Gábor

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Matematikai statisztikai elemzések 4.

Matematikai statisztikai elemzések 4.

Korreláció és lineáris regresszió

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Varianciaanalízis 4/24/12

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Grafikonok az R-ben március 7.

Eloszlás-független módszerek 13. elıadás ( lecke)

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

IV. Változók és csoportok összehasonlítása

2012. április 18. Varianciaanaĺızis

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Többváltozós lineáris regressziós modell feltételeinek

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

kritikus érték(ek) (critical value).

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Az első számjegyek Benford törvénye

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

Nemparaméteres próbák

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Több valószínűségi változó együttes eloszlása, korreláció

6. Előadás. Vereb György, DE OEC BSI, október 12.

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Ismétlı áttekintés. Statisztika II., 1. alkalom

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Dr. Karácsony Zsolt. Miskolci Egyetem november

A pont példájának adatai C1 C2 C3 C

Kísérlettervezés alapfogalmak

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Populációbecslések és monitoring

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

KÖVETKEZTETŐ STATISZTIKA

A maximum likelihood becslésről

Átírás:

Középérték és variancia azonosságának próbái: t-próba, F -próba 2012. március 21.

Hipotézis álĺıtása Feltételezés: a minta egy adott szempont alapján más populációhoz tartozik, mint b minta. Nullhipotézis (H 0 ): a minta és b minta egyazon populációhoz tartozik, azaz az átlaguk ugyanazon µ populációátlag körül szór. Ellenhipotézis (H 1 ): p valószínűséggel álĺıtható, hogy b minta átlaga nem ugyanahhoz a populációhoz tartozik, mint az a minta. Azonos populációhoz tartozó átlagok Különbözö populációhoz tartozó átlagok 0.0 0.1 0.2 0.3 0.4 0.5 x2 M x1 0.0 0.1 0.2 0.3 0.4 0.5 M2 x2 x1 M1 2 0 2 4 6 M=2, x1=3, x2=1,5 2 0 2 4 6 M1=4, M2=1, x1=3, x2=1,5

Hipotézis tesztelése p = 95%-os megbízhatósággal 1. H 1 : a nagy valószínűséggel eltér b-től. H 0 : a és b ugyanazon populáció része. Elutasítás: ha x a sűrűségfüggvény két szélén α/2-be esik kétoldali teszt (felső ábra).

Hipotézis tesztelése p = 95%-os megbízhatósággal 1. H 1 : a nagy valószínűséggel eltér b-től. H 0 : a és b ugyanazon populáció része. Elutasítás: ha x a sűrűségfüggvény két szélén α/2-be esik kétoldali teszt (felső ábra). 2. H 1 : a nagy valószínűséggel nagyobb, mint b. H 0 : b nem kisebb, mint a. Elutasítás: ha x a sűrűségfüggvény jobb szélén α-ba esik egyoldali teszt (alsó ábra).

Hibatípusok 1. α-hiba (első fajta, elsőfajú hiba): elutasítjuk H 0 -t, mert az érték megadott konfidencia-intervallumon kívül esik α része (piros tartomány). 2. β-hiba (második fajta, másodfajú hiba): megtartjuk H 0 -t, holott az érték más populációhoz tartozik (sárga tartomány).

Hibatípusok 1. α-hiba (első fajta, elsőfajú hiba): elutasítjuk H 0 -t, mert az érték megadott konfidencia-intervallumon kívül esik α része (piros tartomány). 2. β-hiba (második fajta, másodfajú hiba): megtartjuk H 0 -t, holott az érték más populációhoz tartozik (sárga tartomány). H 0 -t megtartjuk H 0 -t elvetjük H 0 igaz helyes döntés α-hiba (álpozitív) H 1 igaz β-hiba (álnegatív) helyes döntés

Összehasonĺıtás alapjai Átlagok, szórások, minta populációval minta mintával, azonos varianciák eltérő varianciák, független párosított minták, parametrikus ordinális vagy nem normális eloszlású minták. Ha populáció σ szórása ismert: átlagok z-eloszlás szerint szórnak µ körül. Gyakorlatban: populáció szórása nem ismert, ezért a mintaátlag szórását a Student-féle t eloszlással jellemezzük. t = x µ 0 s/ n Mint z meghatározása, de σ helyett s.

t-eloszlás Jellemzők: szimmetrikus, átlaga 0, aszimptotikus, de nem normális eloszlású. közvetve függ a minta méretétől, n-től. t-eloszlás laposabb, mint z adott szignifikanciaszint határértékei messzebb esnek az átlagtól. n = esetén t eloszlás azonos z eloszlással. n 100 esetén különbség elhanyagolható, z-értékeket lehet használni.

Szabadsági fokok Szabadsági fok, degree of freedom, df : a szabadon változtatható elemek száma, ami mellett a minta egy adott tulajdonsága változatlan marad. df = n 1. Pl. egy n = 5 elemű minta átlaga x = 10. Hány elem változtatható szabadon a mintaátlag változatlansága mellett? Négy, hiszen az ötödik elemet úgy kell kiválasztani, hogy a minta átlaga 10 maradjon, tehát csak négy elem változtatható szabadon.

t-eloszlás és szabadsági fokok t-eloszlás lapossága függ a szabadsági fokoktól. Minél nagyobb a szabadsági fok, annál közelebb esik a kritikus érték (= szignifikancia-határ, konfidencia-intervallum szélső értéke) az átlaghoz. dt(x, 1) 0.0 0.1 0.2 0.3 0.4 df 100 30 10 5 2 1 0 20 40 60 80 Index

Egymintás Student-féle t-próba Feltétel: normális eloszlású változó, ismeretlen szórással. Alkalmazás: populáció vagy nagyszámú referenciaminta átlaga ismert, pl. IQ = 100. Eljárás: ha t minta > t 1 α(n 1) H 0 elvetése. A Kincskereső óvodába 60 okos és ügyes gyerek jár. Átlagos IQ-juk 108, a szórás 10. Okosabbak-e az oda járó gyerekek az átlagnál?

Feladat átlag: 108, populáció átlaga: 100, szórás: 10, elemek száma 60. t = x µ 0 s/ n = 108 100 10/ 60 = 8 1,29 = 6, 2 Kritikus értékhez tartozó t meghatározása (p = 1 α = 0, 95): adott kvantilishoz (0,95) tartozó t-érték 59-es szabadságfok mellett: qt(p,df), itt: qt(0.95,59) 1,67

Feladat átlag: 108, populáció átlaga: 100, szórás: 10, elemek száma 60. t = x µ 0 s/ n = 108 100 10/ 60 = 8 1,29 = 6, 2 Kritikus értékhez tartozó t meghatározása (p = 1 α = 0, 95): adott kvantilishoz (0,95) tartozó t-érték 59-es szabadságfok mellett: qt(p,df), itt: qt(0.95,59) 1,67 Mivel t minta > t 0.95(59) > H 0 -t elutasítjuk. A Kincskereső óvodába tehát az átlagnál szignifikánsan intelligensebb gyerekek járnak.

Kétmintás független t-próba Két minta alapján két ismeretlen µ értéket hasonĺıtunk össze. Minták kiválasztása egymástól független (pl. spanyol óvodások és cseh óvodások). Feltétel: normális eloszlás, azonos varianciák t = x 1 x 2 s 2 n 1 + s2 n 2 ahol s 2 a közös variancia becslése a mintánkénti szórásokból. DE: szórás egyenlőségét ritkán álĺıthatjuk biztosan!

Welch-próba Mint kétmintás független t-próba, de nem feltételezzük a varianciák egyenlőségét. t = x 1 x 2 s 2 1 n 1 + s2 2 n2 Eltér-e az alábbi mintában a nőstény és hím borjak születéskor mért testtömege? bika (kg) 46 37 39 37 33 48 35 üsző (kg) 27 37 35 41 35 34 43 38 40 bika = c(46,37,39,37,33,48,35) uszo = c(27,37,35,41,35,34,43,38,40)

Feladat Normális eloszlásúak-e a minták? shapiro.test(bika), shapiro.test(uszo) Ha p az adott szignifikanciaszintnél nagyobb, elfogadjuk a normális eloszlás feltételezését. Két minta összehasonĺıtása t-próbával: t.test(bika,uszo) alapbeálĺıtás: kétoldali (alternative=two.sided), varianciák nem egyenlőek (var.equal=false).

Feladat Normális eloszlásúak-e a minták? shapiro.test(bika), shapiro.test(uszo) Ha p az adott szignifikanciaszintnél nagyobb, elfogadjuk a normális eloszlás feltételezését. Két minta összehasonĺıtása t-próbával: t.test(bika,uszo) alapbeálĺıtás: kétoldali (alternative=two.sided), varianciák nem egyenlőek (var.equal=false). Mivel p nagyobb, mint 0,05, a különbség nem szignifikáns.

Kétmintás páros t-próba Minta egyazon elem vagy összetartozó elemek kétszeri megfigyeléséből áll. Feltétel: egy elem két értékének különbsége normális eloszlású, n 30 esetén normális eloszlás nélkül is használható. t = d s d / n ahol d a különbségek átlaga, s d a különbségek becsült szórása, n a párok száma.

Feladat ratings adatmátrix a languager könyvtárból. Növények és állatok méretére és súlyára adott átlagos becslések: meansizerating, meanweightrating. Normális eloszlás tesztelése: shapiro.test(ratings$meansizerating), shapiro.test(ratings$meanweightrating) páros t-próba : t.test(ratings$meansizerating,ratings$meanweightrating, paired=t) p 0, 001, tehát a megkérdezettek az állatok és növények méretét szignifikánsan nagyobbra becslik egy adott skálán, mint a súlyukat.

Varianciára vonatkozó próbák (Legalább) két minta esetén: F -próba: mindkét mintában normális eloszlás, független minták. R: var.test(). Levene-próba: közeĺıtő próba, de normális eloszlás hiányában is használható, több mintára is. R: levene.test a car könyvtárban. Bartlett-próba: normális eloszlás, páros mintákra is használható. R: bartlett.test().

Feladat Töltsük le a trans.rdata fájlt innen: clara.nytud.hu/ mady/kurzusok/stat-r/2012tavasz/trans.rdata Letöltés load("konyvtar/trans.rdata") parancccsal (NEM read.table()). A fájl R-formátumú, objektum mentése így történt: save(trans,file="celkonyvtar/filenev.rdata") A mátrixban eredetileg angol, ill. portugál, kb. 1500 szavas szövegek hossza van megadva, majd a másik nyelre való lefordítás utáni hosszuk. Ellenőrizzük, azonos-e az angol és portugál szövegek varianciája és átlaga. var.test(fuggovaltozo fuggetlenvaltozo), azaz var.test(trans$length trans$language) t.test(fuggovaltozo fuggetlenvaltozo), azaz t.test(trans$length trans$language)

Házi feladatok megoldása 1 Pontdiagramm készítése az állatokra és a növényekre eltérő színnel. A tengelyhosszok legyenek azonosak. logikai vektor: csak növények: z = ratings$class == "plant" Növények [z] ábrázolása piros színnel: plot(ratings$frequency[z],ratings$meanfamiliarity[z], col="red",xlim=range(ratings$frequency), ylim=range(ratings$meanfamiliarity)) par(new=t) állatok [!z] ábrázolása kék színnel plot(ratings$frequency[!z],ratings$meanfamiliarity[!z], col="blue",xlim=range(ratings$frequency), ylim=range(ratings$meanfamiliarity)) range(): egy adott vektor terjedelme (min... max)

Házi feladatok megoldása 2 Boxplot készítése adott csoportra (csak növények, csak egyszerű szavak stb.). z = ratings$class == "plant" boxplot(ratings$frequency[z] ratings$complex[z]) boxplot(ratings$frequency[!z] ratings$complex[!z])

Házi feladatok megoldása 3 A minta adatbázisban hány személy magassága tér el az átlagtól 1 σ-nál nagyobb mértékben? És 2 σ-nál nagyobb mértékben? átlag: mean(minta$height), szórás: sd(minta$height) átlagtól egységnyi szórással felfelé, ill. lefelé eltérők száma: sig1p=minta$height>mean(minta$height)+sd(minta$heigth) sig1m=minta$height<mean(minta$height)-sd(minta$heigth) két minta összege: sum(sig1p)+sum(sig1m) Két σ eltérés esetén: 2*sd(minta$height) sig2p=minta$height>mean(minta$height)+2*sd(minta$height) sig2m=minta$height<mean(minta$height)-2*sd(minta$height) sum(sig2p)+sum(sig2m)

További feladatok 1. Hasonĺıtsuk össze a bikák és üszők születési súlyának varianciáit a megfelelő tesztekkel. Milyen különbségeket látunk? ratings adatmátrix a languager könyvtárból. 2. Igaz-e, hogy a ratings mátrixban szereplő állatnevek gyakorisága alacsonyabb mértékű, mint a növényeké? És az ismertségük? 3. Milyen értéket vesz fel p, ha a növények és állatok súly- és méretbecslését külön-külön vizsgáljuk? Teszteljük minden esetben, hogy az adatok normális eloszlásúak-e, és hogy a varianciák homogének (egyenlőek)-e.