Hipotézisvizsgálat R-ben

Hasonló dokumentumok
Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Statisztika GI II félév. Paraméteres Nem-paraméteres Desc Linkek Desc 1.dolgozat

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Baran Sándor. Feladatok a hipotézisvizsgálat

Baran Sándor. Feladatok a hipotézisvizsgálat

A konfidencia intervallum képlete: x± t( α /2, df )

Normális eloszlás paramétereire vonatkozó próbák

499, 525, 498, 503, 501, 497, 493, 496, 500, 495

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria gyakorló feladatok BsC hallgatók számára

Bevezetés a hipotézisvizsgálatokba

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

NEVEZETES FOLYTONOS ELOSZLÁSOK

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hipotézis vizsgálatok

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

[Biomatematika 2] Orvosi biometria

nem kezelt 1.29, 1.60, 2.27, 1.31, 1.81, 2.21 kezelt 0.96, 1.14, 1.59

Statisztika elméleti összefoglaló

egyetemi jegyzet Meskó Balázs

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztikai módszerek 7. gyakorlat

Normális eloszlás tesztje

Függetlenségvizsgálat, Illeszkedésvizsgálat

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Biomatematika 13. Varianciaanaĺızis (ANOVA)

y ij = µ + α i + e ij

Matematikai statisztikai elemzések 4.

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Biostatisztika VIII. Mátyus László. 19 October

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Nemparaméteres próbák

Nemparametrikus tesztek december 3.

Matematikai statisztikai elemzések 4.

Az első számjegyek Benford törvénye

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Hipotézis vizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Adatok statisztikai értékelésének főbb lehetőségei

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

1. Két pályázat esetén a nyerési esélyeket vizsgálják. Mintát véve mindkét pályázat esetén az egyik. (b) Mit nevezünk másodfajú hibának?

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

KÖVETKEZTETŐ STATISZTIKA

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Statisztika Elıadások letölthetık a címrıl

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

6. Előadás. Vereb György, DE OEC BSI, október 12.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Biostatisztika Összefoglalás

Matematikai statisztika c. tárgy oktatásának célja és tematikája

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Többváltozós lineáris regressziós modell feltételeinek

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

A Statisztika alapjai

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

d) Transzformáljuk-e az adatokat? Képezzünk-e rangokat? Hogyan változtatná meg ez az eredmények szakmai értelmezését?

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

STATISZTIKA PÉLDATÁR

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

MATEMATIKA HETI 5 ÓRA

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Biostatisztika Összefoglalás

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Gyakorló feladatok a 2. dolgozathoz

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Dr. Karácsony Zsolt. Miskolci Egyetem november

Korreláció és lineáris regresszió

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

Nehézségi gyorsulás mérése megfordítható ingával

Átírás:

Hipotézisvizsgálat R-ben

1-mintás u-próba Az elmúlt évben egy, az Antarktiszon talált királypingvinkolónia esetén a pingvinek átlagos testtömege 15.4 kg volt. Idén ugyanebből a kolóniából megmérték 35 pingvin tömegét, és átlagos értéknek 14.6 kg-ot kaptak. Tegyük fel, hogy a populációban a pingvinek tömege normális eloszlású, 2.5 kg szórással. Döntsünk 95%-os megbízhatósággal arról, hogy idén ugyanannyi-e a kolóniában az átlagos pingvin tömeg, mint tavaly! Egy teát 200 grammos dobozokban árulnak, a csomagológép szórása 4 gramm. A Fogyasztóvédelmi Felügyelőség lemérte öt véletlenszerűen kiválasztott teásdoboz tömegét, melyekre az alábbi, grammban kifejezett értékek adódtak: 196, 202, 198, 197, 190. Hipotéziseinket pontosan megfogalmazva és feltételezve, hogy a teásdobozok tömege normális eloszlást követ, döntsünk 98%-os szinten, hogy az átlagos töltőtömeg tényleg 200 gramm, avagy kevesebb annál.

1-mintás t-próba Az atlétikai világbajnokságon résztvevő kokszföldi csapat néhány versenyzője arra panaszkodott, hogy a leadott doppingtesztjeiket nem megfelelően analizálták és az egyik szernek túlságosan magas koncentrációját mutatták ki, minek következtében a versenybíróság törölte az eredményeiket. A Kokszföldi Atlétikai Szövetség a laboratóriumot tesztelendő nyolc mintát küldött, melyek mindegyikében a kérdéses anyag koncentrációja pontosan 0.500 g/l volt. A laboratórium az alábbi eredményeket szolgáltatta: 0.485, 0.518, 0.460, 0.530, 0.560, 0.550, 0.490, 0.575. A laboratórium mérési hibáját normálisnak tételezve fel döntsön 95%-os szinten, igazuk van-e az atlétáknak.

t-próba beépített függvénnyel Töltsük be az R beépített immer adatállományát! library(mass) immer: ez az adattömb egy árpamező hozamait tartalmazza 1931-ben és 32-ben. Tegyük fel, hogy a hozamok egy adott évben normális eloszlásúak. Használjuk a t.test parancsot annak eldöntésére, hogy 1931-ben 100 egység volt-e az átlagos hozam. Használjunk 5%-os szignifikanciaszintet. Döntsük el az előbbi szintet használva, hogy megegyezik-e a hozam a 2 évben.

Paraméteres próbák folytatás Kétfajta instant kávé oldódási idejét tesztelték, melyekből minden alkalommal azonos mennyiséget tettek 1 dl forrásban lévő vízbe. A kísérletek eredményeit az oldódási időket másodpercben az alábbi táblázat tartalmazza: Mokka Makka 8.2 5.0 6.8 6.7 5.8 7.3 6.4 7.8 Koffe In 5.1 4.3 3.4 3.7 6.1 4.7 Az oldódási időket normálisnak tételezve fel 5%-os szinten igazoljuk, hogy nincs különbség az oldódási idők szórása között. Az előző pontbeli szinten vizsgáljuk meg azt az álĺıtást, hogy a Mokka Makka kávé lassabban oldódik, mint a Koffe In.

Paraméteres próbák folytatás A Mindent Tudás Egyeteme harmadéves matematikus hallgatói két zárthelyi dolgozatot írtak statisztikából. Az alábbi táblázat tíz véletlenszerűen kiválasztott hallgató eredményeit tartalmazza: Hallgató A B C D E F G H I J 1. dolgozat 57 63 67 82 45 65 53 32 51 27 2. dolgozat 53 62 63 80 46 64 44 28 50 29 A dolgozateredmények eltérését normális eloszlásúnak tételezve fel, döntsünk 95%-os szinten, van-e különbség a két dolgozat nehézségi foka között.

Paraméteres próbák folytatás A Felsőkutyafalvi Kerékpárüzem kerékrészlegének vezetője arra gyanakszik, hogy az egyik beszálĺıtó által készített küllők hosszúsága igencsak változékony. Gyanújának ellenőrzése céljából az adott beszálĺıtó termékeiből véletlenszerűen kiválasztott 20 darabot és megmérte azok hosszát. A hossz szórásnégyzetének a minta alapján számolt torzítatlan becslése 1.0369mm 2. A beszálĺıtó álĺıtása szerint a küllők hosszának szórása 0.75mm. A küllők hosszát normális eloszlásúnak tételezve fel ellenőrizzük, megalapozott-e a részlegvezető gyanúja. Döntsünk 95%-os szinten.

Nemparaméteres χ 2 -próbák Nagy mintaelemszám szükséges (osztályonként 6-10 már jó). Mindig jobboldali kritikus tartományt használunk. Illeszkedésvizsgálat: tényleg az adott eloszlásból származik a minta? chisq.test(megfigyeltgyak,p=varhatogyak) Függetlenségvizsgálat: az adatokat 2 ismérv szerint csoportosítva vizsgáljuk, hogy az ismérvek függetlenek-e egymástól. chisq.test(kontingenciatablazat)

Előjelpróba Feladat: Egy üdítőgyártó cég megváltoztatta egyik italának az összetételét és kíváncsiak, vajon jobban szeretik-e majd az új ízt a vásárlók. Így megkértek 18 főt, hogy teszteljék az új italt. A kísérlet során kiderült, hogy 5 résztvevőnek ízlett jobban az új ital, a többiek a régi ízt preferálják. Döntsünk 5%-os szignifikanciaszinten arról, hogy egyformán népszerű-e a két íz! binom.test(pozitiv,osszes)

Feladat Az alábbi adatok 12 Turbo tudás módszerrel felkészített hallgató vizsgapontszámait tartalmazzák (a maximális pontszám 50): 36 26 30 34 42 24 30 45 32 19 35 38. Közismert, hogy a hagyományos módszerrel tanulók körében a pontok mediánja 30. (a) Az előjelpróba segítségével döntsünk 95%-os szinten, hogy az új módszerrel megszerzett pontok magasabb mediánértékkel bírnak-e. (b) Döntsünk a Wilcoxon-féle előjeles rangösszeg próbával is, a szint legyen a korábbi. wilcox.test(...)

Szórásanaĺızis Egy franchise gyorsétterem 3 új menüt tesztel. Ahhoz, hogy lássák, egyenlően népszerűek-e, kiválasztanak 18 éttermet véletlenszerűen, és 6-ban az első menüt kezdik el árulni, 6-ban a másodikat, 6-ban pedig a harmadikat. Egy hét után a következő eladási mennyiségeket könyvelték: Menü 1 22 42 44 52 45 37 Menü 2 52 33 8 47 43 32 Menü 3 16 24 19 18 34 39 Döntsünk 95%-os megbízhatósággal arról, hogy egyenlően népszerűek-e a menük, feltéve, hogy az eladások menünként normális eloszlást követnek. aov(eredmeny ~ faktor)