Gyakorló feladatok statisztikai programcsomagokhoz

Hasonló dokumentumok
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Normális eloszlás paramétereire vonatkozó próbák

Alkalmazott statisztika feladatok

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Hipotézis vizsgálatok

Biometria gyakorló feladatok BsC hallgatók számára

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Korreláció és lineáris regresszió

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Többváltozós lineáris regressziós modell feltételeinek

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

[Biomatematika 2] Orvosi biometria

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

Matematikai statisztika szorgalmi feladatok

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

A konfidencia intervallum képlete: x± t( α /2, df )

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Nemparametrikus tesztek december 3.

Adatok statisztikai értékelésének főbb lehetőségei

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Varianciaanalízis 4/24/12

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Segítség az outputok értelmezéséhez

Statisztikai módszerek 7. gyakorlat

A leíró statisztikák

KÖVETKEZTETŐ STATISZTIKA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A valószínűségszámítás elemei

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Hipotézis vizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

egyetemi jegyzet Meskó Balázs

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Kísérlettervezés alapfogalmak

y ij = µ + α i + e ij

Matematikai statisztika feladatsor

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

NEVEZETES FOLYTONOS ELOSZLÁSOK

Valószín ségszámítás és statisztika

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

A Statisztika alapjai

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Bevezetés a hipotézisvizsgálatokba

Abszolút folytonos valószín ségi változó (4. el adás)

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Statisztika Elıadások letölthetık a címrıl

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Regressziós vizsgálatok

[Biomatematika 2] Orvosi biometria

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Biostatisztika Összefoglalás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Biostatisztika feladatok

Typotex Kiadó. Tartalomjegyzék

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Több valószínűségi változó együttes eloszlása, korreláció

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Biomatematika 2 Orvosi biometria

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Kettőnél több csoport vizsgálata. Makara B. Gábor

Készítette: Fegyverneki Sándor

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉP SZINT Függvények

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Átírás:

Gyakorló feladatok statisztikai programcsomagokhoz Az elvégzett tesztek eredményeit és azok magyarázatait mentsük el egy valasz.txt, ha ábra is van, a valasz.xls nev fájlba! 1. Nyissuk meg a kolcson.txt-t! Adjunk becslést a fedezet eloszlására! Ábrázoljuk oszlopdiagramon és kördiagramon is! 2. Nyissuk meg az emberek.txt-t! Ábrázoljuk a magasság s r séghisztogramját! Exportáljuk ki csak a diagramot egy html le-ba! 3. Nyissuk meg az emberek.txt-t! Adjuk meg a testsúly empirikus eloszlásfüggvényét és adjunk becslést is (ábrával) az eloszlásfüggvényre! Adjunk becslést azon jellemz k (változók) mediánjára, amelyekre lehet! 4. Nyissuk meg az emberek.txt-t! Hozzunk létre egy ttidx változót, amely az emberek testtömegindexét tartalmazza! (testtömegindex: testtömeg osztva a testmagasság négyzetével kg/m 2 ) Hozzunk létre sulykat változót, amely értéke 1, ha sovány (ttidx<20), 2, ha normál testtömeg (ttidx 20 és 25 között) és 3, ha túlsúlyos (ttidx>25)! Ábrázoljuk oszlopdiagramon az átlag életkorokat a sulykat változó szerint csoportosítva! 5. Nyissuk meg az emberek.txt-t! Ábrázoljuk a férak és n k testmagasságának mediánjának becslését oszlopdiagramon! Ábrázoljuk boxploton is a két csoport testmagasságát! 6. Nyissuk meg a kolcson.txt-t! Adjunk becslést azon jellemz k (változók) várható értékére és szórására, amelyekre lehet! A várható értékekre adjunk 99%-os megbízhatósági szint kondencia-intervallumot is! A szórás becslése korrigált vagy korrigálatlan? 7. Nyissuk meg az emberek.txt-t! Hozzunk létre egy új változót, amely az emberek életkorát tartalmazza! Adjuk meg az életkor empirikus várható értékét és az empirikus szórásnégyzetet! 8. Nyissuk meg az emberek.txt-t! Legyen X a testmagasság, Y a nem. Adjunk becslést az E(X Y = 1) és E(X Y = 2) feltételes várható értékekre! Ábrázoljuk ezeket az értékeket oszlopdiagramon! 9. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy az intelligencia (FSIQ) várható értéke 100. 10. Nyissuk meg a kolcson.txt-t! Teszteljük le azt a nullhipotézist, hogy a 40 év felettiek jövedelme várhatóan 35. Teszteljük le ugyanezt a hipotézist az egész mintán! Szükséges-e, hogy a minta normális eloszlásból származzon? 11. Hogyan valósíthatjuk meg az egyoldali t-próbát SPSS-ben? 12. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy a verbális intelligencia (VIQ) és performációs intelligencia (PIQ) várhatóan nem tér el egymástól! Teszteljük a két változó különbségének várható értékének 0 voltát egymintás t- próbával is és ellen rizzük, hogy a két eljárás ugyanazt az eredményt adja!

13. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy a férak és n k intelligenciájának (FSIQ) várható értéke megegyezik. Teszteljük azt a nullhipotézist is, hogy a férak esetén ez a várható érték 5-tel magasabb! Magyarázzuk meg a kapott eredményeket! 14. Nyissuk meg a kolcson.txt-t! Teszteljük, hogy a házasok és nem házasok munkaviszonyának várható értéke nem tér el egymástól! 15. Generáljunk függetlenül két normális eloszlású mintát r1 és r2 néven. Teszteljük várható értékük egyezését páros és kétmintás t-próbával is! Tudunk-e mondani valamit arra vonatkozólag, hogy melyik próbát érdemesebb inkább alkalmazni? 16. Nyissuk meg a kolcson.txt-t! Tegyük fel, hogy a régi és új ügyfelek csoportjaiban a jövedelmek normális eloszlásúak. Teszteljük, hogy a régi és új ügyfelek jövedelmének szórása nem tér el egymástól! Ez alapján melyik próba alkalmazható a két csoport várható értékének különbségének tesztelésére? 17. Nyissuk meg a kolcson.txt-t! Feltehetjük, hogy a jövedelem normális eloszlást követ. Adjunk becslést a legalább 45 évesek és a 45 alattiak várható jövedelmére! Ellen rizzük azt a nullhipotézist, amely szerint ezek nem térnek el egymástól! Adjunk 95%-os megbízhatósági szint kondencia-intervallumot a két csoport várható jövedelmének különbségére! 18. Nyissuk meg a calc.sav-ot! Itt kalcium hatását vizsgáják a vérnyomásra. A kutató arra kíváncsi, van-e hatása a kezelésnek. Milyen próbákat alkalmazhatunk? Mik az adott próbák feltételei? Írjuk fel a hullhipotézist és az ellenhipotézist is minden esetben! 19. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy a status mediánja 2! Oldjuk meg a feladatot a binomiális teszt és a Wilcoxon-próba segítségével is! Teljesülnek-e mindkét próba feltételei? 20. Nyissuk meg az emberek.txt-t! Teszteljük azt a nullhipotézist, hogy a magasság alsó kvartilise (0,25-kvantilise) 170 cm! 21. Nyissuk meg a brain.sav-ot! Teszteljük a H 0 : P(P IQ < V IQ) = 1/2 hipotézist! Miért nem alkalmas a választott teszt a két változó mediánjának egyenl ségének tesztelésére? 22. Generáljunk egy 100 elem p = 0,4 paraméter Bernoulli eloszlású véletlen mintát! Teszteljük le, hogy a minta valóban elfogadható-e véletlennek! Generáljunk egy olyan változót, amelyben 0-k és 1-esek váltakozva jelennek meg. Teszteljük, hogy ez elfogadható-e véletlen sorozatnak! 23. Nyissuk meg a kolcson.txt-t! Teszteljük minden intervallumváltozóra azt a nullhipotézist, hogy normális eloszlású! Milyen próbákat alkalmazhatunk? Magyarázzuk meg az elvégzett próbák eredményeit a Q-Q ábra segítségével! 24. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy a különböz statuszok azonos valószín ség ek! Teszteljük azt a nullhipotézist is, hogy a status 1-es értékének valószín sége 1/2, a 2-es és 3-as érték pedig 1/4-1/4 valószín ség!

25. Hozzunk létre a [0, 1] intervallumon egyenletes eloszlású álvéletlenszámokat! 3 osztópont segítségével χ 2 -próbával teszteljük, elfogadható-e az így kapott minta [0, 1] intervallumon egyenletes eloszlásúnak! Mely teszteket használhatjuk még a kérdés eldöntésére? 26. Hogyan tesztelhetjük azt a nullhipotézist, hogy egy minta standard normális eloszlásból származik? 27. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy azok, akik korábban ügyfelek voltak és akik nem voltak (adostip) életkorának eloszlása megegyezik! Mely teszteket használhatjuk a kérdés eldöntésére? 28. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy azok, akik korábban ügyfelek voltak és akik nem voltak (adostip) családi állapotának eloszlása megegyezik! 29. Készítsünk gyakorisági táblázatot a kolcson.txt adóstípus és a kölcsön típusa változók alapján. Végezzük el a χ 2 próbát. Milyen következtetést von le az eredmény alapján 0,05-ös szinten? Mi itt a nullhipotézis és az ellenhipotézis? 30. Nyissuk meg a kolcson.txt-t! Mondhatjuk-e, hogy a statusok eltérnek a régi és új ügyfeleknél? 31. Nyissuk meg a beteg.sav-ot! A következ kérdéseket viszgáljuk: Van-e hatása a kezelésnek a lázra? Egyformán reagálnak-e a kezelésre a férak és a n k? Mindkét kérdés esetén írjuk fel a nullhipotéziseket, és végezzünk el minden ezekre vonatkozó vizsgálatot, amit lehet! 32. Nyissuk meg a jegyek.txt-t! A matematika és zika jegyek összehasonlítására milyen próbákat alkalmazhatunk? Milyen következtetéseket vonhatunk le ezek alapján a matematika és zika jegyekr l 5%-os szinten? 33. Nyissuk meg a kolcson.txt-t! Tegyük fel, hogy a különböz családi állapotúak csoportjaiban az életkorok normális eloszlásúak. Teszteljük azt a nullhipotézist, hogy a várható életkor megegyezik minden csoportban. Ha elvetjük a nullhipotézist, végezzünk kiegészít vizsgálatot is! 34. Mutassuk be konkrét példán keresztül, hogy a varianciaanalízis a kétmintás t-próba általánosítása (2 csoport esetén ugyanazt az eredményt adják)! 35. Nyissuk meg a kolcson.txt-t! Feltehetjük, hogy a jövedelem normális eloszlást követ. Van-e összefüggés a kölcsön típusa és a jövedelem közt? 36. Nyissuk meg a plastic.sav-ot! Teszteljük azt a nullhipotézist, hogy az anyag er ssége nem függ az önt ben töltött id t l! 37. Nyissuk meg a munka.sav-ot! Írjuk fel a lineáris regressziós modellt! Teljesülnek-e a modell alkalmazhatóságának feltételei? 38. Nyissuk meg az emberek.txt-t! Mely intervallumváltozók között van lineáris kapcsolat (ha normális eloszlásúnak tekinthetjük ket)? Adjuk meg a leger sebb kapcsolathoz tartozó regressziós egyenes paramétereit! Ábrázoljuk az egyik változót a másik függvényében, az ábrán tüntessük fel a regressziós egyenest is! Adjunk becslést a modell segítségével a hiányzó adatokra!

39. Nyissuk meg az emberek.txt-t! A testtömegindex kvadratikus kapcsolatra utal a magasság és súly között, adjunk becslést erre a kapcsolatra! Adjunk becslést lineáris kapcsolatra is. Melyik esetben kapjuk a jobb becslést legkisebb négyzetes értelemben? 40. Nyissuk meg a chemical.txt-t! Címkézzük fel az x1 változót a tartályok száma, az x2 változót a hajórakomány súlya és az y változót a kirakodás ideje percekben címkékkel! Ábrázoljuk az y értékeit az x1 és x2 függvényében! Adjunk többváltozós regressziós modellt y függ és x1 és x2 független változókra (regressziós sík)! Mely együtthatók (változók) hagyhatók el a modellb l? A többváltozós regressziószámításnál a megoldás egyértelm ségének feltétele, hogy a független változók lineárisan függetlenek legyenek. Teljesül-e a feltétel? 41. Nyissuk meg a kolcson.txt-t! A változók közül melyek tekinthet k függetlennek? 42. Nyissuk meg az országok.xls-t! A Manhattan-távolságot (Minkowski-távolság 1 hatvánnyal) használva a legközelebbi szomszéd módszerével klaszterezzük hierarchikusan az országokat! Olvassuk le a dendrogramról, mely ország alkot ömnagában egyelem klasztert a legtovább! 43. Nyissuk meg a brain.sav-ot! Csoportosítsuk k-közép módszerrel az embereket két csoportba FSIQ, VIQ, PIQ, Weight, Height változók alapján! Adjuk meg a klaszterközéppontokat! Hány eset tartozik egy-egy klaszterbe? 44. Nyissuk meg a brain.sav-ot! Klaszterezzük hierarchikusan az embereket centroid módszerrel az euklideszi távolságot használva az intervallumváltozók (scale változók) értékei szerint! Legalább mekkora klaszterszám esetén lesz olyan ember, aki önmagában egy klasztert alkot? 45. Nyissuk meg a brain.sav-ot! Redukáljuk az intervallumváltozókat három korrelálatlan változóra és mentsük el a kapott faktorokat! Adjuk meg a faktorok kovarianciamátrixát! 46. Nyissuk meg az autok.sav-ot! A Kaiser-kritériumot használva végezzünk f faktoranalízist! Magyarázzuk meg a tapasztalt jelenséget (faktorok száma) az eredeti változók korrelációs mátrixának segítségével! 47. Nyissuk meg a brain.sav-ot! Az intervallumváltozók alapján (korrelációs mátrixszal számolva) a Kaiser kritériumot használva (legalább 1 sajátértékhez tartozó vektorok kiválasztása) csökkentsük a változók számát! A faktorok segítségével adjuk meg az els néhány f komponenst! Hány dimeniósra redukáljuk így a teret? 48. Nyissuk meg a brain.sav-ot! Az intervallumváltozók alapján hozzunk létre 3 faktort! A faktorok értelmezésének könnyítése érdekében alkalmazzunk forgatást, és csoportosítsuk az így kapott faktorok segítségével az eredeti változókat! 49. Nyissuk meg a brain.sav-ot! Határozzuk meg a nemeket elválasztó diszkriminanciafüggvényt (adjuk meg az együtthatókat) az el z feladatbeli faktorok által meghatározott térben! Hány esetben hibás az el rejelzett csoportbatartozás? 50. Nyissuk meg birth.sav-ot! Egy anya nem adta meg, dohányzik-e! Adjunk el rejelzést arra, hogy a dohányzók csoportjába tartozik-e! A használt módszer hány esetet klasszikált rosszul?

51. Nyissuk meg a tulelo.sav-ot! Adjunk becslést a túlélési függvényre! Mi lenne a becslés, ha minden esetben a valódi életkor lenne adva? Tudnánk-e becslést adni, ha egy esetben sem valódi életkor lenne adva? 52. Nyissuk meg a Mouse_survival.sav-ot! Adjunk becslést a túlélési függvényre Coxregresszióval!