Biostatisztika feladatok

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Biostatisztika feladatok"

Átírás

1 Biostatisztika feladatok 1. Valószín ség, diszkrét valószín ségi változók 1.1. A biológia szakos hallgatók ebben a félévben két kötelez en választható kurzust vehettek fel. A Sárkányok élettana cím tárgyra a hallgatók 60, a Micimackó anatómiája cím kurzusra a hallgatók 40 százaléka jelentkezett. Mindkét kurzust az évfolyam 24 százaléka vette fel. Véletlenszer en kiválasztunk egy hallgatót. a. Mennyi a valószín sége annak, hogy választott hallgató a Sárkányok élettana cím tárgyat felvette, de a Micimackó anatómiája cím kurzust nem? Mennyi az esélye annak, hogy egyik kurzust sem vette fel? b. Mennyi a valószín sége annak, hogy a hallgató felvette a Sárkányok élettana cím tárgyat, ha tudjuk, hogy a másik kurzusra jelentkezett. Mennyi az esélye annak, hogy felvette a sárkányos tárgyat, ha azt tudjuk, hogy a Micimackós kurzust nem vette fel? A két kurzusra történ jelentkezés egymástól független, vagy tapasztalható közöttük valamilyen kapcsolat? 1.2. Egy ország lakosságát vizsgáljuk haj- és szemszín szempontjából. Az országban az emberek 30 százaléka fekete, 50 százaléka pedig barna hajú, a többiek sz kék. A sötét (barna, fekete) szem aránya 60 százalék, a többiek világos (kék, zöld) szem ek. Tudjuk még, hogy egyaránt 5 százalék a sz ke hajú és sötét szem, illetve a fekete hajú és világos szem emberek aránya. Véletlenszer en kiválasztunk egy embert az országból. a. Mennyi a valószín sége, hogy a kiválasztott ember sz ke hajú és világos szem? Mennyi az esélye annak, hogy barna hajjal és sötét szemmel rendelkezik? b. Mennyi az esélye annak, hogy a kiválasztott ember fekete hajú, ha tudom, hogy sötét a szeme? Mennyi ez a valószín ség akkor, ha a kiválasztott ember világos szem? Hogyan hat a szem színe a fekete haj megjelenésére? Végezzük el ugyanezt az elemzést a barna és a sz ke hajra is. Mely események függetlenek egymástól? Független egymástól a szem és a haj színe úgy általában? c. Milyen arányban fordulnának el a lehetséges hajszín-szemszín kombinációk, ha a két tényez független lenne egymástól? 1.3. Egy borsópopulációban a növények 70 százalékának piros, a maradéknak fehér a virága. Ugyanezen populáción belül 60 százaléknak sárga a maghéja, míg a többinek zöld. Genetikából ismert, hogy a borsó növénynél a virág és a maghéj színe egymástól függetlenül örökl dik. Emiatt feltehet, hogy a populáción belül a virág és a maghéj színe két egymástól független tényez. a. A piros virágú növények között milyen arányban jelenik meg a sárga illetve a zöld maghéj? A sárga maghéjjal rendelkez egyedek körében mennyi az aránya 1

2 a piros illetve a fehér virágú növényeknek? Értelmezzük ezeket az arányokat feltételes valószín ségként is. b. Írjuk fel, hogy a 4 lehetséges virág-maghéj színkombináció milyen arányban fordul el a populáción belül Egy szerencsejátékban a játékos 1000, 2000, 3000 vagy 5000 forintot nyerhet, ezen nyeremények esélye 50, 30, 15 illetve 5 százalék. Egyszer játszuk ezt a játékot, jelölje ξ a nyeremény összegét. Írjuk fel a ξ változó eloszlását, várható értékét és szórását. Mennyi a játék igazságos ára? 1.5. A biológiai kutatások egyik új és fontos területe a sárkányok vizsgálata. A tudósok eddig 1, 3, 7 és 12 fej sárkányokat gyeltek meg, ezek aránya a populáción belül 10, 40, 30 illetve 20 százalék. Véletlenszer en kiválasztunk egy egyedet a populációból, és jelölje ξ a fejek számát a választott egyednél. Adjuk meg a ξ változó eloszlását, várható értékét és szórását. 2. Folytonos valószín ségi változók 2.1. Jelölje ξ a napi középh mérséklet egy véletlenszer en kiválasztott januári napon. A ξ egy folytonos változó, melynek s r ségfüggvénye f(x) = 1/20, ha 15 x 5, és f(x) = 0 egyébként. Ábrázoljuk a s r ségfüggvényt, és mutassuk meg, hogy a görbe alatti terület 1. Határozzuk meg a ξ változó értékkészletét. Mennyi annak az esélye, hogy a ξ változó 10 és 2 közé esik? Határozzuk meg a napi középh mérséklet várható értékét és szórását. Írjuk fel a ξ változó eloszlásfüggvényét, majd adjuk meg a mediánt és a kvartiliseket A ξ folytonos valószín ségi változó s r ségfüggvénye f ξ (x) = 3 x/2, ha 0 x 1, és f ξ (x) = 0 minden más x valós számra. Mutassuk meg, hogy a görbe alatti terület 1, és írjuk fel ξ értékkészletét. Mennyi a P (0,5 ξ 1,5) valószín ség értéke? Adjuk meg a változó várható értékét és szórását. Írjuk fel az eloszlásfüggvényt, majd ez alapján határozzuk meg a 80%-os kvantilist Egy ξ folytonos valószín ségi változó s r ségfüggvénye f ξ (x) = x/2, ha 0 x 2, és f ξ (x) = 0 minden más x valós számra. Mutassuk meg, hogy a görbe alatti terület 1, és írjuk fel ξ értékkészletét. Mekkora valószín séggel vesz fel a változó 1,5-nél nagyobb értéket? Mennyi az esélye, hogy a ξ változó 1 és +1 közé esik? Adjuk meg a változó várható értékét és szórását. Írjuk fel az eloszlásfüggvényt, majd ez alapján határozzuk meg a 40%-os kvantilist. 3. A normális eloszlás 3.1. Az alábbi ábrán ϕ a standard normális eloszlás s r ségfüggvénye. Határozzuk meg, hogy az f 1, f 2, f 3, f 4 s r ségfüggvények közül melyik tartozik az alábbi µ várható 2

3 értékkel és σ szórással deniált normális eloszlásokhoz. Adjuk meg a kimaradt s r ségfüggvényhez tartozó várható értéket és szórást is. a. µ = 2, σ = 0,5 b. µ = 2, σ = 1 c. µ = 0, σ = 2 f 1 f 3 0,5 ϕ f 4 f x 3.2. Az IQ teszteket úgy állítják össze, hogy az eredmény a feln tt populáción belül normális eloszlást kövessen 100 pont várható értékkel és 15 pont szórással. A feln tt népesség mekkora hányadának esik az IQ pontszáma 90 és 120 közé? A Mensa egy nemzetközi egyesület, ahol a belépés feltétele a legalább 131 pontos IQ. A népesség hány százaléka felel meg ennek a követelménynek? Adjunk meg egy olyan intervallumot, melyre teljesül, hogy az emberek 95 százalékának ebbe az intervallumba esik az IQ pontszáma Biológusok azt vizsgálták, hogy a szavannán él majmok reggelente milyen eloszlás szerint ébrednek fel, és másznak le a fáról. A meggyelések alapján az ébredési id egy normális eloszlású valószín ségi változó. A majmok átlagosan reggel 7 órakor kellnek fel, a szórás 0,75 óra. A majmok mekkora hányada kel fel 6 és 7 óra között? És 8 óra után? Adjunk meg egy olyan id intervallumot, melyre teljesül, hogy a majmok 90 százaléka ebben az id intervallumban mászik le a fáról. (Valós kutatás alapján.) 3.4. Legyen ξ egy véletlenszer en kiválasztott feln tt ember szisztolés vérnyomása higanymilliméterben (mmhg) kifejezve. A statisztikai adatok alapján ξ egy-egy földrajzi területen lognormális eloszlást követ, ami azt jelenti, hogy az ln ξ valószín ségi változó normális eloszlású. A paraméterek országonként változóak, például az Egyesült Államokban az ln ξ változó várható értéke µ = 4,78, szórása σ = 0,16. (Forrás: National Health and Nutrition Examination Survey, 2006.) Az orvosi szakirodalom a 140 mmhg feletti vérnyomást tekinti kórosan magasnak. Ez az amerikai feln tt népesség mekkora hányadát érinti? Az emberek mekkora hányadának esik a vérnyomása az egészségesnek tekintett tartományba, tehát 90 és 130 mmhg közé? Adjunk meg egy olyan intervallumot, melyre teljesül, hogy a feln tt népesség 95 százalékának a szisztolés vérnyomása ide esik. 4. Leíró statisztikák és grakonok 4.1. a. Olvassuk be a Davis adatsort a car vagy a cardata csomagból, és fussuk át az adatsor leírását! Kérdezzük le és értelmezzük a repwt és a weight változóra a következ leíró statisztikákat: mintaátlag, korrigált empirikus szórás, standard hiba, IQR, minimum, maximum, medián, alsó illetve fels kvartilis! Mekkora a minta mérete és hány meggyelés hiányzik az egyed változóknál? 3

4 b. Kérdezzük le a repwt változó boxplotját és hisztogrammját is! Vázlatosan rajzoljuk be a s r ségfüggvényt, és adjunk becslést a móduszra! A kapott s r ségfüggvény összhangban van a minta ferdeségével? 4.2. a. Olvassuk be a Mroz adatsort a car vagy a cardata csomagból, és fussuk át az adatsor leírását! Kérdezzük le és értelmezzük az age változóra a következ leíró statisztikákat: mintaátlag, korrigált empirikus szórás, standard hiba, ferdeség, IQR, minimum, maximum, medián, 40%-os kvantilis! Mekkora a minta mérete és hány meggyelés hiányzik az age változónál? b. Kérdezzük le az age változó boxplotját és hisztogrammját is! Vázlatosan rajzoljuk be a s r ségfüggvényt! A kapott s r ségfüggvény összhangban van a minta ferdeségével? Egy vagy több módusza van a s r ségfüggvénynek? 4.3. Az alábbi ábrán Histogram egy hisztogramm of xi és egy boxplot látható. Frequency xi a. A hisztogramm alapján milyen el jel a ferdeség: pozitív, negatív vagy közel nulla? Vázlatosan ábrázoljuk a s r ségfüggvényt a hisztogramm grakonján, majd adjunk becslést a móduszra! b. A boxplot alapján adjunk becslést a következ mennyiségekre: medián, alsó és fels kvartilis, IQR, minimum és maximum. Hány outlier érték szerepel az ábrán? c. Vajon a hisztogramm és a boxplot ugyanazon statisztikai mintához tartozik? A választ indokoljuk is! 5. Grakus normalitásvizsgálat, kondencia intervallumok 5.1. a. Olvassuk be a Davis adatsort a car vagy a cardata csomagból! Ábrázoljuk a weight változó boxplotját, majd értelmezzük az outlier értékeket! Vegyük észre, hogy az egyik alany adatait elírták! Keressük meg a hibás sort, és javítsuk ki az adatokat! A további kérdésekre a javított adatok alapján válaszoljunk! b. Adjunk becslést a weight változó várható értékére, szórására és ferdeségére! Kérdezzük le és értelmezzük a standard hibát, illetve határozzuk meg a korrigálatlan empirikus szórást is! 4

5 c. Ábrázoljuk a változó hisztogrammját ás a boxplotját, és adjunk becslést a móduszra! Ezek alapján mit állíthatunk weight változóról: normális eloszlású; nem normális, de a s r ségfüggvény közel szimmetrikus; vagy a s r ségfüggvény ferde valamelyik irányba? d. Végezzük el a b. és c. feladatrészek elemzését a height változóra is! e. Adjunk meg egy 95% megbízhatósági szintú kondencia intervallumot a weight illetve a height változó elméleti várható értékére! Kivonat a Student-eloszlás táblázatából: x Φ 199 (x) a. Olvassuk be a Mroz adatsort a car vagy a cardata csomagból! Adjunk becslést az,age változó várható értékére, szórására és ferdeségére! Kérdezzük le és értelmezzük a standard hibát, illetve határozzuk meg a korrigálatlan empirikus szórást is! b. Vegyük fel a változó hisztogrammját és boxplotját! Ezek alapján az age változó normális eloszlásúnak t nik? Annyi feltehet, hogy a s r ségfüggvénye szimmetrikus? c. Adjunk meg egy 90% megbízhatóságú kondenciai intervallumot az age változó várható értékére. Kivonat a Student-eloszlás táblázatából: x Φ 752 (x) Statisztika feladatok a dolgozat el tt 6.1. Régészek radiokarbonos kormeghatározással szeretnék meghatározni egy lel hely korát. Ismert, hogy a radiokarbonos módszert az egyazon ásatáson talált különböz leleteken alkalmazva nem pontosan ugyanazt a kort fogjuk megkapni minden lelet esetében, hanem a kapott korok (közelít leg) normális eloszlást követnek, melynek elméleti várható értéke a lel hely igazi kora. A radiokarbonos módszert öt leleten alkalmazva a következ korokat kapjuk: 1180, 1220, 1230, 1250 és 1270 év. a. Számoljuk ki a mintaátlagot, a korrigálatlan illetve a korrigált empirikus szórást, a standard hibát illetve az empirikus mediánt. Mi ezen statisztikai mutatószámok jelentése ebben a feladatban? b. A t-próba alkalmazásával teszteljük le 5%-os szignikancia szinten azt a nullhipotézist, hogy a lel hely igazi kora 1220 év. Írjunk fel egy 99% megbízhatósági szint kondencia intervallumot is a lel hely korára! x Φ 4 (x)

6 6.2. Bejelentés érkezik a fogyasztóvédelemhez, hogy az egyik tejgyár 1 literes kiszerelés dobozos teje a névleges tartalomnál kevesebbet tartalmaz. Tudni kell, hogy a tölt berendezések véletlen nagyságú hibával dolgoznak, így ténylegesen egyik dobozban sincs pontosan 1 liter tej. Feltehet, hogy a dobozokba töltött mennyiség egy ξ normális eloszlású valószín ségi változó, melynek 1 liter a várható értéke, ha a gép jól van beállítva. A fogyasztóvédelem emberei beszereznek hat doboz tejet, és azt találják, hogy ezek 975, 980, 985, 995, 1000, 1010 ml tejet tartalmaznak. a. Számoljuk ki a mintaátlagot, a korrigálatlan illetve a korrigált empirikus szórást, a standard hibát illetve az empirikus mediánt. Mi ezen statisztikai mutatószámok jelentése ebben a feladatban? b. A t-próba alkalmazásával teszteljük le 10%-os szignikancia szinten azt a nullhipotézist, hogy a gép jól van beállítva, tehát a gyárban a tejesdobozokba átlagosan 1000 ml tej kerül! Írjunk fel egy 90% megbízhatósági szint kondencia intervallumot is a ξ változó várható értékére! x Φ 5 (x) Az alábbi ábrán egy hisztogram és egy boxplot látható. A két grakon két különböz adatsor alapján készült. Mi mindent tudunk leolvasni a grakonokról? Frequency Mg 7. Egymintás és páros t-próba Az adatsorok az el adás Coospace oldaláról vagy az el adó oldaláról tölthet ek le Egy orvosi kísérlet keretei között két új kísérleti vérnyomáscsökkent gyógyszert vizsgáltak magas vérnyomásos betegeken. Véletlenszer en kiválasztottam 150 magas vérnyomású embert, majd három 50 f s csoportba sorolták ket. A három csoport három különböz gyógyszert szedett néhány héten át. A kísérlet eredménye a vernyomas.xls fájlban található. A változók: 6

7 CSOPNEV: betegcsoport neve CSOPKOD: betegcsoport kódja SYS1: kezelés el tti szisztolés vérnyomás SYS2: kezelés utáni szisztolés vérnyomás a. Adjunk becslést a SYS1 változó átlagos értékére és szórására a teljes populációban! Mennyire pontos a populációátlagra kapott becslés? Vegyük fel a SYS1 változó hisztogrammját is! Feltehet, hogy normális eloszlásból származik a minta? b. Teszteljük le azt a nullhipotézist, hogy a SYS1 változó teljes populációban vett átlagos értéke 160 Hgmm! Teszteljük le a 162 Hgmm-es értéket is! Adjunk meg egy 95% megbízhatóságú kondencia intervallumot is a populációátlagra! Mely értékeket fogadná el a t-próba, mint a teljes populációban vett átlagos érték? c. Tekintsük csak a kiserleti1 betegcsoport tagjait! Ábrázoljuk a SYS1 és a SYS2 változó hisztogramját! Feltehet, hogy mindkét minta normális eloszlásból származik? Teszteljük le 1%-os szignikancia szinten azt a nullhipotézist, hogy a SYS1 és a SYS2 változónak azonos a várható értéke! Adjunk meg egy 99%-os kondencia intervallumot is a várható értékek jülönbségére. Értelmezzük is a kapott eredményt! d. Ismételjük meg az el z pont elemzését a kiserleti2 betegcsoportra is! 7.2. Az írisz adatsor a matematikai statisztika egyik legismertebb adatsora, mellyel az elmúlt 80 évben számos statisztikai módszert illusztráltak. Az adatsor az iris.xls állományban érhet el, továbbá egy rövid ismertet található a Wikipedian. Az adatsor három kanadában honos írisz (n szirom) fajról tartalmaz adatokat, fajtánként 50 meggyelést. A változók: faj: faj megnevezése fajkod: lásd faj cseszehossz: szélelevél hossza (cm) cseszeszel: csészelevél szélessége (cm) sziromhossz: sziromlevél hossza (cm) sziromszel: sziromlevél szélessége (cm) a. Ábrázoljuk a sziromszel változó hisztogrammját! Vajon hány módusza van ennek az eloszlásnak? Mi ennek az oka? Mi a szokásos eljárás, ha statisztikában ilyen adatsorral találkozunk? Ábrázoljuk a hisztogrammot fajonkénti bontásban is! b. Adjunk becslést a virginica fajhoz tartozó növényeknél a sziromszel változó várható értékére és szórására. Teszteljük le 5% szignikancia szinten azt a nullhipotézist, hogy a várható érték 2 cm. Adjunk meg egy 95% megbízhatóságú kondencia intervallumot is erre a várható értékre. 7

8 c. Teszteljük le 10% szignikancia szinten azt a nullhipotézist, hogy a virginica fajnál a sziromlevél átlagos hossza azonos a csészelevél átlagos hosszával! Adjunk meg egy 99% megbízhatóságú kondenciai intervallumot a két várható érték eltérésére is! d. Végezzük el az el z két pont elemzését a másik két faj egyedeire is. 8. Az ANOVA és a Levene-teszt 8.1. Olvassuk be az vernyomas.xls fájlban található statisztika adatsort, a leírásért lásd a 7.1. feladatot! a. Adjunk becslést a SYS1 változó várható értékére és szórásásra betegcsoportonkénti bontásban! Látunk jelent s eltérést a becslések között? Ábrázoljuk a változó hisztogramját és boxplotját szintén betegcsoportonkénti bontásban! Mit olvashatunk le az ábrákról? b. Teszteljük le 5% szignikancia szinten azt a nullhipotézist, hogy a SYS1 változónak azonos a várható értéke a három betegcsoportban, tehát nincsen csoporthatás. Teszteljük le a szórások egyenl ségét is! c. Ismételjük meg az el z két pont elemzését a SYS2 változóra is! Ha van csoporthatás, akkor adjunk becslést és 95% megbízhatósági szint kondencia intervallumot az eltérésekre! 8.2. Olvassuk be az iris.xls fájl tartalmát, az adatsor leírása megtalálható a 7.2. feladatban! a. Adjunk becslést a sziromszel változó elméleti várható értékére és elméleti szórására fajonkénti bontásban. Hogyan értelmezhet az elméleti várható érték és az elméleti szórás ebben a feladatban. Ábrázoljuk a boxplotot és a hisztogramot is, szintén fajonkénti bontásban! b. Teszteljük le azt a nullhipotézist, hogy a sziromszel változó esetében a csoportonkénti szórások azonosak. A szignikancia szint 5%. c. Teszteljük le a csoportonkénti várható értékek egyenl nl ségét is. Ha szignikáns különbség van a várható értékek között, akkor adjunk becslést és 95% megbízhatósági szint kondencia interavallumot a különbségekre! d. Ismételjük meg azt az elemzést a cseszeszel változóra is! 9. Valószín ségek becslése és tesztelése 9.1. A titanic2.txt adatsor a Titanic utolsó (és egyetlen) útjáról tartalmazza az utasnévsor egy részletét. A változók: Name: vezetéknév Sex: nem (male=fér, female=n ) 8

9 Age: életkor (év) Embarked: melyik kiköt ben szállt fel (C=Cherbourg, Q=Queenstown, S=Southampton) Class: utasosztály Survived: túlélte-e a katasztrófát (1=igen, 0=nem) a. Ábrázoljuk az Age változó hisztogramját. Teszteljük le azt a nullhipotézist, hogy a hajó utasai körében az Age változó normális eloszlást követett! b. Adjunk becslést arra, hogy az utasok mekkora valószín séggel élték túl a katasztrófát! 1%-os szignikancia szinten teszteljük le azt a nullhipotézist, hogy a túlélés esélye 0.4 volt, illetve adjunk meg egy 99% megbízhatóságú kondencia intervallumot a túlélés valószín ségére! c. Ábrázoljuk a Sex változót oszlopdiagrammal és kördiagrammal! Adjunk becslést a nemek arányára a hajón! Teszteljük le azt a nullhipotézist, hogy a hajón azonos arányban utaztak férak és n k! Adjunk meg egy 95%-os kondencia intervallumot a férak arányára! d. Teszteljük le azt a nullhipotézist, hogy az utasok körében azonos volt a férak és a túlél k aránya! Teszteljük le azt is, hogy azonos volt az 1. osztályon utazók és a Southamptonban felszállók aránya! e. Adjuk meg a túlél k arányát nemenkénti bontásban! Teszteljük le azt a nullhipotézist, hogy a férak és a n k körében azonos volt a túlélés valószín sége. f. Életkor alapján bontsuk fel a hajó utasait három csoportra: 0-20 év, év, 41-t l felfelé. Adjuk meg a három korcsoport arányát a hajón! Határozzuk meg a férak arányát a három korcsoporton belül! Teszteljük le azt a nullhipotézist, hogy a három korcsoportban azonos volt a férak aránya! 9.2. Felmérést végeztek egy egyetemen. Azt kérdezték meg 1000 véletlenszer en kiválasztott hallgatótól, hogy dohányzik-e, illetve tart-e valamilyen háziállatot. A felmérés eserménye a catsdogs.txt adatsorban található. A változók: Gender: a hallgató neme (M=fér, F=n ) Smokes: dohányzik-e (1=igen, 0=nem) CatsDogs: van-e kutyája vagy macskája (dogs=kutya, cats=macska, both=mindkett, none=egyik sem) a. Adjunk becslést a dohányosok arányára az egész egyetem hallgatóinak körében. Teszteljük le 1% szignikancia szinten az a nullhipotézist, hogy a hallgatók 20 százaléka dohányzik. Adjunk meg egy 99% megbízhatóságú kondencia intervallumot is a dohányosok arányára! b. Adjunk becslést a dohányosok arányára nemenkénti bontásban. Teszteljük le 10% szignikancia szinten az a nullhipotézist, hogy a férak és a n k körében azonos a dohányosok aránya! c. Ábrázoljuk a Gender változót oszlopdiagram illetve kördiagram segítségével. Adjunk becslést a férak illetve a n k arányára az egész egyetemen! Teszteljük 9

10 le 5%-os szignikancia szinten azt a nullhipotézist, hogy az egyetemen azonos a fér és n i hallgatók száma! Adjunk meg egy 95% megbízhatóságú kondencia intervallumot is a n k arányára! d. Adjunk becslést a dohányosok arányára a CatsDogs változó által meghatározott csoportokban! Teszteljük le 1% szignikancia szinten azt a nullhipotézist, hogy a dohányosok aránya azonos a CatsDogs változó által deniált részpopulációkban, tehát a háziállatok tartása nem hat a dohányzásra! e. Adjunk becslést arra nézve, hogy az egész egyetemen a hallgatók milyen arányban tartanak kutyát illetve macskát! Teszteljük le 5% szignikancia szinten azt a nullhipotézist, hogy ez a két arány egyenl egymással! Adjunk meg egy 95% megbízhatósági szint kondencia intervallumot is az arányok különbségére! 10. Korrelációs együttható és lineáris regresszió A UScars.txt adatsorban az amerikai piacon forgalmazott autótípusok egyes m szaki paraméterei szerepelnek. A változók: MODEL: a modell neve COUNTRY: hol gyártották VOL: utastér térfogata (köbláb) HP: teljesítmény (lóer ) MPG: fogyasztás (mérföld/gallon) SP: végsebesség (mérföld/óra) WT: teljes tömeg (100 font) a. Ábrázoljuk az SP változót a HP változó függvényeként! A grakon alapján milyen irányú és milyen er sség kapcsolat lehet a két változó között? Adjunk becslést a korrelációs együttható értékére! Teszteljük le azt a nullhipotézist, hogy a két változó független egymástól, továbbá adjunk meg egy 95% megbízhatóságú kondencia intervallumot az elméleti korrelációs együtthatóra! b. Végezzünk lineáris regressziót az SP és a HP változón és adjuk meg a regressziós egyenes egyenletét! Milyen jól illeszkedik a regressziós egyenes a meggyelt értékekhez? Ábrázoljuk a regressziós egyenest koordináta rendszerben! c. Milyen becslést adhatunk egy 150 lóer s autó végsebességére? d. Végezzük el az el z pontok elemzését a SP és a VOL változóra is! Az utolsó kérdésnél legyen VOL= Olvassuk be az iris.xls fájl tartalmát, az adatsor leírása megtalálható a 7.2. feladatban! a. Ábrázoljuk a sziromszel változót a sziromhossz változó függvényeként! A grakon alapján milyen irányú és milyen er sség kapcsolat lehet a két változó között? Adjunk becslést a korrelációs együttható értékére! Teszteljük le azt a nullhipotézist, hogy a két változó független egymástól, továbbá adjunk 10

11 meg egy 95% megbízhatóságú kondencia intervallumot az elméleti korrelációs együtthatóra! b. Végezzünk lineáris regressziót a sziromszel és sziromhossz változókon és adjuk meg a regressziós egyenes egyenletét! Milyen jól illeszkedik a regressziós egyenes a meggyelt értékekhez? Ábrázoljuk a regressziós egyenest koordináta rendszerben! c. Milyen becslést adhatunk a sziromszel változó értékére, ha a sziromhossz értéke 3? d. Végezzük el az a. pont elemzését a cseszeszel változót a cseszehossz változókra is! Érdemes lineáris regressziót végezni ezen két változó között? e. Viszgáljuk csak a setosa növényeket! Ezen növények esetében milyen irányú és er sség kapcsolat van a cseszeszel és cseszehossz változók között? Végezzünk lineáris regressziót a két vátozóra! 11. Nemlineáris regresszió Olvassuk be az UScars.txt fájlban található statisztika adatsort, a leírásért lásd a feladatot! a. Ábrázoljuk az MPG változót a HP változó függvényeként! A grakon alapján milyen irányú és milyen er sség kapcsolat van a két változó között? Lineáris a kapcsolat a változók között? Kérdezzük le az MPG és a HP változó korrelációs együtthatóját! A korrelációs együtthatóban megjelenik az el z pontban kapott sejtés a kapcsolat irányára és er sségére? b. Végezzünk lineáris regressziót a két változóra, és írjuk fel a regressziós egyenes egyenletét! Mennyire jó az illeszkedés az egyeneshez? c. Adjunk becslést az autók fogyasztására MGP a/hp + b alakban! Határozzuk meg az a és b paraméterek értékét, továbbá adjuk meg, hogy az adatok mennyire jól illeszkednek a regressziós görbéhez! Ezek alapján milyen becslést adhatunk egy 100 lóer s autó fogyasztására? d. Oldjuk meg az el z pont feladatait azzal a módosítással, hogy a fogyasztást MGP exp(ahp + b) alapban fejezzük ki! A car avagy cardata csomag states adatsora azt vizsgálja, hogy az Egyesült Államok egyes tagállamai mennyit költöttek a középsikolás oktatásra a 90'-es évek elején, és ennek hatására milyenek lettek az egyetemi felvételi eredmények. Olvassuk be az adatsort illetve kérdezzük le az adatsor leírását. a. Mely változók között tapasztalható er s lineáris kapcsolat? Adjuk becslést ezen változók korrelációs együtthatójára! b. Végezzünk exponenciális illetve reciprokos regressziót az SATM és percent változókon az alábbi formában: 11

12 Megoldások percent a exp(satm) + b, percent 1/(a SATM + b). Mintkét esetben adjuk meg a regressziós görbe egyenletét és az R 2 értéket! 1.1. Legyen: A = a kiválasztott hallgató felvette a Sárkányok élettanát, P (A) = 60%, B = a kiválasztott hallgató felvette a Micimackó anatómiáját, P (B) = 40%, P (mindkét kurzus) = P (A és B) = 24% a. P (A igen, de B nem) = 36%, P (nem A és nem B) = 24% B igen B nem össz. A igen 24% 36% 60% A nem 16% 24% 40% össz. 40% 60% 100% b. P (A B) = 0,6 = 60%, P (A nem B) = 0,6 = 60% A és B független események: P (A B) = P (A) a. P (sz ke haj és világos szem) = 15%, P (barna haj és sötét szem) = 30% fekete haj barna haj sz ke haj összesen sötét szem 25% 30% 5% 60% világos szem 5% 20% 15% 40% összesen 30% 50% 20% 100% b. P (fekete haj sötét szem) = 41,7%, P (fekete haj világos szem) = 12,5% A sötét szem el segíti, a világos szem akadályozza a fekete haj megjelenését. P (barna haj sötét szem) = 50%, P (barna haj világos szem) = 50% A barna haj megjelenése független a szem színét l. P (sz ke haj sötét szem) = 8,3%, P (sz ke haj világos szem) = 37,5% A sötét szem akadályozza, a világos szem el segíti a sz ke haj megjelenését. A haj és a szem színe úgy általában nem független egymástól. c. Függetlenség esetén: fekete haj barna haj sz ke haj összesen sötét szem 18% 30% 12% 60% világos szem 12% 20% 8% 40% összesen 30% 50% 20% 100% 12

13 1.3. a. A függetlenség miatt: sárga maghéj aránya a piros virág között = P ( sárga maghéj piros virág )=60% zöld maghéj aránya a piros virág között = P ( zöld maghéj piros virág )=40% piros virág aránya a sárga maghéj között = P ( piros virág sárga maghéj )=70% fehér virág aránya a sárga maghéj között = P ( fehér virág sárga maghéj )=30% b. piros virág fehér virág össz. sárga maghéj 42% 18% 60% zöld maghéj 28% 12% 40% össz. 70% 30% 100% 1.4. R ξ = {1000, 2000, 3000, 5000} k P (ξ = k) 0,5 0,3 0,15 0,05 E(ξ) = 1800, D(ξ) = 1030, igazságos ár: R ξ = {1, 3, 7, 12} k P (ξ = k) 0,1 0,4 0,3 0,2 E(ξ) = 5,8, D(ξ) = 3, R ξ = [ 15, +5], P ( 10 ξ 2) = 0,4, E(ξ) = 5, D(ξ) = 5,77, 0, t < 15, F ξ (t) = (t + 15)/20, 15 t 5, 1, t > 5, q α = 20α 15, q 25% = 10, q 50% = 5, q 75% = R ξ = [0, 1], P (0,5 ξ 1,5) 0,65, E(ξ) = 3/5, D(ξ) 0,26, 0, t < 0, F ξ (t) = t 3/2, 0 t 1, 1, t > 1, q α = α 2/3, q 80% 0, R ξ = [0, 2], P (ξ > 1,5) 0,44, P ( 1 ξ 1) = 0,25, E(ξ) = 4/3, D(ξ) 0,47, 0, t < 0, F ξ (t) = t 2 /4, 0 t 2, 1, t > 2, q α = 2 α, q 40% 1,

14 3.1. a. f 3 ; b. f 4 ; c. f 2. Az f 1 s r ségfüggvény paraméterei: µ = 3, σ = 0, a. 66%; 2%; [70,6, 129,4] %; 9%; [5,77, 8,23] ,6%; 66,8%; [87, 163] a. Statistics > Summaries > Numerical summaries b. Graphs > Histogram, Graphs > Boxplot Módusz 55. A s r ségfüggvény jobbra ferde, ez összhangban van a ferdeséggel a. Statistics > Summaries > Numerical summaries b. Graphs > Histogram, Graphs > Boxplot A s r ségfüggvény jobbra ferde, ez összhangban van a ferdeséggel. A függvénynek több módusza is van a. A boxplot alapján a 12. sor kilóg az adatsorból. Ennek az a magyarázata, hogy valaki felcserélte a weight és a height változó értékét. Ez javítható az Edit data set gomb segítségével. b. E(weight) weight = 65.3, D(weight) D n(weight) = 13.32, skewness 0.94 SE = 0.94 = a mintaátlag átlagosan ennyivel tér el a várható értékt l Var n(weight) = = , Var n (weight) = = , 200 D n (weight) = = c. A weight változó nem normális eloszlású, a s r ségfüggvény jobbra ferde. Kis jóindulattal tekinthetjük közel szimmetrikusnak, ugyanis a ferdeség értéke 1 alatt marad. A módusz körülbelül 55. Egyébként outlier értékb l nincsen sok, ez még nem tenné tönkre a normalitást. d. height = , D n(height) = 8.93, SE = 0.63, skewness 0.22, módusz 165 A s r ségfüggvény enyhén jobbra ferde. Nem normális eloszlásról van szó, de a ferdeség alapján közel szimmetrikus. d. Mivel nagy a mintaméret, és mindkét változó s r ségfüggvény közel szimmetrikus, használhatjuk a normális eloszlás várható értékére vonatkozó intervallumot. Most α = 0.05, amib l c = Φ 1 199(0.975) = weight: [ , ] = [63.45, 67.15] height: [ , ] = [169.32, 171.8] 4.3. a. A ferdeség pozitív. A s r ségfüggvény követi a hisztoggramm tetejét. A módusz körülbelül b. Egy outlier érték van. A többi leíró statisztika értéke az ábra alapján: 14

15 min. ˆq 25% ˆq 50% ˆq 75% max. IQR c. Nem azonos mintához tartoznak. Egyrészt a hisztogramm szerint a mintában van 3-nál nagyobb meggyelt érték, a boxploton ilyen érték nincs. Másrészt a boxplot közel szimmetrikus, a hisztogramm viszont ferde a. E(age) age = 42.54, D(age) D n(age) = 8.07, skewness 0.15 SE = 0.29 = a mintaátlag átlagosan ennyivel tér el a várható értékt l Var n(age) = = 65.12, Var n (age) = = 65.04, 753 D n (age) = = A nagy mintaméret miatt a korrigálás csak minimális mértékben változtatott az empirikus szórás értékén. b. Az age változó nem normális eloszlású, a s r ségfüggvény jobbra ferde. Meglep módon a ferdeség egészen közel esik nullához, ez a hisztogramm alapján nem volt várható. A boxplot teljesen rendben van. c. A nagy mintaméret és a nullához közeli ferdeség miatt használhatjuk a normális eloszlás várható értékére vonatkozó intervallumot. Most α = 10% = 0.1, amib l c = Φ 1 752(0.95) = [ , ] = [42.06, 43.2] 6.1. a. ξ = 1230, jelentése: az elméleti várható érték becslése. D n (ξ) = 30.33, jelentése: az elméleti szórás (pontatlan) becslése. D n(ξ) = 33.91, jelentése: az elméleti szórás pontosabb becslése. SE = 15.17, jelentése: átlagosan ennyivel tér el a mintaátlag a várható értékt l, ennyi a becslés átlagos hibája. empirikus medián: 1230, jelentése: a minta középs eleme, becslés az elméleti mediánra. b. H 0 : µ = 1220, tehát a hipotetikus várható érték µ 0 = Próba statisztika: t = (ξ µ 0 )/SE = Kritikus érték: c α = Φ 1 4 (0.975) = 2.78 Döntés: t c α, ezért a nullhipotézist elfogadjuk. Kondencia intervallum: [ξ c α SE, ξ + c α SE] = [1187.8, ] a. ξ = , jelentése: az elméleti várható érték becslése. D n (ξ) = 12.05, jelentése: az elméleti szórás (pontatlan) becslése. D n(ξ) = 13.2, jelentése: az elméleti szórás pontosabb becslése. SE = 5.39, jelentése: átlagosan ennyivel tér el a mintaátlag a várható értékt l, ennyi a becslés átlagos hibája. empirikus medián: 990, jelentése: a minta középs eleme, becslés az elméleti mediánra. b. H 0 : µ = 1000, tehát a hipotetikus várható érték µ 0 =

16 Próba statisztika: t = (ξ µ 0 )/SE = 1.86 Kritikus érték: c α = Φ 1 4 (0.95) = 2.02 Döntés: t c α, ezért a nullhipotézist elfogadjuk. Kondencia intervallum: [ξ c α SE, ξ + c α SE] = [979.1, ] Hisztogram: A minimum 5 és 6 közé esik, a maximum 10 és 11 közé. A grakon alapján úgy t nik, hogy két módusz van, ezek 7.5 illetve 9.5 közelébe esnek. A s r ségfüggvény balra ferde, a skewness negatív. A s r ségfüggvény nem szimmetrikus, ami kizárja, hogy a minta normális eloszlásból származzon. Boxplot: min 0, ˆq 25% 300, ˆq 50% 500, ˆq 75% 1100, max 3700, IQR 800, terjedelem Két outlier érték van. A s r ségfüggvény nem szimmetrikus, hanem jobbra ferde. Ezek alapján a skewness pozitív, és a minta nem normális eloszlásból származik a. E(SYS1) 159.9, D(SYS1) 5.8, SE = A hisztogramm alapján úgy t nik, hogy a normális eloszlásból származik. b. H 0 : E(SYS1) = 160, egymintás t-próba: p-érték=0.63, elfogadjuk. H 0 : E(SYS1) = 162, egymintás t-próba: p-érték=0.00, a nullhipotézist elvetjük. Kondencia intervallum: [159.31, ]. A teszt az intervallumba es értékeket fogadja el igazi várható értéknek. c. A kiserleti1 betegcsoportban a hisztogramok rendben vannak, elfogadható a normalitás. H 0 : E(SYS1) = E(SYS2), páros t-próba, p-érték=0.00, a nullhipotézist elvetjük, szignikáns különség van a kezelés el tti és utáni átlagos vérnyomás között. Kondencia intervallum a vérnyomáscsökkenés átlagos értékére: [6.53, 11.71]. f. A kiserleti2 betegcsoportban: E(SYS1) = E(SYS2), páros t-próba, p-érték=0.11, a nullhipotézist elfogajuk. Nincs szignikáns különség a kezelés el tti és utáni átlagos vérnyomás között, nincs statisztikai bizonyíték arra, hogy ez a készítmény hat. Kondencia intervallum a vérnyomáscsökkenés átlagos értékére: [ 3.98, 0.98] a. Legalább 2, de talán 3 módusz is van. Ennek az az oka, hogy az adatsor több különböz fajról tartalmaz adatokat. Érdemesebb az elemzéseket nem a teljes adatsoron, hanem inkább fajonként végezni. b. mintaátlag=2.02, sd=0.27. H 0 : E(sziromszel) = 2, egymintás t-próba: p-érték=0.51, elfogadjuk. A populációátlag nem különbözik szignikáns módon a 2 centimétert l. Kondencia intervalum: [1.95, 2.10]. c. H 0 : E(cseszehossz) = E(sziromhossz), páros t-próba, p-érték=0. A nullhipotézist elvetjük, szignikáns eltérés van a két várható érték között. Kondencia intervallum: [0.91, 1.16]. d. Azonos módszerekkel, mint az el z két pontban. 16

17 8.1. a. A becslések alapján nincs látványos különbség a csoortonkénti várható értékek és szórások között: mean sd kiserleti kiserleti kontroll Ugyanez jelenik meg a csoportonkénti boxploton is. A hisztogramok alapján feltehet, hogy a SYS1 változó minden csoportoban normális eloszlást követ. b. H 0 : a csoportonkénti szórások azonosak Levene-teszt: p-érték=0.28, a nullhipotézist elfogadjuk, nincs szignikáns különbség a szórások között. H 0 : a csoportonkénti várható értékek azonosak ANOVA: p-érték=0.22, a nullhipotézist elfogadjuk, nincs szignikáns különbség a csoporthatások között. c. A becslések alapján és a boxpotok alapján a várható értékek és a szórások között is van különbség. A hisztogram alapján legalább a csoportonkénti normalitás rendben van. Levene-teszt: p-érték=0, szignikáns különbség van a szórások között. Welch-féle ANOVA: p-érték=0, a várható értékek között szignikáns különbség van. Becslés és kondencia intervallum a csoporthatások különbségére: különbség becslés konf. int. kiserleti2 - kiserleti [8.03, 12.69] kontroll - kiserleti [ 3.39, 1.27] kontroll - kiserleti [ 13.75, 9.09] 8.2. a. Csoportonkénti várható érték: fajonkénti populációátlag; csoportonkénti elméleti szórás: fajonkénti szórás. mean sd setosa versicolor virginica A mintaátlagok között látványos az eltérés, és valószín leg a szórások sem lesznek egyenl ek. Ugyanez jelenik meg a boxploton is. A hisztogram alapján a csoportonkénti normalitás bizonytalan. b. H 0 : a csoportonkénti szórások azonosak. Levene-teszt: p-érték=0, elvetjük a nullhipotézist. c. H 0 : a csoportonkénti várható értékek azonosak Welch-féle ANOVA: p-érték=0, elvetjük. Becslés és kondencia intervallum a várható értékek különbségére: 17

18 különbség becslés konf. int. versicolor - setosa 1.08 [0.98, 1.18] virginica - setosa 1.78 [1.68, 1.88] virginica - versicolor 0.70 [0.60, 0.80] d. A cseszeszel változó esetében a Levene-teszt elfogadja a csoportonkénti szórások azonosságát. Emiatt alkalmazhatjuk a síma ANOVA tesztet, ami elveti a várható értékek egyenl ségét a. A hisztogram jobbra ferde, nem t nik normális eloszlásnak. Shapiro-Wilk-próba: p-érték=0, elvetjük azt a nullhipotézist, hogy az Age változó normális eloszlást követ. b. túlél utasok atánya a teljes hajón = E(Survived) Survived = 0.41 H 0 : E(Survived) = 0.4, t-próba, p-érték=0.57, elfogadjuk. 99%-os konndencia intervallum a várható értékre: [0.369, 0.448]. c. A mintában a férak aránya 63%, a n k aránya 37%. Ezek becslések a teljes hajón belüli arányokra. A teszteléshez átkódolással hozzuk létre a Sex2 változót a következ szabállyal: male = 1 female = 0 Nullhipotézis: H 0 : férak aránya a teljes hajón 50%, tehát E(Sex2) = 0.5 t-próba: p-érték=0, elvetjük. 95%-os kondencia intervallum: [0.379, 0.438]. d. H 0 : E(Sex2) = E(Survived), páros t-próba, p-érték=0, elvetjük. 95%-os kondencia intervallum az E(Sex2) E(Survived) különbségre: [0.168, 0.272]. Második kérdés: el ször át kell kódolni a változóka 0/1 érték változókká, utána páros t-próba. e. A teljes hajóra vonatkozó arányokat becsülhetjük a mintabeli relatív gyakoriságokkal. A relatív gyakoriságok nemenkénti bontásban: túlélési arány a férak körében = E(Survived Sex=male) túlélési arány a n k körében = E(Survived Sex=female) H 0 : E(Survived Sex=male) = E(Survived Sex=female) ANOVA: p-érték=0, elvetjük. Szignikáns különbség van a két arány között. f. El ször átkódoljuk az Age változót az Age2 változóba: 0:20 = child 21:40 = middle 41:100 = old A túlélési arány az életkor kategóriákban becsülhet a kategóriánkénti relatív gyakoriságokkal: 18

19 kategória child middle old relatív gyakoriság H 0 : a túlélési arány azonos volt a három kategóriában, tehát E(Survived Age2=child) = E(Survived Age2=middle) = E(Survived Age2=old) ANOVA: p-érték= 0.17, elfogadjuk, nincs szignikáns különbség a. dohányosok aránya= E(Smokes) Smokes = H 0 : E(Smokes) = 0.2, t-próba: p-érték=0.58, elfogadjuk. Kondencia intervallum az arányra: [0.16, 0.23]. b. A dohányosok arányát ismét a relatív gyakoriságokkal becsüljük: dohányosok aránya a férak között = E(Smokes Gender=M) 0.21 dohányosok aránya a n k között = E(Smokes Gender=F) 0.17 H 0 : E(Smokes Gender=M) = E(Smokes Gender=F), ANOVA: p-érték=0.131, a nullhipotézist elvetjük. c. A nemek aránya a mintában: 41.6% n és 58.4% fér. A teszteléshez át kell kódolnunk a Gender változót egy (mondjuk) Gender2 nev 0/1 érték változóba, ami azt kódolja, hogy az egyes hallgatók n k(!) vagy nem: F = 1 M = 0 H 0 : a két nem aránya azonos, tehát 50% a n k aránya, tehát E(Gender2) = 0.5 Egymintás t-próba: p-érték=0, elvetjük. Kondencia intervallum a n k(!) arányára: [0.39, 0.45]. d. Az arányok becslése: Csoport both cats dogs none Becslés H 0 : minden csoportnak azonos a hatása, ANOVA: p-érték=0.0387, elfogadjuk. e. Átkódolással hozzuk létre a következ változókat: CatsDogs Cats: CatsDogs Dogs "both" = 1 "both" = 1 "cats" = 1 "cats" = 0 "dogs" = 0 "dogs" = 1 "none" = 0 "none" = 0 H 0 : E(Cats) = E(Dogs), páros t-próba: p-érték=0.019, elvetjük. Kondencia intervallum az E(Cats) E(Dogs) különbségre: [ 0.081, 0.007] a. A grakon alapján er s pozitív irányú kapcsolat van a két változó között. Az empirikus korrelációs együttható: corr n (SP, HP) = Korrelációs teszt a függetlenségre: p-érték=0, elvetjük azt a nullhipotézist, hogy az SP és a HP változó független. 19

20 95%-os kondencia intervallum: [0.948, 0.978]. b. A regressziós egyenes egyenlete: y = 0.24x R-squared=0.9342, ez nagyon jó illeszkedést jelent, amit az ábra is alátámaszt. c. Most HP = 150, amib l SP 0.24 HP = d. A grakon nem mutat kapcsolatot a két változó között. corr n (SP, VOL) = Korrelációs teszt a függetlenségre: p-érték=0.7, elfogadjuk a függetlenséget. Kondencia intervallum az elméleti korrelációra: [ 0.26, 0.18]. A regressziós egyenes egyenlete: y = 0.027x Nagyon rossz az illeszkedés: R-squared= A becslés: SP VOL = Ez a becslés most nagyon pontatlan, nem sok értelme volt felírni a. A grakon alapján er s pozitív irányú a kapcsolat. corr n (sziromszel, sziromhossz) = Korrelációs teszt: p-érték=0, elvetjük azt a nullhipotézist, hogy a két változó független lenne. Kondencia intervallum az elméleti korrelációra: [0.95, 0.97]. b. Regressziós egyenes: sziromszel 0.42 sziromhossz R-sqaured=0.93, nagyon jó az illeszkedés. c. sziromszel = 0.9 d. A grakon alapján nincs kapcsolat a két változó között. corr n (cseszeszel, cseszehossz = Korrelációs teszt: p-érték=0.15, elfogadjuk a nullhipotézist, hogy a változók függetlenek. Nincs értelme lineáris regressziót csinálni. Kondencia intervallum: [ 0.27, 0.04]. e. Csak a setosa növényeket vizsgálva közepesen er s pozitív irányú kapcsolat van: corr n (sziromszel, sziromhossz) = Regressziós egyenes: cseszeszel 0.8 cseszehossz R-sqaured=0.55, nem túl jó az illeszkedés, de a modell még használható a. Er s negatív irányú kapcsolat van a két változó között. Viszont a kapcsolat nem lineáris jelleg. r n (HP, MPG) = A korrelációs együttható negatív irányú kapcsolatra utal, de csak közepesen er s kapcsolatot jósol. Ez a grakon alapján nem meglep. b. Linerási regresszióval: MPG 0.13 HP R-squared=0.62, tehát nem túl jó az illeszkedés. c. Reciprokos regresszióval: MPG 2373/HP R-squared=0.84, ez már jobb illeszkedést jelent. Becslés: MPG 2373/ = d. Exponenciális regresszióval: MPG exp( HP + 4). R-squared=0.73. Becslés: MPG exp( ) =

21 11.2. a. r n (dollars, pay) = 0.84, r n (SATM, SATV) = Mindkét esetben pozitív irányú lineáris kapcsolat tapasztalható, ezt a graon is alátámasztják. b. Exponenciális regresszió: létrehozzuk az expsatm = exp(satm) változót, majd erre végzünk lineáris regressziót. Az eredmény: percent 0 expsatm + 34 = 0 exp(satm) + 34 R-squared=0.03, nagyon rossz az illeszkedés. Reciprokos regresszió: létrehozzuk a reppercent = 1/percent változót, majd erre végzünk lineáris regressziót. Az eredmény: reppercent SATM 0.61, percent 1/( SATM 0.61). R-squared=0.62. Nem túl jó illeszkedés, de már használható. 21

Alkalmazott statisztika feladatok

Alkalmazott statisztika feladatok Alkalmazott statisztika feladatok 1. Leíró statisztikák és grakonok 1.1. a. Olvassuk be a Davis adatsort a car vagy a cardata csomagból! Ábrázoljuk a weight változó boxplotját, majd értelmezzük az outlier

Részletesebben

Biostatisztika feladatok

Biostatisztika feladatok Biostatisztika feladatok 1. Valószín ség, diszkrét valószín ségi változók 1.1. A biológia szakos hallgatók ebben a félévben két kötelez en választható kurzust vehettek fel. A Sárkányok élettana cím tárgyra

Részletesebben

Biomatematika és biostatisztika feladatok

Biomatematika és biostatisztika feladatok Biomatematika és biostatisztika feladatok 1. Elemi függvények 1.1. A zárt tartályban tárolt gázok nyomása függ a h mérséklett l. Egy tartályban a nyomás 20 C h mérsékleten 10 000 Pascal, és a nyomás 34

Részletesebben

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet Biostatisztika Sz cs Gábor Szegedi Tudományegyetem, Bolyai Intézet 2018/19 tavaszi félév Bevezetés Tudnivalók, követelmények Tudnivalók, követelmények Félév tematikája: Értékelés: Valószín ségszámítás

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Biometria gyakorló feladatok BsC hallgatók számára

Biometria gyakorló feladatok BsC hallgatók számára Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90

Részletesebben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben 1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy

Részletesebben

A konfidencia intervallum képlete: x± t( α /2, df )

A konfidencia intervallum képlete: x± t( α /2, df ) 1. feladat. Egy erdőben az egy fészekben levő tojásszámokat vizsgáltuk egy madárfajnál. A következő tojásszámokat találtuk: 1, 1, 1,,,,,,, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7. Mi a mintának a minimuma, maximuma,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Matematikai statisztika szorgalmi feladatok

Matematikai statisztika szorgalmi feladatok Matematikai statisztika szorgalmi feladatok 1. Feltételes várható érték és konvolúció 1. Legyen X és Y független és azonos eloszlású valószín ségi változó véges második momentummal. Mutassuk meg, hogy

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás paramétereire vonatkozó próbák Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika Survey statisztika mesterszak + földtudomány alapszak Backhausz Ágnes agnes@math.elte.hu Fogadóóra: szerda 10 11 és 13 14, D 3-415 2018/2019. tavaszi félév Bevezetés A statisztika

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László Gyakorló feladatok Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László I/. A vizsgaidőszak második napján a hallgatók %-ának az E épületben, %-ának a D épületben,

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

2. A ξ valószín ségi változó s r ségfüggvénye a következ : c f(x) =

2. A ξ valószín ségi változó s r ségfüggvénye a következ : c f(x) = 1 Egy dobozban hat fehér golyó van Egy szabályos dobókockával dobunk, majd annyi piros golyót teszünk a dobozba, amennyit dobtunk Ezután véletlenszer en húzunk egy golyót a dobozból (a) Mi a valószín sége,

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! A1 A2 A3 (8) A4 (12) A (40) B1 B2 B3 (15) B4 (11) B5 (14) Bónusz (100+10) Jegy NÉV (nyomtatott nagybetűvel) CSOPORT: ALÁÍRÁS: ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! 2011. december 29. Általános tudnivalók:

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Gyakorló feladatok statisztikai programcsomagokhoz

Gyakorló feladatok statisztikai programcsomagokhoz Gyakorló feladatok statisztikai programcsomagokhoz Az elvégzett tesztek eredményeit és azok magyarázatait mentsük el egy valasz.txt, ha ábra is van, a valasz.xls nev fájlba! 1. Nyissuk meg a kolcson.txt-t!

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Statisztika Elıadások letölthetık a címrıl

Statisztika Elıadások letölthetık a címrıl Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Számítógépes döntéstámogatás. Statisztikai elemzés

Számítógépes döntéstámogatás. Statisztikai elemzés SZDT-03 p. 1/22 Számítógépes döntéstámogatás Statisztikai elemzés Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-03 p. 2/22 Rendelkezésre

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17. Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások

Részletesebben

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016 Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait

Részletesebben

Feladatok 2. zh-ra. 1. Eseményalgebra április Feladat. Az A és B eseményekr l tudjuk, hogy P (A) = 0, 6, P (B) = 0, 7 és

Feladatok 2. zh-ra. 1. Eseményalgebra április Feladat. Az A és B eseményekr l tudjuk, hogy P (A) = 0, 6, P (B) = 0, 7 és Feladatok 2 zh-ra 205 április 3 Eseményalgebra Feladat Az A és B eseményekr l tudjuk, hogy P (A) = 0, 7, P (B) = 0, 4 és P (A B) = 0, 5 Határozza meg az A B esemény valószín ségét! P (A B) = 0, 2 2 Feladat

Részletesebben

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai) Gyakorlat (Statisztika alapjai) 2018. december 2. Statisztika alapjai 1 A mérnökinformatikus hallgatók zárthelyi dolgozatot írtak, ahol a maximális pontszám 50 pont volt. Véletlenszer en megnéztük 5 hallgató

Részletesebben

Folyadékszcintillációs spektroszkópia jegyz könyv

Folyadékszcintillációs spektroszkópia jegyz könyv Folyadékszcintillációs spektroszkópia jegyz könyv Zsigmond Anna Julia Fizika MSc I. Mérés vezet je: Horváth Ákos Mérés dátuma: 2010. október 21. Leadás dátuma: 2010. november 8. 1 1. Bevezetés A mérés

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézis Állítás a populációról (vagy annak paraméteréről) Példák H1: p=0.5 (a pénzérme

Részletesebben

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás A feladatok megoldásához használandó adatállományok: potzh és potolando (weboldalon találhatók) Az állományok kiterjesztése sas7bdat,

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,

Részletesebben

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK 2004 november 29. 1.) Lisztbogarak súlyvesztése 9 lisztbogár-csapat súlyát megmérték, (mindegyik 25 bogárból állt, mert egyenként túl kis súlyúak

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21. Középérték és variancia azonosságának próbái: t-próba, F -próba 2012. március 21. Hipotézis álĺıtása Feltételezés: a minta egy adott szempont alapján más populációhoz tartozik, mint b minta. Nullhipotézis

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

Abszolút folytonos valószín ségi változó (4. el adás)

Abszolút folytonos valószín ségi változó (4. el adás) Abszolút folytonos valószín ségi változó (4. el adás) Deníció (Abszolút folytonosság és s r ségfüggvény) Az X valószín ségi változó abszolút folytonos, ha van olyan f : R R függvény, melyre P(X t) = t

Részletesebben

NEVEZETES FOLYTONOS ELOSZLÁSOK

NEVEZETES FOLYTONOS ELOSZLÁSOK Bodó Beáta - MATEMATIKA II 1 NEVEZETES FOLYTONOS ELOSZLÁSOK EXPONENCIÁLIS ELOSZLÁS 1. A ξ valószínűségi változó eponenciális eloszlású 80 várható értékkel. (a) B Adja meg és ábrázolja a valószínűségi változó

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

1. Példa. A gamma függvény és a Fubini-tétel.

1. Példa. A gamma függvény és a Fubini-tétel. . Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +

Részletesebben

Gazdasági matematika II. tanmenet

Gazdasági matematika II. tanmenet Gazdasági matematika II. tanmenet Mádi-Nagy Gergely A hivatkozásokban az alábbi tankönyvekre utalunk: T: Tóth Irén (szerk.): Operációkutatás I., Nemzeti Tankönyvkiadó 1987. Cs: Csernyák László (szerk.):

Részletesebben

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta Közlemény Biostatisztika és informatika alajai. előadás: Az orvostudományban előforduló nevezetes eloszlások 6. szetember 9. Veres Dániel Statisztika és Informatika tankönyv (Herényi Levente) már kaható

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

0,9268. Valószín ségszámítás és matematikai statisztika NGB_MA001_3, NGB_MA002_3 zárthelyi dolgozat

0,9268. Valószín ségszámítás és matematikai statisztika NGB_MA001_3, NGB_MA002_3 zárthelyi dolgozat A 1. A feln ttkorú munkaképes lakosság 24%-a beszél legalább egy idegen nyelvet, 76%-a nem beszél idegen nyelven. Az idegen nyelvet beszél k 2,5%-a, az idegen nyelvet nem beszél k 10%-a munkanélküli. Véletlenszer

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008 Képfeldolgozás 1. el adás. A képfeldolgozás m veletei Mechatronikai mérnök szak BME, 2008 1 / 61 Alapfogalmak transzformációk Deníció Deníció Geometriai korrekciókra akkor van szükség, ha a képr l valódi

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI Statisztikai alapfogalmak a klinikai kutatásban Molnár Zsolt PTE, AITI Bevezetés Research vs. Science Kutatás Tudomány Szerkezeti háttér hiánya Önkéntesek (lelkes kisebbség) Beosztottak (parancsot teljesítő

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel

Részletesebben

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Szűk elméleti összefoglaló Valószínűségi változó: egy függvény, ami az eseményteret a valós számok halmazára tudja vetíteni. A val.

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei Alapfogalmak BIOSTATISZTIKA ÉS INFORMATIKA A valószínűségszámítás elemei Jelenség: minden, ami lényegében azonos feltételek mellett megismételhető, amivel kapcsolatban megfigyeléseket lehet végezni, lehet

Részletesebben