Az R adatelemzési nyelv alapjai I.
|
|
- Tivadar Pintér
- 6 évvel ezelőtt
- Látták:
Átírás
1 Gyakorlati feladat megoldása Az R adatelemzési nyelv alapjai I. September 14, 2018 A feladat megoldása során egy olyan adattáblával fogunk dolgozni, amely hipotetikus személyek testmagasság és testsúly adatait tartalmazza. Gyakorlandó ismeretek: adattábla létrehozása statisztikai függvények használata adattáblák összefűzése hiányzó adatok kezelése adatok származtatása leíró statisztikák készítése adattáblákról részhalmazok szűrése adattábla exportálása / importálása 1. Hozzon létre egy adattáblát, amely 50 hipotetikus férfi testmagasságát és testsúlyát tartalmazza. Az adatok előállításához sorsoljon normális eloszlású véletlen számokat (testmagasság átlaga = 175 [cm], szórása = 10 [cm]; testsúly átlaga = 80 [kg], szórása = 10 [kg]). Parancsok: data.frame, rnorm df.ferfi <- data.frame( Magassag = rnorm( n = 50, mean = 175, sd = 10 ), Suly = rnorm( n = 50, mean = 80, sd = 10 ) ) head( df.ferfi ) Magassag Suly Hozzon létre egy másik adattáblát, amely 50 hipotetikus nő testmagasságát és testsúlyát tartalmazza. Az adatok előállításához sorsoljon normális eloszlású véletlen
2 számokat (testmagasság átlaga = 165 [cm], szórása = 8 [cm]; testsúly átlaga = 65 [kg], szórása = 10 [kg]). Parancsok: data.frame, rnorm df.no <- data.frame( Magassag = rnorm( n = 50, mean = 165, sd = 8 ), Suly = rnorm( n = 50, mean = 65, sd = 10 ) ) head( df.no ) Magassag Suly Mindkét táblához fűzzön hozzá egy új oszlopot, amely a személy nemét tartalmazza, majd fűzze össze a két táblát egy új táblává. A további feladatok megoldása során ezt az új táblát használja. Parancsok: rbind df.ferfi$nem <- "Ferfi" df.no$nem <- "No" df <- rbind( df.ferfi, df.no ) df$nem <- as.factor( df$nem ) head( df ) Ferfi Ferfi Ferfi Ferfi Ferfi Ferfi 4. Generáljon véletlenszerű hiányzást az adattáblában a testmagasság és a testsúly oszlopba (~10%-nyi hiányzó adatot generáljon). Tipp: sorsoljon véletlen indexeket a megadott oszlopokban és töltse ki NA -val. Parancsok: sample sample( 1:100, 100 * 0.1 ) [1]
3 df[ sample( 1:100, 10 ), "Magassag" ] <- NA df[ sample( 1:100, 10 ), "Suly" ] <- NA df[!complete.cases( df ), ] NA Ferfi 5 NA Ferfi 6 NA NA Ferfi NA Ferfi 25 NA Ferfi NA Ferfi 40 NA Ferfi NA Ferfi 46 NA Ferfi NA Ferfi 61 NA No 62 NA No NA No 64 NA No 69 NA No 72 NA No NA No NA No NA No 5. Készítsen leíró statisztikákat az adattábláról, összesítve és nemenkénti bontásban is. Figyeljen a hiányzó értékekre. Parancsok: summary, split, lapply summary( df ) Min. :147.4 Min. : Ferfi:50 1st Qu.: st Qu.: No :50 Median :169.6 Median : Mean :170.0 Mean : rd Qu.: rd Qu.: Max. :201.9 Max. : NA's :10 NA's :10 dfs.list <- split( x = df, f = df$nem ) lapply( X = dfs.list, FUN = summary ) $Ferfi Min. :155.7 Min. : Ferfi:50 1st Qu.: st Qu.: No : 0 Median :174.2 Median : 78.48
4 Mean :175.5 Mean : rd Qu.: rd Qu.: Max. :201.9 Max. : NA's :5 NA's :6 $No Min. :147.4 Min. :46.50 Ferfi: 0 1st Qu.: st Qu.:59.45 No :50 Median :165.1 Median :66.79 Mean :164.4 Mean : rd Qu.: rd Qu.:71.33 Max. :181.5 Max. :83.79 NA's :5 NA's :4 6. Pótolja a hiányzó adatokat a nemeknek megfelelő átlagértékek alapján. Parancsok: mean, is.na mean( df$magassag[ df$nem == "Ferfi" ] ) [1] NA mean( df$magassag[ df$nem == "Ferfi" ], na.rm = T ) [1] df$magassag[ is.na( df$magassag ) & df$nem == "Ferfi" ] <- mean( df$magassag[ df$nem == "Ferfi" ], na.rm = T ) df[ is.na( df$suly ) & df$nem == "Ferfi", "Suly" ] <- mean( df$suly[ df$nem == "Ferfi" ], na.rm = T ) df[ is.na( df$magassag ) & df$nem == "No", "Magassag" ] <- mean( df$magassag[ df$nem == "No" ], na.rm = T ) df[ is.na( df$suly ) & df$nem == "No", "Suly" ] <- mean( df$suly[ df$nem == "No" ], na.rm = T ) summary( df ) Min. :147.4 Min. : Ferfi:50 1st Qu.: st Qu.: No :50 Median :169.6 Median : Mean :170.0 Mean : rd Qu.: rd Qu.: Max. :201.9 Max. : lapply( X = split( x = df, f = df$nem ), FUN = summary ) $Ferfi Min. :155.7 Min. : Ferfi:50
5 1st Qu.: st Qu.: No : 0 Median :175.5 Median : Mean :175.5 Mean : rd Qu.: rd Qu.: Max. :201.9 Max. : $No Min. :147.4 Min. :46.50 Ferfi: 0 1st Qu.: st Qu.:59.89 No :50 Median :164.4 Median :65.19 Mean :164.4 Mean : rd Qu.: rd Qu.:71.13 Max. :181.5 Max. : Számítsa ki a BMI értékét minden személyre, és ezt fűzze az adattáblához egy új oszlopba ( BMI ). BMI = testsúly [kg] / (testmagasság [m])^2 df$bmi <- df$suly / ( ( df$magassag / 100 ) * ( df$magassag / 100 ) ) summary( df$bmi ) Min. 1st Qu. Median Mean 3rd Qu. Max A BMI értéke alapján sorolja be a személyeket az alábbi kategóriákba: 18.5 alatt: Alultáplált 18.5 és 25 között: Normális 25 és 30 között: Túlsúlyos 30 felett: Elhízott Ezt fűzze hozzá az adattáblához egy új oszlopba ( BMI.Status ). Parancsok: cut df$bmi.status <- cut( x = df$bmi, breaks = c( 0, 18.5, 25, 30, Inf ), labels = c( "Alultaplalt", "Normalis", "Tulsulyos", "Elhizott" ) ) lapply( X = split( x = df$bmi, f = df$bmi.status ), FUN = summary )
6 $Alultaplalt Min. 1st Qu. Median Mean 3rd Qu. Max $Normalis Min. 1st Qu. Median Mean 3rd Qu. Max $Tulsulyos Min. 1st Qu. Median Mean 3rd Qu. Max $Elhizott Min. 1st Qu. Median Mean 3rd Qu. Max Szűrje le a túlsúlyos személyeket, az elhízott férfiakat, azokat a normális nőket, akiknek a testmagassága átlagon aluli azokat a túlsúlyos vagy elhízott nőket, akiknek a testsúlya meghaladja a normális férfiak átlagos testsúlyát Parancsok: pl. subset, mean stb. # túlsúlyos személyek subset( df, BMI.Status == "Tulsulyos" ) BMI BMI.Status Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Tulsulyos
7 Ferfi Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos No Tulsulyos # elhízott férfiak subset( df, BMI.Status == "Elhizott" & Nem == "Ferfi" ) BMI BMI.Status Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott Ferfi Elhizott # normális nők, akiknek a testmagassága átlagon aluli subset( df, BMI.Status == "Normalis" & Nem == "No" & Magassag < mean( df$magassag[ df$nem == "No" ] ) ) BMI BMI.Status No Normalis No Normalis No Normalis No Normalis No Normalis No Normalis No Normalis No Normalis No Normalis No Normalis
8 # túlsúlyos vagy elhízott nők, akiknek a testsúlya meghaladja a normális férfiak átlagos testsúlyát subset( df, ( BMI.Status == "Tulsulyos" BMI.Status == "Elhizott" ) & Nem == "No" & Suly > mean( df$suly[ df$nem == "Ferfi" ] ) ) BMI BMI.Status No Elhizott No Tulsulyos No Elhizott 10. Exportálja az adattáblát egy szöveges fájlba, majd töltse be onnan. Parancsok: write.table, read.table write.table( x = df, file = "tablazat.txt", quote = F, sep = "\t", row.names = F, col.names = T ) df.2 <- read.table( file = "tablazat.txt", header = T, sep = "\t", quote = "" ) head( df.2 ) BMI BMI.Status Ferfi Tulsulyos Ferfi Tulsulyos Ferfi Elhizott Ferfi Normalis Ferfi Tulsulyos Ferfi Tulsulyos
GYERMEKEK FIZIKAI FEJLŐDÉSE. Százalékos adatok és görbék. Fiúk Lányok Fiúk Lányok 1 72 76 81 69 74 79 8,8 10,5 12,6 8,1 9,7 11,6
MAGASSÁG (cm) SÚLY (kg) Fiúk Lányok Fiúk Lányok min átlag max min átlag max min átlag max min átlag max 0 46 50 54 46 49 54 2,5 3,5 4,3 2,5 3,4 4,2 0,5 64 68 73 62 66 70 6,7 8,2 9,9 6,1 7,5 9,0 1 72 76
Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22
Biostatisztika VIII. Mátyus László. 19 October
Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.
Malnutríció rizikószűrés és testösszetétel vizsgálat a gasztroenterológiai osztályon
Malnutríció rizikószűrés és testösszetétel vizsgálat a gasztroenterológiai osztályon Magyar Mesterséges Táplálási Társaság 2018. évi Kongresszusa Temesváry Ágnes 1, Csabai Csilla 1, Császár Valéria 1,
Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás
Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás A feladatok megoldásához használandó adatállományok: potzh és potolando (weboldalon találhatók) Az állományok kiterjesztése sas7bdat,
NEVEZETES FOLYTONOS ELOSZLÁSOK
Bodó Beáta - MATEMATIKA II 1 NEVEZETES FOLYTONOS ELOSZLÁSOK EXPONENCIÁLIS ELOSZLÁS 1. A ξ valószínűségi változó eponenciális eloszlású 80 várható értékkel. (a) B Adja meg és ábrázolja a valószínűségi változó
III. melléklet. Az alkalmazási előírás és a betegtájékoztató vonatkozó pontjainak módosításai
III. melléklet Az alkalmazási előírás és a betegtájékoztató vonatkozó pontjainak módosításai 26 [Az alábbi szöveget módosítani kell a hatályos kísérőiratban (beillesztés, helyettesítés vagy törlés a megfelelő
Általános lelet. A vizsgálatot kérı orvos: 0 0 0 69 3 8 57 2 6 13 0 2 0 0 0 [mmhg*h]
Általános lelet Páciens: T. Z. Szül. dátum: 1953.3.23 Neme: férfi Megjegyzés: Vizsgálat paraméterei Magasság: 18 Súly: 124 kg cm BMI 38,27 Mérési terv 15/3 (24h) A vizsgálatot kérı orvos: Eredmények SBPao
Leíró statisztika. Adatok beolvasása az R-be és ezek mentése
Leíró statisztika. Adatok beolvasása az R-be és ezek mentése Leíró statisztika Definíciója: populáció egy ismert részhalmazára vonatkozó megfigyelések leírása és összegzése. Jelentősége: nominális adatok
Normális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
Adatelemzés az R-ben. 2014. április 25.
Adatelemzés az R-ben 2014. április 25. Kísérleti adatok elemzése Kísérlet célja: valamilyen álĺıtás vagy megfigyelés empirikus és szisztematikus tesztelése. Pl. a nők többet beszélnek, mint a férfiak,
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,
Segítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)
STATISZTIKA 10. Előadás Megbízhatósági tartományok (Konfidencia intervallumok) Sir Isaac Newton, 1643-1727 Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com
Adatelemzés SAS Enterprise Guide használatával Soltész Gábor solteszgabee[at]gmail.com Tartalom SAS Enterprise Guide bemutatása Kezelőfelület Adatbeolvasás Szűrés, rendezés Új változó létrehozása Elemzések
A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet
A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html
STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)
Normális eloszlás sűrűségfüggvénye STATISZTIKA 9. gyakorlat Konfidencia intervallumok f σ π ( µ ) σ ( ) = e /56 p 45% 4% 35% 3% 5% % 5% % 5% Normális eloszlás sűrűségfüggvénye % 46 47 48 49 5 5 5 53 54
ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
Létszám: 97 / 54 fiú, 43 lány Tanév: 2014/2015. Adatfeltöltöttségi állapot: 88,99083 % Nyomtatás dátuma: :00:11 FIÚK LÁNYOK
Centenáriumi Általános Iskola és Szakiskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 97 / 54 fiú, 43 lány Tanév: 2014/2015 Adatfeltöltöttségi állapot: 88,99083 % Nyomtatás
Elso elemzés Example Athletic
50 KHz R 520 Xc 69 [Víz és BCM zsír nélkül] A mérés 11.07.2005 Ido 15:20 dátuma: Név: Example Athletic Születési dátum: 22.07.1978 Keresztnév: Kor:: 26 Év Neme: férfi Magasság: 1,70 m Mérés sz.: 1 Számított
Létszám: 372 / 182 fiú, 190 lány Tanév: 2014/2015. Adatfeltöltöttségi állapot: 84,16290 % Nyomtatás dátuma: :08:07 FIÚK LÁNYOK
Szent István Közgazdasági Szakközépiskola és Kollégium Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 372 / 182 fiú, 190 lány Tanév: 2014/2015 Adatfeltöltöttségi állapot: 84,16290
Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?
01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó
Létszám: 325 / 163 fiú, 162 lány Tanév: 2014/2015. Adatfeltöltöttségi állapot: 99,08537 % Nyomtatás dátuma: :38:57 FIÚK LÁNYOK
Deák Ferenc Általános Iskola, Gimnázium és Alapfokú Művészeti Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 325 / 163 fiú, 162 lány Tanév: 2014/2015 Adatfeltöltöttségi
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Létszám: 72 / 28 fiú, 4 4 lány Tanév: 2015/2016. Adatfeltöltöttségi állapot: 97,29730 % Nyomtatás dátuma: :59:53 FIÚK LÁNYOK
Sziget szent márt oni Ált alános Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 72 / 28 fiú, 4 4 lány Tanév: 2015/2016 Adatfeltöltöttségi állapot: 97,29730 % Nyomtatás
dr.xlsx A programról Szövegműveletekhez használható függvények
dr.xlsx A programról A CD struktúrája A CD 9 munkafüzetben mutatja be a Microsoft Excel 2003, 2007 és 2010 függvényeit. Az egyes munkafüzetek a "tartalom" munkafüzetből érhetők el a munkafüzet nevére kattintással.
Létszám: 180 / 100 fiú, 80 lány Tanév: 2015/2016. Adatfeltöltöttségi állapot: 100,00000 % Nyomtatás dátuma: :19:32 FIÚK LÁNYOK
Budapest V. Kerület i Hild József Ált alános Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 180 / 100 fiú, 80 lány Tanév: 2015/2016 Adatfeltöltöttségi állapot: 100,00000
Adatfeltöltöttségi állapot: 100,00000 % Nyomtatás dátuma: :47:45 FIÚK LÁNYOK. 11 évesek 6 33% 50% 17% 18 6% 67% 22% 5%
Centenáriumi Általános Iskola és Szakiskola 35090 / 1 Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 104 / 55 fiú, 49 lány Átlagéletkor: 13 Tanév: 2015/2016 Adatfeltöltöttségi
Létszám: 335 / 263 fiú, 72 lány Tanév: 2014/2015. Adatfeltöltöttségi állapot: 99,11243 % Nyomtatás dátuma: :53:30 FIÚK LÁNYOK
Dugonics András Piarista Gimnázium, Alapfokú Művészeti Iskola és Kollégium Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 335 / 263 fiú, 72 lány Tanév: 2014/2015 Adatfeltöltöttségi
Létszám: 789 / 345 fiú, 444 lány Tanév: 2014/2015. Adatfeltöltöttségi állapot: 83,22785 % Nyomtatás dátuma: :38:37 FIÚK LÁNYOK
Pécsi Apáczai Csere János Általános Iskola, Gimnázium, Kollégium, Alapfokú Művészeti Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 789 / 345 fiú, 444 lány Tanév: 2014/2015
VIII. Népegészségügyi Konferencia, Megnyitó 2017.
VIII. Népegészségügyi Konferencia, Megnyitó 2017. Pécsvárady Zsolt Magyar Angiológiai és Érsebészeti Társaság Központi Rizikófelmérési Kérdőív 2012-2016. évi eredmények, és a visszérbetegség kockázat összefüggésének
Adatfeltöltöttségi állapot: 97,46032 % Nyomtatás dátuma: :37:18 FIÚK LÁNYOK. 11 évesek 19 89% 5% 6% 12 8% 58% 17% 17%
Tüköry Lajos Általános Iskola és Alapfokú Művészeti Iskola 201475 / 1 Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 210 / 105 fiú, 105 lány Átlagéletkor: 13 Tanév: 2015/2016
Miskolci Herman Ottó Gimnázium / 1 INTÉZMÉNYI ZÓNAÖSSZESÍTŐ VÁLASZTOTT TANÉV SZERINT TESTÖSSZETÉTEL ÉS TÁPLÁLTSÁGI PROFIL
Miskolci Herman Ottó Gimnázium 29261 / 1 Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 832 / 381 fiú, 451 lány Átlagéletkor: 15 Tanév: 2016/2017 Adatfeltöltöttségi állapot: 99,24
Kutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
Létszám: 175 / 95 fiú, 80 lány Tanév: 2015/2016. Adatfeltöltöttségi állapot: 96,15385 % Nyomtatás dátuma: :18:05 FIÚK LÁNYOK
Szent Erzsébet Kat olikus Ált alános Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 175 / 95 fiú, 80 lány Tanév: 2015/2016 Adatfeltöltöttségi állapot: 96,15385 % Nyomtatás
Gyakorló feladatok 9.évf. halmaznak, írd fel az öt elemű részhalmazokat!. Add meg a következő halmazokat és ábrázold Venn-diagrammal:
Gyakorló feladatok 9.évf.. Mennyi az összes részhalmaza az A a c; d; e; f halmaznak, írd fel az öt elemű részhalmazokat!. Legyen U ;;;;;6;7;8;9, A ;;6;7; és B ;;8. Add meg a következő halmazokat és ábrázold
7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1
52. feladat Stat Jenő egyetemi hallgató autóbusszal jár az egyetemre. Néhány napon át megmérte, hogy mennyit kell várnia az első egyetem felé közlekedő autóbuszra. A következő időket tapasztalta (percben):
Létszám: 324 / 194 fiú, 130 lány Tanév: 2014 /2015. Adatfeltöltöttségi állapot: 113,30590 % Nyomtatás dátuma: :04:56 FIÚK LÁNYOK
Gödöllői Hajós Alfréd Ált alános Iskola Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 324 / 194 fiú, 130 lány Tanév: 2014 /2015 Adatfeltöltöttségi állapot: 113,30590 % Nyomtatás
2.1. A éves népesség munkanélküliségi rátája
2.1. A 15-64 éves népesség munkanélküliségi rátája Az aktív népesség arányában, % Az aktív korú népesség arányában, % férfi nő összesen férfi nő összesen 1990 1,4 1,1 1,4 1,1 0,7 0,9 1991 6,0 5,1 5,6 4,4
Adatmanipuláció, transzformáció, szelekció SPSS-ben
Adatmanipuláció, transzformáció, szelekció SPSS-ben Statisztikai szoftver alkalmazás Géczi-Papp Renáta Számított változó A már meglévő adatokból (változókból) további adatokat származtathatunk. munkavállalók.sav
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Handout-ok a továbbképzés résztvevői számára
STRUKTURÁLATLAN PROBLÉMÁK KEZELÉSE Vonuljak vissza és figyeljek, vagy avatkozzam közbe és mondjam meg nekik, mit kell csinálni? Handout-ok a továbbképzés résztvevői számára Tartalom 1 Strukturált problémák...
VI. Népegészségügyi Konferencia, Megnyitó 2015.
VI. Népegészségügyi Konferencia, Megnyitó 2015. Jubileumi V. Sikeresen Teljesült Évad / 2010-2011 - 2012-2013 - 2014 / Anyagcsere változások Prof dr Kékes Ede Az anyagcsereváltozások elemzésének koncepciója
Az antropometria alkalmazásának célja a hatékony, biztonságos és kényelmes tevékenység biztosítása a méretek és elrendezés helyes megválasztásával
Az antropometria helye TERMÉKFEJLESZTÉS / TERV ERGONÓMIAI FELADATOK ÉS TEVÉKENYSÉGEK ANTROPOMETRIAI ADATOK Az antropometria alkalmazásának célja a hatékony, biztonságos és kényelmes tevékenység biztosítása
1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő
Figyelem! A példasor nem tartalmazza valamennyi típuspéldát. A dolgozatban az órán leadott feladatok közül bármely típusú előfordulhat. A példasor már a második dolgozat anyagát gyakorló feladatokat is
Tehergépkocsi TANFOLYAMOK ÁRAI. Képzés díja (Oktatási + Vizsgadíjak): "C" kategória OKTATÁSI DÍJ. VIZSGADÍJAK (az NKH részére fizetendők)
TANFOLYAMOK ÁRAI Tehergépkocsi "C" kategória Óradíj összesen: 30 óra 6 000,Ft 180 000,Ft 50 000,Ft 230 000,Ft Szerkezeti és üzemeltetési ismeretek: 4 600,Ft Munkavédelem, tűzvédelem, szállítás: 4 600,Ft
STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:
A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,
Típus PH 500 PH 800 PH 1000-B PH 1000-S PH 1250 PH 1500 PH 2000 PH 2500 PH 3000 PH 4000 PH 5000
PO-HEAT ÉTEGTÁOLÓ TEMÉKLEÍÁS Pro-Heat rétegtároló szféracserélő csatlakozóval Acélból (S 235 J) készült kiváló minőségű rétegtároló fűtésüzemhez napkollektoros berendezéssel összekötve. A rétegelt szolár
NETFIT mérés. Az iskola eredményei 2015/16. TESTÖSSZETÉTEL ÉS TÁPLÁLTSÁGI PROFIL. Testtömeg-index (BMI: kg/m 2 ) 10 évesek 0 0
NETFIT mérés A NETFIT egészségközpontú, és egységes formában kínál komplex, tudományosan megalapozott megoldást a tanulói fittségi állapotmérésre. A pedagógiai eszköz alkalmazásának célja az egészséghez
Logisztikus regresszió október 27.
Logisztikus regresszió 2017. október 27. Néhány példa Mi a valószínűsége egy adott betegségnek a páciens bizonyos megfigyelt jellemzői (pl. nem, életkor, laboreredmények, BMI stb.) alapján? Mely genetikai
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel
Adatfeltöltöttségi állapot: 23,51 % Nyomtatás dátuma: :26: é ve s e k 3 100% 1 100% 13 é ve ses e k 5 20% 60% 20% 2 50% 50%
Győri Eöt vös Józ sef Ált alános Iskola és Sz akköz épiskola 30 552 / 1 Fokozott fejlesztés szükséges Fejlesztés szükséges Egészségzóna Létszám: 76 / 49 fiú, 27 lány y Átlagéletkor: 15 Tanév: 20 17/20
A beadandó 4 db feladatból áll. Mindegyik feladatra külön jegyet kap, amelyek beszámítanak a félév végi jegybe.
Beadandó feladatok A beadandó 4 db feladatból áll. Mindegyik feladatra külön jegyet kap, amelyek beszámítanak a félév végi jegybe. A leadási határidő lecsúszása esetén -1 jegy az adott feladatra, 2 óránként.
6. Előadás. Vereb György, DE OEC BSI, október 12.
6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás
Az elhízás, a bulimia, az anorexia. Az elhízás
Az elhízás, a bulimia, az anorexia Az elhízás Elhízás vagy túlsúlyosság elhízás a testsúly a kívánatosnál 20%-kal nagyobb túlsúlyosság a magasabb testsúly megoszlik az izmok, csontok, zsír és víz tömege
Az OECD PISA adatbázis elemzése
Az OECD PISA adatbázis elemzése A program Emlékeztető a múlt hétről A PISA val kapcsolatos honlapok tartalma és az online elérhető dokumentáció A PISA adatbázisának felépítése A PISA makróinak használata,
Fontos azt figyelembe venni, hogy az egy-két fős létszámok nem reprezentatívak. Nyilván ezt az iskolai szintű eredményeknél kell értelmezni.
A Landorhegyi Sportiskolai Általános Iskola NETFIT eredményeinek iskolai, városi és országos összehasonlító elemzése, értékelése a 20/20-ös tanévben Fontos azt figyelembe venni, hogy az egy-két fős létszámok
Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?
Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles
Valószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
III. Népegészségügyi Konferencia, Megnyitó 2012. A 2011. év szűrővizsgálatainak eredményei. Dr. Barna István
III. Népegészségügyi Konferencia, Megnyitó 2012. A 2011. év szűrővizsgálatainak eredményei Dr. Barna István Vérnyomás A szűrésben részvevők 29 százalékának normális a vérnyomása; 23 százalék az emelkedett
Adatok importálása R-ben
Adatok importálása R-ben Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.hu Utolsó módosítás: 2019. június 11. Telepítendő csomagok A példák kipróbálásához telepítendő
Matematikai statisztika
Matematikai statisztika Survey statisztika mesterszak + földtudomány alapszak Backhausz Ágnes agnes@math.elte.hu Fogadóóra: szerda 10 11 és 13 14, D 3-415 2018/2019. tavaszi félév Bevezetés A statisztika
A leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
MH Honvéd Egészségügyi Központ, Preventív Igazgatóság, Fizikai Alkalmasság-vizsgáló Osztály Budapest, 2009. január 22.
A toborzó irodákon keresztül jelentkező leendő szerződéses állomány vizsgálati tapasztalatai (2007. szept - 2008. dec.) Juhász Zsolt őrnagy MH Honvéd Egészségügyi Központ, Preventív Igazgatóság, Alkalmasság-vizsgáló
QP és QX mélykútszivattyúk 4"
QP 4A-8 0,25 2,8 A - 20 681 mm 11,5 kg 1 1/4" QP 4A-12 0,37 3,3 A 1,6 A 20 761 mm 12,0 kg 1 1/4" QP 4A-18 0,55 4,4 A 1,7 A 25 896 mm 13,5 kg 1 1/4" QP 4A-25 0,75 5,8 A 2,5 A 35 1061 mm 15,4 kg 1 1/4" QX
Hogyan mentsd meg a szíved?
Hogyan mentsd meg a szíved? Mivel minden második haláleset oka szív- és érrendszeri betegségbõl adódik, a statisztikán sokat javíthatunk, ha tudjuk, hogyan is küzdjünk e probléma ellen. Pl. már minimális
PHP-MySQL. Adatbázisok gyakorlat
PHP-MySQL Adatbázisok gyakorlat Weboldalak és adatbázisok Az eddigiek során megismertük, hogyan lehet a PHP segítségével dinamikus weblapokat készíteni. A dinamikus weboldalak az esetek többségében valamilyen
ÁR kulcsrakész ÁR lapraszerelt
Szélesség (cm) 90 Magasság (cm) 85 52 266 Ft 39 412 Ft 54 057 Ft 41 203 Ft 54 095 Ft 41 005 Ft 54 455 Ft 41 365 Ft 55 143 Ft 42 052 Ft 57 396 Ft 44 305 Ft 56 886 Ft 43 795 Ft 58 146 Ft 45 055 Ft 55 316
Deutsche Telebank besorolása
1. feladat Függvény segítségével számítsa ki az átlagokat és azt, hogy hány ország kapta meg a maximális 10 pontot. Az EU tagállamokat átlag pontszámuk alapján minősítik. Az alábbi segédtáblázat alapján
Elso elemzés Example Anorexia
50 KHz R 739 Xc 62 [Víz és BCM zsír nélkül] A mérés 11.07.2005 Ido 15:11 dátuma: Név: Example Anorexia Születési dátum: 05.02.1981 Keresztnév: Kor:: 24 Év Neme: no Magasság: 1,65 m Mérés sz.: 1 Számított
A lovassportban versenyzők szakágak, nemek és életkor szerinti elemzése
Bardóczky Veronika A lovassportban versenyzők szakágak, nemek és életkor szerinti elemzése 2015. március 25. Tartalom 1. Összefoglaló... 1 2. Módszertan... 2 3. Eredmények... 4 3.1. Díjlovaglás... 4 3.2.
Feladatok. Az adatokat tartalmazó munkafüzetet mentsük le saját számítógépünkre, majd onnan nyissuk meg az Excel programmal!
1. Feladat A táblázatunk négy légitársaság jegyeladását tartalmazza, negyedéves bontásban. Válaszoljunk a táblázat alatt lévő kérdésekre! Az eredmény IGAZ, vagy HAMIS legyen. Készítette: SZÁMALK Zrt, Szakképzési
MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:
1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti: 100% 90% 80% 70% 60% 50% 2010 2011 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% a) Nevezze
Kérem, ismerkedjen meg a DigitAudit program AuditTeszt moduljának Adatok tesztelése menüpontjával.
Tisztelt Felhasználó! Kérem, ismerkedjen meg a DigitAudit program AuditTeszt moduljának Adatok tesztelése menüpontjával. A program céljai: A programot azért fejlesztettük ki, hogy segítséget adjunk a nagytömegű
Laktózérzékenyek táplálkozási szokásainak hatása a testösszetételre
Laktózérzékenyek táplálkozási szokásainak hatása a testösszetételre DR. PÁLFI ERZSÉBET 1, DAKÓ SAROLTA 2, MOLNÁR RÉKA 3, DR. MIHELLER PÁL 2 1 SEMMELWEIS EGYETEM EGÉSZSÉGTUDOMÁNYI KAR DIETETIKAI ÉS TÁPLÁLKOZÁSTUDOMÁNYI
Korreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Általános lelet. A vizsgálatot kérő orvos: 70 30 38 59 29 37 11 1 2 0 0 0 [mmhg*h]
Általános lelet Páciens: Neme: férfi Megjegyzés: Vizsgálat paraméterei Magasság: 18 Súly: 125 kg cm BMI 38.58 Mérési terv 15/3 (24h), Standard 1 A vizsgálatot kérő orvos: Eredmények SBPao HR Általános
VI. Népegészségügyi Konferencia, Megnyitó 2015.
VI. Népegészségügyi Konferencia, Megnyitó 2015. Jubileumi V. Sikeresen Teljesült Évad / 2010-2011 - 2012-2013 - 2014 / 2010-2011-2012-2013-2014. évi eredmények, összefüggések bemutatása II. Dr. habil Barna
Magyarország átfogó egészségvédelmi szűrőprogramja 2010 2020
Magyarország átfogó egészségvédelmi szűrőprogramja 2010 2020 www.egeszsegprogram.eu EMBERI ERŐFORRÁSOK MINISZTÉRIUMA A Programban résztvevők egészségi állapotára irányuló statisztikai jelentés Projekt:
s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés
A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége,
Bevezetés a programozásba I.
Elágazás Bevezetés a programozásba I. 2. gyakorlat, tömbök Surányi Márton PPKE-ITK 2010.09.14. Elágazás Elágazás Eddigi programjaink egyszer ek voltak, egy beolvasás (BE: a), esetleg valami m velet (a
1. Tankönyvrendelés. 2. Mátyás király. 3. Halma. I n f o r m a t i k a é r e t t s é g i, k ö z é p s z i n t, o k t ó b e r 2 7.
1. Tankönyvrendelés Az iskolai tankönyvrendelés többlépcsős művelet. A tankönyvrendelés folyamatos jegyzéséhez egy nyomtatványt készítettünk, melynek egy része látható a mintán. 1. A diákok számára javasolt
Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016
Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait
Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?
Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet
A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai
Matematikai alapok és valószínőségszámítás. Normál eloszlás
Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak
FÖL(D)PÖRGETŐK HÁZI VERSENY 2. FORDULÓ 5-6. évfolyam Téma: Lelkünk temploma, avagy nagyító alatt az emberi test
A Földpörgetők versenyen, minden tantárgy feladataira összesen 20 pontot lehet kapni, így egy forduló összpontszáma 100 pont a feladatok számától függetlenül. Csak a kiosztott fejléces üres papírokra lehet
Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Statisztika
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Statisztika A szürkített hátterű feladatrészek nem tartoznak az érintett témakörhöz, azonban szolgálhatnak fontos információval az érintett feladatrészek
Bevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
Normális eloszlás paramétereire vonatkozó próbák
Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású
Excel gyakorlása 1. 2. Hozd létre az alábbi cellastruktúrát a harmadik munkalapra! 3. A második munkalapra készítsd el a következő naptár részletet!
Excel gyakorlása 1. 1. Készíts el egy fiktív órarendet! Használj legalább 10 karakter- és cellaformázási lehetőséget! (Betű típus, szín, kitöltőszín, cellaméretezés, -igazítás, -egyesítés, szegélyek, stb.)
Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék
Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17. Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások