Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Hasonló dokumentumok
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Valószínűség-eloszlás

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Adattípusok, ábrák és grafikonok az excelben

Változók eloszlása, középértékek, szóródás

Elemi statisztika fizikusoknak

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A leíró statisztikák

Segítség az outputok értelmezéséhez

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Vargha András Károli Gáspár Református Egyetem Budapest

Normális eloszlás tesztje

Biomatematika 2 Orvosi biometria

Biostatisztika VIII. Mátyus László. 19 October

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Biometria gyakorló feladatok BsC hallgatók számára

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Grafikonok az R-ben március 7.

Korreláció és lineáris regresszió

Többváltozós lineáris regressziós modell feltételeinek

Matematikai alapok és valószínőségszámítás. Normál eloszlás

GYERMEKEK FIZIKAI FEJLŐDÉSE. Százalékos adatok és görbék. Fiúk Lányok Fiúk Lányok ,8 10,5 12,6 8,1 9,7 11,6

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kutatásmódszertan és prezentációkészítés

NEVEZETES FOLYTONOS ELOSZLÁSOK

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Alkalmazott statisztika feladatok

Matematikai statisztika

Bevezetés a hipotézisvizsgálatokba

Mérési adatok illesztése, korreláció, regresszió

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

y ij = µ + α i + e ij

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

A valószínűségszámítás elemei

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Korrelációs kapcsolatok elemzése

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Microsoft Excel Gyakoriság

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Hipotézis vizsgálatok

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

[Biomatematika 2] Orvosi biometria

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Többváltozós Regresszió-számítás

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Területi sor Kárpát medence Magyarország Nyugat-Európa

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Dr. Kalló Noémi. Termelés- és szolgáltatásmenedzsment. egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék. Dr.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Számítógépes döntéstámogatás. Statisztikai elemzés

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Matematikai geodéziai számítások 6.

4 2 lapultsági együttható =

Kockázatkezelés és biztosítás 1. konzultáció 2. rész

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Nemparaméteres próbák

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Matematikai geodéziai számítások 6.

Ismételt méréses multifaktoriális varianciaanaĺızis (repeated measures MANOVA) szeptember 19.

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Hipotézisvizsgálat R-ben

SEGÉDLET A 2009/2010. TANÉVI BEMENETI MÉRÉS ISKOLAJELENTÉS ÉRTELMEZÉSÉHEZ

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Adatok statisztikai értékelésének főbb lehetőségei

Matematika osztályozó vizsga témakörei 9. évfolyam II. félév:

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

KÖVETKEZTETŐ STATISZTIKA

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Principal Component Analysis

Deutsche Telebank besorolása

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Átírás:

Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk?

Alakmutatók: ferdeség, csúcsosság

Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését (szóródási mutatók) már láttuk, de ez nem minden. Az eloszlás további fontos jellemzői: Ferdeség (skewness): szimmetria mértéke Lapultság/csúcsosság (kurtosis) : mennyire húzódik szét az eloszlás két széle, mennyire hegyes a centrumnál, mennyire lejtős

Ferdeség (skewness) Balra ferde/negatív eloszlás Jobbra ferde/pozitív eloszlás Szimmetrikus (pl. standard normális eloszlás): ferdeség = 0

Medián Módusz Módusz Átlag

Lapultság/csúcsosság (kurtosis) normális eloszlás: csúcsosság = 0 Csúcsosabb eloszlás: a csúcsosság pozitív A lapultság valójában arra utal, hogy az 1 szórásnyira lévő adatok valóban az adatok 68%-át tartalmazzák-e! (ld. később) Lapultabb eloszlás: a csúcsosság negatív

Standardizálás (normalizálás) A ferdeség és csúcsosság paraméterek függetlenek a konkrét értékektől (hol van az eloszlás közepe, milyenek a szóródási viszonyok). Viszont az eloszlások átlaga, szórása sokszor eltérhet a nyers adatok nem összevethetők! Tehát a ferdeségi és csúcsossági együtthatók számításához valahogy közös nevezőre kell hoznunk a különböző változókat, hogy összehasonlíthatók legyenek. Ehhez egy lineáris transzformációval megszüntetjük a konkrét szakmai dimenziót (mértékegységet, pl. kg, cm).

Standardizálás (normalizálás) Ha egy újszülött 56 cm és 4 kg, akkor melyik mérték szerint kiemelkedőbb (extrémebb)? Közvetlenül nem összevethető. Közös mérce: adjuk meg az adat nagyságát azzal, hogy a populáció átlagától hány szórásnyira van. Magyar csecsemők átlagai és az adatok szórása: Testhossz: 49,8 cm 2,5 cm Tömeg: 3,24 kg 0,5 kg Az adott baba ehhez képest: Testhossz: (56 49,8)/2,5 = 2,48 Tömeg: (4 3,24)/0,5 = 1,5

Standardizálás (normalizálás) Ha egy újszülött 56 cm és 4 kg, akkor melyik mérték szerint kiemelkedőbb (extrémebb)? Közvetlenül nem összevethető. Közös mérce: adjuk meg az adat nagyságát azzal, hogy a populáció átlagától hány szórásnyira van. Magyar csecsemők átlagai és az adatok szórása: Testhossz: 49,8 cm 2,5 cm Tömeg: 3,24 kg 0,5 kg Az adott baba ehhez képest: Testhossz: (56 49,8)/2,5 = 2,48 Tömeg: (4 3,24)/0,5 = 1,5 szélsőségesebb

Standardizálás (normalizálás) formalizálása: Z-transzformáció X kvantitatív változó Átlaga a populációban: Szórása a populációban: X változó standardizáltja: Z Z = X μ σ Ha valaki átlagos: Z = 0 Előjel! Pozitív érték: a populációátlagnál nagyobb érték; negatív: a populációátlagnál kisebb érték.

Standardizálás (normalizálás): Z-transzformáció Z elméleti átlaga mindig 0 Z elméleti szórása mindig 1 Az így transzformált értékek átlaga és szórása tehát független az eredeti értékek mértékegységtől (skálaléptékétől) és nagyságszintjétől (középértékétől), és csak az eloszlás azon jellemzőit tükrözi, melyek ezektől függetlenek (lapultság, ferdeség), ezért a változók összehasonlíthatók!

Standardizálás a mintában Egy adott érték: x Mintaátlag: x Minta szórása: s s z = x x s s Jelentése: az adott érték hány szórásnyival tér el a mintaátlagtól (előjelesen!). Vajon mikor használjuk?

Standardizálás: 1. példa Likert skálás adatok: egy adott kérdésre válaszadás 1-től 5-ig terjedő skálán. egyesek (a típus) extrém értékeket adnak (1, 5), mások (b típus) csak a skála közepét használják (2, 3, 4) a két ksz átlaga hasonló (3 körüli), de a szórás különbözik! adatközlő típus válaszok átlag szórás Z-score da a 2 3 1-1 da a 3 0 da a 4 1 bm b 1 3,33333 2,08167-1,1209 bm b 5 0,800641 bm b 4 0,320256 z = x x s s

Standardizálás: 1. példa Ha arra vagyunk kíváncsiak, hogy a kísérletben releváns kérdések esetében az adatközlők magukhoz képest melyik irányba és mennyire térnek el a legtöbbet adott értéktől, azaz nem a érdekel, hogy pontosan milyen értékeléseket adnak, hanem hogy az kirívó-e, vagy semleges. Ehhez az adatközlők saját egyéni átlagértékeire normalizálunk. adatközlő típus válaszok átlag szórás Z-score da a 2 3 1-1 da a 3 0 da a 4 1 bm b 1 3,33333 2,08167-1,1209 bm b 5 0,800641 bm b 4 0,320256 Ugyanaz a 4-es értékelés a szűkebb tartományt használó esetében messzebb van, azaz többet ér, nagyobb a jelentősége.

Standardizálás: példa 2 Ha az egész mintára standardizálunk: megállapíthatjuk, hogy mik a kilógó adatok, mert normális eloszlásban 3 szórásnál messzebb alig vannak adatok! Lásd később a normális eloszlás tulajdonságainál Mi a gond a kilógó adatokkal? Elrontják a normális eloszlást ekkor nem használhatók parametrikus próbák.

Standardizálás: példa 3 Korreláció! Két változó közti (nem feltétlenül ok-okozati) összefüggés vizsgálata (ha az egyik változik, változik-e a másik és ha igen, hogyan). Vajon az ember testtömege (kg) nő az életkor előrehaladtával (év)? A kettő közti összefüggés vizsgálatához el kell tüntetni a (szakmai) dimenziót (= mértékegység!), és valahogy közös nagyságrenden kezelni az értékeket!

Feladat 1-3 Januárban született 12 csecsemő testsúlyadatai: csecsemok.xlsx 3 3,4 3,5 3,83 3,6 2,9 2,52 3,9 4 3,8 3,75 4,4 Testhosszadatai: 49,8 47,5 48 46,3 47 44 49 48,1 49,5 49 45 49 Nemek: Nő ffi nő ffi ffi nő ffi nő nő nő nő nő nő Számoljuk ki: összesített és csoportokra bontott átlagot, mediánt, szórást. excel. Ábrázoljuk grafikonon a nemek eloszlását a mintában! darabteli()

Feladat 4-5-6 Januárban született 12 csecsemő testsúlyadatai: 3 3,4 3,5 3,83 3,6 2,9 2,52 3,9 4 3,8 3,75 4,4 Testhosszadatai: 49,8 47,5 48 46,3 47 48 49 48,1 49,5 49 45 49 Nemek: Nő ffi nő ffi ffi nő ffi nő nő nő nő nő nő A fiúk vagy a lányok születési súlya nagyobb? A fiúk vagy a lányok születési hossza nagyobb? Számoljuk ki: átlag + szórás (excel) Ábrázoljuk (SPSS): medián és interkvartilis tartomány (SPSS) pont diagram hibasávokkal (SPSS) oszlopdiagram hibasávokkal (excel)

Feladat II Súlyban vagy hosszban kiemelkedőbbek a lányok? Mit kell tennünk, hogy összehasonlíthatók és együttesen ábrázolhatók legyenek a tömeg és hossz adatok? Normalizáljuk az adatokat. excel. z = x x s s = (x-átlag())/szórása() A standardizált adatok összehasonlítása grafikusan: SPSS csoportosított pont diagram hibasávval (± 1 SD)

Házi feladat Formázzuk meg az SPSS adattábláinkat! Formázzuk meg az ábráinkat!

Excel Rögzített sorok/oszlopok Sorba rendezés Aritmetikai függvények (szum, szumha, szórása, átlag, medián, módusz) Logikai függvények (bal, jobb, darab, darab2, darabteli) Szövegből oszlopok Grafikonok típusai (köv óra)