Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése



Hasonló dokumentumok
Matematikai alapok és valószínőségszámítás. Bevezetés Statisztikai mintavétel

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás

A gyakorló feladatok számozása a bevezetı órát követı órán, azaz a második órán indul. Gyakorló feladatok megoldásai 1

Vargha András Károli Gáspár Református Egyetem Budapest

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Ismétlı áttekintés. Statisztika II., 1. alkalom

V. Gyakorisági táblázatok elemzése

Adatok statisztikai értékelésének főbb lehetőségei

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

[Biomatematika 2] Orvosi biometria

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Biomatematika 2 Orvosi biometria

Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/ félév Arató Miklós

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Vizuális adatelemzés

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Kutatásmódszertan és prezentációkészítés

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Sta t ti t s i zt z i t k i a 1. előadás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Microsoft Excel Gyakoriság

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.

NEVEZETES FOLYTONOS ELOSZLÁSOK

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kollányi Bence: Miért nem használ internetet? A World Internet Project 2006-os felmérésének eredményei

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Változók eloszlása, középértékek, szóródás

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Az empirikus vizsgálatok alapfogalmai

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

2. előadás. Viszonyszámok típusai

Vizuális adatelemzés

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Matematikai alapok és valószínőségszámítás. Valószínőségszámítási alapok

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztikai módszerek

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

KÖVETKEZTETŐ STATISZTIKA

Biomatematika 2 Orvosi biometria

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Segítség az outputok értelmezéséhez

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Sta t ti t s i zt z i t k i a 3. előadás

Alapfogalmak áttekintése. Pszichológiai statisztika, 1. alkalom

Bevezető Mi a statisztika? Mérés Csoportosítás

[GVMGS11MNC] Gazdaságstatisztika

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

[Biomatematika 2] Orvosi biometria

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

14-469/2/2006. elıterjesztés 1. sz. melléklete. KOMPETENCIAMÉRÉS a fıvárosban

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv Március 13.

y ij = µ + α i + e ij

Statisztika 10. évfolyam. Adatsokaságok ábrázolása és diagramok értelmezése

Bevezetés az SPSS program statisztikai alapjaiba. Előadó: Dr. Balogh Péter

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

A statisztika alapjai - Bevezetés az SPSS-be -

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

A Statisztika alapjai

Függetlenségvizsgálat, Illeszkedésvizsgálat

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Matematikai statisztika

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Elemi statisztika fizikusoknak

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Matematikai statisztika

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Szakdolgozat. Pongor Gábor

A 3. országos kompetenciamérés (2004) eredményeinek értékelése, alkalmazása iskolánkban

A társadalomtudományi kutatás teljes íve és alapstratégiái. áttekintés

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

Nemparaméteres próbák

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Többszempontos variancia analízis. Statisztika I., 6. alkalom

A leíró statisztikák

[Biomatematika 2] Orvosi biometria

Biometria gyakorló feladatok BsC hallgatók számára

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Biostatisztika Összefoglalás

Kutatói pályára felkészítı modul

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mesterséges Intelligencia I.

Biostatisztika VIII. Mátyus László. 19 October

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

MINTAVÉTELEZÉS. Alaptípusai: sampling. véletlen érvényesítésére v. mellőzzük azt. = preferenciális mintav. = véletlen mintav.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Területi statisztikai elemzések

Valószínűségszámítás összefoglaló

Kvantitatív kutatás mire figyeljünk? Majláth Melinda PhD Tartalom. Kutatási kérdés kérdőív kérdés. Kutatási kérdés kérdőív kérdés

Átírás:

Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése

Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık mentén vizsgáljuk, adatokat győjtünk (pl. az iskolai végzettség és a kreativitás). Ezek a jellemzık általában vizsgálati egységrıl vizsgálati egységre változnak, ezért ezeket statisztikai változóknak nevezzük.

Adatmátrix Nem Iskolai végzettség Intelligencia Testmagasság Személy 1 Férfi alapfokú 95 190 Személy 2 Férfi felsıfokú 123 173 Személy 3 Nı alapfokú 111 178 Személy 4 Nı középfokú 109 162 Személy 5 Férfi középfokú 130 169 Személy 6 Nı posztgraduális 95 165 Személy 7 Férfi felsıfokú 104 184

Adatmátrix A statisztikai változók értékeirıl beszélünk, és ezeket az értékeket konvencionálisan számokkal reprezentáljuk. Nem Iskolai végzettség Intelligencia Testmagasság Személy 1 1 1 95 190 Személy 2 1 3 123 173 Személy 3 2 1 111 178 Személy 4 2 2 109 162 Személy 5 1 2 130 169 Személy 6 2 4 95 165 Személy 7 1 3 104 184

Statisztikai változók típusai I. Számoknak számos különbözı tulajdonsága van: Sorba rendezhetık Összegük is értelmes Hányadosuk is értelmes A statisztikai változók megkülönböztethetık aszerint, hogy a fenti tulajdonságok közül melyekkel rendelkeznek! Ez alapján négy ún. mérési skáláról beszélhetünk statisztikai változók esetén.

Nominális skála A változó a számok egyetlen tulajdonságával sem rendelkezik Kit kedvel a leginkább a következı festık közül? 1. Dalí 2. Klimt 3. Van Gogh 4. Da Vinci Biológiai nem 1. Férfi 2. Nı Milyen cigarettát szív?

Ordinális skála A számok tulajdonságai közül rendelkezik a sorba rendezhetıséggel. Pl. Iskolai végzettség: 1. Alapfokú, vagy az sem 2. Középfokú 3. Felsıfokú 4. Posztgraduális Ordinális skála esetén igaz az, hogy 1<2<3<4 DE: nem mondhatjuk, hogy: 2-1=4-3

Intervallum skála Értékei sorba rendezhetık és összegük (különbségük) is értelmes. Intelligencia teszten elért pontszámok Sorba rendezhetı: 99<100<101 A különbségük értelmes: 75-70=120-115 DE: az arányuk már nem értelmezhetı: NEM mondhatjuk, hogy a 90-es IQ a 180-as IQ fele

Arány skála A változó értékei sorba rendezhetık, különbségük és arányuk is értelmes Testmagasság Sorba rendezhetı: 160<170<171 A különbségük értelmes: 75-70=190-185 Az arányuk is értelmes: 80cm éppen 160cm fele

Skála-típusok összefoglalása sorbarendezhetı különbség értelmes arány értelmes nominális nem nem nem ordinális igen nem nem intervallum igen igen nem arány igen igen igen

Statisztikai változók típusai II. Az alapján, hogy hány különbözı értéket vehet fel egy adott változó két típust különböztethetünk meg: Diszkrét változó: véges számú különbözı értéket vehet fel, és az értékek egymástól jól elkülönülnek. Pl.: iskolai végzettség, családi állapot Folytonos változó: értékei folytonosan helyezkednek el. Pl.: reakcióidı, testmagasság

Statisztikai változók típusai III. Attól függıen, hogy számszerősíthetı-e egy adott változó szintén két típust különböztethetünk meg: Kvalitatív változó: bár a változó értékei számokká konvertálhatók, ám ezek a számok nem rendelkeznek a számok egyetlen tulajdonságával sem. A változó értékei nem számszerősíthetı minıséget fejeznek ki. Pl.: biológiai nem, családi állapot Kvantitatív változó: A változó értékei számszerősíthetı minıséget fejeznek ki. Pl.: reakcióidı, testmagasság

Statisztikai változók típusai Skálatípus? Kvalitatív vagy kvantitatív változó? Diszkrét vagy folytonos változó? Dohányzási szokásokat mérı kérdıív alapján a függıség számszerősített mértéke (20 fokú skálán). Dohányzással töltött idı naponta Milyen cigarettát szív? Dohányzik? Gyakran, ritkán, soha.

A változók eloszlása a populációban és a mintában Az adatmátrixból minden személyrıl számos információt leolvashatunk pl. neme, végzettsége, depresszió mértéke Alapvetıen azonban a populáció érdekel bennünket pl. mekkora hányada milyen nemő, végzettségő, depresszió tekintetében milyen az eloszlás Adataink azonban csak a mintáról vannak, ennek szerepe, hogy segítségével becsüljük a populáció jellemzıit. Minél reprezentatívabb a minta, annál sikeresebb a becslésünk pl. mekkora hányada milyen nemő, végzettségő, depresszió tekintetében milyen az eloszlás

Leíró statisztikák Vizsgálataink során tehát kérdéseket fogalmazunk meg, meghatározzuk azon populációt, amelyre az érdeklıdésünk irányul, majd a sokaságból mintát veszünk (lehetıleg nagyszámú, véletlen mintát) és a mintába került megfigyelési egységeinkrıl adatokat győjtünk különbözı statisztikai változók (a megfigyelési egységek jellemzıi, ismérvei) mentén. Az összegyőjtött adatokat adatmátrixban rögzítjük, melyben jellemzıen egy megfigyelési egység (eset) egy sor, míg az egyes oszlopok egy-egy változót reprezentálnak. Minthogy azonban az ideális minta nagyszámú megfigyelési egységet tartalmaz, az adatmátrix általában túlontúl terjedelmes ahhoz, hogy egyszerő megtekintés útján megállapíthassuk az adatok lényeges tulajdonságait. Az adatok lényeges ismérveinek jellemzésére, leírására ún. leíró statisztikákat használunk. Erre a célra használhatunk: Grafikus módszereket Az adatokból számolt összegzı statisztikákat

Gyakorisági eloszlás (nominális változó) Egy változó jellemezhetı azzal, hogy különbözı értékei hányszor, milyen gyakran fordulnak elı az adott mintában. A gyakorisági eloszlás éppen ezt, a változó értékeinek gyakoriságát fejezi ki. Pl. Etnikai hovatartozás gyakoriság relatív gyakoriság százalék 1. Latin 135.26 26 % 2. Fehér 309.60 60 % 3. Ázsiai 5.01 1 % 4. Afrikai 9.02 2 % 5. Indián 9.02 2 % 6. Multietnikai 13.03 3% 7. Egyéb 38.07 7 %

Oszlopdiagram

Oszlopdiagram

Gyakorisági eloszlás (ordinális változó) Pl. iskolai végzettség: gyak rel. gyak. % kum. gyak. Kum. % középiskola 210.40 40 210 40 2 év fıiskola 118.23 23 328 63 4 év fıiskola 143.28 28 471 91 master 38.07 7 509 98 PhD 10.02 2 519 100

Oszlopdiagram

Gyakorisági eloszlás (folytonos változó) Pl. naponta elszívott cigaretták száma érték 1 1 2 2 4 5 5 7 6 4 7 2 8 2 9 1 10 35 12 14 14 2 15 36 16 2 17 1 18 12 20 138 gyakoriság érték gyakoriság 22 6 23 1 24 2 25 53 28 1 29 2 30 75 32 1 33 1 35 23 40 54 45 11 50 16 60 11 65 1 80 1

Oszlopdiagram Folytonos változók esetén az oszlopdiagram nem a megfelelı megoldás az adatok grafikus megjelenítésére, mert a változónak túl nagyszámú értéke van, amelyek gyakorisága meglehetısen kicsi lesz, még nagy minta esetén is.

Hisztogram Az értékeket intervallumokba soroljuk, és az egyes intervallumokba esı értékek gyakoriságára koncentrálunk. Ha pl. a naponta elszívott cigaretták számát 8 intervallumba (1-10, 11-20, 21-30,, 71-80) soroljuk, a balra látható hisztogramot kapjuk.

Hisztogram Az intervallumok száma (bizonyos határok között) önkényesen megválasztható, azonban a túl sok vagy túl kevés intervallum sem jó, mivel az elıbbi esetben nem tömörítjük kellıképpen az információt, míg az utóbbi esetben pedig éppen fordítva, olyannyira tömörítjük, ami már információvesztést okozhat.

A sőrőségfüggvény Mint láttuk, a folytonos változók mintabeli eloszlását hisztogrammal reprezentáljuk, de ha a folytonos változók populációbeli eloszlását tekintjük, azt legjobban az ún. sőrőségfüggvénnyel lehet leírni. A sőrőségfüggvény jellemzıi: X változó minden x értékéhez egy nem negatív számot rendel (ez a szám nagyobb azon x-ek közelében, ahol az adatok jobban sőrősödnek) Az egy-egy szakaszra esı terület a populáció ezen szakaszra esı arányát adja meg A sőrőségfüggvény alatti összterület 1, azaz 100% más néven eloszlásgörbének is nevezzük

Példa sőrőségfüggvényre -3-2 -1 0 1 2 3 t-eloszlás (df=3)