MINTAVÉTELEZÉS. Alaptípusai: sampling. véletlen érvényesítésére v. mellőzzük azt. = preferenciális mintav. = véletlen mintav.

Hasonló dokumentumok
Adatok statisztikai értékelésének főbb lehetőségei

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

[Biomatematika 2] Orvosi biometria

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Biomatematika 2 Orvosi biometria

[Biomatematika 2] Orvosi biometria

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Bevezetés az SPSS program használatába

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Területi statisztikai elemzések

6. Előadás. Vereb György, DE OEC BSI, október 12.

A statisztika alapjai - Bevezetés az SPSS-be -

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Mintavételi eljárások

Dr. Király István Igazságügyi szakértő Varga Zoltán Igazságügyi szakértő Dr. Marosán Miklós Igazságügyi szakértő

Vargha András Károli Gáspár Református Egyetem Budapest

A statisztika alapjai - Bevezetés az SPSS-be -

Varianciaanalízis 4/24/12

s.s. Bere Anikó Zsuzsanna

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Bevezető Mi a statisztika? Mérés Csoportosítás

Környezet statisztika

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Függetlenségvizsgálat, Illeszkedésvizsgálat

EÖTVÖS LORÁND SZAKKÖZÉP- ÉS SZAKISKOLA TANÍTÁST SEGÍTŐ OKTATÁSI ANYAGOK MÉRÉS TANTÁRGY

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Mérés és skálaképzés. Kovács István. BME Menedzsment és Vállalatgazdaságtan Tanszék

Érettségi feladatok: Trigonometria 1 /6

Mérés és modellezés 1

Mérés és modellezés Méréstechnika VM, GM, MM 1

MATEMATIKA ÉRETTSÉGI május 3. EMELT SZINT I.

MATEMATIKA PRÓBAÉRETTSÉGI 2013 I. rész

[GVMGS11MNC] Gazdaságstatisztika

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Matematika alapjai; Feladatok

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé.

Kvantitatív kutatás mire figyeljünk? Majláth Melinda PhD Tartalom. Kutatási kérdés kérdőív kérdés. Kutatási kérdés kérdőív kérdés

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

MATEMATIKA ÉRETTSÉGI május 8. EMELT SZINT

Kutatói pályára felkészítı modul

Segítség az outputok értelmezéséhez

1. Olvassuk be két pont koordinátáit: (x1, y1) és (x2, y2). Határozzuk meg a két pont távolságát és nyomtassuk ki.

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

BIOMATEMATIKA ELŐADÁS

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Populációbecslések és monitoring

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

KÖVETKEZTETŐ STATISZTIKA

Méréselmélet MI BSc 1

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Elemi statisztika fizikusoknak

Bevezetés a hipotézisvizsgálatokba

Sta t ti t s i zt z i t k i a 1. előadás

y ij = µ + α i + e ij

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

A leíró statisztikák

} számtani sorozat első tagja és differenciája is 4. Adja meg a sorozat 26. tagját! A = { } 1 pont. B = { } 1 pont. x =

Az egyenes egyenlete: 2 pont. Az összevont alak: 1 pont. Melyik ábrán látható e függvény grafikonjának egy részlete?

[Biomatematika 2] Orvosi biometria

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Valószínűségi változók. Várható érték és szórás

Populációbecslések és monitoring

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Két adatfelvétel: a szegény háztartások fogyasztási szokásai és a tulajdonosi jövedelmek szerkezete. Medgyesi Márton Tárki Zrt

Matematikai statisztika

Normális eloszlás tesztje

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Feladatok MATEMATIKÁBÓL II.

Emelt szintű érettségi feladatsorok és megoldásaik Összeállította: Pataki János; dátum: november. I. rész

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

A társadalomkutatás módszerei I.

Növénytársulások cönológiai felvételezése

Mit nevezünk nehézségi erőnek?

Átírás:

A teljes alapsokaságot nem ismerhetjük meg. MINTAVÉTELEZÉS Fontossága: minden későbbi értékelés ezen alapszik. Alaptípusai: Szubjektív folyamat Objektív folyamat (non-probabilistic) (probabilistic) sampling Nincs lehetőség a véletlen hatásokat véletlen érvényesítésére viszünk bele v. mellőzzük azt. = preferenciális mintav. = véletlen mintav. A MINTAVÉTEL FŐBB KRITÉRIUMAI 1.Univerzumhalmaz sajátságai Diszkrét (D): véges sok (vagy megszámlálhatóan végtelen) egység illetve lehetőség a mintavételre. A mintavételnek természetes egységei vannak, nem kérdés a mve.(mintavételi egység) mérete és alakja, ezek adottak. Folytonos (F): A populáció egy kontinuumot alkot a térben, a természetes egységek hiányoznak, az ember kénytelen mesterséges határokat vonni. Fontos kérdés tehát a mve. alakja és mérete. Elvileg megszámlálhatatlanul végtelen sok mintavételezési lehetőség van. 2. Vizsgálat célja Becslés: egy paraméter meghatározása variancia minimalizálás Mintázatelemzés: ökológiai / cönológiai / taxonómiai mintázatok, sokféleség vizsgálata variancia maximalizálás 1

3. Vizsgálat szintje a. egyedi b. faji (populációs) c. társulás d. táj stb A MINTAVÉTEL FŐBB JELLEMZŐI 1. Mve. száma = a minta mérete (sample size) 2. Mve. kiválasztásának, ill. elrendezésének a módja Csak folytonos esetre: 3. Mve. nagysága 4. Mve. alakja A MVE KIVÁLASZTÁSÁNAK ÉS ELRENDEZÉSÉNEK MÓDJA Random mintavétel: ábramagyrázat ld. köv. oldal 2

Diszkrét: minden egyed ugyanolyan vsz-gel kerül a mintába a) a véletlenszerűen kiválasztott koordinátákhoz legközelebb eső elemet választjuk b) az egyik kiválasztott elemtől a következőt a véletlenszerűen kivál. szögben és távolságra választjuk ki c) szabályos elrendezésnél: véletlenszerűen kivál. koordinátájú elemeket választunk Folytonos: az univerzumhalmaz minden pontja ugyanolyan vsz-gel kerül a mintába d) a mve.-et véletlenszerűen kivál. koordinátájú középpont körül helyezzük el e) az előző mve. középpontjától véletlenszerűen kivál. szögben és távolságra jelöljük ki a következőt Rétegzett random mintavétel: Korábbi információ alapján az univerzumhalmazt részekre osztjuk. Minden részhalmazt külön mintavételezünk randomizálva, azután egyesítjük az adatokat. Az egyes rétegekből vett minta nagysága arányos lehet a területtel, egyedszámmal vagy lehet variancia-arányos (ahol nagyobb a V, ott több mve.) B A C Szisztematikus m.v. (ábra a köv. oldalon) a) Folyt.: véletlenszerűen kivál. az első mve. középpontját, majd attól mindig azonos távolságra jelöljük ki a köv. mve. középpontját (ld. mindig a kocka közepén) b) Diszkr.: véletlenszerűen kivál. az első mve.-t, majd mindig azonos távolságra jelöljük ki a köv. mve.-t (pl. minden harmadik) A minta nagysága függ a kezdőelem megválasztásától és az intervallumtól. 3

Szemiszisztematikus m.v. A területet egyenletesen felosztjuk részekre, ezeken belül random veszünk mintát. Egyesíti az egyenletesség és a randomitás szempontjait. 4

A MVE ALAKJA Becsléshez jobb az elnyúltabb mve., mert csökkenti a varianciát (összemos dolgokat). Mintázatelemzéshez jobb a négyzet alakú (izodiametrikus), mert az elnyúlt olyan részeket foglal egy egységbe, amelyek egyébként távol esnek egymástól. A MVE MÉRETE Becslésre jobb a több kicsi, mert kisebb a variancia. (Minél több és minél kisebb mve.) Mintázatelemzésre igazán egy mve. méret sorozat az alkalmas. A mve. változtatásával kell vizsgálni a jelenséget TÉRFOLYAMAT. Kiszámítható a variancia/átlag hányados különböző mve. méreteknél, ahol ez a legnagyobb, ott a legalkalmasabb a mintázatelemzésre. Ha a variancia/átlag hányados kb. állandó, akkor Poisson elo. áll fenn, ilyenkor a mve. mérete nem számít, hiszen nincs mintázat, az egyedek véletlenszerűen helyezkednek el. 5

Skálatípusok Értelmezhető műveletek: Nominális =, Ordinális =,, <, > Arányskála =,, <, >, Intervallum =,, <, >,, / Nominális skála A legegyszerűbb skálatípus a nominális skála, ahol a mérés eredményei között csak az egyenlőséget és a nem egyenlőséget tudjuk definiálni. A genotípus, a szőrszín, a prezencia/abszencia, illetve a taxonómiai besorolás mind-mind nominális skálájú adat. Két egyed genotípusáról megmondhatjuk, hogy azonosak, vagy sem, de ennél többet nem. A rendszertanban egy adott fáról eldönthető, hogy az a fenyő-e vagy sem. A nominális adatok nem számszerűsíthetőek, és így a legtöbb tárgyalt statisztika nem használható velük kapcsolatban. Nominális még: ivar, egy betegség vagy még áltánosabban valamilyen állapot megléte/hiánya. Ordinális skála Az ordinális (rendezett) adatokról nem csak egyezőségüket állapíthatjuk meg, hanem valamilyen elv szerint sorba is rendezhetjük őket. Az osztályzatok tipikus ordinális skálájú adatok. Megállapítható, hogy egy négyesnél jobb az ötös, de nem mondható, hogy a hármas és a négyes között ugyanakkora a tudáskülönbség, mint a négyes és az ötös között. Továbbá nem igaz, hogy egy négyes kétszer jobb, mint egy kettes (sem az, hogy fele annyit tud). A legtöbb ordinális skálán mért adatot elvileg arány vagy intervallum skálán is mérhetnénk, de valamilyen okból nem tesszük (például jegyek helyett a szerzett pontok jobban tükrözik a teljesítményt). Ordinális skála például a Braun-Blanquet féle borításértékek, vagy a ph skála. A ph skálánál bár tudjuk, hogy az 1 és a 2 között 10-es arány van, ez a puszta numerikus adatokból nem derül ki, ha ténylegesen hidrogénion koncentrációval számolunk, az már arányskála. Szintén ordinális pl. egy állatnál az agresszivitás foka (erős, közepes, gyenge). Ordinális adatok esetében általában a nem paraméteres statisztikákat kell alkalmaznunk. Intervallum skála Az intervallum skálánál az egyes értékek közötti különbség azonos, de mivel nincs eleve adott 0 pontjuk, így arányaiknak nincs értelme. Legismertebb intervallumskála a Celsius-fok skála. Igaz, hogy a 10 C és a 12 C közötti különbség azonos a 22 C és 24 C közötti különbséggel. Azonban nem igaz, hogy a 10 C kétszer olyan meleg, mint az 5 C. Intervallum skálák még a cirkuláris skálák, mint például egy adott napon belül az idő, vagy a hónapok egy éven belül. Vagy pl. ha különböző emlős fajoknál nézzük a téli álomba vonulás időpontját. Az október és a november között azonos időkülönbség van, mint a november és december között, azonban nincs értelme a kétszer korábban vonul téli álomba kifejezésnek. Vagy például mondjuk egyes madárfajok vonulásának irányát rögzítjük fokskálán, 0 -nak véve az északi irányt. Ebben az esetben a 30 irány a 60 -hoz képest nem fele akkora, csak az egyik inkább ÉÉK, a másik meg KÉK. Intervallumskálán mért az IQ is. 6

Ezekből a példákból is láthatjuk, hogy a nem pusztán a mértékegység számít, hanem az is, hogy mit mérünk. A téli állom idejét mérve hónapokban az arányskála, ugyanígy az pl. egy növény oldalágának elágazási szöge a főágtól nézve. Arányskála Az arányskálára igaz, hogy az értékek arányának jelentése van, például az 5 kg-os ponty kétszer annyi tömegű, mint egy 2.5 kg-os ponty. Ehhez az kell, hogy legyen a skálának nulla pontja, és ezen nulla pont ne önkényes legyen. Magasságméréseknél a nullapont a 0 magassághoz tartozik, ugyanígy tömegmérésnél a 0 tömeghez. A Kelvin hőmérsékletsálának 0 pontja is adott, nem úgy a Celsius és Farenheit skálán 0 pontja, amelyek önkényesen választottak (pl. víz fagyáspontja). A legtöbb mért adatunk aránysálán mért, a legtöbb itt tárgyalt statisztika alkalmazható arányskálára. 7