A teljes alapsokaságot nem ismerhetjük meg. MINTAVÉTELEZÉS Fontossága: minden későbbi értékelés ezen alapszik. Alaptípusai: Szubjektív folyamat Objektív folyamat (non-probabilistic) (probabilistic) sampling Nincs lehetőség a véletlen hatásokat véletlen érvényesítésére viszünk bele v. mellőzzük azt. = preferenciális mintav. = véletlen mintav. A MINTAVÉTEL FŐBB KRITÉRIUMAI 1.Univerzumhalmaz sajátságai Diszkrét (D): véges sok (vagy megszámlálhatóan végtelen) egység illetve lehetőség a mintavételre. A mintavételnek természetes egységei vannak, nem kérdés a mve.(mintavételi egység) mérete és alakja, ezek adottak. Folytonos (F): A populáció egy kontinuumot alkot a térben, a természetes egységek hiányoznak, az ember kénytelen mesterséges határokat vonni. Fontos kérdés tehát a mve. alakja és mérete. Elvileg megszámlálhatatlanul végtelen sok mintavételezési lehetőség van. 2. Vizsgálat célja Becslés: egy paraméter meghatározása variancia minimalizálás Mintázatelemzés: ökológiai / cönológiai / taxonómiai mintázatok, sokféleség vizsgálata variancia maximalizálás 1
3. Vizsgálat szintje a. egyedi b. faji (populációs) c. társulás d. táj stb A MINTAVÉTEL FŐBB JELLEMZŐI 1. Mve. száma = a minta mérete (sample size) 2. Mve. kiválasztásának, ill. elrendezésének a módja Csak folytonos esetre: 3. Mve. nagysága 4. Mve. alakja A MVE KIVÁLASZTÁSÁNAK ÉS ELRENDEZÉSÉNEK MÓDJA Random mintavétel: ábramagyrázat ld. köv. oldal 2
Diszkrét: minden egyed ugyanolyan vsz-gel kerül a mintába a) a véletlenszerűen kiválasztott koordinátákhoz legközelebb eső elemet választjuk b) az egyik kiválasztott elemtől a következőt a véletlenszerűen kivál. szögben és távolságra választjuk ki c) szabályos elrendezésnél: véletlenszerűen kivál. koordinátájú elemeket választunk Folytonos: az univerzumhalmaz minden pontja ugyanolyan vsz-gel kerül a mintába d) a mve.-et véletlenszerűen kivál. koordinátájú középpont körül helyezzük el e) az előző mve. középpontjától véletlenszerűen kivál. szögben és távolságra jelöljük ki a következőt Rétegzett random mintavétel: Korábbi információ alapján az univerzumhalmazt részekre osztjuk. Minden részhalmazt külön mintavételezünk randomizálva, azután egyesítjük az adatokat. Az egyes rétegekből vett minta nagysága arányos lehet a területtel, egyedszámmal vagy lehet variancia-arányos (ahol nagyobb a V, ott több mve.) B A C Szisztematikus m.v. (ábra a köv. oldalon) a) Folyt.: véletlenszerűen kivál. az első mve. középpontját, majd attól mindig azonos távolságra jelöljük ki a köv. mve. középpontját (ld. mindig a kocka közepén) b) Diszkr.: véletlenszerűen kivál. az első mve.-t, majd mindig azonos távolságra jelöljük ki a köv. mve.-t (pl. minden harmadik) A minta nagysága függ a kezdőelem megválasztásától és az intervallumtól. 3
Szemiszisztematikus m.v. A területet egyenletesen felosztjuk részekre, ezeken belül random veszünk mintát. Egyesíti az egyenletesség és a randomitás szempontjait. 4
A MVE ALAKJA Becsléshez jobb az elnyúltabb mve., mert csökkenti a varianciát (összemos dolgokat). Mintázatelemzéshez jobb a négyzet alakú (izodiametrikus), mert az elnyúlt olyan részeket foglal egy egységbe, amelyek egyébként távol esnek egymástól. A MVE MÉRETE Becslésre jobb a több kicsi, mert kisebb a variancia. (Minél több és minél kisebb mve.) Mintázatelemzésre igazán egy mve. méret sorozat az alkalmas. A mve. változtatásával kell vizsgálni a jelenséget TÉRFOLYAMAT. Kiszámítható a variancia/átlag hányados különböző mve. méreteknél, ahol ez a legnagyobb, ott a legalkalmasabb a mintázatelemzésre. Ha a variancia/átlag hányados kb. állandó, akkor Poisson elo. áll fenn, ilyenkor a mve. mérete nem számít, hiszen nincs mintázat, az egyedek véletlenszerűen helyezkednek el. 5
Skálatípusok Értelmezhető műveletek: Nominális =, Ordinális =,, <, > Arányskála =,, <, >, Intervallum =,, <, >,, / Nominális skála A legegyszerűbb skálatípus a nominális skála, ahol a mérés eredményei között csak az egyenlőséget és a nem egyenlőséget tudjuk definiálni. A genotípus, a szőrszín, a prezencia/abszencia, illetve a taxonómiai besorolás mind-mind nominális skálájú adat. Két egyed genotípusáról megmondhatjuk, hogy azonosak, vagy sem, de ennél többet nem. A rendszertanban egy adott fáról eldönthető, hogy az a fenyő-e vagy sem. A nominális adatok nem számszerűsíthetőek, és így a legtöbb tárgyalt statisztika nem használható velük kapcsolatban. Nominális még: ivar, egy betegség vagy még áltánosabban valamilyen állapot megléte/hiánya. Ordinális skála Az ordinális (rendezett) adatokról nem csak egyezőségüket állapíthatjuk meg, hanem valamilyen elv szerint sorba is rendezhetjük őket. Az osztályzatok tipikus ordinális skálájú adatok. Megállapítható, hogy egy négyesnél jobb az ötös, de nem mondható, hogy a hármas és a négyes között ugyanakkora a tudáskülönbség, mint a négyes és az ötös között. Továbbá nem igaz, hogy egy négyes kétszer jobb, mint egy kettes (sem az, hogy fele annyit tud). A legtöbb ordinális skálán mért adatot elvileg arány vagy intervallum skálán is mérhetnénk, de valamilyen okból nem tesszük (például jegyek helyett a szerzett pontok jobban tükrözik a teljesítményt). Ordinális skála például a Braun-Blanquet féle borításértékek, vagy a ph skála. A ph skálánál bár tudjuk, hogy az 1 és a 2 között 10-es arány van, ez a puszta numerikus adatokból nem derül ki, ha ténylegesen hidrogénion koncentrációval számolunk, az már arányskála. Szintén ordinális pl. egy állatnál az agresszivitás foka (erős, közepes, gyenge). Ordinális adatok esetében általában a nem paraméteres statisztikákat kell alkalmaznunk. Intervallum skála Az intervallum skálánál az egyes értékek közötti különbség azonos, de mivel nincs eleve adott 0 pontjuk, így arányaiknak nincs értelme. Legismertebb intervallumskála a Celsius-fok skála. Igaz, hogy a 10 C és a 12 C közötti különbség azonos a 22 C és 24 C közötti különbséggel. Azonban nem igaz, hogy a 10 C kétszer olyan meleg, mint az 5 C. Intervallum skálák még a cirkuláris skálák, mint például egy adott napon belül az idő, vagy a hónapok egy éven belül. Vagy pl. ha különböző emlős fajoknál nézzük a téli álomba vonulás időpontját. Az október és a november között azonos időkülönbség van, mint a november és december között, azonban nincs értelme a kétszer korábban vonul téli álomba kifejezésnek. Vagy például mondjuk egyes madárfajok vonulásának irányát rögzítjük fokskálán, 0 -nak véve az északi irányt. Ebben az esetben a 30 irány a 60 -hoz képest nem fele akkora, csak az egyik inkább ÉÉK, a másik meg KÉK. Intervallumskálán mért az IQ is. 6
Ezekből a példákból is láthatjuk, hogy a nem pusztán a mértékegység számít, hanem az is, hogy mit mérünk. A téli állom idejét mérve hónapokban az arányskála, ugyanígy az pl. egy növény oldalágának elágazási szöge a főágtól nézve. Arányskála Az arányskálára igaz, hogy az értékek arányának jelentése van, például az 5 kg-os ponty kétszer annyi tömegű, mint egy 2.5 kg-os ponty. Ehhez az kell, hogy legyen a skálának nulla pontja, és ezen nulla pont ne önkényes legyen. Magasságméréseknél a nullapont a 0 magassághoz tartozik, ugyanígy tömegmérésnél a 0 tömeghez. A Kelvin hőmérsékletsálának 0 pontja is adott, nem úgy a Celsius és Farenheit skálán 0 pontja, amelyek önkényesen választottak (pl. víz fagyáspontja). A legtöbb mért adatunk aránysálán mért, a legtöbb itt tárgyalt statisztika alkalmazható arányskálára. 7