Populációbecslés és monitoring Eloszlások és alapstatisztikák
Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk mintát, amelyben a vizsgált változó az adott eloszlást követi. Normál és binomiális eloszlás A normál eloszlás folytonos, azaz bármely értéket felvehet két paraméterrel adjuk meg: átlag és szórás. A binomiális eloszlás a diszkrét eloszlásokhoz tartozik, azaz a változó csupán bizonyos értékeket vehet fel. pl. fej vagy írás
Egy egyén IQ-ja folytonos, a gyermekeinek száma diszkrét változó. Normál eloszlású populáció 100-as átlaggal és 10-es szórással: Kis elemszám esetén a minta eloszlása még nem követi jól az elméleti eloszlást, de már 1500-as mintanagyságnál szépen illeszkedik a görbéhez. ha a populáció erre a görbére illeszkedik, akkor a változó eloszlása ebben a populációban ilyen normál eloszlást követ 30 160 140 120 20 10 0 118.0 116.0 114.0 112.0 110.0 108.0 106.0 104.0 102.0 100.0 98.0 96.0 94.0 92.0 90.0 88.0 86.0 100 80 60 40 20 0 117.0 115.0 113.0 111.0 109.0 107.0 105.0 103.0 101.0 99.0 97.0 95.0 93.0 91.0 89.0 87.0 85.0 83.0 250-es minta 1500-as minta
Alapstatisztikák Parametrikus próbák normál eloszlású változó esetén Kolmogorov-Szmirnov teszt Két populáció összehasonlítására: kétmintás t- próba Kezelés hatásának kimutatására: páros t-próba Három vagy több populáció összehasonlítására: Variancia analízis Összefüggések kimutatására: korreláció analízis, lineáris regresszió
Házi rozsdafarkú etetési viselkedését vizsgálták. A megfigyelések során mérték a szülők által a fészekbe hordott rovarok hosszát. Vajon a hím és a tojó által behordott rovarok hossza eltérő-e? A nullhipotézis, hogy a két nem által hozott rovarok hossza nem tér el. Egy korábbi vizsgálatból már ismert, hogy a bevitt rovarok hossza normális eloszlást követ. A következő eredményeket kapták. A tojó által bevitt rovarok átlagos hossza 1 = 128.5 mm volt (s 1 = 9.2, n 1 = 52), míg a hím átlagosan 2 = 131.9 mm-es rovarokkal etette a fiókákat (s 2 = 8.2. n 2 = 39). Mivel a szórások nem különböztek (hogyan döntötték el?) t-próbával hasonlították össze az átlagokat.
df = 89. A táblázatban keresve a kritikus értéket egy problémába ütközünk: nem találunk df = 89-es szabadsági fokhoz tartozó sort. Csak df = 60 és df = 120-hoz vannak megadva az értékek. Ilyen esetekben általában lineáris interpolációt alkalmazunk. ahol t' az interpolált érték, t 60 és t 120 a táblázatban szereplő szabadsági fokokhoz tartozó t-értékek. A számolást elvégezve p = 0.05-ös szignifikanciaszintre, t' = 2.00+ (1.98-2.00)*89/(120-60) = 1.97 A számított t s -értékünk (abszolút értékben) kisebb, mint az interpolált érték. Így a nullhipotézis elutasítására nincs okunk, és nem állíthatjuk, hogy a két szülő különböző hosszúságú rovarokat hordott volna.
Egy fiziológiai kísérletben vizsgálták az ijedtség vérnyomásra kifejtett hatását. E célból kiválasztottak tíz önként jelentkezőt és megmérték a vérnyomásukat. Ezután egy ajtót becsapva, hirtelen megijesztették őket, majd vérnyomásmérés következett. A következő eredményeket kapták: Vérnyomás ijesztés Személy előtt után Különbség (d i ) d 2 i 1 90 100 10 100 2 110 129 19 361 3 85 100 15 225 4 125 155 30 900 5 130 135 5 25 6 100 123 23 529 7 115 143 28 784 8 95 99 4 16 9 85 97 12 144 10 140 165 25 625 171 3709
=17,1 t s =17,1/2,953=5.791, df = 10-1 = 9. A kapott t-érték (t s ) nagyobb, mint a táblázatbeli kritikus érték (t 0,001[9] = 4.791). Így levonhatjuk a következtetést, hogy az ijesztés szignifikánsan (p < 0.001) növelte a vérnyomást.
Nem-paraméteres próbák: Két minta összehasonlítására: Mann-Whitney U-teszt Három vagy több csoport esetén: Kruskal- Wallis próba Eloszlások összehasonlítására: Chi 2 -teszt Összefüggések vizsgálatára: Rangkorreláció
A bíbicek Vanellus vanellus tojásméretét vizsgálták. A bíbicek két élőhelyen költenek a Dél-Alföldön: legelőn és kaszálón. Különböző tömegűek-e a két élőhelyen lerakott tojások? A nullhipotézis, hogy a két élőhelyen nem különbözik a tojások tömege. Egyetlen fészekaljon belül azonban a 3-5 tojás tömege nem független egymástól, mivel a tojók hasonló méretű tojásokat raknak. Így a tojások tömegét fészekaljanként átlagoljuk, és az átlagokat használjuk a rangsoroláshoz. Feltételezzük, hogy a fészkeket különböző tojók rakták.
S = 61.5, n 1 = 7 így, T=61.5-(7*8)/2=33.5 mivel n 1 = 7, n 2 = 9, így a táblázat alapján w 0,025 = 13 W 0.975 = 50 T értéke nem kisebb az alsó kritikus értéknél, sem nem nagyobb a felső kritikus értéknél, ezért a nullhipotézist nem utasítjuk el p = 0.05 szinten.
Három erdőben vizsgálták a hektáronkénti fák számát. Az erdészek nullhipotézise szerint nincs különbség a három erdő fasűrűségében. Fenntartható-e a nullhipotézis? Fa/hektár A erdő 126 142 156 228 245 R i Rang 7 8 9 11 12 47 B erdő 98 98 216 249 301 319 Rang 5,5 5,5 10 13 14 15 63 C erdő 29 39 60 78 Rang 1 2 3 4 10
A három mintát összevonjuk, és az összevont minta rangjait az adatokhoz rendeljük. A tesztstatisztikát R i -k alapján számoljuk: A kritikus érték χ 2 2,0,025 = 7.378 (p = 0.025 szinten és 2 szabadsági foknál), így a három erdő azonos fasűrűségére vonatkozó nullhipotézist elutasítjuk.
Hullatékeloszlás - kukorica, június távolság (m) valós (db) egyenletes (db) eltérés 0 17 9 7.111111111 50 6 9 1 100 6 9 1 150 7 9 0.444444444 9.555555556 kritikus érték p<0.025-nél :9.35
Hullatékeloszlás -május,június távolság (m) búza gyep vegyes napraforgó kukorica összes 0 11 1 10 17 21 60 50 7 8 16 14 8 53 100 4 9 24 10 6 53 150 1 2 7 6 7 23 összes 23 20 57 47 42 189
elméleti eloszlás e.érték búza e.érték gyep e.érték vegyes e.érték nap. e.érték kuk. 0.317460317 7.3015873 02 6.34920634 9 18.095238 1 14.9206 3 13.333333 33 0.28042328 6.4497354 5 5.60846560 8 15.984126 98 13.1798 9 11.777777 78 0.28042328 6.4497354 5 5.60846560 8 15.984126 98 13.1798 9 11.777777 78 0.121693122 2.7989417 99 2.43386243 4 6.9365079 37 5.71957 7 5.1111111 11
Eltérés - május,június búza gyep vegyes napraforgó kukorica 1.873326 4.506706 3.621554 0.2897839 4.4083333 0.046946 1.019786 1.58E-05 0.0510303 1.21174 0.930457 2.050918 4.019877 0.7672085 2.8343816 1.15622 0.077341 0.000581 0.0137488 0.6980676 4.00695 7.654752 7.642028 1.1217714 9.1525226 29.57802312 DF=12 kritikus érték p<0,01-nél: 26.2