Adatok statisztikai értékelésének főbb lehetőségei

Hasonló dokumentumok
Bevezetés a hipotézisvizsgálatokba

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Korreláció és lineáris regresszió

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis vizsgálatok

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika elméleti összefoglaló

[Biomatematika 2] Orvosi biometria

Biomatematika 13. Varianciaanaĺızis (ANOVA)

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

y ij = µ + α i + e ij

6. Előadás. Vereb György, DE OEC BSI, október 12.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Biostatisztika Összefoglalás

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Biostatisztika Összefoglalás

MINTAVÉTELEZÉS. Alaptípusai: sampling. véletlen érvényesítésére v. mellőzzük azt. = preferenciális mintav. = véletlen mintav.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

[Biomatematika 2] Orvosi biometria

Hipotézis vizsgálatok

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Nemparaméteres próbák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

Matematikai statisztika c. tárgy oktatásának célja és tematikája

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Eloszlás-független módszerek 13. elıadás ( lecke)

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Függetlenségvizsgálat, Illeszkedésvizsgálat

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Normális eloszlás tesztje

Biostatisztika VIII. Mátyus László. 19 October

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Több valószínűségi változó együttes eloszlása, korreláció

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Normális eloszlás paramétereire vonatkozó próbák

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Többváltozós lineáris regressziós modell feltételeinek

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Nemparametrikus tesztek december 3.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztikai módszerek 7. gyakorlat

A konfidencia intervallum képlete: x± t( α /2, df )

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Valószínűségi változók. Várható érték és szórás

Varianciaanalízis 4/24/12

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Kettőnél több csoport vizsgálata. Makara B. Gábor

Ismétlı áttekintés. Statisztika II., 1. alkalom

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Kísérlettervezés alapfogalmak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Regressziós vizsgálatok

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

[Biomatematika 2] Orvosi biometria

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Számítógépes döntéstámogatás. Statisztikai elemzés

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

KÖVETKEZTETŐ STATISZTIKA

(Independence, dependence, random variables)

Átírás:

Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció c. Társulás d. Regionális.... z. Bioszféra 4. Mintavételi univerzum: a. diszkrét b. folytonos Ennek alapján minden vizsgálat kategorizálható, pl. kapcsolat egy faj vízigénye és hőmérséklet-tűrése között: 1a 2a - 3b 4b stb.

További példák Becslés Mintázatelemzés Egyváltozós Többváltozós Egyváltozós Többváltozós Folytonos Diszkrét Fa magasság, Magtermés növényenként Borítás, egyedszám, biomassza, diverzitás (kvadrátokkal), Sok ökológiai változó együttes becslése egyedekre Fajok korrelációi borítás alapján. Random növények Kvadrátok alkalmazása mintázat vizsgálatára Tavak, szigetek osztályozása a fauna alapján Mintaterületek osztályozása és ordinációja

Fontos definíciók: Paraméter - Minta elméleti érték, pl. testmagasság átlaga. Csak teljes enumerációval kapható meg. Ez ritkán lehetséges. - Lehetséges adatok részhalmaza Becslőfüggvény - Olyan formula, ami a mintából becsli a paramétert. Statisztika Becslés A paraméter becsült értéke.

SKÁLATÍPUSOK Nominális =, levélalak Ordinális =,, <, > keménység Intervallum =,, <, >, C o Arány =, <, >,, / súly, stb

Mindezek behatárolják az alkalmazható módszerek körét Legtöbb módszer: intervallum és arányskálára Pl. t-próba, variancia elemzés, Kevesebb: nominális Chi 2 -próba Legkevesebb: ordinális eset. Rang korreláció

Az eloszlás: a lehetséges adatok fontos jellemzője 1/6 1 2 3 4 5 6 Kockadobás IQ 100

Bevezetés a hipotézis vizsgálatba A mintavételi univerzumból sokszor vehetünk mintát Mindegyikre kaphatunk egy-egy becslést 1/6 Statisztikák eloszlása nézzük az átlagot, nagyon sokszor feldobva n kockát f(x) n = 3 f(x) n = 6 1 2 3 4 5 6 1 2 3 4 5 6 x 1 2 3 4 5 6 x

Tegyük fel, hogy csak egy mintát vehetünk, azaz 6 kockát feldobunk Nullhipotézis: a kocka szabályos f(x) n = 6 1 2 3 4 5 6 x

Alternatív hipotézis: nem szabályos f(x) n = 6 1 2 3 4 5 6 x

Vagyis: ha a statisztika olyan eredményt ad, ami valószínű, akkor elfogadjuk, hogy a statisztika az adott eloszlásból származik. Ha a statisztika olyan eredményt ad, ami nagyon valószínűtlen, akkor azt mondjuk, hogy NEM, a statisztika mégse ebből az eloszlásból származik!! Tévedés lehetősége: mégis abból származik, ez rendszerint 0.05% Általános munkamenet: a. A minta alapján kiszámítunk egy statisztikát b. Megnézzük egy táblázatban, hogy ez mennyire valószínű c. Eldöntjük, hogy az eredmény szignifikáns-e avagy sem.

Statisztikai próbák t-próba A mintából kapott átlag lehet-e egy adott µ érték becslése Kétmintás t-próba A két minta átlagai megegyeznek-e?? Variancia-analízis Sok minta átlagai megegyeznek-e, vagy van legalább egy minta. Amelyik kilóg a többiek közül.

Egyszerű példa: Kísérleti személyek egy tárgyat 20 cm-re elmozdítanak, először jelzik nekik a távolságot, másodszor viszont anélkül, becsukott szemmel. Kérdés: van-e távolságérzékelés?? Adatok: 22,1 20,1 20,5 16,6 22,2 18,7 20,6 20,6 n = 8, x = 20,225 s = 1,89 H 0 = a második kísérletben is 20 a becsült várható érték H 1 = a második kísérletben már nem 20 Számítás: t = x µ = s / n 20.225 20 1.89 / 8 = 0.225 0.668 = 0.336 d.f. = n-1 = 7, legyen α = 0.05, s ekkor t crit =2.365.

Változók közötti kapcsolatok vizsgálata Korreláció: vö. az intuitív tartalommal Akkor pozitív, ha x és y átlagosan ugyanabba az irányba tér el a saját várható értékétől, negatív ha ellentétes irányba. r=0.89 r=-0.94 korrelálatlanság: r=0

Lineáris regresszió Predikcióra alkalmas: adott x-hez meghatározható az y a kettő közötti függvénykapcsolat ismeretében. Lineáris esetben a feladat a legjobban illeszkedő egyenes egyenletének a meghatározása. Az elméleti tengelymetszet α, becslése pedig a, az elméleti meredekség β, becslése pedig b, tehát: y = a +bx becsli az y = α + βx kapcsolatot.

Megállapítható változók elemzése Ordinális, nominális esetre, 2 x 2-es kontingenciatábla a gyakoriságokkal Oltás Betegség + - + 5 144 149-15 117 132 Hipotézisvizsgálat: 20 261 281 H 0 : nincs összefüggés a két változó között, függetlenek H 1 : a két változó között van összefüggés χ 2 próba

Függetlenségvizsgálat: két valószínűségi változó független-e vagy összefüggenek (a függetlenségtől való eltérés szignifikáns-e, vagy csak a mintavételi hiba okozta)? ˆχ A fenti példára 2 X 2 = 2,96 + 3,34 + 0,22 + 0,25 = 6,63 és ˆχ 2 X 2 2 χ krit 2 χ krit ( 1, α = 0,05) = 3,84 Mivel > a null hipotézis elvethető, a két változó nem független, szignifikáns az összefüggés, az oltás hatásos.

Mann-Whitney teszt A kétmintás t-próba helyett alkalmazható. Nullhipotézisünk az, hogy a két minta ugyanabból az alapsokaságból származik. Ha ez igaz, akkor a rangszámok véletlenszerűen oszlanak meg a minták közt. Teljes keveredés 1. minta: 13 16 24 29 34 2. minta: 9 15 20 27 33 37 rangsz.: 1 2 3 4 5 6 7 8 9 10 11 Ekkor a véletlen csak nagyon ritkán produkál pl. olyan szélsőséges megoszlást, hogy az egyik minta minden eleme kisebb a másik minta összes eleménél: 1. minta: 27 29 33 34 37 2. minta: 9 13 15 16 20 24 rangsz.: 1 2 3 4 5 6 7 8 9 10 11 Itt egy U statisztikát számolunk, s annak szignifikanciáját nézzük meg a táblázatban.