Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Hasonló dokumentumok
6. Előadás. Vereb György, DE OEC BSI, október 12.

KÖVETKEZTETŐ STATISZTIKA

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Normális eloszlás tesztje

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

[Biomatematika 2] Orvosi biometria

A Statisztika alapjai

Bevezetés a hipotézisvizsgálatokba

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Statisztika elméleti összefoglaló

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

[Biomatematika 2] Orvosi biometria

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Mintavételi eljárások

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Adatok statisztikai értékelésének főbb lehetőségei

Statisztikai becslés

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Biomatematika 2 Orvosi biometria

Biostatisztika VIII. Mátyus László. 19 October

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

Kutatásmódszertan és prezentációkészítés

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Matematikai statisztikai elemzések 3.

Matematikai alapok és valószínőségszámítás. Normál eloszlás

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

egyetemi jegyzet Meskó Balázs

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria gyakorló feladatok BsC hallgatók számára

A leíró statisztikák

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Populációbecslések és monitoring

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Statisztika Elıadások letölthetık a címrıl

Kísérlettervezés alapfogalmak

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Kettőnél több csoport vizsgálata. Makara B. Gábor

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Hipotézis vizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

A társadalomkutatás módszerei I.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Populációbecslések és monitoring

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

A társadalomkutatás módszerei I.

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Valószínűségi változók. Várható érték és szórás

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Elemi statisztika fizikusoknak

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

A maximum likelihood becslésről

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Többváltozós lineáris regressziós modell feltételeinek

Biostatisztika Összefoglalás

4. A méréses ellenırzı kártyák szerkesztése

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

3. A mintavételi kockázat elfogadható szintjének meghatározása (pl. 5 vagy 10%)

Hipotézis vizsgálatok

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

y ij = µ + α i + e ij

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Hipotézisvizsgálat R-ben

A matematikai statisztika alapfogalmai

Átírás:

Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása

Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból vett minta segítségével becsüljük. A minta akkor jó, ha reprezentatív a populációra nézve, amit a legjobban akkor biztosíthatunk, ha véletlen, random mintát veszünk. Random minta esetén a populáció minden egyes tagjának azonos esélye van a mintába kerülésre.

Bevezetés Példa: Tegyük fel, hogy egy adott populációt az elsı éves pszichológia szakos hallgatók képezik. Egy 10 elemő mintát veszünk ebbıl a populációból a következõképpen: a neveket felírjuk egy-egy papírra, egy dobozból húzunk 10 nevet. Ebben az esetben a mintavétel véletlen lesz: minden egyes nevet azonos valószínûséggel húzunk ki. Az egyes események (húzások), egymástól függetlenek.

Mintavétel Példa: Tegyük fel, hogy egy adott populációt a telefonkönyvben szereplõ személyek alkotnak. Ebbõl a populációból szeretnénk egy mintát venni oly módon, hogy véletlenszerûen kiválasztunk egy személyt, majd aztán szisztematikusan haladva minden 100. személy választjuk ki a mintába kerülésre. Véletlenszerû-e a mintavétel ebben az esetben?

Mintavétel A véletlen mintavétel nagyon fontos lépés a minta reprezentativitásának biztosítására, DE: A véletlen mintavétel nem mindíg garantálja, hogy a minta valóban reprezentatív lesz a populációra nézve. Pl.: nõk:férfiak aránya egy populációban 43:57, de ha 100 fõs mintát veszünk, lehet, hogy a mintabeli arány 38:62 lesz, akkor is, ha a mintavétel véletlenszerû volt. Ha ennek a változónak a reprezentativitása fontos a vizsgálat szempontjából, akkor alkalmazzák a rétegzett mintavételt, azaz, egy változó mentén felosztják a mintát, jelen esetben pl. véletlenszerûen választanak 43 nıt és véletlenszerően választanak 57 férfit, akik a 100 fıs mintát alkotják.

Statisztikai becslés A mintavétel csak eszköz, ahhoz, hogy a minta alapján becsülni tudjuk a populáció különbözõ paramétereit, amikre az érdeklõdésünk irányul. A mintában kiszámolhatjuk az érdeklõdésünk tárgyát képezõ paraméter értéket, amit a mintabeli, vagy tapasztalati értéknek nevezünk, és ez az érték lesz a populációbeli, vagy elméleti érték becslése. Ezeket a minta adataiból számolt értékeket statisztikának nevezzük. A becsült érték a gyakorlatban szinte sohasem fog pontosan megegyezni az populációbeli értékkel, hanem valamennyire szinte mindig eltér attól. Egy adott populációbeli paraméter és a mintabeli paraméter különbsége a becslés hibája. A becslés akkor jó, ha torzítatlan, azaz egyik irányba sem elfogult, azaz a becslés uo. valószínûséggel lesz kisebb, mint nagyobb, mint a becsülendı paraméter. Azt mondhatjuk tehát, hogy a becslések várható értéke (ha valós populációról van szó a becslések átlaga) megegyezik a paraméter elméleti értékével.

Statisztikák elméleti eloszlása A populáció paramétereit a mintából számított statisztikával becsülhetjük, például a populáció átlagát a mintából számolt átlaggal. Ez a becslés nagy valószínûséggel hibával terhelt lesz. Ha a populációból egy másik mintát veszünk, abban is kiszámolhatjuk az adott statisztika (becslés) értékét, így már 2 becslésünk lesz a populáció paraméterre. Ezek átlagát vehetjük, és azt is tekinthetjük a megfelelõ elméleti paraméter becslésének. Aztán vehetünk még egy mintát, ebben is számolhatjuk a megfelelõ statisztikát, és így tovább

Statisztikák elméleti eloszlása Ily módon tehát vehetjük egy adott populáció összes n elemû mintáját és mindegyikben kiszámolhatjuk a megfelelõ statisztika értékét. Ezek az értékek mind a populáció- paraméter becslései lesznek, és ha a becslés torzítatlan, akkor a populáció-paraméter körül fognak ingadozni. Már viszonylag kis számú populációból is nagyon nagyszámú mintát vehetünk, melyekben az adott statisztikák értékei bizonyos eloszlást fognak követni.

Statisztikák elméleti eloszlása Az átlagot például véve tekintsünk egy populációt, amelyben egy bizonyos X véletlen változó normál eloszlást követ µ átlaggal, ésσszórással (X ~ N( µ, σ) ). Ha ebbõl a populációból 30 elemû mintákat veszünk, akkor a minták átlaga normál eloszlást fog követni melynek várható értéke (átlaga) megegyezik az eredeti véletlen változó X átlagával: E( x 30) = µ szórása pedig egyenlõ lesz az X szórásának és a mintaelemszám gyökének hányadosával. σ σ X x = 30 n Azt, hogy a mintaátlagok, a populációátlag becslései mennyire ingadoznak a populációátlag (ami egyenlõ a mintaátlagok elméleti eloszlásának átlagával) körül, a mintaátlagok elméleti eloszlásának szórása fejezi ki.

A becslés standard hibája A becslések hibájának nagyságát fejezi ki, a becslés standard hibájának (SE) nevezzük. Tehát a becslés standard hibája megegyezik a becslõ statisztika elméleti eloszlásának szórásával. SE σ = X n Ha a populáció szórása nem ismert, akkor a minta szórásával becsülhetjük, így a standard hiba becslése: s ˆ x 30 SE = n

A becslés standard hibája Mint a standard hiba képletébõl is látható, az elemszám növelésével a standard hiba csökken, azaz a becslı statisztikák átlagosan egyre kisebb hibával becslik a populáció átlagát. A becslés standard hibájával kapcsolatos a becslés két további fontos ismérve, a hatékonyság, ami arra utal, hogy a becslés kis hibával közelíti a becsülendı paramétert, és a konzisztencia, ami arra utal, hogy a mintanagyság növelésével a becslı statisztika elméleti eloszlásának szórása, vagyis standard hibája, egyre kisebb lesz.

Intervallumbecslés Az eddigiekben tárgyalt becslést pontbecslésnek nevezzük, mert a becsülendõ populáció-paraméter becsléseként egyetlen értéket, egyetlen pontot adunk meg. Láttuk, hogy a minta elemszámának növelésével a becslés egyre pontosabb lesz, de pontosan ritkán fog megegyezni a populáció-paraméterrel. A statisztikai becslés egy másik típusát az ún. Intervallumbecslés jelenti, amikor nem pontos értéket adunk meg a populációparaméter becsléseként, hanem egy tartományt, intervallumot, amibe a becsülendõ paraméter bizonyos valószínûséggel bele fog esni. Ezt a valószínûséget a becslés megbízhatóságának, konfidenciájának nevezzük, az intervallumot pedig megbízhatósági tartománynak, vagy konfidencia intervallumnak.

Intervallumbecslés Az átlagok példájánál maradva: láttuk, hogy a mintaátlagok normál eloszlást követnek µ várható értékkel és σ szórással. n Ha 95%-os konfidencia intervallumot szeretnénk az átlagra, akkor meg kell adnunk azt a tartományt, ami a populációátlagot 95%-os valószínûséggel tartalmazza. Standard normál eloszlás esetén az értékek 95%-os valószínûséggel a -1.96 és 1.96 szórásnyi tartományba esnek, tehát az σ σ átlag esetén a -1.96*,1.96* tartomány lesz a 95%-os konfidencia n n intervallum.