KÖVETKEZTETŐ STATISZTIKA

Hasonló dokumentumok
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztika elméleti összefoglaló

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

A Statisztika alapjai

Statisztikai becslés

[Biomatematika 2] Orvosi biometria

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

6. Előadás. Vereb György, DE OEC BSI, október 12.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biomatematika 2 Orvosi biometria

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

[Biomatematika 2] Orvosi biometria

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Matematikai statisztikai elemzések 3.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria gyakorló feladatok BsC hallgatók számára

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Normális eloszlás tesztje

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

A maximum likelihood becslésről

A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

egyetemi jegyzet Meskó Balázs

Bevezetés a hipotézisvizsgálatokba

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Mintavételi eljárások

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Elemi statisztika fizikusoknak

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Többváltozós lineáris regressziós modell feltételeinek

Biostatisztika VIII. Mátyus László. 19 October

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

A társadalomkutatás módszerei I.

Variancia-analízis (VA)

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kutatásmódszertan és prezentációkészítés

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Statisztika Elıadások letölthetık a címrıl

y ij = µ + α i + e ij

Populációbecslések és monitoring

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

A társadalomkutatás módszerei I.

Valószínűségszámítás és Statisztika I. zh november MEGOLDÁS

Valószínűségi változók. Várható érték és szórás

Kísérlettervezés alapfogalmak

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

Osztályozóvizsga követelményei

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A valószínűségszámítás elemei

Kísérlettervezés alapfogalmak

Lineáris regressziószámítás 1. - kétváltozós eset

Dr. Karácsony Zsolt. Miskolci Egyetem november

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Adatok statisztikai értékelésének főbb lehetőségei

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Populációbecslések és monitoring

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A leíró statisztikák

Abszolút folytonos valószín ségi változó (4. el adás)

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Átírás:

ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1

A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: Pontbecslés Pl. A minta alapján a sokasági nézettségi arány 32 %. Vesznek egy mintát, azaz, megkérdeznek pl. 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort. Intervallumbecslés: A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik. 2

Mintavétel A mintavétel módja lehet: véletlen és nem véletlen 1. A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A véletlen minta fontos jellemzője: a reprezentativitás. Egyszerű véletlen mintavétel Visszatevéssel Visszatevés nélkül Rétegzett minta Csoportos és többlépcsős minta 3

Mintavétel (folyt) 2. A nem-véletlen mintavétel Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) Kvóta szerinti minta Koncentrált minta (Fogy.K. Top 200) Önkényes minta 4

A mintaátlag eloszlása Alapkérdések: Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés A mintaátlag szórása és a sokasági szórás közötti összefüggés 5

A mintaátlag mint valószínűségi változó A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van eloszlása, várható értéke, szórása. A mintaátlag normális eloszlású, Ha a sokaság normális eloszlású Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem) Ha a sokaság eloszlása nem ismert és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.) 6

A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, A mintaátlag várható értéke a sokasági átlag: A mintaátlagok szórása, (standard hiba) E ( ) X Visszatevéses mintánál: Visszatevés nélküli mintánál: 1 n n N n n N N n 1 Ahol n / N a kiválasztási arány 7

Testmagasság A minta és mintaátlag normális eloszlása 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 140 145 150 155 160 165 170 175 180 185 190 195 200 205 210 8

PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.) Ellenőrizzük, hogy a) A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! b) A mintaátlag varianciája a sokasági variancia n-ed része! Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája? 9

Megoldás 1. (Visszatevéses minta esetén) A sokasági átlag: A sokasági szórásnégyzet ill. szórás: A minta átlaga 2 2 2 2 3 2,5 2 4 3 2 5 3,5 A mintaátlagok átlaga: A mintaátlagok szórásnégyzete: Következtetés: 10

Megoldás 2. (Visszatevés nélküli minta esetén) A sokasági átlag: 4 A sokasági szórásnégyzet: 2 ill. szórás: 2 A minta átlaga 2 3 2,5 2 4 3 2 5 3,5 2 6 4 3 4 3,5 3 5 4 3 6 4,5 A mintaátlagok átlaga: 4 A mintaátlagok szórásnégyzete = Következtetés: 11

Relatív gyakoriság (%) A mintaátlagok eloszlása (%) 25 20 20 15 12 16 16 12 10 8 8 5 4 4 0 1 1,5 2 2,5 3 3,5 4 4,5 5 Mintaátlagok 12

A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai Torzítatlanság Hatásosság Konzisztencia 13

Torzítatlan becslések A mintaátlag a sokasági átlag torzítatlan becslése E() mintabeli arány a sokasági aránynak torzítatlan becslése E ( p) P Vagy: E ( g) G A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan ˆ E(s) s X ( n i 1 ) 2 14

A jó becslés kritériumai (folyt) Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk) 15

BECSLÉS A sokasági várható érték intervallum-becslése A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlan pontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik. 16

A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását. Tudjuk, hogy M ( ) X Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik? Átrendezve: 1,96 Rövidebb formában: X 1,96 1,96 X 1, 96 X 1, 96 Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található. X 17

Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy P Átrendezve z z p X X z 1 z p Tömörebben: X z p X z p n 18

Kifejezések Az (1- ) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1- ) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidenciaintervallum A z p szorzat a maimális hiba vagy hibahatár. z p 19

PÉLDA - Átlagbecslési alapfeladat A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. a) Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! b) Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne? 20

További figyelembeveendő problémák Ha nem független a mintavétel. Ha nem ismerjük a sokasági szórást, 21

A nem független mintavétel esete A standard hiba kisebb lesz, 1 n X z p 1 n n N n N ahol az n /N a kiválasztási arány. 22

Példa Becslés nem független mintavétellel Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eft. A sokaságról tudjuk, hogy normál eloszlású 15 eft szórással a) Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! b) Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? 23

Ha a sokasági szórás nem ismert Ha nem ismerjük a sokasági szórást, akkor a mintából becsüljük. A korrigált mintaszórással számolunk: ˆ s ( és (n -1) szabadságfokú t-eloszlással n i 1 ) 2 24

A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, kis minta (n<30) esetén kötelező, nem ismert. nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb. 25

A Student (t) eloszlás ábrája különböző mintanagyságok mellett 26

PÉLDA (Becslés, a sokasági szórás nem ismert) Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. a) Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! b) Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás? 27

Értékösszeg-becslés esetén Megszorozzuk N-nel a mintából becsült átlagot és a maimális hibát (hibahatárt) Egyébként minden ugyanúgy megy, mint az átlag-becslésnél. 28

PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. Mennyi a mintaátlag standard hibája? Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! Mennyi a főiskolások által szinházjegyre költött teljes összeg maimális értéke? (A megbízhatósági szint továbbra is 95%) 29

Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az 2. A becslőfv eloszlása: normális vagy Student t? Ismert-e a sokasági szórás? Ha nem: a minta nagy vagy kicsi? 3. A standard hiba kiszámítása Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/n) arány? Független-e (visszatevéses-e) a minta? 4. A konf. intervallum kiszámítása z ˆ t ˆ Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel) 5. Az eredmény értelmezése 30

Minta-nagyság meghatározása EV mintánál Visszatevéses eset: n z 2 Visszatevés nélküli eset: z 2 2 n 2 2 2 z N 31

PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft. KÉRDÉS: Ha az - átlagra vonatkozó becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk? 32

Köszönöm a figyelmüket! 33