Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Hasonló dokumentumok
Mintavételi eljárások

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

KÖVETKEZTETŐ STATISZTIKA

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

6. Előadás. Vereb György, DE OEC BSI, október 12.

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

A Statisztika alapjai

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Bevezetés a hipotézisvizsgálatokba

[Biomatematika 2] Orvosi biometria

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Kutatásmódszertan és prezentációkészítés

Kísérlettervezés alapfogalmak

Mintavétel a gyakorlatban

y ij = µ + α i + e ij

Normális eloszlás tesztje

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria gyakorló feladatok BsC hallgatók számára

Statisztika elméleti összefoglaló

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Adatok statisztikai értékelésének főbb lehetőségei

Elemi statisztika fizikusoknak

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biostatisztika VIII. Mátyus László. 19 October

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Mintavétel: terv és eljárások

Kísérlettervezés alapfogalmak

Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Populációbecslések és monitoring

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Matematikai statisztika c. tárgy oktatásának célja és tematikája

A társadalomkutatás módszerei I.

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Mintavétel: terv és eljárások

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria

A populáció meghatározása

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika. Politológus képzés. Daróczi Gergely március 20. Politológia Tanszék

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Hipotézis vizsgálatok

Mérési hibák

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Populációbecslések és monitoring

A leíró statisztikák

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Biomatematika 13. Varianciaanaĺızis (ANOVA)

PIACKUTATÁS (MARKETINGKUTATÁS)

Dr. Piskóti István Marketing Intézet. Marketing 2.

1/8. Iskolai jelentés. 10.évfolyam matematika

Statisztika Elıadások letölthetık a címrıl

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztika. Politológus képzés. Daróczi Gergely március 13. Politológia Tanszék

A társadalomkutatás módszerei I.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Az értékelés során következtetést fogalmazhatunk meg a

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Iskolai jelentés. 10. évfolyam szövegértés

Két adatfelvétel: a szegény háztartások fogyasztási szokásai és a tulajdonosi jövedelmek szerkezete. Medgyesi Márton Tárki Zrt

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05. A kutatás dokumentációja

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Átírás:

Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 24.

Outline 1 A mintavételi hiba és konfidencia-intervallum 2 A mintaválasztás A mintaválasztás célja Alapfogalmak A mintaválasztás lépései Valószínűségi és nem-valószínűségi mintavétel Nem-valószínűségi mintavételi eljárások Valószínűségi mintavételi eljárások 3 Valószínűségi mintavételi eljárások Ismétlés Egyszerű véletlen mintavétel Rétegzett mintavétel Szisztematikus mintavétel Szisztematikus-rétegzett mintavétel Csoportos mintavétel Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 2 / 36

A mintavételi hiba és konfidencia-intervallum Elmélet Szükséges képletek: Tehát: számtani átlag: x = n i=1 x i n korrigált empirikus szórás: S = n (x i x) 2 i=1 n standard/mintavételi hiba: SE = S n 1 n N S n konfidencia-intervallum: x ± z SE, ahol legtöbbször z = 1, 96 konfidencia-intervallum: [x 2 SE;x + 2 SE] x 2 SE x x + 2 SE Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 3 / 36

A mintavételi hiba és konfidencia-intervallum Gyakorlat Az őszi kutatásban is megkérdezték az autósokat az üzemanyagárak lélektani határáról. A felmérés közben hétről hétre dőltek meg az üzemanyagár csúcsok, ezért a kutatás a 400 és a 450 forint közötti literenkénti ársávot vizsgálta. A gázolaj árának hatását most is rugalmasabban ítélték meg az autósok, még mindig sokan vannak, akik 450 forint feletti áron is ugyanannyit tankolnának, mint most. A benzinnél 420 forintos árnál a válaszadók többsége már nem tankolna annyit mint korábban, s jelentősen csökkentené az autó használatát. Forensis Autóklub (2011.november) Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 4 / 36

A mintavételi hiba és konfidencia-intervallum Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 5 / 36

A mintavételi hiba és konfidencia-intervallum Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 Leíró statisztikák: számtani átlag: x = 410+420+420+430+500+450+400+425+460 9 = 435 medián: 425 módusz: 420 minimum érték: 400 maximum érték: 500 terjedelem: 100 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 5 / 36

A mintavételi hiba és konfidencia-intervallum Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 számtani átlag: x = 410+420+420+430+500+450+400+425+460 9 = 435 korrigált empirikus szórás: S = 30,619 standard/mintavételi hiba: SE = 30,619 9 = 30,619 3 = 10,206 konfidencia-intervallum: 435 ± 2 10, 206 = [414, 59; 455, 41] Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 6 / 36

A mintavételi hiba és konfidencia-intervallum Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 számtani átlag: x = 410+420+420+430+500+450+400+425+460 9 = 435 korrigált empirikus szórás: S = 30,619 standard/mintavételi hiba: SE = 30,619 9 = 30,619 3 = 10,206 konfidencia-intervallum: 435 ± 2 10, 206 = [414, 59; 455, 41] x = 435 x 2 SE = 414,59 x +2 SE = 455,41 400 420 440 460 480 500 Ft Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 6 / 36

Ismétlés Középértékek 10-10 diák magasságát mértük 2 osztályteremben? 170 180 190 cm 170 180 190 cm Melyik osztály diákjai a magassabbak a leíró statisztikák alapján adható becslések alapján? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 7 / 36

Ismétlés Középértékek 170 180 190 cm 170 180 190 cm a b * * 160 165 170 175 180 185 190 195 Height (cm) Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 8 / 36

Számítás Minták összehasonlítása Hat gesztenyefa magasságát mértük meg a Margit-szigeten két időpontban. Számoljuk ki, határozzuk meg az átlagot, a szórás és a standard/mintavételi hibát! Kimutatható szignifikáns eltérés a két minta átlaga között? 1 2012. március 22: 36 48 50 44 53 39 0 10 20 30 40 50 60 70 80 inches 2 2012. április 1: 41 53 55 49 58 44 0 10 20 30 40 50 60 70 80 inches Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 9 / 36

Számítás Minták összehasonlítása Hat gesztenyefa magasságát mértük meg a Margit-szigeten két időpontban. Számoljuk ki, határozzuk meg az átlagot, a szórás és a standard/mintavételi hibát! Kimutatható szignifikáns eltérés a két minta átlaga között? 1 2012. március 22: 36 48 50 44 53 39 X = {36,48,50,44,53,39} 36 + 48 + 50 + 44 + 53 + 39 x = = 270 6 6 = 45 (36 45)2 + (48 45) σ = 2 + (50 45) 2 + (44 45) 2 + (54 45) 2 + (39 45) 2 = 5 81 + 9 + 25 + 1 + 64 + 36 216 = = 5 5 = 43.2 = 6.57 SE = 6.57 = 6.57 6 2.44 = 2.68 A várható érték 40,5 és 49.5 között alakul (95% valószínűséggel). Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 10 / 36

Számítás Minták összehasonlítása Hat gesztenyefa magasságát mértük meg a Margit-szigeten két időpontban. Számoljuk ki, határozzuk meg az átlagot, a szórás és a standard/mintavételi hibát! Kimutatható szignifikáns eltérés a két minta átlaga között? 1 2012. április 1: 41 53 55 49 58 44 X = {41,53,55,49,58,44} 41 + 53 + 55 + 49 + 58 + 44 x = = 300 6 6 = 50 (41 50)2 + (53 50) σ = 2 + (55 50) 2 + (49 50) 2 + (58 50) 2 + (44 50) 2 = 5 81 + 9 + 25 + 1 + 64 + 36 216 = = 5 5 = 43.2 = 6.57 SE = 6.57 = 6.57 6 2.44 = 2.68 A várható érték 45,5 és 54.5 között alakul (95% valószínűséggel). Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 11 / 36

Minták összehasonlítása Eredmények Hat gesztenyefa magasságát mértük meg a Margit-szigeten két időpontban. Számoljuk ki, határozzuk meg az átlagot, a szórás és a standard/mintavételi hibát! Kimutatható szignifikáns eltérés a két minta átlaga között? 1 2012. március 22: 36 48 50 44 53 39 2 2012. április 1: 41 53 55 49 58 44 x = 45 x = 50 40.5 45.5 49.5 54.5 30 40 50 60 inches Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 12 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 13 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 5 perc pontosság 95 %-os döntési szinten: SE = 2.5, becsült szórás: 10 SE = S n 2,5 = 10 n 2,5 n = 10 n = 4 n = 16 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 13 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 1 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 14 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 1 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 1 perc pontosság 95 %-os döntési szinten: SE = 0.5, becsült szórás: 10 SE = S n 0,5 = 10 n 0,5 n = 10 n = 20 n = 400 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 14 / 36

Mintanagyság meghatározása általános esetben Példa Normális eloszlás (m=100, s=10) P 0.00 0.01 0.02 0.03 0.04 60 80 100 120 140 Mennyire homogén a vizsgált populáció? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 15 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 16 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 5 perc pontosság 95 %-os döntési szinten: SE = 2.5, becsült szórás: 100 SE = S n 2,5 = 100 n 2,5 n = 100 n = 40 n = 1600 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 16 / 36

Mintanagyság meghatározása általános esetben Példa Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 5 perc pontosság 95 %-os döntési szinten: SE = 2.5, becsült szórás: 100 SE = S n 2,5 = 100 n 2,5 n = 100 n = 40 n = 1600 Annál nagyobb minta kell,... minél nagyobb pontosságra törekszem, minél nagyobb a vizsgált változó szórása a populációban. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 16 / 36

A mintaválasztás A mintaválasztás célja Miért vegyünk mintát? Nem áll rendelkezésre megfelelő információ, ismeret az érintett csoporton belül (pl. egyetemisták zenehallgatási szokásai ). Teljes populáció megkérdezésének lehetetlensége, nehézsége (költséghatékonyság, korlátozott racionalitás). Az alapsokaság egyes tulajdonságainak, paramétereinek becslése annak egy kiválasztott része alapján. Másképp: Mi célból vegyünk mintát? Felderítő kutatás: Vajon hallgatnak-e zenét? Leíró adatok gyűjtése: Milyen zenét hallgatnak? Hipotézisvizsgálat: Tényleg a trash-metal a legkedveltebb műfaj? Minőségbiztosítás: A kortárs zene jótékony hatásai? Döntéshozatal segítése: A büfében érdemes-e egy állandó DJ-t alkalmazni? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 17 / 36

A mintaválasztás Alapfogalmak Populáció: azon elemek összessége, akikre általánosítani akarom, érvényesnek tekintem a mintából levont következtetéseket Mintavételi keret: a mintavételi egységekről készült lista, melyet a mintavétel céljára használunk Minta: a ténylegesen megfigyelt elemek összessége Vizsgálati populáció: a mintavételi keret által lefedett populáció Elem: akikről információt gyűjtünk, akikről hipotéziseink szólnak Mintavételi egység: az elemek vagy azok valamilyen csoportja l. Mintavételi egység, válaszadó, megfigyelési egység, eset Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 18 / 36

A mintaválasztás A mintaválasztás lépései Forrás: http://www.femwiki.com/fem/w/wiki/concepts-in-sampling.aspx Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 19 / 36

A mintaválasztás A mintaválasztás lépései Célcsoport meghatározása: a populáció a kutatás tárgyának függvénye. Vizsgált csoport meghatározása: nem mindig tudatos döntés eredménye, szisztematikus (l. konceptualizálás). Mintavételi keret meghatározása: rendelkezésre álló erőforrások függvénye. Elemek meghatározása: valószínűségi mintavétel, nem-valószínűségi mintavétel,. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 20 / 36

A mintaválasztás A mintaválasztás lépései Alapsokaság: a vizsgálati populáció (elméletileg meghatározott) összes eleme Mintavételi keret: a kiválasztásnál figyelembe vett (elérhető) elemek összessége Megfigyelési egység: az alapsokaság elemeinek tekintett egységek Mintavételi egység: a kiválasztásnál figyelembe vett, legelemibb egységek 2 1 0 1 2 2 1 0 1 2 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 21 / 36

A mintaválasztás Valószínűségi és nem-valószínűségi mintavétel Az elemek kiválasztása alapvetően két, egymástól jól elkülöníthető módszer szerint történhet. Valószínűségi mintavétel: amikor a populáció (l. mintavételi keret) minden eleme (a mintavétel előtt már) ismert, nem nulla (és egyenlő) eséllyel kerül a mintába. VAGY Nem-valószínűségi mintavétel: minden egyéb kiválasztás. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 22 / 36

A mintaválasztás Nem-valószínűségi mintavételi eljárások A minta elemei nem valószínűségi alapon kerülnek kiválasztásra. A minta torzítása (alapsokaságtól való eltérése, ill. annak nagysága) matematikailag nem számítható. Bizonyos helyzetekben elkerülhetetlen (vagy nem célszerű) az alkalmazásuk. Gyors, költséghatékony módszerek. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 23 / 36

A mintaválasztás Nem-valószínűségi mintavételi eljárások Általánosan ismert típusai: hólabda módszer, egyszerűen elérhető alanyok megkeresése, szakértői mintavétel, kvótás mintavétel: 1936: Gallup vs. Literary Digest Az alapsokaságot leíró mátrix alapján kerülnek az egyedek kiválasztásra. A súlyozás következtében bizonyos jellemzők mentén reprezentatív a minta. Hátrányok és buktatók: l. 1948 Megfelelő kiindulási mátrix Megfelelően kiválasztott tulajdonságok Marginális elemek figyelmen kívül hagyása Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 24 / 36

A mintaválasztás Nem-valószínűségi mintavételi eljárások Miért nem valószínőségiek ezek a technikák? Vannak olyan elemek, melyek sose kerülhetnek a mintába például: kvótás mintavételnél: megfigyelő számára antipatikus emberek az egyszerűen nem elérhető alanyok hólabdás mintavételnél: a mintába került alanyok által nem ismert emberek Nem ismert az a valószínőség, amivel a kiválasztott elemek a mintába kerültek A mintába kerülés esélye szubjektív ismertségen, szimpátián alapul A szubjektív esélyt nem tudjuk számszerűsíteni Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 25 / 36

A mintaválasztás Valószínűségi mintavételi eljárások Minden egyed azonos (pontosabban: meghatározott) valószínűséggel kerül kiválasztásra. A valószínűségek alapján lehetőség nyílik a mintavétel során elkövetett hibát (mintavételi hiba), a minta torzítását számolni, azaz meghatározni azt, hogy minta által felvázolt jellemzők milyen jól jellemzik az alapsokaságot. Reprezentativitás Az alapsokaság minden eleme meghatározott, nem nulla (egyenlő) valószínűséggel kerülhet kiválasztásra. Megbízhatósági szint: a minta alapján számolt becslések milyen valószínűséggel lesznek igazak az alapsokaság tagjaira. Mintavételi hiba: a minta alapján becsült paraméter milyen mértékben ingadozik a valós érték körül (konfidencia intervallum). Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 26 / 36

A mintaválasztás Valószínűségi mintavételi eljárások Típusai: Egyszerű véletlen mintavétel (SRS) Szisztematikus véletlen mintavétel (systematic sampling) Rétegzett mintavétel (stratified sampling) Rétegzett-szisztematikus mintavétel Csoportos mintavétel (cluster sampling) Többlépcsős technikák (multi-stage sampling) Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 27 / 36

A mintaválasztás Valószínűségi mintavételi eljárások Véletlen mintaválasztás történik-e, amikor: Budapest egy véletlen módon kiválasztott buszmegállójában megkérdezek minden harmadik embert? a reprezentativitás elérése érdekében a mintatagokat az alapsokaság arányában választjuk ki: a kérdezőbiztosok 40 férfit és 60 nőt kérdeznek le a Campus véletlen bejárása során. felhívunk 500 számítógép által generált telefonszámot (l. 2+7 véletlen számjegy)? a kurzus látogatóinak neveivel ellátott papírfecniket tartalmazó kalapból csupa női nevet húzunk ki? matematika órán a tanár a napló felcsapásával választja ki a felelőt? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 28 / 36

Egyszerű véletlen mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 29 / 36

Egyszerű véletlen mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 29 / 36

Egyszerű véletlen mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 29 / 36

Rétegzett mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 30 / 36

Rétegzett mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 30 / 36

Rétegzett mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 30 / 36

Rétegzett mintavétel A mintavételi hiba Négy hallgatót kérdeztünk meg arról, hogy hány macskát tart otthon: Budapest vidék Lányok 9 7 Fiúk 3 1 Mit gondolunk, hogyan alakulna a mintavételi hiba ha egyszerű véletlen mintát, és hogyan, ha rétegzett mintát vennénk? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 31 / 36

Rétegzett mintavétel A mintavételi hiba Négy hallgatót kérdeztünk meg arról, hogy hány macskát tart otthon: Budapest vidék Lányok 9 7 Fiúk 3 1 Mit gondolunk, hogyan alakulna a mintavételi hiba ha egyszerű véletlen mintát, és hogyan, ha rétegzett mintát vennénk? Két fős mintákat választva: 1 SRS: 6 lehetséges minta: (1,7) (1,9) (3,7) (3,9) (1,3) (7,9) x = 4 + 5 + 5 + 6 + 2 + 8 6 2 Rétegzett: 4 lehetséges minta: (1,7) (1,9) (3,7) (3,9) x = 4 + 5 + 5 + 6 4 3 Rétegzett: 4 lehetséges minta: (1,3) (1,9) (3,1) (3,7) x = 2 + 5 + 2 + 5 4 = 5,S = 1 + 0 + 0 + 1 + 9 + 9 6 = 5,S = 1 + 0 + 0 + 1 4 = 0.5 = 3.33 = 3.5,S 1.5 + 1.5 + 1.5 + 1.5 = = 1.5 4 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 31 / 36

Szisztematikus mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 32 / 36

Szisztematikus mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 32 / 36

Szisztematikus-rétegzett mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 33 / 36

Szisztematikus-rétegzett mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 33 / 36

Csoportos mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 34 / 36

Csoportos mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 34 / 36

Csoportos mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 34 / 36

Csoportos mintavétel A kiválasztás menete Forrás: Dan Kerlner, Elgin Community College Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 34 / 36

A mintaválasztás Valószínűségi vs. nem-valószínűségi mintavétel Rétegzett mintavétel: Kvótás mintavétel: Nő Férfi Elméleti matematika 10 10 20 Környezettudomány 40 10 50 Rendezvényszervező 10 20 30 60 40 100 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-24 35 / 36

Köszönöm a figyelmet! Daróczi Gergely daroczi.gergely@btk.ppke.hu