Mintavételi eljárások

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

A társadalomkutatás módszerei I.

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

KÖVETKEZTETŐ STATISZTIKA

A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

6. Előadás. Vereb György, DE OEC BSI, október 12.

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Dr. Piskóti István Marketing Intézet. Marketing 2.

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05. A kutatás dokumentációja

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Populációbecslések és monitoring

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Mintavétel: terv és eljárások

Mintavétel: terv és eljárások

Populációbecslések és monitoring

Mintavétel a gyakorlatban

S atisztika 2. előadás

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Szerzők: Kmetty Zoltán és Sztárayné Kézdy Éva Lektor: Fokasz Nikosz TÁMOP A/1-11/ INFORMÁCIÓ - TUDÁS ÉRVÉNYESÜLÉS

PIACKUTATÁS (MARKETINGKUTATÁS)

Statisztika elméleti összefoglaló

[Biomatematika 2] Orvosi biometria

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

y ij = µ + α i + e ij

A populáció meghatározása

3. A mintavételi kockázat elfogadható szintjének meghatározása (pl. 5 vagy 10%)

MÓDSZERTANI LEÍRÁS DIPLOMÁS KUTATÁS A vizsgálat keretei. A kutatás alapsokasága. Az adatfelvétel módszere

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

A Statisztika alapjai

Normális eloszlás tesztje

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 98/1. SPSS állomány neve: Könyvtári dokumentum sorszáma: 287. Budapest, 1998.

Statisztika. Politológus képzés. Daróczi Gergely március 13. Politológia Tanszék

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kvantitatív kutatás mire figyeljünk? Majláth Melinda PhD Tartalom. Kutatási kérdés kérdőív kérdés. Kutatási kérdés kérdőív kérdés

Bevezetés a hipotézisvizsgálatokba

Hipotézis vizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Hipotézis vizsgálatok

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Két adatfelvétel: a szegény háztartások fogyasztási szokásai és a tulajdonosi jövedelmek szerkezete. Medgyesi Márton Tárki Zrt

Lineáris regresszió vizsgálata resampling eljárással

Varianciaanalízis 4/24/12

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

Dr. Király István Igazságügyi szakértő Varga Zoltán Igazságügyi szakértő Dr. Marosán Miklós Igazságügyi szakértő

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

A leíró statisztikák

S atisztika 1. előadás

Mérési hibák

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Változás SPSS állomány neve: Budapest, 2002.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

NÉPESSÉGTUDOMÁNYI KUTATÓ INTÉZET

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Adatok statisztikai értékelésének főbb lehetőségei

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Inflációs várakozás 2002/8. SPSS állomány neve: Budapest, augusztus

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

S atisztika 1. előadás

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 2003/2. SPSS állomány neve: Budapest, február

Több valószínűségi változó együttes eloszlása, korreláció

Heckman modell. Szelekciós modellek alkalmazásai.

A társadalomkutatás módszerei I.

MINŐSÉGFEJLESZTÉSI BESZÁMOLÓ

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 2002/10. SPSS állomány neve: Budapest, október

Kettőnél több csoport vizsgálata. Makara B. Gábor

(Minőségirányítási utasítás) 3. sz. verzió. A kiadás dátuma: február 1. Dr. Gáti József általános rektrohelyettes

Kockázatalapú változó paraméterű szabályozó kártya kidolgozása a mérési bizonytalanság figyelembevételével

[Biomatematika 2] Orvosi biometria

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

1. ECHO Innovációs Műhely Obádovics Csilla Vinogradov Szergej: tavaszi on-line felmérés

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Diplomás kutatás Módszertani leírás

Biomatematika 2 Orvosi biometria

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Reform. SPSS állomány neve: Budapest, október

Átírás:

Mintavételi eljárások Daróczi Gergely, PPKE BTK 2008. X.6.

Óravázlat A mintavétel célja Alapfogalmak Alapsokaság, mintavételi keret, megfigyelési egység, mintavételi egység... Nem valószínűségi mintavételezési technikák Könnyen elérhető alanyok megkérdezése Szakértői mintavétel Hólabda Kvótás mintavétel Valószínűségi mintavételezési technikák Egyszerű és szisztematikus mintavétel Rétegzett mintavétel Többlépcsős technikák A lebonyolítás módjai Önkitöltős / kérdezőbiztos által felvett kérdőívek Posta / telefon / Internet / SMS (csatorna) Egyéb megfontolások 2

A mintavétel célja Nem áll rendelkezésre megfelelő információ, ismeret az érintett csoporton belül (pl.: egyetemisták zenehallgatási szokásai) Teljes populáció megkérdezésének lehetetlensége, nehézsége (költséghatékonyság, avagy: a korlátozott racionalitás jótékony hatásai) Az alapsokaság egyes tulajdonságainak, paramétereinek becslése annak egy kiválasztott része alapján Felderítő kutatás ( Vajon hallgatnak-e zenét... ) Leíró adatok gyűjtése ( Milyen zenét hallgatnak... ) Hipotézisvizsgálat (elméletek, modellek tesztelése) ( Tényleg a trash-metal a legkedveltebb műfaj? ) Minőségbiztosítás ( A kortárs zene jótékony hatásai... ) Döntéshozatal segítése ( A büfében érdemes-e egy állandó DJ-t alkalmazni? ) 3

Alapfogalmak Alapsokaság: a vizsgálati populáció (elméletileg meghatározott) összes eleme Mintavételi keret: a kiválasztásnál figyelembe vett (elérhető) elemek összessége Megfigyelési egység: az alapsokaság elemeinek tekintett egységek Mintavételi egység ( alapsokaság elemi egységei): a kiválasztásnál figyelembe vett, legelemibb egységek Pontos meghatározás! 4

Nem valószínűségi mintavétel A minta elemei nem valószínűségi alapon kerülnek kiválasztásra A minta torzítása (alapsokaságtól való eltérése, ill. annak nagysága) matematikailag nem számítható Bizonyos helyzetekben elkerülhetetlen (vagy nem célszerű) az alkalmazásuk Gyors, költséghatékony módszerek Típusai: egyszerűen elérhető alanyok megkeresése szakértői mintavétel hólabda módszer kvótás mintavétel (ld. Gallup) 5

Kvótás mintavétel 1936: Gallup sikeresen megjósolta Roosevelt győzelmét (vs Literary Digest önkitöltős, postai kérdőívek milliós nagyságrendje) Az alapsokaságot leíró mátrix alapján kerülnek az egyedek kiválasztásra (nem konkrét célszemélyek!) Egyetemisták Fekete Barna Szőke Vörös Fiú 432 543 643 23 Lány 234 436 387 63 A megkérdezett minta súlyozása bizonyos jellemzőkre reprezentatív felmérés Hátrányok, buktatók: ld. 1948 Megfelelő kiindulási mátrix Megfelelően kiválasztott tulajdonságok Marginális elemek figyelmen kívül hagyása 6

Valószínűségi mintavétel Minden egyed azonos (pontosabban: meghatározott) valószínűséggel kerül kiválasztása Reprezentativitás általános meghatározása: az alapsokaság minden eleme meghatározott, nem nulla valószínűséggel kerülhet kiválasztásra (pontosítást igényel!) A valószínűségek alapján lehetőség nyílik a mintavétel során elkövetett hibát (mintavételi hiba), a minta torzítását számolni, azaz meghatározni azt, hogy minta által felvázolt jellemzők milyen jól jellemzik az alapsokaságot Megbízhatósági szint: a minta alapján számolt becslések milyen valószínűséggel lesznek igazak az alapsokaság tagjaira Mintavételi hiba: a minta alapján becsült paraméter milyen mértékben ingadozik a valós érték körül (konfidencia intervallum) Pl.: 95 százalékos megbízhatósági szinten elmondható, hogy a Blikk címoldalán 3-5 szupersztár neve jelenik meg nap, mint nap 7

Egyszerű véletlen mintavétel (SRS) A mintavételi keret minden tagja ugyanakkora valószínűséggel kerülhet kiválasztásra (P=n/N) Az alapsokaság minden tagjának ( mintavételi keret) ismerni kell elérhetőségét, az elemeket listába kell tudnunk rendezni A listáról n (=mintaelemszám) darab, véletlenül kiválasztott egyedet választunk be a mintába 8

Egyszerű véletlen mintavétel (SRS) II. A véletlen választás történhet: véletlenszám-táblázat vagy számítógép segítségével a lista véletlen szerinti elrendezése után szisztematikusan (minden k. elem kiválasztása, ahol k=n/n) A mintavételi hiba függ: Minta homogenitásától (szórásától) A minta nagyságától Az alapsokaság elemszámától Se= S n 1 n N A szükséges mintanagyság számolható! Hüvelykujj-szabály:n>1.000 fő elfogadható reprezentativitást garantál (nem minden esetben - ld. a mintavételi hibát meghatározó tényezők) 9

Rétegzett mintavétel (stratification) Célja: a minta bizonyos változók szerinti teljes reprezentativitása Módszere: a mintavételi hiba csökkentése a homogenitás növelésével (a minta rétegekre bontásával) Egy nagy, véletlen minta helyett számos kisebb, homogén részcsoport vizsgálata A részcsoportok kiválasztása előzetes feltételezéseken alapul Nem megfelelő réteg-képzés nagyobb mintavételi hibával jár együtt (mint akár SRS esetén!) Legegyszerűbb módja: a mintavételi keret tagjainak listájának rétegek szerinti rendezése, majd szisztematikus mintavételezés 10

Az egyszerű és a rétegzett mintavétel összehasonlítása ALAPSOKASÁG Hajszálak száma (100e) Fiú 1 3 Lány 7 9 Átlag 5 Véletlen mintavétel: átlag = (4+5+5+6+2+8)/6 = 5 szórás = (1+0+0+1+9+9)/6 = 3,33 Rétegzett mintavétel: átlag = (4+5+5+6)/4 = 5 szórás = (1+0+0+1)/4 = 0,5 Véletlen mintavétel Véletlen mintavétel Minta Átlag Valószínűség Minta Átlag Valószínűség 1,7 4 1/6 1,7 4 ¼ 1,9 5 1/6 1,9 5 ¼ 3,7 5 1/6 3,7 5 ¼ 3,9 6 1/6 3,9 6 ¼ 1,3 2 1/6 7,9 8 1/6 Átlag: az egyes minták átlagainak átlaga (összegük / minták száma) Szórás: a minták átlagainak eltérése az összesített átlagtól (egyes eltérések négyzetének összege / minták száma) Rossz rétegzés esetén: (1,7) (3,9) a szórás értéke 4,5 lesz!!! 11

Többlépcsős csoportos mintavétel (clustering) Bizonyos esetekben nem áll rendelkezésre teljes lista a célcsoportról (vagy nem célszerű az alapján dolgozni) A mintavételi egységek több lépésen keresztül is elérhetőek valószínűségi alapon Viszont: minden egyes lépcső esetén újabb mintavételi hiba jelentkezik! 12

A minta elérésének módjai Önkitöltős postai kérdőív Olcsó (alacsony emberi erőforrás) Kényes kérdések magasabb megválaszolási aránya Összességében magasabb válaszmegtagadási arány Alacsony visszaküldési arány (60%?) Kérdezőbiztosok által felvett adatok Megbízható (problémás pontok tisztázása a kérdezőbiztos által) Alacsonyabb válaszmegtagadási arány Kényes kérdések nehezen kezelhetőek Kérdezőbiztosok megbízhatósága, megfelelő felkészítése? Magas emberi erőforrás-szükséglet 13

A kérdezést, adatfeldolgozást megkönnyítő eszközök Computer Aided Telephone Interview Computer Aided Personal Interview On-line kutatások SMS / Wap kérdőívek Emberi közreműködést nem igénylő telefonos kérdezések 14