A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

A társadalomkutatás módszerei I.

KÖVETKEZTETŐ STATISZTIKA

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Mintavételi eljárások

Kutatásmódszertan és prezentációkészítés

6. Előadás. Vereb György, DE OEC BSI, október 12.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

A Statisztika alapjai

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Bevezetés a hipotézisvizsgálatokba

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Populációbecslések és monitoring

A társadalomkutatás módszerei I.

Populációbecslések és monitoring

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Biomatematika 2 Orvosi biometria

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

Elemi statisztika fizikusoknak

[Biomatematika 2] Orvosi biometria

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kísérlettervezés alapfogalmak

Statisztika elméleti összefoglaló

[Biomatematika 2] Orvosi biometria

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

A leíró statisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Tervezett béremelés a versenyszektorban 2016-ban A októberi vállalati konjunktúra felvétel alapján február 3.

A társadalomkutatás módszerei I.

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Alba Radar. 4. hullám. Helyi politikai preferencia

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

A valószínűségszámítás elemei

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

Mérési hibák

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

JA45 Cserkeszőlői Petőfi Sándor Általános Iskola (OM: ) 5465 Cserkeszőlő, Ady Endre utca 1.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

y ij = µ + α i + e ij

MÓDSZERTANI LEÍRÁS DIPLOMÁS KUTATÁS A vizsgálat keretei. A kutatás alapsokasága. Az adatfelvétel módszere

Véleménypolarizáció és választási részvétel. Kmetty Zoltán MTA- ELTE- PERIPATO

Biometria gyakorló feladatok BsC hallgatók számára

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Fábián Zoltán: Szavazói táborok társadalmi, gazdasági beágyazottsága - Statisztikai melléklet

Iskolai jelentés. 10. évfolyam szövegértés

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Lineáris regresszió vizsgálata resampling eljárással

11.3. A készségek és a munkával kapcsolatos egészségi állapot

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Többváltozós lineáris regressziós modell feltételeinek

Kísérlettervezés alapfogalmak

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Statisztikai becslés

A maximum likelihood becslésről

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Alba Radar. 26. hullám

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

PIACKUTATÁS (MARKETINGKUTATÁS)

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Matematika. Xántus János Két Tanítási Nyelvű Gimnázium és Szakgimnázium OM azonosító: Telephelyi jelentés Telephely kódja: 001

Alba Radar. 11. hullám

[Biomatematika 2] Orvosi biometria

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Több valószínűségi változó együttes eloszlása, korreláció

III. Képességvizsgálatok

Minőség-képességi index (Process capability)

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

1/8. Iskolai jelentés. 10.évfolyam matematika

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Biomatematika 2 Orvosi biometria

Biostatisztika Összefoglalás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Kockázatalapú változó paraméterű szabályozó kártya kidolgozása a mérési bizonytalanság figyelembevételével

Átírás:

A társadalomkutatás módszerei I. 10. hét Daróczi Gergely Budapesti Corvinus Egyetem 2011. november 17. Outline 1 Ismétlés Számítási feladat Egyéb példák 2 A mintavételi hiba dichotóm változók esetében 3 A mintanagyság meghatározása 4 Torzítatlanság és reprezentativitás Elmélet Típusok 5 Elrettentő példa Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 2 / 26 Elmélet Szükséges képletek: számtani átlag: x = n i=1 x i n korrigált empirikus szórás: S = n (x i x) 2 i=1 n (nem Zh kérdés!) standard/mintavételi hiba: SE = S n 1 n N S n konfidencia-intervallum: x ± z SE, ahol legtöbbször z = 1,96 Tehát: konfidencia-intervallum: = [x 2 SE;x + 2 SE] x 2 SE x x + 2 SE Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 3 / 26

Gyakorlat Az őszi kutatásban is megkérdezték az autósokat az üzemanyagárak lélektani határáról. A felmérés közben hétről hétre dőltek meg az üzemanyagár csúcsok, ezért a kutatás a 400 és a 450 forint közötti literenkénti ársávot vizsgálta. A gázolaj árának hatását most is rugalmasabban ítélték meg az autósok, még mindig sokan vannak, akik 450 forint feletti áron is ugyanannyit tankolnának, mint most. A benzinnél 420 forintos árnál a válaszadók többsége már nem tankolna annyit mint korábban, s jelentősen csökkentené az autó használatát. Forensis Autóklub (2011.november) Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 4 / 26 Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 Leíró statisztikák: számtani átlag: x = 410+420+420+430+500+450+400+425+460 9 = 435 medián: 425 módusz: 420 minimum érték: 400 maximum érték: 500 terjedelem: 100 szórás/variancia: nem Zh kérdés Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 5 / 26 Gyakorlat Mi az az üzemanyag ár, ahol már hosszútávra leállítanád az autódat és nem tankolnál rendszeresen? 410, 420, 420, 430, 500, 450, 400, 425, 460 számtani átlag: x = 410+420+420+430+500+450+400+425+460 9 = 435 korrigált empirikus szórás: S = 30,619 standard/mintavételi hiba: SE = 30,619 9 = 30,619 3 = 10,206 konfidencia-intervallum: 435 ± 2 10,206 = [414,59;455,41] x = 435 x 2 SE = 414,59 x+2 SE = 455,41 400 420 440 460 480 500 Ft Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 6 / 26

Az "új fizika" lehetőségét vetíti előre az a részecskebomlási "anomália", amelyet az Európai Nukleáris Kutatási Szervezet (CERN) nagy hadronütköztetőjében (LHC) észleltek. Matthew Charles, az Oxfordi Egyetem fizikusának beszámolója szerint a D-mezon szubatomi részecskék kissé másként bomlanak, mint antirészecskéik. A felfedezés segíthet megérteni, hogy a világegyetemben miért több az anyag, mint az antianyag. Egyelőre azonban újabb vizsgálatok szükségesek, jelenleg ugyanis statisztikailag mindössze 0,05 százalék a valószínűsége, hogy eredményeik nem véletlenszerűek. Forrás: index.hu Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 7 / 26 Forrás: Dr. Bartus Tamás előadásanyagai Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 8 / 26 Forrás: spss.hu Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 9 / 26

Forrás: Metz Rudolf Tamás A 2010-es országgyűlési választások előrejelzései és azok eltérései Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 10 / 26 Forrás: Kópházi Dániel A politikai közvélemény-kutatások megbízhatósága Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 11 / 26 Forrás: Kópházi Dániel A politikai közvélemény-kutatások megbízhatósága Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 12 / 26

A mintavételi hiba dichotóm változók esetében Elmélet Bernoulli-eloszlás: diszkrét, dichotóm valószínűségi változó p valószínűséggel 1, q (= 1 p) valószínűséggel 0 értéket vesz fel átlag: p medián: 0 if q > p módusz: 0,1 if q = p 1 if q < p szórás: p(1 p) variancia: p(1 p) standard/mintavételi hiba: SE = S n 1 n N S n p(1 p) n konfidencia-intervallum: x ± z SE, ahol legtöbbször z = 1,96 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 13 / 26 A mintavételi hiba dichotóm változók esetében Pesszimista megközelítés Bernoulli-eloszlás: a várható legnagyobb mintavételi hibával számolunk, a mérési hiba a szórás és a mintaelemszám függvénye, a mintaelemszám növelésével csökkenthető a mintavételi hiba, ha egy mintában magas a szórás, magas lesz a mintavételi hiba. Milyen p érték mellett lesz a lehető legmagasabb a szórás? S = p(1 p) p = 0.5 VAR(x) = 0.5 (1 0.5) = 0.5 2 = 0.25 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 14 / 26 A mintavételi hiba dichotóm változók esetében Pesszimista megközelítés Bernoulli distribution Standard error 0.00 0.05 0.10 0.15 0.20 0.25 0.0 0.2 0.4 0.6 0.8 1.0 standard/mintavételi hiba: SE = S n 1 n N p(1 p) S n n p Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 15 / 26

A mintavételi hiba dichotóm változók esetében Mintanagyság meghatározása Mekkora mintára van szükségem ahhoz, hogy egy párt támogatottságát plusz/mínusz 2 százalék pontossággal mérjem? 2 százalék pontosság 95 %-os döntési szinten: SE = 1, várható legnagyobb szórásnégyzet százalékos értékeknél: 50 (100 50) = 2500 SE = S n 1 = 2500 n 1 n = 2500 n = 2500 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 16 / 26 Mintanagyság meghatározása általános esetben Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 5 perc pontosság 95 %-os döntési szinten: SE = 2.5, becsült szórás: 10 SE = S n 2,5 = 10 n 2,5 n = 10 n = 4 n = 16 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 17 / 26 Mintanagyság meghatározása általános esetben Mekkora mintára van szükségem ahhoz, hogy 1 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 1 perc pontosság 95 %-os döntési szinten: SE = 0.5, becsült szórás: 10 SE = S n 0,5 = 10 n 0,5 n = 10 n = 20 n = 400 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 18 / 26

Mintanagyság meghatározása általános esetben Normális eloszlás (m=100, s=10) P 0.00 0.01 0.02 0.03 0.04 60 80 100 120 140 Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 19 / 26 Mintanagyság meghatározása általános esetben Mekkora mintára van szükségem ahhoz, hogy 5 perc pontosság meg tudjam állapítani a napi tévénézésre fordított idő hosszát a felnőtt magyar lakosság körében? 5 perc pontosság 95 %-os döntési szinten: SE = 2.5, becsült szórás: 100 SE = S n 2,5 = 100 n 2,5 n = 100 n = 40 n = 1600 Annál nagyobb minta kell,... minél nagyobb pontosságra törekszem, minél nagyobb a vizsgált változó szórása a populációban. Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 20 / 26 Torzítatlanság és reprezentativitás Elmélet Amennyiben X: az a változó, amiről meg akarunk tudni valamint (vizsgálati változó), és Y: tetszőleges NEM vizsgálati változó, melynek paramétere ismert, akkor: A minta torzítatlan ha X mintabeli átlaga = X valós átlaga. A minta reprezentatív ha Y mintabeli átlaga = Y valós átlaga. De: ezek közül melyik megismerhető? Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 21 / 26

Torzítatlanság és reprezentativitás A torzítatlanság típusai Szelekciós torzítás: a mintába kerülés a vizsgált változó, vagy azzal összefüggő, látens dimenzió függvénye. A reprezentativitás hiányából fakadó torzítás: Kérdés: a mintába kerülés valószínűsége összefügg egy megfigyelt, de nem vizsgált változóval, amely változó eloszlása eltér a populációbeli ismert eloszlástól. A vizsgált változó összefügg-e az említett változóval? L. az NRC eredményeit az EP választással kapcsolatban! Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 22 / 26 Torzítatlanság és reprezentativitás Miért nem tudta előrejelezni a Literary Digest 1936-ban Roosevelt újraválasztását? Torz mintavételi keret használata: A Digest mintavételi kerete: gépkocsi tulajdonosok és telefon-előfizetők listája, ahol nagyobb arányban fordulnak elő konzervatív (jómódú) szavazók. Szelektív válaszmegtagadás: A Digest által kiküldött kérdőíveknek csak 22 százaléka érkezett vissza! És a visszaküldés a pártpreferencia függvénye: a kérdőívet alacsonyabb arányban küldték vissza a demokrata szavazók. Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 23 / 26 Torzítatlanság és reprezentativitás Vizsgáljuk a magyar felnőtt lakosság jövedelmi viszonyait! Torz mintavételi keret használata: Mintavételi keret legyen a mobiltelefon-előfizetők listája, ahol a kevéssé tehetősek nem jelennek meg, ill. a keret akkor is torzított, ha a leggazdagabbak titkosítják számukat. Szelektív válaszmegtagadás: Kisebb eséllyel készül interjú azokkal, akik sokat dolgoznak, és akik sokat dolgoznak, valószínűleg sokat is keresnek. Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 24 / 26

Egy elrettentő példa A szavazás lezárult, kiderült tehát, hogy a Nemzeti Sport SMS-ben szavazó olvasói kit láttak a világ legjobbjának az elmúlt esztendőben. Három kategóriában viaskodtak a legek, harmadszorra a csapatok versengésének végeredményét ismertetjük. A szavazók szerint 2005-ben a Barcelona labdarúgócsapata volt a legjobb! Reprezentatív a minta, elvégre lapunk olvasói csak elenyésző részét képezik a labdarúgásról véleményt formálók táborának, ám él bennünk a gyanú, hogy ha a Nemzeti Sport globálisan hirdette volna meg szimpátiaszavazását, akkor is a Barcelona érdemelte volna ki «A világ legjobb csapata» címet. Forrás: Nemzeti Sport (2006. 01. 06.) Daróczi Gergely (BCE) A társadalomkutatás módszerei I. (10/14) 2011. november 17. 25 / 26 Köszönöm a figyelmet! Daróczi Gergely daroczi.gergely@btk.ppke.hu