Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása



Hasonló dokumentumok
Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

A statisztika részei. Példa:

7. el adás Becslések és minta elemszámok fejezet Áttekintés

Az új építőipari termelőiár-index részletes módszertani leírása

Ingatlanfinanszírozás és befektetés

KAOTIKUS VAGY CSAK ÖSSZETETT? Labdák pattogása lépcsôn

csz10 eleje.qxd :51 Page 1 CIVIL SZEMLE

A HŐMÉRSÉKLETI SUGÁRZÁS

Villamos gépek tantárgy tételei

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel?

18. Differenciálszámítás

I. FEJEZET BICIKLIHIÁNYBAN

Tartalomjegyzék. Pemutáció 5 Ismétléses permutáció 8 Variáció 9 Ismétléses variáció 11 Kombináció 12 Ismétléses kombináció 13

Hosszmérés finomtapintóval 2.

GAZDASÁGI MATEMATIKA 1. ANALÍZIS

Tranziens káosz nyitott biliárdasztalokon

Orosz Gyula: Markov-láncok. 2. Sorsolások visszatevéssel

ANDRÁS SZILÁRD, CSAPÓ HAJNALKA, NAGY ÖRS SIPOS KINGA, SOÓS ANNA, SZILÁGYI JUDIT

Az iparosodás és az infrastrukturális fejlődés típusai

Jelen tanulmány tartalma nem feltétlenül tükrözi az Európai Unió hivatalos álláspontját.

Példa: 5 = = negatív egész kitevő esete: x =, ha x 0

Tisztelt Olvasó! Minden Kedves oovasónknak Szeretetteljes Karácsonyi Ünnepeket és Boldog Új Esztendõt Kívánunk!

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Mérések, hibák. 11. mérés. 1. Bevezető

1.1 Példa. Polinomok és egyenletek. Jaroslav Zhouf. Első rész. Lineáris egyenletek. 1 A lineáris egyenlet definíciója

2. AZ INFORMÁCIÓS TÁRSADALOM ÉRTELMEZÉSI DIFFERENCIÁINAK TERÜLETI KÖVETKEZMÉNYEI

Nagyméretű nemlineáris közúti közlekedési hálózatok speciális analízise

TENYÉSZTÉSES MIKROBIOLÓGIAI VIZSGÁLATOK II. 1. Mikroorganizmusok számának meghatározása telepszámlálásos módszerrel

10. évfolyam, harmadik epochafüzet

AZ ÉPÜLETGÉPÉSZETI RENDSZEREK ENERGIA-HATÉKONYSÁGÁNAK KÉRDÉSEI

Dunaföldváron a régió legnagyobb máltai ünnepi rendezvénye

Területi koncentráció és bolyongás Lengyel Imre publikációs tevékenységében

Ingatlanok értékelése hozamszámítással

SIMA FELÜLETŰ MOTO- ROKKAL 0,37 1,1 kw

TETÔPONT. e ég e t t v é d e l

Sorbanállási modellek

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

n akkor az n elem összes ismétléses ... k l k 3 k 1! k 2!... k l!

1. Az absztrakt adattípus

Minőségirányítási rendszerek 8. előadás

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

képzetes t. z = a + bj valós t. a = Rez 5.2. Műveletek algebrai alakban megadott komplex számokkal

Hipotézis-ellenırzés (Statisztikai próbák)

PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ. Írta Dr. Huzsvai László

A PÉNZ IDİÉRTÉKE. Egy jövıbeni pénzösszeg jelenértéke:

A logaritmus függvény bevezetése és alkalmazásai

VI.Kombinatorika. Permutációk, variációk, kombinációk

XXXIV. Egyetemi Orvosnapok

Vi-vaHA collagen Ajándékozza meg testét és bőrét a megújulás üdeség és a vitalitás érzésével, köszönhetően a

Rugalmas elektronszórás; Recoil- és Doppler-effektus megfigyelése

1. A radioaktivitás statisztikus jellege

Felhasználói kézikönyv

Csapágyak üzem közbeni vizsgálata a csavarhúzótól a REBAM 1 -ig 2

a legjobb kezekben K&H Csoport

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Nevezetes sorozat-határértékek

Walltherm rendszer. Magyar termék. 5 év rendszergaranciával. Felületfûtés-hûtés Épületszerkezet-temperálás padlófûtés

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

A települési hősziget-intenzitás Kárpátalja alföldi részén 1

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Független komponens analízis

CIVILEK A NYOMTATOTT SAJTÓBAN ÉRDEKÉRVÉNYESÍTÉS A MÉDIÁBAN 1

3.3 Fogaskerékhajtások

2 x. Ez pedig nem lehetséges, mert ilyen x racionális szám nincs. Tehát f +g nem veszi fel a 0-t.

Kevei Péter november 22.

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

IFFK 2013 Budapest, augusztus Stróbl András*, Péter Tamás**

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

DIGITÁLIS DOMBORZATMODELLEK ELŐÁLLÍTÁSI TECHNOLÓGIÁI ÉS MINŐSÉGI PARAMÉTEREI

III. FEJEZET FÜGGVÉNYEK ÉS TULAJDONSÁGAIK

Tehetség, kreativitás és zsenialitás: a felszín és ami mögötte van

Kontingencia táblák. Khi-négyzet teszt. A nullhipotézis felállítása. Kapcsolatvizsgálat kategorikus változók között.

f(n) n x g(n), n x π 2 6 n, σ(n) n x

Kalkulus II., második házi feladat

NUMERIKUS SOROK II. Ebben a részben kizárólag a konvergencia vizsgálatával foglalkozunk.

FELADATOK A KALKULUS C. TÁRGYHOZ

Felhasználói kézikönyv

Statisztikai programcsomagok

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

FELADATOK a Bevezetés a matematikába I tárgyhoz

BIOMATEMATIKA ELŐADÁS

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

Statisztika 1. zárthelyi dolgozat március 21.

FOLYADÉKKRISTÁLY-TELEVÍZIÓK Éber Nándor

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

A teveszabály és alkalmazásai

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

VII. A határozatlan esetek kiküszöbölése

Felépítés Típus / Konfigurálás setup programmal. Mérési adatok kiolvasása

AZ ÜZEMELTETÉSI KÖLTSÉGEK MINIMALIZÁLÁSA, A TERMELÉKNYSÉG MAXIMALIZÁLÁSA

EGYENLETEK ÉS EGYENLETRENDSZEREK MEGOLDÁSA A Z n HALMAZON. egyenletrendszer megoldása a

FANTASZTIKUS KOMBINATORIKA. Adva van n különböző elem. A kiválasztás sorrendje számít VARIÁCIÓ. mateking.hu

specific (assignable) cause: azonosítható, tettenérhető (veszélyes) hiba megváltozott a folyamat

4. Test feletti egyhatározatlanú polinomok. Klasszikus algebra előadás NE KEVERJÜK A POLINOMOT A POLINOMFÜGGVÉNNYEL!!!

Sorozatok A.: Sorozatok általában

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

HU / -- Mag rendszer. Padlótisztítás

Átírás:

Rudas Tamás: A hibahatár a becsült meyiség függvéyébe a mért ártrefereciák téves értelmezéséek egyik forrása Megjelet: Agelusz Róbert és Tardos Róbert szerk.: Mérésről mérésre. A választáskutatás módszertai kérdései. Budaest: Demokrácia Kutatások Magyar Közotja Alaítváy, 6. 7-4.. Forrás: htt://www.valasztaskutatas.hu

RUDAS TAMÁS A hibahatár a becsült meyiség függvéyébe a mért ártrefereciák téves értelmezéséek egyik forrása A felmérések eredméyeiek megbízhatóságát általába egyetle számmal, a hibahatárral jellemezzük. Taasztalataim szerit sok félreértés létezik a hibahatár jeletését és helyes haszálatát illetõe, amelyek közül egyesek a vélt hibát a várhatóál agyobbak, mások edig kisebbek mutatják. A hibahatár otos fogalmáak és helyes haszálatáak leírása utá a megbízhatóságot befolyásoló legfotosabb téyezõket mutatom be. A fejezet legfõbb üzeete az, hogy elletétbe a közkeletû vélekedéssel a megbízhatóságot em csak a felmérés elkészítése sorá alkalmazott eljárások befolyásolják, haem az is, hogy milye érték becsléséek a megbízhatóságáról va szó. Például az összes szavazásra jogosult közül az egy bizoyos ártot választók aráyára voatkozó becslés megbízhatósága eltér a valamilye ártot választók közül ugyaezt a ártot választók aráyára voatkozó becslés megbízhatóságától. Talá em megleõ ebbe a helyzetbe, hogy a felmérések készítõi és közlõi az esetek többségébe a sok külöbözõ megbízhatóság közül a legkedvezõbbek tûõt mutatják be, és ezzel a felhaszálókat gyakra félrevezetik. Még eél is sajálatosabb, hogy magukat szociológusak vagy statisztikusak evezõ szerzõk emegyszer olitikai elvakultságtól vezetve a hibahatárt tévese haszáló és ezért hibás godolatmeetekkel róbálak érveli. MEGBÍZHATÓSÁG ÉS ÉRVÉNYESSÉG Elsõ közelítésbe azt modhatjuk, hogy adataik megbízhatósága azt jeleti, hogy otosa mértük, érvéyességük edig azt, hogy téylegese azt mértük meg, amire kívácsiak vagyuk. Eze a szite érvéyesség és meg-

8 RUDAS TAMÁS bízhatóság kíváalmak, amelyekek adatfelvételük vagy megfelel vagy em, ugyaakkor az esetek többségébe haszos az érvéyesség és megbízhatóság fogalmát kvatifikáli már ameyire ez lehetséges, és többé vagy kevésbé megbízható adatfelvételekrõl beszéli. Amit azt láti fogjuk, a megbízhatóság kvatifikálására meglehetõse hatásos eszközökkel redelkezük, az érvéyesség mérése azoba ehezebb feladat. Ha a oulációra jellemzõ téyleges érték, amelyet meg akaruk becsüli egy felmérés adataiból araméter és erre voatkozó becslésük értéke b, akkor a és b közötti eltérést hibáak evezzük. Az eltérés szó jeletése itt a külöbség abszolút értéke. Általába ics szükség arra, hogy a ozitív hibákat amikor b agyobb, mit megkülöböztessük a egatív hibáktól amikor b kisebb, mit. A b becslés valamilye agyságú mitá alault és mivel b várható viselkedésébe a mitaagyságak kulcsszeree va, ezt jelöljük is: b. Feltételezzük, hogy egy adott adatgyûjtési eljárást külöbözõ mitaagyságokkal is végrehajthaták. Természetese b értéke függ attól is, hogy ée melyik elemû mitát figyeltük meg, de ez a függés egyelõre em lesz léyeges. Azok a oulációk, amelyekkel a társadalomtudomáyokba foglalkozuk véges agyságúak, és jelöljük az aktuális ouláció agyságát N-el. Az érvéyesség kvatifikálható fogalmáak megértéséhez tekitsük a bn értéket, azaz azt a becslést, amelyet akkor kaák, ha mitaagyságuk megegyeze a teljes ouláció agyságával. Mivel olya mita, amely akkora, mit a teljes ouláció, csak egyetle lehetséges mideki a mitába kerül, a bn meyiség egyértelmûe meghatározott, abba az értelembe, hogy em függ attól, hogy ée melyik mitával dolgozuk hisze N elemû mita csak egyetle lehetséges. A bn becslés, amely természetese csak akkor álla redelkezésre, ha midekit megfigyelék vagy megegyezik a araméter értékkel vagy em, azaz a bn meyiség lehet ulla is, de más érték is. Nyilvávaló éldául, hogyha lehetséges is lee a választások elõtt két aal midekit megkérdezi, akkor sem tudák egésze otosa megmodai a választások eredméyét, mert egyesek em modaáak igazat, mások késõbb megváltoztaták a véleméyüket stb. Ebbe az esetbe bn értéke em ulla. Hasolókée a észámlálás sem tud otos kéet adi éldául a lakosság vallásosságáról [azaz bn itt sem ulla], mert az alkalmazott eljárások em megfelelõek egy ilye érzékey és eheze defiiálható fogalom vizsgálatára. Tehát aak, hogy egy teljes körû felmérés cezus, észámlálás adata eltér a téyleges értéktõl, többféle oka lehet.

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 9 Az érvéyesség szemotjából az eltérés oka közömbös és csak eek agysága játszik szereet. Egy becslés hibája, azaz eltérése a valódi értéktõl, midig felírható a következõ alakba: b = b bn bn. A jobb oldalo szerelõ két meyiség közül az elõbbi azt mutatja, hogy az aktuális elemû mitá alauló becslés meyire tér el attól, amelyet akkor kahaták, ha midekit megkérdeztük vola, a második meyiség edig azt mutatja, hogyha midekit megkérdezék, akkor becslésük meyire tére el a valódi értéktõl. Ezzel a hibát két komoesre botottuk, az elsõ eve mitavételi hiba, a másodiké edig em mitavételi hiba. Az elsõ hibaösszetevõ aak tudható be, hogy em kérdeztük meg midekit haem csak egy mitába került személyeket. Eek a hibáak a mértéke általába csökkethetõ a mitaagyság övelésével, sõt, elméletileg mideki megkérdezésével ez a hiba teljese elkerülhetõ. A második hibaösszetevõek ics köze a mitavételhez. Akkor is változatla lee, ha egyáltalá em is egy mitára, haem mideki megkérdezésére alaozák a becslést. Ez a hiba az adatgyûjtések a mitavétel által em éritett jellemzõiek tudható be az alkalmazott kérdõív, a kérdezõbiztosok, az adatgyûjtést végzõ cégrõl kialakult vélekedés stb. A téylegese haszált becslési eljárások szite midig redelkezek a következõ két fotos tulajdosággal és a továbbiak csak ilye tulajdoságú becslésekre igazak:. adott eseté b értéke bn körül igadozik [a külöbözõ elemû mitákra alaozott becslések közül egyesek agyobbak, mit bn, mások kisebbek aál], azaz b várható értéke bn;. továbbá ha értékét öveljük az elõbbi igadozás mértéke csökke és b értékei a külöbözõ elemû miták eseté egyre közelebb kerülek bn értékéhez. Ebbõl következõe a mitavételi hiba övelésével egyre csökke, sõt, tetszõlegese kicsivé tehetõ. Ugyaakkor a mitaagyság övelése em befolyásolja a em mitavételi hiba értékét sõt, az adatgyûjtés egyre extezívebb módja miatt ikább öveli azt. Ha tehát bn értéke em ulla, akkor eljárásuk igazából em -t becsli, haem bn értékét, mert becsléseik ekörül igadozak és a mi-

RUDAS TAMÁS taagyság övelésével ehhez tuduk közel kerüli. Ezzel szembe értékét torzítással becsüljük, amelyek mértéke ée bn. Egy becslést akkor moduk érvéyesek a araméter értékére ézve, bn értéke ulla, azaz ics em mitavételi hiba. Ezzel kvatifikáltuk az érvéyesség fogalmát, természetese azo az áro, hogy a gyakorlatba eheze hozzáférhetõ bn értéket felhaszáltuk. A becslés megbízhatósága attól függ, hogy a b értékekek a bn érték körüli fet említett igadozása mekkora. Miél kisebb, aál megbízhatóbb a becslés. Következõ lééskét tekithetjük a b meyiség égyzetéek várható értékét [magáak a b meyiségek ugyais ulla a várható értéke], és erre a következõ kélet adódik: Eb = Eb bn bn, amire általába úgy hivatkozuk, hogy a becslés várható égyzetes hibája = a becslés szóráségyzete a torzítás égyzete. Tehát a várható égyzetes hiba tartalmazza a torzításból azaz az érvéyesség hiáyából és a véletle mitavételbõl következõ igadozásokból a megbízhatóság hiáyából vagy alacsoy fokából származó égyzetes eltéréseket is. SZÓRÁS ÉS HIBAHATÁR VÉLETLEN MINTAVÉTEL ESETÉN A b becslésekek korábba említett két tulajdosága, általáosabba a b meyiségek igadozásáak valameyi tulajdosága, alavetõe aak következméye, hogy véletle mitákat haszáluk. Igazából a véletle mitavételi eljárások haszálatáak léyegébe egyetle oka, hogy a b meyiségek igadozása csak ebbe az esetbe írható le aélkül, hogy valameyi lehetséges mitát ki kellee választauk és meg kellee figyelük az igadozás megértéséhez. Természetese ez csak akkor lehetséges, ha a véletle mitavétel egy jól defiiált eljárás alkalmazását jeleti és em esetlegese, találomra stb. törtéõ kiválasztást. A bevezetõ taköyvekek a véletle mitavétel alkalmazásához fûzött idoka hogy ti. midekiek egyforma esélyt adjuk a mitába kerülésre,

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN elfedi a léyeget. Hozzáteszem: a valóságba agyo sok mitavételi eljárás esetébe általába em is aduk egyforma esélyt midekiek a mitába kerülésre. A véletle mitavétel alkalmazásával tudomásul vesszük azt, hogy téylegese kiválasztott miták esetleg em ad túl jó becslést [azaz b esetleg ics közel bn-hez], de ezért cserébe azt kajuk, hogy egyrészt a becslések redelkezek az - tulajdoságokkal, sõt, várható viselkedésükre ézve agy miták eseté további ismeretekkel is redelkezük. Ezek közül legfotosabb, hogy a b bn meyiség viselkedése amely égyzetéek várható értéke a becslés szóráségyzete leírható. Nagy miták eseté ez a meyiség ige jó közelítéssel ormális eloszlású és várható értéke ulla. A következõkbe ezeket a téyeket haszáljuk a becslések viselkedéséek leírására A b bn meyiség jellemzõ viselkedéséek leírásához felhaszáljuk szórását, amiek értékét a mitavételi eljárástól és a becsüli kívát araméter jellemzõitõl függõe késõbb tárgyaljuk. Az itt következõk azt mutatják be, hogy milye fotos a szórás ebbõl a szemotból. Valóba, agy miták eseté ige jó közelítéssel csak a szórás határozza meg, hogy tiikusa mekkora eltéréseket foguk láti. Ezt mutatja be a következõ táblázat. beltérése bn értékétõl Azokak a mitákak az aráya, amelybe ekkora az eltérés Kisebb, mit ¼ szórás,97 ¼ és ½ szórás között,86 ½ és ¾ szórás között,64 ¾ és szórás között,6 és ¼ szórás között,6 ¼ és ½ szórás között,78 ½ és ¾ szórás között,5 ¾ és szórás között,5 és ¼ szórás között, ¼ és ½ szórás között, ½ és ¾ szórás között,6 ¾ és szórás között, és ¼ szórás között, Több mit ¼ szórás,

RUDAS TAMÁS A táblázat haszálatához felhívjuk a figyelmet arra, hogy a sorok az eltérés agyságát mutatják, de iráyát em. Például bn és b között az eltérés akkor is ¾ és szórás között va, ha b agyobb BN-él,8 szórással, meg akkor is, ha kisebb ála,9 szórással. A ozitív és egatív eltérések egyforma eséllyel fordulhatak elõ, azaz éldául az, hogy b kisebb, mit bn egy ¾ és szórás közötti meyiséggel a miták,75%- ába fordul elõ, és ugyaígy a miták,75%-ába fordul elõ, hogy b agyobb bn-él egy ¾ és szórás közötti meyiséggel, továbbá,75%,75% =,5%, ami a táblázatba egy ekkora agyságú abszolút értékû eltérésre voatkozó érték. Általába hibahatárkét a szórás kétszeresét szokták megadi. Ez a meyiség tehát olya tulajdoságú, hogy agy miták eseté várhatóa a b becslésekek mitegy 95%-a közelebb lesz bn-hez, mit a hibahatár. A hibahatár tehát em a tiikus vagy várható hiba agysága ez ikább a szórás. A becslésekek jeletõs része eél sokkal közelebb va bn- hez, a becslések kis része eél távolabb va bn-tõl. Nem igaz az sem, hogy a hibahatár lee az az érték, amelye belül a hiba lehet, hisze az esetekek mitegy 5%-ába eél agyobb a hiba. Egy felmérés végrehajtása és ebbõl a becslés meghatározása utá sohasem tudjuk, hogy mekkora a hiba. [Ha tudák, meg a becslést is tudák, akkor bn-t is tudák, máredig ezt csak mideki lekérdezése árá tudhaták meg.] Tudjuk az általáos tedeciát, de em tudjuk a téyleges helyzetet. Végké em igaz az sem, hogy két azoos meyiségre voatkozó becslés egymástól egy hibahatáryira térhet el. Még az sem igaz, hogy hibahatáryira térhetek el. Köye elõfordulhat éldául, hogy az egyik hibája ¾ szórás, a másiké ½ szórás. Sõt, még eél léyegese messzebb is lehetek egymástól a becslések. Nem lehet tehát a rossz esetleg csaláso alauló felméréseket aak alajá lelelezi, hogy egymástól a hibahatárál jobba eltérõ eredméyeket adak külööse ha majd a szórás értékét meghatározó sokszor övelõ téyezõket is figyelembe vesszük. Téves tehát mide olya godolatmeet, amely a hibahatárak determiisztikus értelmezést róbál adi ekkora a hiba és eek feltételezésével végez számításokat.

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN SZÓRÁS ÉS MINTAVÉTEL A hibahatárak az elõzõekbe bemutatott haszálatához természetese a hibahatár értékéek ismerete szükséges, ehhez edig a becslés szórását kell ismerük. A becslés szórása általába az eredeti ouláció szórásától függ, és ezt többyire em ismerjük. A függés természete edig a mitavételi eljáráso múlik. Ráadásul em a tervezett, haem a téylegese végrehajtott mitavétele. A közvéleméy-kutatások eredméyeivel közölt hibahatárok szite kivétel élkül az egyszerû véletle mitavétel eseté érvéyes szórás agyságára alaozak, és abba az esetbe érvéyesek, ha az összes megkérdezett közül kívájuk megbecsüli a valamilye tulajdosággal redelkezõk éldául egy bizoyos ártot választók aráyát. Be lehet láti, hogy ebbe az esetbe a szórás legfeljebb. Ebbõl az adódik, hogy éldául egy 5 elemû egyszerû véletle mita eseté a szórás legfeljebb /, azaz, és a hibahatár,. A sokszor alkalmazott elemû miták eseté a szórás legfeljebb,6, azaz a hibahatár,. Megjegyezzük, hogy a feti kéletbõl az következik, hogy a hibahatár értéke a mitaagyság égyzetgyökéek reciroka, /. Ezeket a számokat gyakra látjuk a olitikai közvéleméy-kutatások eredméyeit oly szívese közlõ újságokba. Ha a becsledõ valódi aráy agyo kicsi közel va -hoz vagy agyo agy közel va -hez, a szórás eél kisebb is lehet. A otos kélet a valószíûségre tehát most ez a araméter, amelyet becsüli akaruk voatkozó becslés szórására ahol a valódi aráy valószíûség. Természetese a valóságba téyleges értéke em ismert és a feti kéletbe becsült értékét helyettesítjük. Ha em is bízuk esetleg a becsült értékbe, a = / választás felsõ korlátot ad a szórásra. Amitavétel befolyása a szórásra ézve redkívül összetett még akkor is, ha most csak az elméletileg meghatározott mitavételre godoluk. Aszórás

4 RUDAS TAMÁS kiszámítása a valóságba haszált összetett mitavételi eljárásokra ige ehéz feladat, és sokszor csak utólag azaz az adatok összegyûjtése utá lehetséges. A téyleges szórás az egyszerû véletle mitavételre voatkozó szórásál akár kisebb és akár agyobb is lehet. Ebbõl a szemotból haszos fogalom az effektív mitaagyság. Ez azt a mitaagyságot jeleti, amely mellett egy egyszerû véletle mitából származó becslés szórása ée akkora lee, mit a téyleges becslés szórása. Természetese az effektív mitaagyság meghatározása semmivel sem köyebb, mit a téyleges szórásé, de az eredméy megfogalmazására alkalmas. Általáosa azt modhatjuk, hogy azoos, elõre rögzített agyságú mitákat feltételezve, a becslés szórása csak akkor lehet kisebb, mit egyszerû véletle mitavétel eseté, ha a mitavételi eljárásba valamilye külsõ iformációt haszáluk fel. Például, ha N = 4 és a ouláció megoszlása a következõ: Személy a oulációba Nem Pártreferecia V férfi A X férfi A Y õ B Z õ B akkor az = elemû egyszerû véletle miták az A ártra voatkozó ártrefereciák becslésével a következõek: Egyszerû véletle miták Becslés az A árt észerûségére V, X % V, Y 5% V, Z 5% X, Y 5% X, Z 5% Y, Z % Megjegyezzük, hogy az egyszerû véletle mitavételél elméletileg lehetséges, ugyaazt a személyt kétszer tartalmazó mitáktól eltekitettük.

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 5 Ebbe az esetbe tehát égy otos becslés mellett kettõ va, amelyek hibája egyekét 5% azaz ½. Ha valahoa tudjuk, hogy a ouláció fele õ és fele férfi, és ezt rétegzéshez felhaszáljuk, akkor csak a következõ miták lehetségesek: Nemek szerit rétegzett miták Becslés az A árt észerûségére V, Y 5% V, Z 5% X, Y 5% X, Z 5% Ebbe az esetbe mide becslés otos és a rétegzés javított az eljáráso, csökket a szórás ulla lett. Ha azoba a ouláció megoszlása a következõ: Személy a oulációba Nem Pártreferecia V férfi A X férfi B Y õ A Z õ B akkor az egyszerû véletle miták az alábbiak: Egyszerû véletle miták Becslés az A árt észerûségére V, X 5% V, Y % V, Z 5% X, Y 5% X, Z % Y, Z 5% Tehát az egyszerû véletle mitavételi eljárás ée olya teljesítméyt yújt, mit az elõzõ ouláció esetébe: égy otos becslés és két becslés ½ hibával. Ha most erre a oulációra alkalmazzuk a emek szeriti rétegzést, akkor a következõ mitákat kajuk:

6 RUDAS TAMÁS Nemek szerit rétegzett miták Becslés az A árt észerûségére V, Y % V, Z 5% X, Y 5% X, Z % Itt a égy mita közül csak kettõ ad jó becslést, kettõ hibája edig ½, azaz ebbe az esetbe a rétegzés rotott a szóráso. Valóba, az egyszerû véletle mitavételbõl származó szóráségyzet értéke 4**//6 = /6, míg a rétegzett mitavétel eseté a szóráségyzet **//4 = /4. Aak okát, hogy a második ouláció esetébe a emek szeriti rétegzés agyobb szórású becslést eredméyezett, mit az egyszerû véletle mitavétel, úgy fogalmazhatjuk meg, hogy eél a oulációal a emek szerit homogé csoortok a férfiak illetve a õk agyobb mértékbe ihomogéek a vizsgált változó ártreferecia szemotjából, mit az egész ouláció. A rétegzés csak akkor csökketi a becslés szórását, ha a rétegekbe a vizsgált változó homogéebb kisebb szórású, mit az egész oulációba. Tehát a mitavételbe haszált külsõ iformáció éldákba a ouláció emek szeriti megoszlása csak akkor javítja a mitavételt, ha az valóba relevás a becsült meyiség szemotjából éldákba akkor, ha a emek szeriti csoortok homogéebbek, mit az egész ouláció. HIBAHATÁR ÉS BECSLÉS Eek a fejezetek a fõ célja aak bemutatása, hogy a becsült meyiség hogya befolyásolja a szórás és eze keresztül a hibahatár értékét. Elõször azt fotoljuk meg, hogy ha egy olya aráy helyett, amelyek evezõjébe az összes megkérdezett, azaz egy elõre rögzített, em becsült meyiség áll, egy olya aráy becslésére térük át, amelyek evezõje is becsült, az vajo befolyásolja-e a szórás értékét. Például a magukat biztos ártválasztókak vallók között akarjuk becsüli az egy bizoyos ártot választók aráyát. Mibõl származik a rögzített evezõjû becslés szórása? Abból, hogy a mitába a magukat egy bizoyos ártot választóak vallók száma igadozik. Az elemû mitába b N ilye személyt várák [b az rögzített e-

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 7 vezõjû becslés, b N az aráy, amelyet mideki megfigyelésével taasztalák] és ebbõl a becsült aráy b N, azaz a helyes érték lee. Ha a mitába b Na ilye személyt figyelék meg, akkor a becslés b N a / lee, ahol a természetese lehet ozitív és egatív szám is. Aváltozó evezõjû becslés, b, tulajdokée két becslés háyadosa: b, ami a magukat a vizsgált árttal szimatizálók aráyára voatkozó becslés, és b, ami a biztos ártválasztók aráyára voatkozó becslés. Ebbe az esetbe b viselkedése ée ugyaaz, mit az elõbbi esetbe, hisze b em tud arról, hogy egy kostassal a mitaagyság vagy edig egy véletletõl függõ meyiséggel a mitába magukat biztos ártválasztókak modók létszáma osztjuk el. A b becslés hasolóa viselkedik a b becsléshez, ayiba, hogy b értéke általába egy bizoyos meyiséggel eltér b N-tõl, modjuk a -mal amely szité lehet ozitív és egatív szám is. A továbbiakba azt vizsgáljuk, hogya viselkedik b N a //b N a / = b Na /b Na. Elõször is szögezzük le, hogy ez a háyados agyobb, mit b N a /, ugyais b a kisebb, mit. Miket azoba em a agyság, haem az igadozás mértéke érdekel. Eek hatását bemutatadó, ézzük egy elemû oulációt N =, amelybe 6 biztos ártválasztó va [b N = 6/], és 4-e referálják az A ártot [b N = 4/ és b N = 4/6]. Potosabba fogalmazva, ezek azok az értékek, amelyeket az egész ouláció megkérdezésével kaák. Feltesszük azt, hogy az alkalmazott mitavételi eljárás összese három külöbözõ érték megfigyelését teszi lehetõvé az A ártot referálókra és a biztos ártválasztókra ézve is, ezekél az a hiba értékei,, és az a hiba értékei is,,, végül azt, hogy ezek a hibák egymástól függetleül fordulak elõ. Midezek a feltevések em reálisak, és csak azt szolgálják, hogy egy köye áttekithetõ éldához jussuk. A következõ táblázat a b Na megfigyeléseket és az azokból kaott becsléseket mutatja: Megfigyelt gyakoriságok, 4, 6, Becslés,,, Ie a becslések átlaga a helyes, érték, azaz b N és a becslések szórása,8.

8 RUDAS TAMÁS Ha a b becslést ézzük, akkor a következõ lehetséges megfigyelések vaak: A biztos ártválasztók száma Az A ártot választók száma 4 6 4,4,86,49 6,5,5,75 8,,, Ebbõl a becslések átlaga,5 [émileg eltér a helyes értéktõl, hisze b N =,5, ami feltevéseik egymással em teljese összeegyeztethetõ voltát mutatja], a becslés szórása edig,7. Ebbe a éldába azt látjuk, hogy ha em az összes megkérdezetthez, haem a magukat biztos választóak modó személyek számához viszoyítjuk az A ártot referálók aráyát, akkor becslésük szórása mitegy %-kal megõ. Természetese a hibahatár is hasolóa változik. A élda illusztrálja a változás téyét, de em segít aak megítélésébe, hogy reálisabb feltevések mellett hogya változa a szórás, illetve aak megértésébe, hogy az adott robléma milye jellemzõi befolyásolják a szórás alakulását. Eze a oto az ituitív tárgyalás lehetõsége megszûik, és ezeket a kérdéseket matematikai módszerekkel fogjuk megvizsgáli. Mielõtt azoba rátérék a matematikai elemzésre, még két becslést említük meg, amelyek szité gyakra elõfordulak a olitikai közvéleméy-kutatások eredméyeiek közlései között, és amelyekre a szokásos hibahatár szité em alkalmazható. Ezek a becslések a két árt észerûsége közötti eltérésre voatkozak, az összes megkérdezette, illetve a biztos ártválasztóko belül. Legye tehát b 4 N a magukat az A ártot illetve a B ártot referálóak vallók létszáma közötti külöbség a teljes ouláció lekérdezésekor, osztva a ouláció létszámával és b 5 N ugyaez a külöbség a biztos ártválasztók számával osztva, illetve b 4 és b 5 ugyaezek a becslések egy elemû mita alajá. Azt modhatjuk, hogy b 4 két véletle meyiség külöbsége, b 5 edig két véletle meyiség külöbsége osztva egy véletle meyiséggel.

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 9 HIBAHATÁR ÉS BECSLÉS MATEMATIKAI TÁRGYALÁS Tegyük fel, hogy a éességbe az A ártot választók aráya, a bármilye más ártot választók aráya és végül = a ártrefereciával em redelkezõk aráya. Egy elemû mita eseté a gyakoriságok legyeek X = X, X, X. Ekkor az X vektor oliomiális eloszlású és =,, araméterekkel, kovariaciamátrixa edig a következõ alakú A b becslés ebbe a jelölésbe A becslés, amelyek szórását keressük tehát a oliomiális eloszlású gyakoriságokak egy függvéye. Tekitettel arra, hogy a gyakoriságok aszimtotikus eloszlása ormális, a b függvéy edig folytoosa deriválható, az úgyevezett delta módszer alkalmazható b aszimtotikus szórásáak meghatározására. Eszerit b aszimtotikus variaciája az alakba írható, ahol A a C =. f X = X A C A f X arciális derivált vektor az X = helye kiértékelve. A arciális derivált vektorra azt kajuk, hogy X X X X X X X X.

és ebbe az X = értékeket behelyettesítve: Ezt felhaszálva az aszimtotikus variacia: A b becslés aszimtotikus azaz agy mitákra közelítõleg érvéyes szórása eek a égyzetgyöke, a hibahatár ez utóbbi meyiségek a kétszerese. Jól látszik, hogy a szórás alakú, azaz a mitaagyságtól a szokásos módo függ. Emlékeztetük arra, hogy a gyakorlatba redszerit közölt aiv érték s =,5. Az alábbi táblázatba bemutatjuk, hogy s értéke hogya változik és függvéyébe. A hibahatárt tehát úgy kajuk, hogy a táblázatba lévõ értékeket meg s b SD =. = = RUDAS TAMÁS

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN szorozzuk -vel és elosztjuk a mitaagyság égyzetgyökével. Természetese a valóságba és értéke em ismert és a mitából számított becsléseiket haszáljuk. s értéke és függvéyekét =, =, =, =,4 =,5 =,6 =,7 =,8 =,9 =,,8,86,685,566,48,48,7,, =,,86,79,69,69,54,484,48,4 =,,685,69,645,59,54,497,458 =,4,566,69,59,559,54,49 =,5,48,54,54,54,5 =,6,48,484,497,49 =,7,7,48,458 =,8,,4 =,9, Az általába ublikált ½ értékhez kéest tehát s több mit kétszeres is lehet. Ha egy 6 elemû mita esetébe a miket érdeklõ ártot a megkérdezettek %-a választja =, és összese a megkérdezettekek 5%-a választ ártot =,4, akkor a becslés szórása,566/4. Itt tehát az ½ haszálata a fix evezõ eseté otos, bár a jele esetre em érvéyes érték helyett agyrészt komezálja az eltérést. Ha azoba a otos de erre az esetre em érvéyes kéletet haszálák, a szórásra,/4 adóda és a helyes érték eek mitegy kétszerese. Olya becsült valószíûségek esetébe, amelyek a táblázatba em szereelek, iterolációt illetve extraolációt alkalmazhatuk a megfelelõ értékek közelítésére. A b 4 becslés hibahatáráak megállaításához legye X az A ártot választók száma, X a B ártot választók száma az elemû mitába és legye X = X X, a megfelelõ oulációbeli valószíûségek edig, és. Ekkor az X vektor eloszlása ismét oliomiális és araméterekkel. A kovariaciamátrix ée olya alakú mit elõbb de most ersze a kategóriák jeletése más. A b 4 becslés ezzel a jelöléssel X X f X =.

A arciális deriváltakat tartalmazó vektor. és ez a vektor változatla marad, ha az X = helye értékeljük ki. Az aszimtotikus kovariaciára tehát a következõ kélet adódik: Ezért b 4 szórása: ahol s 4 értékeit a következõ táblázat tartalmazza., SD 4 4 s b =. ] [ = RUDAS TAMÁS

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN s 4 értéke és függvéyekét =, =, =, =,4 =,5 =,6 =,7 =,8 =,9 =,,44,5,548,574,58,574,548,5,44 =,,5,566,68,6,64,6,68,566 =,,548,68,648,67,678,67,648 =,4,574,6,67,69,7,69 =,5,58,64,678,7,77 =,6,574,6,67,69 =,7,548,68,648 =,8,5,566 =,9,44 Azt látjuk, hogy a két árt közötti külöbség szóráségyzete a külö észerûségi becslések szóráségyzeteiek összege. A külöbség szórása tehát agyságredileg -ször azaz 4%-kal agyobb a aiv szórás értékél. Eél a táblázatál is alkalmazható szükség eseté iteroláció illetve extraoláció. Végül b 5 szórásáak és hibahatáráak meghatározásához legye X az A ártot választók száma egy elemû mitába, X a B ártot választók száma, X a más ártot választók száma és X 4 = X X X a ártot em választók száma. A oulációba a megfelelõ kategóriák valószíûségeit jelölje redre,,, 4. A b 5 becslés úgy írható, hogy f X = X X X X X. A arciális deriváltakból álló vektor: X X X X X X X X X X X X X X X X X X X X X

Ez a vektor az X = helye kiértékelve: A kovariaciát adó szorzat ebbe az esetbe: = 4 = 4 4 4 4 4 4 4 4 RUDAS TAMÁS 4

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 5 4 4 4 A b 5 becslés szórása tehát a s5 SD b 5 =, ahol s 5 értékeit a következõ táblázat tartalmazza. s 5 értéke és függvéyekét, ha =, =, =, =, =,4 =,5 =,6 =,7 =,8 P =,,48,5,99,787,6,58,4,6 P =,,5,6,65,98,77,658,566 P =,,99,65,898,796,7 P =,4,787,98,898,84,77 P =,5,6,77,796,77 P =,6,58,658,7 P =,7,4,566 P =,8,6 s 5 értéke és függvéyekét, ha =, =, =, =, =,4 =,5 =,6 =,7 P =,,78,76,648,558,479,4,56 P =,,76,74,69,65,558,496 P =,,648,69,674,6,58 P =,4,558,65,6,68 P =,5,479,558,58 P =,6,4,496 P =,7,56

6 RUDAS TAMÁS s 5 értéke és függvéyekét, ha =, =, =, =, =,4 =,5 =,6 P =,,5,59,475,4,84,4 P =,,59,56,498,466,4 P =,,475,498,494,474 P =,4,4,466,474 P =,5,84,4 P =,6,4 s 5 értéke és függvéyekét, ha =,4 =, =, =, =,4 =,5 P =,,7,8,7,48, P =,,8,9,84,68 P =,,7,84,84 P =,4,48,68 P =,5, s 5 értéke és függvéyekét, ha =,5 =, =, =, =,4 P =,,8,,,9 P =,,,, P =,,, P =,4,9 s 5 értéke és függvéyekét, ha =,6 =, =, =, P =,,5,47,5 P =,,47,56 P =,,5

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 7 s 5 értéke és függvéyekét, ha =,7 =, =, P =,,8,6 P =,,6 A fejezet eddigi részeibe bemutatott elemzések azo a feltételezése alaulak, hogy a mitavételi eljárás egyszerû véletle mitavétel. Amit arra már korábba is utaltuk, más mitavételi eljárások eseté a szórások máskét alakulak, de azt ehéz megmodai, hogy az itt bemutatott értékekél kisebbek vagy agyobbak. A feti eredméyekek de természetese a aiv hibaformuláak is tovább ehezíti alkalmazását, hogy a téylegese lekérdezett mita az esetek agy részébe eltér a tervezett mitától. Ezek az eltérések az adathiáy illetve a mita em teljese véletle jellege öbeválogatás a mitába fogalmaival írhatók le. Bár számos érdekes és oteciálisa haszos eljárás létezik ezekek a roblémákak a kezelésére, ezek jeleleg az esetek többségébe em alkalmasak a szórás megállaítására. A legtöbb gyakorlati helyzetbe a szórás és a hibahatár megállaítása em statisztikai értelembe vett becslést kívá. Ráadásul amikor a hibák agyságáról beszélük, a mitavételi hibá kívül a em mitavételi hibát azaz a torzítást, az érvéyesség hiáyát is be kell kalkuláluk. Ez utóbbi szemot mutatja, hogy még ha ismerjük is otosa a mitavételi eljárás szórását, torzítását szite sohasem ismerjük és ezért midekée becslés 5 értéke és függvéyekét, ha =,8 =, P =,,5 A táblázatokba bõve találuk ½-él agyobb értéket, egésze eek háromszorosáig. Ige kis észerûségû ártok eseté s 5 értéke még eél is agyobb lehet. Tehát a téyleges szórás és a valódi hibahatár a aiv értékél léyegese agyobb lehet, ha két árt észerûségét hasolítjuk össze a biztos ártválasztók között. A VÁRHATÓ HIBA NAGYSÁGÁT BEFOLYÁSOLÓ EGYÉB TÉNYEZÕK

8 RUDAS TAMÁS sekre szorítkozuk. Amitavételi hiba ezért a gyakorlatba a téyleges hibáak csak alsó korlátjáak tekithetõ. Midezekbõl a megfotolásokból az következik, hogy feltehetõleg em túlzuk, ha éldául két árt észerûségéek összehasolítása eseté a biztos ártválasztók között a hibahatárt a aiv érték mitegy égyszereséek tekitjük. Természetese ez em a hiba aktuális és em is várható agysága, haem egy korlát, amelyet az esetek agyjából 95%-ába a téyleges hiba em halad meg és az esetek többségébe a téyleges hiba kisebb eél. Eek féyébe az elmúlt évek hazai választási elõrejelzései meglehetõse sikeresek tûek. ÖSSZEGZÉS A hibahatár mide olya haszálata, amely ezt a meyiséget a téyleges hiba agyságakét kezeli téves és teljese alatala kalkulusra vezet. Ugyaez igaz arról a feltételezésrõl is, amely a hibahatárt a hiba lehetséges maximumakét értelmezi. A hibahatárak kizárólag sztochasztikus értelmezése lehetséges. A hibahatár téyleges agyságát számos olya téyezõ befolyásolja, amelyek kvatifikálása léyegébe em lehetséges. Ezek közül legfotosabbak a téyleges általába az egyszerû véletle mitavételtõl eltérõ mitavételi eljárásba felhaszált iformációk helyes vagy helytele voltáak illetve a mita gazdaságos lekérdezhetõségét elõsegítõ eljárásokak, továbbá a tervezett és téylegese lekérdezett mita eltéréséek hatásai. Az egyszerû véletle mitavétel eseté érvéyes hibahatárokak csak orietáló jellegük va. Bemutattuk, hogy a hibahatárok ezért jeletõse függek a becsült meyiségtõl. Ha ezeket az értékeket a leggyakrabba ublikált / értékekhez viszoyítjuk, akkor a vizsgált mutatók egy árt észerûsége a ártválasztók között, két árt észerûségéek külöbsége az összes megkérdezett illetve a ártválasztók esetébe a téyleges hibahatár eél akár háromszor is agyobb lehet.

A HIBAHATÁR A BECSÜLT MENNYISÉG FÜGGVÉNYÉBEN 9 Irodalmi megjegyzések A fejezet matematikai részébe haszált delta módszer általáosa ismert eljárás, leírásai közül Bisho, Fieberg, Hollad 975 köyvét javasolám. Az itt is tárgyalt kézett mutatók hibahatáráak kérdésével a közvéleméy-kutatásról szóló köyvem midkét kiadásába Rudas, 998, 6 foglalkoztam és ott az itt közölt táblázatokak a gyakorlatba bizoyos esetekbe jobba haszálható változatait közöltem. Bisho, Y. M. M., Fieberg, S. E., Hollad, P. W. 975 Discrete Multivariate Aalysis. Theory ad Practice. MIT Press. Rudas T. 998 Hogya olvassuk közvéleméy-kutatásokat? Új Madátum, Budaest. Rudas T. 6 Közvéleméy-kutatás. Értelmezés és kritika. Corvia, Budaest.