A könyv első kiadása Hogyan olvassunk közvélemény-kutatásokat? címen jelent meg (Budapest, Új Mandátum Kiadó, 1998). Második, bővített kiadás Rudas Tamás, 2006 Sorozatterv: Kiss István Jelen kiadvány a jogtulajdonos írásos engedélye nélkül sem részben, sem egészben nem másolható, sem elektronikus, sem mechanikus eljárással, ideértve a fénymásolást, számítógépes rögzítést vagy adatbankban való felhasználást is. Kiadja a Corvina Kiadó kft., az 1795-ben alapított Magyar Könyvkiadók és Könyvterjesztők Egyesülésének tagja 1072 Budapest, Rákóczi út 16. e-mail:corvina@t-online.hu www.corvinakiado.hu Felelős kiadó: Kúnos László, a Corvina igazgatója Felelős szerkesztő: Blaschtik Éva Műszaki vezető: Illyés Éva ISBN 963 13 55012 ISSN 1787-4629
Tartalom Az első kiadás előszavából... 7 A második kiadás előszava... 10 1. Megismerhető-e a közvélemény?... 11 (Megbízhatóság és érvényesség) 2. Kit képviselnek a megkérdezettek?... 19 (Reprezentativitás) 3. Hány embert kell megkérdezni? (Mintanagyság).. 30 4. Hogyan választják ki a megkérdezetteket?... 43 (Mintavétel) 5. Hogyan befolyásolja a kérdezés módja... 57 az eredményeket? (Adatgyűjtés) 6. Mi történik azokkal, akik nem válaszolnak?... 71 (Válasz- és véleményhiány) 7. Egyformán fontos minden válasz? (Súlyozás)... 81 8. Hogyan értelmezzük az eredményeket?... 97 9. Minden adatra érvényes a vizsgálat hibahatára?.... 110 10.... 5
Összehasonlíthatók-e a különböző... 119 közvélemény-kutatások eredményei? 11.... Miért jóka közvélemény-kutatások?... 131 7
Az első kiadás előszavából 1936-ban az Amerikai Egyesült Államok elnöke, Franklin Delano Roosevelt másodszori megválasztásáért küzdött. Ellenfele a republikánus párti Alfréd Landon volt. A szavazópolgároknak nemcsak két elnökjelölt vagy két párt, hanem két gazdaságpolitika között is választaniuk kellett. FDR a gazdaság óvatos élénkítésével akarta az országot kivezetni a válságból, Landon további takarékoskodást javasolt. A választás eredményének előrejelzésére a Literary Digest című magazin a történelem minden bizonnyal legnagyobb közvélemény-kutatását hajtotta végre. Tízmillió címre küldtek ki a választási szándékra vonatkozó kérdőívet. Kétmillió négyszázezer választ kaptak, és ezek alapján teljes bizonyossággal állították, hogy a választás nyertese Alfréd Landon lesz. Előrejelzésük téves volt, és ez az olvasók bizalmának és érdeklődésének olyan mértékű csökkenéséhez vezetett, hogy a lap hamarosan csődbe ment. Az 1936-os elnökválasztás nemcsak az USA, hanem a közvélemény-kutatások történetének is jelentős állomása. A kutatók megértették, hogy önmagában a nagy mintaelemszám nem garantálja az előrejelzés pontosságát. Amekkora kudarc volt a Literary Digest számára az 1936-os amerikai elnökválasztás eredményeinek előrejelzése, ugyanakkora volt a siker George Gallup számára. Előrejelzésének sikere alapján úgy tűnt, ő tudta, mire van szükség ahhoz, hogy viszonylag kisebb mintákra alapozva is sikeres előrejelzést lehessen adni. A megkérdezetteket úgy választotta ki, hogy a teljes minta összetétele néhány lényeges szempontból - mint a nem, az iskolai végzettség, a jövedelem - hasonló legyen a választópolgárok összességéhez. Ezzel a módszerrel nemcsak az 1936-os elnökválasztás eredményét tudta helyesen megjósolni, de 1948-ig mindig sikeres 7
8 előrejelzést adott. 1948-ban azonban az ő előrejelzése is tévesnek bizonyult, éppúgy, mint versenytársaié, akik akkor már mind hasonló elvek alapján választották mintáikat. A negyvenes évek második fele óta az elemzők többsége egyetért abban, hogy nem elegendő, ha a mintát úgy választjuk, hogy bizonyos, könnyen ellenőrizhető szempontokból hasonlítson az összes szavazópolgárból álló népességre. A jó előrejelzéshez az is szükséges, hogy az igazán lényeges szempontból, ti. a szavazási szándék szerint is hasonlítson a minta a szavazópolgárok összességére. Az utóbbi hasonlóság pedig nem feltétel nélküli következménye az előbbinek. Az első feltétel úgy is teljesülhet, hogy a mintába kerültek szavazási szándékai erősen különböznek a teljes népességétől. Csak akkor remélhetjük, hogy a minta a szavazási szándék szerint is jól reprezentálja a népességet, ha kiválasztásában nem kedvezünk egyik társadalmi csoportnak sem, legyen ez akár felismerhető (például iskolai végzettség), akár pedig felismerhe- tetlen jegyek által meghatározott (például a különböző jelöltekre szavazók). Ezt csak úgy valósíthatjuk meg, ha mindenkinek egyforma esélyt biztosítunk arra, hogy a mintába kerüljön, azaz a mintát véletlenszerűen választjuk. Ezzel a felismeréssel megszületett a mintavétel, és vele a közvélemény-kutatások modern elmélete. Az utóbbi évtizedekben a közvélemény-kutatások, és különösen a politikai közvélemény-kutatások, minden demokratikus ország közéletében fontos szerepet játszanak, és ezért célszerű ezen kutatások alapvető módszereinek megismerése. Ezzel a könyvvel a közvélemény-kutatások iránt érdeklődő olvasóknak szeretnék segítséget nyújtani úgy, hogy bemutatom a közvélemény-kutatásokkal kapcsolatos legfontosabb fogalmak jelentését és a közvélemény-kutatások azon jellemzőit, amelyek az eredmények megbízhatóságára és érvényességére a legnagyobb hatással vannak. Részletesen lesz szó a közvélemény-kutatások eredményeinek értelmezéséről és a különböző közvélemény-kutatások eredményeinek
összehasonlításáról. Nem azt tárgyaljuk, hogy hogyan tervezzünk és hajtsunk végre közvélemény-kutatásokat, hanem olyan ismereteket mutatunk be, amelyek egy közvélemény-kutatás minőségének megítélésében és eredményeinek értelmezésében a leglényegesebbek. Ezek az ismeretek hasznosak lehetnek ázoknak, akik politikusként, döntéshozóként vagy újságíróként közvéleménykutatásokat rendelpek meg, és azoknak is, akik a közvélemény-kutatások eredményeit akár hivatásszerűen, akár csak érdeklődő újságolvasóként szeretnék pontosan megérteni. A szerző 5
A második kiadás előszava A könyv első kiadása a megjelenése óta eltelt nyolc évben elfogyott, köszönhetően talán annak is, hogy az ország számos egyetemén tankönyvként használják. A közvéleménykutatások fontossága és az irántuk megnyilvánuló érdeklődés azonban nem csökkent az elmúlt időben. Az új kiadás a szöveg átfésülésén és néhány szóhasználati változtatáson túlmenően számos helyen részletesebb magyarázatokkal szolgál, mint az első. A bővítések nem érintik az eredeti könyv célját és szemléletét: ebből a könyvből nem lehet megtanulni közvélemény-kutatások készítését, de - szándékaim szerint - meg lehet tudni, hogy a közvéleménykutatások eredményeit hogyan lehet értő és kritikus módon értelmezni. A szerző 10
1. Megismerhető-e a közvélemény? (Megbízhatóság és érvényesség) Hihetünk-e a közvélemény-kutatások eredményeinek? Pontos képet kaphatunk-e egy egész ország vagy akár csak egy városrész lakosságának véleményéről pusztán néhány száz vagy néhány ezer embernek feltett kérdésekre kapott válaszok alapján? Valójában olyan sikeresek és pontosak-e a közvélemény-kutatások, mint ahogyan azt készítőik gyakran állítják? Vagy talán a közvélemény-kutatások készítőik szándékait, az általuk várt eredményeket tükrözik? Ezekre a kérdésekre nehéz lenne általánosan érvényes válaszokat adni. A közvélemény-kutatások nagy részét olyan problémákkal kapcsolatban végzik, amelyekről a lakosság pontos" véleménye sohasem lesz ismert. Ezeknek a közvélemény-kutatásoknak az eredményeit nincs mivel összehasonlítani, ezért nem lehet teljes bizonyossággal megállapítani, hogy milyen mértékben tükrözték a valóságot. A közvélemény-kutatások egy része azonban olyan kérdéseket vizsgál, amelyekkel kapcsolatban a teljes lakosság pontos álláspontja később ismertté válik, és ezekben az esetekben az előrejelzések összehasonlíthatóak a tényleges eredményekkel. A legfontosabb ilyen jellegű közvéleménykutatások választási eredmények előrejelzését szolgálják. Ezek eredményei összehasonlíthatóak a tényleges választási eredményekkel, és így pontosságuk megállapítható. Természetesen ez az összehasonlítás csak akkor helyénvaló, ha a közvélemény-kutatás ideje és a tényleges választás között az emberek nem változtatják meg szavazási szándékukat. Mivel ez teljes mértékben sohasem teljesül, a ténylegesen elvégezhető összehasonlítások a közvéleménykutatásokat a valóságnál némileg kedvezőtlenebb színben tüntetik fel. Ezt figyelembe véve még meglepőbb lehet az a tény, hogy sok ország számos választása esetében az előre jelzett eredmények csak igen kis mértékben tértek el a valódi 11
12 eredményektől. Mivel a közvélemény-kutatások eredményeinek pontosságát (legalábbis közvetlenül elkészültük után) nem lehet megítélni, az egyetlen alkalmazható minőségi kritérium a kutatásban alkalmazott módszerekre vonatkozhat. Nem tudjuk, hogy milyen pontosak az eredmények, de tudjuk, hogy a megfelelően megválasztott módszerek jó eséllyel meglepően pontos eredményekre vezetnek, azaz több közvélemény-kutatás közül a nagy hibát eredményezők hányada kicsi. Azokat a módszereket, amelyeket a közvélemény-kutatás tervezése és végrehajtása során alkalmaztak, meg lehet ítélni, és megfelelő ismeretek birtokában jó képet alkothatunk az eredmények várható pontosságáról. A közvélemény-kutatások eredményeinek hibáját (azaz eltérésüket a valóságtól) kétféle oknak lehet betudni. A hibák egyik lehetséges fajtája azzal van kapcsolatban, hogy a közvélemény-kutatás nem a teljes népességnek, hanem csak egy részének, nevezetesen a mintába került embereknek a megkérdezésén alapul. Az ebből származó hibákat mintavételi hibának nevezik. A mintavételi hiba nagyságát úgy határozhatjuk meg, mint a közvélemény-kutatás eredményének az eltérését attól az eredménytől, amelyet akkor kapnánk, ha a vizsgált népességből mindenkit kikérdeznénk, méghozzá ugyanazokat az eszközöket (kérdőíveket, telefonos vagy személyes megkérdezést, kérdezőbiztosokat) használva, mint az adott közvélemény-kutatásban. Ennek a hibának a nagysága tehát kizárólag azon múlik, hogy a mintába került és ténylegesen megkérdezett emberek véleménye (amennyire az adott eszközökkel megtudható) mennyire tér el a teljes népesség véleményétől. Hangsúlyozzuk, hogy a mintavételi hiba nagysága nem kizárólag a jó mintaválasztáson (ez elméleti kérdés) múlik, hanem azon is, hogy a mintába választott személyeket milyen mértékben sikerül ténylegesen megkérdezni (ami gyakorlati kérdés). A hibák másik csoportja azáltal jön létre, hogy az emberek
véleményét mindig csak korlátozott mértékben lehet megismerni egy kikérdezés során. Hiába kérjük a megkérdezettet: képzelje el, hogy most tartják a választásokat, és ezt feltételezve mondja meg, hogy kire szavazna; a megkérdezett jól tudja, hogy a választásokat nem most tartják, ő most valójában nem szavaz, hanem egy ettől jelentősen eltérő helyzetben van (nevezetesen a véleményét kérdezik, és ez a vélemény - összesített formában - hamarosan megjelenik az újságban vagy egy döntéshozó asztalán), és emiatt nem feltétlenül pont azt a pártot nevezi meg, amelyikre tervei szerint szavazni fog. Például - különösen a valódi választásoktól időben távol - üzenetet küld az aktuális kormánynak arról, hogy elégedett-e. Az azonban, ha a megkérdezett nem elégedett, még nem jelenti azt, hogy feltétlenül egy másik pártot választ majd, ha szavazásra kerül a sor. Azokat a hibákat, amelyek abból származnak, hogy a felhasznált módszerekkel a vizsgálat tárgyát nem lehet teljesen felderíteni (ami lehet a módszerek hibáinak vagy más körülményeknek a következménye), még akkor sem, ha az egész népességet kikérdezik, nem mintavételi hibának nevezik. A közvélemény-kutatás eredményeinek teljes hibája a mintavételi és nem mintavételi hibáknak az eredője, de ez nem feltétlenül jelent egyszerű összeadást. Néha a mintavételi és nem mintavételi hibák kioltják vagy csökkentik egymást, hiszen mindkét hiba lehet pozitív és negatív is abban az értelemben, hogy eredményünk a valódi értéknél lehet nagyobb (pozitív hiba) és lehet kisebb (negatív hiba) is. Mindenesetre a teljes hiba nem lehet nagyobb, mint a mintavételi és nem mintavételi hiba (abszolút értékének) összege. Ezért egy jó kutatásban mindkét hibafajtát csökkenteni kell. Ezeknek a hibáknak a nagysága - és ez különösen igaz a nem mintavételi hibára - többnyire nem kvantifikálható, ezért egy konkrét kutatás esetén a hiba 13
14 nagysága nem állapítható meg. A kutatás végrehajtására olyan eljárásokat kell választani, amelyek ezeknek a hibáknak a nagyságát várhatóan csökkentik, és ez a legjobb biztosíték arra, hogy az eredmények várhatóan nem lesznek túl rosszak. A mintavételi és nem mintavételi hibák a közvéleménykutatás megbízhatóságával és érvényességével vannak kapcsolatban. Egy közvélemény-kutatás annál megbízhatóbb, minél kevésbé esetleges az eredménye. Ez azt jelenti, hogy ha a vizsgálatot azonos módszereket alkalmazva megismételnék (a mintavételtől kezdve), akkor mennyire kapnának más eredményeket. Minél eltérőbbek lennének az ismétlés eredményei az eredetiektől, annál esetlegesebbeknek tekinthetőek az eredmények, annál kevésbé megbízhatóak. Némileg paradoxnak tűnhet az, hogy véletlen mintavételt alkalmazva azt kívánjuk, hogy az eredmények ne legyenek esetlegesek. Mi mást adhatna a véletlen mintavétel, mint a véletlentől függő, azaz esetleges eredményeket? Mint később látni fogjuk, a véletlen mintavétel - néhány egyszerű szabály betartása és kellően nagy minta- nagyság esetén - éppenséggel nem ad jellemzően a véletlentől nagy mértékben függő eredményeket. Az eredmények csak kis mértékben fognak a véletlen hatásán múlni, és még ez a függés is jól kvantifikálható. Más (nem véletlen) mintaválasztási eljárások esetén ennek a függésnek a mértéke nem ismert. A véletlen mintavétel ismert megbízhatóságú eredményekre vezet. Természetesen, amikor egy eljárás megbízhatóságáról beszélünk, a (feltételezett) megismétlésnél feltesszük, hogy a valódi helyzet, amelyet a közvélemény-kutatással szeretnénk megismerni, nem változott. Ezt a valóságban ritkán hihetjük. Például két egymást követő közvélemény-kutatás eredményeinek eltérése egyaránt lehet a megbízhatóság alacsony mértékének és az időközben megváltozott véleményeknek a következménye. Következésképpen megismételt közvélemény-kutatások eredményeinek összehasonlításából nem lehet a kutatások megbízhatóságára következtetni. A közvélemény-kutatás eredményeinek érvényessége azt
jelenti, hogy a kapott válaszok tényleg arra vonatkoznak, amiről a közvélemény-kutatás szól. Ha a közvéleménykutatás célja a szavazópolgárok választási szándékainak előrejelzése, akkor ha a megkérdezettek ahelyett, hogy az általuk majdan választandó pártot megneveznék, válaszaikban a hatalmon lévő pártnak vagy az egyébként általuk megválasztani szándékolt pártnak a párt pillanatnyi politikáját megerősítő vagy ellenző üzeneteket küldenek, akkor a vizsgálat érvényessége kicsi, mert az eredmények nem arra vonatkoznak, mint amit a készítők várnak. Az emberek jelentős része szavazhat egy pártra anélkül, hogy annak politikájával teljesen egyetértene (ha más pártokéval még kevésbé ért egyet), de egy megkérdezés alkalmával adott válasza kifejezheti azt is, hogy egy éppen aktuális kérdéssel kapcsolatban egy másik párt álláspontját helyesli. Az érvényességet azonban nemcsak a közvélemény-kutatás készítői által nehezen befolyásolható szempontok csökkenthetik, hanem a feltett kérdések pontatlansága, nehéz értelmezhetősége vagy az esetlegesen sugallt válaszok is. Hasonlóan csökkenti a vizsgálat érvényességét, ha a kérdőív nem nehezíti meg azt, hogy a megkérdezett bizonyos tényekről a valóságnak nem megfelelő állításokat tegyen. Például stigmatizáló tényekről (például családon belüli erőszak vagy kábítószer-használat) az emberek nem szívesen számolnak be. Az őszinte válaszadást a kérdések megfogalmazásának (a stigmatizáló jelleg csökkentésével) meg kell könnyítenie, és ennek letagadását (kiegészítő kérdések feltevésével) meg kell nehezítenie. Természetesen mindez csak akkor hatásos, ha a kérdezőbiztos személyisége és viselkedése megkönnyíti az esetleg kellemetlen valóság feltárását. A közvélemény-kutatások megbízhatóságát és érvényességét a kutatás végzői által választott módszerek alapvetően befolyásolják. A mintavételi hibát csökkenteni, és ezzel a megbízhatóságot növelni elsősorban a gondos mintaválasztással, a megfelelő mintanagysággal, a minta minél nagyobb hányadának tényleges lekérdezésével lehet (a lekérdezés a szakzsargonban sikerrel végrehajtott megkérdezést jelent). A 15
16 nem mintavételi hibát csökkenteni, és ezáltal az érvényességet növelni elsősorban a kérdezés helyes módjának megválasztásával, a kérdőív megfelelő szerkesztésével, a kérdezőbiztosok alapos kiképzésével és ellenőrzésével lehet. Ez a felsorolás csak vázlatosan tartalmazza a legfontosabb szempontokat. A kérdezés helyes módjának megválasztása például magában foglalja a döntést a kérdezés helyéről és idejéről és arról is, hogy az adatgyűjtést kérdezőbiztosok végezzék, vagy pedig úgynevezett önki- töltéses kérdőíveket használjanak; ha kérdezőbiztosokat alkalmaznak, az adatgyűjtés személyes megkeresésen alapuljon, vagy telefonon keresztül történjen, esetleg postán juttassák el a kérdőíveket a megkérdezettekhez (amely esetben természetesen nincsenek kérdezőbiztosok). Mindezen eldöntendő szempontokat a közvélemény-kutatás tervezőjének együttesen kell mérlegelnie, nem feledkezve meg az egyes módszerek költség- és időigényéről sem. A cél adott költségkereten belül a legmegbízhatóbb és legérvényesebb adatok gyűjtése. Ezt az optimalizálási feladatot általában nem lehet teljesen egzaktul megoldani, és bár bizonyos választások egy adott esetben minden bizonnyal jobbak más választásoknál, a vizsgálat tervének kialakításakor a tapasztalatból származó intuícióra is szükség lehet. A fenti szempontok közül a közvélemény-kutatás megrendelője vagy eredményeinek olvasója néhányat köny- nyen megítélhet, és ebben a könyvben elsősorban ezekről lesz szó. A mintanagyságot, a mintaválasztás módját, a nemválaszolók arányát a legtöbb vizsgálatról szóló beszámoló közli. Ritkábban lehet olvasni a kérdőívben szereplő azon kérdésekről, amelyekkel megpróbálták kideríteni, hogy
például a megkérdezett szándékozik-e szavazni (márpedig azok pártpreferenciái nem fogják befolyásolni a választások eredményeit, akik el sem mennek szavazni, és nem biztos, hogy azok, akik nem kívánnak szavazni, ezt előre meg is mondják). Arról pedig, hogy kik voltak a kérdezőbiztosok, milyen képzésen vettek részt, hogyan ellenőrizték a munkájukat, hogyan biztosították például azt, hogy nagyjából hasonlóan legyenek öltözve, vagy volt-e lényeges eltérés korban vagy képzettségben közöttük, szinte soha nem tudunk meg semmit. Egy jó közvélemény-kutatás (amelyről joggal remélhetjük, hogy hibája kicsi) nagy figyelmet fordít mindezekre a szempontokra. Egy jó közvélemény-kutatási beszámoló valamilyen szinten utal is ezekre a szempontokra. Ebből az is következik, hogy egy bizonyos terjedelem alatt nem lehet érdemben beszámolni egy közvélemény-kutatásról. A közvélemény-kutatás eredményei nem értékelhetők a módszerek ismerete nélkül, amelyekkel az eredmények születtek. A módszerek ismerete nélkül az eredményeknek sem a megbízhatósága sem az érvényessége nem ítélhető meg. Sőt, az eredmények egyáltalán nem értelmezhetőek azoknak a módszereknek az ismerete nélkül, amelyeknek alkalmazásával születtek. A magyar sajtóban kialakult gyakorlat (a közvélemény-kutatások módszereinek rövid ösz- szefoglalása egy úgynevezett keretben) sokkal jobb, mint ha az olvasót az alkalmazott módszerekről egyáltalán nem tájékoztatnák. Ugyanakkor a szokásos tájékoztató méretek nem teszik lehetővé valamennyi szükséges információ közlését, még vázlatos formában sem. Pedig ez nagyon hasznos lenne, mivel a sajtóban megjelenő közlemények sok különböző módon végrehajtott, részleteikben erősen elé- térő közvélemény-kutatásokon alapulnak. Egy - a valóságot némileg leegyszerűsítő - példaként tegyük fel, hogy a vizsgálat eredménye szerint egy pártra a szavazók 15%-a szavazna. Ez nem sokat jelent, ha nem tudjuk a következőket: az összes szavazásra jogosult, vagy pedig 17
a valószínűleg valóban szavazók 15%-áról van-e szó; hogyan és mennyire pontosan állapították meg, hogy kik a valószínű szavazók és kik a valószínűleg nem szavazók (érvényesség); a minta nagyságától, a mintavétel módjától és egyéb szempontoktól függően mit várhatunk a mintában talált arány és az egész népességre jellemző arány eltérésének nagyságával kapcsolatban (megbízhatóság). Összefoglalás Egy közvélemény-kutatás eredményeinek eltérése a valóságtól, azaz hibája, a mintavételi és a nem mintavételi hibákból ered. A mintavételi hibák a megbízhatóságot, a nem mintavételi hibák az érvényességet csökkentik. E hibák várható nagyságának csökkentésére számos módszer áll a közvélemény-kutatás készítőinek rendelkezésére. Egy jó közvélemény-kutatás él ezekkel a lehetőségekkel, és az alkalmazott módszerekről be is számol olyan részletesen, hogy érvényessége és megbízhatósága megítélhető legyen. 18
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) A reprezentativitás a közvélemény-kutatások mintáinak legkívánatosabb tulajdonsága. Egyes közvélemény-kutató cégek azt állítják saját mintáikról, hogy azok reprezentatívak", mások csak annyit, hogy mintáik valamilyen szempontokból jól reprezentálják a vizsgálni kívánt sokaságot. Természetesen a közvélemény-kutatás céljaira egy olyan minta lenne a jó, amely a vizsgálni kívánt változó szerint reprezentatív. Ha például arra vagyunk kíváncsiak, hogy egy bizonyos politikai párt a szavazatok hány százalékát kapná, ha most tartanák a választásokat, akkor egy olyan minta lenne jó, amelyben a párt szavazóinak aránya megegyezik a párt szavazóinak a populációbeli arányával. Ha a párt az összes szavazat 14%-át kapná, akkor olyan mintára lenne szükségünk, amelyben a párt szavazóinak aránya szintén 14%. Ha például a közvélemény-kutatás 1000 fő megkérdezésén alapul, azaz a mintanagyság 1000, akkor egy olyan minta lenne jó számunkra, amelyben a párt szavazóinak száma 140. Ebből a mintából a párt szavazóinak arányára olyan becslést kapnánk (140/1000=14%), amely megegyezik a populációbeli értékkel. A vizsgált párt szavazóinak száma vagy aránya szempontjából ez a minta reprezentatív lenne, mert pontosan tükrözné a populációbeli arányokat. Sajnálatos módon azt sohasem tudhatjuk, hogy a mintánk a minket érdeklő szempontból reprezentatív-e. Ennek eldöntéséhez a mintában tapasztalt értéket össze kellene hasonlítani a populációra jellemző értékekkel. A populációra jellemző értékek azonban nem ismeretesek. Ha ezeket az értékeket ismernénk, például tudnánk egy párt szavazóinak arányát az összes szavazó között, akkor a vizsgálatra nem is lenne szükség. A közvélemény-kutatás mindig olyan té- 19
20 máról szól, amellyel kapcsolatban a lakosság álláspontja nem ismert kellő pontossággal, ezért az sem eldönthető, hogy a vizsgálat alapjául szolgáló minta reprezentatív-e. Más a helyzet olyan jellemzőkkel, amelyek a Központi Statisztikai Hivatal által gyűjtött adatok alapján jól ismertek. Ilyenek például a felnőtt népesség megoszlása nemek szerint, az iskolai végzettség különböző szintjei szerint vagy pedig a Budapesten, egyéb városokban, illetve községekben lakók aránya. Ezeknek az információknak a forrása a tízévenkénti népszámlálás és a közbülső időben végrehajtott úgynevezett mikrocenzus, amely ugyan nem teljes körű adatfelvétel, de még mindig olyan nagy mintán végzett és megbízható adatgyűjtés, amelynek eredményei a közvélemény-kutatások számára viszonyítási alapként szolgálhatnak. Ezen változók szempontjából a minta reprezentativitása ellenőrizhető és szerencsés esetben megállapítható (ha a mintabeli érték nem tér el nagymértékben a populációra jellemző értéktől). Könnyen előfordulhat, hogy a minta valamely szempontból reprezentatív, de egy más szempont szerint már nem az. Egy mintát akkor nevezhetnénk minden további nélkül reprezentatívnak, ha valamennyi, a vizsgálatban feltett kérdés szerint reprezentálná a teljes populációt. Azt, hogy a reprezentativitás teljesül-e, éppen a legfontosabb (a kutatás tárgyát képező) változók szempontjából lehetetlen ellenőrizni. Ezért ebben az általános értelemben reprezentatív mintáról nem beszélhetünk. A minta csak bizonyos változók szerint lehet reprezentatív. A vizsgálat tárgyát képező változó(k) szempontjából a reprezentativitás kérdése nem dönthető el. Ennek illusztrálására képzeljünk el egy egész pici országot, amelyben csak tíz szavazásra jogosult él (ez a populáció), közülük öt nő és öt férfi. Tegyük fel még azt is, hogy a választáson, amelynek eredményét szeretnénk előre jelezni, csak két párt indul, A és B. A nők közül egy szavaz az A pártra, a férfiak közül pedig 4, a többiek a B pártra szavaznak. Eszerint a lakosság fele az A pártra szavazna, a lakosság fele a B pártra. Ez a valóság. De milyen eredménnyel járna egy
közvélemény-kutatás? Ennek illusztrálására feltesszük, hogy minden megkérdezett válaszol szavazási szándékát firtató kérdésünkre, a megkérdezettek pártpreferenciái léteznek, határozottak és őszintén is válaszolnak. A valóságban természetesen ezek közül a feltevések közül egyetlen sem teljesül, de most csak a minták lehetséges tulajdonságait vizsgáljuk, és az egyéb problémákat későbbi fejezetekben tárgyaljuk. Tegyük még fel, úgy döntünk, hogy a közvélemény-kutatást két fő megkérdezésére alapozzuk, azaz a mintanagyság kettő. Ki lehet számolni, hogy ebben az esetben negyvenöt darab különböző mintával találkozhatunk. (Bár annak belátása, hogy éppen 45 különböző minta lehetséges ebben az esetben, nem szükséges a továbbiak megértéséhez, bemutatjuk azt az egyszerű gondolatmenetet, amelyen ez az eredmény alapul: Válasszuk ki először az első személyt a mintába. Mivel a populációban 10-en vannak, a választás tízféle módon lehetséges. Akárkit választottunk is az első alkalommal, a második személy kiválasztására még 9 különböző lehetőség maradt, hiszen a 10 emberből egyet már kiválasztottunk. így a két fő kiválasztására 10*9 = 90 lehetőség van. Ha azonban 90 lehetőségre gondolunk, akkor ebbe beleszámítottuk azt a mintavételt, amelynek során az első választás az x ember és a második választás az y ember, és egy másik mintavételként azt is, amelyben y az elsőként kiválasztott ember és x a másodszorra kiválasztott. Valójában ezek a választások ugyanarra a mintára vezettek, nevezetesen arra, amelyben x és y szerepel, függetlenül attól, hogy milyen sorrendben választottuk ki őket. Hasonlóan minden lehetséges mintát kétféle sorrendben választhatunk ki, és előbbi eredményünk, a 90, minden mintát kétszer tartalmaz. Tehát ténylegesen 90/2 = 45 különböző minta van. Megjegyezzük, hogy a későbbiekben ennél sokkal bonyolultabb számítások eredményeit közöljük majd, anélkül, hogy utalnánk azokra a módszerekre, ahogy a közölt eredményeket megkaphatjuk.) Az, hogy a 45 lehetséges minta közül éppen melyiket választjuk, véletlentől függő eljáráson 21
alapul és nem befolyásolható. Az egész populáció és valamennyi lehetséges minta is egy úgynevezett 2*2-es táblázatba helyezhető. Ez a táblázat minden embert két szempontból csoportosít: a neme és a pártpreferenciája szerint. Ezekből a szempontokból az ország lakosságának megoszlását az 1. táblázat tartalmazza. férfi A párt szavazói 4 1 B párt szavazói 1 4 1. Táblázat Egy kis ország szavazói, nemük és pártpreferenciáik alapján csoportosítva nő Az egyik lehetséges minta két férfiból áll, akik közül egy az A pártra, egy pedig a B pártra szavaz. A negyvenöt lehetséges mintából négy lesz ilyen, hiszen B-re szavazó férfi egy van és ehhez négyféleképpen választhatunk egy A-ra szavazót. Egy ilyen mintából a pártpreferenciát helyesen becsülnénk (mert a minta fele szavazna az A pártra), tehát a pártpreferencia szempontjából ez a minta reprezentatív. Ugyanakkor a minta nem reprezentatív a nemek szerinti eloszlás szempontjából, mert csupa férfiból áll. Ez utóbbi tényt meg tudnánk állapítani a mintának a nép- számlálás adataival való összehasonlításából, az előbbit nem. Ez a minta tehát nem tűnik reprezentatívnak a nemek szerint, de ennek ellenére reprezentatív a pártpreferenciák szerint. Léteznek olyan minták is, amelyek csak a nemek szerinti megoszlást mutatják helyesen (például egy A-ra szavazó 22
férfit és egy A-ra szavazó nőt tartalmaznak), valamint olyan minták, amelyek mindkét szempontból reprezentatívak vagy egyikből sem. Az összes minta besorolható ezen szempontok szerint. A 2. táblázat azt mutatja, hogy a 45 lehetséges minta hogyan oszlik meg a reprezentativitás szempontjából. nemek szerint reprezentatív nemek szerint nem reprezentatív Pártpreferencia reprezentatív Pártpreferencia nem reprezentatív szerint szerint 17 8 8 12 2. Táblázat A 45 lehetséges kétfős minta megoszlása reprezentativitás szerint Azt látjuk, hogy a 45 lehetséges minta közül 17 olyan, amely a nemek és a pártpreferencia szerint is reprezentatív, további 8 a pártpreferencia szerint reprezentatív, a nemek szerint nem. Ezen minták bármelyikét választjuk is, a párt- preferenciák előrejelzése helyes lesz. Vannak tehát olyan minták, amelyek a pártpreferenciák pontos előrejelzésére kitűnően használhatóak, annak ellenére, hogy a nemek szerinti megoszlás szempontjából torzítanak. A pártpreferenciák pontos előrejelzésének nem feltétele az, hogy a minta pontosan tükrözze a populáció nemek szerinti megoszlását. Ugyanakkor azon 25 minta között, amelyek a nemek szerinti megoszlást pontosan reprezentálják, 8 olyan van, amely a pártpreferenciák szerint nem reprezentatív, azaz az ellenőrizhető reprezentativitás a nemek szerinti megoszlás szempontjából egyáltalán nem garantálja a reprezentativitást a pártpreferenciák szempontjából. Összefoglalóan megállapíthatjuk, hogy egy ellenőrizhető szempont (nemek) szerinti megoszlásnak a pontos vagy pontatlan volta a mintában nem garantálja, hogy a minta a vizsgálat célja (pártpreferencia) szerint reprezentatív. Ezért azok a mintavételi eljárások, amelyek csak arra ügyelnek, hogy a mintában bizonyos társadalmi csoportok a populációbeli 23
24 arányuknak megfelelően szerepeljenek (természetesen itt csak ellenőrizhető szempontokról lehet szó), de ezen belül a kérdezőbiztosokra bízzák a megkérdezettek kiválasztását, nem megfelelőek. Az ilyen eljárásokat kvótás mintavételnek nevezik. Ezek olyan mintákat eredményeznek, amelyek néhány ellenőrizhető szempontból reprezentatívak, de ez nem jelent biztosítékot arra nézve, hogy a vizsgálat tárgyát képező szempontból is reprezentatívak lennének. A valóságban a kvótás mintavételi eljárások rosszabb eredményeket adnak, mint azt a fentiek alapján hihetnénk. Gyakran lényeges torzításokhoz vezet az, hogy a kérdezőbiztosok a megadott kereteken belül maguk választják ki a megkérdezetteket. Ez azért van így, mert a kérdezőbiztosoknak könnyebb megkérdezniük bizonyos csoportok tagjait, mint másokat. A kérdezőbiztosok gyakran saját környezetükből választják ki a megkérdezetteket kvótás mintavétel esetén, ami torzításokhoz vezethet. Vagy például könnyen feltételezhető, hogy a rendszerint fiatal kérdezőbiztosok minden társadalmi csoportból a fiatalosabbakat" fogják előnyben részesíteni, aminek egy politikai közvéleménykutatás esetén jelentős torzító hatása lehet. A kvótás mintavétel tehát annak ellenére, hogy bizonyos ellenőrizhető szempontokból biztosítja a minta reprezentativitását, a vizsgálat tárgyát képező szempontokból gyakran torz mintához vezet. Ez a torzítás a körülményektől függően többé vagy kevésbé fontos. Ha csak arra vagyunk kíváncsiak hogy ki nyeri a választásokat, és az egyik párt lényegesen népszerűbb, mint bármely másik párt, akkor a választások eredményét kissé torz minta alapján is pontosan előre jelezhetjük. Ha azonban az eredmény szoros, akkor már egy kissé torz minta alapján is tévedhetünk. Ezért kvótás mintavételt ma már általában nem használnak. A kvótás mintavételi eljárás hiányossága úgy is megfogalmazható, hogy a kérdezőbiztosok által preferált társadalmi csoportok nagyobb mértékben kerülnek a mintába, mint az egyéb csoportok, még akkor is, ha a csoportképző szempontok
egy része - az előírt kvóta miatt - nem is torzul. Ezt úgy lehet kiküszöbölni, hogy a populáció minden tagjának egyforma esélyt adunk a mintába kerülésre. Az ezen az elven alapuló mintavételi eljárásokat véletlen mintavételnek nevezik. A véletlen mintavétel legegyszerűbb formája egy olyan listát használ fel, amely a populáció minden egyedét tartalmazza. Közvélemény-kutatásoknál a vizsgált populáció emberekből áll, például a budapesti hajléktalanokból, ha azt szeretnénk megtudni, hogy mennyire elégedettek bizonyos szociális ellátásokkal, vagy az összes szavazásra jogosultból egy választási előrejelzésnél, vagy a város egy bizonyos területének összes lakójából, ha a buszmegálló kívánatos elhelyezésének felderítése a cél, vagy egy iskola tanulóiból, ha a legnépszerűbb tanárt akarjuk kiválasztani. Ezekben az esetekben a teljes populációt felsoroló lista előállítása különböző (az előbbi felsorolásban csökkenő) mértékben nehéz feladat. Az egyszerű véletlen mintavétel a populáció minden tagjának ugyanakkora esélyt ad a mintába kerülésre. Ha a minta nagysága előre rögzített és a populáció nagysága is ismert, akkor egy személy bekerülési valószínűsége e két szám hányadosa. Ha teljes listával rendelkezünk a populációról, akkor az egyszerű véletlen mintavételt úgy képzelhetjük el, hogy a populáció minden tagjának a nevét felírjuk egy papírlapra, ezeket belehelyezzük egy nagy dobozba, jól megkeverjük a cédulákat, és addig húzunk ki neveket (a már ki- húzottak visszatevése nélkül), amíg el nem érjük a kívánt mintanagyságot. Ez a mintavételi eljárás azt is eredmé- 25
26 nyezi, hogy rögzített mintanagyság mellett az összes lehetséges ekkora méretű minta azonos valószínűséggel kerül kiválasztásra. A korábbi példában szereplő tíz fős populáció esetén az egyszerű véletlen mintavételt úgy hajtanánk végre (kételemű mintákkal), hogy előbb kiválasztanánk egy személyt a tízből, és utána még egyet a fennmaradó kilencből. A mintába kerülő személyek kiválasztásánál azonban semmilyen szubjektív tényező nem játszhatna szerepet, kizárólag a pártatlan véletlen. Mint említettük, ebben az esetben 45 különböző kételemű minta lehetséges, és ezek mindegyike ugyanakkora valószínűséggel kerülne kiválasztásra. Ez azt jelenti, hogy ha például kilencezerszer vennénk mintát ebből a populációból, akkor várhatóan valamennyi mintát nagyjából kétszáz alkalommal választanánk. Mit nyerünk, és mit veszítünk a véletlen mintavétel alkalmazásával? Az egyik veszteség az, hogy véletlen mintavétel esetén nincs garancia arra, hogy a kapott minta bármilyen fontos jellemző szerint reprezentatív legyen. Előfordulhat, hogy a minta torz még olyan alapvető szempontból is, mint a nemek szerinti megoszlás. További veszteségnek tűnhet az, hogy a véletlen mintavétel eredménye felett nem gyakorlunk kontrollt, ki vagyunk szolgáltatva a véletlennek". A véletlennek való kiszolgáltatottság azonban nem is olyan rossz. Mindenesetre sokkal jobb, mint ha a kérdezőbiztosok vagy a vizsgálat egyéb résztvevőinek önkéntelen preferenciái befolyásolnák a minta összetételét. A véletlen pártatlan és - legalábbis hosszú távon - kiegyensúlyozott mintaválasztást eredményez. Semmilyen mintavételi eljárás esetén sem tudjuk megmondani, hogy az aktuális minta reprezentatív-e a vizsgálandó szempontokból. Véletlen mintavétel esetén azt remélhetjük, hogy ez a reprezentativitás - hosszú távon és átlagosan - teljesül. Az előző példánkban szereplő negyvenöt különböző kételemű minta közül huszonöt reprezentatív volt, azaz azt mutatják, hogy a szavazók fele az A pártra, másik fele pedig a B pártra szavaz. A fennmaradó húsz minta közül tízben mindenki az A pártra
szavazna, tízben pedig mindenki a B pártra. Ha az összes mintából számítanánk ki az A pártra szavazók arányát, ötven százalékot kapnánk, hiszen (25*50%+10* 100%+10*0%)/(25+10+10)=50%. Ebből az is következik, hogy véletlen mintavétel esetén a mintából az A párt szavazóira kapható becslések átlaga a mintavételi és becslési eljárás sokszori alkalmazása után szintén 50% lesz. Átlagosan tehát helyesen fogjuk megbecsülni a két párt szavazóinak arányát. Természetesen ez nem jelenti azt, hogy véletlen mintavétel esetén minden minta alapján pontos becslést adnánk. Azonban olyan mintát, amely alapján a becslés nagyon rossz lenne, ritkán kapunk. Kicsit pontosabban: minél jobban eltér egy mintában az A párt szavazóinak aránya a teljes népességen belüli arányuktól, annál kisebb valószínűséggel, annál ritkábban fogjuk ezt a mintát megfigyelni. Az a tendencia, hogy rossz becslést adó mintákat csak ritkán fogunk megfigyelni, sokkal erősebb, mint azt gondolnánk. Ha például a párt szavazóinak aránya a népességben 50%, a mintanagyság pedig 2500, akkor az összes lehetséges minta 68%-a annyira jó, hogy a párt szavazóinak aránya a mintában (és ezzel együtt a populációbeli arányukra vonatkozó becslésünk) 49% és 51% között lesz. Az összes 2500 személyt tartalmazó mintáknak a fennmaradó nagyjából egyharmad része egyformán oszlik meg olyan minták között, amelyekben a párt szavazóinak aránya több, mint 51%, és olyan minták között, amelyekben a párt szavazóinak aránya kisebb, mint 49 %. Más szavakkal: ha véletlenszerűen választunk egy 2500 elemű mintát, akkor az eseteknek több mint kétharmad részében a mintánk any- nyira jó lesz, hogy a párt szavazóinak arányát illetően a mintára és a populációra jellemző értékek eltérése kisebb, mint 1 százalékpont, és csak a mintáknak kevesebb, mint egy harmada fog olyan becslést adni, amelynek hibája nagyobb, mint 1 százalékpont. Ezek az eredmények a véletlen mintákra vonatkozó matematikai megfontolásokból származnak. Ezeknek a jó tulajdonságoknak a teljesüléséhez nem kell mást tenni, mint a véletlen mintaválasztás szabályait betartani, és akkor 27
28 automatikusan" teljesülnek. Ugyanebben a helyzetben azon minták aránya, amelyekből a párt szavazóinak arányát 48% és 52% közé tennénk, 95% lenne, azaz húsz minta közül tizenkilenc esetében legfeljebb két százalékpontot tévednénk. Azon minták aránya, amelyben legfeljebb három százalékpontot tévednénk, azaz a pártra szavazók becsült aránya 47% és 53% között lenne, az összes lehetséges minták 99,7%-a. Ez azt jelenti, hogy 300 mintaválasztás közül mindössze egy lenne - várhatóan - annyira balszerencsés, hogy három százalék- pontnál nagyobb hibát vétsünk. Tehát a véletlen mintavételen alapuló eljárások nagy biztonsággal olyan mintákat eredményeznek, amelyekből egy párt szavazóinak arányát kis hibával meg lehet becsülni. Természeten a fenti eredmények matematikaiak, és csak megszorítással alkalmazhatóak a valóságra. Azt kell feltennünk, hogy a népességben mindenkinek van határozott pártpreferenciája, a mintát valóban egyszerű véletlen mintavétellel választották ki, mindenki válaszolt, aki eredetileg a mintába került, és mindenki őszintén válaszolt. Ezen szempontok közül valamennyi szerint jónak kell lennie a közvélemény-kutatásnak ahhoz, hogy a fenti - igen kedvező - eredmények a pontosságra vonatkozóan akár csak közelítőleg is igazak legyenek. Ez azt mutatja, hogy egy közvélemény-kutatás minőségének és ezen keresztül az eredmények érvényességének és megbízhatóságának a megítéléséhez számos részlettel kell tisztában lennünk.
Összefoglalás A véletlen mintavétel átlagosan pontos és megfelelő mintanagyság mellett az esetek többségében egyedileg is igen pontos becsléseket tesz lehetővé. A véletlen minták az esetek többségében jól reprezentálják a népességet a vizsgált szempontból; ennek nem feltétele az, hogy a minta valamely ellenőrizhető szempontból reprezentatív legyen. Azt, hogy egy minta jó-e, nem lehet eldönteni. Egy mintát akkor tekintünk jónak, ha helyes módszerrel választották. Ne higgyünk azoknak a közvélemény-kutatásoknak, amelyek készítői azt állítják, hogy mintájuk reprezentatív". Ezek a kutatók összekeverik vágyaikat a tényekkel. 29
3. Hány embert kell megkérdezni? (Mintanagyság) 30 Minél nagyobb a minta, annál megbízhatóbbak az eredmények. Ezt mindenki tudni véli, bár nem biztos, hogy mindenki ugyanazt érti ezen az állításon. Mielőtt azonban megkeresnénk azt a jelentést, amely helyes, emlékezzünk a Literary Digest kudarcára. Ha egy mintát rossz módon választanak, a nagyobb létszám nem segít. Ez ugyanis csak nagyobb léptékben lesz rossz. Tehát a nagy mintalétszám csak akkor kívánatos, ha egyébként a mintát helyesen választották. A minta nagy voltának egyik szokásos értelmezése az, hogy a minta elemszáma nagy. Annak megállapításához, hogy a minta elég nagy-e ebben az értelemben, olyan kritériumokat kellene felállítani, amelyeket bármilyen populáció esetén alkalmazhatunk. A másik szokásos értelmezés az, hogy a minta a vizsgált sokaságnak nagy hányadát képviseli. Annak eldöntéséhez, hogy egy ilyen típusú kritérium teljesül-e, ismerni kell a vizsgált populáció létszámát. Sok esetben ez a létszám nem ismert (gondoljunk csak a hajléktalanok véleményével foglalkozó vizsgálatra). Az, hogy a minta milyen mértékben közelíti az egész népességet, sok tényezőtől függ, de matematikai szempontból lényegében csak háromtól: a populáció becsülni kívánt jellemzőjétől, a mintavétel módjától és a minta elemszámától. A populáció becsülni kívánt jellemzője lehet egy arányszám, melyet gyakran százalékos formában fejezünk ki (például egy pártra adott szavazatok aránya az összes szavazaton belül) vagy egy átlag (például egy politikus ro- konszenv-osztályzatainak átlaga). Első látásra úgy tűnhet, hogy ez a két eset nem különbözhet nagyon: az arány is egy átlag. Ennek belátásához arra az egyszerű trükkre van szükség, hogy a párt szavazóihoz rendeljük az 1 értéket, azokhoz pedig, akik nem erre a pártra szavaznának, rendeljük a 0-t. így minden megfigyelést egy értékkel jel- lemzünk, és ezeknek összege éppen a vizsgált párt szavazóinak száma. A keresett arány ez az érték osztva a minta
teljes elemszámával. De ha egy összeget (a 0-k és 1-ek ösz- szegét) elosztjuk a tagok számával, az átlagot kapjuk. Ezért a párt szavazóinak aránya a mintában a megfigyelt 0-k és 1-ek átlaga lesz. E könnyű azonosíthatóság ellenére a két eset eltérő. Feltéve, hogy a párt szavazóinak népességbeli arányát ismerjük, a szavazóknak a különböző mintákban vett számát vagy arányát illetően hasznos állításokat tehetünk pusztán ezt az információt felhasználva. Az átlagos rokonszenv osztályzat esetében a különböző mintákban megfigyelt értékek eloszlása a népességbeli átlagon túlmenően még mástól is függ. Ennek a különbségnek az az oka, hogy ha a szavazóknak a populációbeli aránya adott, például, ha egy nyolcmilliós népességben a párt szavazóinak aránya 15%, akkor ez - természetesen - csak úgy fordulhat elő, hogy a népességben egymilliókétszázezren erre a pártra szavaznak és hatmillió-nyolcszázezren nem erre a pártra szavaznak. Tehát a minket érdeklő jellemző ebben az esetben meghatározza az egész populációt jellemző viszonyokat. Ezzel szemben, ha egy politikus rokonszenv-átlaga 4, akkor ez úgy is előfordulhat, hogy a népesség fele hármas, fele pedig ötös osztályzatot ad, vagy úgy, hogy a népesség kétharmada ötös, egyhar- mada pedig kettes osztályzatot. Tehát ebben az esetben a minket érdeklő jellemző nem határozza meg az egész népesség értékeit. Emiatt a minták jó vagy rossz voltának mértékét nemcsak az a tény határozza meg, hogy a népesség átlagos osztályzata négyes, hanem az is, hogy milyen osztályzatokból jön össze ez a négyes. Ha például a népességben mindenki négyes osztályzatot ad, akkor 31
32 ezt minden minta híven tükrözi, de ha a népesség fele hármas, fele ötös osztályzatot ad, akkor lesznek jobb és rosszabb minták (amelyek többé vagy kevésbé pontosan tükrözik ezt). A mintavétel módját most csak idealizált, matematikai szemszögből tárgyaljuk. Később lesz szó azokról a mintavételi eljárásokról, amelyek a gyakorlatban is kivitelezhe- tők, és elméleti szempontból is kielégítő eredményeket adnak. Az egyszerű véletlen mintavétel technikailag pontos jelentése az, hogy a vizsgálandó népességből a mintába kerülőket egymás után választjuk, egyik választás sem függ az előző eredményétől, és minden húzás alkalmával a vizsgálandó népesség minden (addig ki nem választott) tagjának egyforma esélye van a mintába kerülésre. A mintavételi módszerek aszerint is csoportosíthatók, hogy a mintavétel visszatevéssel vagy anélkül történik. Ennek a különbségnek a megértéséhez tegyük fel, hogy a vizsgálandó népesség minden egyedének a neve fel van írva egy cédulára, ezek a cédulák egy dobozba vannak elhelyezve, és alapos keverés után kihúzzuk az első mintába került személy nevét. Visszatevés nélküli mintavétel esetén ezután újra keverünk, és utána kihúzzuk a második nevet. Visszatevéses mintavétel esetén az első nevet tartalmazó cédulát visszatesszük, mielőtt újra kevernénk és húznánk. Ez azt jelenti, hogy visszatevéses mintavételnél, legalábbis elvileg, fennáll annak a lehetősége, hogy ugyanazt a személyt kétszer válasszuk. Ezért közvéleménykutatásnál sohasem alkalmaznak visszatevéses mintavételt. Értelmetlen lenne ugyanazt a személyt kétszer is megkérdezni. Visszatevéses és visszatevés nélküli mintavétel esetén a keletkező minták statisztikai viselkedése némileg eltér. Ez az eltérés annál kisebb, minél kisebb hányada a mintanagyság a populáció méretének. Ha a populáció nagy a mintához képest, akkor ugyanazon személy kétszeri mintába kerülésének a valószínűsége kicsi, és ezért a visszatevéses és visszatevés nélküli mintavétel közötti különbség is kicsi. Egy olyan közvélemény-kutatásban, ahol egy többmilliós népességet egy néhány ezres minta alapján vizsgálunk, a kétféle mintavétel közötti különbség elhanyagolható, ezért a továbbiakban ezzel
nem is foglalkozunk. A minta elemszámának a növelése ténylegesen csökkenti a népességbeli érték és a megfelelő mintabeli érték várható eltérését. Ebben az értelemben a nagyobb minta jobb. Mindaddig, amíg az előző bekezdésben tett feltevés (hogy a mintanagyság kicsi a populáció nagyságához képest) igaz, a minta relatív nagysága (a mintaelemszám és a populáció nagyságának hányadosa) nem befolyásolja a mintából nyerhető becslés jóságát, ez csak a minta elemszámától függ. A 3-7. táblázatok ezt a függést illusztrálják. Különböző mintanagyságokra és különböző valós, a népességre jellemző értékekre azt mutatják, hogy különféle bizonyossággal mekkora eltérést várhatunk a becsült értékek és a valódi értékek között. Mintanagyság: 100 Valódi arány a népességben Megfigyelt arány a minták 99%-ában Megfigyelt arány a minták 95%-ában Megfigyelt arány a minták 90%-ában Megfigyelt arány a minták 75%-ában 10% 2,3%-17,7% 4,1 % 15,8 % 5,1 % 14,9% 6,5%-13,5% 20% 9,7%-30,3% 12,2%-27,8% 13,4%-26,6% 15,4%-24,6% 30% 18,2%-41,8% 20,0%-40,0% 22,5%-37,5% 24,7%-35,3% 40% 27,4%-52,6% 30,4%-49,6% 31,9%-48,1% 34,4%-4S,7% 50% 37,1%-62,9% 40,2%-59,8% 41,8%-58,2% 44,2%-S5,8% 60% 47,4%-72,6% 50,4%-69,6% 51,9%-68,1% 54,4%-65,7% 70% 58,2%~81,8% 60%-80% 62,5%-77,5% 64,7%-75,3% 80% 69,7%-90,3% 72,2%-87,8% 73,4%-86,6% 75,4%-84,6% 90% 82,3%-97,7% 84,1%-95,8% 85,l%-94,9% 86,5%-93,5% 3. Táblázat Egy 100 elemű minta várható teljesítménye 33
Mintanagyság: 500 Valódi arány a népességben Megfigyelt arány a minták 99%-ában Megfigyelt arány a minták 95%-ában Megfigyelt arány a minták 90%-ában Megfigyelt arány a minták 75%-ában 5% 2,596-7,5% 3,196-6,9% 3,4%-6,6% 3,996-6,1% 10% 6,5%-13,5% 7,496-12,6% 7,8%-12,2% 8,596-11,5% 20% 15,4%-24,6% 16,596-23,5% 17,1 % 22,9% 18,096-22,0% 30% 24,7%-35,3% 26,096-34,0% 26,6%-33,4% 27,696-32,4% 40% 34,4%-45,6% 35,796-44,3% 36,4%-43,6% 37,596-42,5% 50% 44,2%-55,8% 45,696-54,4% 46,3%-53,7% 47,4%-52,6% 60% 54,4%-65,6% 55,796-64,3% 56,496-63,6% 57,596-62,5% 70% 64,7%-75,3% 66,096-74,0% 66,6%-73,4% 67,696-72,4% 80% 75,4%-84,6% 76,596-83,5% 77,l%-82,9% 78,0%-82,0% 90% 86,5%-93,5% 87,496-92,6% 87,8%-92,2% 88,5%-91,5% 95% 92,5%-97,5% 93,196-96,9% 93,4%-96,6% 93,996-96,1% 4. Táblázat Egy 500 elemű minta várható teljesítménye Mintanagyság: 1000 Valódi arány a népességben Megfigyelt arány a minták 99%-ában Megfigyelt arány a minták 95%-ában Megfigyelt arány a minták 90%-ában Megfigyelt arány a minták 75%-ában 5% 3,2%-6,8% 3,6%-6,4% 3,996-6,1% 4,296-5,8% 10% 7,696-12,4% 8,1 % 11,9% 8,496-11,6% 8,95% 11,1 % 20% 16,796-23,3% 17,596-22,5% 17,996-22,1% 18,5% 21,5% 30% 26,396-33,7% 27,296-32,8% 27,696-32,4% 29,396-31,7% 40% 36,0%-44,0% 37,096-43,0% 37,5%-42,5% 38,2%-41,8% 50% 45,996-54,1% 46,996-53,1% 47,4%-52,6% 48,2%-51,8% 60% 56 /0%-64,0% 57,096-63,0% 57,596-62,5% 58,2%-61,8% 70% 66,3%-73 /7% 67,296-72,8% 67,6%-72,4% 69,396-71,7% 80% 76 /7%-83 /3% 77,596-82,5% 77,9%-82,1% 78,596-81,5% 90% 87,696-92,4% 88,1496-91,9% 88,496-91,6% 88,9%-91 /l% 95% 93,2%-96,8% 93,696-96,4% 93,9%-96,l% 94,2%-95,8% 5. Táblázat Egy 1000 elemű minta várható teljesítménye 34
Mintanagyság: 2000 Valódi arány a népességben Megfigyelt arány a minták 99%-ában Megfigyelt arány a minták 95%-ában Megfigyelt arány a minták 90%-ában Megfigyelt arány a minták 75%-ában 5% 3,7%-6,3% 4,l%-5,9% 4,2%-5,8% 4,4%-5,6% 10% 8,3%-11,7% 8,7%-11,3% 8,996 11,1 9,3%-10,7% % 20% 17,7%-22,3% 18,2%-21,8% 18,5%-21,5% 19,0%-21,0% 30% 27,4%-32,6% 28,0%-32,0% 28,3%-31,7% 28,8%-31,2% 40% 37,2% 42,8% 37,9%-42,l% 38,2% 41,8% 38,7%-41,3% 50% 47,1 %-52,9% 47,8%-52,2% 48,2%-51,8% 48,7%-51,3% 60% 57,2%-62,8% 57,9%-62,1% 58,2%-61,8% 58,7%-61,3% 70% 67,4%-72,6% 68,0%-72,0% 68,3%-71,7% 68,8%~71,2% 80% 77,7%-82,3% 78,2%-81,8% 78,5%-81,5% 79 <0%-81,0% 90% 88,3%-91 /7% 88,7%-91,3% 88,9%-91,1% 89,3%-90,7% 95% 93,7%-96,3% 94,1%-95,9% 94,2%-95,8% 94 /4%_95,6% 6. Táblázat Egy 2000 elemű minta várható teljesítménye Mintanagyság: 3000 Valódi arány a népességben Megfigyelt arány a minták 99%-ában Megfigyelt arány a minták 95%-ában Megfigyelt arány a minták 90%-ában Megfigyelt arány a minták 75%-ában 5% 4,0%-6,0% 4,2% 5,8% 4,3%-5,7% 4,5%-5,5% 8,6% 11,4 8,9% 11,19 10% % 6 9,1%-10,9% 9,4%-10,6% 20% 18,1 % 21,9% 18,6%-21,4% 18,8%-21,2% 19,2%-20,8% 30% 27,8%-32,2% 28,4%-31,6% 28,6%-31,4% 29,0%-31,0% 40% 37,7%-42,3% 38,2%-41,8% 38 /5%-41,5% 39,0%-41,0% 50% 47,6%-52,4% 48,2%-51,8% 48,5%-51,5% 48,9%-51,1% 60% 57,7%-62,3% 58,2%-61,8% 58,5%-61,5% 59,0%-61,0% 70% 67,8%-72,2% 68,4%-71,6% 68,6%-71,4% 69,0%-71 /0% 80% 78,1 %-81,9% 78,6%-81,4% 78,8%-81,2% 79,2%-80,8% 90% 88,6%-91,4% 88,9%-91,1% 89 /1%-90,9% 89,4%-90,6% 95% 94,0%-96,0% 94,2% 95,8% 94,3%-95,7% 94,5%-95,5% 7. Táblázat Egy 3000 elemű minta várható teljesítménye Ezekben a táblázatokban az látható, hogy különböző valós (tehát az egész népességre vonatkozó) értékek esetén, 100, 500, 1000, 2000 és 3000 nagyságú minták esetén a mintából becsült 35