Kutatásmódszertan és prezentációkészítés 9. rész: Mintavétel a gyakorlatban Szerzők: Kmetty Zoltán és Sztárayné Kézdy Éva Lektor: Fokasz Nikosz
Kilencedik rész Mintavétel a gyakorlatban
Tartalomjegyzék Bevezetés EVM Szisztematikus mintavétel Rétegzett mintavétel Többlépcsős mintavétel I Többlépcsős mintavétel II Többlépcsős mintavétel III Nem arányos kiválasztás és súlyozás Nem válaszolás és súlyozás I Nem válaszolás és súlyozás II Nem valószínűségi mintavételi módszerek A nem valószínűségi mintavétel előnyei és hátrányai Nem valószínűségi mintavétel a kvantitatív kutatásokban 1. Kvótás mintavétel 2. Szakértői mintavétel 3. Egyszerűen elérhető alanyokra hagyatkozó mintavétel 4. Hólabda módszer/rds 5. Önkiválasztós módszer A nem valószínűségi mintavétel típusai a kvalitatív kutatásokban Célirányos mintavétel fajtái 1. Célirányos mintavétel fajtái 2. Felhasznált irodalom
Bevezetés A korábbi egységekben már érintettük a mintavétel problémakörét A 8. unitban részletesen foglalkoztunk azzal, hogy a mintákból kapott eredmények, milyen módon terjeszthetők ki a teljes sokaságra. Ebben a részben megismerkedünk két nagy mintavételi osztállyal, a valószínűségi mintavételi eljárásokkal, és a nem valószínűségi mintavételi eljárásokkal. Statisztikai következtetések levonásához, csak a valószínűségi mintavételi eljárások alkalmasak - bár egyes nem valószínűségi mintavételi eljárásoknál is kialakítottak már komoly statisztikai eszköztárat és azokon belül is csak azon minták, amik megfelelnek a reprezentativitás kritériumának. Abban az esetben nevezhetünk egy mintát reprezentatívnak, ha a sokaság (szaknyelven populáció), minden egyes tagjának a mintába kerülési valószínűsége ismert és nem nulla.
EVM A valószínűségi mintavételi eljárások során a populációból egy véletlen algoritmus segítségével kiválasztjuk a mintába kerülő személyeket. Az itt bemutatott módszerek nem magukban alkalmazandók, hanem részben egymásra épülnek, és együttesen is alkalmazhatók. EVM A valószínűségi mintavételi eljárások közül a legegyszerűbb az egyszerű véletlen kiválasztás módszere. Ehhez rendelkeznünk kell a populáció tagjairól egy listával, amiben szerepel mindenki a sokaságból. Ezt nevezzük mintavételi keretnek. A mintavételi keret a legtöbb esetben sajnos nem fedi le a teljes populációt, ami sérti a reprezentativitás kritériumát, de a kutatások legtöbb esetben behatároltak ebben a tekintetben. Az EVM mintavétel során a listából véletlenszerűen kiválasztunk annyi esetet, ahány főre a mintában szükségünk van. Tehát, ha egy adott egyetemről szeretnék 100 embert megkérdezni, akkor elkérjük a Tanulmányi Osztálytól az egyetem hallgatóinak névsorát, és véletlenszerűen kiválasztunk belőlük 100 főt.
Szisztematikus mintavétel A szisztematikus mintavételhez ugyanúgy rendelkeznem kell mintavételi kerettel. Azonban a mintavételi keretből nem véletlenszerűen választom ki a bekerülőket, hanem minden X-ik esetet választom ki. Ha a szisztematikus mintavétel előtt véletlenszerűen sorba rendezem a sokaságot, akkor statisztikailag ugyanolyan véletlen mintát kapok, mint az EVM esetében. Azonban egyes esetekben lehet annak haszna, ha a listánk előzetesen már sorrendbe van állítva valamilyen szempont szerint. Ezzel gyakorlatilag rétegezni tudom a mintámat (lásd később). Ha például az egyetemi listámat úgy állítom sorrendbe, hogy az évfolyamok egymást kövessék, és az ugrásköz elég hosszú ahhoz, hogy végigérjen a teljes sokaságon, akkor biztosítani tudom azt is, hogy minden évfolyamból annyi ember legyen megkérdezve, ahány oda jár. Ezzel a mintavételi hiba problémáját ki tudjuk küszöbölni az évfolyamok vonatkozásában. A sorba rendezett lista azonban bizonyos esetekben problémákhoz is vezethet. Erre példa az a II. világháborús kutatás, amelyben a katonákból szerettek volna mintát venni. A mintavételi keret úgy volt sorrendbe állítva, hogy minden tízedik személy őrmester volt rajta. Mivel a szisztematikus mintavétel során is pont tíz egységgel számoltak a kutatásban, csak őrmesterek kerültek a mintába.
Rétegzett mintavétel A rétegzett minta az EVM, és a szisztematikus mintavétel alkalmazásának egy módosított verziója. Az EVM, bár reprezentatív a sokaságra, de minden változó esetében terhelt a mintánk a mintavételi hibával. Ha a populáció egyes arányait előre ismerjük, akkor kialakíthatjuk, úgy a mintavételünket, hogy előre meghatározzuk az egyes csoportok nagyságát, és ezen csoportokon belül veszünk véletlen mintákat. Tehát a korábbi példánkat tovább vezetve előre meg tudjuk határozni, hogy az egyes évfolyamokba hány ember jár. Ez alapján kiszámoljuk, hogy évfolyamonként hány embernek kell bekerülnie ahhoz a mintánkba, hogy minden évfolyam arányosan reprezentálja magát. Ezt követően évfolyamonként választjuk ki a bekerülőket, valamilyen véletlen eljárással. Azon változók esetében, amelyeket fontosnak gondolunk a kutatás kapcsán érdemes rétegeznünk. Ezt azonban csak olyan változók esetében tudjuk elvégezni, amelynek tudjuk a pontos sokaságbeli megoszlását, és amelyek esetében van információnk arról, hogy a minta tagjai milyen kategóriába tartoznak a változó mentén.
Többlépcsős mintavétel I Egyes társadalomtudományi kutatások esetében bizonyos hátrányokkal jár, az EVM minta használata. Ezt a következő példa egyszerűen szemléltetni tudja. Szeretnénk egy olyan személyes megkérdezésen alapuló kutatást végezni, ami egész Magyarországot reprezentálja. Tételezzük fel, hogy létezik egy olyan listánk, ami az összes 18 évesnél idősebb magyar személyt tartalmazza. Ha EVM mintavételt használnánk, akkor a gyakorlatban a kérdezőbiztosainknak, megközelítőleg 500 településre kellene kimennie. Ez kutatásmenedzsment szempontból nagyon megterhelő, és a kutatás költségszintjét is jelentősen megemeli, ezért nehezen megvalósítható. Ilyen esetekben a kutatók többlépcsős mintavétel mellett szoktak dönteni. Az első lépcsőben kiválasztják azokat a településeket, amik bekerülnek a mintába, majd a második lépcsőben a kiválasztott településekről vesznek egy véletlen mintát a lakosokból. Tehát a gyakorlatban két mintavételt valósítanak meg. A nehézséget ebben az esetben az okozza, hogy előre meghatározzuk, azokat a valószínűségeket, amivel a települések, és a településen belül a személyek (vagy háztartások) a mintába kerülnek.
Többlépcsős mintavétel II Az előző példát tovább vezetve, kétlépcsős települési minta esetén azt az elvet szokták követni, hogy az első lépcsőben a települések mintába kerülési valószínűsége a település nagysággal arányos, majd a második lépcsőben a településekről ugyanannyi személyt kérdeznek le. Ez statisztikailag jó megoldáshoz vezet, azonban a gyakorlatban nem feltétlen jó megoldás, a nagyon eltérő településnagyságok miatt. Ezért az ilyen típusú mintavételeknél még két elvet szoktak követni. Egyrészről a nagyobb települések (főváros, megyeszékhelyek), önreprezentálóak, tehát mintegy külön rétegként működnek, és nem kerülnek be a többlépcsős mintavételbe. Másrészről a kutatók ki szoktak alakítani település nagyság szerinti rétegzést, és ezen rétegeken belül választják ki a településeket. Ez a módszer a gyakorlatban pontosabb és jobb mintákhoz vezet.
Többlépcsős mintavétel III A másik nagy kérdés, hogy hány települést válasszunk ki, és a településeken belül hány főt kérdezzünk le. Erre nehéz általános választ adni, mivel egyrészről a sok település költség szinten drága, a kevés település viszont rontja a mintánk illeszkedését a teljes sokaság arányaihoz képest. Ennek az az elsődleges oka, hogy a statisztikai próbák és magának a mintavételi hiba kiszámítása is azon az alapelven nyugszik, hogy a mintába került személyek függetlenek egymástól. Mivel egy településen belül nagyobb valószínűséggel jelennek meg a hasonló emberek, ezért ez a függetlenség valamennyire sérül. Ezt nevezik design-hatásnak a kutatásokban. Arra mindenképpen érdemes figyelni, hogy egy településen legalább 5-10 kérdezett legyen. 1000 fős országos kutatások esetén, 100-120 településről szokták a mintát általában kiválasztani.
Nem arányos kiválasztás és súlyozás Bizonyos esetekben külső körülmények miatt, vagy a kutató döntése alapján az egyes esetek mintába kerülési valószínűsége nem egyenlő már a mintavétel tervezésekor sem. Például kutatásunk szempontjából különleges fontosságú, hogy a Budapestiek véleményét részletesen megismerjük, ezért úgy tervezzük az 1000 fős mintánkat, hogy 500 fő kerül bele Budapestről, és 500 fő vidékről. Egyértelmű, hogy ha a teljes magyar lakosságra szeretnénk állításokat megfogalmazni a mintánkból, akkor ez az allokáció nem szerencsés, mivel a Budapestiek véleménye túl lesz reprezentálva a mintába. Ilyenkor az elemzés során a súlyozás módszerét tudjuk használni. A súlyozás azt jelenti, hogy a válaszok kiértékelésénél nem mindenkit veszünk ugyanolyan súllyal figyelembe. A mi példánkban egy Budapesti személy súlyszáma 1 alatt lenne, egy vidéki személy súlyszáma pedig 1 felett. Tehát a teljes sokaságra tett megállapításaink esetében kisebb arányban vennénk figyelembe a mintába került Budapestiek véleményét. A mintavételi torzítást kiküszöbölő korrigálást designsúlynak nevezzük.
Nem válaszolás és súlyozás I A társadalomtudományi kutatásokban fel kell arra készülnünk, hogy nem minden kiválasztott eset fog majd a kutatásunkban részt venni. A kiválasztott esetek egy része nem elérhető (pl: elköltözött), más része pedig egyszerűen nemet mond a kutatásunkra. Ennek a kezelésére, már a mintavétel során fel kell készülnünk. Erre több módszer is lehetőséget ad. A leggyakoribb a pótcímezés módszere. Ez azt jelenti, hogy ha egy kiválasztott eset lekérdezése valamilyen oknál fogva meghiúsul mintavételi szempontból, akkor helyette a pótcímen kell a kutatást lekérdezni. Bármilyen körültekintőek legyünk is, a kapott mintánk nem fog illeszkedni, minden általunk fontosnak tartott változó mentén a teljes sokaságra. Ez részben abból is adódik, hogy a mintavétel során nem tudunk minden olyan szempontot figyelembe venni a tervezéskor, ami az elemzés kapcsán azonban fontos számunkra. Például az iskolai végzettség szerinti megoszlás általában fontos elemzési kritérium, azonban mivel a mintavételi keret szintjén erről nincs információnk, ezért a mintavételbe nem tudjuk alkalmazni.
Nem válaszolás és súlyozás II A nem válaszolásnak lehetnek olyan szisztematikus torzítási mechanizmusai is, amin a pótcímezés sem segít (hiszen a pótcímek kijelölésénél csak 1-2 szempontot tudunk figyelembe venni (pl. a kérdezett korcsoportja és neme). Az ilyen jellegű torzításokat szintén tudjuk valamilyen mértékben kezelni az elemzés során. Azon változók esetében, amelyeknek ismerjük a populációs megoszlását, ki tudjuk számolni, hogy a mintában hány százalékban kellene, hogy előforduljanak. Ez pedig lehetőséget ad arra, hogy a korábban már ismertetett súlyozás módszerét kiterjesszük, erre a problémára is. Különböző algoritmusok alapján (amik legtöbb esetben valamilyen iteratív eljáráson alapulnak), úgy állítjuk be a válaszolók súlyszámait, hogy az általunk kiválasztott változókra, a súlyozott minta összetétele minél pontosabban illeszkedjen.
Nem valószínűségi mintavételi módszerek A társadalomtudományos kutatások során azonban nem minden esetben van lehetőség valószínűségi mintavételi eljárással dolgozni, ill. vannak olyan kutatási kérdések, amelyek megválaszolásához nem célszerű vagy szükségszerű a valószínűségi mintavétellel kiválasztott reprezentatív minta vizsgálata. Kvantitatív kutatások esetén, ahol számszerűsíthető, kemény adatokat gyűjtünk, célunk az, hogy egy viszonylag kisebb számú reprezentatív minta eredményeit általánosítani tudjuk a teljes alapsokaságra vonatkozóan. Azonban nem minden esetben áll rendelkezésünkre a teljes populációról egy lista, amelyből reprezentatív mintát tudnánk venni. Ilyen esetben alkalmazzuk a nem valószínűségi mintavételi módszereket. Kvalitatív kutatások esetén pedig mivel a kutatás célja a jelenségek mélyebb értelmének feltárása, megértése, az egyes emberek saját, egyéni tapasztalatai, életútja által is befolyásolt véleményének, attitűdjének megismerése, amelyre nem alkalmasak a nagymintás kvantitatív kutatások általában nem használják a valószínűségi mintavételi módszereket. l. 3. unit
A nem valószínűségi mintavétel előnyei és hátrányai: nem jutunk reprezentatív mintához ezért eredményeink nehezen általánosíthatóak viszont eredményeink érvényessége magas kisebb létszámú, kontextusba ágyazott minta kiválasztására alkalmas a kvalitatív kutatásokban
Nem valószínűségi mintavétel a kvantitatív kutatásokban: 1. Kvótás mintavétel 2. Szakértői mintavétel 3. Egyszerűen elérhető alanyokra hagyatkozó mintavétel 4. Hólabda módszer/rds 5. Önkiválasztós módszer
1. Kvótás mintavétel Kvótás mintavétel esetén reprezentatív mintára törekszünk, azonban nem áll rendelkezésünkre egy lista az alapsokaságról, viszont ismerjük az alapsokaság struktúráját (pl. megbízható, hiteles népszámlálási adatok alapján). Kiindulópontunk egy, a sokaságot a kutatás szempontjából fontos változók szerint, pl. nem, életkor, iskolai végzettség, településtípus, stb. leíró táblázat (mátrix). Ha ismerjük a mátrix egyes celláiba tartozók arányát, a mintánkat úgy választjuk ki, hogy az egyes cellába az alapsokaság arányainak megfelelő számú válaszadó kerüljön lehetőleg úgy, hogy a válaszadók mintába kerülése véletlenszerűen történjen. Tehát a mintánk követi a teljes populációt jellemző arányokat. (Babbie 2008.: 207., Héra-Ligeti 2005: 66-68.) Kvótás mintavétel segítségével jósolta meg sikeresen 1936-ban az akkor fiatal kutató, Georg Gallup és intézete Roosevelt győzelmét az amerikai elnökválasztáson. (Babbie 2008.: 204.) http://www.gallup.com/corporate/21364/george-gallup-19011984.aspx
2. Szakértői mintavétel Bizonyos esetekben akkor jutunk kutatási kérdésünk megválaszolásához legmegfelelőbb mintához, ha annak alapján választjuk ki a mintát, amit a populáció elemiről előzetesen tudunk. Például egy hallgatói tiltakozó csoport vezetőit szeretnénk megkérdezni, akikről ugyan nem áll rendelkezésünkre lista, viszont jól felismerhetőek. (Babbie 2008: 206.) Vagy egy kérdőívet szeretnénk előzetesen tesztelni a legkülönbözőbb válaszadókon.
3. Egyszerűen elérhető alanyokra hagyatkozó mintavétel Szintén kérdőívek előzetes tesztelésére alkalmas módszer, mikor azokat kérdezzük meg különösebb megfontolás nélkül akiket a legegyszerűbb elérni: szomszédaink, barátaink, virtuális ismerőseink, oktatók hallgatói csoportjai stb., A kutatás más szakaszában alkalmazása kerülendő (!), mert bár kényelmes, olcsó és egyszerű módszer (éppen ezért szak- és évfolyamdolgozatokhoz használt önálló kutatások esetén csábító lehetőség), mintánk nem lesz reprezentatív, továbbá általánosítható, megbízható és érvényes eredményre ritkán vezet.
4. Hólabda módszer/rds A hólabda módszert akkor alkalmazzuk, ha egy nehezen elérhető társadalmi csoportot (ún. rejtett populációt) szeretnénk vizsgálni, amelynek tagjairól nem létezik, vagy nem áll rendelkezésünkre lista vagy nyilvántartás. Például stigmatizált kisebbségek, hajléktalanok, droghasználók, különböző bűnözői csoportok, illegális bevándorlók, kisebb vallási közösséghez tartozók, arisztokraták, stb. Amennyiben a vizsgálni kívánt csoport egyik/néhány tagját sikerül rávenni a kutatásban való részvételre, adatokat gyűjtünk, majd megkérjük, hogy adják meg még más, a célzott populációba tartozó személyek elérhetőségét. (Schleicher 2007: 20.) A mintánkat tehát úgy gyűjtjük, ahogy a hólabda növekszik. Az RDS (válaszadó vezérelt mintavétel) a hólabda mintavétel egy speciális változata. Az RDS mintavétel bizonyos esetekben lehetőséget biztosít arra is, hogy a teljes sokaságra tegyünk megbízható állításokat belőle. Elsősorban feltáró kutatásokban alkalmazzák.
5. Önkiválasztós módszer Az önkiválasztós minta esetében nem a kutató választja a mintát, hanem a válaszadók önként jelentkeznek a részvételre. Például a rádió és tv betelefonálós műsorai, sms-es szavazásai, internetes szavazások, stb. Az ilyen mintavételen alapuló kutatások úgynevezett pszeudo felmérések, tudományos értékük nincs, mivel eredményeit semmiképpen nem vetíthetjük ki semmilyen nagyobb populációra, akármilyen magas a válaszadók száma.
A nem valószínűségi mintavétel típusai a kvalitatív kutatásokban 1. Hólabda módszer 2. Önkiválasztós módszer 3. Kényelmi módszer (egyszerűen elérhető alanyokra hagyatkozó mintavételt a kvantitatív kutatásoknál) A kényelmi módszer ritkán indokolható elméleti szempontból. Pl. saját családunk, vagy volt osztálytársaink kutatása esetén (Neményi 1999.) 4. Célirányos/elméletvezérelt mintavétel (l. a szakértői mintavételt a kvantitatív kutatásoknál) (Schleicher 2007: 18-20., Miles-Huberman 1994.) Kvalitatív kutatások esetén a leggyakrabban alkalmazott módszer a célirányos mintavétel. Ebben az esetben a kiválasztás elve a kutatás céljától, ill. az alkalmazni kívánt elmélettől függ. A mintánkat célirányosan választjuk, nem véletlenszerűen, így elméletileg orientált, nem reprezentatív mintához jutunk. Azt feltételezzük, hogy az így kiválasztott mintánk a kutatott téma, ill. probléma lehető legmélyebb megértését fogja szolgálni.
Célirányos mintavétel fajtái 1. 4.1. Homogén mintavétel esetén a mintánkba bizonyos szempont(ok)ból azonos vagy hasonló egyedeket válogatunk (pl. nem, kor, társadalmi státusz, iskolai végzettség, stb.) Például fókuszcsoportos kutatás esetén a kutatás tárgyával kapcsolatos élmény szempontjából csoport homogenitása vezérelv (de nem kizárólagos!) a tagok kiválasztásánál. (Síklaki 2006: 70.) l. 5. unit fókuszcsoport 4.2. Heterogén mintavétel esetén a célunk az, hogy a mintánkba minél több, a kutatás szempontjából fontos szempont/változó szerint különböző alany kerüljön. Ha például televíziós hírműsorokat vizsgálunk, érdemes kereskedelmi és közszolgálati, minőségi és bulvár, valamint különböző politikai beállítottságú csatornák híreit beválogatni mintánkba. 4.3. Extrém esetek kiválogatása során a vizsgált jelenség szokatlan megjelenéséből próbáljuk a jelenséget megérteni. Például a társadalom legszegényebbjeinek, vagy leggazdagabbjainak attitűdjére vagyunk kíváncsiak egy bizonyos kormányzati intézkedéssel kapcsolatban.
Célirányos mintavétel fajtái 2. 4.4. Kritikus esetek kiválogatása során olyan eseteket vizsgálunk, amelyek az adott jelenség szempontjából kritikus hatással, következménnyel bírnak. Erre legjobb példa Gyurcsány Ferenc 2006-os ún. balatonőszödi beszéde, amely a politikusi beszédek közül kulcsfontossággal bírt a politikai közbeszéd, valamint a közélet alakulására. http://www.youtube.com/watch?v=wrafsbcnrl8 4.5. Tipikus esetek kiválogatása esetén a normális, átlagos jelenséget keressük. Mintánkba olyan egyedeteket válogatunk, amelyek semmilyen szempontból nem térnek el az átlagtól. Piackutatók például elsősorban a tipikus, átlagos fogyasztókat vizsgálják egy-egy termék tesztelése során. 4.6. Deviáns esetek kiválogatása esetén a tipikus esetekkel ellentétben éppen azokat választjuk mintánkba, akik az átlagostól, tipikustól eltérőek. Kvalitatív kutatások esetén a vizsgált jelenség jobb, pontosabb megértéséhez sokszor érdemes (és ajánlott) a deviáns, a szabályosnak tekintett attitűdöktől, magatartásoktól eltérő eseteket is megvizsgálni, megfigyelni. Pl. a Facebook-jelenség jobb megértéséhez hozzásegíthet minket a közösségi portálokon tudatosan nem regisztráló fiatalokat is megfigyelni. l. 5. unit
Felhasznált irodalom: Babbie, Earl: A társadalomtudományi kutatás gyakorlata. Budapest, Balassi Kiadó, 2008. ISBN: 978-963-506-764-0 Héra Gábor Ligeti György: Módszertan. A társadalmi jelenségek kutatása. Budapest, Osiris, 2005. ISBN: 963-389-788-2 Hoffman Márta Kozák Ákos Veres Zoltán: Piackutatás, Műszaki könyvkiadó 2000 Letenyei László: Településkutatás. Ráció Kiadó, Budapest, 2005. 9639457 914 Miles, Matthew B. Huberman A. Michel: Qualitative Data Analysis. Sage, London, 1994. Neményi Mária: Csoportkép nőkkel. Budapest, Új Mandátum, 1999. Schleicher Nóra: Kvalitatív kutatási módszerek a társadalomtudományokban. BKF jegyzet. Századvég, Budapest. 2007. ISBN: 963 734053 6 Siklaki István: Vélemények mélyén. A fókuszcsoport módszer a kvalitatív kutatás alapmódszere. Kossuth Könyvkiadó, Budapest, 2006. 9630948575