A Magyar Választáskutatási Panel 2008-2009: a paneltagságot meghatározó tényezők többszempontú elemzése Készült a Demokrácia Kutatások Magyar Központja Alapítvány (DKMKA) megbízásából A Magyar Választáskutatási Program (MVP) keretében a Részvétel és képviselet projekt keretében, melyet a Norvég Alap támogat 2009 1
Tartalom Bevezetés... 2 A paneltagok és a nem-paneltagok összehasonlítása... 6 Deskriptív elemzés... 6 Többváltozós modellek a paneltagság magyarázatára... 8 Összefoglalás... 11 Függelék... 12 1. sz Függelék: TÁRKI Felkérő levél 2008... 12 Táblázatok jegyzéke... 13 Bevezetés 2008-ban és 2009-ben a TÁRKI Társadalomkutatási Intézet Zrt. (TÁRKI Zrt.) a DKMKA megbízásából a Medián Kft-vel és a Szonda-Ipsos Kft-vel közösen végezte el a Magyar Választáskutatási Panel kutatás első két hullámának adatfelvételét. A kutatásra a Magyar Választáskutatási Program (MVP) keretében került sor. Az adatfelvétel mintavételi eljárását, a módszertant és a kérdőíveket az MVP Tématanácsa dolgozta ki. A vizsgálat terepmunkáját három kutatóintézet végezte el összehangoltan. 2008-ban a kiinduló címlistát a Központi Nyilvántartó és Választási Hivatal az adatvédelmi törvény rendelkezéseinek betartásával véletlenszerűen választotta ki adatbázisából. A vizsgált népesség a magyarországi állandó lakhellyel rendelkező 18 éves és idősebb népesség, vagyis összhangban a kutatás témájával a magyarországi szavazó korú személyek. A kiválasztáshoz a településenként kiválasztandó személyek számát a Tématanács határozta meg. Összesen 4650 személy címe szerepelt a 2008-as kiinduló mintában. A mintavétel tehát kétlépcsős arányosan rétegzett mintavételi eljárás volt. Első lépésben meghatároztuk a településeket településrétegenként (főváros, nagyváros, egyéb), majd a településekről a Választási Hivatal egyszerű véletlen mintavételi eljárással választotta ki a neveket és a címeket. A kiadott 4650 alapcímből 2313 sikeres interjú készült el 2008-ban. Ez 50 százalékos válaszadási arányt jelent. A válaszadási arányt csökkenthette, hogy a kutatás kérdőíve mindkét évben meghaladta átlagosan az egy órát. Ugyancsak szerepet játszhatott az, hogy a 2
kérdezettek olyan felkérőlevelet kaptak, amely többéves kutatásra szólt, nem csak egyszeri alkalomra (vö. 1. sz. Függelék). Ezt úgy tűnik az sem tudta ellensúlyozni, hogy a válaszoló személyek csekély értékű motivációs ajándékot egy www.valasztaskutatas.hu feliratos LED kulcstartó-lámpát kaptak. A kellő esetszám biztosításához a kiesett alapcímeket véletlen sétás pótmintavételhez használtuk fel. A véletlen séta algoritmusa mindhárom cégnél azonos volt. (Ezt egyébként a Medián Kft. Munkatársa Karácsony Gergely dolgozta ki.) 809 esetben készült pótmintán 2008-ban adatfelvétel. A sikeres interjúk végén a megkérdezettek nyilatkoztak arról, hogy hajlandóak ( biztosan vagy talán ) a következő évben újra részt venni a kutatásban, vagy nem ( elzárkózók ). A 3122 főből eleve elzárkózó volt 897 fő, a teljes minta 29 százaléka. Őket tehát 2009-ben már nem tudtuk újra megkeresni. 2009-ben 2225 olyan potenciális paneltag volt, akit újra megkereshettünk a kutatás keretében. Ebben a körben 68 százalékos sikeres lekérdezési arányt értünk el, ami 1523 fős panelminta kialakítását teszi lehetővé. (vö. 1. táblázat) A 2009-es adatfelvétel során is sor került pótmintán történő kérdezésre. A pótminta kialakításához a 2008-ban fel nem használt (sikertelenül keresett) címeket használtuk fel, véletlen sétával történő kiválasztás kiindulópontjaként. A pótcímeket a részleadások tapasztalatai, összesítései alapján területileg kvótáztuk, hogy tekintettel a nagyvárosokban mutatkozó nagyobb arányú panelkopásra ellensúlyozni tudjuk a településtípus szerinti torzulást. A rendelkezésre álló 2008-as kiesett alapcímekből 551 nagyvárosi címet használtunk fel az 1457 pótcímen belül. 3
1. táblázat 2008-as alapcímek felhasználása és a keresztmetszeti minták összetétele címforrás szerint 2008 alapcímek 2008 pótcímek N 2008-ban 2009-ben lekérdezték lekérdezték 2008-ban kiesett, 2009-ben fel 880 nem használt cím (tartalékcím) 2008-ban kiesett cím, de 2009-1457 1457 ben véletlen séta kiindulópont 2008-ban és 2009-ben is 1320 1320 1320 paneltag alapcím 2008-ban alapcím, de 2009-ben kiesett 526 526 2008-ban alapcím, de elzárkózó 467 467 2008-ban véletlen sétás pótcím, 203 203 203 2009-ben lekérdezett 2008-ban véletlen sétás pótcím, 176 176 de 2009-ben kiesett 2008-ban véletlen sétás pótcím, 430 430 de elzárkózó Összesen 5459 3122 2980 A következőkben a Magyar Választáskutatási Panel összevont kumulált adatbázisát használjuk fel, amely fájl tartalmazza azokat az eseteket, melyeket legalább egyszer sikeresen lekérdeztek a kutatóintézetek munkatársai (N=4579). A két keresztmetszeti minta összesített esetszáma a paneltagok átfedése miatt ennél értelemszerűen nagyobb, 3122 plusz 2980 azaz 6102. Ebből azonban le kell vonni a két alkalommal kérdezett panelminta tagjainak számát (N=1523). Az MVP összevont kumulált adatbázisában tehát nem szerepelnek az egyik évben sem felhasznált 2008-as alapcímek (N=880). A panelminta kutatóintézetek szerinti összetételét az 1. ábra mutatja. A keresztmetszeti minták összetétele panel- és kiegészítő minták szerint kutatóintézeti bontásban a 2. táblázat tartalmazza. 4
1. ábra Az 1523 fős panelminta megoszlása kutatóintézetenként (fő) 512 542 469 TÁRKI Medián Szonda 2. táblázat Panelminta és a kiegészítő minták nagysága (fő) kutatóintézetenként Keresztmetszeti Keresztmetszeti Pótminta, minta nagysága Pótminta minta nagysága Panelminta 2008 összesen 2008 2009 összesen 2009 TÁRKI 542 470 1012 449 991 Medián 469 639 1108 505 974 Szonda 512 490 1002 503 1015 Összesen 1523 1599 3122 1457 2980 5
A paneltagok és a nem-paneltagok összehasonlítása Deskriptív elemzés A következőkben a 2008-as (súlyozatlan) keresztmetszeti mintán azt vizsgáljuk, hogy a paneltagok (akik 2009-ben is részt vettek a vizsgálatban) és a nem-paneltagok milyen szempontok szerint különböznek. Elsőként a szokásos sztenderd társadalmi-demográfiai változók, valamint a lakókörnyék társadalmi státusza szerinti megoszlásokat vizsgáljuk. Ezek a következők: nem (férfi, nő); életkor (18-29 éves, 30-44 éves, 45-59 éves, 60+éves); iskolai végzettség (max. általános, szakmunkás, érettségizett, diplomás); gazdasági aktivitás (dolgozik, nem dolgozik); etnikai háttér (roma, nem-roma); településtípus (Budapest, megyeszékhely, város, község), lakókörnyék státusza (3 dichotóm változó) o értékes terepjáró parkolt, nem parkolt értékes terepjáró o villa o panellakás Az elemzésbe bevontuk továbbá a politikai involváltságot jelző szavazási hajlandóságot mérő változónkat. Politikai involváltság (nem- biztos szavazó, biztos szavazó ). A 3. táblázat mutatja a fenti változók megoszlását a paneltagság szerint. Nem mutatkozik jelentős különbség nem, életkor, iskolai végzettség és gazdasági aktivitás szerint. Viszont viszonylag nagyobb különbségek mutatkoznak az etnikai háttér szerinti bontásban. A roma megkérdezettek 60 százaléka paneltag, míg a nem-romák körében ez 48 százalék. A legnagyobb arányú különbségeket a településtípus szerint találjuk: a fővárosban nagyon alacsony a paneltagok aránya (27%). A megyeszékhelyeken is átlag alatti, míg a kisebb városokban (59%) és a községekben (62%) átlag feletti a panelmintába bevont személyek aránya. A magasabb lakóhelyi státuszt jelző két indikátorunk szerint (értékes parkoló autók a 6
lakóhely környékén és villa jellegű lakóház) alacsonyabb paneltagságot valószínűsítenek. Ugyanakkor némiképp meglepő módon a panellakás is ugyanebbe az irányba hat: a panelekben élők körében alacsonyabb a panelkutatásban résztvevők aránya. Ez arra mutat, hogy nem biztos, hogy státuszhatással van dolgunk, hanem kérdezéstechnikai, demoszkópiai szempontok játszanak szerepet ezekben az esetekben. A kutatás témája, a politikai attitűdök és a szavazói magatartás is nyilvánvalóan befolyásolta a kutatásban való részvételi hajlandóság mértékét. A nagyobb fokú politikai involváltság nagyobb arányú paneltagsággal járt együtt. 3. táblázat A paneltagok aránya különböző társadalmi-demográfiai csoportokban (%)* nem életkor iskolai végzettség gazdasági aktivitás etnikai háttér településtípus Lakóhely társadalmi státusza: (1) értékes autók parkolnak a környéken (2) villa jellegű ház (3) panelházban van a lakás nempaneltag paneltag Összesen Átlagosan 51,2% 48,8% 100,0% férfi 51,0% 49,0% 100,0% nő 51,4% 48,6% 100,0% 18-29 éves 49,6% 50,4% 100,0% 30-44 éves 52,3% 47,7% 100,0% 45-59 éves 50,2% 49,8% 100,0% 60+ éves 52,0% 48,0% 100,0% max. általános 46,8% 53,2% 100,0% szakmunkásképző 48,9% 51,1% 100,0% középfokú 54,4% 45,6% 100,0% felsőfokú 54,7% 45,3% 100,0% nem dolgozik 49,7% 50,3% 100,0% dolgozik 52,8% 47,2% 100,0% nem-roma 51,7% 48,3% 100,0% roma 39,7% 60,3% 100,0% Budapest 72,9% 27,1% 100,0% megyeszékhely 57,2% 42,8% 100,0% város 41,4% 58,6% 100,0% község 37,9% 62,1% 100,0% nem parkol értékes 50,1% 49,9% 100,0% terepjáró a környéken értékes terepjáró parkol 62,9% 37,1% 100,0% nem villalakás 51,2% 48,8% 100,0% villalakás 56,4% 43,6% 100,0% nem panellakás 48,5% 51,5% 100,0% panellakás 63,5% 36,5% 100,0% 7
politikai involváltság nempaneltag paneltag Összesen Átlagosan 51,2% 48,8% 100,0% nem "biztos szavazó" 57,1% 42,9% 100,0% "biztos szavazó" 46,7% 53,3% 100,0% * Megjegyzés: MVP Panel, 2008-as keresztmetszeti alminta, N=3122. Többváltozós modellek a paneltagság magyarázatára Annak érdekében, hogy a statisztikailag szignifikáns, független hatásokat modellezni tudjuk, többváltozós statisztikai elemzést (logisztikus regresszió analízist) végeztünk. A magyarázandó, függő változónk a paneltagságot jelző dichotóm változónk volt, míg a független változók az előzőekben felsoroltak voltak. Az elemzés eredményét a 4. táblázat mutatja. Összességében a modell magyarázóereje nem túl erős. Az esetek 63 százaléka sorolható be helyesen a függő változó kategóriáiba a logisztikus regresszió egyenlet alapján. Ha véletlenszerűen tesszük a függő változó ismert eloszlása alapján, akkor ez az arány 51 százalék lett volna. A modell segítségével tehát 12 százalékpontot javítottunk a helyes besorolás arányán. Ezt tükrözi lényegében a Nagelkerke-féle R 2 mutató 11 százalékos értéke is. A legfőbb tanulság a vizsgált magyarázó változók vonatkozásában az, hogy egyetlen társadalmi-demográfiai változó hatása bizonyult statisztikailag szignifikánsnak. Ez a településtípus. Hasonló erejű, jelentős hatásként volt azonosítható a politikai involváltság hatása is. Ez alapján az mondható, hogy a kérdezett lakóhelyének településtípusa és a kérdezett politikai érdeklődése, involváltsága alapján lehet a legpontosabban előre jelezni, hogy a kutatás panelmintájában szerepelni fog, vagy csak egyetlen alkalommal sikerül bevonni a kutatásba. E két tényező hatását érdemes lesz a későbbiekben részletesebben vizsgálni. Most egy leegyszerűsített modellt fogunk bemutatni, melyben csak a szignifikáns hatással szereplő változók fognak szerepelni. Annyiban változtatunk a magyarázó változók körén, hogy a településtípust dummy (dichotóm) változók segítségével mérjük. Referenciakategóriaként a községek kategóriája szolgál. Az eredményeket a 5. táblázat mutatja. 8
A leegyszerűsített modell magyarázóereje nem változott: továbbra is 11-12 százalékpontot jelent, ha a magyarázó változók bevonásával szeretnénk előre jelezni a paneltagságot. Figyelembe véve, hogy mindössze két tényezőről van szó, ez a nyereség nem elhanyagolható, különösen annak függvényében, hogy a településtípus olyan változó, amely a kutatás tervezése során előre figyelembe vehető. A leegyszerűsített modellből az is kiderült, hogy a kisebb városokban élők részvételi hajlandósága nem különbözik lényegesen a községekben élőkénél. Megfontolandó tehát, hogy a két kategóriát (város, község) a későbbi vizsgálatok előkészítése azaz a kiegészítő minta tervezése során összevontan kezeljük. Fontos megjegyezni, hogy a panelminta terv szerint lett torzított a községek irányában, hiszen a kiegészítő mintavétel tervezése során felülreprezentáltuk a nagyvárosi pótcímeket. A politikai involváltság hatását viszont előre nem tudjuk figyelembe venni, vagyis a mintavétel tervezésekor nem tudjuk ezt a hatást befolyásolni. Ugyanakkor a későbbiekben a panelelemzések során számításba kell venni azt, hogy a paneltagok politikailag involváltabbak, aktívabbak. Megfontolandó tehát, hogy a panelminta súlyozásakor figyelembe vegyünk olyan változókat, melyek a politikai aktivitással, részvételi hajlandósággal kapcsolatosak. 4. táblázat A paneltagság teljes logisztikus regressziós modellje* EXP(B) 95%-os Szignifikanciaszint konfidenciaintervalluma B S.E. Wald df Exp(B) Alsó Felső Nem -,004,076,002 1,960,996,858 1,157 Életkor -,030,039,594 1,441,970,899 1,048 iskolai végzettség,022,041,283 1,595 1,022,943 1,109 gazdasági aktivitás -,100,085 1,377 1,241,905,766 1,069 etnikai háttér,259,199 1,683 1,195 1,295,876 1,914 településtípus,474,038 158,202 1,000 1,607 1,492 1,730 értékes autó -,058,138,179 1,672,943,720 1,236 Villalakás -,124,337,135 1,714,884,457 1,710 Panellakás -,179,104 2,947 1,086,836,681 1,026 politikai involváltság,434,077 32,047 1,000 1,544 1,328 1,795 Konstans -1,425,250 32,531 1,000,240 * -2 Log likelihood: 4029,4 Nagelkerke R 2 =0,11. N=3103. 9
5. táblázat A paneltagság egyszerű logisztikus regressziós modellje* EXP(B) 95%-os konfidenciaintervalluma B S.E. Wald df Szignifikanciaszint Exp(B) Alsó Felső Budapest -1,503,109 190,732 1,000,222,180,275 Megyeszékhely -,766,103 55,232 1,000,465,380,569 Város -,177,100 3,131 1,077,838,688 1,019 Politikai involváltság,428,076 31,626 1,000 1,533 1,321 1,780 Konstans,258,080 10,402 1,001 1,294 * -2 Log likelihood: 4048,1 Nagelkerke R 2 =0,11. N=3122. Végezetül egy olyan magyarázó modellt mutatunk be, amely figyelembe veszi azt a tényt, hogy a kutatás terepmunkáját három független kutatóintézet végezte. A Tématanács a kutatási tervében a módszertan lehető legnagyobb mértékű egységesítésére törekedett, de ismert, hogy a kutatóintézetek szokásos rutinja eltérő. A korábbi egyszerűsített modellünkbe bevontuk tehát a kutatóintézeti hatást mérő dummy változókat. Referenciakategóriaként a TÁRKI szerepel. Az eredményeket a 6. táblázat mutatja. A kiegészített modell magyarázóereje 2 százalékponttal növekedett a Nagelkerke R 2 mutató szerint. A TÁRKI-hoz képest nem tapasztalható szignifikáns eltérés a Szonda-Ipsos esetében a paneltagok elérése vonatkozásában. Tapasztalható ilyen a Medián esetében. Ez is egy olyan megfigyelés, melyet a későbbi vizsgálatok során figyelembe kell venni. Ismert, hogy a csökkenő mintás kérdezés költségessége miatt kevéssé elterjedt módszer annak ellenére, hogy leginkább közel áll a klasszikus véletlen mintavételi technikákhoz. Ehelyett a kutatóintézetek a véletlen sétás kiválasztást preferálják, amely adatfelvételi technika is megfelel a véletlen kiválasztás kritériumának, ugyanakkor az utólagos kontroll, minőségellenőrzés bonyolultabb. Ebben a technikában a legtöbb tapasztalatot a Medián szerezte be az elmúlt években, vélhetőleg ennek tudható be, hogy a kiegészítő mintán jobban teljesítettek a Medián kérdezői, mint a a bevett intézeti rutintól jobban eltérő panelmintán. 10
6. táblázat A paneltagság egyszerű kiegészített logisztikus regressziós modellje* EXP(B) 95%-os konfidenciaintervalluma B S.E. Wald df Szignifikanciaszint Exp(B) Alsó Felső Budapest -1,534,110 195,661 1,000,216,174,267 Megyeszékhely -,777,104 56,121 1,000,460,375,564 Város -,196,101 3,766 1,052,822,675 1,002 Poitikai involváltság,401,077 27,446 1,000 1,493 1,285 1,735 Szonda -,054,094,337 1,562,947,788 1,138 Medián -,457,092 24,700 1,000,633,529,758 Konstans,466,100 21,816 1,000 1,593 * -2 Log likelihood: 4018,1 Nagelkerke R 2 =0,13. N=3122. Összefoglalás Elemzésünkben bemutattuk, hogy a panelkutatásban való részvétel valószínűségét legnagyobb mértékben a lakóhely településtípusa határozza meg. Igaz, hogy ezt a hatást a kutatási tervünkbe tudatosan építettük be, a településtípus szerinti kvóta szempontok érvényesítésével a kiegészítő mintavétel során. A lakóhelyi jellegzetességek (a környezet társadalmi státusza, kérdezéstechnikai gátak, pl. kaputelefon, kutya, stb.) hatásának további elemzésére van szükség. A panelmintában kimutathatóan nagyobb eséllyel szerepelnek a politikailag involváltabb, aktívabb megkérdezettek. Felvetődik ennek figyelembevétele a panelszempontú súlyozás kialakítása során ennek figyelembe vétele. A különböző kutatóintézetek nem egyenlő eséllyel értek el paneltagokat. A jövőben tovább kell egységesíteni az adatfelvételi módszertanokat a paneltagok elérésének maximalizálása érdekében. 11
Függelék 1. sz Függelék: TÁRKI Felkérő levél 2008 MAGYAR VÁLASZTÁSKUTATÁSI PROGRAM Tisztelt Hölgyem! Tisztelt Uram! A TÁRKI Társadalomkutatási Intézet a Budapesti Corvinus Egyetem Politikatudományi Intézetével szakmailag együttműködő Demokrácia Kutatások Alapítvány Magyar Választáskutatási Programja 2008-2011 megbízásából más közvélemény-kutató intézetekkel együttműködve tudományos céllal kérdőíves szociológiai vizsgálatot végez a magyar lakosság körében. Ebben kérjük az Ön közreműködését! A vizsgálatba bevont személyeket köztük Önt is a hazai tudományos kutatások szokásainak megfelelően a Központi Nyilvántartó és Választási Hivatal az adatvédelmi törvény rendelkezéseinek betartásával véletlenszerűen választotta ki adatbázisából. A neveket és címeket titkosan, a kérdőívektől elkülönítve kezeljük. A válaszokat statisztikai módszerekkel dolgozzuk fel. A kutatásban való részvétel önkéntes. Kérjük, hogy fogadja bizalommal fényképes igazolvánnyal rendelkező munkatársunkat, aki felkeresi Önt, hogy kérdőív segítségével kérdéseket tegyen fel a tudományos vizsgálatok céljából életmódjával, szokásaival, gondolkodásmódjával, közéleti kérdésekkel kapcsolatban. Reméljük, hogy Ön is segíteni fogja munkánkat válaszaival. Részvételét előre is köszönjük! Budapest, 2008. április 15. Szivós Péter ügyvezetői igazgató Választás 2008 12
Táblázatok jegyzéke 1. táblázat 2008-as alapcímek felhasználása és a keresztmetszeti minták összetétele címforrás szerint... 4 2. táblázat Panelminta és a kiegészítő minták nagysága (fő) kutatóintézetenként... 5 3. táblázat A paneltagok aránya különböző társadalmi-demográfiai csoportokban (%)*... 7 4. táblázat A paneltagság teljes logisztikus regressziós modellje*... 9 5. táblázat A paneltagság egyszerű logisztikus regressziós modellje*... 10 6. táblázat A paneltagság egyszerű kiegészített logisztikus regressziós modellje*... 11 13