Mûhely Medvegyev Péter kadidátus, a Corvius Egyetem egyetemi taára E-mail: peter.medvegyev@uicorvius.hu A brexit-szavazás és a agy számok törvéye A 016. év, de vélhetőe az egész évtized legfotosabb politikai eseméye a brexit-épszavazás volt. A épszavazás már ömagába is egy redkívüli eseméy: a világ már régóta beszél kasziókapitalizmusról, de úgy tűik most már megszületett a kasziókormáyzás műfaja is. Va abba valami félelmetes, ahogy egy büszke évszázados politikai kultúra, amely mitája volt a világ jeletős részéek, feldob egy érmét, és jövőjét em az értelemre alapozza, em a bölcs politikai megfotolástól teszi függővé, haem attól, hogy a feldobott érem melyik oldalára esik. A brexitépszavazás taulságai kimeríthetetleek. Ebbe a rövid dolgozatba csak egyetle és talá em is a legfotosabb aspektussal szereték foglalkozi: a épszavazást megelőző közvéleméy-kutatásokkal. Tulajdoképpe már agyo régóta figyelem a külöböző választásokat megelőző közvéleméy-kutatásokat, és az elmúlt évtizedek alatt egyre ehezebbe tudtam szabaduli attól a beyomásomtól, hogy ezek a felmérések, ha em is midig, de többyire tévedek. A moder társadalmak egyik legfotosabb jellemzője a agyfokú boyolultság. Az eseméyek redkívül szerteágazók és áttekithetetleek. A külöböző dötéshozókak ahhoz, hogy megalapozott dötéseket tudjaak hozi, iformációkra va szükségük, és a társadalmakkal kapcsolatos iformációk jeletős részét a közvéleméy-kutatások szolgáltatják. Éppe ezért a közvéleméy-kutatás kiterjedt és ige jövedelmező üzletág. Hogy lehet az, hogy a véleméyek felméréséek eze formája eyire rosszul teljesít? A válasz szeritem agyo egyszerű, de em leék meglepve, ha véleméyemmel egyedül maradék. Szeritem az iparág helytele alapokra épül, potosabba a miták, amikkel dolgozik, redkívül kicsik. Kiidulásképpe térjük vissza az alapokhoz, a agy számok törvéyéhez. Mikét ismert, kétféle agy számok törvéye va, az erős és a gyege. Az erős törvéy azt állítja, hogy a relatív gyakoriság a valószíűséghez tart. A gyege törvéy jeletőségét az adja, hogy lehetőséget ad a kovergecia sebességéek becslésére. Legye adva valamilye A eseméy, amely valószíűsége legye p. Végezzük el kísér-
Medvegyev: A brexit-szavazás és a agy számok törvéye 1051 letet, és tegyük fel, hogy ebből az A eseméy r -szer következett be. Vagyis r legye az A eseméy valószíűségéhez tartozó relatív gyakoriság. A törvéy szerit tetszőleges ε 0 és δ 0 eseté va olya N küszöb, hogy ha N, akkor r p ε δ. P Az állítás igazolása léyegébe triviális, ami azoba távolról sem triviális az a kovergecia sebessége. A sebességgel kapcsolatos legfotosabb kérdés, hogy adott ε és δ eseté milye agy az N? A brexit kapcsá a várt p agyo közel volt az 50 százalékhoz, így ahhoz, hogy haszos és potos becslést tudjuk adi, az ε értékét agyo kicsire kell vei, ugyais pot az a kérdés, hogy most p 0,49 vagy p 0,51. A továbbiakba tehát ε 0,01 -gyel foguk számoli. Ugyaakkor a dolog redkívüli fotossága miatt a δ értékét is kicsiek kell vei. Nemcsak agyo potosa, haem agyo biztosa is szereték tudi a végeredméyt. Az egyszerűség kedvéért ezért a δ szité legye 1 százalék. A agy számok törvéyére ismert egyik legjobb becslést a Berstei-egyelőtleség szolgáltatja. 1 r ε P p ε exp exp ε pq Ha most ez alapjá kiszámoljuk az ε δ 0,01 értékekhez tartozó küszöbszámot, akkor 4 N l 00 10 6 49 értéket kapuk. Egy másik közismert megfotolás a cetrális határeloszlás tételére épül. r r p r p P p ε ε ε P P pq pq P N 0,1 ε P N 0,1 ε pq 1/ 4 Ha ε δ 0,01, akkor 1 Φ ε δ δ Φ ε 1 0, 995, amiből ε,5758. 1 SHIRYAEV, A. N. [1996]: Probability. Spriger. New York. 69. oldal.
105 Medvegyev Péter Tehát,5758 0,01 16 587, amely jóval kevesebb mit a Berstei-féle becslés, de még midig körülbelül 16 000-es agyságredű mitával kell számoli. Érdemes hagsúlyozi, hogy bár jeletős matematikai irodalma va a Berstei-típusú becslésekek, szerepük az alkalmazásokba elhayagolható. Eek oka éppe az imét látott példába ragadható meg. A cetrális határeloszlás tétele egyrészt sokkal egyszerűbb, másrészt sokkal potosabb becslést szolgáltat. A Fiacial Times összegyűjtötte a épszavazással kapcsolatos közvéleméykutatásokat. Ezek közül egyetle egy volt, amelybe húszezer embert kérdeztek meg, és a közvéleméy-kutatás 014. jauár 0-á törtét. Ekkor 41 százalék godolta, hogy ki kell lépi, és ugyaeyi, hogy maradi kell. Egy másik 015. december 5-é végzett mitavételbe 10 015 személyt kérdeztek meg, itt 4 százalék godolta, hogy ki kell lépi, és 40 százalék, hogy maradi kell. Az utolsó 016. júius -é tartott közvéleméy-kutatás sorá 4 700 személyt kérdeztek meg és 55 százalék modta, hogy maradi akar, 45 százalék godolta azt, hogy ki kell lépi. Ha δ 1 százalék akkor a szabály alapjá,5758 ε ε,5758,5758 1, 8786 10 %. 4 700 Tehát az 55 százalékhoz képest a lehetséges hiba százalék alatt lesz, vagyis a mitát tekitve esetleg godolhatták, hogy a brexit-szavazás eredméye alapjá Nagy-Britaia em fog kilépi az EU-ból. Iroikus, de érdemes megjegyezi, hogy a végeredméy 51,89 százalék volt, ami a p 50 százalékhoz képest valóba százaléko belül maradt, csak éppe a másik oldalo. Ez a közvéleméy-kutatás széles körbe ismerté vált, és ige megyugtatóa hatott. Elképzelhető, hogy mivel a közvéleméy-kutatás a bemaradás szavazatok agy föléyét mutatta, jeletős mértékbe befolyásolta a szavazás végeredméyét, ugyais agyba hozzá járult a szavazók utólag kimutatható felületességéhez, meggodolatlaságához. Soka godolták, hogy a szavazásak valójába ics tétje, és így a téyleges tartalomtól függet- https://ig.ft.com/sites/brexit-pollig/ Júius -é égy közvéleméy-kutatás volt, abból kettő eltalálta a végeredméyt, kettő em! A dolgozatba a két hibás eredméyt kapó közvéleméy-kutatást elemzem.
A brexit-szavazás és a agy számok törvéye 1053 leül általáos elégedetleségükek adtak hagot. Ez a közvéleméy-kutatások egy másik tulajdoságára mutat rá, amely szerit ezek célja em is a téyleges helyzet feltárása, haem a közvéleméy maipulálása. Ez egy fotos kérdés, de ezzel ebbe a dolgozatba em foglalkozom. Bárhogya is volt, egy olya közvéleméy-kutatás született, amelybe, legalábbis véleméyem szerit, a mita elemszáma túl kicsi volt. Mivel a gazdasági szereplők ige tartottak a kilépéstől, egy problémás közvéleméykutatásra építették a várakozásokat és számításaikat. Persze másképpe is godolkodhatuk. Mivel a p agyságát agyo jól el akarjuk találi, ezért az ε 0,01 értéket tartai kell. Ilyekor a tévedés valószíűsége δ 1 Φ ε 1 Φ 10 4 700 0,1703, ami túlságosa agy, valamivel agyobb aál, hogy egy kockával hatost dobuk. Ugyaakkor a téylegese bekövetkezett eredméy valószíűsége redkívül csekély volt. Ami arra utal, hogy a mita agyságáak helytele meghatározásá túl egyéb hibák is törtétek. Ugyaeze a apo egy másik közvéleméy-kutató 1 03 embert kérdezett meg. Ők 48 maradást, 4 kilépést és 11 százalék bizoytala szavazót mértek. Az ő esetükbe a potosság δ 0,01 eseté ε,5758,5758 4, 0091 10 4% 1 03 hibahatárt jelet. Ha most a 11 százalék fele-fele aráyba oszlik meg, akkor 53,5 százalék a bemaradás valószíűsége, de a 4 százalékos potosság miatt előfordulhat δ 0,01 mellett is a kilépés. Itt a tévedés valószíűsége ε 0,01 eseté δ 0,5 százalék volt. Vagyis a közvéleméy-kutatás által közvetített pozitív üzeet valójába megalapozatla volt. 50-50 százalék, hogy a valós érték a közölttől kevesebb mit 1 százalékkal tér el. 3 Természetese tisztába vagyok azzal, hogy a agy számok törvéyéek közvetle alkalmazása em helyes. A világ midig jóval boyolultabb, mit a taköyv, és 3 Ezek a becslések a cetrális határeloszlás tételére épülek. Elképzelhető, hogy a határeloszlás-tételbe a kovergecia sebességét talá túlértékeltük. Próbáljuk meg a Berstei-becslést alkalmazi. Mivel a p agyo közel va az 1/ értékhez az ε 0,01 idokolt. Ha 4 700, akkor a hibás becslés valószíűsége a exp 4 700 0,01 0,7816, ami elképesztőe agy. Ha 1 000, akkor a 1,6375, ami alapjá csak azt tudjuk megállapítai, hogy valószíűségről va szó. A példából is látható, hogy a Bersteiegyelőtleség haszálhatatla, és em véletle, hogy a mitaelemek agyságáak meghatározásakor az ilye típusú becslések az irodalomba említés élkül maradak.
1054 Medvegyev Péter ezért egy egyszerű taköyvi példát em lehet az eredméyekre ráhúzi. Bár a taköyvi példák egyfajta józaészkét, midig haszos iformációt adak. Ha valami agyo em illeszkedik a józaész keretei közé, ott valami agy csoda kell, hogy legye, és bár csodák vaak, azért ritká találkozuk velük. Valójába a feti megfotolások mögötti matematikai feltételek egyike sem teljesült. A mitába szereplő elemek eloszlása em volt azoos. Közismert, hogy a szavazás eredméye függött az életkortól, a képzettségtől, a lakhelytől és számos egyéb dologtól. Világos, hogy a mitaelemek egymástól is függtek, hisze valószíűleg a közvetle kérdezés eseté egyszerűbb egy agyvárosba válaszoli hajladó egyedet találi, mit vidéke, és elképzelhető, hogy bizoyos társadalmi csoportokba jeletős a választ em adók vagy a szádékosa rossz választ adók aráya. Vagyis a modellkockázat jeletős, és ezért a szükséges ε 0,01 elvárás tarthatatla, ugyais a N övelése éppe a agy modellkockázat miatt egy poto túl már értelmetle. Itt érdemes megjegyezi, hogy a mitavételes irodalomba más termiológiát haszálak. 4 A statisztika ugyais em tud mit kezdei a valószíűségi változó fogalmával, amely egy ige kéyelmes, de megfigyelhetetle matematikai absztrakció. A mitavételi irodalom szerit a választók em egymástól függetle, azoos eloszlású valószíűségi változók, haem egy fix halmazból vett mita elemei. A mita kiválasztásakor mide egyed egyelő eséllyel kerül megkérdezésre, és ez biztosítja a valószíűség-számítás szabályaiak, így például a cetrális határeloszlás tételéek alkalmazhatóságát. A valószíűségszámítás yelvé a valószíűségi változók egymástól függetleek és azoos eloszlásúak, a mitavételi irodalom yelvé az egyes mitákak kell azoos valószíűségűek lei. Az itt említett problémák a valószíűség-számítás termiológiájába azt jeletik, hogy em teljesülek a tétel feltételei, a mitavételi irodalom meg azt modja, hogy ameyibe a mitavételt szabályosa és korrekt módo hajtották végre, akkor a tétel feltételei midig haszálhatók, aak elleére, hogy a problémák feálltak vagy sem. Vagyis, ha véletleszerűe választjuk a megkérdezett elemeket, akkor a valószíűségszámítás szabályai, így a cetrális határeloszlás tétele alkalmazható, és az említett ehézségeket a mitavételi eljárás ehézségekét, hibájakét iterpretálják. 5 Akárhogya is ézzük, a közvéleméy-kutató cégek agyot tévedtek, és véleméyem szerit a tévedések egyik oka, hogy egy elemi megfotolást em vettek figyelembe, valamit a mita agyságát túl alacsoyak vették. Mide közvéleméykutató bizoyos költségkeretek között mozog, és vélhetőleg tisztába va a módszer- 4 COCHRAN, W. G. [1977]: Samplig Techiques. Third editio. Wiley & Sos. Hoboke. Talá em érdektele megjegyezi, hogy a köyv első példájába, midjárt az első oldalo 105 000 személyből álló mitára hivatkozik. A köyv második példájába a szerző az 1940-es egyesült államokbeli épszámlálást említi, ahol bizoyos kérdésekbe csak a lakosság 5 százalékát kérdezték meg. 1940-be az Egyesült Államok lakossága körülbelül 130 millió volt. Ez 6,5 millió ember megkérdezését jeleti. Ehhez képest mit is jelet 4 700 ember megkérdezése az évtized politikai dötése előtt? 5 A termiológia szerzőkét változik. Vö.: BOBROV, A. A. [1999]: Matematikai statisztika. Typotex Kiadó. Budapest.
A brexit-szavazás és a agy számok törvéye 1055 taáak hiáyosságával. Eek elleére eredméyeit a részletekbe tájékozatla közvéleméyel a tudomáy és a matematika magas szitjéről egyfajta téykét közli. Miközbe ez em igaz. Erre talá a legszebb iskolapéldát a brexit szolgáltatta. A közvéleméy-kutatókak módszertaukat és kommuikációjukat jeletőse át kell vizsgáli. Az átvizsgálás eredméyekét az elemszámot, legalábbis véleméyem szerit, a brexit-hez hasoló kiélezett helyzetekbe jeletős mértékbe célszerű lesz öveli. Persze ezzel a költségek is meg fogak ői. A magasabb költségek eseté a megredelők száma csökkei fog, és elképzelhető, hogy így az iparág kisebb bevételhez fog juti. Ám, hogy végül még egy közismert szabályt megosszak az olvasóval: Olcsó húsak sajos híg a leve.