A brexit-szavazás és a nagy számok törvénye

Hasonló dokumentumok
Statisztika 1. zárthelyi dolgozat március 21.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Ingatlanfinanszírozás és befektetés

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

BIOMATEMATIKA ELŐADÁS

A matematikai statisztika elemei

Statisztikai hipotézisvizsgálatok

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

A figurális számokról (IV.)

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

Feladatok és megoldások a 11. heti gyakorlathoz

VII. A határozatlan esetek kiküszöbölése

Populáció nagyságának felmérése, becslése

Statisztika 1. zárthelyi dolgozat március 18.

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

1. A radioaktivitás statisztikus jellege

NUMERIKUS SOROK II. Ebben a részben kizárólag a konvergencia vizsgálatával foglalkozunk.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

A HŐMÉRSÉKLETI SUGÁRZÁS

Kalkulus II., második házi feladat

Villamos gépek tantárgy tételei

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Statisztika október 27.

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

Matematika B4 I. gyakorlat

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

EGYENLETEK ÉS EGYENLETRENDSZEREK MEGOLDÁSA A Z n HALMAZON. egyenletrendszer megoldása a Z

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel-

Komputer statisztika

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

1. elıadás: Bevezetés. Számonkérés. Irodalom. Valószínőségszámítás helye a tudományok között. Cél

AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL

KAOTIKUS VAGY CSAK ÖSSZETETT? Labdák pattogása lépcsôn

Matematika I. 9. előadás

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

6. feladatsor. Statisztika december 6. és 8.

Matematikai statisztika

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Nevezetes sorozat-határértékek

Feladatok megoldása. Diszkrét matematika I. Beadandó feladatok. Bujtás Ferenc (CZU7KZ) December 14, feladat: (A B A A \ C = B)

I. FEJEZET BICIKLIHIÁNYBAN

Valószínűségszámítás alapjai szemléletesen

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

képzetes t. z = a + bj valós t. a = Rez 5.2. Műveletek algebrai alakban megadott komplex számokkal

6. Minısítéses ellenırzı kártyák

Rádiókommunikációs hálózatok

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

NAGYVADÁLLOMÁNY JELLEMZŐ ADATAINAK MEGHATÁROZÁSA KÖZVETETT ÚTON

Hosszmérés finomtapintóval 2.

IKT eszközök használata az oktatásban

? közgazdasági statisztika

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

Komplex számok. d) Re(z 4 ) = 0, Im(z 4 ) = 1 e) Re(z 5 ) = 0, Im(z 5 ) = 2 f) Re(z 6 ) = 1, Im(z 6 ) = 0

Kombinatorika. Variáció, permutáció, kombináció. Binomiális tétel, szita formula.

7. el adás Becslések és minta elemszámok fejezet Áttekintés

Az új építőipari termelőiár-index részletes módszertani leírása

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Nagyméretű nemlineáris közúti közlekedési hálózatok speciális analízise

? közgazdasági statisztika

fogalmazva a nagy számok törvénye azt mondja ki, hogy ha vesszük n független és

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel?

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Általános taggal megadott sorozatok összegzési képletei

kritikus érték(ek) (critical value).

Az iparosodás és az infrastrukturális fejlődés típusai

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

Tartalomjegyzék. Pemutáció 5 Ismétléses permutáció 8 Variáció 9 Ismétléses variáció 11 Kombináció 12 Ismétléses kombináció 13

EGYENLETEK ÉS EGYENLETRENDSZEREK MEGOLDÁSA A Z n HALMAZON. egyenletrendszer megoldása a

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

3.1. A Poisson-eloszlás

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

2. fejezet. Számsorozatok, számsorok

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél

Valószínűségszámítás

Átírás:

Mûhely Medvegyev Péter kadidátus, a Corvius Egyetem egyetemi taára E-mail: peter.medvegyev@uicorvius.hu A brexit-szavazás és a agy számok törvéye A 016. év, de vélhetőe az egész évtized legfotosabb politikai eseméye a brexit-épszavazás volt. A épszavazás már ömagába is egy redkívüli eseméy: a világ már régóta beszél kasziókapitalizmusról, de úgy tűik most már megszületett a kasziókormáyzás műfaja is. Va abba valami félelmetes, ahogy egy büszke évszázados politikai kultúra, amely mitája volt a világ jeletős részéek, feldob egy érmét, és jövőjét em az értelemre alapozza, em a bölcs politikai megfotolástól teszi függővé, haem attól, hogy a feldobott érem melyik oldalára esik. A brexitépszavazás taulságai kimeríthetetleek. Ebbe a rövid dolgozatba csak egyetle és talá em is a legfotosabb aspektussal szereték foglalkozi: a épszavazást megelőző közvéleméy-kutatásokkal. Tulajdoképpe már agyo régóta figyelem a külöböző választásokat megelőző közvéleméy-kutatásokat, és az elmúlt évtizedek alatt egyre ehezebbe tudtam szabaduli attól a beyomásomtól, hogy ezek a felmérések, ha em is midig, de többyire tévedek. A moder társadalmak egyik legfotosabb jellemzője a agyfokú boyolultság. Az eseméyek redkívül szerteágazók és áttekithetetleek. A külöböző dötéshozókak ahhoz, hogy megalapozott dötéseket tudjaak hozi, iformációkra va szükségük, és a társadalmakkal kapcsolatos iformációk jeletős részét a közvéleméy-kutatások szolgáltatják. Éppe ezért a közvéleméy-kutatás kiterjedt és ige jövedelmező üzletág. Hogy lehet az, hogy a véleméyek felméréséek eze formája eyire rosszul teljesít? A válasz szeritem agyo egyszerű, de em leék meglepve, ha véleméyemmel egyedül maradék. Szeritem az iparág helytele alapokra épül, potosabba a miták, amikkel dolgozik, redkívül kicsik. Kiidulásképpe térjük vissza az alapokhoz, a agy számok törvéyéhez. Mikét ismert, kétféle agy számok törvéye va, az erős és a gyege. Az erős törvéy azt állítja, hogy a relatív gyakoriság a valószíűséghez tart. A gyege törvéy jeletőségét az adja, hogy lehetőséget ad a kovergecia sebességéek becslésére. Legye adva valamilye A eseméy, amely valószíűsége legye p. Végezzük el kísér-

Medvegyev: A brexit-szavazás és a agy számok törvéye 1051 letet, és tegyük fel, hogy ebből az A eseméy r -szer következett be. Vagyis r legye az A eseméy valószíűségéhez tartozó relatív gyakoriság. A törvéy szerit tetszőleges ε 0 és δ 0 eseté va olya N küszöb, hogy ha N, akkor r p ε δ. P Az állítás igazolása léyegébe triviális, ami azoba távolról sem triviális az a kovergecia sebessége. A sebességgel kapcsolatos legfotosabb kérdés, hogy adott ε és δ eseté milye agy az N? A brexit kapcsá a várt p agyo közel volt az 50 százalékhoz, így ahhoz, hogy haszos és potos becslést tudjuk adi, az ε értékét agyo kicsire kell vei, ugyais pot az a kérdés, hogy most p 0,49 vagy p 0,51. A továbbiakba tehát ε 0,01 -gyel foguk számoli. Ugyaakkor a dolog redkívüli fotossága miatt a δ értékét is kicsiek kell vei. Nemcsak agyo potosa, haem agyo biztosa is szereték tudi a végeredméyt. Az egyszerűség kedvéért ezért a δ szité legye 1 százalék. A agy számok törvéyére ismert egyik legjobb becslést a Berstei-egyelőtleség szolgáltatja. 1 r ε P p ε exp exp ε pq Ha most ez alapjá kiszámoljuk az ε δ 0,01 értékekhez tartozó küszöbszámot, akkor 4 N l 00 10 6 49 értéket kapuk. Egy másik közismert megfotolás a cetrális határeloszlás tételére épül. r r p r p P p ε ε ε P P pq pq P N 0,1 ε P N 0,1 ε pq 1/ 4 Ha ε δ 0,01, akkor 1 Φ ε δ δ Φ ε 1 0, 995, amiből ε,5758. 1 SHIRYAEV, A. N. [1996]: Probability. Spriger. New York. 69. oldal.

105 Medvegyev Péter Tehát,5758 0,01 16 587, amely jóval kevesebb mit a Berstei-féle becslés, de még midig körülbelül 16 000-es agyságredű mitával kell számoli. Érdemes hagsúlyozi, hogy bár jeletős matematikai irodalma va a Berstei-típusú becslésekek, szerepük az alkalmazásokba elhayagolható. Eek oka éppe az imét látott példába ragadható meg. A cetrális határeloszlás tétele egyrészt sokkal egyszerűbb, másrészt sokkal potosabb becslést szolgáltat. A Fiacial Times összegyűjtötte a épszavazással kapcsolatos közvéleméykutatásokat. Ezek közül egyetle egy volt, amelybe húszezer embert kérdeztek meg, és a közvéleméy-kutatás 014. jauár 0-á törtét. Ekkor 41 százalék godolta, hogy ki kell lépi, és ugyaeyi, hogy maradi kell. Egy másik 015. december 5-é végzett mitavételbe 10 015 személyt kérdeztek meg, itt 4 százalék godolta, hogy ki kell lépi, és 40 százalék, hogy maradi kell. Az utolsó 016. júius -é tartott közvéleméy-kutatás sorá 4 700 személyt kérdeztek meg és 55 százalék modta, hogy maradi akar, 45 százalék godolta azt, hogy ki kell lépi. Ha δ 1 százalék akkor a szabály alapjá,5758 ε ε,5758,5758 1, 8786 10 %. 4 700 Tehát az 55 százalékhoz képest a lehetséges hiba százalék alatt lesz, vagyis a mitát tekitve esetleg godolhatták, hogy a brexit-szavazás eredméye alapjá Nagy-Britaia em fog kilépi az EU-ból. Iroikus, de érdemes megjegyezi, hogy a végeredméy 51,89 százalék volt, ami a p 50 százalékhoz képest valóba százaléko belül maradt, csak éppe a másik oldalo. Ez a közvéleméy-kutatás széles körbe ismerté vált, és ige megyugtatóa hatott. Elképzelhető, hogy mivel a közvéleméy-kutatás a bemaradás szavazatok agy föléyét mutatta, jeletős mértékbe befolyásolta a szavazás végeredméyét, ugyais agyba hozzá járult a szavazók utólag kimutatható felületességéhez, meggodolatlaságához. Soka godolták, hogy a szavazásak valójába ics tétje, és így a téyleges tartalomtól függet- https://ig.ft.com/sites/brexit-pollig/ Júius -é égy közvéleméy-kutatás volt, abból kettő eltalálta a végeredméyt, kettő em! A dolgozatba a két hibás eredméyt kapó közvéleméy-kutatást elemzem.

A brexit-szavazás és a agy számok törvéye 1053 leül általáos elégedetleségükek adtak hagot. Ez a közvéleméy-kutatások egy másik tulajdoságára mutat rá, amely szerit ezek célja em is a téyleges helyzet feltárása, haem a közvéleméy maipulálása. Ez egy fotos kérdés, de ezzel ebbe a dolgozatba em foglalkozom. Bárhogya is volt, egy olya közvéleméy-kutatás született, amelybe, legalábbis véleméyem szerit, a mita elemszáma túl kicsi volt. Mivel a gazdasági szereplők ige tartottak a kilépéstől, egy problémás közvéleméykutatásra építették a várakozásokat és számításaikat. Persze másképpe is godolkodhatuk. Mivel a p agyságát agyo jól el akarjuk találi, ezért az ε 0,01 értéket tartai kell. Ilyekor a tévedés valószíűsége δ 1 Φ ε 1 Φ 10 4 700 0,1703, ami túlságosa agy, valamivel agyobb aál, hogy egy kockával hatost dobuk. Ugyaakkor a téylegese bekövetkezett eredméy valószíűsége redkívül csekély volt. Ami arra utal, hogy a mita agyságáak helytele meghatározásá túl egyéb hibák is törtétek. Ugyaeze a apo egy másik közvéleméy-kutató 1 03 embert kérdezett meg. Ők 48 maradást, 4 kilépést és 11 százalék bizoytala szavazót mértek. Az ő esetükbe a potosság δ 0,01 eseté ε,5758,5758 4, 0091 10 4% 1 03 hibahatárt jelet. Ha most a 11 százalék fele-fele aráyba oszlik meg, akkor 53,5 százalék a bemaradás valószíűsége, de a 4 százalékos potosság miatt előfordulhat δ 0,01 mellett is a kilépés. Itt a tévedés valószíűsége ε 0,01 eseté δ 0,5 százalék volt. Vagyis a közvéleméy-kutatás által közvetített pozitív üzeet valójába megalapozatla volt. 50-50 százalék, hogy a valós érték a közölttől kevesebb mit 1 százalékkal tér el. 3 Természetese tisztába vagyok azzal, hogy a agy számok törvéyéek közvetle alkalmazása em helyes. A világ midig jóval boyolultabb, mit a taköyv, és 3 Ezek a becslések a cetrális határeloszlás tételére épülek. Elképzelhető, hogy a határeloszlás-tételbe a kovergecia sebességét talá túlértékeltük. Próbáljuk meg a Berstei-becslést alkalmazi. Mivel a p agyo közel va az 1/ értékhez az ε 0,01 idokolt. Ha 4 700, akkor a hibás becslés valószíűsége a exp 4 700 0,01 0,7816, ami elképesztőe agy. Ha 1 000, akkor a 1,6375, ami alapjá csak azt tudjuk megállapítai, hogy valószíűségről va szó. A példából is látható, hogy a Bersteiegyelőtleség haszálhatatla, és em véletle, hogy a mitaelemek agyságáak meghatározásakor az ilye típusú becslések az irodalomba említés élkül maradak.

1054 Medvegyev Péter ezért egy egyszerű taköyvi példát em lehet az eredméyekre ráhúzi. Bár a taköyvi példák egyfajta józaészkét, midig haszos iformációt adak. Ha valami agyo em illeszkedik a józaész keretei közé, ott valami agy csoda kell, hogy legye, és bár csodák vaak, azért ritká találkozuk velük. Valójába a feti megfotolások mögötti matematikai feltételek egyike sem teljesült. A mitába szereplő elemek eloszlása em volt azoos. Közismert, hogy a szavazás eredméye függött az életkortól, a képzettségtől, a lakhelytől és számos egyéb dologtól. Világos, hogy a mitaelemek egymástól is függtek, hisze valószíűleg a közvetle kérdezés eseté egyszerűbb egy agyvárosba válaszoli hajladó egyedet találi, mit vidéke, és elképzelhető, hogy bizoyos társadalmi csoportokba jeletős a választ em adók vagy a szádékosa rossz választ adók aráya. Vagyis a modellkockázat jeletős, és ezért a szükséges ε 0,01 elvárás tarthatatla, ugyais a N övelése éppe a agy modellkockázat miatt egy poto túl már értelmetle. Itt érdemes megjegyezi, hogy a mitavételes irodalomba más termiológiát haszálak. 4 A statisztika ugyais em tud mit kezdei a valószíűségi változó fogalmával, amely egy ige kéyelmes, de megfigyelhetetle matematikai absztrakció. A mitavételi irodalom szerit a választók em egymástól függetle, azoos eloszlású valószíűségi változók, haem egy fix halmazból vett mita elemei. A mita kiválasztásakor mide egyed egyelő eséllyel kerül megkérdezésre, és ez biztosítja a valószíűség-számítás szabályaiak, így például a cetrális határeloszlás tételéek alkalmazhatóságát. A valószíűségszámítás yelvé a valószíűségi változók egymástól függetleek és azoos eloszlásúak, a mitavételi irodalom yelvé az egyes mitákak kell azoos valószíűségűek lei. Az itt említett problémák a valószíűség-számítás termiológiájába azt jeletik, hogy em teljesülek a tétel feltételei, a mitavételi irodalom meg azt modja, hogy ameyibe a mitavételt szabályosa és korrekt módo hajtották végre, akkor a tétel feltételei midig haszálhatók, aak elleére, hogy a problémák feálltak vagy sem. Vagyis, ha véletleszerűe választjuk a megkérdezett elemeket, akkor a valószíűségszámítás szabályai, így a cetrális határeloszlás tétele alkalmazható, és az említett ehézségeket a mitavételi eljárás ehézségekét, hibájakét iterpretálják. 5 Akárhogya is ézzük, a közvéleméy-kutató cégek agyot tévedtek, és véleméyem szerit a tévedések egyik oka, hogy egy elemi megfotolást em vettek figyelembe, valamit a mita agyságát túl alacsoyak vették. Mide közvéleméykutató bizoyos költségkeretek között mozog, és vélhetőleg tisztába va a módszer- 4 COCHRAN, W. G. [1977]: Samplig Techiques. Third editio. Wiley & Sos. Hoboke. Talá em érdektele megjegyezi, hogy a köyv első példájába, midjárt az első oldalo 105 000 személyből álló mitára hivatkozik. A köyv második példájába a szerző az 1940-es egyesült államokbeli épszámlálást említi, ahol bizoyos kérdésekbe csak a lakosság 5 százalékát kérdezték meg. 1940-be az Egyesült Államok lakossága körülbelül 130 millió volt. Ez 6,5 millió ember megkérdezését jeleti. Ehhez képest mit is jelet 4 700 ember megkérdezése az évtized politikai dötése előtt? 5 A termiológia szerzőkét változik. Vö.: BOBROV, A. A. [1999]: Matematikai statisztika. Typotex Kiadó. Budapest.

A brexit-szavazás és a agy számok törvéye 1055 taáak hiáyosságával. Eek elleére eredméyeit a részletekbe tájékozatla közvéleméyel a tudomáy és a matematika magas szitjéről egyfajta téykét közli. Miközbe ez em igaz. Erre talá a legszebb iskolapéldát a brexit szolgáltatta. A közvéleméy-kutatókak módszertaukat és kommuikációjukat jeletőse át kell vizsgáli. Az átvizsgálás eredméyekét az elemszámot, legalábbis véleméyem szerit, a brexit-hez hasoló kiélezett helyzetekbe jeletős mértékbe célszerű lesz öveli. Persze ezzel a költségek is meg fogak ői. A magasabb költségek eseté a megredelők száma csökkei fog, és elképzelhető, hogy így az iparág kisebb bevételhez fog juti. Ám, hogy végül még egy közismert szabályt megosszak az olvasóval: Olcsó húsak sajos híg a leve.