Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17.
Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 2 / 35
Adatelemzés #1 Átlag: 56.9 % Medián: 52 % Módusz: 48 % és 78 % Szórás: 18,8 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 3 / 35
Középértékek Számos különböző középérték (átlag) áll a kutató rendelkezésére - azok előnyeivel és hátrányaival együtt: 1 Számtani átlag: 1 n n i=1 x i = x 1+x 2 + +x n n 2 n Mértani átlag: n i=1 x i = n x 1 x 2 x n 3 Módusz: leggyakoribb érték 4 Medián: a statisztikai sokaságot kétfelé vágó érték 5 Midrange: maxx+minx 2 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 4 / 35
Példák Mely középérték(ek)kel jellemezné a következőket? 1 Egy szemeszterben gyűjtött jegyek. 2 A könyvtárban lévő hallgatók száma. 3 A legjellemzőbb hajszín a Campuson. 4 A budapesti lakosok fizetése. 5 Egy sítáborban elköltött eurók száma. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 5 / 35
Értelmezze, szükség esetén javítsa a következő állításokat! 1 1940 és 1948 között az átlagos heti juttatások összege 107 százalékkal emelekedett a United States Steel Corporation-ben. 2 Az átlagos fizetés $ 5.000 körül mozgott 1942-ben. 3 Az autóbalesetben való elhalálozás valószínűsége kétszer nagyobb, mint repülőbalesetet szenvedni (+ statisztikus a repülőn). 4 Tamás IQ-ja 98, Lindáé pedig 101. Egy újabb példája annak, hogy a nők sokkal intelligensebbek a férfiaknál. 5 Ezen a héten feleannyit dolgoztam, mint tavaly ilyenkor. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 6 / 35
Milyen középértékekkel jellemezné a következő, European Values Study (Hungary, 2008)-ból származó változókat: Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. 1 Állami juttatásokat jogtalanul igénybe venni 2 Abortusz 3 Válás 4 Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön 5 Homoszexualitás Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 7 / 35
Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön 0 200 400 600 Átlag: 2.751 Módusz: 1 Medián: 1 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 8 / 35
Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Válás 0 50 100 150 200 250 300 350 Átlag: 5.824 Módusz: 5 Medián: 5 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 9 / 35
Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Homoszexualitás 0 100 200 300 400 500 600 700 Átlag: 3.261 Módusz: 1 Medián: 1 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 10 / 35
Hallgatók közötti intelligencia-teszt eredménye: Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 11 / 35
Hallgatók közötti intelligencia-teszt eredménye: Histogram of t Frequency 0 50 100 150 Átlag: 99.6 Módusz: 89.2 Medián: 99.8 60 80 100 120 t Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 12 / 35
Hallgatók közötti intelligencia-teszt eredménye: 60 70 80 90 100 110 120 130 Átlag: 99.6 Módusz: 89.2 Medián: 99.8 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 13 / 35
Magyar munkavállalók fizetése: Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 14 / 35
Magyar munkavállalók fizetése: Frequency 0 100 200 300 400 Átlag: 113721 Módusz: 72554 Medián: 114613 0 50000 100000 150000 200000 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 15 / 35
Magyar munkavállalók fizetése: 50000 100000 150000 200000 Átlag: 113721 Módusz: 72554 Medián: 114613 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 16 / 35
Mi történik, ha a mintába egy kiemelkedően gazdag alany is bekerül? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 17 / 35
Leíró statisztikák Mi történik, ha a mintába egy kiemelkedően gazdag alany is bekerül? 0 100000000 300000000 500000000 10000 100000 1000000 10000000 100000000 Átlag: 471150 Módusz: 72554 Medián: 116299 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 18 / 35
Szóródási mutatók Számos különböző szóródási mutató áll a kutató rendelkezésére - azok előnyeivel és hátrányaival együtt. A homogenitás, variabilitás kiragadott mérőeszközei: 1 Terjedelem: max x min x 2 Empirikus szórás: σ = 3 Variancia: σ 2 N i=1 (x i x) 2 n 1 4 A kvartilisek (Q1, Q2, Q3) négy egyenlő részre osztják a rendezett mintát: Q2 felezi a mintát (tehát megegyezik a mediánnal); Q1 a minta alsó felének, Q3 a felső felének közepe. 5 Interkvartilis terjedelem (IQR): Q 3 Q 1 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 19 / 35
Interkvartilis terjedelem Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 20 / 35
Interkvartilis terjedelem Hallgatók közötti intelligencia-teszt eredménye: 70 80 90 100 110 120 130 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 21 / 35
Lyotard : A posztmodern állapot (1979) vége a nagy elveszéléseknek anything goes posztmodern kor és posztmodern kultúra Vajon mi történik a normákkal? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 22 / 35
Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Homoszexualitás (1982-1991) Hungary (1982) Hungary (1991) Frequency 0 200 400 600 800 1000 1200 Frequency 0 200 400 600 2 4 6 8 10 2 4 6 8 10 x = 1.447407;σ = 1.419384 x = 2.713547;σ = 3.230236 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 23 / 35
Példa Mi magyarázza az átlagok alacsony különbségét? Frequency 0 50 100 150 200 Frequency 0 100 200 300 400 4 3 2 1 0 1 2 3 0.4 0.2 0.0 0.2 0.4 x = 0.1;σ = 1.019 x = 0;σ = 0.453 Mi a magyarázat arra, hogy az első példában magasabb a szórás? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 24 / 35
Egy eddig elhallgatott leíró statisztikai mutató: szumma Milyen problémát sejtünk a fentebbi ábrához tartozó kutatás mögött? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 25 / 35
Daróczi Gergely (PPKE BTK) Forrás: http://faculty.washington.edu/chudler/stat3.html Statisztika 2012-04-17 26 / 35 Néhány megjegyzés a grafikonokról Palacsintás példa
Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 27 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 28 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 29 / 35
Számítások A várható értékről Szükséges képletek: számtani átlag: x = n i=1 x i (becslőfüggvény) n korrigált empirikus szórás: σ = n (x i x) 2 i=1 n standard/mintavételi hiba: SE = σ n konfidencia intervallum: x ± SE z ahol z = 1.96 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 30 / 35
Számítások A várható értékről ( ) 1 x 2 σ 2π exp 2σ 2 0.1% σ 34% 34% 14% 14% 2% 2% 0.1% x 3σ 2σ σ σ 2σ 3σ standard normális eloszlás: x = 0,σ = 1 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 31 / 35
Számítások Egy nagyon egyszerű példa Játékszabály Egy hatoldalú dobókockával gurítunk: Ha a dobás páratlan, a játékos a dobott összeget megnyeri. Amennyiben a dobás páros, úgy ő fizet két dollárt a banknak. Adatgyűjtés: előzetes számítások helyett belevetjük magunkat a játékba, és a következő értékeket dobjuk. Folytassuk a játékot? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 32 / 35
A mintavételi hiba Egy egyszerű példa X = { 2,2,4, 2, 2,6} x = 2 + 2 + 4 + 2 + 2 + 6 = 6 6 6 = 1 1 = 1 ( 2 1)2 + (2 1) σ = 2 + (4 1) 2 + ( 2 1) 2 + ( 2 1) 2 + (6 1) 2 = 5 9 + 1 + 9 + 9 + 9 + 25 62 = = 5 5 = 12.4 = 3.521363 SE = 3.521363 = 3.521363 6 2.44949 = 1.437591 A várható érték valahol -1.87 és 3.87 között (CI) található 95%-os döntési szinten. Hogyan döntenénk? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 33 / 35
Computation Theoretical solution Felejtkezzünk el az empirikus adatokról egy időre, és vizsgáljuk meg a valódi várható értéket! Density 0.10 0.15 0.20 0.25 0.30 2 0 2 4 6 Winnings Mi a probléma az ábrával? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 34 / 35
Köszönöm a figyelmet! Daróczi Gergely daroczi.gergely@btk.ppke.hu