Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Hasonló dokumentumok
A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

Kutatásmódszertan és prezentációkészítés

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Elemi statisztika fizikusoknak

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

A társadalomkutatás módszerei I. Outline. A mintavételi hiba és konfidencia-intervallum Elmélet. Szükséges képletek: Tehát:

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

A Statisztika alapjai

Statisztikai alapfogalmak

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Biomatematika 2 Orvosi biometria

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Definíció. Definíció. 2. El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása fejezet. A variabilitás mér számai 3.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A valószínűségszámítás elemei

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Változók eloszlása, középértékek, szóródás

[Biomatematika 2] Orvosi biometria

6. Előadás. Vereb György, DE OEC BSI, október 12.

A leíró statisztikák

A társadalomkutatás módszerei I.

18. modul: STATISZTIKA

Segítség az outputok értelmezéséhez

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Számelmélet Megoldások

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Vargha András Károli Gáspár Református Egyetem Budapest

Matematikai statisztika

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

y ij = µ + α i + e ij

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

[Biomatematika 2] Orvosi biometria

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

IV. Felkészítő feladatsor

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Alkalmazott statisztika feladatok

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

2. Egy mértani sorozat második tagja 6, harmadik tagja 18. Adja meg a sorozat ötödik tagját!

A statisztika veszélyei (Darrell Huff: How to Lie with Statistics, 1954)

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Populációbecslések és monitoring

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Számelmélet

A statisztika alapfogalmai Kovács, Előd, Pannon Egyetem

Biomatematika 2 Orvosi biometria

Populációbecslések és monitoring

Hol terem a magyar statisztikus?

KÖVETKEZTETŐ STATISZTIKA

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Biostatisztika Összefoglalás

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

[Biomatematika 2] Orvosi biometria

Matematikai statisztikai elemzések 2.

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Normális eloszlás tesztje

Biostatisztika VIII. Mátyus László. 19 October

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Számelmélet

Kísérlettervezés alapfogalmak

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Biostatisztika Összefoglalás

Statisztika elméleti összefoglaló

Matematikai statisztikai elemzések 2.

Kettőnél több csoport vizsgálata. Makara B. Gábor

Bevezetés a hipotézisvizsgálatokba

Magyarország 1,2360 1,4622 1,6713 1,8384 2,0186 2,2043

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

2. Adott a valós számok halmazán értelmezett f ( x) 3. Oldja meg a [ π; π] zárt intervallumon a. A \ B = { } 2 pont. függvény.

} számtani sorozat első tagja és differenciája is 4. Adja meg a sorozat 26. tagját! A = { } 1 pont. B = { } 1 pont. x =

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

Biomatematikai Tanszék

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika. Politológus képzés. Daróczi Gergely február 23. Politológia Tanszék

1. óra: Területi statisztikai alapok viszonyszámok, középértékek

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

JA45 Cserkeszőlői Petőfi Sándor Általános Iskola (OM: ) 5465 Cserkeszőlő, Ady Endre utca 1.

Átírás:

Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17.

Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 2 / 35

Adatelemzés #1 Átlag: 56.9 % Medián: 52 % Módusz: 48 % és 78 % Szórás: 18,8 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 3 / 35

Középértékek Számos különböző középérték (átlag) áll a kutató rendelkezésére - azok előnyeivel és hátrányaival együtt: 1 Számtani átlag: 1 n n i=1 x i = x 1+x 2 + +x n n 2 n Mértani átlag: n i=1 x i = n x 1 x 2 x n 3 Módusz: leggyakoribb érték 4 Medián: a statisztikai sokaságot kétfelé vágó érték 5 Midrange: maxx+minx 2 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 4 / 35

Példák Mely középérték(ek)kel jellemezné a következőket? 1 Egy szemeszterben gyűjtött jegyek. 2 A könyvtárban lévő hallgatók száma. 3 A legjellemzőbb hajszín a Campuson. 4 A budapesti lakosok fizetése. 5 Egy sítáborban elköltött eurók száma. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 5 / 35

Értelmezze, szükség esetén javítsa a következő állításokat! 1 1940 és 1948 között az átlagos heti juttatások összege 107 százalékkal emelekedett a United States Steel Corporation-ben. 2 Az átlagos fizetés $ 5.000 körül mozgott 1942-ben. 3 Az autóbalesetben való elhalálozás valószínűsége kétszer nagyobb, mint repülőbalesetet szenvedni (+ statisztikus a repülőn). 4 Tamás IQ-ja 98, Lindáé pedig 101. Egy újabb példája annak, hogy a nők sokkal intelligensebbek a férfiaknál. 5 Ezen a héten feleannyit dolgoztam, mint tavaly ilyenkor. Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 6 / 35

Milyen középértékekkel jellemezné a következő, European Values Study (Hungary, 2008)-ból származó változókat: Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. 1 Állami juttatásokat jogtalanul igénybe venni 2 Abortusz 3 Válás 4 Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön 5 Homoszexualitás Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 7 / 35

Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön 0 200 400 600 Átlag: 2.751 Módusz: 1 Medián: 1 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 8 / 35

Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Válás 0 50 100 150 200 250 300 350 Átlag: 5.824 Módusz: 5 Medián: 5 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 9 / 35

Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Homoszexualitás 0 100 200 300 400 500 600 700 Átlag: 3.261 Módusz: 1 Medián: 1 1 2 3 4 5 6 7 8 9 10 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 10 / 35

Hallgatók közötti intelligencia-teszt eredménye: Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 11 / 35

Hallgatók közötti intelligencia-teszt eredménye: Histogram of t Frequency 0 50 100 150 Átlag: 99.6 Módusz: 89.2 Medián: 99.8 60 80 100 120 t Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 12 / 35

Hallgatók közötti intelligencia-teszt eredménye: 60 70 80 90 100 110 120 130 Átlag: 99.6 Módusz: 89.2 Medián: 99.8 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 13 / 35

Magyar munkavállalók fizetése: Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 14 / 35

Magyar munkavállalók fizetése: Frequency 0 100 200 300 400 Átlag: 113721 Módusz: 72554 Medián: 114613 0 50000 100000 150000 200000 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 15 / 35

Magyar munkavállalók fizetése: 50000 100000 150000 200000 Átlag: 113721 Módusz: 72554 Medián: 114613 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 16 / 35

Mi történik, ha a mintába egy kiemelkedően gazdag alany is bekerül? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 17 / 35

Leíró statisztikák Mi történik, ha a mintába egy kiemelkedően gazdag alany is bekerül? 0 100000000 300000000 500000000 10000 100000 1000000 10000000 100000000 Átlag: 471150 Módusz: 72554 Medián: 116299 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 18 / 35

Szóródási mutatók Számos különböző szóródási mutató áll a kutató rendelkezésére - azok előnyeivel és hátrányaival együtt. A homogenitás, variabilitás kiragadott mérőeszközei: 1 Terjedelem: max x min x 2 Empirikus szórás: σ = 3 Variancia: σ 2 N i=1 (x i x) 2 n 1 4 A kvartilisek (Q1, Q2, Q3) négy egyenlő részre osztják a rendezett mintát: Q2 felezi a mintát (tehát megegyezik a mediánnal); Q1 a minta alsó felének, Q3 a felső felének közepe. 5 Interkvartilis terjedelem (IQR): Q 3 Q 1 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 19 / 35

Interkvartilis terjedelem Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 20 / 35

Interkvartilis terjedelem Hallgatók közötti intelligencia-teszt eredménye: 70 80 90 100 110 120 130 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 21 / 35

Lyotard : A posztmodern állapot (1979) vége a nagy elveszéléseknek anything goes posztmodern kor és posztmodern kultúra Vajon mi történik a normákkal? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 22 / 35

Kérem mondja meg a következő állításokról, hogy azokat mindig megengedhetőnek tartja-e (10), vagy soha meg nem engedhetőnek tartja (10, vagy valami a kettő között. Homoszexualitás (1982-1991) Hungary (1982) Hungary (1991) Frequency 0 200 400 600 800 1000 1200 Frequency 0 200 400 600 2 4 6 8 10 2 4 6 8 10 x = 1.447407;σ = 1.419384 x = 2.713547;σ = 3.230236 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 23 / 35

Példa Mi magyarázza az átlagok alacsony különbségét? Frequency 0 50 100 150 200 Frequency 0 100 200 300 400 4 3 2 1 0 1 2 3 0.4 0.2 0.0 0.2 0.4 x = 0.1;σ = 1.019 x = 0;σ = 0.453 Mi a magyarázat arra, hogy az első példában magasabb a szórás? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 24 / 35

Egy eddig elhallgatott leíró statisztikai mutató: szumma Milyen problémát sejtünk a fentebbi ábrához tartozó kutatás mögött? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 25 / 35

Daróczi Gergely (PPKE BTK) Forrás: http://faculty.washington.edu/chudler/stat3.html Statisztika 2012-04-17 26 / 35 Néhány megjegyzés a grafikonokról Palacsintás példa

Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 27 / 35

Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 28 / 35

Néhány megjegyzés a grafikonokról Palacsintás példa Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 29 / 35

Számítások A várható értékről Szükséges képletek: számtani átlag: x = n i=1 x i (becslőfüggvény) n korrigált empirikus szórás: σ = n (x i x) 2 i=1 n standard/mintavételi hiba: SE = σ n konfidencia intervallum: x ± SE z ahol z = 1.96 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 30 / 35

Számítások A várható értékről ( ) 1 x 2 σ 2π exp 2σ 2 0.1% σ 34% 34% 14% 14% 2% 2% 0.1% x 3σ 2σ σ σ 2σ 3σ standard normális eloszlás: x = 0,σ = 1 Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 31 / 35

Számítások Egy nagyon egyszerű példa Játékszabály Egy hatoldalú dobókockával gurítunk: Ha a dobás páratlan, a játékos a dobott összeget megnyeri. Amennyiben a dobás páros, úgy ő fizet két dollárt a banknak. Adatgyűjtés: előzetes számítások helyett belevetjük magunkat a játékba, és a következő értékeket dobjuk. Folytassuk a játékot? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 32 / 35

A mintavételi hiba Egy egyszerű példa X = { 2,2,4, 2, 2,6} x = 2 + 2 + 4 + 2 + 2 + 6 = 6 6 6 = 1 1 = 1 ( 2 1)2 + (2 1) σ = 2 + (4 1) 2 + ( 2 1) 2 + ( 2 1) 2 + (6 1) 2 = 5 9 + 1 + 9 + 9 + 9 + 25 62 = = 5 5 = 12.4 = 3.521363 SE = 3.521363 = 3.521363 6 2.44949 = 1.437591 A várható érték valahol -1.87 és 3.87 között (CI) található 95%-os döntési szinten. Hogyan döntenénk? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 33 / 35

Computation Theoretical solution Felejtkezzünk el az empirikus adatokról egy időre, és vizsgáljuk meg a valódi várható értéket! Density 0.10 0.15 0.20 0.25 0.30 2 0 2 4 6 Winnings Mi a probléma az ábrával? Daróczi Gergely (PPKE BTK) Statisztika 2012-04-17 34 / 35

Köszönöm a figyelmet! Daróczi Gergely daroczi.gergely@btk.ppke.hu