Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely május 8. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 27. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely február 20. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely február 23. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely február 28. Politológia Tanszék

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztika. Politológus képzés. Daróczi Gergely március 13. Politológia Tanszék

Elemi statisztika fizikusoknak

Bevezetés a hipotézisvizsgálatokba

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Biomatematika 2 Orvosi biometria

A társadalomkutatás módszerei I. Outline. 1. Zh Egyéni eredmények. Notes. Notes. Notes. 9. hét. Daróczi Gergely november 10.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Mintavételi eljárások

A társadalomkutatás módszerei I.

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Adatok statisztikai értékelésének főbb lehetőségei

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Kutatásmódszertan és prezentációkészítés

Adattípusok, ábrák és grafikonok az excelben

BIOMETRIA_ANOVA_2 1 1

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

KISTERV2_ANOVA_

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05. A kutatás dokumentációja

KÖVETKEZTETŐ STATISZTIKA

Logisztikus regresszió október 27.

Normál deviza és forint elszámolási értéknapok évben

Biostatisztika VIII. Mátyus László. 19 October

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Statisztika. Politológus képzés. Daróczi Gergely március 20. Politológia Tanszék

Grafikonok az R-ben március 7.

[Biomatematika 2] Orvosi biometria

A statisztika alapjai - Bevezetés az SPSS-be -

Alkalmazott statisztika feladatok

Az fmri alapjai Statisztikai analízis II. Dr. Kincses Tamás Szegedi Tudományegyetem Neurológiai Klinika

Regisztrál álláskeresők alakulása évben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Esetelemzések az SPSS használatával

A társadalomkutatás módszerei I.

Idõ-ütemterv há lók - I. t 5 4

Korreláció és lineáris regresszió

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Többszempontos variancia analízis. Statisztika I., 6. alkalom

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Aszályindexek és térképezési lehetıségeik. Lakatos Mónika, Szentimrey Tamás, Bihari Zita OMSZ

Nemparaméteres próbák

SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA

WIL-ZONE TANÁCSADÓ IRODA

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

A társadalomkutatás módszerei I.

Idő-ütemterv hálók - I. t 5 4

SPSS ALAPISMERETEK. T. Parázsó Lenke

Hipotézis vizsgálatok

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Minőség-képességi index (Process capability)

Minőségjavító kísérlettervezés

Mérési adatok illesztése, korreláció, regresszió

Változók eloszlása, középértékek, szóródás

[Biomatematika 2] Orvosi biometria

Kabos Sándor. Térben autokorrelált adatrendszerek

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Az R statisztikai programozási környezet: az adatgyűjtéstől a feldolgozáson és vizualizáción át a dinamikus jelentéskészítésig

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Logisztikus regresszió

Statisztikai becslés

Polarizáló beruházások és változó gazdasági térszerkezet az átmenet Kínájában

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Normális eloszlás tesztje

Biomatematika 2 Orvosi biometria

Sztochasztikus kapcsolatok

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Változás SPSS állomány neve: Budapest, 2002.

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Statistical Inference

A társadalomkutatás módszerei I.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Többváltozós lineáris regressziós modell feltételeinek

Okozati következtetések levonása megfigyeléses adatokból

Átírás:

Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2011. május 4.

Outline 1 Korreláció 2 Standardizálás és dekompozíció 3 Grafikonok, ábrák Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 2 / 33

Korreláció Valós kapcsolat? 5 10 15 20 60 70 80 90 Wind (miles per hour) Temperature (degrees Fahrenheit) Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 3 / 33

Korreláció Valós kapcsolat? Temp 5 10 15 20 60 70 80 90 0.46*** 60 70 80 90 5 10 15 20 Wind Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 3 / 33

Korreláció Valós kapcsolat? May Jun Jul Aug Sep Oct 60 70 80 90 date Temp May Jun Jul Aug Sep Oct 5 10 15 20 date Wind Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 3 / 33

Korreláció Valós kapcsolat? date 60 70 80 90 0.39*** 15100 15150 15200 15250 0.17 * 60 70 80 90 Temp 0.46*** 15100 15150 15200 15250 5 10 15 20 5 10 15 20 Wind Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 3 / 33

Kereszttábla Egy klinikai példa Kettős vak, randomizált kísérletet végeztünk végzős orvostanhallgatók körében. A kísérleti gyógyszert, ill. placebo-t fogyasztó alanyok egy éven keresztül minden nap benették a kiosztott pirulákat, majd a kísérlet végeztével az infarktusra való hajlamot vizsgálták: szívroham nincs szívroham Aspirin 104 10933 placebo 189 10845 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 4 / 33

Kereszttábla Egy klinikai példa szívroham nincs szívroham ráta (1000 fő) Aspirin 104 10 933 11 937 9.4 Placebo 189 10 845 11 034 17.1 293 21 778 22 071 13.3 szívroham nincs szívroham Aspirin 0,9 % 99,1 % 100 % Placebo 1,7 % 98,3 % 100 % 1,3 % 98,7 % 100 % Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 5 / 33

Kereszttábla Egy klinikai példa Heart Attack? Yes No Total Aspirin 104 10933 11037 146.52 10890.48 Placebo 189 10845 11034 146.48 10887.52 Total 293 21778 22071 Chi-Sq = 12.339 + 0.166 + 12.343 + 0.166 = 25.014 DF = 1, P-Value = 0.000 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 6 / 33

Kereszttábla Egy klinikai példa tizede Heart Attack? Yes No Total Aspirin 10 1093 1103 14.49 1088.51 Placebo 19 1085 1104 14.51 1089.49 Total 29 2178 2207 Chi-Sq = 1.393 + 0.019 + 1.392 + 0.019 = 2.822 DF = 1, P-Value = 0.093 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 7 / 33

Standardizálás és dekompozíció Egy egyszerű példán keresztül bemutatva Henderson & Velleman (1981): Building multiple regression models interactively Weight (t) 1.0 1.5 2.0 2.5 50 100 150 200 250 300 Horsepower Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 8 / 33

Standardizálás és dekompozíció Egy egyszerű példán keresztül bemutatva Henderson & Velleman (1981): Building multiple regression models interactively Standardized weight (t) 1 0 1 2 1 0 1 2 Standardized horsepower Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 8 / 33

Standardizálás és dekompozíció A standardizálás egyszerű esete Normált érték (z-values, z-scores, normal scores, standardizált változó) alatt azt értjük, hogy a megfigyelések az átlagtól hány szórásnyira esnek: z = x µ σ Diamonds Diamonds Frequency 0 5000 15000 25000 Frequency 0 5000 15000 0 5000 10000 15000 20000 Price (USD) 1 0 1 2 3 4 Price (standardized) Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 9 / 33

Standardizálás és dekompozíció Dekompozíció Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 10 / 33

Standardizálás és dekompozíció Közvetlen transzformáció Meghatározás Közvetlen transzformáció (direct standardization) során a rétegspecifikus arányokat, rátákat értelmezzük a teljes populációra jellemző rétegnagyságokon. ráta = rétegspecifikus arány standard súlyok standard súlyok Miami = Alaska = (1.19x23,961) + + (39.11x10,685) 91, 208 (1.59x23,961) + + (39x10,685) 91, 208 = 6.92 = 6.71 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 11 / 33

Standardizálás és dekompozíció Közvetett transzformáció Meghatározás A közvetett transzformáció (indirect standardization) esetében pontosan fordítva, a teljes populációból származtatjuk az arányokat/rátákat, a súlyokat pedig a rétegek alapján számoljuk. tapasztalt értékek ráta = várt értékek Várt értékek = Rétegspecifikus súlyok populációbeli arányok/ráta Minta Alapsokaság Directly-standardized rate ráta súly Indirectly-standardized rate súly ráta Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 12 / 33

Csoportosított oszlopdiagram Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 13 / 33

Rétegzett oszlopdiagram Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 14 / 33

Rétegzett oszlopdiagram Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 15 / 33

Vonal Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 16 / 33

Kördiagram Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 17 / 33

Kördiagram Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 18 / 33

Kördiagram Very Good Good Premium Fair Ideal Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 19 / 33

Kördiagram Ideal Premium Very Good Good Fair 5000 10000 15000 20000 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 19 / 33

Dot plot Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 20 / 33

Dot plot Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 21 / 33

Terület Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 22 / 33

Terület Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 22 / 33

Összetett, kombinált grafikonok Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 23 / 33

Összetett, kombinált grafikonok Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 23 / 33

Poláris Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 24 / 33

Heatmap Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 25 / 33

Heatmap Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 25 / 33

Heatmap Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 25 / 33

Waterfall Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 26 / 33

Boxplot Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 27 / 33

Violin plot Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 28 / 33

Mosaic chart Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 29 / 33

Szófelhő Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 30 / 33

Crayola Color Chart, 1903-2010 Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 31 / 33

Érdekes, felkeresésre javasolt honlapok: http://www.visual-literacy.org/periodic_table/periodic_table.html http://www.edwardtufte.com/tufte/ http://www.perceptualedge.com/ http://www.visualcomplexity.com/vc/ http://flowingdata.com/ http://infosthetics.com/ http://chartsgraphs.wordpress.com/ http://www.informationisbeautiful.net/ http://chartporn.org/ Daróczi Gergely (PPKE BTK) Statisztika 2011-05-04 32 / 33

To be continued... Daróczi Gergely daroczi.gergely@btk.ppke.hu