A statisztika veszélyei (Darrell Huff: How to Lie with Statistics, 1954)

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

y ij = µ + α i + e ij

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

A kutatás folyamán vizsgált, egyes kiemelt jelentőségű változók részletes

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Érveléstechnika-logika 7. Filozófia és Tudománytörténet Tanszék 1111 Budapest, Sztoczek J. u fsz. 2.

[Biomatematika 2] Orvosi biometria

IV. Felkészítő feladatsor

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

II. A következtetési statisztika alapfogalmai

Asszociációs szabályok

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Kutatásmódszertan és prezentációkészítés

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Tények és tévhitek az Országos kompetenciamérés adatairól. Oktatási Hivatal Köznevelési Programok Főosztálya

Populációbecslések és monitoring

Mérési eljárások kidolgozása látók és látássérültek lokalizációs képességeinek összehasonlítására

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Populációbecslések és monitoring

FELHŐTLEN GYERMEKKOR

Heckman modell. Szelekciós modellek alkalmazásai.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Tájékoztató a gyermekbénulásos betegek történetéről és helyzetéről.

ANOVA összefoglaló. Min múlik?

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Az értékelés során következtetést fogalmazhatunk meg a

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Az Országos Epidemiológiai Központ Tájékoztatója az influenza surveillance adatairól Magyarország hét

Matematikai statisztikai elemzések 2.

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

KÖVETKEZTETŐ STATISZTIKA

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek

Egészségértés: Híd a jobb egészséghez

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

S a t ti a s ti z s ti z k ti a k i a i soka k s a ág Megfigyelési egység Statisztikai ismérv

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

VÁLTOZÁSOK A SZEGÉNYSÉG STRUKTÚRÁJÁBAN

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Online melléklet. Kertesi Gábor és Kézdi Gábor. c. tanulmányához

Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31

MINŐSÉGFEJLESZTÉSI BESZÁMOLÓ

1/8. Iskolai jelentés. 10.évfolyam matematika

Kettőnél több csoport vizsgálata. Makara B. Gábor

ISKOLAKEZDÉS, AHOGY A CSALÁDOK LÁTJÁK

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Az Országos Epidemiológiai Központ Tájékoztatója az influenza surveillance adatairól Magyarország hét

3. Öt alma és hat narancs 20Ft-tal kerül többe, mint hat alma és öt narancs. Hány forinttal kerül többe egy narancs egy

Mintavétel a gyakorlatban. Tóth Gergely ELTE-TÁTK, Doktori iskola Statisztika tanszék

A társadalomkutatás módszerei I.

Normális eloszlás tesztje

2. Adott a valós számok halmazán értelmezett f ( x) 3. Oldja meg a [ π; π] zárt intervallumon a. A \ B = { } 2 pont. függvény.

Kő, papír, olló és a snóbli

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

18. modul: STATISZTIKA

ÁLLATOK KLINIKAI VIZSGÁLATAI

[Biomatematika 2] Orvosi biometria

KOMPETENCIA MÉRÉS ÉVFOLYAM

ÉVKÖZI MINTA AZ EGÉSZSÉGÜGYI BÉR- ÉS LÉTSZÁMSTATISZTIKÁBÓL. (2007. III. negyedév) Budapest, március

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Elemi statisztika fizikusoknak

Az Országos Epidemiológiai Központ tájékoztatója az influenza figyelőszolgálat adatairól Magyarország hét

Jobb a csapvíz, mint az Evian?

A Statisztika alapjai

Biomatematika 2 Orvosi biometria

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Intenzíven terjed az influenza

ÉVKÖZI MINTA AZ EGÉSZSÉGÜGYI BÉR- ÉS LÉTSZÁMSTATISZTIKÁBÓL. (2006. II. negyedév) Budapest, augusztus

Statisztika feladatok (emelt szint)

Hatvány gyök logaritmus

6. Előadás. Vereb György, DE OEC BSI, október 12.

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Statisztika Elıadások letölthetık a címrıl

Tovább csökkent az influenzaszerű megbetegedések száma

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Matematikai statisztikai elemzések 5.

Az Országos Epidemiológiai Központ tájékoztatója az influenza figyelőszolgálat adatairól Magyarország hét

GYORSELEMZÉS. Bérek alakulása a 2016-ban kötött országos bérmegállapodás tükrében

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

ÚTMUTATÓ A MÓDSZERTANI SZIGORLAT LETÉTELÉHEZ

Biomatematika 2 Orvosi biometria

Mérési hibák

Mintavétel a gyakorlatban

Átírás:

A statisztika veszélyei (Darrell Huff: How to Lie with Statistics, 1954)

Háromfajta hazugság van: füllentés, hazugság és statisztika. (Disraeli) A legnagyobb problémát nem az jelenti, amit nem tudunk, hanem az, amit tudunk de rosszul. (Artemus Ward) A kerek számok mindig hazudnak. (Samuel Johnson)

A 24 éve Yale-en végzett átlagos diák évente 25111 dollárt keres (Time magazin) Mi a gond ezzel? Túl pontos Hogyan készült? Bevallott kereset alapján Az ember hajlamos többet mondani a valósnál Pl. Egy átlag amerikai napi 1,02 alkalommal mos fogat Csak azok, akiket sikerült elérni Inkább a sikeres vagy inkább a rosszul keresőket nehezebb megtalálni?...

Torzított minta 1936-os választás előtt telefonos szavazás Telefonos felmérés: 370 Landonra, 161 Rooseveltre szavazott Választást mégis Roosevelt nyerte hogyhogy? Ok: a telefonnal rendelkezők nem reprezentatív minta volt XY pszichiáter szerint lényegében mindenki neurotikus. Kivel szokott találkozni legtöbbet?...

Torzított minta Véletlen minta tesztje: A csoport minden tagját egyenlő eséllyel vesszük figyelembe? Mintavételezés nehézsége: Utcán -> otthon maradtak? Nappal -> éjszakai dolgozók? Általános torzítás: Több pénz Magasabb képzettség Jobb megjelenés

Melyik átlagot használjam? A környéken élők átlagos bevétele 15000 dollár. A környéken élők átlagos bevétele 3500 dollár. Mindkettő igaz hogy lehet ez? 15000 dollár: számtani közép 3500 dollár: medián 5000 dollár: módusz

Melyik átlagot használjam? Cég: 90 dolgozó, fejenként 2200 dollár Három cégvezető, fejenként 11000 dollár Év végén 45000 dollár profit maradt mi a teendő? 1. opció: profitot 3-felé osztjuk Dolgozók átlag bére: 2200 dollár Vezetők átlagos bére profittal: 25000 dollár 2. opció: 30000 dollárt 3-felé osztunk prémiumként Átlagbér: 2806 dollár (CÉGVEZETŐKKEL EGYÜTT!!!) Vezetők profitja: 5000 dollár

Melyik átlagot használjam? 1949-ben egy amerikai család átlagos keresete 3100 dollár volt. (Forrás: statisztikai hivatal) Kérdés: Mi az átlag? Medián. Mi a család? Két vagy több egy háztartásban élő személy. Valódi eredmény: 3107±59 dollár (p=95%) Jelentés: 20-ból 19-szer legfeljebb 59 dollárral tér el ettől az értéktől Szignifikancia (p) értékét a minta mérete határozza meg

Kis minták előnyei Független, akkreditált laboratóriumok mérései mutatják, hogy a Doakes fogkrém 23%-kal csökkenik a fogszuvasodást. Hogyan lehetséges? Kis minta (12 fő) Ha nem jó, próbáld újra Nagy számok törvénye -> előbbutóbb összejön

Kis minták előnyei Kísérlet: érmedobás 10x Eredmény: 8 fej, 2 írás Tudományosan igazolt, hogy az érme az esetek 80%-ban fejre esik.

Kis minták előnyei Mekkora az elég? Attól függ Polio védőoltás: 450 gyermek beoltva, 680 nem (kontrollcsoport) Eredmény: járványban egyik beoltott gyerek sem lett beteg A kontrollcsoportból sem Ok: polio előfordulási aránya: 2% Sokkal nagyobb mintára lett volna szükség

Kis minták előnyei Átlagos amerikai család mérete 3,6 fő. Házépítők csak ezt vették figyelembe Valóság: 3-4 fős családok: 45% 1-2 fős családok: 35% >4 fős családok: 20% Jobb megoldás: intervallum

Kis minták előnyei Gesell-normák: A gyerekek átlagosan x hónapos korukban kezdenek járni Szülői ertelmezés: Ha <x: visszamaradott Ha >x: fejlettebb az átlagnál Tény elvárás Megfigyelés etikai értékelés Intervallum jobb

Kis minták előnyei

Mérési hibák Átlag IQ: 100 Péter: 98 -> visszamaradt? Linda: 101 -> szuperokos? Valóság: IQ mérési hibája 3% Péter: 98±3 Linda: 101±3 Valóság: normál IQ tartomány: 90-110 Soha ne felejtsük el a ±-t (sokszor nincs ott!)

24 Varázslatos grafikonok 22.0 0

Varázslatos grafikonok

Játék az ábrákkal There the le ft

Játék az ábrákkal 10 millió tonna 14 millió tonna 8 millió liter 25 millió liter

Csúsztatások Laboratóriumi vizsgálatok igazolják, hogy X megfázás elleni gyógyszer 31108 pusztított el. Milyen baktérium? Laboratórium valós élet Rasszizmus vizsgálata: Ugyanannyi esélye van-e a színes- és fehérbőrű munkavállalóknak? Minél rasszistább valaki, annál inkább igennel válaszolt

Csúsztatások A doktorok többsége (27%) X cigarettát szív. Na és? Este 7-kor 4x annyi baleset történik, mint reggel 7-kor. Vajon miért?... Ilyen alapon a tiszta idő veszélyesebb, mint a ködös idő. Több ember halt meg repülőbalesetben tavaly, mint 20 évvel ezelőtt.

Csúsztatások Van-e valami panasza a vezetőség ellen? -> Az emberek 78%-a le akarja váltani a vezetőséget. A háború alatt 4x annyian haltak meg New Yorkban, mint a tengerészetnél. -> A tengerészet biztonságosabb. X polgármester megválasztása előtt a tanárok minimum fizetése bizonyos államokban 900 dollár volt. [ ] Ma a tanárok fizetése New York-ban 2500 és 5325 dollár között mozog.

Ok és okozat Az A óra pontosan akkor üt éjfélt, mint a B óra. -> A B óra ütését az A okozza. A dohányosok átlaga rosszabb. -> Ha leszokom, jobbak lesznek a jegyeim. Szoros korreláció van a lelkészek fizetése és a rum ára között. -> A lelkészek benne vannak a rumiparban. (INFLÁCIÓ!) Post hoc logikai hiba: ha A-ból következik B, akkor A okozta B-t

Trükkös térkép

Családok átlagkeresete Statisztikai hivatal szerint 3100 dollár Russell Alapítvány szerint 5004 dollár Teljes jövedelem / Teljes lakosság * Átlag családméret Mi ezzel a probléma?

Játék a százalékokkal

Játék a százalékokkal Számtani közép: 200 + 50 2 = 125% Mértani közép: 200 50 = 100%

Önvédelmi kérdések Ki mondja? Honnan tudja? Mekkora a méret? Mik a hiányzó adatok? Megváltozott-e a téma? Van-e értelme?