Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31

Hasonló dokumentumok
[Biomatematika 2] Orvosi biometria

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hipotézis vizsgálatok

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

KÖVETKEZTETŐ STATISZTIKA

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Bevezetés a hipotézisvizsgálatokba

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

BME Nyílt Nap november 21.

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotézis vizsgálatok

Adatok statisztikai értékelésének főbb lehetőségei

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Többváltozós lineáris regressziós modell feltételeinek

Statisztikai becslés

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Kettőnél több csoport vizsgálata. Makara B. Gábor

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Arisztotelesz Kr.e. 350 körül írta logikai műveit, melyek egyrésze elveszett, a többit 300 évvel később

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztikai módszerek 7. gyakorlat

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

EPIDEMIOLÓGIA I. Alapfogalmak

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

Biomatematika 13. Varianciaanaĺızis (ANOVA)

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

6. Előadás. Vereb György, DE OEC BSI, október 12.

y ij = µ + α i + e ij

Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Biostatisztika VIII. Mátyus László. 19 October

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

1. Két pályázat esetén a nyerési esélyeket vizsgálják. Mintát véve mindkét pályázat esetén az egyik. (b) Mit nevezünk másodfajú hibának?

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

X PMS 2007 adatgyűjtés eredményeinek bemutatása X PMS ADATGYŰJTÉS

Függetlenségvizsgálat, Illeszkedésvizsgálat

nem kezelt 1.29, 1.60, 2.27, 1.31, 1.81, 2.21 kezelt 0.96, 1.14, 1.59

Környezet statisztika

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

AZ EGÉSZSÉGESEN ÉS A FOGYATÉKOSSÁG NÉLKÜL LEÉLT ÉVEK VÁRHATÓ SZÁMA MAGYARORSZÁGON

Autóipari beágyazott rendszerek. Kockázatelemzés

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Az első számjegyek Benford törvénye

Normális eloszlás tesztje

Mikor hazudnak a számok?

Hajléktalanság keletkezése, megszűnése és alakváltozásai I.

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Asszociációs szabályok

[Biomatematika 2] Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság

DSD DSD. Az új Nemzeti Rákregiszter előnyei kutatói szempontból. Kovács László Szentirmay Zoltán Surján György Gaudi István Pallinger Péter

A minőség és a kockázat alapú gondolkodás kapcsolata

Biomatematika 2 Orvosi biometria

Markov modellek

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

A magyar lakosság vitaminbevitelének. Schreiberné Molnár Erzsébet, Bakacs Márta

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.

Nemzeti Onkológiai Kutatás-Fejlesztési Konzorcium 1/48/ Részjelentés: November december 31.

ÉRZÉS NÉLKÜLI ÁLLAPOTOK Az ájulással összefüggésbe hozható pszichés sajátosságok Disszociáció és alexitímia vizsgálata syncopés betegek körében

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

ÁLLAMI SZÁMVEVŐSZÉKRŐL - ÁBRÁK -

Diszkrét idejű felújítási paradoxon

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A évi hőhullám expozíció, egészségi hatás és módosító tényezők összefüggésének kistérségi modellezése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószínűségszámítás és statisztika

GYORSTESZTEK ALKALMAZÁSA A

Romics Imre, Majoros Attila

Irányított TULAJDONSÁGRA IRÁNYULÓ Melyik minta sósabb?, érettebb?, stb. KEDVELTSÉGRE IRÁNYULÓ Melyik minta jobb? rosszabb?

Tájékoztatott vagy tájékozott beteg kérdése

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Átírás:

Matematikai statisztika Gazdaságinformatikus MSc 11. előadás 2018. november 26. 1/31

A tojást rakó kutya - a könyv Hans Peter Beck-Bernholdt, Hans-Hermann Dubben: A tojást rakó kutya c. könyve alapján 2/31

A tojást rakó kutya - a sztori 3/31

Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 4/31

Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 4/31

Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. 4/31

Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. Kb minden 1000-edik turista kapja el. 4/31

Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. Kb minden 1000-edik turista kapja el. A turistával néhány nap után közlik, hogy a vizsgálat pozitív volt. Mekkora az esélye annak, hogy megkapta a betegséget? 98%, 95%, 92%, 50%, 5%, 2%? 4/31

5/31

6/31

Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe 7/31

Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe A betegség gyakoriságát viszont nem (prevalencia) 7/31

Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe A betegség gyakoriságát viszont nem (prevalencia) Pl AIDS teszt esetén: Pozitív eredmény estén az eredeti vérmintával elvégeznek egy második, költségesebb, de pontosabb tesztet is. (Immunobot-próba). Ha ez is pozitív, akkor újabb vérmintát vesznek a pácienstől, amin elvégzik az immunobot tesztet. Ha ez is pozitív, akkor kezdik el a kezelést. 7/31

Időbeli sűrűsödés 8/31

Térbeli sűrűsödés Hamburgban átlagosan 30 leukémiás megbetegedés fordul elő egy évben. Harminc szimulált leukémiás beteg címét a telefonkönyvből véletlenszerűen választottak ki. Winterhude városrészben szemmel láthatóan sűrűbb a megbetegedések előfordulása. 9/31

Térbeli sűrűsödés Hamburgban átlagosan 30 leukémiás megbetegedés fordul elő egy évben. Harminc szimulált leukémiás beteg címét a telefonkönyvből véletlenszerűen választottak ki. Winterhude városrészben szemmel láthatóan sűrűbb a megbetegedések előfordulása. Ilyen jelenség szinte minden hasonló jellegű vizsgálatban előfordul. vetődés... Árnyékra 9/31

Véletlen vagy törvényszerű? Egy éjszakai ellenőrzés során 6000 autót megálĺıtva 84 vezetőt ittasnak találtak. Tehát az sofőrök 1,5%-át. Ezután egy felvilágosító kampányba kezdtek. 10/31

Véletlen vagy törvényszerű? Egy éjszakai ellenőrzés során 6000 autót megálĺıtva 84 vezetőt ittasnak találtak. Tehát az sofőrök 1,5%-át. Ezután egy felvilágosító kampányba kezdtek. Két hónappal később megismételve az éjszakai ellenőrzést, 400 autóból csak kettő sofőrje volt ittas, ez 0,5%. Vagyis harmadára csökkent az arány. Sikeres volt a kampány? 10/31

Véletlen vagy törvényszerű Eredmény: χ 2 = 2, 2 < 3, 84, azaz nem szignifikáns az eredmény (13,8% a véletlen valsége!) 11/31

5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul 12/31

5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul Átlagosan ez minden 20. eredményt érinti! 12/31

5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul Átlagosan ez minden 20. eredményt érinti! Régebben 0,27%-os tévedési eséllyel dolgoztak 12/31

5% 13/31

5% - Független tesztek 14/31

5% - Független tesztek 16 tanulmány mindegyike egyenként 16 paramétert elemez. A fekete négyzetek a téves pozitív eredmények. A véletlenfüggő szignifikáns paraméterek aránya most is csak 5% (13/256), de a 16 tanulmányból 9 (56%) téves eredményt hoz ki. 14/31

5% 15/31

5% Ha 81 a paraméterek száma, és most is csak 5%-os hibával számolunk, a téves eredmény valószínűsége már 98,4% lesz! 15/31

5% Autógyártás: 50 kritikus alkatrész 16/31

5% Autógyártás: 50 kritikus alkatrész Új autóban 99,9% az alkatrészek megbízhatósága Használt autóban 99,8% Régi autóban: 95% 16/31

5% 17/31

Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. 18/31

Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától 18/31

Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) 18/31

Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) A vizsgált minta nagyságától 18/31

Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) A vizsgált minta nagyságától Minél pontosabb kérdéseket tesz fel egy vizsgálat, annál kevesebb beteggel kénytelen beérni, s így a válasz is egyre pontatlanabb lesz. Minél pontatlanabb a kérdés, statisztikai szempontból annál pontosabb lesz a válasz. 18/31

Igazsággal csalni 19/31

Igazsággal csalni 20/31

Igazsággal csalni 21/31

Igazsággal csalni 22/31

Igazsággal csalni Az A gyógyszerrel a szívkoszorúér megbetegedések halálozási rátája 2,0%-ról 1,6%-ra csökkenthető. Ez a 0,4%-os csökkenés statisztikailag szignifikáns. 23/31

Igazsággal csalni Az A gyógyszerrel a szívkoszorúér megbetegedések halálozási rátája 2,0%-ról 1,6%-ra csökkenthető. Ez a 0,4%-os csökkenés statisztikailag szignifikáns. A B gyógyszerrel történő kezelés relatívan 20%-al csökkenti a a szívkoszorúér megbetegedések miatt bekövetkező elhalálozások számát. Ez a csökkenés statisztikailag szignifikáns. 23/31

Igazsággal csalni 24/31

Igazsággal csalni 25/31

Hibás következtetések 26/31

Hibás következtetések Mennyiség vs hányad. 26/31

Hibás következtetések 27/31

Hibás következtetések A grafikon torzít, hiszen nem veszi figyelembe a vizsgált időszak alatt a megnövekedett várható élettartamra. Ez az adat az 50 alatti nőkre nincs hatással, csak az ötven felettiekre... 27/31

Simpson paradoxon Álĺıtás: egy cég a férfi jelentkezők nagyobb hányadát veszi fel mint a női jelentkezőkénél (4%-al). 28/31

Simpson paradoxon 29/31

Simpson paradoxon 29/31

logika 30/31

Köszönöm a féléves munkát! Vége 31/31