Matematikai statisztika Gazdaságinformatikus MSc 11. előadás 2018. november 26. 1/31
A tojást rakó kutya - a könyv Hans Peter Beck-Bernholdt, Hans-Hermann Dubben: A tojást rakó kutya c. könyve alapján 2/31
A tojást rakó kutya - a sztori 3/31
Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 4/31
Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 4/31
Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. 4/31
Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. Kb minden 1000-edik turista kapja el. 4/31
Ugatókór Egy turista hallotta, hogy abban az egzotikus országban, ahol nyaralt, felütötte a fejét a canine overhoe (ún. ugatókor) betegség. Elvégeztet egy tesztet, mert korai stádiumban felfedezve a betegséget, egy kis műtéttel gyógyítható. 100 fertőzöttből 99-et azonosít a teszt, 1-et nem. 100 nem fertőzött közül 98-ról álĺıtja, hogy egészséges, 2-ről tévesen, hogy beteg. Kb minden 1000-edik turista kapja el. A turistával néhány nap után közlik, hogy a vizsgálat pozitív volt. Mekkora az esélye annak, hogy megkapta a betegséget? 98%, 95%, 92%, 50%, 5%, 2%? 4/31
5/31
6/31
Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe 7/31
Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe A betegség gyakoriságát viszont nem (prevalencia) 7/31
Mi a tévedés oka? Csak a teszt megbízhatóságát vesszük figyelembe A betegség gyakoriságát viszont nem (prevalencia) Pl AIDS teszt esetén: Pozitív eredmény estén az eredeti vérmintával elvégeznek egy második, költségesebb, de pontosabb tesztet is. (Immunobot-próba). Ha ez is pozitív, akkor újabb vérmintát vesznek a pácienstől, amin elvégzik az immunobot tesztet. Ha ez is pozitív, akkor kezdik el a kezelést. 7/31
Időbeli sűrűsödés 8/31
Térbeli sűrűsödés Hamburgban átlagosan 30 leukémiás megbetegedés fordul elő egy évben. Harminc szimulált leukémiás beteg címét a telefonkönyvből véletlenszerűen választottak ki. Winterhude városrészben szemmel láthatóan sűrűbb a megbetegedések előfordulása. 9/31
Térbeli sűrűsödés Hamburgban átlagosan 30 leukémiás megbetegedés fordul elő egy évben. Harminc szimulált leukémiás beteg címét a telefonkönyvből véletlenszerűen választottak ki. Winterhude városrészben szemmel láthatóan sűrűbb a megbetegedések előfordulása. Ilyen jelenség szinte minden hasonló jellegű vizsgálatban előfordul. vetődés... Árnyékra 9/31
Véletlen vagy törvényszerű? Egy éjszakai ellenőrzés során 6000 autót megálĺıtva 84 vezetőt ittasnak találtak. Tehát az sofőrök 1,5%-át. Ezután egy felvilágosító kampányba kezdtek. 10/31
Véletlen vagy törvényszerű? Egy éjszakai ellenőrzés során 6000 autót megálĺıtva 84 vezetőt ittasnak találtak. Tehát az sofőrök 1,5%-át. Ezután egy felvilágosító kampányba kezdtek. Két hónappal később megismételve az éjszakai ellenőrzést, 400 autóból csak kettő sofőrje volt ittas, ez 0,5%. Vagyis harmadára csökkent az arány. Sikeres volt a kampány? 10/31
Véletlen vagy törvényszerű Eredmény: χ 2 = 2, 2 < 3, 84, azaz nem szignifikáns az eredmény (13,8% a véletlen valsége!) 11/31
5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul 12/31
5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul Átlagosan ez minden 20. eredményt érinti! 12/31
5% A konvenció jelentése: Adott eredmény 5% valséggel a véletlenen alapul Átlagosan ez minden 20. eredményt érinti! Régebben 0,27%-os tévedési eséllyel dolgoztak 12/31
5% 13/31
5% - Független tesztek 14/31
5% - Független tesztek 16 tanulmány mindegyike egyenként 16 paramétert elemez. A fekete négyzetek a téves pozitív eredmények. A véletlenfüggő szignifikáns paraméterek aránya most is csak 5% (13/256), de a 16 tanulmányból 9 (56%) téves eredményt hoz ki. 14/31
5% 15/31
5% Ha 81 a paraméterek száma, és most is csak 5%-os hibával számolunk, a téves eredmény valószínűsége már 98,4% lesz! 15/31
5% Autógyártás: 50 kritikus alkatrész 16/31
5% Autógyártás: 50 kritikus alkatrész Új autóban 99,9% az alkatrészek megbízhatósága Használt autóban 99,8% Régi autóban: 95% 16/31
5% 17/31
Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. 18/31
Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától 18/31
Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) 18/31
Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) A vizsgált minta nagyságától 18/31
Másodfajú hiba Nem találunk szignifikáns különbséget nem bizonyítja, hogy nincs semmilyen különbség. Mitől függ, hogy észreveszünk-e egy létező eltérést? A különbség nagyságától Az elsőfajú hiba valószínűségétől (egyszerre csak egyik minimalizálható) A vizsgált minta nagyságától Minél pontosabb kérdéseket tesz fel egy vizsgálat, annál kevesebb beteggel kénytelen beérni, s így a válasz is egyre pontatlanabb lesz. Minél pontatlanabb a kérdés, statisztikai szempontból annál pontosabb lesz a válasz. 18/31
Igazsággal csalni 19/31
Igazsággal csalni 20/31
Igazsággal csalni 21/31
Igazsággal csalni 22/31
Igazsággal csalni Az A gyógyszerrel a szívkoszorúér megbetegedések halálozási rátája 2,0%-ról 1,6%-ra csökkenthető. Ez a 0,4%-os csökkenés statisztikailag szignifikáns. 23/31
Igazsággal csalni Az A gyógyszerrel a szívkoszorúér megbetegedések halálozási rátája 2,0%-ról 1,6%-ra csökkenthető. Ez a 0,4%-os csökkenés statisztikailag szignifikáns. A B gyógyszerrel történő kezelés relatívan 20%-al csökkenti a a szívkoszorúér megbetegedések miatt bekövetkező elhalálozások számát. Ez a csökkenés statisztikailag szignifikáns. 23/31
Igazsággal csalni 24/31
Igazsággal csalni 25/31
Hibás következtetések 26/31
Hibás következtetések Mennyiség vs hányad. 26/31
Hibás következtetések 27/31
Hibás következtetések A grafikon torzít, hiszen nem veszi figyelembe a vizsgált időszak alatt a megnövekedett várható élettartamra. Ez az adat az 50 alatti nőkre nincs hatással, csak az ötven felettiekre... 27/31
Simpson paradoxon Álĺıtás: egy cég a férfi jelentkezők nagyobb hányadát veszi fel mint a női jelentkezőkénél (4%-al). 28/31
Simpson paradoxon 29/31
Simpson paradoxon 29/31
logika 30/31
Köszönöm a féléves munkát! Vége 31/31