Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

Hasonló dokumentumok
Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

y ij = µ + α i + e ij

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hipotézis vizsgálatok

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Varianciaanalízis 4/24/12

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Bevezetés a hipotézisvizsgálatokba

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Nem-paraméteres (eloszlásmentes) statisztikai módszerek Makara Gábor

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Hipotézis vizsgálatok

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biostatisztika Összefoglalás

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika elméleti összefoglaló

Biostatisztika Összefoglalás

6. Előadás. Vereb György, DE OEC BSI, október 12.

Variancia-analízis (folytatás)

2012. április 18. Varianciaanaĺızis

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Biostatisztika VIII. Mátyus László. 19 October

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Kutatástervezés és értékelés. az egy szempontos ANOVA használata

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

[Biomatematika 2] Orvosi biometria

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biomatematika 2 Orvosi biometria

Több valószínűségi változó együttes eloszlása, korreláció

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Kísérlettervezés alapfogalmak

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Adatok statisztikai értékelésének főbb lehetőségei

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Statisztika Elıadások letölthetık a címrıl

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Többváltozós lineáris regressziós modell feltételeinek

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

[Biomatematika 2] Orvosi biometria

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Eloszlás-független módszerek 13. elıadás ( lecke)

Az első számjegyek Benford törvénye

IV. Változók és csoportok összehasonlítása

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Segítség az outputok értelmezéséhez

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Sztochasztikus kapcsolatok

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

KÖVETKEZTETŐ STATISZTIKA

Matematikai statisztika c. tárgy oktatásának célja és tematikája

ANOVA összefoglaló. Min múlik?

Gyártástechnológia alapjai Méréstechnika rész. Előadások (2.) 2011.

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Valószínűségszámítás összefoglaló

Normális eloszlás tesztje

Többszempontos variancia analízis. Statisztika I., 6. alkalom

Diszkriminancia-analízis

Reiczigel Jenő,

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Logisztikus regresszió október 27.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Kísérlettervezés alapfogalmak

Mérési hibák

Biomatematika 2 Orvosi biometria

Mintavételi eljárások

Least Squares becslés

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Átírás:

Összetett vizsgálati tervek és kiértékelésük Kettő és több szempontos variancia analizis modellek

A kezelések osztályozása Ha legalább két féle beavatkozást vizsgálunk és azokat egymással kombinálva is alkalmazzuk, akkor több szempontos vagy más néven több utas elemzést végzünk (one way ANOVA, two way ANOVA, stb.) Az egyes szempontoknak megfelelő kezeléseket minden vizsgálati alanyon úgy alkalmazzuk, hogy az alany kapjon egy kezelést az 1. szempont szerint és egy kezelést a 2. szempont szerint és így tovább, ha több szempont van és minden kezelést kiosztunk

Miért tervezzünk több szempontos elrendezést? Ha teljesülnek a feltételezések, akkor az optimális hatékonyságú eljárás több kérdés vizsgálatára Jobban véd a véletlen okozta tévedésektől, mint az egyszerűbb vizsgálatok sorozata Közös, nagyobb szabadságfokú becslés adható a véletlen hibára, a populáció varianciájára Közös elsőfajú hiba használható, Jó hatásfokú többes összehasonlító eljárások állnak rendelkezésre Sokféle kérdés és összehasonlítás lehetséges, több, mint az egyszempontos ANOVA esetében

ANOVA modellek x x x M M ij A i ijk ijkl M ij A B i A i j B j AxB C k ij ijk AxB ij AxC ik BxC jk AxBxC ijk ijkl Ahol: i, j, k, l jelöli azt, hogy a többes előfordulásból melyikről beszélünk x ijkl = Az egyes megfigyelések értéke (például x 2,5 az 5. megfigyelés Az utolsó index a csoporton belüli mintaelemeken fut végig M = nagyátlag a második csoportban A, B, C = a kezelések szempontjai, amin belül 2, vagy több kezelés lehet (i darab, j darab, k darab) A x B jelöli az A és B szempontba sorolt kezelések kölcsönhatásait jelzi a véletlennek tulajdonítható, normál eloszlású szóródás változóját (hibavariancia)

Illusztráció a négyzetes összeg felbontásához Adat Átlag Nagy átlag = véletlen komponens csoportosítási komponens rögzített érték

A négyzetes összeg és annak felbontása A minta elemek szórásának vizsgálata során először a négyzetes eltéréseket, majd az összegzett négyzetes eltéréseket vizsgáljuk. Az "átlagos" négyzetes eltérés a variancia, ennek négyzetgyöke a szórás (standard deviáció). A mintaelemekből számított teljes négyzetes összeg olyan összeadandókból áll, amelyek egyes tagjai a szóródást létrehozó különféle tényezőkről, "okokról" tájékoztatnak. A csoportosítási komponens négyzetes összege tovább particionálható, felbontható (additív) komponensekre. Az átlagolt négyzetes összegek (variancia = szórásnégyzet) nem additívak, hanem súlyozottan átlagoltak.

A négyzetes összeg összetevői egy szempont esetén Az A szempont szóródása A véletlen okozta szóródás

A négyzetes összeg összetevői két szempont esetén Az A szempont szóródása A B szempont szóródása Az A x B szempontok kölcsönhatásának szóródása A véletlen okozta szóródás

A négyzetes összeg összetevői három szempont esetén Az A szempont szóródása A B szempont szóródása A C szempont szóródása A szempontok (A, B, C) kölcsönhatásainak (4 db!) szóródása A véletlen okozta szóródás

Két szempontos ANOVA elrendezése (kezelések kiosztása 3x4-es esetben) B szempont B 1 B 2 B 3 B 4 A szempont A 1 A 1 B 1 (n 11 ) A 1 B 2 (n 12 ) A 1 B 3 (n 13 ) A 1 B 4 (n 14 ) A 2 A 2 B 1 (n 21 ) A 2 B 2 (n 22 ) A 2 B 3 (n 23 ) A 2 B 4 (n 24 ) A 3 A 3 B 1 (n 31 ) A 3 B 2 (n 32 ) A 3 B 3 (n 33 ) A 3 B 4 (n 34 )

Két szempontos ANOVA modellje x ij =Nagyátlag+A i +B j +(AxB) ij + ij (ahol (AxB) ij az A i és B j kezelések interakciója) i darab kezelés az A szempont szerint, (úgy mondjuk i -ik szintje A-nak) j darab kezelés a B szempont szerint, kezelésenként (celllánként ugyanannyi eset) n megfigyelés esete Feltételezések 1. A mérések populációi normális eloszlásúak 2. A mérések populációinak eloszlásai homogének 3. A megfigyelések egymástól függetlenek. 4. A szórások nem különbözőek (homoscedascitás) Hipotézis(ek) A nullhipotézis A i =B j =(A i B j )=0, ( ij ) =0, minden i-re és j-re Az alternativ hipotézis A i, B j, (A i B j ) <>0, ( ij ) =0, legalább egy i-re vagy j-re Itt a két szempontú kezelést egymástól függetlenül valósítjuk meg. Minden lehetséges kombinációt alkalmazunk.

Két szempontos ANOVA tábla Forrás sz.fok(df) Négyzetes összeg variancia F P A kezelés i-1 Q A (SS A ) s 2 A (MS A ) s 2 A/s 2 b B kezelés j-1 Q B (SS B ) s 2 B (MS B ) s 2 B/s2 b AxB interakció (i-1)*(j-1) Q AB (SS AB ) s 2 AB ( MS AB ) s 2 AB/s 2 b Mintákon belül ij(n-1) Q B (SS within ) s 2 b (Ms within ) Összes ijn-1 Q összes (SS total ) S 2 összes Négyzetes összeg= Sum of Squares (SS) Variancia=Mean Squares (MS), (SS within ) másképpen (SS error ), (MS within ) másképpen (MS error )

Egyszerű példa a két szempontos ANOVA-ra Vizsgálat célja: stressz hatás és nyugtató kölcsönhatásának vizsgálata Két féle kezelés, két szempont: Stressz és kontroll (két csoport) Nyugtató és kontroll (két csoport) 2x2-es elrendezés - 4 csoport A mérendő változó: plazma kortikoszteron szint 60 perccel a stressz után Statisztikai elrendezés: 2 szempontos ANOVA

Példa: plazma kortikoszteron (μg/dl) stresszben Kontroll (oldószer) Kontroll 9,6 27,5 5,8 12,8 6,3 32,7 7,3 8,7 Nyugtató 12,7 27,7 19,0 8,7 16,0 13,1 5,4 13,1 Stressz 58,0 53,0 65,5 58,3 60,3 49,8 31,5 68,0 30,4 20,9 39,0 27,0 67,5 38,2 17,6 56,0

A példát elemezzük

Egy szempontos ANOVA - randomizált blokkban Értelmezés, az interakció kezelése Két kezelés esetében az egymintás t próbával ekvivalens. Az analízis célja az A kezelés vizsgálata, azon belül, szignifikáns F érték esetében a többszörös összehasonlítás. Az esetleges interakció problémás, mert akkor jó az ilyen elrendezés, ha a blokkokban csoportosított tulajdonság nincs interakcióban a kezelésekkel. Interakció észlelésekor annak okát fel kell deríteni, és a teljesen randomizált, nem blokk elrendezés szerint értékelni. Javaslatok, ajánlások Az elemzés során, ha az interakció nem szignifikáns, akkor annak szabadságfokát, és négyzetes összegét a véletlennek tulajdonítható particióba vonhatjuk be ( angolul pool, pooling), ezzel is javitjuk a véletlen ingadozás becslését. A STATISTICA program erre ad lehetőséget.

Randomizált blokk ANOVA elrendezés Kezelés (A) Blokk (B) B 1 A 1 A 3 A 4 A 2 B 2 A 2 A 3 A 1 A 4 B 3 A 3 A 2 A 4 A 1 Valamilyen ismert tényező szerint homogén blokkokat képezünk, a blokkokon belül a kezeléseket (mindegyikből azonos számút) randomizáltan osztjuk el. Példa: 4 kezelés (A 1,..,A 4 ) elrendezése 3 blokkban (B 1, B 2, B 3 ), ahol minden blokkon belül több (4xn j )megfigyelést végzünk.

Randomizált blokk elrendezés Jelölés: Blokk=B, véletlen változó, ami szóródást okoz az elemzésben A modell Az x ij megfigyelés additív összetevői: X ij =Nagyátlag+A i +Blokk j +(AxBlokk) ij + ij (ahol AxBlokk az A i és B j interakciója) Feltételezések 1. A mérések populációi normális eloszlásúak 2. a mérések populációinak eloszlásai homogének 3. A megfigyelések egymástól függetlenek. Hipotézis(ek) A null hipotézis A i =B j =(A i B j )=0, ( ij ) =0, minden i-re és j-re Az alternativ hipotézis A i, B j, (A i B j ) <>0, ( ij ) =0, legalább egy i-re vagy j-re

Egy szempontos, randomizált blokk ANOVA: "Rejtett" két szempontú ANOVA Forrás sz.fok. (df) Négyzetes összeg variancia F P A kezelés i-1 Q A (SS A) Blokk j-1 Q B (SS Blokk) s 2 A (MS A) s 2 B (MS Blokk) S 2 A/ s 2 b s 2 B/ s 2 b AxBlokk interakció (i-1)*(j-1) Q AB (SS AxBlokk) s 2 AB (MS AxBlokk) s 2 AB/ s 2 b Mintákon belül ij(n-1) Qb (SS within ) s 2 b (MS within ) Összes ijn-1 Q ö (SS total ) s 2 ö i darab kezelés, j darab randomizált blokkban vizsgálva, kezelésenként és blokkonként (cellánként) n darab megfigyeléssel..

"Repeated measures" ANOVA (within subjects) Az önkontrollos kisérletezésnek esete is ide tartozik, egyszerű példa a párosított minták t próbája. Amikor minden egyes vizsgálati alanyon több mérést végeznek, és a kezelések (szempontok) egy része az egyes alanyokon végzett több mérésre vonatkozik. A randomizált blokk elrendezés is egy ide tartozó sajátos eset: a megfeleltetés a blokkon belüli, a blokkok véletlentől függenek Keveredhet az alanyok közötti és az alanyokon/blokkon belüli kezelés Fontos, hogy az ebbe a csoportba tartozó elrendezések nem kezelhetők úgy, mintha az egyes mért változók egymással nem lennének kapcsolatban. Nem függetlenek az időben ismételt megfigyelések. A mért változók közötti összefüggések lehetősége miatt külön eljáráscsoport alkalmazandó, vagy olyan általános ANOVA modellt megvalósító program, amely a repeated measures szempontokat tartalmazó feladatokat a ANOVA/MANOVA (multivariate analysis of variance) eljárással oldja meg.

Faktoriális ANOVA Célja Számos faktor hatásainak és interakciójának szimultán vizsgálata. A legegyszerübb elrendezésben k darab faktort, mindegyiket 2 szinten vizsgálunk Feltételezések Az x ijkl megfigyelés additív összetevői: Pl. k=3 esetén: x ijkl =Nagyátlag+A i +B j +C i +(AxB) ij +(AxC) ik +(BxC) jk +(AxBxC) ijk + ijkl (ahol AxB stb. a faktorok interakciója) Feltételek: A megfigyelések egymástól függetlenek, a mérések populációi normális eloszlásúak stb. Hipotézisek A nullhipotézisek: a vizsgált faktor szintjeinek hatásában nincs különbség, illetve a vizsgált kölcsönhatás nem lép fel (A i =0 stb.) Az alternativ hipotézis ezek tagadásai: van legalább egy nem 0 (kölcsön)hatás Megjegyzések Sok csoport, sok mérés kell hozzá. Minél több a faktor, annál nehezebb az egyöntetûség biztosítása. Többszintû interakciók vannak a kísérleti elrendezésben, ezek néha nehezen értelmezhetőek.

Három szempontos ANOVA tábla Forrás sz.fok.(df) Négyzetes összeg variancia F P A kezelés a-1 QA (SSA) B kezelés b-1 QB (SSB) C kezelés c-1 QC (SSC) AxB interakció (a-1)*(b-1) QAB (SSAB) AxC interakció (a-1)*(c-1) QAC (SSAC) BxC interakció (b-1)*(c-1) QBC (SSBC) s2 A (MSA) s2 B (MSB) s2 C (MSC) s2 AB (MSAB) s2 AC (MSAC) s2 BC (MSBC) s2 A/ s2 b s2 B/ s2 b s2 C/ s2 b s2 AB/ s2 b s2 AC/ s2 b s2 BC/ s2 b AxBxC interakció (a-1)*(b-1)* *(c-1) QABC (SSABC) s2 ABC (MSABC) s2 ABC/ s2 b Mintákon belül abc(n-1) Qbelső (SSwithin) Összes abcn-1 Qösszes (SStotal) s2 belső (MSwithin) s2 összes Angol terminológia: SS= sum of sqares, MS=mean sqares

A reprodukálhatóság függ a H 0 és H 1 valószínűségétől Szignifikáns kimenetel Nem-szignifikáns kimenetel H 0 igaz Fals pozitív (α) Igaz negatív (1 α) H 1 igaz Igaz pozitív (1 β) Fals negatív (β) Ha a H 0 igaz voltának valószínűsége 50% Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 80%*50%=40% Fals negatív 20%*50%=10% CC-BY Daniel Lakens, Improving your statistical inferences, by Eindhoven University of Technology

A reprodukálhatóság függ a H 0 és H 1 valószínűségétől Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 80%*50%=40% Fals negatív 20%*50%=10% Ha β = 1% ot választunk Szignifikáns kimenetel α = 5%, 1-β = 99% Nem-szignifikáns kimenetel 1-α = 95%, β = 1% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 99%*50%=49,5% Fals negatív 1%*50%=0,5% CC-BY Daniel Lakens, Improving your statistical inferences, by Eindhoven University of Technology

A reprodukálhatóság függ a H 0 és H 1 valószínűségétől Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 80%*50%=40% Fals negatív 20%*50%=10% Szignifikáns kimenetel α = 1%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 99%, β = 20% Ha α = 1%-ot választunk H 0 igaz (50%) Fals pozitív 1%*50%=0,5% Igaz negatív 99%*50%=49,5% CC-BY Daniel Lakens, Improving your statistical inferences, by Eindhoven University of Technology H 1 igaz (50%) Igaz pozitív 80*50%=40% Fals negatív 20%*50%=10%

A reprodukálhatóság függ a H 0 és H 1 valószínűségétől Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 80%*50%=40% Fals negatív 20%*50%=10% Ha a H 0 igaz voltának valószínűsége 10% Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (10%) Fals pozitív 5%*10%=0,5% Igaz negatív 95%*10%=9,5% H 1 igaz (90%) Igaz pozitív 80*90%=72% Fals negatív 20%*90%=18% CC-BY Daniel Lakens, Improving your statistical inferences, by Eindhoven University of Technology

A reprodukálhatóság függ a H 0 és H 1 valószínűségétől Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (50%) Fals pozitív 5%*50%=2,5% Igaz negatív 95%*50%=47,5% H 1 igaz (50%) Igaz pozitív 80%*50%=40% Fals negatív 20%*50%=10% Ha a H 0 igaz voltának valószínűsége 90% Szignifikáns kimenetel α = 5%, 1-β = 80% Nem-szignifikáns kimenetel 1-α = 95%, β = 20% H 0 igaz (90%) Fals pozitív 5%*90%=4,5% Igaz negatív 95%*90%=85,5% H 1 igaz (10%) Igaz pozitív 80*10%=8% Fals negatív 20%*10%=2% CC-BY Daniel Lakens, Improving your statistical inferences, by Eindhoven University of Technology

A reprodukálhatóság krízise a tudományos szakirodalomban A jelenség a tudományos szakcikkeknek töredékét sikerült utánvizsgálatokban reprodukálni. Az okok Tervezési hibák, alacsony elemszám és az ismeretlen statisztikai erő Értelmezési hibák: a null hipotézis, p érték és a konfidencia intervallum fogalmában Eredmények szelekciója, a negatív kutatási eredmények nem nyilvánosak Rejtett (vagy eltitkolt) többszörös összehasonlítások Adatok manipulálása szignifikancia elérésére A javítás módszerei A biostatisztikai oktatása színvonalának javítása Hatásméret, elemszám, reprodukálhatóság szintjének tervezése Adatmanipulálási szokások tárgyalása Megbízható negatív eredmények számára közlési lehetőség Biostatisztikai módszertani leírás, biostatisztikai lektorálás Tervezés lektorálása, nyilvánosan regisztrált kutatások elterjesztése A reprodukálhatóság vizsgálatának tudományos értékként elismerése Open Data közlés

(Bio)statisztikai hibák és orvoslásuk a jobb reprodukálhatóságért Tervezés Hatásméret, megfelelő elemszám és a statisztikai erő (power) A tervezési folyamatban szerepeljen a reprodukálhatóság becslése A szórás és a hatás méret szerepeljen a paraméterek között A feltáró és a megerősítő vizsgálatok megkülönböztetése Adattisztítás szabályainak rögzítése Biostatisztikai szemlélet A hipotézis vizsgálat, a p érték és a konfidencia intervallum gondos értelmezése A fals pozitivitási esély becslése, értelmezése A szignifikancia szó használatának mellőzése Többszörös összehasonlítás a kutatási folyamatban: Adathalászat sok mérés között a szignifikáns esetek feltüntetése tervezett vizsgálatként Adat manipulálás módszerei szignifikancia elérésére Kedvezőtlen adatok kihagyása a szórás csökkentésére Menet közbeni esetszán növelés a p<0,05 eléréséig A negatív kimenetelű kutatási eredmények kezelése A pozitív eredmények közlésében a negatív vizsgálatok is megjelenítendőek A kutatási hipotézisek negatív eredményű tesztelésének közlése