Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Elemszám becslés Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Miért fontos? Gazdasági okok: Túl kevés elem esetén nem tudjuk kimutatni a kívánt hatást Túl kevés elem esetén olyan eredmény kimutatására pazaroljuk az erőt, amely gyakorlatilag nem érdekes Etikai szempontok Tudományos: Ha elegendő elemszám esetén kapunk negatív eredményt, akkor az eredményt tudjuk értelmezni Ha nem elegendő esetszám esetén kapunk negatív eredményt, klinikailag fontos hatást dobhatunk ki az ablakon 9. Elemszámbecslés

Az elemszámbecslést meghatározó (befolyásoló) tényezők A kutatás célja (becslés, hipotézis vagy ekvivalencia) A fő hatásmutató (outcome): kategórikus v. folytonos, egy vagy több, elsődleges, másodlagos.. és a hatásmutató eloszlásának - korábbi vizsgálatokon alapuló becslése I. fajta hiba valószínűsége,α A próba ereje (1-β) (1-II. fajta hiba valószínűsége) a választott értékelési módszer a klinikailag jelentősnek ítélt hatás A feltételek rögzítése után a mintaelemszámot a választott statisztikai próbának megfelelő módszerrel számítják ki

Hipotézisek felállítása Null-hipotézis: semmi nem történt Alternatív hipotézis: valami változás van A döntés megbízhatósága (vagy a hiba) rögzítése: α=0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, α-tól, az elemszámtól) Döntés A hipotézisvizsgálat menete A null-hipotézist elfogadjuk (nincs szignifikáns különbség α szinten, nincs elegendő információ a különbség (hatás) kimutatására) A null-hipotézist elvetjük, a különbség szignifikáns α%-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.

Hipotézis vizsgálat Null-hipotézis: A és B kezelés között nincs különbség A vádlott mindaddig ártatlan, amíg az ellenkezője bizonyítást nem nyer Alternatív hipotézis: A és B kezelés között van különbség A vád igaz

Az ítélkezés A statisztika hibái p : ( probability, valószínűség) Elsőfajú (α)-hiba: Bűnösnek ítéljük az ártatlant 5-1%-ban szokás korlátozni (p<0.05; p<0.01) Másodfajú (β)-hiba Ártatlannak ítéljük az bűnöst (~10-20%) (Nem fogadjuk el a Null-hipotézis, vagy az alternatív hipotézis vizsgálat eredményét) Erő (Power of the study) 1-β= 80-90% Annak esélye (%): Ártatlannak ítéljük az ártatlant, mert Nincs erő-analízis (mintaméret meghatározás)

Statisztikai hibák Hipotézisvizsgálat során a minták alapján az összehasonlítandó populációkról döntést hozunk: vagy azt állítjuk róluk, hogy különbözők, vagy azt, hogy azonosak. Bárhogyan döntünk is, nem tudhatjuk, hogy helyesen döntöttünk-e, mivel a valóságot nem ismerjük (a hipotézisvizsgálatot éppen ezért végezzük). Helyesen döntöttünk, ha különbséget állapítottunk meg és a populációk valóban eltérők, vagy ha nem állapítottunk meg különbséget, és a populációk valóban azonosak. Igazság Döntés nem vetjük el H 0 -t elvetjük H 0 -t H 0 igaz helyes döntés első fajta hiba, Type I. error valószínűsége: α H 0 hamis második fajta hiba helyes döntés Type II.error valószínűsége: β

Első fajta hiba, Type I. error Előfordulhat, hogy szignifikáns különbséget állapítunk meg, pedig valójában nincs különbség. Ebben az esetben a döntés hibás, az elkövetett hibát első fajta hibának nevezik, nagyságát elkövetésének valószínűségével szokás megadni. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ez éppen a szignifikanciaszinttel egyenlő (α). Ha több összehasonlítást végzünk, pl. több csoportot páronként hasonlítunk össze, ez a hiba halmozódhat.

Második fajta hiba, Type II.error Hipotézisvizsgálat során nem állapítunk meg szignifikáns különbséget, pedig valójában azaz a populációk között mégis van különbség. Ebben az esetben a döntés hibás, az így elkövetett hibát második fajta hibának nevezik. A második fajta hiba valószínűségét (β) általában nem ismerjük, mivel függ a szignifikanciaszinttől (α), az elemszámtól, a populáció(k) szórásától tényleges különbség (hatás) nagyságától egyéb tényezők (milyen próba, a feltételek teljesülése, a kísérleti elrendezés,..) A második fajta hiba valószínűségének kiszámítását az nehezíti, hogy nem ismerjük a populációk közötti tényleges különbséget, így gyakran ehelyett a megfelelőnek tekintett különbséget (pl. a legkisebb klinikailag jelentős különbség), vagy a minták átlagai alapján becsült különbséget alkalmazzák. A populáció szórását pedig a minta(ák)ból számolt szórással közelítik.

A próba ereje A második fajta hiba valószínűsége helyett inkább (1 β)-t, a próba erejét szokták megadni. A próba ereje azt méri, hogy a próba milyen jó abban az esetben, ha elvetjük a hamis null hipotézist. Minél erősebb a próba, (minél közelebb van értéke 1-hez), annál nagyobb valószínűséggel veti el a hamis null hipotézist. Másképpen: a próba ereje annak valószínűsége, hogy egy különbséget adott mintanagyság és szignifikancia-szint mellett egy statisztikai próba kimutat. A vizsgálatok tervezésének gyakorlatában az erő nagyságának előre megszabott értékéből kiindulva határozzák meg a szükséges mintaelemszámot. A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé teszi adott esetén.

PS, Power and Sample Size 1 0.8 0.6 0.4 0.2 0 0 5 10 15 20 25 Difference in Population Means

Ajánlás Nemszignifikáns eredmény diszkussziójakor ha nem volt előzetes elemszámbecslés meg kell adni a próba erejét. Kis erejű nemszignifikáns eredményt nem lehet úgy értelmezni, hogy az összehasonlított változók (csoportok) azonosak.

Példa A mintaelemszám meghatározás korábbi retrospektív vizsgálat alapján történt. Ahhoz, hogy posztoperatív komplikációk klinikailag jelentős csökkenését ki tudjuk mutatni az URI és URI-mentes gyerekek között (42%-ról 23%-ra), 94 eset kell csoportonként (α= 0.05 and β= 20%, kétoldalas teszt). Sample size determination was based on our previous retrospective study using overall postoperative complications as the outcome measure. Based on the clinically important difference in incidence of this outcome between children with URIs and those without URIs (i.e., 42 vs. 23%), we calculated that we would need 94 subjects per group to detect a statistically significant difference at least that large ( α= 0.05 and β= 20%, two tailed). S. Malviya, T. Voepel-Lewis, M. Siewert,, U. A. Pandit,, Lori Q. Riegger, Alan R. Tait. Risk Factors for Adverse Postoperative Outcomes in Children Presenting for Cardiac Surgery with Upper Respiratory Tract Infections. Anesthesiology 2003; 98:628 32.