Adatok statisztikai feldolgozása Kaszaki József Ph.D Szegedi Tudományegyetem Sebészeti Műtéttani Intézet Szeged
A mérési adatok kiértékelése, statisztikai analízis A mért adatok konvertálása adatbázis kezelőbe (Excel) Az adatbázis elkészítése; Ábra készítés; Statisztikai analízis Az adatok eloszlás típusa, eloszlás vizsgálata Elemszám, átlag/medián, adatok szórása; Konfidencia intervallum; Szignifikancia szint; P érték;
5. A mérési adatok kiértékelése, statisztikai analízis 1. A mért adatok konvertálása adatbázis kezelőbe (Excel) 2. Az adatbázis elkészítése; 3. Ábra készítés; 4. Statisztikai analízis Van kis hazugság Van nagy hazugság és a STATISZTIKA
5. Statisztikai analízis Az adatok jellemzői: eloszlás, átlag v. medián, szórás; Konfidencia (megbízhatósági) intervallum: amely (általában) nagy valószínűséggel tartalmazza a becsült paraméter valódi értékét; Szignifikancia szint P érték: a statisztikai valószínűség értéke; Statisztikailag szignifikáns különbségről beszélünk, (P = <0.05), ha az átlag értékek különbsége a vizsgált csoportok között nagyobb, mint amit a véletlen idézhetne elő; Eloszlás vizsgálat: A/ Szórás azonosság fennáll: Paraméteres eloszlás (Gausz görbe) Paraméteres statisztikai próbák B/ Nincs szórás azonosság: Nem-paraméteres eloszlás (torz Gausz görbe) Nem-Paraméteres statisztikai próbák
Az adatok eloszlása Eloszlás vizsgálat
Normális eloszlás Gaus görbe Szórás azonosság Átlag ±SD Paraméteres statisztikai próbák -SD Átlag +SD
Nem normális eloszlás Torzult Gaus görbe Nincs szórás azonosság Medián (25%; 75%) Nem-Paraméteres statisztikai próbák Medián 25% átlag 75%
Eloszlás vizsgálat módszere: A szórás azonosság vizsgálata, F próba Eloszlás vizsgálat eredménye: A/ Szórás azonosság fennáll: Paraméteres eloszlás (Gausz görbe) Paraméteres statisztikai próbák B/ Nincs szórás azonosság: Nem-paraméteres eloszlás (torz Gausz görbe) Nem-Paraméteres statisztikai próbák
A közép és a szóródás jellemzőinek párosítása Közép Átlag Medián Szóródás Standard deviáció, Standard error Min, max 5%-os, 95%-os percentilis 25 %, 75% (Kvartilisek) Közlés cikkekben Átlag (SD) Átlag ± SD Átlag ± SE Átlag ± SEM Med (min, max) Med (25.p,75.p)
SD vagy SE? 55.2 ± 15.7 (SD) 55.2±1.57 (SE, n=100) 0.26 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 Probability Density Function y=normal(x;52.2;1.57) 1.0 0.8 0.6 0.4 0.2 0.00 20 40 60 80 0.0 23.8 86.6 52.2 55.34 Ebben az intervallumban van az adatok 95.44%-a Ebben az intervallumban van az igazi átlag 95%-os valószínűséggel 1. Leíró statisztika
Standard deviáció vagy standard error?? Standard deviáció, SD: a minta szórása, a mintaadatok szóródása az átlag körül. Normális eloszlás esetén az átlag ±2SD-n belül van az adatok kb. 95%-a Standard error (SE=SD/ n): az átlag megbízhatósága, a mintaátlag szóródása az (ismeretlen) populáció átlag körül. Normális eloszlás esetén az átlag ± 2SE-n belül van az igazi átlag kb. 95%-os valószínűséggel.
ml/perc/kg 200 180 Box-plot ADATOK ÁBRÁZOLÁSA Szívindex Pont-vonal Átlag+SD Medián+25%,75% 160 140 120 100 80 60 Műtét 0 1 2 3 Idő (óra) Műtét 0 1 2 3 4 Idő (óra)
Ábrázolás: Medián érték 25.-75. percentilissel CVP (Hgmm) 10 8 Kolloid Krisztalloid x x x x x 6 4 2 0 50 50 100 100 150 150-15 0 15 30 45 60 75 90 105 Idő (perc)
Ábrázolás: Átlag érték SD-val Szívindex (ml/perc/m 2 ) 5,0 4,5 4,0 Kolloid Krisztalloid X 3,5 3,0 50 50 100 100 150 150-15 0 15 30 45 60 75 90 105 Idő (perc)
A KONTROL I. Mit tekintünk kontrollnak? Mit viszonyítunk mihez? A kontrollnak azt az állapotot kell tükröznie, amelyhez képest egy beavatkozás következtében fellépő változás mértéke meghatározható Kontroll érték (baseline) normál körülmények között, a tervezett beavatkozás előtt mért érték ön-kontrollos kísérlet Baseline. 0 60 90 150 240 min Hemorrhagic shock 60 min Resuscitation Az ön-kontroll nem mindig adekvált. Hosszabb időtartamú vizsgálatok esetében számos tényező (pl. altatás) befolyásolhat. Ezért beavatkozás nélküli, önálló kontroll csoportra van szükség ál-műtött (ál-kezelt) csoport.
A KONTROL II. Ha egy kórállapotot befolyásoló farmakológiai kezelés hatékonyságát vizsgáljuk A kezelés hatását egy negatív és egy pozitív kontroll csoport adataihoz hasonlítjuk Negatív kontroll olyan állapot, amelyben a vizsgált paraméterek változása minimális nincs intervenció; Pozitív kontroll olyan állapot, amely során a vizsgált paraméterek maximális mértékű változását hozzuk létre maximal intervenció;
Pl.: Ha kísérletes pleuritis hatását vizsgáljuk a thorakális leukocyta szám változására: Negatív kontroll = ál-műtét, kórállapot okozása nélkül (NINCS pleuritis); Pozitív kontroll: Kísérletesen indukált pleuritis (carrageenan injekció). Leukocytes/ml X 8000 6000 4000 # # 2000 0 Control Pleuritis Pleuritis Pleuritis +ASA +PE food
A kísérleti CSOPORTOK Kontroll: pozitív, negatív, ál-műtött; Előkezelt (pl. gyógyszeresen); Kezelt (a már indukált folyamat közben); Kísérleti beavatkozásnak (pl. sebészi) kitett; etc.
A kísérleti PROTOKOL A kísérlet periódusainak egymást szigorú időrendben követő sorozata, amely általában a kontroll, az intervenció és a megfigyelés periódusaiból áll. Szigorú, előre meghatározott időrendben elvégzett mérések, mintavételezések sorozata. Kontroll / baseline A kísérletes intervenció sebészi; pathofiziológiai; farmakológiai (előkezelés/ kezelés hatása) A megfigyelési periódus
I/A A kísérleti PROTOKOL típusai I. Before and After Két mérés ugyanazon az egyeden; Beavatkozás ELŐTT és UTÁNNA. A statisztika szempontjából egymástól függő mérések; I/B Két csoport összehasonlítása Csak egy-egy mérés/mintavétel mindkét vizsgált csoportban; A két csoport 1-1 (azonos) időpillanatbeli eltérésének összehasonlítása; Kontroll Kezelt csoportok esete; A statisztika szempontjából egymástól független mérések;
I/A ml/perc/kg 200 180 Egy-egy mérés ugyanazon az egyeden; a beavatkozás ELŐTT és UTÁNA Szívindex Átlag+SD Medián+25%,75% 160 140 120 100 80 60 Műtét 0 1 2 3 Idő (óra) Műtét 0 1 2 3 4 Idő (óra)
I/B Egy-egy mérés a mindkét vizsgálati csoportban, ugyanazon időpontban Kontroll Kezelt csoportok esete; mu/mg protein/perc Miafrancáz Aktivitás 100 75 50 25 0 Kontroll csoport Kezelt csoport
Folytonos eloszlás 2 minta (mérés) esetén Normális eloszlás Paraméteres próbák Nem Normális eloszlás Nem Paraméteres próbák Független Függő Önkontroll Független Függő Önkontroll Kétmintás t-próba Unpaired t-test Egymintás t-próba Paired t-test Mann-Whitney teszt Kétmintás próba Wilcoxon teszt Egymintás próba Két beteg csoporton 1-1 mérés Egy beteg csoporton 2 mérés Két beteg csoporton 1-1 mérés Egy beteg csoporton 2 mérés
Kettőnél több csoport összehasonlítása Mintavétel EGY időpontban Negativ kontroll, Pozítiv kontroll, Kezelt A, Kezelt B csoportok összehasonlítása; Speciális eset: mintavétel ugyanazon az egyed kezelt és nem kezelt végtagjából
3.6. A kísérleti PROTOKOL típusai II. Kettőnél több csoport összehasonlítása mu/mg protein/min 80 60 X X Sham I/R+Saline I/R+GEL I/R+HES 40 20 0 Ischemic limb Control limb P<0.05 vs control limb Negatív kontroll (álműtött), Pozitív kontroll (I/R), Kezelt I. (I/R+GEL), Kezelt II. (I/R+HES) összehasonlítása; Statisztika szempontjából Független mérések
Kettő csoport összehasonlítása DE mintavétel a beavatkozás előtt és után is történik KÉT csoport 2-2 mérés
DEGRANULÁLT LT HÍZÓSEJTEK H ARÁNYA VÉKONYBÉL L XANTHIN OXIDÁZ ENZIMAKTIVITÁS Degranulált hízósejt / Összes hízósejt (%) pmol/perc -1 /mg protein -1 18 80 60 SBTX SBTX+IPC # 16 14 12 10 SBTX SBTX+IPC # 40 8 6 20 4 0 IPC Hideg ischaemia -180-120 -60 0 180 240 Idő (perc) 2 0 IPC Hideg ischaemia -180-120 -60 0 180 240 Idő (perc)
A kísérleti PROTOKOL típusai III. Ismételt (kettőnél több) mérések esete egy csoportban Kettőnél több mérést/mintavételt végzünk ugyanazon az egyeden, meghatározott időrend szerint. A vizsgált paraméter változását a kiindulási kontroll (baseline) értékhez hasonlítjuk; Baseline. 0 60 90 150 240 min Hemorrhagic shock 60 min Resuscitation Statisztika szempontjából Egymástól függő mérések
Kettő csoport összehasonlítása, ismételt, 2-nél TÖBB mintavételezéssel KÉT csoport n - n mérés n>2
CARDIAC OUTPUT MESENTERIC BLOOD FLOW 200 CObw (ml/min/kg) SMA blood flow (ml/min/kg) SBTX 175 150 125 100 # # 25 20 15 SBTX+IPC # # 75 50 25 0 IPC SBTX SBTX+IPC Cold Ischemia -180-120 -60 0 60 120 180 240 Time (min) 10 5 0 IPC Cold Ischemia -180-120 -60 0 60 120 180 240 Time (min)
Ismételt mérések: Mérések a Kontroll periódus (baseline), a Beavatkozás (sebészi, farmakológiai) és a Megfigyelési periódus alatt, meghatározott időrendben; Több csoportban - 2-nél TÖBB mérés
A kísérleti PROTOKOL típusai IV. Ismételt mérések kettőnél több csoportban 1. Vérzéses shock + zselatin (max. 50 ml/kg) (n=5) 0 60 90 150 240 perc MAP 45 Hgmm 60 perc Kontroll. 2. Vérzéses shock + hidroxietil-keményítő (max. 50 ml/kg) (n=5) 0 60 90 150 240 perc MAP 45 Hgmm 60 perc Kontroll 3. Vérzéses shock + dextrán (max. 50 ml/kg) (n=5) 0 60 90 150 240 perc MAP 45 Hgmm 60 perc Kontroll Statisztika szempontjából: Egymástól függő mérések csoporton belül; Egymástól független mérések csoportok között;
fmol/ml 12 Plasma Endothelin Level 10 8 6 4 Gelatine HES Dextran # 2 0 Hemorrhagic shock Volume resuscitation 0 30 60 90 120 150 180 210 240 Time (min) P<0.05 vs baseline value (0 min) # P<0.05 vs HES group
Szignifikancia Szignifikáns a különbség ha azt mondjuk, hogy van hatás, az esetleges hibanagysága kicsi (maximum α). Ez az ún. első fajta hiba. Nem szignifikáns a különbség ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy Valóban nincs is különbség Van különbség, csak kevés volt az elemszám Nagy volt a szórás Rossz volt a vizsgálati módszer A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e (előfordul, hogy túl sok elemszám esetén nagyon kis különbségek is szignifikánsak staisztikailag)
A hipotézisvizsgálat menete Hipotézisek felállítása Nullhipotézis: semmi nem történt Alternatív hipotézis: valami változás van A döntés megbízhatósága (vagy a hiba) rögzítése: α=0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, α-tól, az elemszámtól) Döntés A nullhipotézist elfogadjuk (nincs szignifikáns különbség α szinten, nincs elegendő információ a különbség (hatás) kimutatására) A nullhipotézist elvetjük, a különbség szignifikáns α%-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.
Előnyei: Paraméteres statisztikai próbák Jól megalapozott, sarkos matematikára épül; Az átlag és a szórás ismerete elegendő a statisztikai próbák, elvégzéséhez, tehát nem a teljes adathalmazzal kell dolgozni; A paraméteres próbák erősebbek, ha a feltételek teljesülnek A próbák robusztusak- feltételeik kisebb megsértése esetén még érvényesek maradnak Hátrány : Ábrázolás esetén a feltüntetett szórás (± SD) mindig nagyobb, mint a nem-paraméteres eloszlásnál használt 25-75 percentilis
Rangszámok készítése 1 2 4 1 Sorba állítjuk az adatokat: 1 1 2 4 A legkisebb kapja az 1-es rangszámot, a legnagyobb az n-et: 1 2 3 4 Korrekció (kapcsolt rangok): az egyenlő elemek rangszámait korrigáljuk a megfelelő rangok átlagával: 1.5 1.5 3 4
A próbastatisztika általában valamilyen rangszámösszeg Önkontrollos kísérlet: a különbségeket rangsoroljuk előjeltől függetlenül (a 0-kat kihagyjuk), majd az egyenlő előjelűeket összeadjuk Független minták: a minták adatait egyesítjük, így készítjük el a rangssort, majd összeadjuk külön az egyik, külön a másik mintűhoz tartoó rangszámokat. Ha igaz a nullhipotézis, a rangszámösszegek kb. megegyeznek
Előnyei: Nem-paraméteres statisztikai próbák A szórás ábrázolása esetén (25-75 percentilis) általában kisebb szórást mutat, mint a ±SD; Hátrányai: Az átlag és a szórás ismerete NEM elegendő a statisztikai próbák elvégzéséhez, mindig a teljes adathalmazzal kell dolgozni; Kevésbé kidolgozott a matematikája, különösen a több szempontos, ismételt mérések esetére
Nem paraméteres próbák Akkor alkalmazzuk, ha A paraméteres próbák feltételei nem teljesülnek Nem tudjuk ellenőrizni (kis elemszám) Nem akarjuk ellenőrizni Ordinális változók (mennyire örülök a tavasznak??? Kicsitközepesen-nagyon) NEM HASZNÁLHATOK ÁTLAGOT ÉS SZÓRÁST!! A fiziológiai paraméterek gyakrabban mutatnak nem normális eloszlást;
Normális eloszlás Paraméteres próbák Folytonos eloszlás Kettőnél több minta (mérés) esetén Nem Normális eloszlás Nem Paraméteres próbák Független Függő Független Függő Kettőnél több Csoport össze- Hasonlítása Egy v. több szempontos Variancia analízis Önkontroll + Ismételt mérések Variancia analízis Kettőnél több Csoport össze- Hasonlítása Kruskal-Wallis próba Önkontroll + Ismételt mérések Friedmann próba Az adatok szignifikanciája esetén: Páronkénti összehasonlítás: Dunnett, LSD, Tukey, Scheffé Az adatok szignifikanciája esetén: Páronkénti összehasonlítás: Dunn; Dunnett; 3 v. több beteg csoporton 1-1 mérés Egy beteg csoporton 3, v. több ismételt mérés 3 v. több beteg csoporton 1-1 mérés Egy beteg csoporton 3, v. több ismételt mérés