Biometria 2. előadás Biostatisztika = Biometria = Orvosi statisztika Néhány egyszerű definíció: A statisztika olyan tudomány, amely a tömegjelenségekkel kapcsolatos tapasztalati törvényeket megfigyelések és mérések segítségével tárja fel. A statisztika véletlen jelenségek leírásával foglalkozik, melyek kimenetelét különböző okok miatt nem lehet 1% biztonsággal megjósolni. A statisztika elkészítésének menete: 1. Mérés (adatok összegyűjtése, számszerűsítése) 2. Kiértékelés (adatok feldolgozása, statisztikai módszerek alkalmazása) 3. Következtetések levonása (óvatosság!) 4. Döntés 213. február 4. A biostatisztika az élővilággal kapcsolatos jelenségeket matematikai módszerekkel elemző tudomány. Modell a biológiában és orvostudományban Modell: a valóság olyan közelítése, amely bizonyos egyszerűsítéssel megőrzi annak leglényegesebb tulajdonságait és alkalmas a valóság törvényszerűségeinek feltárására. Jellemző rá, hogy: (i) leírható matematikai formalizmus segítségéval (ii) kísérletek segítségével ellenőrizhető (iii) predikciók tehetők a jövőre nézve Egy példa a determinisztikus modellre: A cukor vizes oldata a lineárisan poláros fény rezgési síkját jobbra forgatja. A savas hidrolízis a molekulát D-fruktózra és D-glukózra bontja, a D-fruktóz erősen balraforgató, így a reakció során az optikai forgatás előjelváltását figyelhetjük meg (inverzió), ahogy a D-fruktóz mennyisége felszaporodik. A modellek osztályozása: (i) determinisztikus: (adott feltételek mellett) a kísérletnek csakis egy lehetséges kimenetele van * véletlen hibák (ii) sztochasztikus: (legalább egy véletlen elem is található, így adott feltételek mellett) a kísérletnek több lehetséges kimenetele van Ha ismerjük egy rendszer mostani állapotát (a teljes múltját is akár), akkor sem tudjuk teljes biztossággal a jövőbeli állapotát * találgatás * biológiai variabilitás Optikai aktivitás: (i) Szacharóz jobbraforgató (ii) D-fruktóz balraforgató A jobbraforgatás csökkenése a cukor inverziós reakciója során. a i jelenti a forgatás szögét a reakció végén, míg a az elforgatás szöge egy tetszőleges t időpillanatban. 1
Miért determinisztikus modell? Ha az elforgatás szöge egy tetszőleges t időpillanatban ismert, a reakció tetszőleges állapota egyértelműen meghatározható a feltételezett modell alapján, azaz adott feltételek mellett a kísérletnek egy csakis egy lehetséges kimenetele van, azaz a rendszer jövőbeni állapotát a rendszer múltja egyértelműen meghatározza. Egy példa a sztochasztikus modellre: Dern és Wiorkowski 1969-ben 17 családban vizsgálták meg a legfiatalabb és a legidősebb fiúnál az eritrociták ATP szintjét. Az ATP szint (M/g hemoglobin) lényeges faktor, meghatározza a vérből a különböző sejtek számára az energiaátadás lehetséges mértékét. A vizsgálat eredeti célja a vérkészítmények tárolása során bekövetkező változások analízise volt, vajon a tárolás mennyire befolyásolja az eritrociták ATP tartalmát. A vizsgálat során kiderült, hogy az eritrociták ATP szintje tárolás előtt is lényegesen különbözik egymástól. A kísérleti adatokból a fiatal és idősebb fiúk ATP szintjei között egyértelmű hozzárendelés nem tehető, az adatok csak egy sajátos - egyenessel közelíthető - tendenciát mutatnak: az idősebb testvér nagyobb ATP szintje esetén a fiatalabb testvér ATP szintje is magasabb. Ilyen típusú tendencia esetén struktúrált sztochasztikus modellről beszélünk. Mit várunk? Van valamilyen tendenia! Biológiai variabilitásnak meg kell mutatkoznia: genetika környezet placebo mérési hiba 2
Miért sztochasztikus modell? Keressük a lineáris összefüggést! (i) a testsúly és testmagasság között egyértelmű hozzárendelés nem tehető, csupán (ii) (egy egyenessel közelíthető) sajátos tendencia figyelhető meg: magasabb embereknek nagyobb (lehet) a súlyuk Tehát nem lehet egyértelműen megjósolni a független változó egy adott értékéhez tartozó függő változó értékét, azaz olyan rendszerrel van dolgunk, amelyben a mérés várható eredménye bizonytalan, a kísérletnek több lehetséges kimenetel is van Még egy példa a sztochastikus modellre: Baktériumok növekedése A placebó problémája Három fájdalomcsillapító - Aspirin, Codis és Distalgesic - hatását vizsgálták placeboval keresztezett kísérleti elrendezésben (cross-over design). A páciensek egymást követő együtt izületi fájdalmak csillapítására (Huskisson, 1974). Huszonkét pácienst kezeltek ú.n. periódusokban gyógyszert, majd placebot kaptak. Legyen: *1 db baktérium kezdetben (t=) * átlagosan 3 óránként osztódnak Determinisztikus modell: ahol a megoldás: Sztochasztikus modell: * biológiai rendszerek tipikus sztochasztikus rendszerekként kezelhetők * az oszódás folyamatának 3 lehetséges kimenetele látható * a sztoch tendencia mintha zaj lenne a determinisztikus tendenciát követve 3
Adatok feldolgozása, gyakorisági eloszlások, hisztogram Mérésnél vagy kísérletnél általában a következő feltételek teljesítése kívánatos: a./ a vizsgálandó mennyiség a folyamat jellemzésére megkívánt pontossággal mérhető, b./ a mérési eljárás kellő érzékenységet biztosít, c./ a mérés kellő pontossággal reprodukálható, d./ a mért mennyiség az illető folyamatra specifikus, e./ a mérés fejezze ki a komplex változás lényegét, azaz a mérés releváns, kellő kifejező erővel bír, f./ a mérésre kiválasztott mennyiség vagy tulajdonság legyen alkalmas időbeli folyamat során a közbülső állapotokban a különbségek kimutatására, g./ a mérés legyen konvertibilis, a mért mennyiség nagyságából lehessen visszakövetkeztetni a vizsgálni kívánt tulajdonság nagyságára, h./ a méréssel járó beavatkozás a vizsgálandó objektumban vagy a vizsgálandó folyamatban ne okozzon torzítást, i./ a mérés legyen technikailag könnyen keresztülvihető, j./ a mérési folyamat legyen gazdaságos, csak a szükséges számú és típusú mérést végezzük el, k./ olyan konstrukciót célszerű választani, amely nem jár emberi vagy környezeti veszélyeztetéssel. Fogalmak Populáció: A statisztikai megfigyelés tárgyát képező egyedek összességét populációnak nevezzük. pl: Ha az emberek átlagos várható élettartamát vizsgáljuk, akkor az emberiség egésze. Ha a megfigyelés célja csak a magyar nők vizsgálata, akkor az összes magyar nő alkotja. A populáció elemei: az egyedek Egy populációról kétféleképpen szerezhetünk információt: 1. Cenzus 2. Minta (+ kontroll csoport) Reprezentatív mintavétel: elemeknek egymástól függetlennek kell lennie, a kiválogatás véletlenszerű Fogalmak Változó: a mért adat különböző számértékű lehet a populáció egyes elemeinél pl: M 1 biológiai rendszeren (determinisztikus séma) A M 2 biológiai rendszeren (sztochasztikus séma) A 1, A 2, A 3,, A n ahol A ill. A 1, A 2, A 3,, A n az X változó egy-egy értéke. a kísérlet lehetséges kimenetele Mivel az X változó értékét egy-egy esemény esetében véletlen tényezők befolyásolják, ezért X-et valószínűségi vagy véletlen változónak nevezzük. Fogalmak Biológiai rendszeren végzett kísérletek esetén (biológiai variabilitás miatt) a mérés kimenetelének bizonytalanságával kell számolnunk. pl: vérplazma ionkoncentrációja eltérő lehet amúgy egészséges embereknél egyes mérési eredmények nem azonos gyakorisággal fordulnak elő, ezért bevezetjük a valószínűségi változók eloszlása fogalmát az eloszlások ismeretében megbízható becsléseket tehetünk az egyes mérési eredmények előfordulásának gyakoriságáról. 4
A változókat különbözőképpen szokás osztályozni Mérési skálák-1: Kvalitatív skála 1. Nominális skála (nem sorbarendezhető): a megfigyelés eredményei osztályokba sorolhatók, amelyek között nincs számszerű kapcsolat. pl: a születendő gyermek neme (fiú/lány, hajszín, tüdődaganatok szövettani beosztása (kissejtes rák, nagysejtes rák, mirigyhám eredetű rák, laphámrák). 2. Ordinális skála (sorrenden alapuló skála): Ebben az esetben az egyes kategóriák kvantitatív alapon sorba rendezhetők, meg tudjuk mondani, melyik a jobb vagy több. pl. a daganatokat vagy a szívelégtelenséget előrehaladottságuk szerint stádiumokra szokták osztani. A daganatok stádiumbeosztását általában egy és IV közötti skálán végzik, és az előrehaladottság mértéke a stádiummal nő. Mérési skálák-2: Kvantitatív skála Numerikus skála: ebben az esetben a prezentált számoknak numerikus, kvantitatív jelentése van. Pl. ha két ember magassága 15 illetve 75 cm, akkor egyikőjük kétszer olyan magas, mint a másik. Ordinális skála esetében ugyanez nem mondható el (egy IV. stádiumú daganat nem kétszer olyan súlyos vagy előrehaladott, mint egy II. stádiumú). A numerikus skála lehet 1. folytonos (pl. vércukor szint) 2. diszkrét (pl. csonttörések száma),! folytonos valószínűségi változót is meg lehet diszkrét numerikus skálán jeleníteni, ha a folytonos skálát intervallumokra osztják. Mérési eredmények kiértékelése: táblázat, grafikon készítés 1. Kvalitatív adatok gyakorisági eloszlása diagnózis schizophrenia affective betegség szerves agyi syndroma 474 277 45 diagnózis subnormalitás alkoholizmus egyéb és nem ismert 58 57 196 Gyakoriság (frekvencia) A relatív gyakoriság (relatív frekvencia) a százalékban kifejezett gyakoriság. 35 3 25 2 15 1 5 schizophrenia affective betegség A példában pszichiátriai kórház szerepel, a tábla adatai adott napon egy cenzus eredményét tüntetik fel. szerves agyi syndroma subnormalitás alkoholizmus egyéb és nem ismert 1. Kvalitatív adatok gyakorisági eloszlása Összesen 119 fázis I. és fázis II. súlyosságú tumoros megbetegedésben szenvedő páciens esetében klinikai vizsgálatban próbálták ki a bigomycint. 81 betegnél semmiféle mellékhatást nem tapasztaltak, 215 esetben csekély, 72 esetben mérsékelten súlyos, míg 12 beteg esetében súlyos mellékhatást állapítottak meg. Mérési eredmények kiértékelése: táblázat, grafikon készítés 2. Kvantitatív adatok gyakorisági eloszlása Korábbi terhességek száma Gyakoriság Relatív gyakoriság gyakoriság relatív gyakoriság 59 47.2 59 47.2 1 44 35.2 13 82.4 2 14 11.2 117 93.6 3 3 2.4 12 96 4 4 3.2 124 99.2 5 vagy több 1.8 125 1 Összes 125 1 125 1 5
Hisztogram A hisztogram a frekvenciaeloszlás grafikai ábrázolása, ahol az érintkező függőleges oszlopok szélességei arányosak a változó osztályszélességeivel, az oszlopok magassága pedig arányos az osztály frekvenciájával. A hisztogram metrikusan skálázott tulajdonságok grafikus ábrázolása. Ha túl sok érték szerepel, akkor osztályokba vonják össze őket. Az egyes osztályok szélessége változhat. A mennyiségeket a szorosan egymás mellé rajzolt téglalapok jelölik, ahol az egyes téglalapok területe az adott osztály gyakoriságát mutatja. A téglalapok magassága az osztály gyakorisági sűrűségét jelöli, ami az adott osztály szélességével leosztott gyakoriság. Hisztogram 4.7 3.6 3.8 4.4 4.7 4. 4.1 2.2 5. 3.5 3.9 4.8 3. 3. 3.6 3.4 4. 4.1 4.1 3.8 4.1 3.6 4. 4.4 5.1 3.6 2.9 3.6 4.7 3.1 3.9 3.4 4.5 3.3 4. 4.4 4.9 4.9 4.3 6. A vér glükózszintje (mm/l) 4, elsőéves gyógyszerésztan hallgatóból álló mintán. A glükózszint folytonos véletlen változó, de kiértékeléshez csoportosítást végzünk. Hogyan döntjük el, hogy hány intervallumra osszuk: (i) (ii) (iii) 4 k = 2.5 N k =1+ 3.3322 lgn 2 k N k az intervallumok száma N a mérések száma 14 12 1 8 6 4 2 Koncentráció (mm/l) frekvencia frekvencia 2.2-2.7 2.7-3.2 3.2-3.7 3.7-4.2 4.2-4.7 4.7-5.2 5.2-5.7 5.7-6.2 Relatív frelvencia relatív frekvencia 2.2-2.7 1 1.25.25 2.7-3.2 4 5.1.125 3.2-3.7 9 14.225 35 3.7-4.2 12 26.3.65 4.2-4.7 8 34.2.85 4.7-5.2 5 39.125.975 5.2-5.7 39.9758 5.7-6.2 1 4.25 1 Unimodális eloszlás: gyakoriságok a középső érték körül sűrűsödnek. A folytonos változó intervallumából kategóriákat csináltunk! 45 4 35 3 25 2 15 1 5 2.2-2.7 2.7-3.2 3.2-3.7 3.7-4.2 4.2-4.7 4.7-5.2 5.2-5.7 5.7-6.2 Frekvencia és kumulatív frekvencia Halálesetek osztályozása 1983 -ban Angliában és Walesben 1.2 1.8.6 Relatív frekvencia és relatív kumulatív frekvencia.4.2 1 2 3 4 5 6 7 8 6