Biostatisztika = Biometria = Orvosi statisztika Biomatematika 2. előadás Néhány egyszerű definíció: A statisztika olyan tudomány, amely a tömegjelenségekkel kapcsolatos tapasztalati törvényeket megfigyelések és mérések segítségével tárja fel. A statisztika véletlen jelenségek leírásával foglalkozik, melyek kimenetelét különböző okok miatt nem lehet 1% biztonsággal megjósolni. 212. Február 6. A biostatisztika az élővilággal kapcsolatos jelenségeket matematikai módszerekkel elemző tudomány. Modell a biológiában és orvostudományban A statisztika elkészítésének menete: 1. Mérés (adatok összegyűjtése, számszerűsítése) 2. Kiértékelés (adatok feldolgozása, statisztikai módszerek alkalmazása) 3. Következtetések levonása (óvatosság!). Döntés Modell: a valóság olyan közelítése, amely bizonyos egyszerűsítéssel megőrzi annak leglényegesebb tulajdonságait és alkalmas a valóság törvényszerűségeinek feltárására. Jellemző rá, hogy: (i) leírható matematikai formalizmus segítségéval (ii) kísérletek segítségével ellenőrizhető A modellek osztályozása: (i) determinisztikus: (adott feltételek mellett) a kísérletnek csakis egy lehetséges kimenetele van pl: Fizikai és kémiai törvényszerűségek, pl a cukor forgatóképessége (ii) sztochasztikus: (legalább egy véletlen elem is található, így adott feltételek mellett) a kísérletnek több lehetséges kimenetele van pl: Testmagasság és testsúly közötti kapcsolat Placebo hatás: Huskisson's treatment trial Egy példa a determinisztikus modellre: a szacharóz hidrolízise során egy D-glükóz és egy D-fruktóz keletkezik (Inverzió) Optikai aktivitás: (i) Szacharóz jobbraforgató (ii) D-fruktóz balraforgató A jobbraforgatás csökkenése a cukor inverziós reakciója során. a i jelenti a forgatás szögét a reakció végén, míg a az elforgatás szöge egy tetszőleges t időpillanatban. 1
Miért determinisztikus modell? Ha az elforgatás szöge egy tetszőleges t időpillanatban ismert, a reakció tetszőleges állapota egyértelműen meghatározható a feltételezett modell alapján, adott feltételek mellett a kísérletnek egy csakis egy lehetséges kimenetele van, a rendszer jövőbeni állapotát a rendszer múltja egyértelműen meghatározza. Mit várunk? Van valamilyen tendenia! Keressük a lineáris összefüggést! Biológiai variabilitásnak meg kell mutatkoznia: genetika környezet placebo mérési hiba 2
Miért sztochasztikus modell? (i) a testsúly és testmagasság között egyértelmű hozzárendelés nem tehető, csupán (ii) (egy egyenessel közelíthető) sajátos tendencia figyelhető meg: magasabb embereknek nagyobb (lehet) a súlyuk Tehát nem lehet egyértelműen megjósolni a független változó egy adott értékéhez tartozó függő változó értékét, olyan rendszerrel van dolgunk, amelyben a mérés várható eredménye bizonytalan, a kísérletnek több lehetséges kimenetel is van Adatok feldolgozása, i eloszlások, hisztogram Populáció: A statisztikai megfigyelés tárgyát képező egyedek összességét populációnak nevezzük. pl: Ha az emberek átlagos várható élettartamát vizsgáljuk, akkor az emberiség egésze. Ha a megfigyelés célja csak a magyar nők vizsgálata, akkor az összes magyar nő alkotja. A populáció elemei: az egyedek Egy populációról kétféleképpen szerezhetünk információt: 1. Cenzus 2. Minta Reprezentatív mintavétel: elemeknek egymástól függetlennek kell lennie, a kiválogatás véletlenszerű Változó: a mért adat különböző számértékű lehet a populáció egyes elemeinél pl: M 1 biológiai rendszeren (determinisztikus séma) A M 2 biológiai rendszeren (sztochasztikus séma) A 1, A 2, A 3,, A n ahol A ill. A 1, A 2, A 3,, A n az X változó egy-egy értéke. a kísérlet lehetséges kimenetele Mivel az X változó értékét egy-egy esemény esetében véletlen tényezők befolyásolják, ezért X-et valószínűségi vagy véletlen változónak nevezzük. Biológiai rendszeren végzett kísérletek esetén (biológiai variabilitás miatt) a mérés kimenetelének bizonytalanságával kell számolnunk. pl: vérplazma ionkoncentrációja eltérő lehet amúgy egészséges embereknél egyes mérési eredmények nem azonos gal fordulnak elő, ezért bevezetjük a valószínűségi változók eloszlása fogalmát az eloszlások ismeretében megbízható becsléseket tehetünk az egyes mérési eredmények előfordulásának áról. 3
Mérési skálák-1: Kvalitatív skála 1. Nominális skála (nem sorbarendezhető): az egyes kategóriák között nincsen mennyiségi összefüggés, nem lehet azt mondani, hogy az egyik kategóriába tartozó elem nagyobb, több, stb., mint a másikba tartozó. pl: a születendő gyermek neme (fiú/lány) vagy a tüdődaganatok szövettani beosztása (kissejtes rák, nagysejtes rák, mirigyhám eredetű rák, laphámrák). 2. Ordinális skála (sorrenden alapuló skála): Ebben az esetben az egyes kategóriák kvantitatív alapon sorba rendezhetők, meg tudjuk mondani, melyik a jobb vagy több. pl. a daganatokat vagy a szívelégtelenséget előrehaladottságuk szerint stádiumokra szokták osztani. A daganatok stádiumbeosztását általában egy és IV közötti skálán végzik, és az előrehaladottság mértéke a stádiummal nő. Mérési skálák-2: Kvantitatív skála Numerikus skála: ebben az esetben a prezentált számoknak numerikus, kvantitatív jelentése van. Pl. ha két ember magassága 1 illetve 7 cm, akkor egyikőjük kétszer olyan magas, mint a másik. Ordinális skála esetében ugyanez nem mondható el (egy IV. stádiumú daganat nem kétszer olyan súlyos vagy előrehaladott, mint egy II. stádiumú). A numerikus skála lehet 1. folytonos (pl. vércukor szint) 2. diszkrét (pl. csonttörések száma),! folytonos valószínűségi változót is meg lehet diszkrét numerikus skálán jeleníteni, ha a folytonos skálát intervallumokra osztják. Mérési eredmények kiértékelése: táblázat, grafikon készítés 1. Kvalitatív adatok i eloszlása diagnózis schizophrenia affective betegség szerves agyi syndroma 7 277 diagnózis subnormalitás alkoholizmus egyéb és nem ismert 3 Gyakoriság 8 () 7 3 196 A relatív (relatív ) a százalékban kifejezett. 2 2 1 1 schizophrenia affective betegség A példában pszichiátriai kórház szerepel, a tábla adatai adott napon egy cenzus eredményét tüntetik fel. szerves agyi syndroma subnormalitás alkoholizmus egyéb és nem ismert Mérési eredmények kiértékelése: táblázat, grafikon készítés 2. Kvantitatív adatok i eloszlása Korábbi terhességek száma Gyakoriság Relatív relatív 9 7.2 9 7.2 1 3.2 13 82. 2 1 11.2 117 93.6 3 3 2. 12 96 3.2 12 99.2 vagy több 1.8 12 1 Összes 12 1 12 1 Hisztogram.7 3.6 3.8..7..1 2.2. 3. 3.9.8 3. 3. 3.6 3...1.1 3.8.1 3.6...1 3.6 2.9 3.6.7 3.1 3.9 3.. 3.3...9.9.3 6. A vér glükózszintje (mm/l), elsőéves gyógyszerésztan hallgatóból álló mintán. A glükózszint folytonos véletlen változó, de kiértékeléshez csoportosítást végzünk. Hogyan döntjük el, hogy hány intervallumra osszuk: (i) (ii) (iii) k = 2. N k =1+ 3.3322 lgn 2 k N k az intervallumok száma N a mérések száma 1 12 1 8 6 2 Koncentráció (mm/l) 2.2-2.7 2.7-3.2 3.2-3.7 3.7-.2.2-.7.7-.2.2-.7.7-6.2 Relatív frelvencia relatív 2.2-2.7 1 1.2.2 2.7-3.2.1.12 3.2-3.7 9 1.22 3 3.7-.2 12 26.3.6.2-.7 8 3.2.8.7-.2 39.12.97.2-.7 39.978.7-6.2 1.2 1 Unimodális eloszlás: ok a középső érték körül sűrűsödnek. A folytonos változó intervallumából kategóriákat csináltunk!
3 3 2 2 1 1 2.2-2.7 2.7-3.2 3.2-3.7 3.7-.2.2-.7.7-.2.2-.7.7-6.2 Frekvencia és kumulatív Halálesetek osztályozása 1983 -ban Angliában és Walesben 1.2 1.8.6 Relatív és relatív kumulatív..2 1 2 3 6 7 8