Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek) megtervezése megfelelő minőségű adatgyűjtés, mérés az adatok, adathalmazok (minta) számokkal és grafikonokkal történő jellemzése deskriptív (leíró) statisztika: a mintában lévő információk begyűjtése eredmények elemzése, összehasonlítása, következtetések, döntések meghozatala. statisztika : lehet a módszer de az eredmény is. Biometria: A biológiai (élettudomány) jelenségeket matematikai módszerekkel elemző tudomány. 1
Modellek a biológiában és az orvostudományban Modell: a valóság egy megközelítése (elképzelés), mely bizonyos egyszerűsítéssel megőrzi annak leglényegesebb tulajdonságait és alkalmas a valóság törvényszerűségeinek feltárására. Jellemzői: matematikailag leírható kísérletileg ellenőrizhető Osztályozása: Determinisztikus: adott feltételek mellett a kísérletnek csak egy lehetséges kimenetele van, a rendszer jövőbeni állapotát a rendszer múltja egyértelműen meghatározza. Sztochasztikus: véletlennek is szerepe van a kísérlet kimenetelében, nem lehet egyértelműen megjósolni egy folyamat eredményét, az eredmény bizonytalan, több lehetséges kimenetel is van. Sugárkárosodás Sztochasztikus sugárkárosodás a károsodás valószínűsége (gyakorisága) a sugárterheléssel nő, azonban a károsodás súlyossága nem függ a sugárterheléstől nem lehet megállapítani a sugárterhelés alsó határértékét pl. daganatos betegségek megjelenése sugárterhelés hatására Determinisztikus sugárkárosodás az elszenvedett sugárkárosodás nagyságával a károsodás súlyossága fokozódik küszöbdózis felett a determinisztikus sugárkárosodás bekövetkezik pl. fehérvérsejtek számának csökkenése, bőrpír 2
hatás 03/03/2017 Sztochasztikus sugárkárosodás pl. daganatos betegség Determinisztikus sugárkárosodás pl. bőrpír Adatok típusa Adat Kvalitatív (kategorikus, minőségi ) adatok csoportokba rendezi az egyedi eseteket pl. szemszín, hajszín, nem, vélemény valamely kérdésben egyedi esetek száma egy csoportban (gyakoriság) százalékos (%) aránya az egyedi eseteknek egy kategórián belül (relatív gyakoriság) Néha nincs valós jelentése a számoknak (pl. férfi=1, nő=2) Kvantitatív (számszerű, mennyiségi ) adatok egyedi eseményekhez rendelhető eredményeket rögzít (a számoknak valós jelentése van) pl. magasság, súly, életkor, vérnyomás, vércukorszint 3
A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (átlag, medián, módus) Az adatok változékonyságát jellemzi (variancia, standard deviáció) (standard: szokásos, átlagos) terjedelem (d = x max - x min ) ferdeség (0: szimmetrikus, +: csúcs balra, -: csúcs jobbra) csúcsosság, lapultság (3: normál eloszlás, >3: csúcsos, <3: lapos) Következtető statisztika: egy populáció tulajdonságaira következtet a minta elemzése segítségével. becslés hipotézis vizsgálat Deskriptív statisztika 4
Deskriptív statisztika Adathalmaz (számhalmaz) jellemzése I. A központi érték (adat) jellemzése középérték (átlag, matematikai átlag, x) x = i=1 n xi n pl. 1,5,5,5,7,8,9,10,78,122,144. x = 38.545 medián (M or x): a sorba rendezett adatok között a középső érték páros számú elem esetén két középső adat van (használható a két érték számtani közepe) az az érték, amelynél az adatok legfeljebb 50%-a kisebb és legfeljebb 50 %-a nagyobb: P (X>x) 1 és P (X<x) 1 2 2 pl. 1,5,5,5,7,8,9,10,78,122,144. M = 8 Módus(z) (m): a leggyakrabban előforduló érték egy számsorban pl. 1,5,5,5,7,8,9,10,78,122,144. m = 5 5
Adathalmaz (számhalmaz) jellemzése II. A variabilitás (szóródás) jellemzése A minta standard deviációja (s): a középértéktől való átlagos eltérés. s = ± i=1 n (x i x) 2 n 1 az egyedi esemény megismételhetőségét méri nem függ a megfigyelések számától kiugró értékek nagyban befolyásolják mértékegysége azonos az adatok mértékegységével A minta varianciája (v): s 2 s 2 = i=1 n (xi x) 2 n 1 Gyakoriság és relatív gyakoriság Gyakoriság: az adat hányszor fordul elő az adat halmazban (k). Relatív gyakoriság: az adat milyen arányban fordul elő az adat halmazban a gyakoriság és az összes adat számának hányadosa (k/n). 6
Adatok megjelenítése - táblázatok fogak száma az 1 éves gyerekeknél gyakoriság relatív gyakoriság kumulatív gyakoriság kumulatív relatív gyakoriság 0 59 47.2 59 47.2 1 44 35.2 103 82.4 2 14 11.2 117 93.6 3 3 2.4 120 96 4 4 3.2 124 99.2 5 vagy több 1 0.8 125 100 Összesen 125 100 125 100 Kumulatív: összegyűjtő, összegző. A Jonas Salk polio vakcina kísérletek 1954-ben Polio (poliomyelitis anterior acuta): járványos gyermekbénulás, poliomielitisz, Heine-Medin-betegség. 7
A Jonas Salk polio vakcina kísérletek 1954-ben r1 = 33/200745 = 0.0001643 r2 = 115/201229 = 0.00057 r2/r1 = 0.00057 / 0.0001643 = 3.469 százalékos csökkenés = 100 115 33 = 71.3% 115 Adatok megjelenítése - Hisztogram Grafikus megjelenítése az adatok eloszlásának (oszlopdiagram). x-tengely: mért változó (pl. pulzus, vérnyomás, ) felosztása csoportokba. k = a csoportok száma e.g. k=2.5 4 N; 2 k = N; k= N h = a csoportok szélessége h width of the bins = data max data min k y-tengely: az oszlopok magassága arányos a mért adat gyakoriságával a mért adat relatív gyakoriságával 8
Hisztogramok értelmezése Az adatok eloszlása (alakja) Szimmetrikus v. aszimmetrikus Az adatok változékonysága (lapos vagy nem lapos?) Az adatok központjának elhelyezkedés Hisztogram 9
Frequency 03/03/2017 Hisztogram y data01 Bin Frequency 5 5 1 8 16.75 5 11 28.5 5 6 12 40.25 5 12 More 4 4 15 19 21 23 23 27 ( s) = 2 0 30 31 s = 32 x n 35 k h 40 4.5 10.5 41 4 11.75 44 51 bins upper limit lower limit frequency 52 less than bin1 5.00 0 1 bin1 16.75 5.00 5 bin2 28.50 16.75 5 bin3 40.25 28.50 5 more than bin3 52 40.25 4 Histogram 5 16.75 28.5 40.25 More Bin Frequency Vége! 10