[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 18. J J 9
Információk a 2. ZH-ról és a vizsgáról 12. hét: gyakorló óra 13. hét: teszt 14. hét: a teszt megbeszélése, vizsgajegyek megajánlása. Minden csoport a szeminárium alatt írja a tesztet. Egyszerű választás, a ponthatárok ugyanazok, mint az előző ZH esetén. Megajánlott jegy a 2 db ZH átlaga (egyik sem lehet 1-es). A megajánlott jegyet nem köteles a hallgató elfogadni. Az utolsó gyakorlaton kell a hallgatónak eldönteni, hogy elfogadja-e a megajánlott vizsgajegyet vagy szóbeli vizsgát szeretne tenni. Mindenkinek fel kell vizsgaidőpontra iratkozni. Aki nem írta meg mindkét ZH-t, automatikusan szóbeli vizsgát tesz.
Regresszióanalízis. Legkisebb négyzetek elve.
Regresszióanalízis. Legkisebb négyzetek elve. - Relációanalízis: két vagy több mennyiség egymástól való függésének vizsgálata (pl.: hogyan változik egy vagy több változó értéke egy másik változó változásának függvényében) Két különböző eljárás használatos: (1) Regresszióanalízis - Függvénysszerű kapcsolatot keres két (vagy több) változó között. - Technikát szolgáltat az állandók meghatározásához adott megbízhatósági intervallummal. - Kapott függvény: regressziós függvény (egyenlet) - Említsünk a biofizika gyakorlatról példákat! (2) Korrelációanalízis - A változók közötti kapcsolat szorosságát méri.
A regresszióanalízis körébe a következő problémák tartoznak (a regressziós függvény felállítása) (1) Ismert törvények (pl.: fizikai és kémiai) változói közötti kapcsolat egyenlet formájában fejezhető ki. Pl: Lambert-Beer törvény, kinetikai reakciók (2) Előfordul, hogy nincs vagy nem ismert törvényszerű kapcsolat a változók között. Ebben az esetben is megkísérelhetünk egy függvényszerű kapcsolatot felállítani a változók között.
Amikor két változó között van szignifikáns regressziós kapcsolat, de nincs közvetlen oksági összefüggés: Frame, S., Moore, J., Peters, A. (1985) Maternal height and shoe size as predictors of pelvic disproportion: an assessment. Brit. J. Obstet. Gynaecol. 92, 1239-1245. Az adatok analízise jól meghatározott eredményt ad, valós trend létezik az adatok között. A kapcsolat nyílvánvalóan nem oksági kapcsolat, a trend az orvosok számára egy kényelmes indikátor, amely esetenként valós problémát jelezhet.
Mi a regresszió? F. Galton (1812-1911): Megfigyelte, hogy a magas szülők gyermekeinek átlagos magassága kissé alacsonyabb, mint a szülőké, az alacsony szülők gyermekeinek átlagos testmagassága viszont kissé nagyobb, mint szüleiké, azaz a sokaság átlagának irányába történő visszatérési tendenciáról van szó. (regression to the mean = visszatérés az átleghoz) Lineáris regresszió: Két (vagy több) változó között lineáris kapcsolat van. Legyenek két egymástól nem független véletlen változó (X, Y) egymáshoz tartozó értékpárjai a következők: Ha a független változót X -el, a függő változót Y -nal jelöljük, a lineáris kapcsolatra jellemző egyenlet a következő : ahol a a tengelymetszet, b az egyenes meredeksége, E pedig egy véletlen változó, amelynek átlaga 0. E a hiba változó, amely Y -nak azt a részét reprezentálja, amely nem magyarázható meg X változásával.
A legkisebb négyzetek módszere (A populáció egy regressziós egyenesének becslése) Számtalan regressziós egyenes illeszthető a pontokra. De melyik a legjobb? A legkisebb négyzetek módszere az egyik legkedvezőbb eljárás az illesztésre, ha az egyenestől való véletlen eltérések minden X -re normális eloszlást mutatnak azonos varianciával.
Ha az egyenes a és b paramétereit a legkisebb négyzetek eljárás segítségével határoztuk meg, akkor a megfigyelt pontokra vonatkozó négyzetes eltérés kisebb, mint bármely más, a pontokra illesztett egyenes esetében.
Az egyenes egyenlete: Az a és b állandók megfelelő megválasztásával elérhető, hogy a véletlen eltérések négyzeteinek összege minimális legyen az egyenes körül: A matematikai eljárás végeredményeként az egyenes meredeksége: a tengelymetszete pedig: Az Y változó X változóra vonatkozó regressziós egyenlet: - Y megadja y legvalószínűbb értékét egy adott x -re. - Az egyenes áthalad az x és y adatok átlagai által meghatározott ponton. - b a regressziós együttható, amely megadja, mennyivel változik y átlagosan, ha x értékét egységnyivel megváltoztatjuk. (Van biofizikai gyak példa?)
A b kifejezésében szereplő számlálót az X és Y változók közös varianciájának (covarianciájának) hívjuk, jelölése Cov(x,y). Pontos definíciója: Szokás a következő szimbólum használata is: Az előző kifejezések felhasználásával a regressziós koefficiens alakja:
Nemlineáris regressziós-függvények Például egyszerű termikus kémiai reakciónál a termikus reakció reakciósebessége a hőmérséklettől exponenciálisan függ: ahol k a reakció sebességi állandója, k 0 az u.n. akció konstans, E az aktivációs energia, R az egyetemes gázállandó, T pedig az abszolút hőmérséklet. hatványkitevős regresszio, exponenciális regresszio, parabolikus regresszio, hiperbolikus regresszio. Változók közötti nemlineáris kapcsolatra példa lehet egy gyógyszer hatásának függése a gyógyszer dózisától, a baktériumok szaporodása az idő függvényében, terméshozamok függése a csapadék mennyiségétől. Linearizálás módszere: a görbét alkalmas koordinatatranszformációval egyenesbe próbáljuk átalakítani. (A hiperbolikus, az exponenciális és a logaritmikus függvények könnyen linearizálhatók.)
Exponenciális regresszió: Példa: Egy időben lezajló kémiai reakció során a táblázatban foglalt eredményeket kapták, ahol ti jelenti a megfigyelés kezdetétől eltelt időt, yi pedig a kiinduló anyag mennyiségét. Legyen egy reakció időbeli lefolyására alkalmas a összefüggés: A vizsgált egyenlet linearizálását logaritmizálással érhetjük el:
Biofizika gyakorlat példa hasonló alakú függvényről?
Standard deviáció számítása Ahhoz, hogy kiszámítsuk a b regressziós együttható standard deviációját, hasonlítsuk össze a mérésekhez kapcsolódó y i adatok szóródását y átlag körül és a regressziós egyenes pontjainak (Y i ) szóródását az y átlag körül:
Egy tetszőleges y i pontot kiválasztva az y átlag -tól való eltérése a teljes különbség: (y i -y átlag ). Az egyenes megfelelő pontjának az átlagtól való eltérése (Y i - y átlag ) a regresszióval magyarázható eltérés, míg (y i - Y i ) adja a regresszióval nem magyarázható eltérést. Egyenlet formájában: Ha az eltéréseket valamennyi pontra kiterjesztjük, a négyzetre emeléseket elvégezzük, rendezzük az egyenletet, akkor a négyzetes eltérések összegére a következőt kapjuk:
A regressziós becslés standard hibáját a maradék négyzetösszeg, a regresszióval nem megmagyarázható variancia adja: A szabadsági fokok száma ebben az esetben kettővel csökken (n 2), mivel két adatot, a -t és b -t határoztuk meg a mintából. A b standard hibáját megkapjuk, ha a regressziós becslés standard hibáját függetlenítjük az x változó mértékegységének megválasztásától: A regressziós egyenesben szereplő a tengelymetszet standard hibáját a következő összefüggés adja:
A regressziós együtthatóra vonatkozó hipotézisvizsgálat Bebizonyítható, hogy a regressziós együttható (b) normális eloszlású véletlen változó, így a b/se(b) véletlen változó egy (n-2) szabadsági fokú t-eloszlást követ. A populáció regressziós együtthatójára ( ) vonatkozó nullhipotézis segítségével megvizsgálhatjuk, hogy a két változó kapcsolata valós összefüggést takar-e, vagy a kapcsolat csupán látszólagos. Nullhipotézis: a populáció regressziós együtthatójának nullától való eltérése véletlen hatásoknak tulajdonítható. Alternatív hipotézis: a regressziós együttható a két változó közötti valós kapcsolatra utal. 1. t-teszt A nullhipotézis eldöntésére vonatkozó teszt statisztika:
2. ANOVA Az y i adatok átlagtól való eltérésének négyzetét két négyzetösszegre tudtuk felbontani, hasonlóan, ahogy a varianciaanalízis tárgyalásánál láttuk: A felbontásban szereplő két variancia összehasonlításával, amelyet az F-teszt segítségével végezhetünk el, megvizsgálható, hogy a regresszió valós összefüggést mutat-e. Nullhipotézis: a két variancia azonos populációból származik, a regresszióval magyarázható és a maradék variancia legfeljebb véletlen hatások miatt különbözhet egymástól. Alternatív hipotézis: a két variancia eltérő populációból származik, a két változó kapcsolata reális összefüggést takar.
Probléma: Tizenkét önkéntes férfi donor különböző mennyiségű antikoaguláns drogot kapott. A kutatók szignifikáns összefüggést kerestek az antikoaguláns dózisa és a protrombin idő között.
A kapcsolódó regressziós egyenes: A regressziós becslés standard hibája: A regressziós együttható standard hibája:
Nullhipotézis: az antikoaguláns dózisa és a protrombin idő nincs kapcsolatban egymással. Ezzel egyenértékű megfogalmazás, hogy a populáció regressziós egyenesének együtthatója zérus: Alternatív hipotézis: a protrombin idő lineárisan függ az antikoaguláns koncentrációjától, azaz a valódi regressziós egyenes együtthatója zérustól különböző: t-próba: A szabadsági fokok száma: f = (n 2) = 10. P = 0.05 valószínűségi szint választása esetén b nullától való eltérését szignifikánsnak ítéljük. A populáció valódi regressziós egyenesének regressziós együtthatója tehát nullától szignifikánsan különbözik.
F-teszt: f 1 = 1 és f 2 = 10 szabadsági fokú varianciák esetén az F statisztika táblázata: 4.96. A nullhipotézist a P = 0.05 valószínűségi szint mellett elutasítjuk, és az alternatív hipotézist fogadjuk el, azaz a két szórás nem származhat azonos populációból. Ez ismételten azt jelenti, hogy a két változó reális kapcsolatban áll egymással.
Logisztikus regresszió (dózis-válasz probléma) A betegségek gyógyszeres kezelésének alapvető problémája, hogy az azonos betegségben szenvedő páciensek hogyan reagálnak azonos gyógyszerrel történő kezelésre. Az általánosan elfogadott gyakorlat, hogy a válasz az esély logaritmusa - a választott dózistól függ. ahol d az alkalmazott dózis, a és b állandók, Pr(Y = 1) azon páciensek aránya, akik a d dózisra pozitív választ (Y = 1) adtak. Pr(Y = 0) azon páciensek aránya, akik az adott dózisra nem reagáltak. Az egyenletet exponenciális alakban is felírhatjuk:
A felírt összefüggésekből könnyen meghatározhatjuk az effektív medián dózist (E 50 ), az a dózis, amelyre a páciensek 50% -a pozitív választ ad. Mivel ebben az esetben Pr(Y = 1) = 0.5 és Pr(Y = 0) = 0.5, ezért a baloldal logaritmusa log(0.5/0.5) = 0, így
Probléma: Duncan és munkatársai (Anaesthesia 39. 426-428, 1984) 137 gyermeken (1-12 éves) végeztek megfigyeléseket. Trimeprazinnal történő előkezelés után, 2.0-2.8 mg/kg thiopentont adagoltak 0.5 mg/kg lépésekben minden páciensnek 10 másodperces intervallumban, és ezt követően a szempillareflexet figyelték 20 sec -en keresztül: Y = 1, ha volt válasz, Y = 0, ha nem volt válasz A regresszióanalízis szerint az effektív medián dózis: E 50 = 1.99 mg/kg, a thiopentonnal történő kezelés szignifikáns változást eredményezett P = 0.001 valószínűségi szint mellett.
Teszt a regresszió linearitásának ellenőrzésére Fiatal leányok - 8 és 20 év között - átlagos szisztolés vérnyomása nem lineáris relációt követ. Az yi - Yi különbségeket vizsgálva, nagyobb életkorban ezek mind negatív előjelűnek adódnak. A linearitás ellenőrzésének egy gyors és egyszerű modellje egy hipotézisvizsgálaton alapul. A módszer a sorrendbe állított y i - Y i különbségek előjelsorozatának véletlenségét vizsgálja. Ha ez véletlen minta, akkor a lineáris közelítés célravezető.