[Biomatematika 2] Orvosi biometria

Hasonló dokumentumok
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

[Biomatematika 2] Orvosi biometria

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Korreláció és lineáris regresszió

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 13. Varianciaanaĺızis (ANOVA)

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Regressziós vizsgálatok

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Mérési adatok illesztése, korreláció, regresszió

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij

[Biomatematika 2] Orvosi biometria

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Varianciaanalízis 4/24/12

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Adatok statisztikai értékelésének főbb lehetőségei

Többváltozós lineáris regressziós modell feltételeinek

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Korreláció, regresszió. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztika elméleti összefoglaló

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

11. elıadás ( lecke) 21. lecke. Korreláció és Regresszió (folytatás) Lineáris-e a tendencia? Linearizálható nem-lineáris regressziós függvények

Matematikai geodéziai számítások 6.

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Matematikai geodéziai számítások 6.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Likelihood, deviancia, Akaike-féle információs kritérium

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Matematikai statisztikai elemzések 6.

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Lineáris regressziószámítás 1. - kétváltozós eset

Számítógépes döntéstámogatás. Statisztikai elemzés

Több valószínűségi változó együttes eloszlása, korreláció

Bevezetés a hipotézisvizsgálatokba

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Biostatisztika VIII. Mátyus László. 19 October

A kálium-permanganát és az oxálsav közötti reakció vizsgálata 9a. mérés B4.9

Biostatisztika Összefoglalás

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Statisztika Elıadások letölthetık a címrıl

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

A mérési eredmény megadása

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Variancia-analízis (folytatás)

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A leíró statisztikák

6. Előadás. Vereb György, DE OEC BSI, október 12.

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

[Biomatematika 2] Orvosi biometria

Többváltozós Regresszió-számítás

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Biomatematika 2 Orvosi biometria

GVMST22GNC Statisztika II.

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Túlélés analízis. Probléma:

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Bevezetés a Korreláció &

Biometria gyakorló feladatok BsC hallgatók számára

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

A valószínűségszámítás elemei

Mérési hibák

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Matematikai geodéziai számítások 10.

Hipotézis vizsgálatok

Biostatisztika Összefoglalás

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Regresszió számítás az SPSSben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Átírás:

[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 18. J J 9

Információk a 2. ZH-ról és a vizsgáról 12. hét: gyakorló óra 13. hét: teszt 14. hét: a teszt megbeszélése, vizsgajegyek megajánlása. Minden csoport a szeminárium alatt írja a tesztet. Egyszerű választás, a ponthatárok ugyanazok, mint az előző ZH esetén. Megajánlott jegy a 2 db ZH átlaga (egyik sem lehet 1-es). A megajánlott jegyet nem köteles a hallgató elfogadni. Az utolsó gyakorlaton kell a hallgatónak eldönteni, hogy elfogadja-e a megajánlott vizsgajegyet vagy szóbeli vizsgát szeretne tenni. Mindenkinek fel kell vizsgaidőpontra iratkozni. Aki nem írta meg mindkét ZH-t, automatikusan szóbeli vizsgát tesz.

Regresszióanalízis. Legkisebb négyzetek elve.

Regresszióanalízis. Legkisebb négyzetek elve. - Relációanalízis: két vagy több mennyiség egymástól való függésének vizsgálata (pl.: hogyan változik egy vagy több változó értéke egy másik változó változásának függvényében) Két különböző eljárás használatos: (1) Regresszióanalízis - Függvénysszerű kapcsolatot keres két (vagy több) változó között. - Technikát szolgáltat az állandók meghatározásához adott megbízhatósági intervallummal. - Kapott függvény: regressziós függvény (egyenlet) - Említsünk a biofizika gyakorlatról példákat! (2) Korrelációanalízis - A változók közötti kapcsolat szorosságát méri.

A regresszióanalízis körébe a következő problémák tartoznak (a regressziós függvény felállítása) (1) Ismert törvények (pl.: fizikai és kémiai) változói közötti kapcsolat egyenlet formájában fejezhető ki. Pl: Lambert-Beer törvény, kinetikai reakciók (2) Előfordul, hogy nincs vagy nem ismert törvényszerű kapcsolat a változók között. Ebben az esetben is megkísérelhetünk egy függvényszerű kapcsolatot felállítani a változók között.

Amikor két változó között van szignifikáns regressziós kapcsolat, de nincs közvetlen oksági összefüggés: Frame, S., Moore, J., Peters, A. (1985) Maternal height and shoe size as predictors of pelvic disproportion: an assessment. Brit. J. Obstet. Gynaecol. 92, 1239-1245. Az adatok analízise jól meghatározott eredményt ad, valós trend létezik az adatok között. A kapcsolat nyílvánvalóan nem oksági kapcsolat, a trend az orvosok számára egy kényelmes indikátor, amely esetenként valós problémát jelezhet.

Mi a regresszió? F. Galton (1812-1911): Megfigyelte, hogy a magas szülők gyermekeinek átlagos magassága kissé alacsonyabb, mint a szülőké, az alacsony szülők gyermekeinek átlagos testmagassága viszont kissé nagyobb, mint szüleiké, azaz a sokaság átlagának irányába történő visszatérési tendenciáról van szó. (regression to the mean = visszatérés az átleghoz) Lineáris regresszió: Két (vagy több) változó között lineáris kapcsolat van. Legyenek két egymástól nem független véletlen változó (X, Y) egymáshoz tartozó értékpárjai a következők: Ha a független változót X -el, a függő változót Y -nal jelöljük, a lineáris kapcsolatra jellemző egyenlet a következő : ahol a a tengelymetszet, b az egyenes meredeksége, E pedig egy véletlen változó, amelynek átlaga 0. E a hiba változó, amely Y -nak azt a részét reprezentálja, amely nem magyarázható meg X változásával.

A legkisebb négyzetek módszere (A populáció egy regressziós egyenesének becslése) Számtalan regressziós egyenes illeszthető a pontokra. De melyik a legjobb? A legkisebb négyzetek módszere az egyik legkedvezőbb eljárás az illesztésre, ha az egyenestől való véletlen eltérések minden X -re normális eloszlást mutatnak azonos varianciával.

Ha az egyenes a és b paramétereit a legkisebb négyzetek eljárás segítségével határoztuk meg, akkor a megfigyelt pontokra vonatkozó négyzetes eltérés kisebb, mint bármely más, a pontokra illesztett egyenes esetében.

Az egyenes egyenlete: Az a és b állandók megfelelő megválasztásával elérhető, hogy a véletlen eltérések négyzeteinek összege minimális legyen az egyenes körül: A matematikai eljárás végeredményeként az egyenes meredeksége: a tengelymetszete pedig: Az Y változó X változóra vonatkozó regressziós egyenlet: - Y megadja y legvalószínűbb értékét egy adott x -re. - Az egyenes áthalad az x és y adatok átlagai által meghatározott ponton. - b a regressziós együttható, amely megadja, mennyivel változik y átlagosan, ha x értékét egységnyivel megváltoztatjuk. (Van biofizikai gyak példa?)

A b kifejezésében szereplő számlálót az X és Y változók közös varianciájának (covarianciájának) hívjuk, jelölése Cov(x,y). Pontos definíciója: Szokás a következő szimbólum használata is: Az előző kifejezések felhasználásával a regressziós koefficiens alakja:

Nemlineáris regressziós-függvények Például egyszerű termikus kémiai reakciónál a termikus reakció reakciósebessége a hőmérséklettől exponenciálisan függ: ahol k a reakció sebességi állandója, k 0 az u.n. akció konstans, E az aktivációs energia, R az egyetemes gázállandó, T pedig az abszolút hőmérséklet. hatványkitevős regresszio, exponenciális regresszio, parabolikus regresszio, hiperbolikus regresszio. Változók közötti nemlineáris kapcsolatra példa lehet egy gyógyszer hatásának függése a gyógyszer dózisától, a baktériumok szaporodása az idő függvényében, terméshozamok függése a csapadék mennyiségétől. Linearizálás módszere: a görbét alkalmas koordinatatranszformációval egyenesbe próbáljuk átalakítani. (A hiperbolikus, az exponenciális és a logaritmikus függvények könnyen linearizálhatók.)

Exponenciális regresszió: Példa: Egy időben lezajló kémiai reakció során a táblázatban foglalt eredményeket kapták, ahol ti jelenti a megfigyelés kezdetétől eltelt időt, yi pedig a kiinduló anyag mennyiségét. Legyen egy reakció időbeli lefolyására alkalmas a összefüggés: A vizsgált egyenlet linearizálását logaritmizálással érhetjük el:

Biofizika gyakorlat példa hasonló alakú függvényről?

Standard deviáció számítása Ahhoz, hogy kiszámítsuk a b regressziós együttható standard deviációját, hasonlítsuk össze a mérésekhez kapcsolódó y i adatok szóródását y átlag körül és a regressziós egyenes pontjainak (Y i ) szóródását az y átlag körül:

Egy tetszőleges y i pontot kiválasztva az y átlag -tól való eltérése a teljes különbség: (y i -y átlag ). Az egyenes megfelelő pontjának az átlagtól való eltérése (Y i - y átlag ) a regresszióval magyarázható eltérés, míg (y i - Y i ) adja a regresszióval nem magyarázható eltérést. Egyenlet formájában: Ha az eltéréseket valamennyi pontra kiterjesztjük, a négyzetre emeléseket elvégezzük, rendezzük az egyenletet, akkor a négyzetes eltérések összegére a következőt kapjuk:

A regressziós becslés standard hibáját a maradék négyzetösszeg, a regresszióval nem megmagyarázható variancia adja: A szabadsági fokok száma ebben az esetben kettővel csökken (n 2), mivel két adatot, a -t és b -t határoztuk meg a mintából. A b standard hibáját megkapjuk, ha a regressziós becslés standard hibáját függetlenítjük az x változó mértékegységének megválasztásától: A regressziós egyenesben szereplő a tengelymetszet standard hibáját a következő összefüggés adja:

A regressziós együtthatóra vonatkozó hipotézisvizsgálat Bebizonyítható, hogy a regressziós együttható (b) normális eloszlású véletlen változó, így a b/se(b) véletlen változó egy (n-2) szabadsági fokú t-eloszlást követ. A populáció regressziós együtthatójára ( ) vonatkozó nullhipotézis segítségével megvizsgálhatjuk, hogy a két változó kapcsolata valós összefüggést takar-e, vagy a kapcsolat csupán látszólagos. Nullhipotézis: a populáció regressziós együtthatójának nullától való eltérése véletlen hatásoknak tulajdonítható. Alternatív hipotézis: a regressziós együttható a két változó közötti valós kapcsolatra utal. 1. t-teszt A nullhipotézis eldöntésére vonatkozó teszt statisztika:

2. ANOVA Az y i adatok átlagtól való eltérésének négyzetét két négyzetösszegre tudtuk felbontani, hasonlóan, ahogy a varianciaanalízis tárgyalásánál láttuk: A felbontásban szereplő két variancia összehasonlításával, amelyet az F-teszt segítségével végezhetünk el, megvizsgálható, hogy a regresszió valós összefüggést mutat-e. Nullhipotézis: a két variancia azonos populációból származik, a regresszióval magyarázható és a maradék variancia legfeljebb véletlen hatások miatt különbözhet egymástól. Alternatív hipotézis: a két variancia eltérő populációból származik, a két változó kapcsolata reális összefüggést takar.

Probléma: Tizenkét önkéntes férfi donor különböző mennyiségű antikoaguláns drogot kapott. A kutatók szignifikáns összefüggést kerestek az antikoaguláns dózisa és a protrombin idő között.

A kapcsolódó regressziós egyenes: A regressziós becslés standard hibája: A regressziós együttható standard hibája:

Nullhipotézis: az antikoaguláns dózisa és a protrombin idő nincs kapcsolatban egymással. Ezzel egyenértékű megfogalmazás, hogy a populáció regressziós egyenesének együtthatója zérus: Alternatív hipotézis: a protrombin idő lineárisan függ az antikoaguláns koncentrációjától, azaz a valódi regressziós egyenes együtthatója zérustól különböző: t-próba: A szabadsági fokok száma: f = (n 2) = 10. P = 0.05 valószínűségi szint választása esetén b nullától való eltérését szignifikánsnak ítéljük. A populáció valódi regressziós egyenesének regressziós együtthatója tehát nullától szignifikánsan különbözik.

F-teszt: f 1 = 1 és f 2 = 10 szabadsági fokú varianciák esetén az F statisztika táblázata: 4.96. A nullhipotézist a P = 0.05 valószínűségi szint mellett elutasítjuk, és az alternatív hipotézist fogadjuk el, azaz a két szórás nem származhat azonos populációból. Ez ismételten azt jelenti, hogy a két változó reális kapcsolatban áll egymással.

Logisztikus regresszió (dózis-válasz probléma) A betegségek gyógyszeres kezelésének alapvető problémája, hogy az azonos betegségben szenvedő páciensek hogyan reagálnak azonos gyógyszerrel történő kezelésre. Az általánosan elfogadott gyakorlat, hogy a válasz az esély logaritmusa - a választott dózistól függ. ahol d az alkalmazott dózis, a és b állandók, Pr(Y = 1) azon páciensek aránya, akik a d dózisra pozitív választ (Y = 1) adtak. Pr(Y = 0) azon páciensek aránya, akik az adott dózisra nem reagáltak. Az egyenletet exponenciális alakban is felírhatjuk:

A felírt összefüggésekből könnyen meghatározhatjuk az effektív medián dózist (E 50 ), az a dózis, amelyre a páciensek 50% -a pozitív választ ad. Mivel ebben az esetben Pr(Y = 1) = 0.5 és Pr(Y = 0) = 0.5, ezért a baloldal logaritmusa log(0.5/0.5) = 0, így

Probléma: Duncan és munkatársai (Anaesthesia 39. 426-428, 1984) 137 gyermeken (1-12 éves) végeztek megfigyeléseket. Trimeprazinnal történő előkezelés után, 2.0-2.8 mg/kg thiopentont adagoltak 0.5 mg/kg lépésekben minden páciensnek 10 másodperces intervallumban, és ezt követően a szempillareflexet figyelték 20 sec -en keresztül: Y = 1, ha volt válasz, Y = 0, ha nem volt válasz A regresszióanalízis szerint az effektív medián dózis: E 50 = 1.99 mg/kg, a thiopentonnal történő kezelés szignifikáns változást eredményezett P = 0.001 valószínűségi szint mellett.

Teszt a regresszió linearitásának ellenőrzésére Fiatal leányok - 8 és 20 év között - átlagos szisztolés vérnyomása nem lineáris relációt követ. Az yi - Yi különbségeket vizsgálva, nagyobb életkorban ezek mind negatív előjelűnek adódnak. A linearitás ellenőrzésének egy gyors és egyszerű modellje egy hipotézisvizsgálaton alapul. A módszer a sorrendbe állított y i - Y i különbségek előjelsorozatának véletlenségét vizsgálja. Ha ez véletlen minta, akkor a lineáris közelítés célravezető.