[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hasonló dokumentumok
Varianciaanalízis 4/24/12

Kettőnél több csoport vizsgálata. Makara B. Gábor

Hipotézis vizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

y ij = µ + α i + e ij

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Bevezetés a hipotézisvizsgálatokba

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Biostatisztika Összefoglalás

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

2012. április 18. Varianciaanaĺızis

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Biostatisztika Összefoglalás

Biostatisztika VIII. Mátyus László. 19 October

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

[Biomatematika 2] Orvosi biometria

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

A konfidencia intervallum képlete: x± t( α /2, df )

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Korreláció és lineáris regresszió

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek

Adatok statisztikai értékelésének főbb lehetőségei

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Eloszlás-független módszerek 13. elıadás ( lecke)

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Összetett vizsgálati tervek és kiértékelésük. Kettő és több szempontos variancia analizis modellek

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

IV. Változók és csoportok összehasonlítása

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

y ij e ij BIOMETRIA let A variancia-anal telei Alapfogalmak 2. Alapfogalmak 1. ahol: 7. Előad Variancia-anal Lineáris modell ltozó bontását t jelenti.

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Variancia-analízis (folytatás)

Statisztikai módszerek 7. gyakorlat

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Statisztika elméleti összefoglaló

Biomatematika 2 Orvosi biometria

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Nemparametrikus tesztek december 3.

Kísérlettervezés alapfogalmak

Az első számjegyek Benford törvénye

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

6. Előadás. Vereb György, DE OEC BSI, október 12.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Több valószínűségi változó együttes eloszlása, korreláció

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

[Biomatematika 2] Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

egyetemi jegyzet Meskó Balázs

Nem-paraméteres (eloszlásmentes) statisztikai módszerek Makara Gábor

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Normális eloszlás paramétereire vonatkozó próbák

Sztochasztikus kapcsolatok

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

[Biomatematika 2] Orvosi biometria

Diszkriminancia-analízis

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Segítség az outputok értelmezéséhez

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Átírás:

[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27.

Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? A vizsgálatban szívfrekvencia változását regisztrálták a gyógyszerek használata során.

VARIANCIAANALÍZIS (ANOVA: ANalysis Of VAriance) A kérdés ugyanaz, mint az összes teszt statisztikánál! (1) Létezik-e valamilyen szakmai megfontolásból megsejtett effektus, és (2) ha létezik, rendelkezik-e szignifikáns hatással? Ha a kísérletező szempontjából csak egy változó hatása érdekes egy másik változóra, akkor a kísérlet megtervezése és megvalósítása viszonylag egyszerű. A kísérlet lényegesen bonyolultabb abban az esetben, ha több változó egyidejű hatásának vizsgálatáról van szó. Ha egy kísérlet során megengedjük több változó egyidejű hatását, számolnunk kell a változók kölcsönhatásával. A varianciaanalízis során ketto ne l to bb sokasa g ko ze pe rte keinek minta alapján történo összehasonlítása történik. Ezért nevezik a ke tminta s t-pro ba a ltala nosi ta sa nak. A nullhipotézis eldöntéséhez használjuk a szo ra sne gyzeteket, innen származik a varianciaanalízis elnevezés is.

Miért jobb egy ilyen kísérleti terv, mint a két, vagy több független kísérlet elvégzése, a több t-próba alkalmazásával folyó kísérletezés? 1) Lehetővé teszi a kontroll és az N (=2) kezelés egymáshoz hasonlítását is, kísérletenkénti korrekt elsőfajú hibával. 2) Gazdaságosabb az erőforrások felhasználása, nem kell kísérletenként külön kontrollt használnunk. 3) Jobb a csoportokon belüli szórás becslés, mert azt több megfigyelésre alapozhatjuk, más szóval pontosabb becslést kapunk a populációról. 4) további előnye: a hatások kombinációban történő együttes tesztelésének lehetősége. Jó hatásfokú módszerek állnak rendelkezésünkre a kísérletenkénti szignifikancia szint melletti hipotézisvizsgálatra.

Története Az ANOVA alkotója R.A. Fisher (egy angliai mezőgazdasági kísérleti állomáson). Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H0 úgy is vizsgálható, hogy kiszámítjuk (egymástól függetlenül) két módszerrel a populáció varianciájának becslését. Egyik módszerrel a csoportokon belüli szóródásból, a másik módszerrel a csoportok közötti szóródásból. H0 érvényessége esetén a ketto ugyanannak a mennyiségnek két becslése. Ha ez nem valószínű, akkor arra következtetünk, hogy a H0 elvetendő: azaz a csoportok között van különbség. A különbség lehet az átlagokban, vagy a szórásban. Elnevezés: nem szerencsés, valójában additív faktorokat vizsgálunk, a varianciák elemzésének eszközét felhasználva, tehát az analízisnek nem célja, hanem eszköze a varianciák elemzése.

Az ANOVA sem (mint más teszt statisztika sem) ad felvilágosítást arról, hogy a különböző minták átlagai között milyen összefüggések vannak. Csupán annyit állapít meg, hogy vane legalább egy átlag, amely hatásában szignifikánsan különbözik a to bbito l. A z ANOVA alkalmazhatóságának általános feltételei: (1) az egyes megfigyelési vagy mérési adatok egymástól függetlenek (A minták függetlenségét leginkább a megfelelo kísérleti elrendezéssel biztosíthatjuk.), (2) a vizsgált változók normális eloszlást követnek (Ezzel kapcsolatban vagy szakmai ismereteink lehetnek, vagy a minta alapján ellenőrizhetjük a normalitás teljesülését.), (3) a minták varianciái egyenlőek (Itt a következo megkötést szokták tenni: ha közel azonosak a minták elemszámai, akkor a legnagyobb varianciának kisebbnek kell lennie, mint a legkisebb variancia kétszerese.).

A variancia: Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? Csak a frekvenciakülönbségeket vették figyelembe (önkontrollos minta). Mindhárom minta elemszáma kisebb, mint 30, ezért mindegyik úgynevezett kis minta. Biometriai szempontból az orvosbiológiai vizsgálat három populáció átlagának összehasonlítása a három minta alapján.

Az egyes varianciafrakciók számszerűsítése eltérés-négyzetösszegekkel történik (az átlagtól való eltérések négyzeteinek összege, sum of squares, SS) A teljes eltérés-négyzetösszeg (SS total ) a csoportok közötti (SS between ) és csoporton belüli (SS within ) eltérés-négyzetöszeg összege: SS total SS between SS within

A függő változó teljes varianciája: SS total n i 1 ( y i Y A csoportok közötti variancia: SS between k j 1 ( y j 2 ) Y 2 ) A csoporton belüli variancia: SS within k m j 1 l 1 ( y jl y j 2 )

A teszt statisztika elkészítésének menete 1. Ho :μ1=μ2 =...=μk H1 :legalábbegyszerμi= μj,i=1,2,...,k, j=1,2,...,k.

A teszt statisztika elkészítésének menete 2. közepes eltérésnégyzetösszeg MS (Mean Sum of Squares)

A teszt statisztika elkészítésének menete 3.

Emlékszünk, hogy mi is az az F-próba? A t-próbához kapcsolódó egyik feltétel - a varianciák egyenlősége - ellenőrzését az F-teszt segítségével végezhetjük el. Tegyük fel, hogy két populációt vizsgálunk, amelyeknek nem ismerjük az átlagát és szórását, viszont tudjuk, hogy a változók követik a normális eloszlást. ahol m és n jelenti a két minta szabadsági fokát, F-eloszlást követ. A számlálóban mindig a nagyobb variancia áll. Az F-eloszlás aszimmetrikus eloszlás, ferdesége a szabadsági fokok számától függ. Ha a döntéshez a P = 0.05 valószínűségi szintet választjuk, akkor a varianciák egyenlőségére vonatkozó nullhipotézist elutasítjuk, ha a következő egyenlőtlenség teljesül:. Ellenkező esetben a nullhipotézist fenntartjuk, a szórások (varianciák) egyenlőségére vonatkozó feltétel ebben az esetben teljesül, tehát pl. a t-próba alkalmazható.

F-eloszlás két eltérő szabadsági foknál. - Az F-eloszlás aszimmetrikus eloszlás, ferdesége a szabadsági fokok számától függ. - Ha a minták elemszáma nagy, az eloszlás közelíti a normális eloszlást. - Az F-eloszlás értékei különböző szabadsági fokokra megtalálhatók egy táblázatban.

A variancia-felbontás és az F-próba eredménye - ANOVA-táblázat Variancia forrása Szabadsági fok (df) Eltérésnégyzeösszeg SS (Sum of Squares) közepes eltérésnégyzetösszeg MS (Mean Sum of Squares) Próbastatisztika (F-value) p-érték Csoportok közötti (between groups) N-k SS between MS between = SS between /(N-k) F= MS betwen /MS within p Csoporton belüli (within groups) k-1 SS within MS within = SS within /(k-1) Teljes (total) N-1 SS total MS total =SS total /(N-1)

A faktor hatásának szignifikanciatesztje Tesztstatisztika: A csoportok közötti és a csoporton belüli eltérésnégyzetösszeget osztva a szabadsági fokaikkal: közepes eltérés-négyzetösszegeket (Mean of Sum of squares). A csoportok közötti és a csoporton belüli közepes eltérés-négyzetösszeg hányadosa az F próbastatisztika H0: a csoportok alapsokaságbeli átlagai azonosak: µ 1 = µ 2 = = µ k H1: van legalább két olyan csoport, melyeknek különbözik az alapsokaságbeli átlaga. (egyoldali hipotézis!)

Térjünk vissza Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés frekvenciájára. Kérdés, hogy a vizsgálat adatai alapján kijelenthető-e, hogy a gyógyszerek kvantitatíve eltérő hatást okoznak a szívműködés frevenciájára? A vizsgálatban szívfrekvencia változását regisztrálták a gyógyszerek használata során. Nullhipotézis (nullhipotézis egyenlő átlagokra): nincs különbség a három drog hatása között, az átlagokban tapasztalt eltérés véletlen hatások következménye; a három minta azonos populációból származik: Alternatív hipotézis (nem minden átlag egyforma): a drogok között van legalább egy olyan (pl. a harmadik), amely hatásában különbözik a többitől, hatására a szívfrekvencia szignifikánsan csökken:

A teszt statisztika folytonos valószínűségi változó, eloszlása az F-eloszlást követi. Az F- eloszlás függ a szórások szabadsági fokainak számától, ahol n és m a szabadsági fokok száma, (s B ) 2 és (s W)2 pedig a varianciák. Az F-eloszlás alakját a 11.2. ábra mutatja.

Variancia táblázat

H 0 -t elvetjük

Probléma: Egy minőségellenőrzési kísérletben különbözo ti pusu elemek élettartamát vizsgálták. Minden ti pusu elemből 5-5 darabot választottak ki. Az élettartam órában van megadva a következo táblázatban. Vizsgáljuk meg, hogy van-e szignifikáns különbség a különbözo ti pusu elemek élettartama között!

2 minta Mintaszám? 3 vagy több Hány csoport? igen nem Független minták? igen nem Normál eloszlású a minta? igen nem igen nem igen nem igen nem 2 mintás t-próba Páros t-próba 1 szempontos AVOVA Ismételt méréses ANOVA Mann-Whitney t. Wilcoxon t. Kruskal-Wallis t. Friedman próba Paraméteres próbák Nem paraméteres próbák