Hipotézis vizsgálatok

Hasonló dokumentumok
Hipotézis vizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Bevezetés a hipotézisvizsgálatokba

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

[Biomatematika 2] Orvosi biometria

y ij = µ + α i + e ij

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Statisztika Elıadások letölthetık a címrıl

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Normális eloszlás paramétereire vonatkozó próbák

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika elméleti összefoglaló

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Biostatisztika Összefoglalás

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Biostatisztika Összefoglalás

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Adatok statisztikai értékelésének főbb lehetőségei

egyetemi jegyzet Meskó Balázs

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

A konfidencia intervallum képlete: x± t( α /2, df )

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kettőnél több csoport vizsgálata. Makara B. Gábor

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Biostatisztika VIII. Mátyus László. 19 October

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Korreláció és lineáris regresszió

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Matematikai statisztikai elemzések 4.

Matematikai statisztikai elemzések 4.

Normális eloszlás tesztje

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

6. Előadás. Vereb György, DE OEC BSI, október 12.

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Eloszlás-független módszerek 13. elıadás ( lecke)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Varianciaanalízis 4/24/12

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Statisztikai módszerek 7. gyakorlat

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Többváltozós lineáris regressziós modell feltételeinek

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Az első számjegyek Benford törvénye

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Mérési hibák

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Kísérlettervezés alapfogalmak

[Biomatematika 2] Orvosi biometria

IV. Változók és csoportok összehasonlítása

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Variancia-analízis (VA)

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA

Több valószínűségi változó együttes eloszlása, korreláció

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Nemparametrikus tesztek december 3.

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Átírás:

Hipotézis vizsgálatok

Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével egy véletlen minta alapján eldöntjük, hogy az adott hipotézis elfogadható-e vagy sem.

Meg kell határozni az alábbi hipotéziseket a vizsgálat indítása előtt: H 0 : Null-hipotézis H 1 : Alternatív hipotézis Döntési táblázat Valóshelyzet H 0 igaz H 0 hamis H 0 elfogadása H 0 elutasítása Helyes döntés (1- ) Elsőfajú hiba ( hiba) Másodfajú hiba ( hiba) Helyes döntés (Power = 1- )

Elkövethető hibafajták Type I error ( hiba vagy szignifikancia érték): annak valószínűsége, hogy elutasítjuk a valós H 0 hipotézist. Fontos, hogy az elsőfajta hiba kellően alacsony maradjon (felső határaként legtöbbször 5%-ot írnak elő, ezt fejezi ki a p<0,05 jelzés). Ez az ún. szignifikanciaszint. Type II error ( hiba): a hibás H 0 hipotézis elfogadásának valószínűsége.

Értelmezések 1 - : elfogadom a H 0 mikor az igaz, és elutasítom a nem igaz H 1 : 1 2 : elutasítom H 0 mikor az igaz, és elfogadom a nem igaz H 1 : 1 2 1 - : elutasítom a H 0 mikor az hamis, és elfogadom az igaz H 1 : 1 2 : elfogadom a H 0 mikor az hamis, és elutasítom az igaz H 1 : 1 2

Type I error ( hiba ) Az első fajta hiba valószínűségét a fogyasztó kockázatának is nevezik, hiszen ez a maximális valószínűsége annak, hogy a hatástalan gyógyszerek közül valamelyik forgalomba kerüljön. Megnyugtató tehát, hogy a statisztikai hipotézis vizsgálatának logikája szerint az ilyen típusú hibának van meghatározó szerepe a döntésekben (ennek felső határa rögzített).

Type II error ( hiba) A hiba: A vizsgáló/kutató kockázata. Úgy illik, hogy 20 százalékos szint alatt maradjon, de mindenki úgy gondolja, hogy az ezzel való törődés a kutató érdeke (hiszen ha nem vigyáz, kihullhat a rostán egy hatásos gyógyszer vagy a klinikai vizsgálat hatástalannak látszik).

Hipotézisek megfogalmazása

A statisztikai próba A munka-hipotézisek (H 0 ) nem igazolhatók közvetlen úton. Null hipotézis felállítása (H 0 ): μ 1 = μ 2, vagy μ 1 - μ 2 =0. Ellenhipotézis. A minta a nullhipotézist alátámasztja-e? Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezzük. Próbafüggvény előállítása.

Próbák Kétoldali próba: két oldalról állít alsó és felső korlátot (a feltételtől való eltérés tényét vizsgáljuk, irányát nem). Egyoldali próba: csak az egyik irányban állít korlátot (csak ilyen irányú eltérés lehetséges vagy fontos számunkra).

Egy- és kétoldalas próbák Kétoldalas próba H 0 : nincs változás H a : van változás (bármilyen irányú) Egyoldalas próba H 0 : az átlag nem növekedett H a : az átlag növekedett p-értékek esetén: p(egyoldalas)=p(kétoldalas)/2

Átlagra vonatkozó hipotézisek Kétoldalú próbák: x x H : 0 1 2 H : x 1 1 x2 Egyoldalú próbák Baloldali: Jobboldali: H x1 x2 H : 1 : 0 1 x x 2 x x1 x H : 0 1 2 H : > 1 x2

p-érték (empirikus szignifikancia-szint) Az a legkisebb valószínűség, amely mellett a vizsgált H 0 hipotézist elutasíthatjuk a H 1 hipotézissel szemben, azaz, ahol éppen az elfogadásból az elutasításba váltunk. (A gépi output-ok ezt adják meg.) Fisheri döntés a p értéke alapján: p < : H 0 -t elvetjük (elfogadjuk H 1 -t) p : H 0 -t elfogadjuk

A szignifikancia értelmezése Normális populáció esetén ha rögzítjük a szignifikanciaszintet és a próba erejét akkor a szükséges mintalemszám egyenesen arányos a populáció szórásnégyzetével és fordítottan arányos annak a különbségnek a négyzetével, melyet ki szeretnénk mutatni. Első látásra ez egyszerűsíti a dolgokat, hisz a statisztikai szignifikancia elérése jórészt mintaelemszám kérdése.

Kritikus tartomány 0,95 Elfogadási tartomány Kritikus tartomány 0,025 0,025-3.0-2.5-2.0-1.5-1.0-0.5 0 0.5 1.0 1.5 2.0 2.5 3.0 Standard (z) Score Szignifikancia értelmezése

Mintaszám és erő (Sample Size and Power): Mintaszám meghatározása: Power : (80 or 90%) Hatásméret Variancia pilot study Signifikancia szint ( ) : (0.05) 1-tailed or 2-tailed testing (Confounders) Non-compliance, Cross-overs (Drop Ins/Outs), Lost to follow up

A statisztikai próba ereje A második fajta hiba komplementere: annak valószínűsége, hogy hatásosnak ítéljük a gyógyszert, amely valóban az is. Mivel komplementerekről van szó, a 20 százalékos második fajta hibához 80 százalékos erő tartozik. A valódi különbség kimutatásának valószínűsége:p=1- β. Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége. Minél kisebb az α, annál ritkább, hogy H 0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H 0 -t tévesen elfogadjuk (másodfajú hiba).

Az első- és másodfajú hiba csökkentése Minta elemszámának növelése. Pontosabb mintavételezés (szórás csökken). Lehet-e az első- és másodfajú hibát nullára csökkenteni? NEM. A véletlen hatásokat nem tudjuk kiiktatni.

A pontosság fokozása a kísérlet pontosabb kivitelezésével az ismétlésszám növelésével a parcellák csoportosításával, blokkképzéssel

Torzítás Randomizáció. Az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés.

A hipotézis vizsgálat menete A null- és alternatív hipotézis megfogalmazása. Próbafüggvény keresése/szerkesztése. Előre rögzített szignifikanciaszint mellett az elfogadási és elutasítási tartomány megszerkesztése. A próbafüggvény empirikus értékének meghatározása. Döntés.

Próbafüggvény

A próbafüggvény A hipotézisvizsgálat eszköze a próbafüggvény. A próbafüggvény a véletlen minta elemeinek függvénye, értéke mintáról-mintára változik, vagyis valószínűségi változó. Valószínűségi eloszlása bizonyos feltételek és a nullhipotézis helyességének a feltételezése mellett ismert.

A statisztikai próba A próbafüggvény kiszámított értékéhez megadható egy p valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ 1 = μ 2

Normális eloszlást feltételezve, az átlagok összehasonlítására használható próbák Egy minta esete: egymintás t-próba Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal): páros t-próba= egymintás t-próba a különbségekre. Független minták (placebo-kezelés, férfi-nő, betegegészséges): kétmintás t-próba Azonos szórások esetén klasszikus. Különböző szórások esetén módosított (Welch, D). Szórások egyezésének tesztelése: F-próba, Levene-próba. Több (>2) minta esete: varianciaanalízis.

Egymintás t-teszt Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Feltétel: H : x x 0 1 2 Normális eloszlású populáció. Egy egyénen kétszer mérjünk. n>6-8. Próbastatisztika: (df = n-1 ): X t 0 s / n

Párosított t-próba Két összefüggő minta középértékének összehasonlítására szolgál. H 0 : d átlag = 0 Próbastatisztika: (df = n 1 1) t s d d / n s d a párosított minták különbségének szórása, becslése a minta alapján.

Két középérték különbségének tesztelése Feltételek: Független minták. Normális eloszlásúak/robusztusság. Azonos szórás.

Kétmintás t-próba Két független minta összehasonlítása Feltételek: A minták függetlenek: normális eloszlású populációból származnak:az x i -k N(µ 1, ) és az y i --k N µ 2, ) eloszlású populációból H 0 : 1 = 2, H a : 1 2 Próbastatisztika Azonos varianciák esetén: t s p x y x y nm 1 1 sp n m s n m. Szabadságfok: n+m-2 Döntés: Ha t >t α,szab.fok, a különbség szignifikáns α szinten, H0-t elvetjük 2 p ( n 1) s ( m 1) s n m 2 2 2 x y

Kétmintás t-próba Két független minta összehasonlítása Feltételek: A minták függetlenek: normális eloszlású populációból származnak:az x i -k N(µ 1, ) és az y i --k N µ 2, ) eloszlású populációból H 0 : 1 = 2, H a : 1 2 Próbastatisztika Különböző varianciák esetén: d x y sx n s 2 2 y m szabadságfok g 2. ( n 1) ( m 1) 2 ( m 1) (1 g ) ( n 1) Döntés: n m Ha t >t α,szab.fok, a különbség szignifikáns α szinten, H0-t elvetjük g s 2 sx n s 2 2 x y

A varianciák összehasonlítása H 0 : 2 1= 2 2 H a : 2 1 > 2 2 vagy 2 1 > 2 2 (egyoldalú próba) A próbastatisztika (F): a nagyobbik standard deviáció négyzetét osztjuk a kisebbel: Szabadságfokok: nagyobb SD-hez tartozó minta elemszáma-1 Kisebb SD-hez tartozó minta elemszáma-1 Döntés: F táblázat alapján Ha F>F α,táblázat, a két variancia szignifikánsan különbözik α szinten F sx sy max( 2, 2 ) 2 2 min( s, s ) x y

z próba arányokra z = p 1 - p 2 pq --- 1 + --- 1 ( ) N 1 N 1 N 1 : az 1. minta elemszáma k 1 : az esemény abszolút gyakorisága k 1 N 1 p 1 = ---- relatív gyakoriság az 1. mintában N 2 : az 2. minta elemszáma k 2 : az esemény abszolút gyakorisága k 2 N 2 p 2 = ---- relatív gyakoriság az 2. mintában

u-próbák A matematikai statisztikában több u-próbát is ismerünk. Szűkebb értelemben ezek az - egymintás u-próba és a - kétmintás u-próba. Mindkét próba a paraméteres próbák özé tartozik. A két próba nagyon hasonló matematikai háttérrel rendelkezik, alkalmazási feltételeikben és nullhipotéziseikben is nagyon sok hasonlóság van. Tágabb értelemben a matematikai statisztikában általában is szoktak u-próbaként, vagy u-próbákként utalni minden olyan próbára, melyben a próbastaisztika standard normális eloszlást követ. A fenti két próba rokonítható rendre az egy és a kétmintáss t-próbához, mivel páronként ugyanazt a H 0 vizsgálják ugyanolyan adottságok mellett.

u-próbák Az egymintás esetben a hasonlóság még nagyobb, ugyanis az egymintás t-próba képlete csak annyiban tér el az egymintás u-próbáétól, hogy benne az előre megadott szórás helyén a minta alapján becsült szórás áll. Sőt, az egymintás t- és u-próba a legtöbb alkalmazási feltételben is azonos. Különbség a két próba között az alkalmazás szintjén mindössze egy feltételben van, mégpedig abban, hogy az egymintás t-próba nem igényli a vizsgált valószínűségi változó szórásának ismeretét, míg az egymintás u-próba esetében ez eleve adott kell, hogy legyen. (A matematikai háttérben az eltérés nagyobb.) A kétmintás u-próbához nem a kétmintás t-próba, hanem a Welch-próba áll ugyanolyan közel, mint az egymintás u- hoz az egymintás t.

Egymintás u-próba A próba alapgondolata, hogy a populációt m átlagú (várható értékű) és σ szórású normális eloszlásúnak feltételezzük és mintavételezéssel tesztelni kívánjuk, hogy az m szám tényleg tekinthető-e a populációs átlagnak, vagy ez a feltételezésünk nem tartható. A populációból véletlen módon egy n elemszámú mintát veszünk (x 1, x 2,,x n ) a minta értékeiből átlagot számolunk ( )és meghatározzuk az átlag eltérését az m feltételezett populációs átlagtól. Vizsgáljuk az eltérést: m

Az egymintás u-próba ahol próbastatisztikája : a vizsgált valószínűségi változó átlaga a mintában, :az előre adott érték, amihez az átlagot viszonyítjuk, :a vizsgált valószínűségi változó ismert szórása és : a minta elemszáma.

Az u-próba feltétele Eszerint, hogy a vizsgált populáció ismérve (valószínűségi változója): - intervallum vagy arányskálán mért - normális eloszlású - ismert szórású - ismert populációs átlagú (illetve várható értékű) A próba a populációs átlagot teszteli, így az utolsó feltételt pontosabb úgy fogalmazni, hogy feltételezéssel kell rendelkeznünk a populáció átlagára vonatkozóan.

Az u-próba hipotézisei : a populáció átlaga = m (nullhipotézis) : a populáció átlaga m (kétoldali ellenhipotézis) : a populáció átlaga = m (nullhipotézis) : a populáció átlaga < m (bal oldali ellenhipotézis) Illetve a másik lehetőség, hogy : m < a populáció átlaga (jobb oldali ellenhipotézis).