Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Hasonló dokumentumok
Eloszlás-független módszerek 13. elıadás ( lecke)

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Variancia-analízis (VA)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Az első számjegyek Benford törvénye

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Korreláció és Regresszió

Bevezetés a hipotézisvizsgálatokba

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Nemparaméteres próbák

Variancia-analízis (folytatás)

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika elméleti összefoglaló

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

V. Gyakorisági táblázatok elemzése

Statisztikai módszerek 7. gyakorlat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Függetlenségvizsgálat, Illeszkedésvizsgálat

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Adatok statisztikai értékelésének főbb lehetőségei

Statisztika Elıadások letölthetık a címrıl

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Biometria gyakorló feladatok BsC hallgatók számára

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis vizsgálatok

A konfidencia intervallum képlete: x± t( α /2, df )

egyetemi jegyzet Meskó Balázs

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Eloszlás-független módszerek (folytatás) 15. elıadás ( lecke)

A khi-négyzet próba és alkalmazásai: illeszkedésés függetlenségvizsgálat. khi-(χ 2 )-négyzet próba

Hipotézis vizsgálatok

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

[Biomatematika 2] Orvosi biometria

Variancia-analízis (folytatás)

Biostatisztika VIII. Mátyus László. 19 October

Kutatásmódszertan és prezentációkészítés

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztikai alapismeretek (folytatás)

y ij = µ + α i + e ij

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Biomatematika 13. Varianciaanaĺızis (ANOVA)

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Kutatásmódszertan és prezentációkészítés

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Normális eloszlás paramétereire vonatkozó próbák

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Kutatói pályára felkészítı modul

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Statisztikai módszerek 7. gyakorlat

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Biostatisztika Összefoglalás

Kettőnél több csoport vizsgálata. Makara B. Gábor

KÖVETKEZTETŐ STATISZTIKA

Biostatisztika Összefoglalás

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Táblázatkezelés 5. - Függvények

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

[Biomatematika 2] Orvosi biometria

Dr. Karácsony Zsolt. Miskolci Egyetem november

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

A Statisztika alapjai

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Centura Szövegértés Teszt

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Átírás:

Eloszlás-független módszerek (folytatás) 14. elıadás (7-8. lecke) Illeszkedés-vizsgálat 7. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok elemzésére Illeszkedés-vizsgálat

Gyakorisági sorok és táblázatok elemzése Bevezetés Kvalítatív ismérvek elemzésérıl lesz szó, az ismérv(ek) változatai kategóriák, osztály-megjelölések f-fel jelöljük adott osztályba esı mintaelemek számát (esetszám, gyakoriság = frekvencia), ezeket cellagyakoriság -oknak is nevezik, mert cellákba írjuk F-fel jelöljük az f (megfigyelt) gyakoriság becslését (várt értékét) az aktuális Ho hipotézis mellett

Gyakorisági sorok és táblázatok elemzése (Bevezetés folytatása) A null-hipotézis ellenırzésére általában két (eltérı) statisztika használatos ( f F) (1) K = () G = fln(f/f) F / itt a ln természetes alapú logaritmus/ Mindkettı az {f} észlelt cella-gyakoriságok táblázatának bizonyos távolsága az {F} várt cella-gyakoriságok táblázatától Mindkettı (közel) χ eloszlású (ha Ho igaz), G használata több szempont szerinti osztályozásnál elınyös

Illeszkedés vizsgálat Az n-elemő minta egyedeit a vizsgált kvalitatív ismérv szerint osztályokba soroljuk, az osztályok száma c, az i- edik osztályba f i egyed esik (Σ f i =n) A feltételezett sokasági megoszlás (ez H 0 ): p 1, p,, p c, összegük 1=100 %. Kérdés: a minta alapján elfogadható-e a feltételezett sokasági megoszlás?

Illeszkedés vizsgálat (folytatás) H 0 -t igaznak feltételezve átrendezzük az esetszámok megoszlását, f i becslése F i =np i (i = 1,,, c), ezek összege szintén n. Ezután kiszámítjuk az {f}: megfigyelési gyakoriságok táblázatának, és az {F}: f 1 f. f c F 1 F. F c becsült gyakoriságok táblázatának a x -távolságát (K vagy G)

Illeszkedés vizsgálat (folytatás) A két táblázat x -távolsága a K-statisztikával: K = ( f F ) ( f np ) i F i i E távolság a G-statisztikával: G = Mindkét statisztika közel x eloszlású, a szabadságfok = c-1. i np i i [ f i ln f i f i ln( np ] f i = f i ln = i ) F i

Illeszkedés vizsgálat (számpélda) N = 00 kétgyermekes családot véletlenszerően kiválasztva egy településen, kaptuk, hogy 54 családban lány, 36 családban fiú van. Ha elfogadjuk, hogy egy sokaságban a fiú:lány arány 50%-50 %, akkor a kétgyermekes családok negyedében lány, felében 1 fiú + 1 lány, negyedében fiú várható (c = 3 kategória). A H 0 hipotézis tehát p 0 =0,5 ; p 1 =0,50 ; p =0,5 ahol az index a fiúk számát jelenti a családban.

Illeszkedés vizsgálat (számpélda folytatása) A minta gyakorisági megoszlása f: 54 110 36 összesen n=00 A H 0 (1::1 arány) mellett a várt gyakoriságok F: 50 100 50 összesen: n=00 A két gyakorisági sor x -eltérése (df=): ( 54 50) ( 110 100) ( 36 50) K = G = 50 + 100 + = 5,4 [ 54ln( 54 / 50) + 110ln( 110 /100) + 36ln( 36 / 50) ] 5, 63 = A kritikus érték 5,99 (tábl.), az 1::1 arányt elfogadjuk. 50

Dichotom eset Ha az ismérv dichotom, a formulák lényegesen egyszerőbbé alakíthatók Jelölje a két osztályt A és B, feltételezzük (ez H 0 ), hogy az alapsokaságban az A osztályba esik az egyedek 100p%-a, a B osztályba 100q%-a (p+q=1). Az n elemő mintából a esik A-ba, b B-be (a+b=n). A becslések tehát A=np, B=nq

Dichotom eset (folytatás) A K statisztika eredeti formulája K = ( a np) ( b nq) +, np nq Némi algebrai átalakítás után ( a np) K = eloszlása 1 szabadságfokú npq khi-négyzet eloszlás, 5 %-os kritikus értéke 3,84 Ezt a képletet használtuk korábban a p sokasági relatív gyakoriság konfidencia határainak számítására.

Dichotom eset (folytatás) Speciálisan, a p=q null-hipotézisnél (a fele-fele arány ellenırzésénél) K képlete tovább egyszerősödik: K = ( a b ) a + b Számpélda: egy munkahelyen a=13 férfi és b=7 nı dolgozik. Megfelel-e ez a fele-fele aránynak? K = ( 13 7 ) 13 + 7 = 1,8 3,84 (a kritikus érték) a válasz: igen, megfelel (kétoldali próba) Az Excellel 1,8-hoz P=0,18-at kapunk. <

KÖSZÖNÖM TÜRELMÜKET

8. lecke Illeszkedés-vizsgálat dichotom ismérvre (folyt.) Kétirányú osztályozás elemzése (1)

Dichotom eset, kis mintaszám Kis mintaszámnál K (és G) eloszlása távolabb áll a khínégyzet eloszlástól. Ilyenkor a K-statisztikánál a Yates-korrekciót alkalmazzuk, a számlálóban a-np helyett a-np -0,5-öt írunk, illetve a fele-fele arány ellenırzésénél a-b helyett a-b -1et. ( 13 7 1) A fenti példában tehát K = = 1,5 13 + 7

Dichotom eset, kisminták (folytatás) Még pontosabb a Binominális eloszlással számolni A példánkban a fele-fele arány ellenırzése egyoldali (H 1 :p<1/) próba esetén így fest: P(nık 7 a 0-ból) = 0 0 0 0 + +... + / 0 1 7 [Az eredményt azonnal kapjuk az Excelbıl az fx- Binomiális menüpontból, a beírások: sikerek 7, kísérletek 0, valószínőség 0,5, eloszlásfüggvény IGAZ] Kétoldali próbánál P = x 0,13 = 0,6 ns = 0,13 ns

Dichotom eset folytatás (4) A G-statisztika formulái dichotom osztályozásnál p : q arányra G = a ln a np Speciálisan p = q = ½ esetre G = a ln a + b ln b n ln n / A példánkban a = 7, b = 13, n = a+b = 0, G = 7 ln 7 + 13 ln13 0 ln10 = 1, szinte azonos K értékével. + b ln b nq [ ( )] [ ] 83

q A két szempont szerinti osztályozás A minta-elemeket két szempont szerint osztályozzuk (besoroljuk) Az A szempont osztályainak száma a (A 1, A,, A a ) ezek az A ismérv változatai a B szempont osztályainak száma b (B 1, B,, B b ) ezek a B ismérv változatai. Az n mintaelem így ab számú cellába oszlik el, jelölje f ij az [A i B j ] cellába esı egyedek számát.

Két szempont szerinti osztályozás folytatás (1) Az alapsokaságra vonatkozóan két feladat-típus merülhet fel. Mindkét esetben ugyanazt a khí-négyzet statisztikát alkalmazzuk, csak az eredmények interpretációjában van eltérés. (1) Függetlenség vizsgálat: A és B mint változók függetlenek-e. Például hajszín és szemszín kapcsolata, iskolai végzettség és pártállás kapcsolata. () Homogenitás vizsgálat: az A ismérv osztályain azonosak-e a B ismérv szerinti gyakorisági megoszlások. Például különbözı településeken azonose az iskolai végzettség szerinti megoszlás.

Két szempont szerinti osztályozás folytatás() A hipotézis ellenırzése A megfigyelések {f ij } táblázatát összehasonlítjuk a H 0 hipotézishez igazított várt értékek {F ij } táblázatával, mindkettı a sorból és b oszlopból áll. F ij számítását késıbb ismertetjük. A két táblázat távolsága (K vagy G) (a-1)x(b-1) szabadságfokú khí-négyzet eloszlású statisztika: ( f ij Fij ) K =, G = f ij ln ( f ij / Fij ) F ij

Az esetszám táblázat (kontingencia táblázat sémája Az f ij megfigyelt gyakoriságok peremösszegekkel kiegészített sémája az alábbi: {f ij } B 1 B. B j. B b összeg A 1 f 11 f 1. f 1j. f 1b f 1. A f 1 f. f j. f b f......... A i f i1 f i. f ij. f ib f i......... A a f a1 f a. f aj. f ab f a. összeg f. 1 f.. f. j. f. b f..=n

Hipotézis ellenırzés kétirányú osztályozásánál (folytatás) A H 0 hipotézisnél (függetlenség, homogenitás) a várt (becsült) gyakoriságok: F ij = f i. f n. j (i = 1,,..,a; j = 1,,..,b) (a becslés miértjének elvi hátterét a foglalkozáson hallják) Az {f ij } táblázat mérete szintén a x b-s, peremösszegei azonosak az {f ij } táblázat peremösszegeivel, tehát az esetszámok átrendezésérıl van szó.

Kétirányú osztályozás (fiktív példa) n = 413 azonos korú férfira a felmérés {f ij }: A/B balszemes kétszemes jobbszemes összesen balkezes 34 = f 11 6 = f 1 8 = f 13 14 = f 1. kétkezes 7 8 0 75 = f. jobbkezes 57 105 5 14 = f 3. összesen 118 = f. 1 195 = f. 100 = f. 3 413 = n Kérdés: van-e kapcsolat a kezesség és a szemesség között (H 0 : nincs) A példa függetlenség vizsgálatra példa.

A fiktív példa folytatása (1) Függetlenség esetén a cella-gyakoriságok becslése F 11 = (14 x 118)/413 = 35,43 (34 helyett) F 1 = (14 x 195)/413 = 58,55 (6 helyett) F 13 = (14 x 100)/413 = 30,0 (8 helyett) és így tovább. Az elsı sor gyakoriságait becsültük itt, a becslések összege 14, megegyezik a megfigyelt gyakoriságok f 1. összegével.

KÖSZÖNÖM TÜRELMÜKET