Függetlenségvizsgálat, Illeszkedésvizsgálat

Hasonló dokumentumok
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Korrelációs kapcsolatok elemzése

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztikai alapfogalmak

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Kvantitatív statisztikai módszerek

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Statisztika elméleti összefoglaló

Sztochasztikus kapcsolatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Adatok statisztikai értékelésének főbb lehetőségei

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

[Biomatematika 2] Orvosi biometria

Nemparaméteres próbák

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

V. Gyakorisági táblázatok elemzése

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév


Statisztikai módszerek 7. gyakorlat

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

2. előadás. Viszonyszámok típusai

Kvantitatív elemzési módszerek

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Többváltozós lineáris regressziós modell feltételeinek

Hipotézis vizsgálatok

Korreláció számítás az SPSSben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Az első számjegyek Benford törvénye

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Bevezető Mi a statisztika? Mérés Csoportosítás

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kutatásmódszertan és prezentációkészítés

[Biomatematika 2] Orvosi biometria

Ted, tudom, mondtad, hogy felrobban a fejed, ha még egy dologra kérlek, de.. Takarítás a hármason.

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Többváltozós Regresszió-számítás

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Normális eloszlás paramétereire vonatkozó próbák

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

[GVMGS11MNC] Gazdaságstatisztika

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Hipotézisvizsgálat R-ben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria gyakorló feladatok BsC hallgatók számára

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A Statisztika alapjai

Sta t ti t s i zt z i t k i a 1. előadás

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Kísérlettervezés alapfogalmak

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Hipotézis vizsgálatok

TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

Biostatisztika Összefoglalás

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Asszociációs szabályok

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biostatisztika VIII. Mátyus László. 19 October

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

Sta t ti t s i zt z i t k i a 3. előadás

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Korreláció és lineáris regresszió

Varianciaanalízis 4/24/12

Matematikai statisztikai elemzések 5.

Több valószínűségi változó együttes eloszlása, korreláció

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

GVMST22GNC Statisztika II.

BIOMATEMATIKA ELŐADÁS

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Átírás:

Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika

A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata az összeüggéseket eltárja és azokat számszerűen jellemezze. A társadalmi, gazdasági élet jelenségeit nem elszigetelten kell vizsgálni. Az összeüggések elemzésének egyik ő módszere sztochasztikus kapcsolatok elemzése.

Ismérvek közötti kapcsolat Függvényszerű vagy determinisztikus kapcsolat ha az egyik ismérv szerinti hovatartozás egyértelműen eldönti a másik ismérv szerinti hovatartozást. (pl születési év életkor) Kapcsolat teljes hiánya az egyik ismérv szerinti hovatartozás egyáltalán nem beolyásolná a másik ismérv szerinti hovatartozást. A két ismérv között nem egyértelműen, csak tendenciaszerűen érvényesülő kapcsolat van valószínűségi vagy sztochasztikus kapcsolat.

Sztochasztikus kapcsolatok ajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).

Kapcsolatvizsgálat eszköze Két ismérv szerinti kombinatív osztályozás, eredménye a kombinációs tábla. Kontingencia tábla (X (ok), Y (okozat)). Elemzési eszköz a tábla adataiból megoszlási vagy koordinációs viszonyszámokat számolunk.

Mintapélda Egy vállalat dolgozóinak megoszlása adott évben őben Megnevezés Féri Nő Összesen Fizikai 251.309 143.044 394.353 Szellemi 24.074 59.032 83.106 Összesen 275.383 202.076 477.459 Egy vállalat dolgozóinak megoszlása adott évben %-ban Megnevezés Féri Nő Összesen Fizikai 63,73 36,27 100,00 Szellemi 28,97 71,03 100,00 Összesen 57,68 42,32 100,00 Forrás cég adatai Forrás cég adatai

Kontingencia tábla X szerinti osztályok Y C 1 Y C 2 Y szerinti osztályok Y C i Y C t j X C 1 X C 2 X C i X C s i 11 21 i1 s1.1 12 1 j. 22 i2 s2.2 2 j ij sj. j N 1t 2t it st.t 1 2. i. s.

Függetlenségvizsgálat Minta Nem paraméteres hipotézisvizsgálat Függetlenségvizsgálat Előordulhat, hogy véletlen hatás miatt egymástól teljesen üggetlen ismérvek vizsgálatakor nullától eltérő eredményt kapunk - -- Hipotézisvizsgálat Van-e kapcsolat adott szigniikancia szinten, a két minőségi ismérv között?

H 0 üggetlenek H 1 nem üggetlenek 2 s t i1 j1 ij ij ij 2

Ha van kapcsolat, milyen erős?

Viszonyításos mérőszámok Yule éle asszociációs együttható (alternatív ismérvek közötti kapcsolat) Csuprov éle asszociációs együttható Cramer éle asszociációs együttható

Yule éle asszociációs együttható Jellemzői csak alternatív ismérvek közötti kapcsolat szorosságának mérésére alkalmas; alapgondolata a koordinációs viszonyszámokkal történő vizsgálathoz kapcsolódik; alternatív ismérvek esetén jelöljük az ismérv egyik változatát 1- el, a másik ismérvváltozatot pedig 0-val; értéke -1 és +1 között van; Y=0 üggetlenség; Y= 1 - üggvényszerű kapcsolat.

Yule éle asszociációs együttható Ismérv (i,j) 1 0 Összesen 1 11 10 1 0 01 00 0 Összesen 1 0 n Ha nincs kapcsolat a két alternatív ismérv között, akkor a megelelő koordinációs részviszonyszámok megegyeznek egymással, vagyis 10 00 Az egyenlőség átalakítható a következőképpen 11 0 10 01 11 00 01 11 00 10 01

Yule éle asszociációs együttható Ha van az ismérvek között kapcsolat Y 11 00 10 01 11 00 10 01 1 Y 1 0 Y 1

Mintapélda Megnevezés Féri Nő Összesen Fizikai 251.309 143.044 394.353 Szellemi 24.074 59.032 83.106 Összesen 275.383 202.076 477.459 Y = 11 00 10 01 11 00 10 01 251309. 59. 032 24. 074 143. 044 251309. 59. 032 24. 074 143. 044 0, 62

Csuprov-éle asszociációs együttható Ha a két ismérv - melyeknek a kapcsolatát vizsgáljuk - legalább egyike nem alternatív, akkor a Yule-éle együttható nem alkalmazható. Csuprov-éle/Cramer-éle asszociációs együttható. Alapgondolata a tényleges gyakoriság és a üggetlenség esetére eltételezett gyakoriság közötti eltérés vizsgálatán alapul.

X szerinti osztályok Kontingencia tábla Y C 1 Y C 2 Y szerinti osztályok Y C i Y C t j X C 1 X C 2 X C i X C s i 11 21 i1 s1.1 12 1 j. 22 i2 s2.2 2 j ij sj. j N 1t 2t it st.t 1 2. i. s.

Csuprov-éle asszociációs együttható A megoszlási viszonyszámokkal történő elemzés alapján azt mondhatjuk, hogy ha az A és B ismérvek egymástól teljesen üggetlenek, akkor bármely tetszőleges gyakoriságra igaz, hogy i ij.. n j vagy Függetlenség esetére eltételezett gyakoriság ij * ij * (i = 1,... s; j = 1,... t) = i. ij. n j. j i. n

Csuprov-éle asszociációs együttható Fő mutatója a khi (c ) t 2 i=1 j=1 s ( * tényleges és eltételezett gyakoriságok összehasonlítására szolgál méri a tényleges és eltételezett gyakoriságok különbségét ij ij ij * ) 2

Csuprov-éle asszociációs együttható Jellemzői 0 T 1 2 T = n s - 1 t - 1 A T együtthatót mindig pozitívnak tekintjük. s=t esetében a maximális értéke 1. Az s=t=2 esetben akár a Yule-éle, akár a Csuprov-éle együtthatót használhatjuk az asszociáció szorosságának mérésére.

Cramer-éle asszociációs együttható A t s esetében a T által elérhető maximális érték T 4 max s -1 t -1 (s t) Ebben az esetben a Csuprov-éle együttható helyett a Cramer mutatót használjuk, melynek képlete C = T T max

Mintapélda A kutyatartók családi állapot és nem szerinti megoszlása egy településen Megnevezés éri nő Összesen nőtlen, hajadon 18 2 20 házas 49 5 54 elvált 17 7 24 özvegy 8 15 23 Összesen 92 29 121

2 Munkatábla ij ij * ( ij - ij *) 2 / ij * 18 15,20661 0,513133 49 41,05785 1,536313 17 18,24793 0,085343 8 17,4876 5,147339 2 4,793388 1,627871 5 12,94215 4,873822 7 5,752066 0,270744 15 5,512397 16,32949 121 121 30,38405 s t i1 j1 ij ij ij 2 30,384

Cramer éle asszociációs együttható T n 2 30,384 s 1 t 1 121 2 1 4 1 0,289 T max 4 s 1 t 1 4 2 1 4 1 0,7598 C = T T max 0,289 0,759 0,381 Gyenge kapcsolat edezhető el a kutyatartók családi állapota és a neme között.

Illeszkedésvizsgálat A sokaság eloszlásának egészére vonatkozó hipotézisek vizsgálatát illeszkedésvizsgálatnak hívjuk. Tiszta illeszkedésvizsgálat Becsléses illeszkedésvizsgálat Elméleti alapeloszlás Egyenletes eloszlás Normális eloszlás Tapasztalati eloszlások összehasonlítása

2 r i1 i np np i i 2 Gazdaságtudományi Kar H H 1 0 P r ( x r i ) i P ( x ) 2 r i1 i i np P P i i np i i (i=1,2,,r) 2 = H 0 H 1 normális eloszlást követ nem követ normális eloszlást Feltétel legalább 50 tagú legyen a sokaság, továbbá, hogy egy-egy ismérvváltozathoz (osztályközhöz) tartozó várható gyakoriság legalább 5 legyen

Osztály A kategória előordulásán ak valószínűsége a sokaságban A kategória előordulásán ak gyakorisága a mintában A kategória előordulásán ak relatív gyakorisága a mintában C 1 P 1 1 g 1 C 2 P 2 2 g 2 C i Pi i gi C r P r r g r Összesen 1 n 1

Egy 1986-os széles körű vizsgálat szerint Magyarországon a 15 éves és idősebb népesség 15%-a sovány, 25 %-a normál súlyú és 60 %-a túlsúlyos volt egy bizonyos kritériumrendszert igyelembe véve. 1994-ben azt találták, hogy 500 véletlenszerűen kiválasztott 15 éves és idősebb személy közül 72 ő sovány, 176 ő normál súlyú, 252 ő pedig túlsúlyos, ugyanannak a kritériumrendszernek az alapján. Az 1986-os eredményt teljes körű vizsgálat eredményének tekintve állíthatjuk-e 1 %-os szigniikancia-szinten, hogy a két eloszlás egyorma?

Életkor eloszlás normális eloszlást követ-e? H 0 normális eloszlás H 1 nem követ normális eloszlást

5%-os szign. szinten elogadható-e az az állítás, miszerint az almaák termésmennyiség szerinti átlag 138,75 eloszlása normális eloszlást követ? szórás 34,98 =NORM.ELOSZLÁS(x;középérték;szórás;igaz) Termésmennyiség (kg/a) Almaák száma (db) Pi' 51 75 14 0,034 76 100 15 0,1345 101 125 27 0,348 126 150 64 0,625 151 175 56 0,849 176 200 19 0,96 201 5 1 Összesen 200 -

Termésmennyiség (kg/a) Almaák száma (db) 51 75 14 0,034 0,034 76 100 15 0,1345 0,1005 101 125 27 0,348 0,2135 126 150 64 0,625 0,277 151 175 56 0,849 0,224 176 200 19 0,96 0,111 201 5 1 0,04 Pi' Összesen 200-1 Pi

Termésmennyiség (kg/a) Almaák száma (db) Pi' Pi n*pi 51 75 14 0,034 0,034 7 76 100 15 0,1345 0,1005 20 101 125 27 0,348 0,2135 43 126 150 64 0,625 0,277 55 151 175 56 0,849 0,224 45 176 200 19 0,96 0,111 22 201 5 1 0,04 8 Összesen 200-1 200

Termésmennyiség (kg/a) Almaák száma (db) Pi' Pi n*pi Khi^2 51 75 14 0,034 0,034 7 7 76 100 15 0,1345 0,1005 20 1,25 101 125 27 0,348 0,2135 43 5,95 126 150 64 0,625 0,277 55 1,47 151 175 56 0,849 0,224 45 2,69 176 200 19 0,96 0,111 22 0,41 201 5 1 0,04 8 1,125 Összesen 200-1 200 19,895

kritikus szigniikancia szint =KHI.ELOSZLÁS(x;szabadságok) 0,05% r 7 b 2 Kritikus érték meghatározása mivel hét osztályközünk van! mivel két becsült paramétert (átlag, szórás) használtunk, INVERZ.KHI(0,05;4) C= 9,487729 C< χ2, Ho-t elutasítjuk

Köszönöm a igyelmet! stbea@uni-miskolc.hu