kritikus érték(ek) (critical value).



Hasonló dokumentumok
kritikus érték(ek) (critical value).

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Statisztikai hipotézisvizsgálatok

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

BIOMATEMATIKA ELŐADÁS

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Hipotézis vizsgálatok

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

VII. A határozatlan esetek kiküszöbölése

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztika 1. zárthelyi dolgozat március 18.

Statisztika 1. zárthelyi dolgozat március 21.

A matematikai statisztika elemei

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Bevezetés a hipotézisvizsgálatokba

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Függetlenségvizsgálat, Illeszkedésvizsgálat

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Matematika B4 I. gyakorlat

6. feladatsor. Statisztika december 6. és 8.

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Matematikai statisztika

A statisztika részei. Példa:

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Valószín ségszámítás és statisztika

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Kutatói pályára felkészítı modul

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Nemparaméteres próbák

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Nevezetes sorozat-határértékek

Biostatisztika Összefoglalás

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

1. A radioaktivitás statisztikus jellege

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Az új építőipari termelőiár-index részletes módszertani leírása

18. Differenciálszámítás

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Normális eloszlás paramétereire vonatkozó próbák

3. Számelmélet. 1-nek pedig pontosan három. Hány pozitív osztója van az n számnak? OKTV 2012/2013; I. kategória, 1. forduló

A figurális számokról (IV.)

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotézis-ellenırzés (Statisztikai próbák)

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

2. fejezet. Számsorozatok, számsorok

Statisztikai módszerek 7. gyakorlat

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Komputer statisztika

ÖSSZEFÜGGÉSVIZSGÁLAT, PARAMÉTERBECSLÉS

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Hipotézis vizsgálatok

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Kombinatorika. Variáció, permutáció, kombináció. Binomiális tétel, szita formula.

GAZDASÁGI MATEMATIKA 1. ANALÍZIS

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Diszkrét matematika II., 3. előadás. Komplex számok

Gyakorló feladatok II.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

A brexit-szavazás és a nagy számok törvénye

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL

Matematika I. 9. előadás

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Kísérletek tervezése és értékelése

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

3.1. A Poisson-eloszlás

Villamos gépek tantárgy tételei

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

? közgazdasági statisztika

Statisztika. Eloszlásjellemzők

Matematikai statisztika

Statisztika Elıadások letölthetık a címrıl

Az állat becsült kor. teljes súly. teljes hossz orrtól. törzs hossza. pocak körkörös méret. hátsó láb hossza kör

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

7. el adás Becslések és minta elemszámok fejezet Áttekintés

Feladatok és megoldások a 11. heti gyakorlathoz

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

Adatok statisztikai értékelésének főbb lehetőségei

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

Átírás:

Hipotézisvizsgálatok (hypothesis testig) A statisztikáak egyik célja lehet a populáció tulajdoságaiak, ismeretle paramétereiek a becslése. A másik tipikus cél: valamely elmélet, hipotézis empirikus bizoyítása vagy cáolata. Nullhipotézisek (ull hypothesis) (H) evezzük azt a hipotézist, amelyet pillaatyilag ics okuk megkérdőjelezi, amely a tudomáy jelelegi álláspotja szerit elogadható, amelyet, ha a kísérlet/elmérés semmi újat em hoz, továbbra is etartuk, amely helyett ekük már jobb elméletük va, és a kísérletet éppe eek a bizoyítására (egybe a régi megcáolására) szájuk. Ellehipotézisek (alterative hypothesis) (H) evezzük azt a hipotézist, amelyek bizoyítását a kísérlettől várjuk (az új elmélet ). Megszoktuk, hogy általába valamely külöbség, hatás, korreláció meglétét, azaz emulla voltát szereték bizoyítai, tehát azt a hipotézist szoktuk H-ak választai, hogy az illető dolog (külöbség, stb.) egyelő ullával. Teszt-statisztika (test statistic), próbastatisztika, próbaüggvéy: az a mitából számított meyiség, amelyek értéke alapjá a dötést hozzuk. A teszt-statisztika mivel a mitából számítjuk véletle változó. Olya meyiségek kell leie, amelyek eloszlása lehetőleg miél jobba eltér a H és a H eállása eseté, például kisebb értékekre számíthatuk H, agyobbakra H eseté. Elutasítási vagy kritikus tartomáy (rejectio regio): a dötési szabályt meghatározó számhalmaz, ha a teszt-statisztika értéke ide esik, a ullhipotézist elvetjük, ha em, megtartjuk. A kritikus tartomáy kiegészítő halmazát elogadási tartomáyak is evezik. E két tartomáyt elválasztó érték(ek) az úgyevezett kritikus érték(ek) (critical value). Elsőajú hiba valószíűsége (Type I error rate), α, aak a valószíűsége, hogy H-t elvetjük, pedig igaz. Az elsőajú hiba, hogy a teszt-statisztika értéke a kritikus tartomáyba esik, bár a H igaz. α a teszt-statisztika ull-eloszlásától * (ull distributio) és a kritikus tartomáy megválasztásától ügg. Szokásosa a kritikus tartomáyt úgy választjuk, hogy α = 5% (vagy %, esetleg.%) legye. Példa: Ha arra vagyuk kívácsiak, hogy egy pézérme szabályos-e, akkor H: az érme szabályos, azaz P(ej)=P(írás)=.5 H: az érme em szabályos Mita: 6 dobás eredméye (csak a példa egyszerűsége kedvéért ilye kicsi) Teszt-statisztika: a ejek száma a 6-ból Null-eloszlás: (a ejek számáak eloszlása H eállása, azaz az érme szabályossága eseté): biomiális eloszlás = 6 és p =.5 paraméterrel, azaz érték 3 4 5 6 valószíűség.56.938.344.35.344.938.56 Dötési szabály: vagy 6 ej eseté elvetjük H-t. Az első ajú hiba valószíűsége:.56+.56=.3 Mivel a tesztek evüket általába a ull-eloszlás utá kapják, ezt biomiális tesztek evezik. Másodajú hiba (Type II error) : ha a H-t megtartjuk, pedig H igaz. Valószíűségét β-val jelöljük, (-β) a teszt ereje power. * a teszt-statisztika eloszlása H eállása eseté

Egy- és kétoldali ellehipotézis A céljaiktól üggőe a legtöbb tesztbe két ajta ellehipotézissel dolgozhatuk. Az első esetbe az elogadási tartomáy midkét oldalá va elutasítási tartomáy. Az eredméy értékelésekor a eltételezett értéktől való midkét iráyú eltérés érdekes. Ez a kétoldali ellehipotézis. H: p=p H: p p Időkét az egyik iráyú eltérés érdektele a kísérlet szempotjából, például ha egy új eljárást vizsgáluk a vércukorszit csökketésére, akkor érdektele az, hogy az érték ő vagy változatla marad, csak a csökkeést va értelme kimutati. Ez az egyoldali ellehipotézis. H: p p H: p>p, vagy H: p p H: p<p Figyeljük meg, hogy a ullhipotézisbe midig va egyelőség. Az, hogy számukra a ullhipotézis elutasítása vagy megtartása a kedvező, midig a kísérleti elredezéstől ügg. Normális eloszlású változó várható értékére voatkozó próbák egy mita eseté z-próba vagy u-próba (u-test) Tartható-e az az álláspot, hogy a vizsgált változó populációátlaga egy eltételezett µ érték? Feltétel: ormális eloszlású változó, valamit (ismert σ szórás, vagy 3-ál agyobb elemszám). Próba-statisztika: z x µ u= σ =, ahol Z ~ N(,) Nullhipotézis: H : µ = µ Ellehipotézis: H : µ µ,45,4,35,3,5,,5,,5 a/ a/ -zkrit 4 7 3 6 9 5 8 3 34 37 4 43 46 49 5 55 58 6 zkrit Kritikus tartomáy: K :{ z > } z krit Nullhipotézis: H : µ µ Ellehipotézis: H : µ > µ,45,4,35,3,5,,5,,5 4 7 3 6 9 5 8 3 34 37 4 43 46 49 5 55 zkrit 58 6 Kritikus tartomáy: K :{ z > } z krit a egymitás t-próba (oe sample t-test) Feltétel: ormális eloszlású változó (robosztus, elég ha szimmetrikus és uimodális) Próba-statisztika: x µ =, s t mely Studet éle t eloszlású változó, - szabadsági okkal Mide más megegyezik a z-próbával. Az egyetle külöbség, hogy a szórás ismert, vagy a mitából kell becsüli. A t-próba értelemszerűe kevésbé hatékoy, hisze eggyel több becsült paramétert haszál. Ha a mitaelemszám elég agy (>3), akkor haszálható a z-próba is. A z-próbát csak a kézzel, táblázatból törtéő muka eseté preeráljuk. A számítógépes programokkal yugodta haszálhatjuk a t-próbát.

Normális eloszlású változó várható értékére voatkozó próbák két mita eseté z-próba vagy u-próba Tartható-e az az álláspot, hogy a vizsgált változók átlaga megegyezik a két populációba? Feltétel: üggetle, ormális eloszlású változók, valamit (ismert szórások, vagy 3-ál agyobb elemszámok). Próba-statisztika: z Nullhipotézis: H : µ = µ x x = u =, ahol Z ~ N(,) σ σ + Mide más ugyaúgy megy, mit az egymitás esetbe. Kétmitás t-próba (two sample t-test) Feltétel: üggetle, ormális eloszlású változók ismeretle, de vélhetőe azoos szórással. x x Próba-statisztika: t=, ahol s = s + Szaadsági okok száma: + Nullhipotézis: H : µ = µ ( ) s + ( ) + Ha a két szórás em egyezik meg, akkor vagy megpróbáljuk traszormáli a mitákat, vagy közelítő próbát alkalmazuk. (Welch-próba) s Welch-próba (Welch-test) Feltétel: üggetle, ormális eloszlású változók. Próba-statisztika: t = x x Szabadsági okok száma: s s + W = ( )( ) ( ) + ( )( ) c c, ahol c s = s + s Nagy mitákra (midkét elemszám agyobb, mit 3) a szórások jól becsülhetőek és a z-eloszlás kritikus értékei elég közel vaak a t-eloszlás kritikus értékeihez, ezért a z- próba haszálható a mitából becsült szórások eseté is. A t-próbát és a Welch-próbát kis mitákra haszáljuk attól üggőe, hogy a szórásokat azoosak godoljuk-e. Ha em tudjuk, haszálhatjuk az F-próbát a szórások tesztelésére. A statisztikusok egy része ezt em ogadja el, szeritük a két szórás sosem tekithető azoosak. A Welch-próba is csak közelítő eredméyt ad, de haszálata széles körbe elogadott. A eti módszerekkel em csak az átlagok egyelősége tesztelhető, haem a köztük levő eltérés is. A számítógépes programok általába csak a t-próbát ismerik, a Welch-próbát is abba építik be.

Várható értékre voatkozó próba két összeüggő mita eseté Páros t-próba (paired t-test) Ha a két mita összeügg (például ugyaazo egyedeke végeztük a mérést a kezelés előtt és a kezelés utá, vagy ikerpároko mérük, ), akkor a kétmitás t-próbáál jóval erősebb a páros t-próba (paired t-test). Techikailag egy mitát képzük, kiszámolva mideütt a két változó értékéek külöbségét, és arra egymitás t-próbát alkalmazuk. Feltétel: a mérések ugyaazo az egyedeke, vagy más módo párosítható mitáko törtétek (a miták em üggetleek), valamit a két változó külöbsége ormális eloszlású (a változók em kell, hogy azok legyeek). Nullhipotézis: H : µ d = µ d µ Próba-statisztika: t= sd Megjegyzések: A páros t-próba azért erősebb, mert iormációt hordoz, hogy melyik mérés melyikkel áll párba. A kapott külöbségek szórása jóval kisebb lehet, mit a kétmitás próbába előálló szórás. Ha kezelés előtti és utái eredméyeik vaak, akkor a külöbséget célszerű úgy képezi, hogy a későbbi mérés eredméyéből vojuk ki a korábbiét, ez esetbe ugyais a pozitív eredméy jeleti a övekedést. Variaciaaalízis (ANOVA) Kettőél több mita eseté aak a ullhipotézisek a tesztelésére szolgál, hogy valameyi részpopulációba, amelyekből a miták származak, ugyaaz a várható érték. Az ellehipotézis, hogy va olya (egy vagy több) részpopuláció, melybe a várható érték eltér. A próba eltétele a változók ormalitása és a szórásuk azoossága, valamit az adatok üggetlesége. Számtala módo előordulhat az, hogy a ullhipotézis em teljesül! z-próba Populációba egy tulajdoság aráyára voatkozó próba Tartható-e az az álláspot, hogy a vizsgált tulajdoság előordulási valószíűsége a populációba a eltételezett p érték? Feltétel: mivel a próba a biomiális eloszlás közelítésé alapul, hagyomáyosa akkor tekitik elogadhatóak, ha 5 ˆ p 5, ahol pˆ a mitabeli relatív gyakoriság. Nullhipotézis: H : p= p Próba-statisztika: z= pˆ p p ( p ) Ha a eltételek em teljesülek, akkor egzakt biomiális próbát kell csiáli. (Lásd koidecia-itervallum meghatározás )

Két valószíűség összehasolítása Származhat-e a két üggetle mita adott tulajdoságra voatkozóa azoos előordulási valószíűségű populációból? Nullhipotézis: H : p = p pˆ pˆ Próbastatisztika: z=, ahol p ( p ) p + = p + + p p Két valószíűség összehasolítása homogeitás vizsgálatkét, törtéhet. χ -próbával is χ -próba Egy változó variaciájára voatkozó próba Tartható-e az az álláspot, hogy a vizsgált változó populációbeli variaciája egy eltételezett σ érték? Feltétel: a vizsgált változó ormális eloszlású. σ σ Nullhipotézis: H :σ = vagy H :σ vagy Próba-statisztika: χ Szabadsági ok: - ( ) s = σ Kritikus tartomáy: H :σ σ eseté χ : χ χ + p vagy χ χ p H :σ < σ eseté χ : χ χ + p F-próba (F-test) Két változó variaciájáak összehasolítása Tartható-e az az álláspot, hogy a vizsgált változók variaciája megegyezik a két populációba? Feltétel: ormális eloszlású(!) üggetle változók, s σ σ s (sorszámozás kérdése ) Nullhipotézis: H :σ = vagy H :σ (harmadik em lehet s s Próba-statisztika: F = s Szabadsági ok: - a számlálóba, - a evezőbe Kritikus tartomáy: { F : F F p } illetve { F : F F p} A ormalitás agy mitaelemszám eseté is kell. s miatt)

Nemparaméteres próbák Ha az eddig megismert paraméteres próbák em alkalmazhatóak, mert em teljesülek a eltételeik, akkor emparaméteres próbákat kell alkalmazi. Ezek általába sokkal egyszerűbbek, mit a paraméteres próbák, sokkal megegedőbbek (eltételek), viszot jóval kisebb az erejük. A paraméteres és a emparaméteres próbák összehasolítása Nemparaméteres próbák Paraméteres próbák Nagyjából üggetleek a változó eloszlásától. Feltételezik, hogy ismert a változó DE: azért em mide eloszlásra, csak egy eloszlása: (leggyakrabba) ormális, tágabb körre. Feltételeket elleőrizi kell. expoeciális, biomiális, stb. Mediáok összehasolítása. Gyakoriságok elemzésére alkalmas. Származtatott adatok elemzésére is jó, pl. aráyok. Átlagok és variaciák összehasolítása. A gyakoriságokat általába traszormáli kell előtte. Származtatott adatokat először traszormáli kell. Előjelpróba (sig test) Tartható-e az az álláspot, hogy a vizsgált változó mediája egy eltételezett med érték? Feltétel: a vizsgált változó eloszlása olytoos. 6< < 3 Nullhipotézis: H : med = med Próba-statisztika: a med hipot -ál agyobb mitaelemek száma., ha xi > med δ i =, B= δ i, ha xi < med i= Vigyázat! -be azokat em számoljuk bele, ahol x i = med! Kritikus tartomáy: a ull-eloszlás biomiális, =mitaelemszám, p=.5. A kritikus tartomáy H -től üggőe egy- vagy kétoldali. Megjegyzések: A próbát azért hívják előjelpróbáak, mert eredetileg a mediá(x) = hipotézis tesztelésére találták ki, és ekkor a próbához a mitabeli értékekek csupá az előjelét haszáljuk. Két párosított mita eseté a külöbségekre alkalmazható. Feltételkét az eloszlás olytoossága helyett elegedő ayi is, hogy P(med ) =. Nagy mitára a biomiális eloszlást a szokásos módo közelíthetjük Poissoal vagy ormálissal. Ugyaígy megy mediá helyett tetszőleges kvatilisre. Wilcoxo-éle előjeles rag-próba (Wilcoxo siged rak test) Tartható-e az az álláspot, hogy a vizsgált változó mediája egy eltételezett med érték? Feltétel: a vizsgált változó eloszlása olytoos és szimmetrikus Szimmetrikus eloszlás eseté a mediá és az átlag egybeesik, ezért midegy, melyikkel ogalmazzuk meg a hipotéziseket. Csak hagyomáy-tiszteletből írjuk el mediáal. Nullhipotézis: H : med = med Próba-statisztika: a megigyelt értékek med -tól való eltéréseit abszolút értékük agysága szerit sorba redezzük, és ragszámokat redelük hozzájuk. A statisztika a pozitív eltérésekhez tartozó ragok összege. Párosított miták eseté a külöbségre alkalmazható.

Példa: elemű mita:.4 3.3 5. 5. 6. 7.5..5 3. 8. med = 9 Eltérések: -7.6-5.7-4. -4. -.8 -.5..5 4. 9. Ragszámok: 9 8 6* 6* 4.5.5 6* * Egyelő abszolút eltérést adó értékek (ties) eseté midegyikük az összese rájuk jutó ragok átlagát kapja (kapcsolt ragok, tied raks). A pozitív eltérések ragösszege: T + = 9.5 Kritikus tartomáy: K { T } : + T krit. A ull-eloszlást kis mitaelemszámokra kiszámolták, a kritikus értékeket táblázatba oglalták. (Csak akkor érvéyes, ha icseek kapcsolt ragok!) ( +) ( + )( + ) Nagyobb mitákra a ull-eloszlás a µ =, σ = paraméterű 4 4 ormálissal közelíthető, a kritikus értékek ebből számolhatók. Ma-Whitey-éle U-teszt (vagy: Wilcoxo-éle ragösszeg-teszt) Tartható-e az az álláspot, hogy a vizsgált X és Y változókra igaz a P(X<Y)=P(X>Y) egyelőség (azaz ha midkét változót megigyeljük, azoos esély va arra, hogy az egyik, illetve a másik lesz agyobb)? Feltétel: a változók eloszlása olytoos, sűrűségüggvéyeik azoos alakúak (eltolással egymásba átvihetők, variaciák megegyezek); a két változóra két üggetle miták va. Nullhipotézis: H : a változók eloszlása megegyezik, azaz az eltolás. Ellehipotézis: H : az eltolás (ez kétoldali ellehipotézis, de megogalmazható egyoldali is) Ellehipotézis: H : F( X ) / F(Y) Kolmogorov-Smirov próba Tartható-e az az álláspot, hogy a vizsgált X és Y változók eloszlása azoos? A kétmitás t-próba megelelője em egyező variaciák esetére. Feltételek: Ordiális vagy olytoos változók, üggetle miták, azoos alakú eloszlások. Nullhipotézis: H : F( X ) F( ) Y Próbastatisztika: A két eloszlásüggvéy közötti maximális dierecia. Nagyo kevéssé hatékoy teszt. Mediá (Mood) próba Tartható-e az az álláspot, hogy a két mita ugyaakkora mediáú populációból származik? Nullhipotézis: H : med= med Számítás meete: Kiszámítjuk az összes adat közös mediáját. Készítük belőle egy -es kotigecia táblázatot, és abból kiszámítjuk az alábbi χ értéket: Próba-statisztika:. mita. mita > Közös mediá Közös mediá χ = ( + )( + )( + )( + )

Kritikus tartomáy: H : med med eseté { χ : χ χ α / vagy χ χ α / }, H : med < med eseté { χ : χ χ α }, H : med > med eseté { χ : χ χ α }, ahol α az elsőajú hiba megegedett szitje, χ α, χ α / és χ α / pedig az - szabadsági okú χ -eloszlás megelelő kritikus értékei. Megjegyzés: Sokkal gyegébb teszt, mit a kétmitás t-próba, illetve a M-W teszt, ha azok is alkalmazhatók. Ha éháy gyakoriság agyo kicsi, akkor a Fischer-éle egzakt teszt alkalmazadó. Példa: X-re 8 elemű mita:, 3, 7, 8, 9, 5, 6, 7 Y-re elemű mita: 5, 6, 8,,, 5, 8,, 3, 5 Összevot mita:, 3, 5, 6, 7, 8, 8, 9,,, 5, 5, 6, 7, 8,, 3, 5 Közös mediá = χ =. mita. mita > Közös mediá =3 =6 Közös mediá =5 =4 ( + )( + )( + )( + ) 8 8 3 4 6 5 = ( 3+ 5)( 6+ 5)( 3+ 6)( 5+ 4) 8 9 = =, 45< χ, 5 = 3, 84 8 9 9 H -t em vetjük el Kruskal-Wallis-éle H teszt (Kruskal-Wallis H-test) Több mit két mita eseté haszáljuk, hasolóa az ANOVA-hoz. Feltétel: a változók eloszlása olytoos, sűrűségüggvéyeik azoos alakúak (eltolással egymásba átvihetők); k változóra k üggetle miták va. Nullhipotézis: H : mid a k változó eloszlása megegyezik Ellehipotézis: H : em mid azoos eloszlásúak Próba-statisztika: boyolult (lásd lejjebb) Kritikus tartomáy: a ull-eloszlás aszimptotikusa χ (k szabadsági okkal), ebből kaphatjuk a kritikus értékeket Példa: Egy biológus 4 mező (A, B, C, D) 5-5 véletleszerűe kiválasztott kvadrátba számolja az orchideákat. Va-e külöbség bármelyik két mező között az orchideák számát tekitve? meg/mező A B C D 7 () 48 (6) (6) 44 (5) 4 (7) 8 (9,5) () 7 (9) 3 8 (4,5) 3 (3) 3 () 8 () 4 8 (9,5) 5 (7) 5 (8) 55 (8) 5 7 (3) () 8 (4,5) 39 (4) A Kruskal-Wallis próba meete: Készítsük el a eti táblázatot. Oszlopokét vaak a miták, zárójelbe a megigyelések ragja (összes mitaelemre együtt kiszámítva). Számítsuk ki mitákét a darabszámokat ( i ) és adjuk össze: N. Számítsuk ki mitákét a ragösszeget: R i. Emeljük égyzetre: R i.

Ri Osszuk el a mitaelemszámmal és adjuk össze:. A próbastatisztika ( χ eloszlású): Ri K = 3 N+ i N( N+ ) Hasolítsuk össze K-t a megelelő χ krit (4-=3).χ krit = 7. 8. K krit i ( ) értékkel. A szabadsági ok: a miták száma- >χ elutasítjuk a H -t. Ezek szerit az orchideák számát tekitve a mezők em tekithetők egyormákak. Csak azt tudjuk, hogy valamelyik kettő között biztos va külöbség. Biztos, hogy a Ri legagyobb és a legkisebb átlagos ragszámú külöbözik, jele példába a C és i D mezők. Megjegyzések: Két mita eseté ugyaaz mit a Ma-Whitey próba. Szigiikacia eseté em tudjuk megmodai, hogy téylegese melyikek külöbözek (legkisebb-legagyobb biztos). Ha a H : med = med =... = medk hipotézis szereték teszteli, a mediá próba kiterjeszthető több mita esetére. Nem üggetle miták eseté a Friedma teszt haszálható. Gyakoriságok elemzése Leszámolásos mitákra alkalmazható próbák. Klasszikus módszer: χ próba. Alkalmazzák homogeitás, véletleszerűség, üggetleség és illeszkedésvizsgálatra. Alapelv: megigyelt gyakoriságokat összehasolítása ullhipotézis alapjá várt gyakoriságokkal. Ha az eltérés egy bizoyos kritikus értékél agyobb, akkor elutasítjuk a ullhipotézist. Léyeg: hogya számítsuk ki a várt gyakoriságokat? Illeszkedés vizsgálat (goodess-o-it, GOF) Tartható-e az az álláspot, hogy a vizsgált változó populációbeli eloszlása (eloszlásüggvéye) egy eltételezett F hipot eloszlás (eloszlásüggvéy)? χ -próba Feltételek: a próbához a változó értékkészletét osztályokba kell soroli és mide osztályra meghatározi az e i ú. várt gyakoriságot (a gyakoriság illeszkedés eseté várható értékét): a mitaelemszámot meg kell szorozi aak az i. osztályak a eltételezett eloszlás szeriti valószíűségével. Akkora mitával kell dolgozi, vagy az osztályokat úgy megválasztai, hogy az e i -k e legyeek 3-ál kisebbek, és 5-él kisebbek is legeljebb az osztályok %-ába. H : : F F H F F P.4.3.. 4 6 5 5 χ

Próba-statisztika: ( i e i), ahol i a megigyelt gyakoriság, ei a várt χ k = i= ei gyakoriság, k pedig az osztályok száma. Kritikus tartomáy: K: { χ χkrit} megelelőe kell kikeresi. >. A kritikus értéket a szigiikacia szitek Tiszta illeszkedésvizsgálat: A eltételezett eloszlás típusa és paraméterei is ismertek. Szabadsági ok: k -. Becsléses illeszkedésvizsgálat: Csak az eloszlás típusa ismert, a paramétereit becsüljük. Szabadsági ok: k--(becsült paraméterek száma). Normalitást is ezzel a próbával vizsgálhatuk. d = eseté szokták az ú. Yates korrekciót alkalmazi: χ = k ( i ei.5), i= ei de erről a statisztikusok véleméye külöbözik, azt a módszert kell haszáli, amely a tudomáyterülete, vagy az adott olyóiratba szokásos. Példa: Kockadobás. Az az elképzelésük (modellük), hogy a kocka szabályos, azaz mide szám egyorma (/6) valószíűséggel ordulhat elő. A modell teszteléséhez dobáljuk a kockát, számoljuk az egyes előordulások gyakoriságát, majd elvégezzük a χ -próbát. Formálisa elírva a hipotéziseket: H : A kocka szabályos H : Nem szabályos ( i e i), ahol i a megigyelt gyakoriság, χ k = i= ei ei a várt gyakoriság, k pedig az osztályok száma. Behelyettesítve a képletbe: ( 8 ) ( 6 ) ( 4 ) 4 χ = + +... + = = 4.. > χ krit =. 7 elutasítjuk a ullhipotézist! érték megigyelt ( i ) várt (e i ) gyakoriság 8 6 3 6 4 7 5 9 6 4 Kolmogorov-Szmirov próba Az eloszlásüggvéyek legagyobb abszolút eltérését veszi csak igyelembe. Példa: Házi rövidszőrű macskák étkezési preereciáiak tesztelése. Ugyaaz a táp 5 éle edvességtartalommal. 35 éhes macskát letettek egyekét az 5 táptól ugyaolya távolságra. Melyiket választják? H : A macskákak ics edvesség preereciája H : Legalább egyélét preerálak Próba-statisztika: d max =7 Táblázatból: d krit(.5, 5, 35) =7 K:{d max d krit } H -t elutasítjuk. Nedves száraz táp 3 4 5 i 8 3 6 6 e i 7 7 7 7 7 kum i 8 7 33 35 kum e i 7 4 8 35 d i 7 6 5 Függetleségvizsgálat khi-égyzet próba Tartható-e az az álláspot, hogy a két vizsgált változó üggetle egymástól? A próbához midkét változó értékkészletét osztályokba kell soroli (em eltétleül ugyaayi osztályba!) és mide osztály-kombiációra (cellára) meghatározi az ú. várt gyakoriságot (e ij ) az alábbi képlettel: e ij I ( ij )( ij ) i= j= = I J J ij i= j=, ahol I és J az egyik, illetve másik változó szeriti osztályok száma, ij pedig az i,j-edik cella mitabeli gyakorisága. 3... J-ik osztály Feltételek: Akkora mitára va szükség, hogy az e ij várt gyakoriságok e legyeek 3- ál kisebbek, és 5-él kisebbek is legeljebb a cellák %-ába.... I-ik oszt. ez a (, 3)-ik

Nullhipotézis: H: a két vizsgált változó üggetle egymástól Ellehipotézis: H: em üggetleek ( ) Próba-statisztika: = I J ij eij χ, ahol ij a megigyelt, e ij a várt gyakoriság az i= j= eij i,j-edik cellába, I és J pedig az egyik, illetve a másik változó szeriti osztályok száma. Elutasítási tartomáy: {χ :χ χ α}, ahol χ -eloszlás megelelő kritikus értéke. χ α az (I )(J ) szabadsági okú Ha em üggetle két változó, akkor hogya tudjuk méri a kapcsolat erősségét? kotigecia táblázatok (omiális változók eseté) pl. asszociációs mértékekkel, ordiális skálák eseté pl. ragkorrelációval, itervallum skála eseté pl. a korrelációs együtthatóval. Homogeitásvizsgálat Tartható-e az az álláspot, hogy a vizsgált változó eloszlása (eloszlásüggvéye) azoos a két populációba? Függetleségvizsgálat A vizsgálatot visszavezethetjük üggetleségvizsgálatra egy új változó segítségével, amelyek értéke mide mitaelemre aak a populációak a sorszáma, amelyből a mitaelem származik ( vagy ). Az, hogy a vizsgált változó ugyaolya eloszlást követ a két populációba, ekvivales azzal, hogy a vizsgált változó üggetle ettől a sorszám-változótól. A sorszám-változóak természetese két osztálya va, a vizsgált változó értékeit pedig a üggetleségvizsgálat eltételeiek megelelőe kell osztályokba soroli. osztály (populáció) 3... J-ik osztály Feltételek: lásd a üggetleségvizsgálatál. Nullhipotézis: H: F =F, ahol F és F az ismeretle eloszlásüggvéyek. Ellehipotézis: H: F F Próba-statisztika: lásd a üggetleségvizsgálatál. Elutasítási tartomáy: lásd a üggetleségvizsgálatál. Ezzel a módszerrel kettőél több populációra is végezhető homogeitásvizsgálat. Ha em lett vola érthető: midkét mitát osztályokba soroljuk, azoos határokkal. A táblázat első sorába az első mitából, a második sorába a második mitából írjuk be a megigyelt gyakoriságokat. Így az első sor az első mitára, a második a második mitára voatkozik. Ha a két sorba az eloszlás azoos, az ugyaazt jeleti, mitha a két mita üggetle lee.

Fisher egzakt teszt x-es kotigecia táblázatokra Ha túl kicsik a gyakoriságaik, akkor a χ próba em ad helyes eredméyt (csak közelítés, agy mitákra működik jól.) A Fisher egzakt teszt azt számítja ki, hogy az adott margiális eloszlások mellett mekkora az adott, illetve aál extrémebb táblázatok valószíűsége, ha eltételezzük a változók üggetleségét. Ha ez a valószíűség kicsi (<5%), akkor em ogadjuk el a ullhipotézist. Példa: Va 4 betegük, akik részbe pszichotikusok, részbe eurotikusok, illetve részbe érezek ögyilkossági hajlamot, részbe em. Ögyilkossági pszichotikus eurotikus Összes hajlam Ige 6 8 Nem 8 4 3 Összes 4 Egy adott táblázat valószíűségét a hipergeometrikus eloszlás adja meg: Az adott margiálisok mellett a táblázat valószíűsége: Mit jelet az, hogy extrémebb? Kiválasztjuk azt az átlót, amelybe a gyakoriságok összege agyobb, és azt még tovább öveljük (az adott iráyú összeüggés iráyába megyük tovább.) Itt úgy tűik, mitha a eurotikusok kicsit hajlamosabbak leéek az ögyilkosságra, mit a pszichotikusok. Megézzük, hogy mi a helyzet, ha még jobba eltoljuk ebbe az iráyba a táblázatot: Ögyilkossági pszichotikus eurotikus Összes hajlam Ige 7 8 Nem 9 3 3 Összes 4 Ögyilkossági pszichotikus eurotikus Összes hajlam Ige 8 8 Nem 3 Összes 4 A példabeli táblázat valószíűsége, illetve a ála extrémebbeké: Összese: Következtetés. A két tüet üggetleek tekithető.