NEMPARAMÉTERES ELJÁRÁSOK



Hasonló dokumentumok
Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Matematikai statisztika

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Változók közötti kapcsolatok vizsgálata

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

Statisztika. Eloszlásjellemzők

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

? közgazdasági statisztika

? közgazdasági statisztika

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Az állat becsült kor. teljes súly. teljes hossz orrtól. törzs hossza. pocak körkörös méret. hátsó láb hossza kör

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Matematikai statisztika

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Feladatok és megoldások a 11. heti gyakorlathoz

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

Populáció nagyságának felmérése, becslése

Statisztikai hipotézisvizsgálatok

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

Változók függőségi viszonyainak vizsgálata

Regresszió és korreláció

VII. A határozatlan esetek kiküszöbölése

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

Regresszió és korreláció

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Információs rendszerek elméleti alapjai. Információelmélet

A Sturm-módszer és alkalmazása

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

A Secretary problem. Optimális választás megtalálása.

Megjegyzés: Amint már előbb is említettük, a komplex számok

Hipotézis vizsgálatok

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

Járattípusok. Kapcsolatok szerint: Sugaras, ingajárat: Vonaljárat: Körjárat:

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

A MATEMATIKAI STATISZTIKA ELEMEI

Bevezetés. 1 A pénz időértékének elve. Befektetés pénzáram grafikonja ábra - Befektetés pénzáram grafikonja

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

Tuzson Zoltán A Sturm-módszer és alkalmazása

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Wilcoxon-féle előjel-próba. A rangok. Ismert eloszlás. A nullhipotézis megfogalmazása H 1 : m 0 0. A medián 0! Az eltérés csak véletlen!

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Képletgyűjtemény a Gazdaságstatisztika tárgy A matematikai statisztika alapjai című részhez

A heteroszkedaszticitásról egyszerûbben

Függvénygörbe alatti terület a határozott integrál

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

3. Sztereó kamera. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

Backtrack módszer (1.49)

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

kritikus érték(ek) (critical value).

Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

SPORTPÉNZÜGYEK. r m. A pénz időértéke.

ICH Harmonised Tripartite Guideline. Stability Testing of New Drug Substances and Products (Q1A(R2)), 2003

Megoldás a, A sebességből és a hullámhosszból számított periódusidőket T a táblázat

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

BIOMATEMATIKA ELŐADÁS

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Boros Daniella Nappali tagozat Kereskedelem és marketing 2. évfolyam Gödöllő Neptun kód: OIPGB9

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel-

3 1, ( ) sorozat általános tagjának képletét, ha

i 0 egyébként ábra. Negyedfokú és ötödfokú Bernstein polinomok a [0,1] intervallumon.

18. Differenciálszámítás

PROJEKTÉRTÉKELÉSI ALAPOK

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

I. Valószínűségelméleti és matematikai statisztikai alapok

Valószínűségszámítás összefoglaló

Korreláció- és regressziószámítás

1. Gyökvonás komplex számból

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

LOGISZTIKAI ÉS SZÁLLÍTMÁNYOZÁSI TANSZÉK

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Átírás:

Kály Zoltá: Statsztka II. NEMPARAMÉTERES ELJÁRÁSOK Az eddgek soá találkoztuk má olya eláásokkal, melyek a változók középétékét vzsgálták: egymtás-, páos-, függetle mtás t-póba, egy- és többszempotos vaaca aalízs. Ezek ól haszálható eláások, de alkalmazásukak vaak feltétele, melyek em mdg telesülek, pl. a omaltás, és szóáshomogetás feltételek. Ezek paamétees eláások voltak abba az ételembe, hogy feltételeztük egy eloszlást és a vzsgálódás az eloszlás kokét paaméteée ( átlag, szóás ) voatkozott. A empaamétees eláások em kíváak külöösebb feltételt a változók eloszlásáól, sőt még az tevallum-skála sem követelméy. Az azoba ó, ha a változó folytoos vagy legalább elég fom beosztású. Ugyas a medá tt fotos szeepet átszk és ekko va gaz eletése. A empaamétees eláások em a téyleges étékekkel dolgozak, haem az étékek soedével, amt az u. agokkal agadak meg. Egy éték aga azt elet, hogy ő agyság szet háyadk a mtába. Nézzük ee egy példát, ahol egy változó mellett a agok oszlopa látható....a RANG_A 5. 4.5.. 4. 3..... 4. 3. 8. 6. 5. 4.5 9. 7. 5. 4.5.. 8. 6. 5. 4.5 9. 7. A obboldal két oszlopba ugyaaz va, csak az A változó étéke soba vaak akva és a agak s mellettük. A hét szám közül az aga, met ô a legksebb, a 9 aga 7, met ô a legagyobb. Az 5 kétsze fodul elô, a 4. és az 5. helye, ezét aga ezek átlaga, azaz (4+5)/4.5. Ezek utá ézzük az egyes eláásokat. A obb áttekthetőség kedvéét állítsuk őket páhuzamba a paamétees eláásokkal: paamétees eláások empaamétees eláások egy mta egymtás t-póba CI-NÉGYZET-póba BINOMIÁLIS KOLMOGOROV-SMIRNOV (KS) WALD-WOLFOWITZ (W-W) két függetle mta függetle mtás (kétmtás) t-póba MANN-WITNEY, KOLMOGOROV-SMIRNOV (K-S) WALD-WOLFOWITZ (W-W) két összetatozó mta páos t-póba WILCOXON több függetle mta egyszempotos KRUSKAL-WALLIS egy szempot szet vaacaaalízs több összetatozó mta egy szempot szet FRIEDMAN egyszempotos vaacaaalízs, smételt méés

Nempaamétees eláások/. (empaamétees póbák) NEMPARAMÉTERES PRÓBÁK A empaamétees eláások közül eddg a Speama-féle agkoelácót (Speama s ho) vzsgáltuk. Ez a módsze gazából folytoos vagy közel folytoos esetbe működk ól, főkét akko, ha az eloszlások alaka s hasoló. Az gaz empaamétees póbák páhuzamba állíthatók a paamétees eláásokkal t-póbákkal és vaaca aalízssel. Fomálsa az egymtás eset módszee s, de eze belül az egyes eláások sokfélék:. Ch-squae (Kh - égyzet póba) omáls, odáls. Bomal (Bomáls póba) dchotóm (omáls) 3. Rus (Wald- Wolfowtz)(széák vzsgálata) dchotóm (omáls) 4. Kolmogoov-Szmov póba tevallum. Ch-squae (Kh-égyzet) póba : Adott egy N elemű mta, k-daab lehetséges étékkel. Az étékek gyakosága:,,, k. Azt kédezzük, hhető-e, hogy a populácó szté ezek a gyakoságok p,p, p k.? A póba-statsztka: k ( N* p ) N* p χ k 3 A póba működését má láttuk koábba, most a omaltásvzsgálata alkalmas változatával smekedük meg: - a hpotetkus eloszlásfüggvéyt k-daab tevalluma osztuk fel - kszámítuk a χ -étékét, - mad dfk-3 szabadság fok mellett elleőzzük az lleszkedést A k-daab tevallum hatáat általába számítógépes algotmussal hatáozzák meg, és elleőzk az lleszkedést. A kategóák optmáls száma: 5 k N Itt: N6 k6 Futtatás R-be a otest-csomagból: lbay(otest) IQ<-c(87,,97,96,7,73,97,8,99,97,96,83,5,88,95,7,9) peaso.test(iq,6, adust TRUE) Eedméy: Peaso ch-squae omalty test data: IQ P 5.353, p-value.554 Vagy:

Kály Zoltá: Statsztka II. peaso.test(iq,*(legth(iq))^(/5), adust TRUE) Eedméy: P 5.635, p-value.58 Automatkus llesztéssel: peaso.test(iq, adust TRUE) Eedméy: P 3.588, p-value.99. BINOMIÁLIS póba Közvetleül a bomáls eloszlást haszála póbastatsztkakét: B(, p)! k!( k)! k k p ( p ) a elég agy (>9/*p*(-p)), a bomáls helyett omáls eloszlású közelítést alkalmazak: µ Np Npq Z R µ σ σ Tegyük fel, va egy populácó, ahol a euotkusok aáya égóta 5 %. A a ma ohaó vlágba felmeül a gyaú, hogy ez az aáy bzoyáa övekedett. Eek vzsgálatáa veszük egy mtát, ahol -gyel kódoluk a euotkusokat, -vel pedg az egészségeseket. Adatok:,,,,,,,,,,,,,,,,,,,,,,,,,,,,, : A populácóba a euotkusok aáya 5% : A populácóba a euotkusok aáya több, mt 5% A póbastatsztka étéke: a mtába levő euotkusok száma. A póba statsztka eseté bomáls eloszlást követ (3, p.5) paaméteekkel. Sztaktkáa R-be: bom.test(x,, p.5, alteatve c("two.sded", "less", "geate"), cof.level.95) R-paacssoból: bom.test(xtabs(~va),a't',p.5) R-commadeből: Statstcs/Popotos/Sgle-sample-popoto (OptoExact bomal) x<-c(,,,,,,,,,,,,,,,,,,,,,,,,,,,,,) x-x # Átkódolás: egészséges, euotkus x 3

Nempaamétees eláások/. (empaamétees póbák) bom.test(sum(x),legth(x),p.5,a g ) Eedméy: [] Exact bomal test data: sum(x) ad legth(x) umbe of successes 3, umbe of tals 3, p-value.59 alteatve hypothess: tue pobablty of success s geate tha.5 95 pecet cofdece teval:.786696. sample estmates: pobablty of success.4333333 A szet gyakoságak.5-ek kellee lee, ezzel szembe látható, hogy a tapasztalat gyakoságuk vszot: 3/3.433. Az egyoldal szgfkaca szt: p,59, tehát elvetük -t. Megvzsgáluk, hogy egy skola osztályba az IQ-háyados medáa lehet-e? valtozo<-c(87,,97,96,7,73,97,8,99,97,96,83,5,88,95,7,9) pc <- ecode(valtozo, ":''; else''") pc bom.test(sum(pc),legth(pc),p.5) A futtatás eedméye: Exact bomal test data: sum(pc) ad legth(pc) umbe of successes 5, umbe of tals 7, p-value.435 alteatve hypothess: tue pobablty of success s ot equal to.5 95 pecet cofdece teval:.3355.559587 sample estmates: pobablty of success.9476 3. WALD-WOLFOWITZ féle egymtás széa-póba (W-W) A Wald-Wolfowtz-féle széa tesztet lehet egy-, lletve kétmtás változatba haszál. Alapelv: ha a dchotóm változó étéke véletleszeűe váltakozak, az étékek véletleszeű, azoos étékekből álló soozatokba (széákba) edeződek. A póbastatsztka étéke a széák száma: R (Rus). Az eláás a dchotóm változó két étékée ézve szmmetkus, és egy stadadzált póbastatsztkához vezet, ahol: p poztív széák elemszáma q egatív széák elemszáma Elemszám: N p + q 4

Kály Zoltá: Statsztka II. pq R Rus µ + + p q σ ( p p ( + q q p q p ) ( + p q q ) ) ( µ ) ( µ ) Vagy egyszeűbbe: σ Így: N Z R µ σ Ks elemszám (N<5) eseté koekcó: Z c ( R ( R µ µ +,5) / σ,5) / σ ha : R µ ha : R µ ha : R µ,5,5 <,5 Bá az egymtás W-W póba egy dchotóm változó étékeek véletleszeűségét vzsgála, agyo ól alkalmazható folytoos változók vzsgálatáa s, am azt elet, hogy a folytoos változó étéktatomáyát kettéváguk egy osztópot segítségével. Ez az osztópot lehet a medá, az átlag, vagy bámlye, előe meghatáozott éték. Eek következtébe a vzsgálat má aa voatkozk, hogy a mtaelemek osztópot alá-, lletve föléesése véletleszeűe váltakozk-e. Megegyzés: Az W-W póba az R-be még cs mplemetálva. 4. Egymtás KOLMOGOROV-SMIRNOV (K-S) póba A Kolmogoov-Smov-póba mdg két eloszlás külöbségét (eloszlásbel távolságát) vzsgála. Alapelve az, hogy ha két változó eloszlása hasoló (azoos eloszlásból számazak), akko em lehetek agy külöbségek az eloszlások között. Éppe ezét a póba a két eloszlás között abszolút távolság méése alapul, md az egymtás- md, pedg a függetlemtás változatba. A távolság méése mde előfoduló X -étéke megtöték. Az egymtás K-S póba alapát a mtából számolt tapasztalat (F tap ) és az előe megadott, elmélet (F ) eloszlás között legagyobb távolság ada, eze kívül tatalmaz egy elemszámkoekcót s. Az F eloszlás tetszőleges eloszlástípus s lehet, de leggyakabba omáls, egyeletes és Posso eloszlás llesztésée haszálatos. : A két eloszlás (alaka) azoos : A két eloszlás külöbözk : F : F tap tap F F Nelemszám Z N max F tap F ( x) ( x) Paamétees eláásokál alapvető, hogy a célváltozó omáls eloszlású legye, mvel a kszámolt szgfkacaszt s ee az alapfeltétele voatkozk. a em omáls eloszlású a célváltozó, akko az elsőfaú hba dasztkusa megövekedhet. Így az egymtás K-S póbát 5

Nempaamétees eláások/. (empaamétees póbák) a pszchológába főkét omaltásvzsgálata haszáluk, ahol az előe megadott F az N(μ,σ) eloszlást elet, amt a tapasztalat mtából számoluk. a em mtából számítuk, haem előe megadott függvéyétékkel (elmélet μ és σ) dolgozuk, akko a K-S póba sztaktkáa a következő: ks.test(x, pom,vahatoetek,szoas) Az IQ-változó omaltásvzsgálata az R-be, amko mtából számoltatuk a μ, és σ étékeket: IQ <- valtozo vagy: IQ<-c(87,,97,96,7,73,97,8,99,97,96,83,5,88,95,7,9) mea(iq) sd(iq) ks.test(iq,pom,mea(iq),sd(iq)) Eedméy: > mea(iq) [] 98.353 > sd(iq) [] 6.6757 > ks.test(iq,pom,mea(iq),sd(iq)) Wag ks.test(iq, pom, mea(iq), sd(iq)) : caot compute coect p-values wth tes Oe-sample Kolmogoov-Smov test data: IQ D.988, p-value.5 alteatve hypothess: two.sded Tehát a mták omáls eloszlásúak vehető (p,5). Azt s tesztelhetük, hogy a mták eloszlása számazhat-e a N(,5) elmélet eloszlásból. ks.test(iq,pom,,5) Eedméy: Oe-sample Kolmogoov-Smov test data: IQ D.38, p-value.9 alteatve hypothess: two.sded Tehát a mták eloszlása em té el a populácóba általáos N(,5) eloszlástól (p,46). Az egyszeű K-S omaltásvzsgálat futtatható a otest-csomagból s: lbay(otest) IQ<-c(87,,97,96,7,73,97,8,99,97,96,83,5,88,95,7,9) llle.test(iq) Az eedméy: Lllefos (Kolmogoov-Smov) omalty test 6

Kály Zoltá: Statsztka II. data: IQ D.988, p-value.764 Két függetle mta (M-W, K-S, W-W). MANN-WITNEY póba (M-W) (Kétmtás/függetlemtás Wlcoxo-póba) A Ma-Whtey-póba téylegese a két függetle mta medááak egyelőségét tesztel, ahol: X és Y a két függetle mta, melyekbe az elemszámok em feltétleül egyezek meg. A póba működése azo alapul, hogy a két függetle mta egyesítésével yet ú mtát edezve, az eedet X és Y mtáa vsszavetített agszámok átlaga hasolóak. a az egyk mta agyobb eedet mtaétékekkel szeepel, akko az egyesített agsoba s magasabba helyezkedk el (agyobb agszámokkal szeepel), ez azt elet, hogy a medáa s agyobb. : A két csopot medáa azoos : A em gaz. A két csopot medáa külöbözk. : med( X Y ) : med( X Y ) A számítás stadadzált póbastatsztkához vezet: a ksebbk agösszegű csopot elemszáma a agyobbk agösszegű csopot elemszáma Mtaelemszám: N + A póbastatsztka alapa a ksebbk agösszegű csopot agösszege: W U W ( + ) µ σ U ( + N ) Z U σ µ Kapcsolt agok eseté: δ Ut 3 Így: k 3 t t ( N + ) N N U Z k 3 t t ( N + ) 3 N N Példa: Egy skola osztályba szeeték összehasolíta a láyok és fúk tellgeca sztét (IQ-háyadosok étéket). Kédés: gaz-e, hogy a láyok okosabbak a fúkál? 7

Nempaamétees eláások/. (empaamétees póbák) Adatok: Fúk(): 87,,97,96,7,73,97,8 Láyok(): 99,97,96,83,5,88,95,7,9 Számolás kézzel: 7 73 83 87 88 95 96 96 97 97 97 99 7 5 8 9 Σ Redez: 3 4 5 6 7 8 9 3 4 5 6 7 Rag 3 4 5 6 7,5 7,5 3 4 5 6 7 Csop W 4 7,5 3 6 63,5 W 3 5 6 7,5 4 5 7 89,5 N 7, 8, 9 Ragátlag()63,5/87,93 Ragátlag()89,5/99,94 úgy tűk, mtha a láyok étéke agyobbak leéek. U ( + ) 8 9 W 63,5 36 7,5 Kapcsolt agok élkül: U 7,5 36 8,5 8,5 Z,879 p ( N + ) 8 9 8 96 8,43 Kapcsolt agokkal pedg (kapcsolt agok:*96 és 3*97): U 7,5 36 8,5 Z k 3 8 9 8 (8 ) + (7 3) 96 3 t t ( ) 7 (7 ) 7 88 N + 3 N N 8,5 8,5 8,5 8,5 Z,846 p,4 3 8 (,6) 8,9938,36 8 4896 Mvel kevés volt a kapcsolt ag, a Z-statsztkák em külöbözek makása. A Ma-Whtey-póba futtatása R-be (~függetlemtás Wlcoxo-teszt, folytoosság koekcó élkül): IQ<-c(87,,97,96,7,73,97,8,99,97,96,83,5,88,95,7,9) NEM<-c(,,,,,,,,,,,,,,,,) meda(iq[nem]) meda(iq[nem]) mea(iq[nem]) mea(iq[nem]) wlcox.test(iq~nem, coectfalse) Eedméy: 8

Kály Zoltá: Statsztka II. > meda(iq[nem]) [] 96.5 > meda(iq[nem]) [] 97 > mea(iq[nem]) [] 93.875 > mea(iq[nem]) []. Wlcoxo ak sum test data: IQ by NEM W 7.5, p-value.4 alteatve hypothess: tue mu s ot equal to Wag message: caot compute exact p-value wth tes : wlcox.test.default(x c(87,, 97, 96, 7, 73, 97, 8), A Ma-Whtey-teszt eedméye azt elz, hogy a két csopot agszáma közel esek egymáshoz (p,4). A ők és féfak IQ-étéke em külöbözek léyegese.. Kétmtás KOLMOGOROV-SMIRNOV póba (K-S) A kétmtás K-S a két függetle mta tapasztalat eloszlását vet össze, vzsgálva, hogy elmélet eloszlásuk azoos-e. a a két mta hasoló, akko em lehet agy külöbség a két eloszlás között. A K-S elsősoba az eloszlások alakáa, másodsoba az elhelyezkedésée ézékey. A számítás tt s a külöbségek abszolút étékée voatkozk az eloszlások mde X -étékél, csak az egymtás K-S-hoz képest boyolultabb elemszám-koekcót alkalmaz. : A két eloszlás azoos : A két eloszlás külöbözk : F : F tap tap G G tap tap egyk (F) mta elemszáma mmásk (G) mta elemszáma D m max F tap ( x) G + m tap( x) A kétmtás Kolmogoov-Smov póba futtatása R-be: meda(iq[nem]) meda(iq[nem]) mea(iq[nem]) mea(iq[nem]) ks.test(iq[nem],iq[nem]) Eedméy: > meda(iq[nem]) [] 96.5 > meda(iq[nem]) [] 97 9

Nempaamétees eláások/. (empaamétees póbák) > mea(iq[nem]) [] 93.875 > mea(iq[nem]) []. Wag ks.test(iq[nem ], IQ[NEM ]) : caot compute coect p-values wth tes Two-sample Kolmogoov-Smov test data: IQ[NEM ] ad IQ[NEM ] D.639, p-value.996 alteatve hypothess: two.sded Az eedméy azt mutata, hogy a két csopot IQ-szet eloszlása léyegébe azoos, (p.996). 3. Kétmtás Wald-Wolfowtz-féle széa-póba (W-W) Két eloszlás eltéését úgy vzsgála, hogy: - A két mtát egyesít - Redez - A edezett összevot mtába vsszadexel, hogy melyk elem melyk eedet mtából számazott. A edezett mtába ezek az dexek egy dchotóm, -eseté véletleszeű változót alkotak. : A két eloszlás azoos : A két eloszlás külöbözk : F : F tap tap G G tap tap Alapelv: ha a dchotóm változó étéke véletleszeűe váltakozak, az azoos étékek véletleszeű soozatokba (széákba) edeződek. (Lehet egy-, lletve kétmtás változatba haszál.) A póbastatsztka étéke a széák száma: R (Rus) lesz. Az eláás a dchotóm változó két étékée ézve szmmetkus, és egy stadadzált póbastatsztkához vezet (lásd: W-W póbáál). Megegyzés: A W-W póba az R-be még cs mplemetálva. Két összetatozó mta vzsgálata WILCOXON-féle előeles agösszeg póba ( páos Wlcoxo-póba) A Wlcoxo póba agokkal dolgozk, tehát hpotézse a mták medááa voatkozk, ullhpotézse, hogy a páosított mta (X és Y) mdkét medáa azoos, vagys a külöbségük medáa ulla. potézse: : med( X Y ) : med( X Y )

Kály Zoltá: Statsztka II. : a két összetatozó mta külöbségéek medáa ulla : a két összetatozó mta külöbségéek medáa em ulla a a két összetatozó mta külöbségéek medáa ulla, ez azt s elet hogy a két összetatozó mta ugyaabból az eloszlásból számazk, vagys léyegese em külöbözek. Vesszük a páosított mta külöbségét: δ X Y Ragszámkovezót végzük a külöbség abszolút étékée: Rag( δ ) Rag( δ ) A póbastatsztka étéke a poztv külöbségekhez tatozó agok összege: V Rag( + δ ) A póbastatsztka tatalmazza a koekcót s, a kapcsolt agok esetée (ahol: k-daab külöböző kapcsolt ag eseté, t a -edk kapcsolt csopot méete): Nelemszám N ( N + ) V Z 4 k 3 N( N + )( N + ) t t 4 48 Változott-e a gyeekek vzuáls képessége (látásélesség) a eggel- és a dél méés között? N5 eggel délbe δ δ -Rag( δ ) +Rag( δ ) 4-3 3 3 3,5 3 4 4 5 4 4 6 6 4 5 3 4 -,5 Σ V,5 A póbastatsztka Z-étéke pedg (k, és t eseté): Z Z p 5 6,5 4 5 6 8 4 48,83,46,5 55 4 7,5 6 48 3 3,75,5 3 3,69 A szgfkaca szt azt elz, hogy -t édemes megtata, vagys a gyeekek vzuáls képessége eggeltől délg em változk számottevőe.

Nempaamétees eláások/. (empaamétees póbák) A Wlcoxo-póba (páos Wlcoxo-póba) futtatása R-be: latasd<-data.fame(eggelc(,3,4,,3),delc(4,,4,4,4)) latasd attach(latasd) meda(latasd$eggel - latasd$del) wlcox.test(eggel, del, paedtrue) osszabb paaméteezéssel: wlcox.test(eggel, del,coectfalse, alteatve'two.sded', coectfalse, exactfalse, paedtrue) Eedméy: Wlcoxo sged ak test wth cotuty coecto data: eggel ad del V.5, p-value.464 alteatve hypothess: tue mu s ot equal to a a két átlag-ag közel esk egymáshoz, tehát a két agso átfed egymást, akko a felé halk a dötés. Itt a szgfkaca szt.464, így a - mellett maaduk. Több függetle mta KRUSKAL-WALLIS póba (K-W) Az eláás léyegébe a Ma-Whtey póba általáosítása és kteesztése háom vagy több függetle mtáa. Az egyszempotos ANOVA empaamétees megfelelőe, akko helyettesítük vele az ANOVA-t ha a csopotokét szóások agyo külöbözek, az eloszlások alaka elté, lletve, ha eőse séül a csopotokét, omaltása voatkozó feltétel. A számítás logkáa s aalóg a Ma-Whtey póbáéval, a mtákat egyesít, kszámíta agokat, mad a agszámokat csopotokét átlagola. Ez a csopotokét agátlag valóába a változó agyságedéől táékoztat beüket, ugyas csak akko agy egy csopot agátlaga, ha a változó adott csopotbel eedet étéke s agyobbak a többél, vagys az egyesített agsoba a többek fölött helyezkedtek el. : A csopotok medáa egyelőek : A csopotok között legalább két csopot medáa külöbözk Potosabb megfogalmazásba: Feltétel: X,X,.X k folytoos függetle mták (csopotok). :, : med( X ) med( X ) :, : med( X ) med( X ( ahol :, {... k}, és : ) ) A számítás meete: - A függetle mtákat egyesítük, így keletkezk az egyesített, közös mta, mad

Kály Zoltá: Statsztka II. - az egyesített közös mtát soba edezzük, - a mtaelemekhez agszámokat edelük, mad - csopotokét (azaz oszlopokét) összeaduk (T ), és átlagoluk az egyes mták agat k T 3( + ) N χ k ( ) N N + Kapcsolt agok eseté koekcós fomulát kell alkalmaz: G 3 Ahol: ( t t ) G: az összes külöböző kapcsolt agok száma C 3 N N t : az -edk kapcsolt agú csopot méete Koekcós fomulával: ' C áom kstéség (CS, CS, CS 3 ) skolába méték a dákok poltkusokkal tötéő elégedettségét. Gyeekek: CS CS CS 3 3 7 5 3 6 5 4 7 6 5 8 9 N5 5 6 3 4 edezés és agszámkovezó a teles mtáa 3 3,5 9,5 6,5 3 3,5 8 4 5 9,5 5 6,5 T 8 T 5,5 T 3 5,5 8 5 6 5 34 + 4 5,5 9,645 5,5 + 6 55,5 6 5,5 + 3 6 4 65,5 + 48 4 48 ( 64,8 + 45,4 + 663,6),5 5,9 48 57,64 48 Mvel : 9,645 χ (, α,5) (A táblázat éték: 5,99) a ullhpotézst elutasítuk. Tehát az skolákba külöbözk a poltkusok megítélése. Futtatás R-be: eleg<-c(,,3,4,5,3,5,6,7,8,9,7,,5,6) csop<-c(,,,,,,,,,,,3,3,3,3) kuskal.test(eleg,csop) Illetve: 3

Nempaamétees eláások/. (empaamétees póbák) poltkus<data.fame(elegc(,,3,4,5,3,5,6,7,8,9,7,,5,6),csopc(,,,,,,,,,,,3,3,3,3)) attach(poltkus) kuskal.test(eleg~csop) Eedméy: Kuskal-Walls ak sum test data: eleg by csop Kuskal-Walls ch-squaed 9.697, df, p-value.784 A medáok katása a csopotváltozó külöböző étékeél (pl. emekét, csopotokét): meda(eleg[csop]) meda(eleg[csop]) meda(eleg[csop3]) Eedméy: > meda(eleg[csop]) [] 3 > meda(eleg[csop]) [] 6.5 > meda(eleg[csop3]) [] 3 A medáok megeleítése boxplot dagammal: boxplot(eleg~csop, ylab"eleg", xlab"csop",datapoltkus) eleg 5 5 3 csop A páokét vzsgálatot célszeű a főeláással (Kuskal-Walls póbával) aalóg Ma- Whtey teszttel végez. Az elsőfaú hba övekedése matt, temészetese szgoított szgfkaca-sztet aálott alkalmaz. A páokét vzsgálat futtatása R-be: wlcox.test(eleg[csop],eleg[csop]) wlcox.test(eleg[csop],eleg[csop3]) 4

Kály Zoltá: Statsztka II. wlcox.test(eleg[csop],eleg[csop3]) Eedméy: Wlcoxo ak sum test wth cotuty coecto data: eleg[csop ] ad eleg[csop ] W 3, p-value.3493 alteatve hypothess: tue mu s ot equal to Wlcoxo ak sum test data: eleg[csop ] ad eleg[csop 3] W, p-value.587 alteatve hypothess: tue mu s ot equal to Wlcoxo ak sum test wth cotuty coecto data: eleg[csop ] ad eleg[csop 3] W.5, p-value.547 alteatve hypothess: tue mu s ot equal to Több összetatozó mta Fedma-póba Több folytoos-, összetatozó mta medááak egyelőségét vzsgála. Egy személytől több (k-daab összetatozó) adatuk va. Nullhpotézse az, hogy az összetatozó mták ugyaabból az eloszlásból számazak (medáuk azoos), ellehpotézs pedg az, hogy az összetatozó mták között va legalább kettő, amelyek medáa külöbözk. Feltétel: X,X,.X k folytoos összetatozó mták. :, : med( X :, : med( X ) ) med( X ( ahol :, {... k}, és : med( X A számítás meete: - a mtát sookét (személyekét) edezzük X ) ) ) - oszlopokét (változókét) összegezzük a agszámokat : R N A póbastatsztkáa pedg: k G R 3 ( + ) ( ) N k χ N k k + k Kapcsolt agok eseté koekcó (ahol t az -edk személyél levő kapcsolt agok száma): 5

Nempaamétees eláások/. (empaamétees póbák) G' G t ( k ) N k Példa: Vzsgálták a gyeekek vzuáls képességét (látásélesség) Reggel, Délbe és Este: Gyeek: Reggel Délbe Este 3 4 5 sookét 3 3 4 edezés és 3 3 4 4 7 agszámkovezó 3 3 4 4 9 5 3 4 5 3 N5 R R 7 R 3 3 G G ( + 7 + 3 ) 3 5 4 5 3 4 + 49 + 69 6 5 38 5 ( ) 6 63,6 6 3, 6 G (Mvel a táblázat éték: 5,99) 3,6 χ (,( α,5)) A futtatás R-be: latas<-matx(c(,3,4,,3,4,,4,4,4,5,4,7,9,5),col3) fedma.test(latas) Eedméy: Fedma ak sum test data: latas Fedma ch-squaed 3.6, df, p-value.653 Az R-be való futtatáshoz léyeges tudvaló, hogy a fedma.test() függvéy csak a mátx adattípust sme. Ezét az adatbázsuk data.fame(dat) adattípusából egy olya mátx-típusú tömböt (pl. latas, vagy latas3) kell készíte, amely csak az általuk vzsgál kívát, összetatozó változókat tatalmazza. Eze kívül, a paacssoba elez kell még a mátx oszlopaak számát s. latas<data.fame(eggelc(,3,4,,3),delc(4,,4,4,4),estec(5,4,7,9,5)) latas attach(latas) meda(eggel) meda(del) meda(este) latas<-as.matx(latas) fedma.test(latas) Illetve, ha má meglévő adatbázsból állítuk össze a mátxot: latas3matx(c(latas[,'eggel'],latas[,'del'],latas[,'este']),col3) fedma.test(latas3) 6

Kály Zoltá: Statsztka II. Az eedméy mdháom esetbe azoos: meda(eggel) [] 3 meda(del) [] 4 meda(este) [] 5 Fedma ak sum test data: latas Fedma ch-squaed 3.6, df, p-value.653 A páokét vzsgálatot a főeláással (Fedma-póba) aalóg, páokét összehasolítással tuduk megvalósíta ( páos wlcoxo-póba), temészetese a szgfkacasztet s szgoítauk kell. wlcox.test(eggel,del,alteatve'two.sded', coectfalse, exactfalse, paedtrue) wlcox.test(eggel,este,alteatve'two.sded', coectfalse, exactfalse, paedtrue) wlcox.test(del,este,alteatve'two.sded', coectfalse, exactfalse, paedtrue) Eedméy: Wlcoxo sged ak test data: eggel ad del V.5, p-value.464 alteatve hypothess: tue mu s ot equal to Wlcoxo sged ak test data: eggel ad este V 6.5, p-value.7865 alteatve hypothess: tue mu s ot equal to Wlcoxo sged ak test data: del ad este V, p-value.47 alteatve hypothess: tue mu s ot equal to A medáok helyzete a boxplot dagammal a következőképp fest: boxplot(eggel,del,este,ylab"latas", xlab"apszak", datalatas) 7

Nempaamétees eláások/. (empaamétees póbák) latas 4 6 8 4 apszak Összefoglalva azt modhatuk, hogy a ap folyamá a látásélesség em változk számottevőe. A tedeca azt mutata, hogy apközbe folyamatosa avul, és este a legobb, de az eltéés em szgfkás. ***************************************************************************** 8

Kály Zoltá: Statsztka II. ***************************************************************************** KIEGÉSZÍTÉS: A stadadzált póbastatsztkák alapelve: A kszámított póbastatsztkák étéke általába több téyező (pl. elemszámokak, egy-egy éték elatív gyakoságáak stb.) együttes függvéye. Bzoyos eláásokál megadható egy-egy specáls taszfomácó (Z-taszfomácó), amvel (a gaz volta eseté) stadad omáls N(,) eloszlású változókét (váható étéke, és szóása ) kezelhető a léteött póbastatsztka. Ilye eláások tpkus esete a Ma-Whtey, lletve a Wald-Wolfowtz póba, de megadható egy-egy taszfomácós fomula pl. a Bomáls és a χ -póba esetée s. Ezeket a taszfomácókat evezzük omál-közelítések (Nomal Appoxmato), amk -eseté és főkét agy elemszámál közelítk ól a stadad omál eloszlást. A omál közelítése egyébkét s csak agy elemszámokál va gazá szükség. Bomáls-póba eseté, ha (>9/*p*(-p)), akko: µ Np Npq R µ Z σ A χ -póba eseté (>3): µ N σ N Z σ R µ σ Más statsztkákál, pl. Cohe-kappa eseté boyolultabb a taszfomácós fomula: κ O N E E [ N O + O+ + ( O + O+ ) N O + O+ ( O + + O+ )] σ ( κ ) N( N O O ) + + Mvel μ (κ), ezét: Z κ σ (κ ) Stadad Nomál eloszlás: µ, σ Sűűség....3.4-3 - - 3 Z A omál közelítés soá gyekszük N(,) eloszlású változókét ételmez a kszámított póbastatsztkát, ezét a ullhpotézst (α,5) kétoldal ellehpotézs mellett, akko utasítuk el, ha 9

Nempaamétees eláások/. (empaamétees póbák) a taszfomált Z póbastatsztka abszolút étéke meghalada a -t (potosabba: Z szélsőségesebb, mt ±,96).