Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Hasonló dokumentumok
? közgazdasági statisztika

? közgazdasági statisztika

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Matematikai statisztika

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Statisztika. Eloszlásjellemzők

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

Regresszió és korreláció

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

BIOMATEMATIKA ELŐADÁS

Változók függőségi viszonyainak vizsgálata

Feladatok és megoldások a 11. heti gyakorlathoz

Regresszió és korreláció

Statisztika 1. zárthelyi dolgozat március 21.

STATISZTIKA II. kötet

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

A MATEMATIKAI STATISZTIKA ELEMEI

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

A heteroszkedaszticitásról egyszerûbben

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

1. A radioaktivitás statisztikus jellege

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Valószínűségszámítás. Ketskeméty László

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Korreláció- és regressziószámítás

VII. A határozatlan esetek kiküszöbölése

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

A matematikai statisztika elemei

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Matematika B4 I. gyakorlat

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

A Secretary problem. Optimális választás megtalálása.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Függvénygörbe alatti terület a határozott integrál

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Matematikai statisztika

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

Regresszió. Fő cél: jóslás Történhet:

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Ökonometria. /Elméleti jegyzet/

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

VASBETON ÉPÜLETEK MEREVÍTÉSE

2. METROLÓGIA ÉS HIBASZÁMíTÁS

Statisztikai hipotézisvizsgálatok

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Statisztika II. előadás és gyakorlat 2. rész

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

A figurális számokról (IV.)

Statisztika 1. zárthelyi dolgozat március 18.

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

Intelligens adatelemzés ea. vázlat 1. rész

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Kutatói pályára felkészítı modul

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

i 0 egyébként ábra. Negyedfokú és ötödfokú Bernstein polinomok a [0,1] intervallumon.

Matematika I. 9. előadás

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Valószínőségszámítás helye a tudományok között. Véletlen tömegjelenségek. Történeti áttekintés 1. Modellezés. Történeti áttekintés 3.

V. GYAKORLATOK ÉS FELADATOK ALGEBRÁBÓL

Ingatlanfinanszírozás és befektetés

Backtrack módszer (1.49)

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Laboratóriumi mérések

Valószínűségszámítás és matematikai statisztika. Ketskeméty László

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

Nevezetes sorozat-határértékek

V. Deriválható függvények

A felhasznált térfogalmak: lineáris tér (vektortér), normált tér, Banach tér, euklideszi-tér, Hilbert tér. legjobban közelítõ elem, azaz v u

7. MÉRÉSEK KIÉRTÉKELÉSE FÜGGVÉNYILLESZTÉSSEL

Átírás:

BIOSTATISZTIKAI ALAPISMERETEK Izsák Jáos ELTE TTK Állatredszerta és Ökológa Taszék Kézrat Budapest, 5

Tartalomjegyzék Előszó 4. Valószíűség vektorváltozók 6.. Bevezetés 6.. A többváltozós, specálsa kétváltozós eloszlásokkal kapcsolatos éháy fogalom 9.3. Nevezetes többváltozós vagy többdmezós eloszlások.3.. Polomáls vagy multomáls eloszlás.3.. Többváltozós vagy többdmezós hpergeometrkus eloszlás.3.3. Többváltozós vagy többdmezós ormáls eloszlás 3.4. Valószíűség vektorváltozó kompoese között sztochasztkus kapcsolat 4.4.. A kovaraca és a leárs korrelácós együttható 5.4.. Ragkorrelácós együtthatók 7.5. A regresszós egyees 9.5.. Regresszóaalízs. Becsléselmélet 5 Bevezetés 5.. Potbecslések 5... Potbecslés a várható értékre és a szóráségyzetre 5... Potbecslés a regresszós egyees paraméterere 9..3. Potbecsések a korrelácós együtthatókra 37..3.. A leárs korrelácós együttható potbecslése 37..3.. A Spearma-féle ragkorrelácós együttható potbecslése 4..3.3. A Kedall-féle korrelácós együttható potbecslése ( em-kapcsolt ragok esetére) 4.. Itervallumbecslés, kofdeca tervallum 44... Ismeretle szórású ormáls eloszlású valószíűség változó várható értékére voatkozó kofdeca tervallum 44... Kofdeca tervallum adott eseméy előfordulásáak P valószíűségére 49 3. Hpotézsvzsgálat 5 Bevezetés 5 3.. Paraméteres statsztka próbák 59 3... Egymtás t-próba 59 3... Kétmtás t-próba 63

3..3. Welch-próba vagy d-próba 67 3..4. F-próba 69 3..5. Bartlett-próba 73 3..6. Szórásvzsgálat (varacaaalízs, ANOVA: aalyss of varace) 75 3..6.. Egyszempotú szórásvzsgálat 76 3..6.a. Leárs regresszó létezéséek elleőrzése egyszempotú szórásvzsgálattal 8 3..6.. Kétszempotú szórásvzsgálat 85 3..6.3. Kovaraca aalízs 89 3.. Nemparaméteres statsztka próbák 9 3... Khí-égyzet próbá alapuló hpotézsvzsgálatok 9 3... Illeszkedésvzsgálat 94 3... Normaltásvzsgálat 98 3...3. Függetleségvzsgálat 3...4. Homogetásvzsgálat 9 Valószíűség változók eloszlására, lletve paraméterere voatkozó tovább statsztka próbák 3.3.. Kolmogorov-próba folytoos eloszlásfüggvéy és smert eloszlásfüggvéy azoosságáak elleőrzésére 3.3.. Ma Whtey-féle U próba, másképpe Wlcoxo-féle ragszámösszeg próba 4 3.3.3. Kruskal Walls próba 7 A korrelácóra voatkozó tovább próbák 3.3.4. Az r leárs korrelácós együttható voltára voatkozó próba 3.3.5. A Fsher-traszformácó alapuló módszer két leárs korrelácós együttható azoosságáak elleőrzésére 3.3.6. A Spearma-féle ragkorrelácós együttható voltára voatkozó próba 4 3.3.7. A Kedall-féle ragkorrelácós együttható voltára voatkozó próba 5 Táblázatok 7 Tárgymutató 36 Irodalom 39 3

Előszó A valószíűségszámítás és a matematka statsztka sajátos és eheze körülhatárolható vszoyba áll egymással. Az kétségtele, hogy a statsztka kérdésfelvetése és problémaköre agyrészt valószíűségszámítás alkalmazás problémákra vezethetők vssza. A matematka statsztka bológa alkalmazása, a bostatsztka, bometra pedg a statsztkáak ömagába s hatalmas és szövevéyes területe. A bometra ayagáak oktatása a magyarország bológusképzés keretébe kötelező tatárgykét mtegy 5 éves múltra tekt vssza. Egy azóta s háyzó egyetem bostatsztka, bometra jegyzet rát a mosta hallgatóság s érdeklődk. 4

Jele oktatás segédayag vagy deglees jegyzet az ELTE Természettudomáy Karáak évek óta tartott Bostatsztka specálkollégumáak csekély mértékbe bővített taayagát tartalmazza. Olvasásához szükséges a Valószíűségszámítás alapfokú stadardak evezhető ayagáak smerete. A hallgatók felkészültségét tektve azoba taácsosak látszott rövde smertet a valószíűség vektorváltozókkal kapcsolatos elem smereteket, melyre a jegyzet első fejezetébe kerül sor. A jegyzet a vlágháló elérhető Izsák Jáos, Pfel Tamás: Bostatstcs című agol yelvű lektorált jegyzet megfelelő részéek magyar változata. A két jegyzet ábrá és statsztka táblázata közel azoosak. Az agol yelvű kétszerzős jegyzetbe, melyek teljes magyar yelvű változatát rövdese közreadjuk, az említett valószíűségszámítás alapsmeretek s fellelhetők. Az smertetedő kérdések md olyaok, melyek a bológa statsztká túlmeőe a statsztka általáos gyakorlatába s közsmertek, így smeretük részét képez az általáos természettudomáyos tellgecáak. A bostatszka, bometra specfkum kább csak a példák ayagába tükröződk. Egyébkét gyekeztem egyesúlyt tarta az elmélet rész és a példák, gyakorlat részletek között. A feladatok megoldása éha hosszabb számolást géyel. Ezek elvégzésére ajálható például az ECEL szoftver vagy a vlágháló elérhetó szabad kalkulátor-programok. Taulságos lehetett vola statsztka szoftverekről s szól, ezt azoba a jegyzet korláta em tették lehetővé. A statsztka jegyzetek általáos stílusáak megfelelőe számos esetbe statsztka eljárásokak csupá receptszerű smertetésére kerül sor. Nem közlök bő rodalomjegyzéket, vszot utalhatok a vlágháló elérhető külöféle keresőprogramok által maapság yújtott ktűő lehetőségre. Javítás javaslatokat köszöettel veszek. (A valószíűség változó rövdítése v.v.) A Szerző Budapest, 5. jauár 5

. Valószíűség vektorváltozók.. Bevezetés Legyeek adottak ugyaazo (Ω, A, P) valószíűség mező az,,, v. v.-k. Az (,,, ) v.v.-sorozatot valószíűség vektorváltozóak evezzük. (Itt tehát az,,, függvéysorozat egy redezett szám -est redel Ω-ak egyetle ω eleméhez, ld.. ábra.). ábra. Kétdmezós valószíűség vektorváltozó értelmezése 6

Példa: A véletle megfgyelések bzoyos véletle (testmagasság, testsúly) adatpárok legyeek. Feltételezük egy mögöttes Ω halmazt és az., : ω (testmagasság, testsúly) = ( ( ), ( )) : R függvéyt, ahol és v.v. -. Vsszatérve a valószíűség vektorváltozók kérdésére, ameybe adottak -,, v.v.-k, akkor bevezethetjük az az F( x, x, xr ) P( x, x,, x ) x (, ) r r ú. együttes eloszlásfüggvéy. Ha az,,, kompoesek mdegyke folytoos eloszlású, akkor létezk a megfelelő f x, x,, x ) többváltozós- vagy - többdmezós ( r sűrűségfüggvéy s. Ilye sűrűségfüggvéy grafkot láthatuk a 3. ábrá. r Példák (szádékosa émleg eltérő szövegezéssel) ) Egy humá populácóba legyeek az egymáshoz redelt (!) v.v.-k az aya testsúlya és az újszülött testsúlya. ) Háromdmezós valószíűség vektorváltozó kompoese lehetek valamely talajta vzsgálat sorá a véletleül kválasztott egységy térfogatú talajmták ph-ja, víztartalma és humusztartalma. 3) Legye valamely adott mtaterülete az elsőkét, másodkkét,, -edkkét megevezett övéyfaj egyedeek száma az (,,, v.v. Ekkor a mtára voatkozó,,, ) redezett v.v.-együttes egy -dmezós valószíűség vektorváltozó. 7

A kompoesek függetlesége eseté az együttes eloszlásfüggvéy P( x ) P( x) P( r xr ) F ( x ) F ( x) F ( x ) r r formába írható, ahol F az kompoes eloszlásfüggvéye, =,,r, továbbá folytoos,,, eseté a többdmezós sűrűségfüggvéyre feáll: f x, x,, x ) = f x ) f ( x ) f ( x ), ( r ( r ahol f az -edk kompoes sűrűségfüggvéye. Ha az egyes kompoesek dszkrét eloszlású v.v.-k, és poztív valószíűséggel az x értékeket vesz fel, az x, x,, xk értékeket, stb., akkor a, x,, xk P ( j r rm x, x,, x ) együttes valószíűségekről beszélük, ahol k, j k,, m (ld.. ábra). A kompoes v.v.-k függetlesége eseté (ld. Valószíűségszámítás) k r P( x, x j,, r xrm ) P( x ) P( x j ) P( r xrm ). Kétdmezós folytoos valószíűség vektorváltozó sűrűségfüggvéyéek grafkoját mt háromdmezós felületet a 3. ábrá llusztráljuk. Itt jegyezzük meg azt, am egyébkét poztív v.v. kompoesek folytoossága eseté általáosságba s gaz, hogy az (a < b, c Y < d) eseméy valószíűsége azo térrész térfogatával egyelő, melyet felülről eze felület egy része határol; más oldalakról pedg az (x,y) síkra merőleges helyzetű síkdomok. 8

. ábra. Kétdmezós dszkrét eloszlás együttes valószíűsége... A többváltozós, specálsa kétváltozós eloszlásokkal kapcsolatos éháy fogalom Érdemes megjegyez, hogy az F ( x, Y ) eloszlásfüggvéy egyrészt -ek F x eloszlásfüggvéyével azoos, másrészt az (, Y) kétváltozós v.v. voatkozásába az kompoesre voatkozó ú. peremeloszlás. Specálsa, ha (, Y) dszkrét eloszlású és az (x, y j ) ( =,,, ; j =,,, m) értékpárok fordulak elő poztív valószíűséggel, akkor P( = x, Y < + ) = P( = x, Y = y ) + P( = x, Y = y ) + + P( = x, Y =y m ) = p + p + + + p m ( ). Eze összeg jelölése: = j p, =,,,. Hasolóa, P( < +, Y = y j ) = p j + p j + +p j p, j=,,,m. A p, p,, p, lletve a p, p,, p m sorozatok a perem valószíűség eloszlások. A peremvalószíűségekre ylvávalóa feáll: m p p j. j Kotgecatáblázat Tektsük a fet meységeket tartalmazó táblázatot (. táblázat): 9

y y y 3 y m Σ x p p p 3 p m p x p p p m p x p p p m p Σ p p 3 p p m. táblázat. Kétváltozós dszkrét eloszlás valószíűség eloszlása margáls valószíűségekkel A voatkozó megfgyelésekkel kapcsolatba készítsük egy hasoló táblázat szerkeszthető, amelybe N számú függetle megfgyelés esetszámat írjuk: f j azo esetek száma (frekvecája, f), ahol az első v.v. értéke x, a másodk értéke y j ( =,,,, j =,,, m), ld.. táblázat, a peremvalószíűségekek megfelelő peremgyakorságokkal. y y y m Σ x x x Σ f f f m f f f m f f f m f f f m f f f N

. táblázat. Kétváltozós dszkrét eloszlásra voatkozó megfgyelések kotgecatáblázata A hasoló táblázatokat evezzük (kétváltozós) kotgecatáblázatokak. Már a kotgeca táblázatból s yerhetük ém áttektést valamely kétváltozós eloszlás alapvető voásaról. Például az f j /N relatív gyakorság a p j valószíűség egy közelítése, stb. Ha az F(x,y) együttes eloszlásfüggvéy folytoos, akkor a lehetséges értékek dszkrét osztályokba sorolását (ú. dszkretzácóját) követőe s kotgeca táblázathoz jutuk (3. táblázat). Y-ra voatkozó y értékek y < y y y < y y m < y Σ -re voatkozó x értékek x < x x x < x x < x f f f m f f f f m f f.. f m f f f f m f N 3.táblázat. Kétváltozós folytoos eloszlásra voatkozó megfgyelések kotgecatáblázata dszkretzácóját követőe Tovább kotgecatáblázatokat lletőe ld. a 3... potot..3. Nevezetes többváltozós vagy többdmezós eloszlások.3.. Polomáls vagy multomáls eloszlás Paramétertartomáy: r=,,, =,,, p, =,,,r, p p. r Az,,, ) valószíűség vektorváltozó polomáls vagy multomáls eloszlású, ha ( r

P ahol! k k kr k, k,, r k ) : P( k, k,..., kr ) : p p... pr, () k! k!... k! ( r k,,,...,, k,,,...,,, kr,,,...,, k k k r r. r= eseté a bomáls eloszláshoz jutuk (ld. Valószíűségszámítás). A kompoesek em függetleek, hsze például összegük. Példák ) Legyeek a teljes eseméyredszert képező E, E,, Er eseméyek valószíűsége p, p,, p r. Végezzük számú függetle megfgyelést. Legye az ( r E eseméy véletle bekövetkezés száma, =,,,r. Ekkor az,,, ) valószíűség vektorváltozóra ézve a fet valószíűség-eloszlás adódk. ) Tektsük egy N számú egyedből álló populácót, amelybe N számú tulajdosággal r redelkező egyed va, =,,,r ( N N). Válasszuk k vsszatevéses módszerrel r számú egyedet. Ekkor aak a valószíűsége, hogy az elemű mtába az tulajdoságú egyedek száma k, p N / k,,,...,,,,, r, k k k r mellett egy r,, N, =,,, r paraméterű multomáls eloszlású valószíűség vektorváltozó..3.. Többváltozós vagy többdmezós hpergeometrkus eloszlás Paramétertartomáy: r=,,,, ( r N, N,, N poztív egész. Az,,, ) valószíűség vektorváltozó lye eloszlású, ha valószíűségeloszlása r

N N N r... k k kr P( k, k,..., k r ) N, N, k,,,...,, k,,,...,,, kr,,,...,, k k k N N N r N. r, A kompoesek természetese tt sem függetleek, mert hpergeometrkus eloszláshoz jutuk (ld. Valószíűségszámítás). k k. r= eseté a Példa: Tektsük egy N számú egyedből álló populácót, amelybe N számú tulajdosággal redelkező egyed va, =,,,r ( N N). Válasszuk k vsszatevés élkül (mtegy markoljuk k ) (<N) számú egyedet. Ekkor aak a valószíűsége, hogy az elemű mtába az tulajdoságú egyedek száma k, k k k, a következő: r r r N N N r... k k kr P( k, k,..., k r ) N, k,,,...,,,,, r, N hsze -féleképpe lehet az N számú tulajdoságú egyed közül kválaszta k k számút, a választás mde tulajdoságra ézve függetle és az összes lehetséges választások N száma..3.3. Többváltozós vagy többdmezós ormáls eloszlás Paramétertartomáy: r=,,, és r számú várható érték és szórás érték. 3

( r Az r dmezós,,, ) v.v.-t r dmezós ormáls eloszlásúak evezzük, ha a kompoesek mde lehetséges leárs kombácója (tetszőleges a a a r összeg, így többek között (!) a r összeg, azaz mde kompoes s ormáls eloszlású. A kétdmezós ormáls eloszlás sűrűségfüggvéyéek grafkoja az ú. haragfelület (3. ábra). Nevezetes, hogy eze felület sztvoala ellpszsek. 3. ábra. Kétdmezós ormáls eloszlás sűrűségfüggvéyéek grafkoja mt háromdmezós felület.4. Valószíűség vektorváltozó kompoese között sztochasztkus kapcsolat Foglalkoztuk korábba egyazo valószíűség mező értelmezett v.v.-k függetleségéek, bzoyos értelembe kapcsolatuk háyáak a kérdésével. Most (azoos valószíűség mező értelmezett) valószíűség változók sztochasztkus kapcsolatával és utóbbak leggyakrabba haszált mértékszámával foglalkozuk. ( Példákat mutatuk be olya mtákra, azaz ( x, y ) értékpárok együttesére, melyek a vektorkompoesek között kapcsolattípusokra voatkozak, ld. a 4. ábrá. 4

4. ábra. Külöböző sztochasztkus kapcsolattípusokra utaló potdagrammok. Az a) esetbe tutíve agy, de vszoylag bzoytala kapcsolatra, a b) esetbe ks mértékű, de bzoyosak látszó kapcsolatra következtethetük. A c) részábra olya esetet mutat be, ahol Y értéke értékétől valószíűleg függetle, ugyaakkor Y szórása függ értékétől. A d) részábra függetleségre utal..4.. A kovaraca és a leárs korrelácós együttható Először s belátjuk a következő állítást: Ha és Y függetle v.v., akkor a és Y b s függetle (a és b tetszőleges valós szám). Bzoyítás: Vegyük fgyelembe, hogy P( a < x, Y b < y) = P( < x + a, Y < y + b). Utóbb és Y feltételezett függetlesége matt egyelő P( < x + a) P(Y < y + b)-vel, am vszot így s írható: P( a < x) P(Y b < y), ez pedg az állítás helyességét bzoyítja. Természetese ugyaígy függetle + a és Y + b s. 5

A fejezet tovább részébe feltesszük, hogy a v.v.-kak va véges varacája és így véges várható értéke. Ezért, ha és Y függetle, akkor E és Y EY s függetle. Ekkor vszot a várható érték egyk tulajdosága alapjá (ld. Valószíűségszámítás) E[( E)(Y EY)] = E( E) E(Y EY). Az utóbb téyezők vszot a várható érték egy másk említett tulajdosága alapjá -val egyelők. Összefoglalva, ha és Y függetle, akkor a Cov(, Y) jelölés bevezetésével a Cov(, Y) = E[( E) (Y EY)] meység, a kovaraca, -val egyelő. A továbbakba fgyelembe fogjuk ve a következő két összefüggést (bzoyítás élkül): a) Cov(, Y) D() D(Y) b) Ha és Y között feáll az Y = a + b leárs kapcsolat, akkor D( ) D( Y), Cov (, Y) D( ) D( Y), ha ha b b. Ezek szert tehát az r(, Y ) Cov (, Y ) D( ) D( Y ) háyadosra, az úgyevezett leárs korrelácós együtthatóra, rövde korrelácós együtthatóra feáll: ) r(, Y) =, ha és Y függetle, ld. a fetebbeket 6

Kétváltozós ormáls eloszlásra (ld. alább) egyébkét a fordított állítás s gaz, azaz, ha r(, Y) =, akkor és Y függetle. Hagsúlyozzuk azoba, hogy r(,y)=-ból és Y függetlesége általáosságba em következk. ) [, ] feltétel élkül r (, Y), ha Y a b és b, ha Y a b és b. A leárs korrelácós együttható két v.v. között összefüggés mértékéek egyk legfotosabb mérőszáma, külööse akkor, ha (,Y) kétváltozós ormáls eloszlású v.v. Az r leárs korrelácós együttható alkalmazása azoba sokkal szélesebb körbe elterjedt. A leárs korrelácós együttható megfgyeléseke alapuló becslésével mely a korrelácó fogalmáak megértésébe s segít a..3.. potba foglalkozuk..4.. Ragkorrelácós együtthatók Számos esetbe csupá a agyságbel sorredet jelző, ú. ordáls skálá fgyelhetjük meg a vzsgált v.v.-kat. Godolhatuk például véletle bormták ragsorára, ugyas lye skálá helyezhetők el például mőség mutatók vagy értékek, melyek esetébe a jobb és rosszabb attrbutum értelmezhető, de a meyvel jobb (vagy rosszabb) kérdése és ezzel kapcsolatba az értékek külöbözősége em haszálható. Ilye esetekbe a övekedőleg redezett mtaelemek ragjáak, a ragszámak va szerepe. és a korrelácó ezekre értelmezhető. Kapcsolt ragok: Gyakor, hogy agyság szert redezett sorozat egyes eleme azoosak, mert az eredet megfgyelések között vaak azoos agyságúak. Az lye elemekhez ú. kapcsolt ragkét azo ragok átlagát redeljük, mely ragokat eze elemek kapáak ugyaeze együttes pozícóba egy övekedő sorba. Megvlágítja a fogalmat a következő példa: Ha a (övekedőleg) redezett sorozat 9,,, 3, 3, 3, 3, 5, akkor az elemekhez redelt ragok redre a következők:,, 3, (4+5+6+7)/4= 5,5, 5,5, 5,5, 5,5, 8. A Spearma-féle ragkorrelácós együttható 7

Ha az és Y - akár ormáls eloszlású - v.v.-t csak ordáls skálá tudjuk mér, akkor az előbb modottak értelmébe az r korrelácós együttható fetebb smertetett képlete csak akkor értelmezhető, ha a változókra voatkozó x, y megfgyelésekkét az llető megfgyeléssorozatbel ragjat szerepeltetjük. Az így adódó Spearma-féle ragkorrelácós együttható emprkus vagy mtára defált képlete, mely egybe potbecslés (ld..., lletve..3.. pot). ( r r)( s s) ˆ. () ( r r) ( s s) (A sapka a mtából törtéő becslésre utal.) A korrelácós együtthatóhoz hasolóa feáll, hogy ˆ. A Spearma-féle ragkorrelácós együttható két v.v. sztochasztkus kapcsolatáak általáosságba alkalmazható mérőszáma olya esetbe s, amkor (,Y)-ak (kétváltozós) ormáls eloszlása em feltételezhető. Numerkus példát a..3.. potba mutatuk be. A Kedall-féle ragkorrelácós együttható Bzoyos esetekbe, amkor az átlagtól való eltérések helyett az eltérésekek csaks az azoos ráyát kívájuk fgyelembe ve, akkor alkalmazhatjuk a következő mérőszámot. Képezzük az ( r, s ),,, megfgyelésekre voatkozóa az alább, mtára defált, ˆ meységet ( r és s jeletése ugyaaz, mt a Spearma-féle együttható esetébe): A B ˆ, ( ) / tt A azo esetek száma, ahol az ( r r )( s s ) ( j ) j szorzat poztív ( j ), B pedg azo esetek száma, ahol a szorzat em poztív. (Az A mérőszámot kokordacáak evezzük. j 8

Kapcsolt ragok eseté a képlet boyolultabb, ezzel az esettel em foglalkozuk. Az előbb képlet szert ˆ (pot)becslések s tekthető (ld...3.3. pot). Megjegyezhető, hogy az összes és j dexek száma, melyekre j feáll, köye beláthatóa (-)/ vel egyelő. A képlet szert az összes vzsgált szorzat számával osztjuk a szorzatok előjeleek összegét. Köye belátható, hogy ha x x j és y j y mde, j párra (<j) azoos előjelű, akkor A=(-)/ és B=, ha vszot az előjelek mde, j párra eltérőek, akkor A=, B=(-)/. Az első esetbe ˆ =, a másk esetbe ˆ = -. Ha pedg közel azoos számba leszek az előjelek azoosak, akkor ˆ. Mthogy B=(-)/-A, feáll, hogy A ( ( ) / A) 4A ˆ. (3) ( ) / ( ) Numerkus példát a..3.3. potba mutatuk be. Az és Y v.v.-k között sztochasztkus kapcsolat vzsgálatára ezt a mérőszámot s gyakra haszálják..5. A regresszós egyees A haragfelületek mde, az y tegellyel párhuzamos és az (x,y) síkra merőleges síkmetszete és úgyaígy az x tegellyel párhuzamos és, az (x,y) síkra merőleges mde síkmetszete ú. haraggörbe, mely g x, lletve g y görbék alkalmas álladóval szorozva ormáls eloszlások sűrűségfüggvéyeek a grafkojahoz juthatuk. Továbbá a g x haraggörbék g x,max maxmumhelye az (x, y) sík egy egyeese meté fekszeek (5. ábra). Hasoló gaz a g y görbékre. 9

5. ábra. A síkba elfektetett g x haraggörbék (ld. a szöveget). Maxmumhelyek vetülete a regresszós egyees potja. Ezt az egyeest Y-ak -re voatkozó y=ax+b regresszós egyeeséek evezzük. Hasolóa, a rögzített y értékekhez tartozó g y haraggörbék x y, max maxmumhelye s egy x a * y b * egyees meté fekszeek az (x,y) síkba. Ezt az egyeest -ek Y-ra voatkozó regresszós egyeeséek evezzük. Nevezetes, hogy -ek Y-ra voatkozó regresszós egyeese (és egybe Y-ak -re voatkozó regresszós egyeese) potosa azo esetbe meredekségű, ha és Y függetle v.v.-k. Nevezetes, hogy a két paraméterre feáll: D( ) a r és b E( Y ) ae( ), D( Y ) lletve D( Y ) a* r és b* E( ) a * E( Y), D( ) tt r a korrelácós együttható. A két regresszós egyees köye beláthatóa az (x, y) sík (E(), E(Y)) potjába metsz egymást. A többdmezós ormáls eloszlás külöféle, a statsztkába és a bometrába s alapvetőe

fotos tulajdoságat tt em részletezhetjük. A regresszós egyeessel az.5.. potba, paramétereek megfgyeléseke (mtá) alapuló becslésevel pedg a... potba foglalkozuk. Tartsuk szem előtt, hogy a regresszós egyees kérdése alapvetőe kétváltozós ormáls eloszlás esetébe merül fel, főkét az.5.. potbel. problémakör kapcsá..5.. Regresszóaalízs Számos statsztka probléma megoldásáak eszköze a regresszóaalízs. Két de tartozó, egymástól agymértékbe külöböző problémakört említük. Ezek és számos változatuk agyo gyakra fordulak elő a statsztka gyakorlatba.. problémakör Legyeek smertek, adottak valamely meység smérv x( ), x(),, x( ) ú. beállítható értéke. A modell kerete belül feltételezés szert mde x () értékhez tartozk egy Y x() v.v., E( Y x( ) ) várható értékkel. Az Y x() v.v.-kra voatkozóa legye smert az m () számú függetle y =,, x( ),, y x( ),,, y x( ), m( ) megfgyelés, (6a), 6b) ábra). Másrészt legye adott valamlye elv vagy smeret alapjá a paraméteres f ( x, a, b, c,...) függvéycsalád, melyek alkalmasa választott a ', b', c', paraméterevel E( Y x ) f ( x, a', b', c',...) mde reálsa szóba jövő x értékre (ld. 6. ábra). Ha például a modell szert (!) f ( x, a, b, ) ax b, (vö. leárs regresszó ), akkor alkalmas a ' és b ' értékre E( Y x ) a' x b'. Vagy ha a modell szert f axb ( x, a, b, ) e, akkor alkalmas a ', b' értékre E( Y x ) e a' xb'.

6. ábra. Illusztrácók az. problémakörhöz (ld. a szöveget). : yx() megfgyelt értékek, : E ) várható értékek. A 6a) ábra esetébe folytoos v.v.-kat ( Y x( ) feltételezve a sűrűségfüggvéyek elfektetett grafkojat s ábrázoltuk. Az f ( x, a, b, c, ) függvéyre ézve ld. a szöveget. A 6b) ábrá olya esetet llusztráluk, ahol mde -re m () =, azaz egyetle megfgyelés törtét. Az f x, a, b, c, ) E( Y ) összefüggés a tulajdoképpe modell. ( x Kokrét esetre voatkozó példát láthatuk a 7. ábrá. 7. ábra. Vízhőmérséklet és lárvaállapot dőtartama közt összefüggés egy Patella géuszbel csgafaj (P. ulysspoess) esetébe (Rbero 8)

Az f függvéyt em feltétleül valószíűségszámítás meggodolás alapjá tekthetjük adottak. Előfordul azoba, hogy kellő smeret háyába x () és E ) kapcsolatát ( Y x( ) kább afféle aray középútkét egyszerűe leársak feltételezzük, azaz az f ( x, a, b) ax b modellt jelöljük k, smeretle a és b paraméterrel. Nagyo gyakor azoba eze leárs modell felmerülése elmélet megfotolások alapjá s. Az a és b paraméter becslését ld. a... potba.. problémakör Ebbe az esetbe egy valószíűség vektor kompoeseről va szó. Ez a problémakör több tektetbe szoros kapcsolatba va a többváltozós, például kétváltozós ormáls eloszlás tárgyalásáál modottakkal, ld..5. pot. A kompoesek ormáls eloszlását azoba általáosságba em feltételezzük. Legegyszerűbb esetbe a valószíűség vektor tt s kétdmezós. A vzsgálat alapját az (, Y) vektorra voatkozó ( x, y ) megfgyeléspárok együttese képez. Itt x az v.v.-ra voatkozó véletle, így em beállítható megfgyelés és hasoló modható el a hozzá tartozó y megfgyelésről. Tektsük az Y a b leárs közelítést (vö. leárs regresszó ). (Ez a közelítés a kétváltozós ormáls eloszlás esetébe a regresszós egyeesről modottakak megfelelőe (ld..5. pot) eleve kézefekvő.) Tekthetük azoba a leárstól eltérő, például expoecáls, vagy egyéb plauzbls vagy legalábbs elfogadható f regresszós függvéyt s. Ekkor tehát a közelítés: Y f (, a, b, c,...). A regresszó típusáak rögzítése utá foglalkozhatuk a paraméterek kérdésével. Az a m és b m paramétereket azzal defáljuk, hogy az ( Y ( )) égyzetes eltérés v.v. várható értéke mmáls legye. Ez a legksebb égyzetek elve. A követelméy a-t és b-t általába egyértelművé tesz. 3

Az előbb optmaltás krtérumak megfelelő egyeest s regresszós egyeesek (vö. az. problémakörrel kapcsolatba s), potosabba Y-ak -re voatkozó regresszós egyeeséek evezzük. A problémakör expermetáls megfelelője: Adottak az ( x, y ),,,, megfgyelések. Meghatározadó azo y x egyees, melyre a m m ( y ( x )) eltéréségyzet összeg mmáls (vö. 8. ábra). Ekkor az m és m értéket tektjük az a és b paraméter â, lletve bˆ becsléséek. 8. ábra. A függőleges, lletve a vízsztes szakaszok hosszáak összege az y m x m, lletve * m y * m x llesztett egyees esetébe a legksebb. Hasolóa beszélhetük -ek Y-ra voatkozó x aˆ * y b ˆ * becsült regresszós egyeeséről s. (Az. problémakör esetébe erről em beszélhetük.) Eek tárgyalásakor csupá és Y, lletve x és y szerepe cseréledő fel. A két regresszós egyees az (E(), E(Y)) potba metsz egymást, az llesztett egyeesek pedg az ( x, y) potba. Az â és bˆ értékek meghatározására a... potba vsszatérük. 4

. Becsléselmélet Bevezetés A statsztka egyk leggyakorbb célktűzése becslést ad valamely véletle meységek, v.v.-ak bzoyos paraméterere. A leggyakrabba felmerülő feladatok egyke a bostatsztka köré belül s - a várható érték és a szórás becslése. Kokrétabba, ekkor a v.v.- ra yert függetle mták együtteséek vagy rövde mtáak az smeretébe szükséges becslést ad valamely v.v. várható értékére és szórására. A becslése érthetjük egy számérték megadását, de egy olya tervallum megadását s, mely előre meghatározott valószíűséggel tartalmazza a valóságos értéket. Például egy rovarfaj valaháy egyedéek megfgyelt élettartama alapjá megsmer kívájuk az egyed élettartam mt v.v. várható értékét és szórását. Becsléskét a várható értékre például 8,4 ap adódk, míg egy másk fajta becsléskét adódhat a következő: a várható érték,95-os valószíűséggel 3 és 7 ap közé esk (potbecslés, lletve tervallumbecslés, ld. alább). Természetese csupá alapvető betektést adhatuk a kérdéskörbe. A fejezetbe az előbbekek megfelelőe értelemszerűe feltételezzük, hogy a szóbakerülő v.v.-kak létezk véges szórása és így várható értéke s (ld. Valószíűségszámítás).... Potbecslések... Potbecslés a várható értékre és a szóráségyzetre Potbecslése általáosságba valamely smeretle értékek egy számmal való becslését értjük. A később tárgyaladó tervallumbecslés esetébe vszot becsléskét olya tervallumot aduk meg, mely megadott valószíűséggel tartalmazza az smeretle számértéket. Végezzük az v.v.-ra voatkozóa számú függetle kísérletet (megfgyelést). A dolgot úgy fogjuk fel, hogy az első, másodk, stb. kísérlet sorá eloszlásával azoos eloszlású, függetle,,, v.v.-kra voatkozóa végzük egy-egy kísérletet vagy megfgyelést 5

(ld. Valószíűségszámítás). Az eredméy az x, x,, x megfgyelt értékek együttese, más szóval a mta. Az... átlag valószíűség változó egyfajta mtastatsztka - várható értéke ekkor, az azoos eloszlására és így azoos várható értékére tektettel: v.v.-k E ) E... E( ( ) E( )... E( ) E( ). (A mtastatsztka kfejezés oa származk, hogy az erre voatkozó megfgyelésbe az eredet v.v.-ra voatkozó megfgyelt értékek, mtaelemek játszaak szerepet.) Az utóbb egyelőség alapjá tehát az átlag v.v. azzal a kedvező tulajdosággal redelkezk, hogy várható értéke az eredet várható érték. Általába, ha egy paraméter becslésére szolgáló v.v. várható értéke éppe a becsüledő paraméter, akkor a becslésre szolgáló v.v.-t torzítatla becslőfüggvéyek evezzük. A fetekek megfelelőe az v.v.- ra voatkozó x x x megfgyeléssel, azaz a mtaátlaggal mt potbecsléssel becsüljük a megfelelő paramétert, am esetükbe az E() várható érték.... x Példák ) Legye az v.v. egy szabályos dobókockával dobás véletle eredméye, úgy mt,, 3, 4, 5 vagy 6. A kockával ötször dobva az egyes dobások eredméye az,,, 5 függetle v.v., ezek eloszlása természetese -ével azoos. A kockadobás utá megfgyelések legyeek: x, x 4, x x 3, x 5. Ekkor az becslőfüggvéyre 3 5 4 6

voatkozó megfgyelés, egybe a becslés, vagys a mtaátlag x 7/ 5.=3,4. ( valóságos várható értéke egyébkét köye beláthatóa 3,5.) ) Valamely madárfaj öt külöböző élőhelye lévő egy-egy fészkébe talált tojások számát, mt v.v.-kra voatkozó megfgyeléseket átlagoljuk. Mely tektetbe em felel meg eek az átlagak a származtatása a fetebb leírt egyk követelméyek? Megoldás: A szóbaforgó v.v.-k számos okál fogva (terület eltérések, stb.) em tekthetők szgorúa egyetle v.v. (függetle) smétléseek. Ezért szgorúa véve az átlag sem tekthető mde tovább élkül függetle, azoos várható értékű v.v.-kra voatkozó megfgyelések átlagáak. Fotos lehet magáak az átlag v.v. szórásáak, lletve szóráségyzetéek a becslése. Az,,, mta v.v.-k függetlesége (ld. fetebb) és a szóráségyzetek lye esetre smertetett tulajdosága alapjá (ld. Valószíűségszámítás): D D D D D D )... ( ( ) ( ( ) ( )... ( )). Tehát az átlag szóráségyzete mely egyébkét láthatóa ksebb, mt az eredet szóráségyzet -, az megfgyelésszám övekedtével egyre ksebb lesz és -hoz tart, ha tart a végtelehez. Ezért előyös a várható értéket mél több megfgyelés átlagakét becsül. Egyébkét az átlag v.v. s említ a szakrodalom. D ( ) szórását az átlag hbájakét (stadard error of the mea) Foglalkozzuk most szóráségyzetéek, D ( )-ek a becslésével. Tektsük az SS ( ) valószíűség változót (rövde eltéréségyzet összeget, SS: sum of squares). Foglalkozzuk az SS / MSS (MSS: mea of sum of squares) átlagos eltéréségyzet összeg v.v.-val, mely szóráségyzetéek egy általáosa haszálatos becslőfüggvéye. Köye megmutatható, hogy -re Ezért E( SS) ( ) D ( ). 7

SS Tehát az MSS* : SS E D ( ). v.v.-ra (korrgált átlagos eltéréségyzet összeg) (és em az SS/ v.v.-ra) feáll, hogy várható értéke az eredet v.v. D ( ) szóráségyzete, tehát utóbbak torzítatla becslőfüggvéye. (A * jel a becslés MSS-hez képest korrgált voltára utal.) Az MSS* v.v.-ra voatkozó mss* ( x x) megfgyelést korrgált tapasztalat vagy korrgált emprkus szóráségyzetek evezzük. (Vgyázat! SS/(-) a D szóráségyzetek ugya torzítatla becslése, de SS /( ) em torzítatla becslése a D D szórásak!) Példa Az ) Példába szereplő öt kockadobással kapcsolatos megfgyelésekre voatkozóa szórásvégyzetéek becslése: mss * (( 7/5) (47/5) (37/5) (57/5) )/4 5,/4 =,3, mss pedg 5,/5=,4. ( valóságos szóráségyzete,97.) Megjegyzés: Előfordul, hogy egy adott paraméterre voatkozó Y, =,, becsléssorozat olya, hogy a becslések -re voatkozó határértékbe torzítatlaok. Ekkor a becsléssorozatot kozsztesek evezzük. Ilye a fetebb becsléssorozat s, mert MSS SS/, =,, E SS SS E D ( ) D ( ). 8

Megemlítjük egy torzítatla becslés hatásfokáak fogalmát. Ném egyszerűsítéssel, akkor modjuk, hogy adott paraméterre voatkozó torzítatla K és K becslőfüggvéyek közül K agyobb hatásfokú, mt K, ha D K ) D ( K ). ( A fetebb bevezetett v.v.-kak és meységekek a bometra szakrodalomba számos jelölése, jelölés-redszere haszálatos. Igyekszük kerül a specáls jelöléseket. Ugyaakkor éha em célszerű ragaszkod a teljese egységes jelöléshez. Például a ormáls eloszlás tárgyalásakor gyakra, haszálják a szórás jelölésére a jelölést D helyett, stb.... Potbecslés a regresszós egyees paraméterere A kérdés az.5.. potbel ) és ) problémakör kapcsá bevezetett kétféle regresszós egyees esetébe azoosa kezelhető. Mt említettük, a ) problémakör esetébe beszélhetük -ek Y-ra voatkozó regresszós egyeeséről s. Tartsuk azoba szem előtt, hogy a regresszós egyees jó terpretálhatósága akkor áll fe, ha a felmerülő kétváltozós v.v. ormáls vagy ahhoz közel eloszlású. A feladat az y=ax+b regresszós egyees a és b paraméteréek az ( x, y ),,,, függetle megfgyeléseke, mtá alapuló â és bˆ becslése. Az x a * y b * regresszós egyees paramétereek becslését az x és felcserélésével yerhetjük. y változók alább részletezett szerepéek A regresszóaalízs tárgyalásakor modottak szert az a és b paraméter és becslése a ( y ( x )) (4) meység mmálásával kapható. Ez akkor mmáls, ha és, mt jelöléssel â és bˆ ) választása a következő: m, m, más 9

aˆ x y x y ( x x)( y y), bˆ y ax ˆ. () (5) x x ( x x) A fetekek megfelelőe a regresszós egyees egyelete a becsült paraméterekkel: y ax ˆ bˆ. Megjegyzedő, hogy az.5.. potba leírtak szert az ) problémakör esetébe az x értékekek általába cs valószíűségszámítás jeletése (!) Példák. problémakör ) Példa Adreal jekcó az deggerléstől az zomrágásg eltelt ú. rágásdőt csökket. Adjuk becslést az jektált adreal meység ( g ) és a rágásdő Y rövdülése (msec) mt v.v.-k között leárs regresszó egyeeséek paraméterere a 4. táblázat első két oszlopába közölt 3 megfgyelés adat alapjá. x y x x y 35 9 5 665 35-5 -35 35-4 5-84 35 9 5 35 35 4 5 49 6 4 3 4 4 48 3 4 6 4 4 8 8 4 36 3

-9 4-8 4 44 5 5 5 5 5 5 55 5 5 5 5 5 3 5 5 5 5 5 44 5 48 48 55 55 55 55 8 8 4 4 4. táblázat. Adreal dózs ( g, x) és zom rágásdő rövdülés (msec, y) adatok (Hajtma 968, 8. oldal) és részletszámítások Megoldás Az (5) formula alkalmazásához szükséges részletszámítások eredméye: x =9575, y =68, x 67865, x y =4695. Ezek alapjá, =3 fgyelembevételével: â =,53, bˆ =4,764, a regresszós egyees a becsült paraméterekkel: y=,53x+4,743. Az eredméyt a matematka háttér smeretéek feltételezésével így s közölhetjük (mértékegységek elhagyásával): rágásdő csökkeés,53 adreal dózs + 4,743. Az ( x, y ) megfgyeléseket és az llesztett regresszós egyeest a 9. ábrá láthatjuk. 3

9. ábra. Adreal dózs ( g, x) és rágásdő csökkeés (msec, y) megfgyeléspárok az llesztett regresszós egyeessel ) Példa Egy övéyta megfgyelés sorá békalecse faj x apos egyedere ézve az y átlagos levélszám logartmusára voatkozó megfgyelés eredméyeket láthatuk az 5. táblázatba. Adjuk becslést az átlagos levélszám y természetes alapú logartmusa és az x életkor között regresszó egyeeséek paraméterere. x y x x y,, 4 4, 3,3 9 6,69 7,8 49 9,74 3 9,5 63 3,63 5. táblázat. Adatok és részletszámítás eredméyek Megoldás A számolás eredméyekét kapjuk: (=4), â,39, bˆ =,834, így a regresszós egyees a becsült paraméterekkel: y=,39 x +,834. 3

( Az x, y ) adatpárokat és az llesztett regresszós egyeest a. ábrá láthatjuk.. ábra. A békalecse logartmált átlagos levélszám vs. életkor (ap) adatokhoz llesztett egyees Megjegyzés: A regresszós egyelet szert, z-vel jelölve az átlagos levélszámot, másképpe y=l z =,39 x +,834, z,834,39x,39x e e 6,59 e. Elvleg helyesebb vola közvetleül az expoecáls összefüggés paraméterbecslésével foglalkoz (részletek mellőzésével).. problémakör ) Példa Egy övéytermesztés vzsgálat sorá regsztrálták búzakalászok hosszúságát (cm, x) és a rajtuk lévő búzaszemek számát (y). Az eredméyek a 6. táblázat első oszlopaba láthatók. Becsüljük meg a szemszám kalászhosszra voatkozó leárs regresszójáak paraméteret. 33

x y x y x, 4 48, 4,4 9,5 38 36 9,5 3 8,6 9 49,4 73,96 4 8,3 33 73,9 68,89 5 8, 3 43 65,6 6 8, 8 6,8 65,6 7 7,7 69,4 59,9 8 7,3 4 75, 53,9 9 7, 6 84,6 5,4 74,9 7 3,5 63,35 6. táblázat. Búzakalászok hosszúsága (x) és szemszáma (y) (Sváb 98, 77. oldal) a leárs regresszó számításához szükséges részletszámításokkal Megoldás Az (5) formuláak megfelelő részletszámítások alapjá és az ott haszált jelölésekkel (a mtaelemszám 9): 9 3,5 74,9 7 aˆ 5,76. 9 63,35 74,9 Hasolóa, b ˆ 7/ 9 5,76 74,9 / 9 7,833. A regresszós egyelet a becsült paraméterekkel: másképpe y=5,76x-7,833, szemszám = 5,76 kalászhossz (cm) - 7,833. A regresszós egyeest ld. a. ábrá. 34

. ábra. Búzakalász hosszúság (cm, x) és szemszám megfgyeléspárok és az llesztett regresszós egyees ) Példa 3 újszülött x születés testsúlya ( uca = 8,35 g) és a születés utá 7. és. ap között, a születés súlyra voatkoztatott y relatív testsúlygyarapodás között a 7. táblázat első két oszlopába látható adatokat kapták. Számítsuk k a születés súly és relatív súlygyarapodás, valamt a relatív súlygyarapodás és születés testsúly között leárs regresszó paraméteret. x y x y 7 68 4896 584 464 63 756 544 3969 66 736 3 4356 7 7 774 449 584 9 5 688 46 74 9 75 69 8464 565 6 76 9576 5876 5776 8 8 944 64 394 8 97 656 44 84 4 9576 756 996 5 9 3335 35 84 8 4 4956 394 764 8 48 644 6384 34 x y 35

8 5 64 6384 5 3 69 8487 59 476 6 59 6844 3456 348 5 7 3375 565 79 6 6 756 5876 36 7 866 4884 54 6 88 88 5876 7744 7 63 8 69 3969 86 88 7568 7396 7744 4 53 756 64 89 3 5 66 744 5 87 9657 7569 3 3 59 757 59 348 33 76 8 7689 5776 6 7 763 36 584 3 9 97 69 8 8 68 84 394 464 4 93 6 996 8649 94 9 8554 8836 88 7. táblázat. Újszülöttek születés testsúlyára (x) és relatív súlygyarapodására (y) voatkozó adatpárok (Armtage 973, 54. oldal) és részletszámítások Megoldás Az (5) formula alkalmazásához szükséges részletszámítások eredméye (összegzés =-től x 3576, 8, 4988, 463, 3-g): y x x y y 7976. Ezek alapjá, =3 fgyelembevételével: â = -,8643, bˆ =67,87, â * = -,57, ˆb * =48,576. Az első regresszós egyees a becsült paraméterekkel: y= -,8643x+67,87. A másk regresszós egyees a becsült paraméterekkel: x = -,57y+48,576. A kétféle eredméyt a matematka háttér smeretéek feltételezésével így s közölhetjük (mértékegységek elhagyásával): 36

relatív súlygyarapodás -,8643 születés súly + 67,87 születés súly -,57 relatív súlygyarapodás + 48,576. ( Az x, y ) adatpárokra mt megfgyelésekre voatkozó potdagramot és a két llesztett egyeest a. ábrá láthatjuk. Megjegyzés: Az eredméy értékét övelé, ha vola formácók arról, hogy a (születés testsúly, relatív súlygyarapodás) kétváltozós v.v. ormáls eloszlású-e (vö..4.. pot). y. ábra. Születés súly és relatív súlygyarapodás és a két regresszós egyees..3. Potbecslések a korrelácós együtthatókra..3.. A leárs korrelácós együttható potbecslése Az r leárs korrelácós együtthatóra voatkozó, számú függetle alapuló becslés (megfgyelés) emprkus képlete : x, y megfgyeléspáro 37

( x x)( y y) rˆ (6) ( x x) ( y y) Emlékeztetük arra (vö..4.. pot), hogy az r korrelácós együttható elsősorba kétváltozós ormáls eloszlás eseté yújt kellő formácót a v.v. kompoeseek függőség mértékéről. Példák ) Állapítsuk meg az r korrelácós együttható emprkus értékét (becslését) a 7. táblázatba megadott születés testsúly vs. relatív súlygyarapodás adatpárok alapjá. Megoldás A (6) formula alkalmazásához szükséges részletszámítások eredméye (összegzés =-től 3- g): ( x x) 65,, ( y y) 768,47, ( x x)( y y) 8869, 75. Eek alapjá r ˆ, 6684. Mthogy r és rˆ értéke mdg a [-, ] tervallumba esk és függetleség eseté r=, az eredméy közepes agyságú egatív korrelácóról taúskodk, főkét akkor, ha feltételezhetjük a (testsúly, relatív súlygyarapodás) v.v. ormáls vagy ahhoz közel eloszlását. A korrelácós együttható szerecsére vszoylag robusztus mérőszám, mely adott adatokkal szembe számos és gyakor kfogás elleére s gyakra alkalmazható. ) Egy agy földrajz terület megfgyelés helye a madárfaua fajszámát és az észak földrajz szélességet a 8. táblázat adata mutatják, ld. a 3. ábrát s. Adjuk becslést az r leárs korrelácós együtthatóra. x y 39,7 8 38,8 37 39,467 8 38,958 8 38,6 35 38

38,583 94 39,733 3 38,33 8 38,9 96 39,533 98 39,33 38,37 5 38,333 8 38,367 8 37, 57 37,967 5 37,667 4 8. táblázat. Észak földrajz szélesség (fokokba, x ) és madárfajok száma ( y ) között kapcsolat (McDoald 9, 5. oldal) Megoldás A (6) formula alkalmazásához szükséges részletszámítások eredméye (összegzés =-től 7-g): ( x x) 7,577, ( y y) 58,, ( x x)( y y) 9, 85. Eek alapjá r ˆ, 469. Az eredméy közepes agyságú egatív korrelácóról taúskodk. 6. 3. ábra. Földrajz szélesség fajszám megfgyeléspárok 39

Megjegyzés: Vegyük észre, hogy tt a földrajz koordátákat s v.v.-ra voatkozó megfgyelésekek tektettük. Megfelelhet ez aak, hogy a megfgyelés helyeket bzoyos mértékg véletleszerűe adódak. Másk probléma, hogy a fajszám tulajdoképpe dszkrét eloszlású v.v. A (földrajz szélesség, fajszám) v.v. ormálshoz közelek feltehető eloszlásáról scs formácók. Szádékosa választottuk olya példát, melyek esetébe az adatok természete óvatosságra t...3.. A Spearma-féle ragkorrelácós együttható potbecslése Erre a becslésre alkalmas maga a ˆ ( r r)( s ( r r) s) ( s s) emprkus képlet (vö..4.. pot), egybe becslőformula. A formula az egyszerűbb 6 ( r s ) ˆ 3. (7) alakba s írható. A becslés torzított...3.3. A Kedall-féle korrelácós együttható potbecslése ( em-kapcsolt ragok esetére) Erre a becslésre alkalmas maga a ˆ 4A ( ) emprkus képlet (vö..4.. pot), mely egybe torzítatla potbecslés. (Emlékeztetük arra, hogy egyszerűség kedvéért -t csak em-kapcsolt ragok esetére defáltuk.) 4

Példák ) Tíz egyetem hallgató szakma tudássztjét és pályaalkalmasságát ragsorolták övekvő sorredbe. Az adatokat a 9. táblázat tartalmazza. (hallgató azoosítója) A B C D E F G H I J tudásszt ragja, pályaalkalmasság ragja, r 4 3 9 6 7 8 5 s 5 8 6 3 9 4 7 9. táblázat. Egyetem hallgatók szakma tudássztjéek és pályaalkalmasságáak ragsorolása (Armtage 973, 45. oldal) ( Az r, s ) adatpárokat a 4. ábrá potdagrammal ábrázoltuk. 4. ábra. Tudásszt (r) és pályaalkalmasság (s) kapcsolata Számítsuk k a tudásszt és pályaalkalmasság között Spearma-féle és a Kedall-féle ragkorrelácós együttható fetebb becslését. Megoldás 4

A Spearma-féle ragkorrelácós együttható meghatározásához (becsléséhez) haszálhatjuk a (7) formulát. Határozzuk meg először az r s meységeket. Ezek redre -,, -3, -, -, - -3, 3,, 4. Négyzetek összege 5. Mthogy =, 65 ˆ,685. 99 A Kedall-féle együttható meghatározásához (becsléséhez) célszerű az egyk változó övekedő ragja szert átredez az adatokat: 3 4 5 6 7 8 9 3 6 5 9 4 7 8 Köye belátható, hogy az A számot megkapjuk, ha a felső sorba végghaladva számbavesszük, hogy háy esetbe haladja meg az alsó sorbel ragot a tőle jobbra lévő rag. Eek megfelelőe A = 8+ 7+ 4+ 4+ 5+ + 3+ + + =34. Így a (3) formula alapjá 36 ˆ,5. 9 Fgyelembe véve, hogy mdkét ragkorrelácós együttható értéke a [-, ] tervallumba esk, és várható értékük függetleség eseté, esetükbe mdkét ragkorrelácós együttható közepes mértékű poztív sztochasztkus kapcsolatról taúskodk. ) Tauláséletta kísérlet sorá azt vzsgálták, hogy patkáyok kísérlet útvesztőbe (labrtusba) való tájékozódásra háy ap alatt trégezhetők, lletve mekkora az általuk apota átlagosa elkövetett tévesztések száma. Az adatokat a. táblázat tartalmazza. 4

egyed átlagos tévesztések x ragja, szükséges apok kódszáma () száma ( x ) ( r ) száma ( y ) y ragja, ( s ) ( r s ) 3,5 6,5 5 3 7 3 8 4 3,5,5 4 8 8 8 5 7 7 6 6 6 5 6 6 7 5 8 43 4 9 9 5 6 6 6 39 9 8. táblázat. Patkáyoko végzett tauláséletta megfgyelések eredméye (Hajtma 97, 44. oldal). Számítsuk k a Spearma-féle ragkorrelácós együttható becslését, mutá az adatokról azok ragszámara térük át. (A kapcsolt ragokra tektettel a Kedall-féle ragkorrelácós együttható becslésétől eltektük, vö. az.4.. potba modottakkal.) Megoldás A. táblázatbel ragpárok, megfelelőe redezve: 3 4 5 6 7 8 9 3,5 3,5 6 6 6 8 9 Ie ( r s ) =,5. A (7) formulával számolva a Spearma-féle ragkorrelácós együttható becsült értéke ˆ (6,5/99), 94. Az eredméy egyértelmű poztív kapcsolatra utal. 43

.. Itervallumbecslés, kofdeca tervallum Itervallumbecslés alkalmával olya véletle tervallumot határozuk meg, mely előre meghatározott valószíűséggel tartalmazza valamely v.v. becsüledő a paraméterét vagy általába, valamely a értéket. Egyes esetekbe az tervallum szélessége em v.v., csak az tervallum középpotja az. Más esetekbe az tervallum szélessége s v.v., ld. alább. Általába, legye a véletle határú, ) tervallum olya, hogy a becsüledő a ( paramétert -p valószíűséggel tartalmazza, vagy másképpe, p valószíűséggel em tartalmazza (p a gyakorlatba valamely előírt, általába kcsy szám). Ekkor az, ) ( tervallumot -p kofdeca szt, megbízhatóság szt vagy valószíűség szt mellett megbízhatóság tervallumak, kofdeca tervallumak evezzük, ld. 5. kofdeca tervallum fetebb, határa tehát valószíűség változók. ábra. A P(a< ):= p P( <a< )= ( p p ) -p P( <a):= p ----------------- ----------- a ------------------------------- ---------------- 5. ábra. Egy lehetséges, a becsüledő a értékre voatkozó -p p : p p ) megbízhatóság sztű (valószíűség sztű), ) ( ( kofdeca tervallum. Az és értékek mt határpotok valószíűség változók lehetek.... Ismeretle szórású ormáls eloszlású valószíűség változó várható értékére voatkozó kofdeca tervallum Olya (véletle) kofdeca tervallumot keresük, mely -p valószíűséggel, más szóval -p megbízhatóság szte tartalmazza az smeretle m várható értéket. Egy lye tervallumhoz juthatuk a következőképpe. Tektsük a t ( / ) m t : MSS * m MSS * 44

v.v.-t, ahol a mtaelemszám, MSS * pedg a korrgált tapasztalat szóráségyzet mt v.v. Ismeretes, hogy a t mtastatsztka, ormáls eloszlására tektettel, paraméterű t-eloszlású v.v. Egy k paraméterű t-eloszású t k v.v.-ra ézve vszot adott p-re egyértelműe meghatározott azo t, érték, melyre k p P tk, t t ) p. (8) ( p k k, p Mthogy t k sűrűségfüggvéyéek grafkoja szmmetrkus a függőleges tegelyre, a (8) formula így s írható: P( t, t ) p /. (9) k p k Egyes k és p értékpárokhoz tartozó, a (8) kétoldal összefüggést kelégítő t, értékek k p táblázatba foglalva elérhetők a szakrodalomba (ld. II. táblázat). Például a táblázat szert a k=3 és p=, értékpárhoz tartozó t 3,, érték,353. Ekkor P(,353 t3<,353)=,9. Megjegyzés: Más esetbe szükségük lehet olya egyoldal melyre * t k, p érték megállapítására, P( t k * tk, ) p () p áll fe. Mthogy azoba ekkor P( t *, t ) p, a (9) formuláak megfelelőe pedg k p k P tk, t ) p, következk, hogy ( p k * tk p tk, p,. () Vagys az egyoldal esetbe fele akkora valószíűség értékhez tartozk azo tervallumhatár, mt a kétoldal esetbe. Példa: Legye továbbra s k=3 és legye p=,5. Határozzuk meg a II. táblázat alapjá a * t értéket. Megoldás: A keresett érték t,353. (ld. 6. ábra). * 3,,5 3,,5 45

Megjegyezzük, hogy a II. táblázatot a hpotézsvzsgálat sorá törtéő haszálatára tektettel a krtkus t-értékek táblázatáak s evezk, vö. például t-próbák, 3..., 3... pot, stb. 6. ábra. k=3 paraméterű t- eloszlás sűrűségfüggvéyéek grafkoja a t 3,,5 3,, 5 * t és t3,,5 t3,, krtkus érték feltütetésével. A grafko alatt, t 3,, 5 és t 3,, 5 között terület agysága,95. (Az ábrá t 3,, 5 értéke helyese -3,8.) A t, p érték smeretébe a megfelelő kofdeca tervallum két határát már köye meghatározhatjuk. Ugyas a t m valószíűség v.v.-ra voatkozó alább MSS * eseméyek azoosak: -t, p < m MSS * < t, p (az eze eseméyre voatkozó valószíűség a (8) formula szert -p), MSS * MSS * ( t, p ) < - m < t, p, + t, p MSS * > m > - MSS * t, p, - MSS * t, p < m < + t, p MSS *. 46

Tehát m értéke -p valószíűséggel esk az véletle középpotú, t MSS*, p / véletle sugarú tervallumba. Eze véletle tervallumak a megfgyelésük által szolgáltatott realzácója a következő kofdeca tervallum: mss * mss * x t, p, x t p ). () (, Az mtaelemszám övelésével a kofdeca tervallum mtegy ráhúzódk a mtaátlagra. (Hasolóa taulságos meggodol a kofdeca tervallum sugaráak változását p övelésekor.) Fgyeljük meg, hogy a két tervallumhatár specáls ayba, hogy egymás elletettje. Választhatuk elvleg más, t p és t p értékeket s, melyekre feáll P t p t t ). Az ( p előző tervallumhatárok azoba előyösebbek, mert ekkor lesz az tervallum szélessége mmáls. Feltételeztük a keresett várható értékű v.v. ormáls eloszlását. Fotos körülméy azoba, hogy a fet becslés eljárás az eloszlásak a ormálstól való csekély eltérésére kevéssé érzékey. Ez agyba övel a becslés alkalmazhatóságát. Tovább példák ) Egy mezőgazdaság borsótábla yolc, egyekét m -es, véletleszerűe kválasztott területé a magtermés súlya (dkg) mt közelítőleg ormáls eloszlásúak feltételezhető v.v.- ra voatkozó függetle megfgyelések a következő voltak: 3, 6,, 4, 5, 3,, 4 (Sváb 98, 47. oldal). Határozzuk meg a termés m várható értékéek az -p=,99-os megbízhatóság szthez tartozó kofdeca tervallumát. Megoldás 47

A () formuláak megfelelőe határozzuk meg az x mtaátlagot, az =8 mtaelemszámhoz tartozó t értéket és az mss* korrgált tapasztalat szóráségyzetet. Ezek a következők: x =6/8=3,5, a II. táblázat szert t 7 3,5, mss * ((33,5)... (43,5) )/7 3,99. A kofdeca tervallum,, sugara: 3,99 /8 3,5, 453. A kofdeca tervallum: (3,5-,453, 3,5+,453) = (,797, 5,73). ) 9 övéyegyede tett, függetleek feltételezett megfgyelés alapjá egy populácóba a övéymagasság ormáls eloszlására voatkozóa vzsgálatot végeztük korább dőpotba, például a 3... potba leírt módszerrel. Arra a következtetésre jutottuk, hogy az adatok (közelítőleg) ormáls eloszlásúak. A mtaátlagra az x 43,, a szórás becslésére a mss * =5,464 értéket kaptuk. Adjuk meg ezek alapjá a övéymagasság m várható értékéek az - p =,95-ös megbízhatóság szthez tartozó kofdeca tervallumát. Megoldás A () formula alapjá a kofdeca tervallum középpotja az x =43, érték, sugara mss * t8,,5. Fgyelembe véve, hogy a t-eloszlás esetébe a 8 paraméter érték közelítéskét -ek vehető, t,, 5 -tel számolhatuk, am a II. táblázat utolsó sora szert,96 (ld. az alább 3. megjegyzést s). Vagys mss * t mss * t 5,464,96 9 8,,5,,5,74. Ezek szert az m várható értékre voatkozó kofdeca tervallum: ( x,74; x,74 ) (4,39; 43,83). Tehát a valód m érték közelítőleg -p =,95 valószíűséggel eze 43, középpotú,,74 sugarú tervallumba esk. Megjegyzések a példával kapcsolatba 48

) Tartsuk szem előtt, hogy feltételeztük az egyedek magasságáak közelítőe ormáls eloszlását. ) Ha az előírt megbízhatóság szt - p =,99, akkor a t,, =,576 értékkel kell számoluk és a kofdeca tervallum a fetvel azoos középpotú, de természetszerűleg (!) agyobb,,37,576 =,953 sugarú tervallum lesz. 3) A jele paraméter érték meglehetőse agy. Ilye paraméter érték esetébe a t-eloszlás jól közelíthető a stadard ormáls eloszlással, és utóbbra voatkoztathatók azo, agy k-ra voatkozó t t értékek s, mely szert ( t a határeset t-eloszlás, a stadard * * k, p /, p / ormáls eloszlás jele): * P( > t P( > t, p ) P( t > u p ) ( u p ) p /, t, p / ) t ahol tehát ( ) p / (3) u p (vö. 7. ábra). Például t u, 96 (ld. I. táblázat, lletve II. táblázat).,,5,5. 7. ábra. Az u p érték magyarázatához. a stadard ormáls eloszlás sűrűségfüggvéyéek grafkoja... Kofdeca tervallum adott eseméy előfordulásáak P valószíűségére Tegyük fel, hogy egy P valószíűségű eseméy bekövetkezésére számú függetle kísérletbe az eseméy k-szor fordult elő ( k ). Ekkor P-ek kézefekvő becslése a relatív gyakorság, mt v.v. (ld. Valószíűségszámítás). Olya ˆp és ˆp értékeket keresük, melyekre adott - p megbízhatóság szt mellett az áll fe, hogy 49

P ( pˆ < P < ˆp ) = p. (A feltétel egymagába tt sem tesz egyértelművé ˆp -t és ˆp -t.) Csupá vázoljuk a feladat agy mellett jó közelítő megoldását. Ismeretesek jobb becslés eljárások s, azoba azok léyegese boyolultabbak. Becslést adhatuk u p smeretébe (ld.... pot,. példa, 3) Megjegyzés) ˆp -ra és ˆp -ra a következők szert (bzoyítás élkül): k u p k k ( ). pˆ, ( ˆp és ˆp egyarát v.v.-ra voatkozó megfgyelés, mert k v.v.) Ks kísérletszám eseté a közelítés em kelégítő; ekkor másfajta, tt em tárgyalt közelítést célszerű alkalmaz. Példa: Egy eseméy bekövetkezésére ézve függetle megfgyelést végeztük. Az eseméy 7 alkalommal következett be. Határozzuk meg az eseméy bekövetkezéséek P valószíűségére voatkozó, -p =,9-os megbízhatóság szthez tartozó kofdeca tervallumot. Megoldás Azt kívájuk, hogy P( ˆp < P < p ˆ ) =,9 feálljo; ekkor p =,. k / 7 /, 7. Határozzuk meg mdeekelőtt u p -t a II. táblázat utolsó sorából. Utóbbt a ( u, ),5,95 egyelet határozza meg. A II. táblázat (aak utolsó sora) szert u p,645. Ezért,645 p ˆ,,7 (,7,93,7,497. Ie a keresett,,7 középpotú, -p=,9-os megbízhatóság sztű kofdeca tervallum: (,83;,97). 5

3. Hpotézsvzsgálat Bevezetés Hpotézsek, feltételezések elemzése sorá bzoyos megfgyelések alapjá a hpotézs elfogadására vagy elvetésére voatkozó dötést hozhatuk. Tegyük fel például, hogy egy érme szabályosságára voatkozóa kíváuk dötést hoz. Dobjuk fel az érmét -szer és jegyezzük fel a fej eredméyek számát. Ha az érme szabályos, akkor a fej eredméyek aráya az esetek többségébe közel lesz /-höz. Ameybe tehát utóbbt tapasztaljuk, akkor az érme szabályosságára voatkozó hpotézst talá elfogadjuk, azaz em fogjuk elutasíta (kocepcoáls kérdés, hogy a két kfejezés közül melyk helyévalóbb.) Ha vszot a fej eredméyek számaráya agyo eltér /-től, akkor a szabályosságra voatkozó hpotézst elutasítjuk. Godolhatuk azoba egésze más természetű hpotézsre s. Feltételezhetjük például egy vádlott bűösségét, egy személy adott fajta betegségét, stb. A hpotézst, melyet ullhpotézskét mdg valamely ellehpotézssel állítuk szembe (ld. alább), gyakra H -lal jelöljük. Az ellehpotézsek, más kfejezéssel alteratív hpotézsek a jelölése többyre H. Adott H hpotézssel szembe többféle ellehpotézs állítható, legegyszerűbb esetbe H a H -ba foglalt állítás elletettje. Ekkor H-t éha em s említk. Ha többféle, a probléma természetéek megfelelőe más és más, H, ' '' H,, ellehpotézst állíthatuk, akkor a H vs. H, H ' H vs,. H '' H vs hpotézspárok más és más hpotézsvzsgálatot jelölek k. Az ellehpotézs. H megválasztása tehát az adott körülméyek, lletve a statsztka kérdésfeltevés függvéye. Megjegyzedő, hogy a fetekkel kapcsolatba számos alapvető kérdés felmerül, melyek említésére és taglalására tt em vállalkozhatuk (vö. a Neyma Pearso-féle problémakörrel és R. A. Fsher hpotézsvzsgálat felfogásával, lletve ezek vszoyával). A H hpotézsre voatkozó dötésük véletletől függő megfgyelés eredméye alapulhat. A dötés sorá kétféle hbát követhetük el. Előfordulhat, hogy gaz (potosabba gaz logka értékű) hpotézst hbása elvetük, elutasítuk. Ilyekor beszélük elsőfajú hbáról. Ilyekor, ha az ellehpotézs a ullhpotézs tagadása, akkor egybe az 5

ellehpotézst tévese - elfogadjuk. Más esetbe az fordulhat elő, hogy H hams, mégs - hbása - elfogadjuk. Utóbb esetbe beszélük másodfajú hbáról (ld. 8. ábra). elfogadjuk H -t elutasítjuk gaz helyes dötés elsőfajú hba H hams másodfajú hba helyes dötés 8. ábra. Az elsőfajú és másodfajú hba értelmezéséhez Néháy példa H ullhpotézsre a matematka statsztka köréből: a) egy bzoyos valószíűség változó valamely paramétere, modjuk m-mel jelölt várható értéke,5-tel egyelő b) az előbb m-re 3<m<6 Tovább példa: Érmedobáskor a fej eredméy p valószíűségére p=,5. Példa lehet voatkozó ellehpotézsekre a fet a) esetbe: ' '' H : m, 5 H : m, 5 H : m, 6. Példa az előző fogalmakra Pézérme szabályosságára (P(fej)=P(írás)=,5) voatkozó H hpotézssel foglalkozuk 6 érmedobás eredméye alapjá. A H ellehpotézs lehet: H em áll fe, azaz az érme em szabályos. Utóbb hpotézs, kssé ügyetle kfejezéssel élve, kétoldal, mert a,5-től való eltérést em specfkáljuk. Eek fgyelembevételével a következő kétoldal próbát 5

végezzük el. Azt a dötés stratégát választjuk, hogy ha a dobás eredméyére, mt a fej dobások számára voatkozó v.v.-t llető megfgyelés a [, 4] tervallumba fog es, akkor a hpotézst el fogjuk fogad. Ha vszot a dobás eredméye eze tervallumo kívül esk, akkor a hpotézst el fogjuk utasíta. Tehát az [, 4] tervallum (aak határat s beleértve), az elfogadás tartomáy, az elutasítás vagy krtkus tartomáy pedg a [, ] és [5,6] tervallumok úója. Ezért evezzük az lye próbát kétoldal próbáak. Ha most a H hpotézs gaz, azaz a pézérme szabályos, akkor a dobás eredméy, lletve megfgyelés az 6 6 6 3 4 =6, p=/ paraméterre tektettel P()+P(3)+P(4)= 6 6 6 =,785 valószíűséggel esk a [, 4] tervallumba és,875 valószíűséggel esk azo kívül. Ezek szert a H hpotézs feálltakor helyes dötést foguk hoz,785 valószíűséggel és elsőfajú hbát követük el,875 valószíűséggel. (Érdemes megvzsgál az elsőfajú hba valószíűségét arra az esetre s, ha a pézérme továbbra s szabályos, vszot az elfogadás tartomáy a [3, 5] tervallum.) Boyolultabb azo eset tárgyalása, amkor a fet H hpotézs hams. Ez ugyas em egyértelmű ayba, hogy a hamsság mértéke alapvető szerepet játszk a másodfajú hba agyságába. Ha például a pézérme csak agyo ks mértékbe tér el a szabályostól, akkor a megfgyelés most s közel,785 valószíűséggel esk a fet elfogadás tervallumba, amkor s H -t (hbás volta elleére) el fogjuk fogad, elkövetve a közel,785 (abormálsa agy) valószíűséggel előforduló másodfajú hbát. Ha a hamsságo a kocka egyfajta kokrét deformtását értjük és erre ráyul az ellehpotézs, akkor adott, kokrét esetbe megadható a másodfajú hba kokrét valószíűsége (vö. Vcze 975 5. oldal). Ha vszot a szabályosságtól való eltérés mértéke erőse bzoytala, akkor a másodfajú hba valószíűségét általába em tudjuk megad. Ezzel kapcsolatba jegyezzük meg, hogy a másodfajú hba valószíűségéek gyakor meghatározhatatlasága matt tulajdoképpe helyesebb a H ullhpotézs elfogadása helyett a H ullhpotézs el em utasításáról beszél. Általáosabba, a dötés eljárás sorá dötést a H ullhpotézsre voatkozóa és H - re s tektettel valamely Y v.v.-ra, mt mtastatsztkára, ez esetbe ú. próbastatsztkára voatkozó megfgyelés alapjá hozuk ( próba ). Ilye lehet a fet esetbe az írás és fej eredméyek aráya. Nevezetese, ha valamely előzetese rögzített dötés stratégáak 53

megfelelőe Y-ak a mtá alapuló megfgyelt y értéke bzoyos A tartomáyba, az elfogadás tartomáyba esk, akkor a H hpotézst H-gyel szembe el fogjuk fogad. Ellekező esetbe, amkor s Y-ak megfgyelt y értéke az elfogadás tartomáyo kívül, ú. elutasítás vagy krtkus tartomáyba esk, akkor a H ullhpotézst el fogjuk vet. Az elfogadás tartomáyt általába úgy jelöljük k, hogy az elsőfajú hbáak valószíűsége valamely rögzített (kcsy) érték legye. A helyes dötések H gaz volta mellett (!) valószíűsége, azaz az elsőfajú hba elkerüléséek a valószíűsége ez esetbe ylvá lesz, mely valószíűséget a próba valószíűség sztjéek, más szóval szgfkacasztjéek evezzük. Helyes, ha statsztka próba alkalmával ezt az sztet a megfgyelést és dötést megelőzőe állapítjuk meg. A gyakorlatba -t általába,99-ek vagy,95-ek, esetleg,9-ek választjuk. Az elfogadás tartomáy kalakításakor természetese fgyelembe kell ve a kokrét ellehpotézst. Gyakra ehéz vagy értelmetle ragaszkod valamely hpotézs egyoldal vagy kétoldal voltáak eldötéséhez. Ugyaakkor egyoldal ( egyfarkú, oe-taled) próba esetébe az egyoldal vs. kétoldal osztályozás általába egyértelmű. Ilye próba esetébe az elutasítás tartomáy a (dszkrét) valószíűségeloszlás vagy a sűrűségfüggvéy egyk végére esk. Mderre alább számos példát látuk. Kétoldal ellehpotézs és kétoldal próba esetébe az ( krt elfogadás tartomáyt agyo gyakra egy a krt, b ) vagy [ a krt, bkrt. ] tervallumak választjuk, amkor s a kétoldal elutasítás tartomáy a (, a ] [ b, ) vagy a (, akrt ) ( bkrt, ] számhalmaz, vö. 9. ábra. Az előbbekkel összefüggésbe a krt., lletve b krt. a próba valószíűség sztjéhez tartozó ú. krtkus érték. Ha a valószíűség krt krt szt, akkor célravezető az a, krt, b krt jelölés, ahol. Ekkor az Y próbastatsztkára voatkozóa és P( a Y b ) krt, krt, H P( Y H akrt., H) P( b., Y ) krt. Gyakor és olya választása, hogy P( Y akrt H) P( bkrt, Y H ) / álljo fe., 54

9. ábra. Krtkus értékek, elfogadás tartomáy és elutasítás tartomáyok. Megjegyzedő, hogy a P( akrt Y b ) egyelőség egymagába az a,, krt, H krt, b krt, számpárt em tesz egyértelművé (vö. a. ábrával), hacsak cs a krtkus értékek között valamlye összefüggés.. ábra. Az Y próbastatsztka f sűrűségfüggvéyéek grafkoja alatt terület és az azoos, valószíűség szthez tartozó kétféle krtkus érték pár. Ez utóbb összefüggés azoba éppe agyo fotos esetekbe előfordul. Ha például az Y folytoos eloszlású v.v. sűrűségfüggvéye -ra szmmetrkus, akkor az elfogadás tartomáyt tt em részletezhető okból célszerűe a krt, a ) alakúak választjuk. (, / krt, / Mdez például a t-eloszlásokra és a stadard ormáls eloszlásra, mt H mellett gyakor próbastatsztka-eloszlásra elmodható. H helyett a képletbe gyakra a kokrét ullhpotézst írjuk k. Ha ez valamlye voatkozásba például m m (ld. alább), akkor az előbb formula helyett a P( a Y b m ) krt, krt.., m formulát írhatjuk. 55

Másk gyakor esetbe az elfogadás tartomáy, a * ) vagy ( a *, ) alakú (ld. ( krt krt. ábra). Megjegyzés: Az alábbakba többyre *-gal jelöljük az egyoldal krtkus értéket. a próbastatsztka értéke de esk a próbastatsztka értéke de valószíűséggel esk valószíűséggel --------------------------------+---------------------------- a * krt. elfogadás tartomáy elutasítás tartomáy. ábra. A, a * ) elfogadás tartomáy és egybe [ a *,, ) ( krt, krt elutasítás tartomáy az a krtkus értékkel egyoldal próba eseté. Ha * krt., a próba valószíűség sztje, akkor az Y próbastatsztkára voatkozóa P Y a * krt, H ) és P a * krt, Y H ). ( ( A továbbakba a krt rövdítést em írjuk k dexbe, csak a -t íruk. Példa egyoldal próbára és elfogadás tartomáyra Az előbb példa esetébe természetesek modható alteratív hpotézs vagy ellehpotézs az, hogy az érme em szabályos. Általába, ha em térük k a ullhpotézssel szembe ellehpotézs részletere, akkor ellehpotézse hallgatólagosa a H : H em áll fe hpotézst szokás érte. Elképzelhető azoba más eset s. Például az érmedobással kapcsolatba lye ellehpotézs lehet a következő: ' H : az érmét úgy mapulálták, hogy a fej dobás valószíűsége,6, ld. a fetebb példát. Ayt jegyzük meg, hogy más dötés stratégát választhatuk H -ak H-gyel szembe, mt eze potba alább, az egyoldal vs. kétoldal próbával kapcsolatba. ' H-vel szembe vzsgálatakor, ld. 56

p-érték szert vzsgálat Hpotézsvzsgálat alkalmával számos esetbe az ú. p-értéket számítják k és aak alapjá folytatják a vzsgálatot. A p-érték em más, mt aak a valószíűsége, hogy a ullhpotézs feállása mellett a próbastatsztka mt v.v. értéke a próbastatsztkáak a mta alapjá adódó megfgyelt értékéél em szélsőségesebb, például em agyobb. Vagys ekkor p: P( a próbastat sztka értéke megfgyelt érték H gaz ). Például (, krtkus érték ) típusú elutasítás tartomáy esetébe a ullhpotézst aszert utasítjuk el vagy fogadjuk el adott valószíűség szte, hogy a megfgyelt p érték a megfelelő szthez tartozó krtkus értéket em haladja meg vagy meghaladja. Nylvávaló, hogy az eljárás tulajdoképpe azoos a fetebb smertetett eljárással, legfeljebb agyobb csábítással jár a krtkus érték, lletve a valószíűség szt változtatására valamely előzetes kocepcó gazolása érdekébe. A p-érték alkalmazására csupá gyakor szakrodalm említése matt tértük k. Egy hpotézst vagy éppe ellehpotézst s gyakra moduk egyoldalak vagy kétoldalak, ld. fetebb s, bár ezek a jelzők em olya egyértelműek, mt az egyoldal és a kétoldal próba esetébe. Például a H : m a ellehpotézst kétoldalak (ld. fetebb s). H : m a hpotézst egyoldalak modhatjuk, a Előfordul, hogy gazá sem egyoldalak, sem kétoldalak em evezhető ullhpotézs esetébe s alkalmazuk egyoldal próbát, lletve egyoldal krtkus tartomáyt, ld. például 3... pot, Bevezetés. Meg szoktuk külöböztet egyszerű és összetett hpotézst. Például H : m =a egyszerű hpotézs, ' H : m a összetett hpotézs. Példa az ellehpotézs szerepére Fetebb említettük, hogy a próba egyoldal vagy kétoldal voltáak megválasztását befolyásolhatja az ellehpotézs. A kérdés megvlágítására tektsük a következő példát. 57

Egy A alfaj egyede megfgyelhető bzoyos folytoos G kvattatív jelleg, melyre mt v.v.-ra voatkozó g A sűrűségfüggvéy grafkoja a. ábrá látható.. ábra. Illusztrácó az ellehpotézs szerepe dötéshozatalkor. A megfgyelt g érték semmképpe em szól a sűrűségfüggvéy g B g A -val szembe érvéyessége mellett. Hozzuk dötést egyszerűség kedvéért egyetle megfgyelt mta(elem) G-értéke(=g) alapjá azo H hpotézsre voatkozóa az alább H ellehpotézssel szembe, mely szert a mta az A alfajból származk. Fotos körülméy, hogy példákba H és H, lletve H és ' H között (ld. alább) dötés kéyszer áll fe. Ezzel kapcsolatba jelöljük k a, ) és ( g, ) elutasítás tartomáyokat. (A két tartomáy együttese kétoldal ( g krt. krt. krtkus tartomáy, a próba kétoldal próba.) Essék g a, ) elutasítás tartomáyba. ( g krt. Eek alapjá a H hpotézst elvetjük. Persze jele esetbe hallgatólagosa feltettük, hogy a H ellehpotézs a következő : H em áll fe (azaz a mta em az A alfajból származk). Ha vszot az ellehpotézs ' H : a mta a B alfajból származk és a B-bel 58

egyedekek a G jellegre voatkozó sűrűségfüggvéye g B (ld.. ábra), akkor a g pot kokrét helyzete semmképpe em szólhat H -ak ( H-gyel szembe) elvetése, egybe ' H elfogadása mellett, hsze g helyzete ylvávalóa még kevésbé szól H mellett. ' H mellett, mt Ncs terük arra, hogy a hpotézsvzsgálat mde léyeges szempotjára ktérjük. Csupá két tovább kérdést említük (Vcze 975, 5. oldal). Ha a H hpotézs összetett, például az m várható értékkel kapcsolatba m m típusú, akkor természetese mde kokrét m' m részhpotézs esetébe más és más lehet a próbastatsztka eloszlása. Így H feállása eseté más és más lehet az adott valószíűség szthez tartozó krtkus tartomáy (ld. mdezt a 3... potbel egymtás t-próba kokrét esetével kapcsolatba s). Némképpe hasolóa, a másodfajú hba valószíűsége általába csak akkor egyértelmű, ha a H ellehpotézs egyszerű. 3.. Paraméteres statsztka próbák A következőkbe először olya, úgyevezett paraméteres próbákkal foglalkozuk, melyek esetébe valamely hpotézs egy paraméteres eloszláscsaládak, az alább tárgyalt esetekbe például a ormáls eloszlásak a várható értékére és/vagy szórására, más esetekbe például az egyparaméteres Posso eloszlásak a paraméterére voatkozk. 3... Egymtás t-próba Feltesszük, hogy az v.v. ormáls eloszlású, smeretle m és σ paraméterrel. Hpotézsük szert az m várható érték megegyezk egy adott hpotetkus m o értékkel (vagys H : m m ). A (kétoldal) ellehpotézs legye H : m m. Legye,,, az első, másodk,,-edk függetle mtára voatkozó v.v. Ismeretes, hogy a 59

t : mo MSS* ( m v.v. mt próbastatsztka paraméterű t-eloszlású v.v. akkor, ha H feáll, azaz ha várható értéke m (a próbastatsztkára hely érvéyességgel haszáljuk a t jelölést). Rögzítsük az - valószíűség sztet. Mthogy m-ek az m -tól való esetleges eltéréséek ráyát lletőe em foglaltuk állást, így kétoldal hpotézsről va szó és kétoldal próbát alkalmazuk. Továbbá bzoyos optmalzálás okok matt szmmetrkus krtkus tartomáyt vezetük be. A II. táblázatból az adott - paraméter mellett meghatározható olya o / ) krtkus érték, melyekre, t -gyel jelölve az - paraméterű t-eloszlású v.v.-t, t, P t t t ), (,, másképpe P t t vagy t t. (,, ) Tektsük most a mtából adódó kokrét, a t próbastatsztkára voatkozó x m t' : (4) mss * megfgyelést. Ha eek értéke ksebb, mt t, a vagy agyobb, mt t,, akkor dötés stratégák szert H -t - hbása el fogjuk vet. Az elsőfajú hba valószíűsége ekkor H gaz volta eseté. A helyes dötés valószíűsége, hagsúlyozzuk, hogy H gaz volta eseté, - (vö. 3. ábra). A másodfajú hba agysága csak az ellehpotézs közelebb megjelölése mellett vola vzsgálható. A kérdés részletet statsztka művek tárgyalják. 6

Megjegyzések: ' ) Ha vszot az (egyoldal) ellehpotézs például H : m m, akkor egyoldal próbát (, végzük, ameybe az egyoldal t *, ) krtkus tartomáyt vezetjük be, ahol t * -re az áll fe, hogy P ( t t, *) ; vö. a () formulával, p helyett -val., Hagsúlyozzuk, hogy a t, lletve t * krtkus érték defícója és meghatározása,, azoos a fetebb bevezetett és t * értékekével és így t, p, p t (5), * t, (ld. 3. ábra). 3. ábra. - paraméterű t-eloszlás sűrűségfüggvéyéek grafkoja, krtkus értékek elfogadás tartomáy és elutasítás tartomáy kétoldal, lletve egyoldal, 95 valószíűség sztű próba esetére (vö. a 6. ábrával) ) A legtöbb statsztka, bometra tárgyú köyvbe azo esettel s foglalkozak, ahol a ormáls eloszlású v.v. szórása smert. Rtka bológa előfordulása matt a megfelelő próba leírását mellőzzük. 3) Megjegyzés: Érdemes megfgyel, hogya változk a mtaelemszám és a paraméter (,, függvéyébe a t, t ) 6

Példák ) Egy pszchológa kísérlet sorá adott kísérlet feltételek mellett yolc kísérlet személy kezével egy tárgyat cm-be kfejezve a következő mértékbe mozdított el (feltevés szert az v.v.-ra voatkozó függetle megfgyelések):,,,,,5, 6,6,,, 8,7,,6,,6. Az elmozdítás közel ormáls eloszlásúak és korább tapasztalatok alapjá m=, cm várható értékűek volt feltételezhető (Hajtma 97,. oldal). Vzsgáljuk a H : m=, ullhpotézst a H : m, (kétoldal) ellehpotézssel szembe kétoldal egymtás t- próbával - =,95-os valószíűség szte. Megoldás A próbastatsztka paramétere: 8-=7. Krtkus érték a kétoldal próba esetére a II. táblázat szert: t,365. A számolás szükséges részeredméye: Átlag:,75, 7,,5 mss*=3,348/7=3,393, mss *, 889. t =,75, 8 =,768. A krtkus érték,889 agyobb a t próbastatsztka (poztív) értékéél. Ezért a ullhpotézst elfogadjuk. Megjegyzés: Feltételeztük a vzsgált v.v. ormáls eloszlását. Az erre voatkozó hpotézs például a 3... potba tárgyaladó khí-égyzet próbával vzsgálható. Azoba a ormaltástól való eltérés vszoylag csekély mértékbe ért a próba haszálhatóságát. Ezért a t-próbák ú. robusztus próbák. ) Egy pedagóga felmérés sorá egyetem hallgatók egy témakörre voatkozó tezív felkészítését követőe függetle megfgyelésekkét a következő potszám eredméyek adódtak (x): 6, 9, 75, 68, 83, 95. Korább tapasztalat alapjá az eredméy közel ormáls eloszlású v.v., melyek várható értéke 7. Az tezív felkészítés agyobb eredméyességét (a agyobb m várható értékre voatkozó feltevést) a következő hpotézspár vzsgálatával elleőrzhetjük: H : m 7, H : m 7. (Ekkor H elvetése gazolhatja adott valószíűség szt mellett az eredet feltevést.) Alkalmazzuk =,9-os szte egymtás t-próbát. Megjegyzés: A H : m 7 ellehpotézs felállítása plauzbls. 6

Megoldás A hpotézspárak megfelelőe egyoldal próbát végzük. Az (egyoldal) krtkus tartomáy a () II. táblázat szert, a (5) formula alapjá t5,, t5,, =,476. Az elutasítás tartomáy tehát (,476, + ). A t próbastatsztka értékéek (ld. (4) formula) a meghatározásához szükséges részletszámítások: x - m=79,7-7=9,7, / (mss*) ((( 6 79,7)... (9579,7) / =3,67. Így ' 6 (9,7 /3,67),76. )/5) az elutasítás tartomáyba esk, ezért a H hpotézst az adott elvetve, állást foglalhatuk a H : m 7 hpotézs mellett. t Utóbb valószíűség szte 3... Kétmtás t-próba Bevezetéskét tektsük a 4. ábrá látható sémát, ahol az és függetle megfgyelések kétféle populácóból (ha úgy tetszk, kétféle hatásak vagy kezelések ktett populácóból) származak. a) b) c) 4. ábra. Illusztrácó a kétmtás t-próba kérdéséek bevezetéséhez Vessük fel a kérdést: Az a) vagy a b) esetbe meggyőzőbb-e és átlagaak az eltérése? A válasz az lehet, hogy a ksebb szórások matt a b) esetbe meggyőzőbb a két átlag eltérése, mert tt ksebb a megfgyelések szóródása. Hasoló kérdés vethető fel a b) és a c) eset vszoylatába, ahol s a c) esetet tarthatjuk meggyőzőbbek az átlagokak a (közel azoos 63

szóródások mellett) agyobb eltérése matt. Megállapíthatjuk tehát, hogy a megítélésbe md a szóródásokak, md a két eltérés agyságáak szerepe lehet. Mdez tükröződk az smertetésre kerülő próbastatsztka képletébe. A kokrét tárgyalásra térve, legyeek adottak a ormáls eloszlású, smeretle, de azoos szórású és Y v.v.-k. A H hpotézs: az m és m Y várható érték egyelő, vagys H : m m Y. A (kétoldal) ellehpotézs legye H : m my, vagys H em áll fe. Jelöljük a mtaelemszámokat -szel, ll. Y -al. Legye a két mtaátlag v.v. és Y. Bebzoyítható, hogy H teljesülése eseté a t : Y ( Y Y ) ( ) MSS Y * ( Y ) MSS Y * v.v. (próbastatsztka) - = + Y - paraméterű t-eloszlású ( t eloszlású), ahol := + Y (tt s hely érvéyességgel haszáltuk a próbastatsztkára a t jelölést). Az egymtás t- próbához hasoló doklással a H ellehpotézs kétoldal voltára tektettel kétoldal próbát alkalmazuk. Most s szmmetrkus krtkus tartomáyt vezetük be. hasolóa meghatározzuk az előre megadott próbához tartozó t krtkus értéket, melyre, Az előző esethez valószíűség szthez és kétoldal P ( t, t t, m my ) P( t, t t, ) és a továbbakba a korábba vázolt dötés stratégát követjük. Vagys, ha a t v.v.-ra voatkozó t': Y ( Y Y ) ( ) mss x y * ( Y ) mss * Y (6) (,, megfgyelés a t, t ) elfogadás tervallumo kívül esk, akkor az m = m Y hpotézst valószíűség szte elvetjük, ha vszot a t ' megfgyelés a 64

(,, t, t ) elfogadás tervallumba esk, akkor a hpotézst valószíűség szte elfogadjuk. Ha az ellehpotézs például az egyoldal ' H : m m alteratíva, akkor egyoldal próbát ( *, végzük, ameybe azo egyoldal t, ) krtkus tartomáyt vezetjük be, melyre P ( t t *) (vö. () formula)., Példák ) Függetle talajmták oldható trogé kocetrácójára összese 4, függetleül kválasztott területe két dőszakba a következő mérés eredméyek adódtak (Sváb 98, 59. oldal):. dőszak (x),,7,,4,6,8. dőszak (y),6,3,9,6,7,,8,9. Feltételezzük, hogy az egyes dőszakokba a kocetrácó közelítőe ormáls eloszlású v.v.-k közel azoos szórásokkal. Vzsgáljuk meg a trogé kocetrácó két dőszakra voatkozó várható értékéek azoosságára voatkozó ullhpotézst ( H : m x m y ) kétmtás t-próbával, 99 -os valószíűség szte. Ellehpotézs legye: H : m x m y. Megoldás Az adott kétoldal ellehpotézsre való tektettel kétoldal próbát végzük. Eek megfelelőe az elfogadás tartomáy a következő: A II. táblázat szert az x y paraméterérték mellett a krtkus t-érték: t,, = 3,55. Az elfogadás tartomáy: (-3,55, 3,55). A t ' próbastatsztkára voatkozó számítás részeredméye (vö. * (6) formula): x =,783, y =,, 5 mss (,,783)... (,8,783),48, x 65

68,783, =,869, ezért t ',87. Utóbb az elfogadás 4,48,869 * 7 mss y tartomáyba esk, ezért a ullhpotézst elfogadjuk (em vetjük el). ) Egy kísérletbe a Dapha logspa rákfaj ( vízbolha ) két populácójáak apokba mért varérettség korát vzsgálták. Az eredméyt a. táblázat tartalmazza (Izsák Juhász- Nagy Varga 98, 67. oldal). Vzsgáladó -,95-os valószíűség szte kétoldal kétmtás t-próbával azo hpotézs, hogy az varérettség korak, mt v.v.-ak a várható értéke a két populácóba azoos (ellehpotézs: H : H em áll fe ). A két populácóbel varérettség kort korább vzsgálat alapjá közelítőleg ormáls eloszlásúak tektjük. A szórások azoosságára voatkozó hpotézs F-próbával vzsgálva (ld. 3..4.) megfelelő valószíűség szte elfogadhatóak bzoyult (a táblázatbel adatok sem látszaak eek elletmoda). x y ( x x) ( y y) 7, 8,8,986,5447 7, 7,5,74,33 9, 7,7,554,4 7, 7,6,986,8 7,3 7,4,458,47 7, 6,7,986,7347 7,5 7,,,76 5,6 5,9 3,86,457. táblázat. A két első oszlopba két csoportbel Dapha egyedek x, lletve y varérettség kora, a tovább oszlopokba részletszámítások Megoldás Mdeekelőtt ez esetbe s az -,95-os valószíűség szthez tartozó elfogadás tartomáyt határozzuk meg. Ez a II. táblázat szert az = Y - = 7+7-= paraméter 66

érték mellett kétoldal próba esetére t,79. A próbastatsztkára voatkozó számítás,,5 * * részeredméye: x 7,54, y 7,557, mss,548, mss, 495. A t megfgyelés értéke: -,9. Mthogy utóbb abszolút értéke a krtkus értékél ksebb, a hpotézst a H ellehpotézssel szembe,95-os valószíűség szte elfogadjuk. Y 3..3. Welch-próba vagy d-próba A kétmtás t-próba esetébe feltételeztük a ormáls eloszlású és Y v.v. szórásáak azoosságát vagy közelségét. Ha utóbbt em tehetjük meg, akkor a várható értékek azoosságára voatkozó H : m m hpotézst vzsgálhatjuk D próbastatsztka alapjá Y (Welch próba, d-próba). (A ormaltás feálltát em kell szgorúa ve; ez a próba s robusztus.) A D-re voatkozó d megfgyelés az megfgyelések alapjá a következő: x, x,, és y, y,, y függetle Y x x y d :, mss / mss / Y Y ahol és Y a két mta elemszáma, x és y a két mtaátlag, mss, lletve mss Y a két tapasztalat átlagos eltérés égyzetösszeg. A (kétoldal) ellehpotézs legye most s H : m m Y, más szóval: H em áll fe. Utóbbra tektettel most s kétoldal próbát alkalmazuk. Ameybe és kellőe agy, akkor a D v.v. H feállása eseté közelítőe t-eloszlású f paraméterrel, ahol ( mss / mss Y / Y ) f. (7) ( mss / ) ( mss Y / Y ) Y Eze alapul az adott valószíűség szthez tartozó kétoldal krtkus t érték (egybe krtkus d érték) meghatározása a krtkus értékeket tartalmazó t-táblázat (II. táblázat) segítségével. 67

Ameybe és Y kellőe agy, akkor f s agy és így a t f próbastatsztka a H ullhpotézs feállása eseté közelítőe stadard ormáls eloszlású és ekkor a krtkus értékek egyszerűbbe határozhatók meg, ld. helyett -ra áttérve. u p meghatározását a (3) formula alapjá, p Megjegyzés: Ameybe egy próbastatsztka eloszlása akkor aszmptotkus próbáról beszélük. mellett tart egy hvatkozott eloszláshoz, Példa A glutamsav vzelet kocetrácó átlagáak (várható értékéek) csmpázok és gorllák körébe való azoosságára voatkozó hpotézst vzsgáljuk, 9 szgfkaca szt mellett. Mthogy a következő, 3..4. potba tárgyalásra kerülő F-próba szert, korább vzsgálat alapjá a két mta szórásáak azoosságára voatkozó hpotézst,99-os valószíűség szte el kell vetük (ld. a 3..4. potbel ) példát), a kocetrácók azoosságára voatkozó ullhpotézs elleőrzésére a kétmtás t-próba em alkalmazható. Legye a (kétoldal) ellehpotézs tt s mt fetebb több alkalommal H o tagadása. Megoldás Alkalmazzuk d-próbát,, 9 -os valószíűség szt mellett. A voatkozó eloszlás paraméteréek meghatározásához szükséges részadatok (ld. az említett példát): mss 37, 6, x,5, y,5, Y (,7 36)/37,4, mss (,45)/6,333. A közelítőleges paraméter érték a (7) formula alapjá: Y (,4 / 37,333 / 6) f 5,6 5. (,4 / 37) (,333 / 6) 36 5 68

A t-táblázatból (II. táblázat) kolvasható, hogy az adott szte a kétoldal próbához tartozó krtkus érték t, 5. Másrészt a próbastatsztka értéke: 5,,,5,5 d= -,993.,4,333 37 6 Utóbb abszolút értéke a krtkus értékél agyobb, ezért a kocetrácók átlagáak azoosságára voatkozó hpotézst,9-os valószíűség szte elvetjük. 3..4. F-próba Statsztka vzsgálatok agy tartomáya azoos szórásúak feltételezhető ormáls eloszlású v.v.-k várható értékeek azoosságára ráyul (ld. ANOVA, 3..6. pot). Ezért fotos kérdés az említett v.v.-k szórásáak azoosságára voatkozó hpotézs(ek) vzsgálata. Legyeek adottak a ormáls eloszlású és függetle és Y v.v.-k. Várható értékek, továbbá σ = D és σ Y = DY szórásak em smertek. Döte kíváuk valószíűség szte a H : σ = σ Y hpotézs felől. Ellehpotézskét a kétoldal H : Y hpotézst választjuk, más esetekbe az egyoldal ' '' H : (vagy H : Y ) hpotézst. Y Ismeretes, hogy a ullhpotézs teljesülése eseté az * MSS F = * MSS próbastatsztka eloszlása, Y paraméterű F-eloszlású, ahol Y és Y a két mtaelemszám (részleteket ld. Vcze, 975, 5. oldal). (Hely érvéyességgel haszáljuk az F jelölést a próbastatsztkára.) Az előzőekhez képest boyolultabb a krtkus- vagy elutasítás tartomáyok kérdése, mert az F próbastatsztka sűrűségfüggvéye em szmmetrkus (vö. 5. ábra). 69

5. ábra. Adott paraméterű F próbastatsztka sűrűségfüggvéyéek grafkoja az valószíűség szthez tartozó a és a (=/ a ) krtkus érték feltütetésével Ayt tarthatuk meg az előzőekbe követett gyakorlatból, hogy meglehetőse kézefekvő módo és persze az valószíűség sztek megfelelőe olya a és a krtkus értékeket aduk meg az elfogadás tartomáy (tervallum) határakét (a paraméterek és a valószíűség szt jelölését egyszerűség kedvéért tt mellőzzük), hogy a sűrűségfüggvéy grafkoja alatt, a -től balra lévő terület agysága megegyezze az a -től jobbra lévő terület agyságával (vö. 5. ábra): P F a ) P ( a F) /. ( Végül s a hpotézs valószíűség szte törtéő vzsgálatakor tulajdoképpe azt vzsgáljuk, hogy az F v.v. ra voatkozó f : mss mss * * Y megfgyelés az ( a, a ) elfogadás tartomáyba esk-e. A szakrodalomból azoba smeretes, hogy törtéetese feáll: a / a (egybe a a matt a a ). Ezek * mss szert az * mss Y * mss ksebb, mt a vagy agyobb, mt a eseméy azoos az * mss Y -ek és recprokáak maxmuma agyobb, mt a eseméyel. Ebből következk, hogy az 7

utóbb eseméy valószíűsége. Tehát a dötés stratéga az eredet kétoldal hpotézs vzsgálatakor a következő egyoldal próbá alapulhat. Tegyük fel, hogy a két háyados közül az -él agyobb meghaladja a táblázatba közölt, egyoldal F * f, f, krtkus értéket, ahol számlálójához, lletve evezőjéhez tartozó paraméter. Ekkor a Y valószíűség szthez tartozó f, lletve f az -él agyobb háyados H : hpotézst a H : ellehpotézssel szembe az aktuálsa egyoldal próba keretébe valószíűség szte elvetjük, külöbe elfogadjuk. Az * f, f, F krtkus értéket megfelelő táblázatból kereshetjük k (III. táblázat). Ha például f, f 7, akkor =,5-os szte a krtkus érték F 5, 7,, 5=3,97. Egyoldal próba esetébe, ha a valószíűség szt H : ' ' Y, az ellehpotézs Y 5 és a ullhpotézs például H :, akkor a következőképpe szokás eljár. Y Ha * * mss áll fe, akkor Y mss ' H -t eleve elvetjük és ' H et elfogadjuk. Ha vszot mss mss áll fe, akkor * * Y ' H -t elfogadjuk, ameybe az mss mss tört meghaladja * * Y / (!) a III. táblázatbel F * f f krtkus értéket, ahol az f, lletve f paraméter Y-hoz, lletve -hez tartozk.,, Az F-próba messze em robusztus próba, azaz a ormálstól jeletőse eltérő eloszlások eseté em alkalmazható. Példák ) azoos életkorú őstéy és 8 hím csótáy egyedet (, lletve Y csoport) táplálékmegvoásak vetettek alá, megfgyelve az egyedek (apokba mért) x, lletve y túlélés dejét. A túlélés dőtartam átlaga x 8, 5, lletve y =4,8. A őstéyekre voatkozó megfgyelések alapjá a korrgált tapasztalat szóráségyzet * mss x =3,6, a hímek esetébe ez az adat * mss y =,9. Feltételezve korább vzsgálat alapjá az egyedek túlélés dejéek eme belül ormáls eloszlását (!), végezzük próbát a szórások azoosságára voatkozó H : x y kétoldal ellehpotézs mellett.,95-os valószíűség szte kétoldal F- H : x y ullhpotézs elleőrzésére, a 7

Megoldás A krtkus értéket attól függőe állapítjuk meg, hogy * * mss y / mss x vagy * * mss x / mss y áll-e fe. Utóbbról lévé szó, az f, f paraméterpáros (9, 7). Az ehhez tartozó krtkus x y érték kétoldal próba és -,95 esetébe F * 9, 7,, 5 =3,68 (ld. III. táblázat). A próbastatsztka megfgyelt értéke 3,6/,9=4,. Utóbb meghaladja a 3,68 krtkus értéket. Eek megfelelőe a szórások azoosságára voatkozó ullhpotézst az adott,95-os valószíűség szte elutasítjuk. Ha a ullhpotézs, lletve ellehpotézs H :, H : ' ' x y y x vola, akkor * * mss matt y mss x ' H -t eleve elveték, ' H -t elfogadák. Vszot a '' '' H :, H : hpotézspár esetébe ugyaeze valószíűség szte, y x x y mthogy * * * y mss y mss x és * mss x mss =4,>3,68, a H hpotézst elfogadjuk. '' ) Két főemlős faj (gorlla és csmpáz) esetébe a vzelet glutamsav kocetrácójáak (x, lletve y) vzsgálatakor a következő eredméyeket kapták: csmpáz gorlla mtaelemszám, (egyedszám), x =37 y =6 korrgált tapasztalat szóráségyzet, mss* * mss x =,7 * mss y =,4. Feltételezzük az egyedekét kocetrácók fajoko belül ormáls eloszlását. Vzsgáljuk kétoldal F-próbával a fajoko belül szórások azoosságára voatkozó ullhpotézst - =,99-os valószíűség szte, a H : x y ellehpotézssel szembe. Megoldás 7

A krtkus érték az (5, 36) paraméter-párál keresedő. A III. Táblázat szert F * 5, 36,, = 3,6. Az F próbastatsztkára voatkozó megfgyelés: f =,4/,7=,589. Utóbb a 3,6 krtkus értékél agyobb, ezért a szórások azoosságára voatkozó ullhpotézst,99-os valószíűség szte elutasítjuk. 3..5. Bartlett-próba Azo ullhpotézs vzsgálatával foglalkozuk, mely szert k számú,, ormáls eloszlású v.v. szórása azoos. Eek megállapítására szükség va például az ú. szórásvzsgálatot megelőzőe (ld. 3..6. pot). Vagys a ullhpotézs: k H : D( ) D( ). k Az ellehpotézs például: H : H em áll fe lehet. Legyeek az egyes v.v.-kra voatkozó függetle mták elemszáma,,, ezek összegét k jelöljük -el. A korrgált átlagos eltéréségyzet összeg v.v. jelölése legye MSS. * *,, MSS k Vezessük be az SS *' v.v.-t a következők szert: Legye továbbá f :, f : f. k * SS*' : ( ) MSS ). k k Ismeretes, hogy a c : 3( k ) k f f jelöléssel a,36 K : (( k)log c SS*' k * ( )log MSS ) 73

v.v. H feállása eseté közelítőleg khí-égyzet eloszlású k- paraméterrel. (A közelítés akkor elfogadható, ha 4,,, k.) Az (egyoldal) próbát a K próbastatsztka kszámítását követőe valószíűség szte úgy hajtjuk végre, hogy megállapítjuk, feáll-e a megfgyelésre k * k, olvashatjuk k és melyet a K -re voatkozó, ahol utóbb egyoldal krtkus értéket a IV. táblázatból k * P ( k k, ) összefüggés defál, ahol k a k- paraméterű khí-égyzet eloszlás jele. (Lásd majd a 3... potot s azzal kapcsolatba, hogy em egyoldal próba esetébe s szokás egyoldal krtkus tartomáyt bevezet.) Egyébkét *, k a khí-égyzet eloszlással kapcsolatba gyakra előforduló krtkus érték, ld. a khí-égyzet próbáál a 3... potba. Ameybe * k k, feáll, akkor a ullhpotézst elfogadjuk, ellekező esetbe elvetjük. A Bartlett-próba em robusztus, így csak jó közelítéssel ormáls eloszlású v.v.-k esetére ajálható. Példa Ötféle, emesítéssel előállított búzafajta bzoyos meység smérvét regsztrálták, számú kísérlet parcellába. Az egyes parcellákra voatkozó smérv egy,, 5 korább vzsgálat alapjá jó közelítéssel ormáls eloszlása feltételezhető. A parcellák számát és az adott fajtához tartozó parcellák adataak eltéréségyzetet a. táblázat. és 3. oszlopába láthatjuk. Vzsgáljuk Bartlett-próbával a fajtákét szórások azoosságára voatkozó ullhpotézst - =,95-os valószíűség szte. 74

* eltérés- mss ( ss /( )) / f * ( ) log mss égyzet, ss 6 3,,54,8,666 7 8,,4,9,65 3 4 9,,74-5,,56 4 38 8,5,77-4,9,7 5 9 33,,84 4,79,555 ----- ------ ------ ---------- 3 3, -,7,374. táblázat. A parcellákra voatkozó adatok és a Bartlett-próba elvégzéséhez szükséges számolás részeredméyek Megoldás * Mthogy, 95 és k-=4, a krtkus érték, ld. IV. táblázat, 9, 49. 4,,5 A próbastatsztka kszámítására voatkozó részeredméyek: f=5, ss *' 3 /3,54, c=+ (,37/5), 9, 3 4 K,36 (5 log,9,54 (,7)) 3,5. Utóbb a krtkus értékél ksebb, ezért a szórások azoosságára voatkozó ullhpotézst elfogadjuk.,95-os valószíűség szte 3..6. Szórásvzsgálat (varacaaalízs, ANOVA: aalyss of varace) Bevezetés A 3... potba tárgyaltuk a kétmtás t-próbát. A ullhpotézs a két azoos szórásúak feltételezett ormáls eloszlású v.v. várható értékéek egyelősége volt. Eze kérdéskör kterjesztett változataval foglalkozk a szórásvzsgálat, másképpe szóráselemzés, varacaaalízs. Klasszkus esetbe tt s csupá ormáls eloszlású és azoos szórású v.v.- 75

kal foglalkozuk (a szórás általába em smert). Azoba eze erős korlátozás mellett s agyo széles körű a szórásvzsgálat (ANOVA) haszálata, elsősorba a mezőgazdaság hatásvzsgálat területé (Haros és Ladáy 5, 5. fejezet) de számos más területe s, ld. például Vargha, 3-6. fejezet. 3..6.. Egyszempotú szórásvzsgálat A kocepcoáls háttér a következő. A vzsgálatra kválasztott egyedek csoportja más és más hatáso vagy kezelése estek át. Hagsúlyozadó, hogy a csoportokét kezeléseket em feltétleül valamely meység smérv eltérő értéke, sztje külöböztet meg, mt például eltérő dózssztek, stb.; erről az esetről alább a Kovaracaaalízs című potba emlékezük meg rövde. Azt vzsgáljuk, hogy a külöböző kezelésekek eltérő hatása va-e bzoyos, az egyedeke mérhető meység smérvre. Példakét tektsük a következő esetet. Tegyük fel, hogy tíz, külöböző éghajlat adottságú területről származó, azoos geetka hátterű búzafajtát vetettek egy kísérlet telep tíz parcellájába, több éve keresztül. Vzsgáljuk a vetőmag eredetéek esetleges hatását a termésátlagra. Potosabba arra voatkozóa fogalmazuk meg hpotézst, hogy a parcella szert lokalzácó (vö. hatás vagy kezelések ) em befolyásolja-e léyegese a termésátlagot. A statsztka elemzés tutív háttere: Ha a magok eredetéből származó varabltás ksmértékű az erededő, rögzített származás helye s fellépő varabltáshoz képest, akkor az eredetek a termésmeységre voatkozó hatása em számottevő (vö. a kétmtás t-próbáál leírt okfejtéssel). Az ellehpotézs a következő lehet: Az eredet jeletőse befolyásolja a terméseredméyt. Ezt a hpotézst gazolhatja, ha az eredetre vsszavezethető varabltás a teljes varabltásak ge agy háyadát képez. Mt majd látjuk, az smertetedő statsztka vzsgálat sorá a bevezetett v.v.-k ormáls eloszlását feltételez kell. Mdeekelőtt jelöléseket vezetük be. A csoportok száma legye h. Az -edk csoportra voatkozóa () számú megfgyelést végzük. Az egyes megfgyelések jelölése x ( ),, x ( ) l,, x ( ) ( ), =,,h. Az összes megfgyelések száma: ( ) ( h). 76

A csoporto belül megfgyelések tekthetők az () v.v. ra voatkozó () számú függetle megfgyelések, vagy - talá alkalmasabb megközelítéskét bzoyos függetle és azoos eloszlású, v.v.-ra voatkozó egy-egy megfgyelések. Az csoportbel átlag ( ), ( ) l v.v.-ak a jelölése voatkozó v.v.: (), az erre voatkozó megfgyelés () x. A teljes átlagra vagy főátlagra h ( ) l ( ) l / ; az erre voatkozó megfgyelés x x h ( ) l ( ) l /. A teljes eltéréségyzet összeg: SS total h ( ) ( ) : SS : ( ). t l l Tektsük most egyrészt az ú. külső eltéréségyzet összeg v.v.-t, mt a csoportátlagokak és a főátlagak a csoport elemszámával súlyozott eltéréségyzet összegét: SS külső h ( ) ( ) : SS : ( ). (8) k Legye a csoportoko belül, belső vagy rezduáls eltéréségyzet összeg, mt a csoporto belül v.v.-kak és a csoportátlag v.v.-ak az eltéréségyzet összege: SS resdual h ( ) ( ) ( ) : SS : ( ). (9) r l l Az SS k és SS r v.v.-kra voatkozó ss k és ss r megfgyelések képletéhez a korábbakhoz hasoló megállapodás szert úgy jutuk, hogy az változójeleket x-re cseréljük. A jelölések a továbbakba s ebbe a szellembe értedők. Megjegyzedő e poto, hogy elem algebra érveléssel bzoyíthatóa feáll a következő evezetes összefüggés, ú. szórásfelbotás: SS SS SS. () t k r 77

Eek az alább dézett Fsher Cochra tétel alkalmazhatóságával kapcsolatba va jeletősége (részletek mellőzésével, ld. Vcze 975, 65. oldal). Vsszatérve a modellre, a fetekbe beszéltük az elemezedő, az egyes egyedekre voatkozó () l meység v.v.-ról. A tárgyalásak megfelelő (leárs) modell: a ( ) ( ) ( ) l l, =,,h, l=,, (). () Itt () () a az -edk kezelés hatása, a tulajdoképpe v.v. pedg az l véletle hbatag, mely mde -re és l-re várható értékű, azoos szórású ormáls eloszlású v.v. (Vegyük észre, hogy az () () l v.v.-k l eloszlására tektettel ormáls eloszlásúak és azoos szórásúak, tehát olyaok, mt amelyekről az ANOVA alkalmazás feltételekét szóltuk (részletek mellőzésével)). A modellből adódóa: E( ( ) l ) ( ) ( ) E( ) a, =,,h. A ullhpotézs: H : a () ( h) a, vagys a ullhpotézs szert a kezelések hatása azoos (vagy ha éppe az egyk kezelés a em-kezelés, akkor a kezelésekek cs hatása). Ellehpotézskét tt és a továbbakba - legegyszerűbb esetkét - a H : H em áll fe kétoldal hpotézst választjuk. A ullhpotézs vzsgálata Képezzük az összegezedő tagok számából származtatható, paraméterek tekthető h- és -h számokkal való osztással yerhető varaca jellegű 78

SSk MSSk : és h MSS r : SS r h v.v.-kat. Egy, a varacaaalízsbe közpot jeletőségű tétel, a Fsher Cochra tétel alapjá (Vcze 975, 6.. pot) belátható, hogy az MSS MSS k r () háyados (h-, -h) paraméterű F-eloszlású v.v., ha a H hpotézs gaz. Ez lehetővé tesz a ullhpotézsek a 3..4. potba leírtak szert, kétoldal F-próbával törtéő vzsgálatát. Vagys tektsük MSSk -ra és ss r /( k) megfgyelést, és próbastatsztkakét az vessük össsze a megfelelő paraméterű (!) F-eloszlás MSS r -re voatkozóa az ss k /( h ), lletve mss mss k r és mss mss r k háyados maxmumát valószíűség szthez tartozó krtkus értékével. Ameybe a H hpotézs elvetése mellett foglaluk állást, akkor tűzhetük k az () a várható értékekre voatkozó becslésvzsgálatot. Megjegyzedő, hogy az egyszempotú szórásvzsgálat két csoport és a fetebb ullhpotézs eseté ekvvales a kétmtás t-próbával. Hasoló modellre voatkozk, de ragszámoko alapul, tehát ordáls skálá mért v.v.-kra s alkalmazható a 4.3. potba tárgyalt Kruskal-Walls próba. Példa Legyeek smertek a 3..5. potbel példába szereplő adatokhoz hasoló következő mérés eredméyek, megfgyelések:. csoport 4, 3,, 3,3 4,7. csoport 5,3,9 6,4 4,8 3. csoport 5,3 3,7 7, 5,8 () = 5 () = 4 (3) =4 79

4. csoport 7, 6, 4, 6, 7, 7,3 5. csoport 8,3 9,5 7,4 6,8 7,7 7, 8, (4) =6 (5) =7 A teljes mtaelemszám tehát =6, a csoportok száma h=5. Tegyük fel, hogy egy korább vzsgálat eredméye alapjá elfogadjuk, hogy a modellel kapcsolatos elvárásak megfelelőe a csoportoko belül meység smérvekre voatkozó megfgyelések azoos szórású ormáls eloszlású v.v.-k realzácó. Kokréta, az csoportbel l-edk megfgyelésre (ld. () formula): ( ) l ( ) ( ) ( ) a l,,,5, l,, (3) A H ullhpotézs tehát az, hogy az a (), =,,5 csoporthatások azoosak. A ullhpotézst - =,95-os valószíűség szte vzsgáljuk. Az ellehpotézs legye H " H emáll fe". : Megoldás A krtkus értéket lletőe fetek szert meg kell állapítauk a kszámoladó mss mss k r maxmumát. Alább azt fogjuk lát, hogy mss mss k r mssr mss a maxmum. Ezért a (4, ) paraméterpár mellett megállapítjuk a,95-os valószíűség szthez tartozó (egyoldal) krtkus értéket, mely a III. táblázat szert,84. k és A próbastatsztka számítása: A () formula szert próbastatsztkára voatkozó megfgyelés: mss k mss r ssk /( h ). ss /( h) r Számítsuk k a külső eltéréségyzet összegre voatkozó megfgyelés értékét (vö. (8) formula): 8

ss k s ( ) ( x ( ) x) A részletszámítások eredméye: x 5,3/6 5,89, x () 3,44, x () 4,85, x (3) 5,475, x (4) 6,3, x (5) 7,857. Ekkor ss 5 (3,44 5,89) 7 (7,857 5,89) 6,99. Az k ss r meység, mt a csoportoko belül megfelelő eltéréségyzetek összege (vö. (9) formula): ss r 5 l ( x () l x () ) 4 l ( x () l x () 7 (5) (5) ) ( x x ) 4,3 4,937 8,73. l l Így a próbastatsztka értéke: mss k mss r ssk / 4,5, ss / r am tehát (ld. a fetebb utalást) valóba agyobb, mt saját recproka. Mthogy a próbastatsztka értéke meghaladja az F * 4,,, 5 =,84 krtkus értéket, a csoporthatások azoos voltára voatkozó ullhpotézst elutasítjuk. A továbbakba foglalkozhaták a csoporthatások becslésével., 95 valószíűség szte 3..6.a Leárs regresszó létezéséek elleőrzése egyszempotú szórásvzsgálattal Az egyszempotú szórásvzsgálat egyk klasszkus alkalmazása valamely feltételezett y=ax+b leárs regresszó háyára voatkozó, azaz a= hpotézs vzsgálata. Hagsúlyozadó, hogy a feltételezések köréből a emleárs regresszót eleve kzárjuk. Rövde smertetjük az 8

eljárást, melyet főkét az.5.. potbel. problémakör kapcsá és a változókra ott említett feltételeket elfogadva alkalmazak. Említést érdemel, hogy az. problémakör kapcsá szereplő x értékek a hpotézsvzsgálat sorá (egyszempotú) kezelés sztekkét foghatók fel, de tt agyságukat em vesszük fgyelembe. Tektsük az y ax ˆ bˆ llesztett regresszós egyeest, ahol tehát â -t és bˆ -t az x ) ( y, =,, potpárokhoz törtéő egyeesllesztéssel yertük. Az ˆx bˆ helyettesítés érték tehát ŷ (ld. 6. ábra). a 6. ábra. A leárs regresszóval kapcsolatos eltérések szemléltetése Ekkor köye elleőrzhetőe érvéyes a következő felbotás: vagys ( y y) ( yˆ y) ss total regresso ( y yˆ ), ss ss. resdual Tehát az ss total teljes eltérés égyzetösszeg előáll a regresszóra (az x sztekkel kapcsolatos hatásokra voatkozó) ss regresso és a leartástól való eltérésekre voatkozó sserror ss resdual égyzetösszeg összegekét (vö. a () formulával). Ekkor a szórásvzsgálat elvéek megfelelőe az 8

mss mss r e ss ss regresso resdual / /( ) megfgyelés egy (, -) paraméterű F-eloszlású v.v.-ra voatkozó realzácó akkor, ha a H : a= hpotézs gaz. Ellehpotézsek tekthetjük a H : " H em áll fe (a regresszós egyees meredeksége em ) hpotézst. Eek megfelelőe a hpotézst valamely előre meghatározott szte kétoldal F-próba keretébe elfogadjuk vagy elutasítjuk aszert, hogy a megfgyelés a megfelelő krtkus sztet em ér el, vagy meghaladja. Példa A.. pot egyk példájába potbecslést adtuk az y zomrágás dő rövdülés x adrealdózsra voatkozó leárs regresszójáak paraméterere. Az llesztett (becsült paraméterű) regresszós egyees egyelete: y ˆ,53 x 4,743. Hagsúlyozadó, hogy a feltételezések köréből a emleárs regresszót eleve kzárjuk. Vzsgáljuk szóráselemzéssel, 95 -os valószíűség szte a (valód) a paraméter - tól való eltéréséek szgfkacáját. A 4. táblázat szükséges megfgyelés adatat újra közöljük a 3. táblázat első két oszlopába. x y ŷ ( yˆ y) yˆ y ( 35 9 6,6 4,6 53,7 35-6,6 4,6 57,79 35-4 6,6 4,6 936,48 35 9 6,6 4,6 5,75 35 4 6,6 4,6 54,74 6 5,36 3,48,47 4 5,36 3,48 74,6 3 5,36 3,48 4,4 4 5,36 3,48,86 8 5,36 3,48 6,95-9 5,36 3,48 593,56 5,36 3,48 44,5 5 3,9 9,54 453,39 ) 83

5 5 3,9 9,54 388,37 5 5 3,9 9,54 349,95 5 3 3,9 9,54,67 5 3,9 9,54 86,36 5 44 3,9 9,54 6,47 48 57,84 959,4 96,88 55 57,84 959,4 8,8 55 57,84 959,4 8,8 8 57,84 959,4 536,5 4 57,84 959,4 38,37 9575 68 789,6 455,99 3. táblázat. Adatok és részletszámítások az adreal dózs ( g, x) és az zomrágás dő csökkeés (msec, y) között leárs regresszó szóráselemzéssel törtéő vzsgálatához Megoldás Előrebocsátjuk (ld. alább), hogy az mss mss regresso resdual háyados agyobb egyél (ld. alább), ezért az =,5-höz tartozó egyoldal krtkus érték a III. táblázat (, ) paraméterpárhoz tartozó pozícójába található és 4,3-del egyelő. A 3 megfgyelés eredméyéek átlaga: y = 68/3=6,87. A regresszós becslés szert ŷ értékeket a 3. táblázat 3. oszlopába, az egyes eltéréségyzeteket a 3. táblázat 4. és 5. oszlopába láthatjuk. A próbastatsztkára voatkozó megfgyelés: mss mss regresso resdual 789,6 4553,47 / 36,39. Mthogy a próbastatsztkára voatkozó megfgyelés meghaladja a krtkus értéket,,95-os valószíűség szte elutasítjuk az a együttható voltára voatkozó feltételezést, más szóval a leárs regresszó téye mellett foglaluk állást. 84

3..6.. Kétszempotú szórásvzsgálat A szórásvzsgálat vagy varacaaalízs számos tovább hpotézs vzsgálatára s alkalmas. Ezek közül említük egy, az egyszempotú szórásvzsgálat kterjesztéséek tekthető tovább vzsgálatot. A kapcsolódó hpotézsvzsgálat tt s mt szórásvzsgálat esetébe általába s - bzoyos modellkörre voatkozk, vö. a 3..6. pot Bevezetésével. Az egyszempotú modell kterjesztésekét most a hatásokak, kezelésekek az egyedekre ráyuló, két, külöböző természetű csoportját feltételezzük. Az egyk kezelés sztje megfelelhetek például egy agroóma vzsgálat sorá a csapadékmeység külöböző sztjeek, a másk kezelés sztje trogé-műtrágyázás külöböző mértékeek. Legyeek az első típusú csoportok az (=,,h) sorszámmal ellátva, a másk típusú csoportok a j(=,,m) sorszámmal. Az egyedek adott, j hatáspárak vaak ktéve. Eek megfelelőe, adott, j hatáspár esetébe az eek ktett l-edk egyede az, l,, v.v.-ra voatkozóa végzük egy megfgyelést. (Egyszerűbb tárgyalás (, j ) l g j kedvéért gyakra felteszk, hogy az (, j) csoporto belül esetszám, azaz megfgyelésszám mde, j párra ézve álladó: g j g.) A (leárs) modell: a b c, =,, h, j=,, m, l=,, g j. (4) (, j) ( ) ( j) (, j) (, j) l l Nemleárs regresszó eshetőségét tt s eleve kzárjuk. Itt tehát () a és ( j) b az első, lletve másodk kezeléscsoportbel determsztkus csoporthatást fejez k az, lletve j hatássztek esetébe, c (, j) pedg a két csoport kölcsöhatásából származó, szté determsztkus tag. A tulajdoképpe v.v., vagys az hbatag mde lehetséges -re, j-re és l-re várható értékű és azoos, általába smeretle szórású (, j ) l ormáls eloszlású v.v. Így az v.v.-k s megfelelek a 3..6. pot Bevezetésébe (, j ) l említett azo feltételek, hogy a vzsgált v.v.-k azoos szórásúak és ormáls eloszlásúak legyeek. (, j ) Az v.v.-ak a várható értéke a leárs modellek megfelelőe: l 85

E( (, j) l ) (, j) ( ) ( j) (, j) E( ) a b c, =,, h, j=,, m, l=,, j g. Ameybe kzárjuk a kölcsöhatások létezését, akkor a modellt kétszeres osztályozás kölcsöhatás élkül modellek, ellekező esetbe kétszeres osztályozás kölcsöhatással modellek evezzük. Megjegyzedő, a kölcsöhatás élkül modell s külöbözk az egyszeres osztályozással kapcsolatos modelltől, mert a kétszeres osztályozás eseté külö eltéréségyzet összeg szerepel az első, lletve a másodk kezelés csoportra ézve, és külö hpotézs voatkozk az első és a másodk csoportbel hatásokra. A továbbakba csak a kölcsöhatást em kzáró modell-változattal foglalkozuk. A kölcsöhatás vzsgálata A (4) formulába szereplő (, j ) c kölcsöhatások voltára voatkozó ullhpotézs: H : c,,, h, j,, (, j) m. Az ellehpotézs lehet H : " H em áll fe. Elem algebra úto bzoyítható a teljes eltéréségyzetre (megfgyelésre) voatkozóa a következő (emlékeztetük arra, hogy egyszerűség kedvéért feltételezhető az összes (, j) pár esetébe a megfgyelések azoos, g száma): ss t h m g h ( xjl x ) mg j l ( x x ) m + hg( x j x ) g j j h m ( x j x x j x ) h m g + j l ( x jl x j ), (5) 86

ahol most x a teljes mtaátlagot jelöl, x, x j, xj pedg a megfelelő csoportátlagokat. A (5) összegbel égy tagot redre ss, ss, ss3, ss4-gyel jelöljük. Megmutatható, hogy eze tagokak megfelelő v.v.-k redre h-, m-, (h-)(m-), hm(g-) paraméterrel redelkezek. Így a Fsher Cochra tétel alapjá (ld. fetebb) az ss /(( h )( m )) 3 ss /( hm( g )) 4 (6) megfgyelés az SS3 /(( h )( m )), SS /( hm( g )) 4 F-eloszlású (h-)(m-), hm(g-) paraméterű v.v. realzácója akkor, ha a ullhpotézs gaz. A III. táblázatból megállapítjuk valamely adott valószíűség szthez tartozó egyoldal krtkus értéket a 3..6. pot fetebb alpotjahoz hasolóa. Aszert, hogy ez az érték ksebb, vagy agyobb a krtkus értékél, a kölcsöhatások (mdegykéek) voltára voatkozó H hpotézst elfogadjuk, lletve elutasítjuk. A hpotézs elfogadása eseté (cseek kölcsöhatások) foglalkozhatuk a csoporthatásokra voatkozó a a a és a ( ) () ( ) Vcze 975, 6.3.3. pot). b b b hpotézsek vzsgálatával (vö. pl. ( ) () ( m) Példa (Vcze 975, 87. oldal) Vzsgálatot végeztek két hatásfajta h=4, lletve m=3 sztje mellett. Az egyes hatáspárok adott sztje mellett megfgyelésre került sor (g=). Az összes megfgyelések száma tehát =. A 4. táblázat többek között az (, j) hatáspár sztek mellett x j átlagokat tartalmazza. Foglalkozzuk az jl a b c ( ) ( j) (, j) (, j) l 87

modellel kapcsolatba a kölcsöhatásra voatkozó (, j) H : c, =,,3, j=,,3,4 hpotézs kérdésével, 95 -os valószíűség szte. Megoldás Határozzuk meg mdeekelőtt a krtkus értéket. Esetükbe (h-)(m-)=6 és hm(g- )=88. A krtkus értéket eek megfelelőe a III. táblázat =,5-ek megfelelő részébe, a 6. oszlopba, a "" sorba keressük, értéke,9. A (5) formulába szereplő meységek meghatározásához számítsuk k előbb az x j részátlagokat. A számolás eredméyét a 4. táblázat tartalmazza. x és a () a () a (3) a (4) B b () x,3 x,87 x3,5 x4,8 x,547 b () x,37 x,49 x3,67 x4,99 x,97 b (3) x 3,36 x3,354 x33,963 x34,6 x3,67 A x,879 x,57 x 3,565 x 4,869 x,47 4. táblázat. Részletszámítás eredméyek a kölcsöhatás vzsgálatához Am a B oszlopba, lletve az A sorba lévő átlagokat llet, vlágos például, hogy 88

l x l x, ezért az = mellett teljes sorösszeg ( x x x3 x4 ), amt a 4-as mtaelemszámmal osztva valóba x -hez jutuk. Hasolóa adódak az A oszlop és a B sor tovább eleme, valamt a táblázat jobb alsó sarkába álló x teljes átlag s. Ezekek a részeredméyekek az alapjá már köye kszámíthatjuk a (6) formulába szereplő ss 3 értéket. Ez esetükbe 9,. Az ss 4 égyzetösszeg értéke tovább számolással 9, / 6 9675,56-ak adódk. A (6) formulabel próbastatsztka értéke,88( ). 9675,56 / 88 Ez ksebb, mt a,9 krtkus érték. Így a kölcsöhatás háyára voatkozó hpotézst az adott szte elfogadjuk. Eze egyszerűsítő feltevés mellett most már foglalkozhaták a két hatásfajtára voatkozó leárs regresszó kérdésével. Ettől terjedelm okokból eltektük. 3..6.3. Kovaraca aalízs Az Egyszempotú szórásvzsgálat és a Kétszempotú szórásvzsgálat potokba megjegyeztük, hogy a csoportokat em feltétleül valamely meység smérv sztje jellemzk. Előfordulhat azoba lye eset s. Ekkor a sztek hatását, más szóval a kvattatív kísérő változó szerepét egy-egy csoporto vagy csoportpáro belül regresszós vzsgálattal elemezhetjük (ld. 3..6.a pot). Azoba a szórásvzsgálat kerete belül s sor kerülhet a kvattatív faktor hatásáak elemzésére az ú. kovaraca aalízs keretébe. A modell a legegyszerűbb esetbe, egy (kvaltatív) szempot és egy kísérő változó eseté a következő: (, j) ( ) b ax, j, j, =,,h, j=,, (), ahol x, az -edk hatás mellett j-edk kísérő változó érték (em v.v.!), a a regresszós j együttható,, j mde -re és j-re azoos szórású, várható értékű ormáls eloszlású v.v. és () b az -edk csoporthatás, =,, h. A csoporthatásokra és a-ra, b-re voatkozó hpotézsek: 89

H b : b () ( h)... b, H a : a. A H a hpotézs elleőrzése tt s törtéhet F-próbával, alkalmas krtkus értékek meghatározása alapjá. A megfgyelések alapjá lehetséges a pot). H a hpotézssel kapcsolatos dötés s (ld. 3..6.a. 3.. Nemparaméteres statsztka próbák A fetekbe olya próbákkal foglalkoztuk, melyek esetébe a hpotézs egy paraméteres eloszláscsalád (törtéetese a kétparaméteres ormáls eloszláscsalád) paraméterere voatkozott. A próbák ge széles körébe vszot a vzsgált v.v.-ról vagy v.v.-król em állítható, hogy az vagy azok ormáls eloszlásúak, esetleg expoecáls vagy Posso eloszlásúak, stb. Általáosabba, az eloszlásokak ge gyakra olya széles osztálya jö tektetbe (Vcze és Varbaova 993, 9. oldal), amelyek elemet em lehet véges sok paraméterrel meghatároz. Ilye például a folytoos eloszlások családja. Az s gyakor, hogy - a paraméteres problémákkal elletétbe a próba em s valamely paraméter értékére ráyul. Más próbák esetébe em s tuduk kjelöl kokrét eloszláscsaládot, mert cs kellő formácók a vzsgált v.v. vagy v.v.-k eloszlásáról. Mdeze esetekbe ú. emparaméteres problémákkal, próbákkal va dolguk. Ide soroluk éháy tovább, például az eloszlásfüggvéyek medájaak azoosságára voatkozó próbát s. A paraméteres és emparaméteres próbák köréek határa azoba em egyértelműek. 9

3... Khí-égyzet próbá alapuló hpotézsvzsgálatok Bevezetés Tektsük az A, valószíűsége p, p,, p (ekkor feáll p p p )., A, Ar teljes eseméyredszert. Legyeek az eseméyek (valóságos) r Végezzük az eseméyekre voatkozóa rögzített számú függetle megfgyelést. Következzék be az A eseméy f () alkalommal (f() v.v.), amkor s az f ( ), f (),, f ( r) r v.v.-kra f ( ) f () f ( r). Köye beláthatóa mde -re E( f ( )) p. Legye hogy az f az f() v.v.-ra voatkozó megfgyelés ( A,..., A cellagyakorságak, f f... f ). Azzal kapcsolatba, r kategórákat gyakra bzoyos cellákak tektk, r p -t gyakra elmélet f -t tapasztalat vagy megfgyelt cellagyakorságak evezk. Vezessük be az f() v.v.-kal kapcsolatba hely érvéyességű jelöléssel a ( f ( ) p r ) : p v.v.-t. Ismeretes, hogy utóbbak az eloszlása khí-égyzet eloszlás. Ekkor mellett aszmptotkusa r- paraméterű r ( f p ) p (7) az előbb v.v.-ra voatkozó megfgyelés, mely tehát kellőe agy -re közelítőleg khíégyzet eloszlásból származk, a paraméter r-. Másrészt legye az A eseméyek valamely hpotetkus (éspedg valóságos vagy a valóságtól eltérő) valószíűsége mde -re ' p. Erre voatkozk a ullhpotézs, azaz H. Ha most H gaz, akkor ' ' : P( A ) p,, P( A r ) pr mde -re ' p p és ekkor a (*) megfgyelés valóba az említett khí-égyzet eloszlású v.v.-ból származk. Másrészt feállhat, hogy ha a ' p hpotetkus valószíűségek s számú 9

paraméteréek ú. maxmum lkelhood becslésével yert pˆ becsléset alkalmazzuk (azaz p ˆ ' p ). Ekkor a fetebb v.v. mellett aszmptotkusa r--s paraméterű khíégyzet eloszlású. Az említett paraméter becslés például ormáls eloszlás eseté a várható értére ézve a mtaátlag, a szóráségyzetre ézve az mss átlagos eltéréségyzet, a Posso eloszlás esetébe a paraméterre ézve a mtaátlag, vö. Vcze 975, 4.7.. fejezet.) Megjegyzedő, hogy más, hasoló statsztkák s aszmptotkusa khí-égyzet eloszlásra vezetek, ld. például alább a homogetásvzsgálatál alkalmazott statsztkát. Léyegébe a feteke alapul a H : P( A ) p,,, r ullhpotézsre voatkozó,, valószíűség szte törtéő hpotézsvzsgálat. Ellehpotézs lehet H : " H em áll fe". Megjegyzés: A korábbaktól eltérő jele esetbe kétoldal és főképpe egyoldal értelme beszél. hpotézsről cs Először megállapítjuk az adott r- paraméterhez tartozó khí-égyzet eloszláshoz, lletve az valószíűség szthez tartozó (egyoldal) r s, krtkus értéket. Tehát tt em részletezhető okok matt - egyoldal khí-égyzet próbát szokás alkalmaz (bár em beszélük * egyoldal hpotézsről), azaz az elutasítás tartomáy az (, ) típusú tervallum. r s, A következőkbe a khí-égyzet krtkus értékek esetébe gyakor előfordulásuk matt a *-gal megjelöléstől eltektük. Ha cs szükség becslésre (pl. a ullhpotézs az, hogy a pézérme szabályos, akkor egyszerűe paraméter. ullhpotézsek veedő P(írás)=,5), akkor s=, ezért r- a megfelelő Másrészt megvzsgáljuk, hogy ha a ' p becsült érték az alább pˆ, akkor a r ' ( f p ) pˆ,,..., r ' p r ( f pˆ ) pˆ 9

megfgyelés értéke a krtkus értékél ksebb, vagy meghaladja azt. Az első esetbe a hpotézst ábra). valószíűség szte elfogadjuk, a másodk esetbe elutasítjuk (vö. 7. 7. ábra. Külöböző paraméterű khí-égyzet eloszlások sűrűségfüggvéyeek grafkoja és az =,95-os valószíűség szthez tartozó 3,84,,, 8,3, 3, 4,,5 krtkus értékek 5,,5,,5,,5 A cellagyakorságokra voatkozó megszorítások Abból adódóa, hogy a próbastatsztkáról csak agy mellett modható el, hogy aszmptotkusa khí-égyzet eloszlású, a megfgyelések számáak meglehetőse agyak kell lee. Jó közelítésre azoba agy mellett s csak akkor számíthatuk, ha mde elmélet cellagyakorság agyobb -él, vagy kevésbé szgorú feltételkét legalább 5-él (esetleg éháy esetbe lehet ksebb utóbbál). Még eyhébb feltétel, hogy az elmélet cellagyakorság legalább a cellák égyötöd részébe az 5 értéket haladja meg. Specálsa, ha a cellák száma égy, akkor mde elmélet cellagyakorság érje el az 5 értéket. Hasolóa gyakor másk elvárás, hogy a megfgyelt p f cellagyakorságok mdegyke érje el a értéket. Ameybe eze követelméyekhez legalább hozzávetőlegese - tarta kívájuk 93

magukat és azok em teljesülek eleve, akkor cellák összevoásával vagy a mtaelemszám övelésével (utóbb a taácsosabb) elérhetjük a követelméyek teljesülését. Mdeesetre az előbb követelméyek és kelégítésük módozata több tektetbe em állak egzakt alapo és em stadardzálhatók teljes mértékbe. A próba megfelelő alkalmazásához kíváatos bzoyos jártasság. A khí-égyzet próba az egyk leggyakrabba haszált emparaméteres próba. Változatos alkalmazás köreről a következőkbe lesz szó. 3... Illeszkedésvzsgálat Vzsgál kívájuk, hogy adott v.v. eloszlása megegyezk-e valamely adott F(x) eloszlással. (Bzoyos értelembe a 3... pot Bevezetésébe s lye esetről va szó.) A hpotézs tehát: H : P( x) F( x), x (, ). Az ellehpotézs lehet például H : P( x) F( x) valamely x-re (azaz H em érvéyes). Képezzük hpotetkus értékkészletére ézve r számú dszjukt meység osztályt úgy, hogy azok együttese teljes eseméyredszert alkosso. Az osztályok dszkrét eloszlás esetébe lehetek szóba jöhető értéke vagy ezek csoportja. Folytoos eloszlás esetébe a fetebb A, A,, A meység osztályokkét gyakra az egymáshoz csatlakozó (-, a ), r [a, a ), [a, a 3 ),, [a r-, a r- ), [a r-, + ) tervallumokat jelöljük k. Írható egyébkét [ a ( a a, ), helyett a, ), s, ha az osztópotokra em esk poztív valószíűséggel a szóba forgó v.v. értéke. Folytoos v.v. esetébe ez valóba feáll. A hpotetkus ' p ' értékek: p P( ), =,,, r. Rögzítsük a próba valószíűség sztjét, majd A keressük k a megfelelő táblázatból (IV. táblázat) a vagy r s,, r krtkus értéket aak megfelelőe, hogy az eloszlás paraméterét becsléssel yerjük, vagy posztuláljuk (becsléses, lletve tszta lleszkedésvzsgálat). Végezzük az v.v.-ra voatkozóa számú, x, x,, x függetle megfgyelést, fgyeljük meg az -edk kategórába esés f számát (megfgyelt cellagyakorságok). Ezt követőe határozzuk meg a voatkozóa a próbastatsztkára 94

r ( f p ' p ' ) megfgyelt értéket. Ha ez ksebb az (egyoldal) krtkus khí-égyzet értékél, akkor a H hpotézst valószíűség szte H elleébe elfogadjuk, ellekező esetbe elvetjük. A képletet vzsgálva megfgyelhetjük, hogy ha az megfgyelésszám k-re ő, akkor az öszeg s k-szorosára ő és kellőe agy k esetébe már meghaladhatja a ullhpotézs elutasításához szükséges krtkus értéket. Megjegyzedő, hogy tszta lleszkedésvzsgálatra alkalmas a 4.. potba smertetedő Kolmogorov-próba s. A vzsgáladó v.v. fktív értékekkel bíró, mőség v.v. s lehet, mt az alább két példa esetébe s. Példák ) Nem smerte szabályos pézérme szabályosságáak elleőrzése céljából dobás eredméyt fgyeltük meg. A fej dobások száma 8-ak adódott. Vzsgáljuk khí-égyzet próbával, 95-os valószíűség szte az érme szabályosságára voatkozó ullhpotézst. (Ajáljuk az Olvasóak, hogy a statsztka vzsgálatot megelőzőe, tutív alapo foglaljo állást a dobás eredméy alapjá a pézérme szabályosságát lletőe!) Megoldás A kategórák száma r= (fej írás), s= (vö. 3... pot Bevezetés). A szabályosságra voatkozó hpotézs szert ' p : P( írás )=P( fej )=/. A krtkus érték (ld. IV. táblázat) 3, 84. A próbastatsztkára voatkozó megfgyelés értéke:,,5 (8,5),5 (4,5),5 3,33. 95

Utóbb a krtkus értékél agyobb, ezért a szabályosságra voatkozó hpotézst az adott valószíűség szte elvetjük (elsőfajú hbát követve el). Megjegyzés: Az érme felderíthetetleül csekély szabálytalasága mellett adatak alapjá ugyaerre a következtetésre juták (szabályosság elutasítása), vszot ekkor utóbb következtetés helyes lee. ) Kocka szabályosságáak elleőrzésével kapcsolatba a dobás eredméyére voatkozóa megfgyelést végeztük (az,, 6 számokkal jelölve a kocka lapjat; tt a számok csak azoosításra szolgálak). A következő összesített eredméyt kaptuk ( a dobás eredméyre voatkozó v.v.): lap azoosító, : 3 4 5 6 P(=) (ha a kocka szabályos), ' p /6 /6 /6 /6 /6 /6 elmélet cellagyakorság, ' p megfgyelt cellagyakorság, f 4 5 5 9 5 Vzsgáljuk khí-égyzet próbával - =,99-os valószíűség szte, a kocka szabályosságára voatkozó ullhpotézst. Megoldás A kategórák száma r=6, s=. A krtkus érték: 5,. A próbastatsztka értéke: 5,, (/ (( 6) 4) 5 5 5 4) 4,8. Utóbb a krtkus értékél ksebb, ezért a kocka szabályosságára voatkozó hpotézst elfogadjuk. 96

Mt említettük, a khí-égyzet próba alkalmazásakor a p valószíűségeket gyakra az eloszlás s számú paraméteréek a mta alapjá yert becslését, éspedg maxmum lkelhood becslését haszáljuk (vö. a 3... pot Bevezetésébe modottakat). Ilye esetre látuk példát a következőkbe. 3) Egy botaka szempotból vzsgáladó területe véletleszerűe és egymástól függetleül kjelölt (tehát egymást akár átfedő) 47 azoos területű mtavétel égyzetbe (ú. mtakvadrátba) megszámolták egy övéyfaj egyedet. Az eredméyt a 5. táblázat. - 3. oszlopa tartalmazza. Elleőrzzük khí-égyzet próbával, 9 -os valószíűség szte a kvadrátbel egyedszám, mt v.v. alkalmas λ paraméter mellett Posso-eloszlására voatkozó H : p k e k! k H " H emáll fe". :, k,,, hpotézst! Ellehpotézs legye meység osztály, k megfgyelések száma, f f k ˆk e pˆ k! ˆ ( f 47 pˆ ) 47 pˆ 6,37,85 4 4,7,6 49 98,7,8 3 3 6,8,577 4 4 4 56,89,64 5 5 5 5,36,6 6 6 6,,33 7 7-7,3,79 Σ: 47 Σ:93 : Σ: χ = 5,68 5. táblázat. Adott számú övéyegyedet tartalmazó kvadrátok gyakorság sora 97

Megoldás Az osztályok (tt dszkrét meységek) száma: r = 8, a szükséges paraméter-becslések száma. A λ paramétert a mtaátlaggal becsüljük (s=, vö. 3... Bevezetés), amre az ad alapot, hogy Posso-eloszlás esetébe a λ paraméter egyelő a várható értékkel (ld. Valószíűségszámítás). Ismeretes, hogy utóbbak maxmum lkelhood becslése a mtaátlag. Ezért a kszámítadó χ próbastatsztka közelítőleg 8 = 6 paraméterű khí-égyzet eloszlású. Az =,9 valószíűség szthez tartozó krtkus érték,6 (ld. IV. táblázat). Ha tehát a próbastatsztka értéke utóbbál ksebb lesz, akkor a hpotézst elfogadjuk, ellekező esetbe a hpotézst elvetjük. A számítás részletet a 5. táblázat 4 6. oszlopa tartalmazzák. Az adatok alapjá a kvadrátbel átlagos egyedszám, 6,, egybe λ becslése:,99. Mthogy a próbastatsztka értéke 5,68 (ld. 5. Táblázat) ksebb,6-ál, így egyedszám Posso-eloszlású. =,9-os valószíűség szte elfogadjuk, hogy a kvadrátbel Oldjuk meg a feladatot a 3... pot Bevezetésébe szereplő Megjegyzésbe leírt azo követelméyekek s eleget téve, hogy a megfgyelt cellagyakorságok mdegyke elérje a értéket. Eek érdekébe összevojuk a 4. - 7. osztályt. Az összevot osztályhoz vagy cellához tartozó megfgyelt cellagyakorság: f 5 =. Az összevot cellára voatkozó ' ˆp 5 érték, mt az eredet ' ˆp 4, ' ˆp 5, ' ˆp 6 és ' ˆp 7 értékek összege:,4. Továbbá ( ' f 5-47 ' ˆp 5 ) /47 ˆp ' 5' =,857. χ megfgyelt értéke:,85 +.. +,577 +,857 = 4,57. A paraméter most 5, az =,9-os valószíűség szthez tartozó, 3 paraméter érték mellett krtkus érték a IV. táblázat szert 6,5, amél a 3,, próbastatsztka 4,57 értéke ksebb. Ezért a H hpotézst H elleébe így s elfogadjuk. 3... Normaltásvzsgálat Specáls esetkét vzsgáljuk azt a hpotézst 98 valószíűség szte, hogy az v.v. ormáls eloszlású. Végezzük egyrészt a folytoos v.v.-ra voatkozó x, x,, x függetle megfgyelést, másrészt soroljuk a megfgyeléseket r számú, a ), ( a, a),,( a r, ) tervallumba. Essék az osztályokba f, f,, f r számú ( megfgyelés (megfgyelt cellagyakorságok).

Számítsuk k a mta alapjá az x : mˆ mtaátlagot, mt az m várható érték becslését és a mss : = ˆ tapasztalat szórást (mdkét esetbe maxmum lkelhood becslésről va szó, vö. a 3... pot Bevezetésébe modottakat), így s=, öv. 3... Bevezetés. Ktérőkét megjegyezzük a következőt. Köyű belát, hogy ha egy Y v.v. ormáls eloszlású az mˆ és ˆ paraméterekkel, akkor az eze v.v.-ra voatkozó megfgyelés az - edk tervallumba a ˆ ˆ m a m pˆ ˆ ˆ valószíűséggel esk,,,, r. Ugyas a Φ stadard ormáls eloszlás két fetebb helyettesítés értékéek külöbsége aak valószíűsége, hogy (a - - mˆ )/ˆ (Y - mˆ )/ˆ < (a - mˆ )/ˆ, mely eseméy vszot az a - Y < a eseméyel ekvvales, vagys azzal, hogy Y az -edk tervallumba esk. Így már számolhatjuk a (becsült) elmélet cellagyakorságokat és meghatározhatjuk a próbastatsztkára voatkozó megfgyelést. Ha a valószíűség szt, akkor a krtkus (egyoldal) khí-égyzet érték 3, r, mert most a becsült paraméterek s száma. A ormaltásvzsgálatak egyébkét számos, az eloszlás sajátosságat fgyelembe vevő és így hatékoyabb módszere s létezk. Példa Egy felmérés alkalmával = 65 számú ő sportoló yugalm percekét pulzusszámát mérték. Az eredméyek függetle megfgyelésekek tekthetők. Az osztálygyakorságokkal megadott eredméyt a 6. táblázat 3. oszlopa tartalmazzák. Vzsgáljuk meg 99 =,95- os valószíűség szte a yugalm pulzusszám közel ormáls eloszlására voatkozó hpotézst. Megjegyzés: Csak közelítőe ormáls eloszlásról lehet szó, hsze a) a pulzusszám eleve csak poztív értéket vehet fel, ugyaakkor ormáls eloszlású v.v.-ra az < eseméy poztív

valószíűségű, b) a mért pulzusszám csak egész szám lehet, míg a ormáls eloszlás folytoos. A paraméterek becsléséek céljából az adott osztályba eső értékek mdegykét az osztályközéppel helyettesítsük. Másrészt első pllatásra kézefekvőek tűhet például a [6 65) gyakorság osztály esetébe a 6. táblázatbel 63,5 érték helyett 63-at választa osztályközépek, hsze eze osztályba gyakorlatlag csaks a 6, 63 és 64 értékek eshetek, mert a mért pulzusszám egész érték. Hasoló modható el a több osztályközépre s. Terjedelm okból em részletezett meggodolások azoba mégs a táblázatbel osztályközepek választását teszk célszerűvé. Megoldás Az osztályok száma r = 9, a szükséges paraméter-becslések száma (az m várható értéket és a σ szórást becsüljük). Ezért az alkalmazadó χ próbastatsztka közelítőleg 9 = 6 paraméterű khí-égyzet eloszlású. A,95 valószíűség szthez tartozó krtkus érték 6,,5 =,6 (ld. IV. táblázat). Ha tehát a próbastatsztka értéke,6-él ksebb lesz, akkor a hpotézst elfogadjuk, ellekező esetbe a hpotézst el fogjuk vet. Az mˆ x és ˆ mss maxmum lkelhood paraméterbecslésre voatkozó számítás részletet a 6. táblázat 4-6. oszlopa, a χ próbastatsztkára voatkozó érték kszámítására voatkozó részleteket pedg a 7. táblázat voatkozó oszlopa tartalmazzák.

gyakorság osztálygyakorság, osztályközép, f x f (x - 74,7) osztály, f x x o x [6 65) 3 63,5 9,5 377,7 [65 68) 6 66,5 399, 45,4 3 [68 7) 8 69,5 556, 8, 4 [7 74) 7,5 87, 59, 5 [74 77) 4 75,5 57, 8,5 6 [77 8) 78,5 785, 4,9 7 [8 83) 7 8,5 57,5 3,8 8 [83 86) 3 84,5 53,5 86,9 9 [86 89) 87,5 75, 36,7 Σ: 65 Σ: 4856,5 Σ: 47, 6. táblázat. Atléták yugalm pulzusszámára voatkozó statsztka A pˆ értékek kszámításához a Φ értékek táblázatát (az I. táblázatot) haszáltuk. Negatív z argumetum eseté a Φ(z) = Φ(-z) összefüggést alkalmaztuk (ld. Valószíűségszámítás). ~ m ˆ x 4856,5/ 65 74,7, ~ˆ 47 / 65 5,75; tt a ~ jel arra utal, hogy az eredet értékek helyett csak osztályközepekkel számolhatuk, am ém torzítással jár.

felső osztályhatár, x f traszformált felső osztályhatár, z = (x 74,7)/5,75 Φ(z ) p ( z ) ( z ) ˆ ( =,,, 8); z o = - ) 65 pˆ ( f 65 pˆ ) 65 pˆ 65 3 -,69,46,45,93, 68 6 -,7,,76 4,94,7 3 7 8 -,65,58,37 8,9,9 4 74 -,3,45,94,6,3 5 77 4,4,655,3 3,,49 6 8,9,8,66,79,58 7 83 7,44,95,4 6,76,9 8 86 3,96,975,5 3,5,9 9 89,48,993,8,7,589 χ =,74 7. táblázat. Normaltásvzsgálat részletszámítása. Eredet adatok a 6. táblázatba. A számított =,74 érték ksebb a 6,, 5 =,6 krtkus értékél, tehát a hpotézst =,95-os valószíűség szte elfogadjuk. (A megfgyelt cellagyakorságokra voatkozó követelméytől eltektettük, a (becsült) elmélet cellagyakorságokra voatkozó követelméyeket pedg (vö. 7. táblázat, oszlop) rugalmasa kezelve, cellaösszevoást em alkalmaztuk.) 65 pˆ 3...3. Függetleségvzsgálat Legye adott az és Y v.v. pár, mt az (, Y) valószíűség vektorváltozó tagja.. A próba esetébe a változópár bármely tagja tt s lehet mőség változó. Az és Y v.v. függetleségére voatkozóa kíváuk vzsgálatot végez. Jelöljük k vagy tektsük adottak a két v.v.-ra voatkozó A, A,, A r, lletve B, B,, B t teljes eseméyredszert a 3... pot bevezetésébe leírtak szert. A szokásos számértékű v.v.-k esetébe tt s gyakor, hogy a számegyeesek egymáshoz csatlakozó r számú, a ), ( a, a ),,(, ) tervallumra, lletve t számú ( a r

( b t, b ), ( b, b ),,(, ) tervallumra osztása szükséges és a megfgyelésekek eze tervallumokba esését tektjük az A, lletve B j eseméyekek. Tegyük fel, hogy ' P( A ) P( A ) p,,, r és P( Y B ) P( B ) p, j,, t. A két v.v., j j j, függetleségét az A, B j és B j A, =,,,r, j=,,,t eseméyekre leszűkítve, másképpe a p, p,, p, lletve r p valószíűségeloszlásra vezető ~, lletve ' ' ', p,, pt Y ~ v.v.-ra fogalmazzuk meg (!): H : P( A, Y B ) P( A ) P( Y B ) mde, j párra. j j Ellehpotézs legye tt s H : H em áll fe. Álljaak redelkezésre a függetle megfgyelésekre voatkozó (x, y ), =,,, meység vagy mőség adatpárok. Készítsük kotgecatáblázatot (ld. a 4.. potot s) azo esetek f j száma alapjá, melyekre ézve az -re voatkozó megfgyelés az A, az Y-ra voatkozó megfgyelés a B j eseméy bekövetkezésére vezetett, =,,, r, j=,,, t (8. r ábra); f j t j a megfgyelések száma. A A A 3 A4 B f f f3 f4 f B f f f3 f4 f B 3 f 3 f3 f33 f34 f 3 f f f 3 4 f 8. ábra. Kotgecatáblázat a megfgyelt cellagyakorságokkal és a peremgyakorságokkal, r=4, t=3. Az A, lletve B j eseméyek bekövetkezéséek számát jelöljük a megfelelő sorbel, lletve oszlopbel elemek összeadásával adódak: 3 f -tal, lletve f j -vel. Ezek

f f f f t, f j f j f j f rj, =,,, r, j=,,, t. Az f és az f j gyakorságokat peremgyakorságokak evezzük, vö... pot. Az f j gyakorságok a megfgyelt cellagyakorságok, az f f j / háyadosok H érvéyessége eseté a várható vagy becsült elmélet cellagyakorságok. Utóbb elevezést tt az dokolja, hogy ha H gaz, azaz és Y függetle, akkor az f P( A ), P( B j ) f j / / közelítésekre hagyatkozva, a P ( A, B j ) valószíűség a H hpotézs teljesülése eseté P(A ) P(B j ), vagys -szer függetle smétlést követőe a cellagyakorság várható értékéek becslése e j f f f f j j :, =,,, r, j=,,, t. Igazolható, hogy az és Y v.v.-k függetlesége eseté a r t ( f j j j f f f f j ) megfgyeléssel kapcsolatos v.v. mt próbastatsztka mellett aszmptotkusa (r )(t ) paraméterű khí-égyzet eloszlást követ. Am a paramétert llet, az eseméyek keresztosztályozása folytá r t számú kategóra adódk. (Másrészt a peremvalószíűségek becsléseek száma r-, lletve s-, fgyelembe véve, hogy az első esetbe például pr -t p p p matt már em kell becsül és hasoló modható el a p ' valószíűségekről. r A becslés tehát (r-) + (t-) számú paraméterre terjed k. Feáll, hogy rt- ((r-)+(t-))= (r-)(t-).) Eek alapjá törtéhet a krtkus érték kjelölése és a függetleségre voatkozó hpotézs elfogadása. Kokréta, kkeressük az (egyoldal) valószíűség szt eseté a megfelelő, IV. táblázatból ( r )( t), krtkus értéket, majd megállapítjuk, hogy eél 4

ksebb, vagy agyobb-e a próbastatsztka megfgyelt értéke. Előbb esetbe a H hpotézst valószíűség szte elfogadjuk, ellekező esetbe elvetjük. Kategorkus vagy mőség valószíűség változók eseté külööse gyakor az r =t = eset. A x -es kotgecatáblázat megfgyelt cellagyakorságat gyakra jelölk egyszerűe a, b, c, d-vel (9. ábra). B B A a b a + b A c d a + c b + d c + d 9. ábra. x -es kotgecatáblázat Ebbe az egyszerű esetbe a χ próbastatsztka megfgyelt értéke köye beláthatóa ( adbc) ( a b)( c d)( a c)( b d) (8) formába írható. A próbastatsztka paramétere ( )( ) =. A próba gyakorlat alkalmazásakor a cellagyakorságokra voatkozó óvatosság dokolt. Kokréta, deáls esetbe egyk elmélet cellagyakorság se legye ksebb 5-él. Példák ) Egy humá populácóra ézve feljegyezték 3 véletleszerűe és függetleül kválasztott személy hajszíét és emét. Az eredméy (8. táblázat) az (,Y)=(hajszí, szemszí) v.v.- párra voatkozó 3 függetle megfgyelés. Elleőrz kívájuk - =,95-os valószíűség szte azt a H hpotézsek tektett feltevést, hogy a hajszí függetle a emtől ( H : " H emáll fe" ). 5

fekete bara vörös szőke férf 3 43 9 6 ő 55 65 6 64 87 8 5 8 3 8. táblázat. A hajszí és a em között függetleség elemzésére szolgáló kotgeca táblázat Megoldás A próbastatsztka paramétere (4 )( ) = 3. A krtkus érték =,95-os valószíűség szte, 3 paraméter érték mellett, ld. IV. táblázat, 3,, 5=7,8. A számolás részletet a 9. táblázat tartalmazza. elmélet cellagyakorság, e j = f f j /3 f j e e j j ha Y= = = = 3 = 4 9, 36, 8,33 6,67,3,36,5 4,7 ha Y= = 58,,6 = 7,,68 = 3 6,67,3 = 4 53,33,3 Σ: 8,99 9. táblázat. Számolás részletek a hajszí és szemszí függetleségére voatkozó hpotézs vzsgálatához. Az eredet adatokat ld. a 8. táblázatba. 6

Mthogy a próbastatsztka megfgyelt 8,99 értéke agyobb a 7,8 krtkus értékél, a függetleség hpotézst az adott,95-os valószíűség szte elvetjük. Megjegyzés: Cellák összevoására em volt szükség; attól eltekthetük, hogy a megfgyelt cellagyakorságok egyke csak 9 (em ér el a -et). ) Egy betegség elle oltásra voatkozóa smeretesek a. táblázatba közölt esetszámok a peremgyakorságokkal. megbetegedések száma (+/-) + - + 5 44 49 oltás megtörtét (+/-) - 5 7 3 6 8. táblázat. Adatok az oltás és megbetegedés között kapcsolat vzsgálatához Elleőrzzük khí-égyzet próbával,99-os valószíűség szte az oltás és a megbetegedés hajlam függetleségére voatkozó ullhpotézst. (Teljesül a próba alkalmazhatóságával kapcsolatos fő krtérum, ameybe mde elmélet cellagyakorság meghaladja az 5-öt. Valóba, 49 /8=,5, 49 6/8=38,39, 3 /8=9,39, 3 6/8=,6.) Megoldás A krtkus érték (ld. IV. táblázat):,, =6,63. A (8) formuláak megfelelőe a próbastatsztkára voatkozó megfgyelés: 8 (5 7 44 5) 49 3 6 6,79. Utóbb meghaladja a krtkus értéket, ezért az oltás és megbetegedés függetleségére voatkozó hullhpotézst az előírt,99-os valószíűség szte elvetjük. 7

3) Egy övéyállomáy egyede kétféle betegség s megjelet. Súlyosságát tektve mdkettőt gyegéek, közepesek vagy erősek mősítjük. A betegségre voatkozó felmérés eredméyét a. táblázat tartalmazza. Vzsgál kívájuk,95-os valószíűség szte a két betegség súlyosság sztjéek függetleségére voatkozó ullhpotézst (Haros és Ladáy 5, 46. oldal).. betegség súlyossága. betegség gyege erős közepes összese gyege 34 8 4 76. betegség súlyossága erős 4 4 49 3 közepes 4 3 39. betegség összese 88 3. táblázat. Növéybetegségek súlyosságára voatkozó esetszámok Megoldás A krtkus érték, mthogy a két kategóraegyüttes elemszáma egyarát 3, az (r-)(t-)=4 paraméterrel,95-os szgfkaca sztre voatkozólag 4,,5 9, 49. A próbastatsztka számolásáak részletet a. táblázatba láthatjuk. megfgyelt elmélet fj fˆ ( j ) / fˆ j cellagyakorság, cellagyakorság, f j 34 5,33,97 8,9,83 4 8,37,67 4 37,67 4,96 4 33,5,4 fˆ j 8

4 37,,68 3 3,56, 39 4,44,4,96. táblázat. Khí-égyzet próba részletszámítása Mthogy a próbastatsztka értéke meghaladja a krtkus értéket, a betegségek súlyosságáak függetleségére voatkozó ullhpotézst,95-os valószíűség szte elvetjük. 3...4. Homogetásvzsgálat Azt a hpotézst vzsgáljuk, hogy adott és Y v.v. F(x), lletve G(x) eloszlása azoos-e: H : P( x) P( Y ), x (, ). x Ellehpotézs lehet: H em áll fe. Legye az -re és Y-ra voatkozó, lletve Y számú függetle megfgyelés alapjá a 3... pot Bevezetésébe említett A osztályba eső megfgyelések száma obs o,, : lletve o Y,, =,,,r. A kétféle várható vagy elmélet gyakorság az egyes osztályokba a H hpotézs teljesülése eseté : e ( o, oy,, lletve, ) e Y ( o, oy,, =,,,r, Y, ) hsze ekkor o, o Y és, ugyaazo eloszlású v.v.-ra voatkozó, együttese számú megfgyelés esetszáma. A próbastatsztka (megfgyelt) értéke: r ( o r, e, ) ( oy, ey, ) e e, Y,. 9

A próbastatsztka a ullhpotézs teljesülése eseté agy -re és m-re közelítőe khí-égyzet eloszlású, r paraméterrel. Eek alapjá az valószíűség szt megadását követőe a homogetás hpotézsre voatkozóa s khí-égyzet próbát alkalmazuk. Az (egyoldal) krtkus érték valószíűség szte, mt fetebb s,, r. Példa A 3. táblázat két csoportbel atléta yugalm percekét pulzusszámára voatkozó adatokat tartalmaz. gyakorság osztály. csoportbelek száma,. csoportbelek száma, f g [6 65) 4 3 [65 68) 8 6 3 [68 7) 8 8 4 [7 74) 5 [74 77) 4 6 [77 8) 7 [8 83) 6 7 8 [83 86) 3 9 [86 89) 3. táblázat. Percekét pulzusszámra voatkozó gyakorság sor. Végezzük homogetásvzsgálatot =,95-os valószíűség szte azo hpotézs elleőrzésére, hogy a két csoportbel pulzusszám azoos eloszlású v.v. Megoldás Először s a khí-égyzet próba alkalmazhatóságáak érdekébe összevojuk az első két osztályt, másrészt az utolsó három osztályt (tovább összevoásokat kompromsszumkét mellőzük, mert az összevoások a vzsgálat hatékoyságát rotják). Az összevot

cellagyakorságokat a 4. táblázatba láthatjuk. Megállapíthatjuk, hogy a kíváatos tulajdoságok most már teljesülek, ld. a táblázat első égy oszlopát. o, o Y, e, e, o, e, ) / e, ( ( o Y, ey, ) / ey, 9,8,9,3657,3376 8 8 7,68 8,3,33,3,56,44,97,74 4 3,833,769,8,9,84,775 8 9,6,4,667,46 :,843 :,778 4. táblázat. Adatok és számolás részletek a példához A próbastatsztka értéke,84,778,6. A IV. táblázatból a,95-os valószíűség szthez és r = 5 paraméterhez tartozó krtkus érték,. A próbastatsztka 5,,5 értékéél a, krtkus érték agyobb, ezért a homogetásra voatkozó hpotézst =,95-os valószíűség szte elfogadjuk. Megjegyzés: Vegyük észre, hogy a 3. táblázatba megadott meység osztályok mbelétéek smeretére em támaszkodtuk. Homogetásvzsgálatra alkalmas a megfgyelt értékek ragszáma alapuló, tehát ordáls skálá mérhető v.v.-kra s alkalmazható a 4.. potba tárgyaladó Ma Whtey-féle U- próba s.

3.3. Valószíűség változók eloszlására, lletve paraméterere voatkozó tovább statsztka próbák Fetebb a khí-égyzet próba alkalmazás lehetőségevel kapcsolatba felhívtuk a fgyelmet a cellagyakorságokra voatkozó elvárásokra és arra s, hogy a próbastatsztka csupá közelítőleg khí-égyzet eloszlású. Mdeek szerepe va abba, hogy az eloszlásokra voatkozó hpotézsek vzsgálatára más eljárások s haszálatosak. Ilyeeket smertetük a következőkbe. 3.3.. Kolmogorov-próba folytoos eloszlásfüggvéy és smert eloszlásfüggvéy azoosságáak elleőrzésére A próba egymtás Kolmogorov Szmrov próbakét s smeretes. szakrodalomba más próbákat s említeek Kolmogorov-próba éve. Másk oldalról, a A ullhpotézs, éppe úgy mt az lleszkedésvzsgálat esetébe: H : P(<x)=G(x), x (, ), azaz a hpotézsek megfelelőe az v.v.-ak G az eloszlásfüggvéye. Ellehpotézs lehet például H : H em áll fe. A (kétoldal) próba az F (x) tapasztalat eloszlásfüggvéy vzsgálatá alapul. (x) defícója, (ld. Valószíűségszámítás): F F az x él ksebb m tabel értékekszáma ( x) : x(, ).

3. ábra. Magyarázó vázlat a tapasztalat és elmélet oszlásfüggvéy eltéréséek számításához A kétoldal próba végrehajtása előtt rögzítsük egy - valószíűség sztet. Megfelelő táblázatból (V. táblázat) olvassuk k a D krtkus értéket. Jelöljük a redezett, mtaelemek övekvő sorozatát x -el. Állapítsuk meg az F x *) és G x *) * * *, x, x ( ( * * * * (=,,,) függvéyértékeket. Képezzük az összes F ( x ) G( x ) és F ( x ) G( x ) abszolút értéket ( G ) értéke -ek veedő), majd állapítsuk meg a két érték-sorozat -re voatkozó közös ( x * D maxmumát. (Ugyas a tapasztalat eloszlásfüggvéy szakadás helye kétféle külöbség fgyelembevétele szükséges, vö. 3. ábra.) Ha a D próbastatsztkára voatkozó megfgyelés értéke meghaladja az (egyoldal) krtkus értéket, akkor a H hpotézst elvetjük. (Ajálatos elvár, hogy a mtaelemszám a -at haladja meg.) Megjegyzés: Valamelyest változk a próba leírása, ha az eloszlásfüggvéyt jobbról folytoosak defáljuk. Példa Nyolc elemű mta alapjá arra a H ullhpotézsre keresük választ - =,95-os valószíűség szte, hogy egy adott mta származhat-e egy m= várható értékű, = 3

szórású ormáls eloszlású v.v.-ból. A yolc mtaelem övekvő sorredbe a 5. táblázat másodk oszlopába látható. x * F ( x 8 * ) G( x * ) F ( x 8 * ) G( x * ) F ( x 8 * ) G( x * ) 9,4,5 +,56 ++,69,5 9,9,5,4,,459 3,55,375,79,334,35 4,6,5,76,6,67 5,73,65,767,4,6 6,,75,84,9,5 7,6,875,855,,3 8 3,,,978, +++ 5. táblázat. Adatok és részletszámítások a Kolmogorov próbához. +:,5=/8, alatta /8, stb., ++: mert 9,4 (,59) (,59),56, stb., +++: mt,-,875 Megoldás A keresett maxmum mt a próbastatsztka értéke D 8, 584. Másrészt az V. táblázat szert D 8,,5*,457, am ksebb, mt a próbastatsztkaértéke. Ezért a ullhpotézst elvetjük. (A példa demostratív célt szolgál, így eltektettük attól, hogy a mtaelemszám a -at em haladja meg.) 3.3.. Ma Whtey-féle U- próba, másképpe Wlcoxo-féle ragszámösszeg próba A vzsgáladó H ullhpotézs: H : P( x) P( Y x), x(, ), 4

vagys két v.v. eloszlásáak azoossága. Ellehpotézs lehet például H " H em áll fe". Eze ellehpotézs mellett most s a próba kétoldal változatát : alkalmazzuk. A próba a fetebb próbával szembe ordáls skálá mért ( ragszám értékű ) v.v.-kra s alkalmazható, ameybe a két mta egyesítésével yert mtaelemek ragsorolása smert (ld. alább). Haszálhatóságáak széles köre mellett s kétértelmű a próba szakrodalm megítélése. A próba statsztka tulajdosága erőse függek a két v.v. bzoyos tulajdoságatól. Javítja például a haszálhatóságot, ha és Y medájáak esetleges eltérésé túlmeőe és Y főképpe csak abba külöbözk, hogy Y közelítőleg mtegy eltoltja -ek. A próba végrehajtása Legye az -re, lletve Y-ra voatkozó mtaelemszám, lletve Y. Legye a valószíűség szt -. Állapítsuk meg az - hoz és kétoldal próbához tartozó krtkus értékek táblázatából (VI. táblázat) az U krtkus értéket., Y, Legyeek az, lletve Y v.v. -ra voatkozó függetle mtaelemek x,. Képezzük az egyesített mta alapjá a mtaelemek, x,, x, y, y, y Y Y hosszúságú övekvő sorozatát. Összegezzük az egyk mta elemeek ragjat az egyesített sorozatba. Jelöljük a ragszámösszeget, mt v.v.-t, T -gyel. Képezzük a ragszámösszeget a másk mtára ézve s, és jelöljük azt T -vel. Jelöljük *-gal a agyobb T- értéket szolgáltató mta elemszámát. Legye T max a két ragszámösszeg maxmuma. Végül képezzük az * U Y * Tmax v.v.-t. (Köye belátható, hogy a jobboldal mde esetbe poztív.) Ha az U próbastatsztkára voatkozó u megfgyelés az adott valószíűség szt mellett U, ) elfogadás tervallumba esk, akkor az (, Y, eloszlások azoosságára voatkozó ullhpotézst az adott H ellehpotézssel szembe elfogadjuk, ellekező esetbe elutasítjuk. (Ha a mta elemszáma agyo kcs, akkor a próba agyfokú bzoytalasága matt a krtkus értékek táblázatából a megfelelő érték gyakra háyzk.) Kapcsolt ragok s haszálhatók. 5

Példa Détás és ormáls étrede tartott patkáyok esetébe vzsgálták a tumorkalakulásg (regsztrálásg) eltelt, apokba mért dőtartamot. A mérés eredméyek a 6. táblázatba láthatók. dőtartam (ap), dőtartam (ap), egyed sorszáma détás csoport kotroll csoport 99 68 6 3 8 3 4 5 4 8 5 5 5 9 6 63 7 7 6. táblázat. Patkáyok életkora tumor első regsztrálásakor Vzsgáljuk kétoldal Ma-Whtey-féle U-próbával - =,95-os valószíűség szte a két csoportra voatkozó véletle dőtartam azoos eloszlására voatkozó ullhpotézst. Megoldás A mtaelemszámok: 7, 5. A krtkus érték a VI. táblázat szert U 5. Y Írjuk fel az adatokat a ragok feltütetésével a következőképpe: 3 4 5 6 7 8 9 7, 5,,5 5 5 63 7 8 6 99 68 8 9 6

Megállapíthatjuk, hogy T 3574, T 37, T 4, * 7. max 7 Eek megfelelőe az U-ra voatkozó u megfgyelés: u 7 5 7 4. Utóbb meghaladja az 5 krtkus értéket, ezért az eloszlások azoosságára voatkozó ullhpotézst,95-os valószíűség szte az adott ellehpotézssel szembe elvetjük. Megjegyzés: Megállapíthatjuk, hogy a feladat ktűzéséhez és megoldásához elegedő lett vola az egyesített adathalmaz elemeek ragszám és csoporthoz tartozás szert smerete. 3.3.3. Kruskal Walls próba Ez a szté ragszámoko alapuló, tehát ordáls skálá mérhető v.v.-kra s alkalmazható próba két vagy több, em feltétleül ormáls eloszlású v.v. várható értékéek azoosságára ráyul, elsősorba a következő voatkozásba. Szerepelje a modellbe k számú populácó, melyek egyede egy-egy feltételezett, csoportokét azoos hatáso vagy kezelése estek át. Voatkozzék az -edk populácó j-edk egyedé megfgyelt meység smérvre az v.v., =,,,k, j=,,,. A modell szert, mely léyegébe hasoló az.5.. potbel leárs közelítés modellhez: j j, =,,, k, j=,,,, j ahol az -edk csoportbel kezelésből adódó csoporthatás vagy kezelés hatás, az folytoos v.v.-k, mt véletle hbatagok, függetleek és azoos eloszlásúak. Megjegyezzük, hogy jele próba esetébe az feltételezzük. j (vagy j ) v.v.-k ormáls eloszlását em A próba tehát azo H ullhpotézsre voatkozk, mely szert em létezk specfkus csoporthatás vagy kezelés hatás, azaz j H : k. 7

Az ellehpotézs lehet H : H em áll fe. A próba: Adjuk meg a próba valószíűség sztjét. Megfelelő táblázatból kkereshető az (,,,, k, ) paraméter-együttesek megfelelő h *,, k, (egyoldal) krtkus k,, k érték. Ha azoba a legksebb érték s kellőe agy, akkor a H próbastatsztka (ld. alább) közelítőleg k- paraméterű khí-égyzet eloszlású, tehát a krtkus érték ekkor a k, krtkus értékkel közelíthető. Az elfogadás tartomáy tehát a, h* ), lletve a (, (,,, k, k, k, ) tervallum. A H hpotézst akkor vetjük el, ha a H statsztkára voatkozó h megfgyelésre h <h, lletve. * k,,,, k, k, h A próbastatsztkát lletőe legye a teljes mtaelemszám =. Legye x j az j v.v.-ra voatkozó megfgyelés. A próbastatsztka a k R H : 3( ), ( ) k v.v., ahol R r j j, és az r j v.v. az összes, számú megfgyelés övekedőe redezett, egyesített sorozatába x j ragja. Kapcsolt ragok eseté h a megfelelő kapcsolt ragokkal számoladó. Példa Az j porérzékeységre, mt v.v.-ra végeztek megfgyeléseket a következő ( kezelés ) csoportokba: a) egészségesek, b) légút betegségbe szevedők, c) azbesztózsba szevedők. A megfgyeléseket a 7. táblázat tartalmazza. 8

j = = =3 (egészséges) (egyéb légút betegség) (asbestoss),9 3,8,8 3,,7 3,4 3,5 4, 3,7 4,6,4, 5 3,, 7. táblázat. Porérzékeység vzsgálat eredméye (Vcze és Varbaova 993, 7. oldal) Az alkalmazott modell szert a porérzékeység a következőképpe áll elő: j, j ahol tehát az -edk csoporthatás, az v.v.-k. A H ullhpotézs: a legye H " H emáll fe". : Vzsgáljuk a ullhpotézst j hbatagok pedg függetle és azoos eloszlású csoporthatások (=,,3) em külöbözek. Az ellehpotézs,9-os valószíűség szte. Megoldás Esetükbe k=3, =,,, 4. A krtkus értéket lletőe közelítéskét a 3 5 megfelelő krtkus értéket haszáljuk (vö. a fetebb modottakkal). Ez a IV. táblázat,, szert =4,6.,, A próbastatsztka kszámításához először s redezzük övekedőleg a megfgyelt értékeket: 9

,,,4,5,6,7,8,9 3, 3, 3,4 3,7 3,8 4, Az első csoportbel értékek ragjaak összege: R =4+5+8+9+=36. Hasolóa R =36, R 3 =33. A próbastatsztka megfgyelt értéke: 36 h 45 5 36 4 33 5 35,77. Mthogy utóbb ksebb a krtkus értékél, a három csoporthatás azoosságára voatkozó H hpotézst a H ellehpotézssel szembe az adott valószíűség szte elfogadjuk. A korrelácóra voatkozó tovább próbák Bológa elemzések sorá előforduló v.v.-k kapcsolatáak szgfkacája agyo gyakra vzsgálat tárgya. Számos statsztka módszert dolgoztak k erre a célra. Ordáls skálá mért, rag-értékű v.v.-k esetébe specáls módszerek alkalmazására kerül sor. Fetebb már foglalkoztuk a khí-égyzet próbá alapuló függetleségvzsgálattal. Tovább módszerekről szóluk rövde ebbe a potba s. 3.3.4. Az r leárs korrelácós együttható voltára voatkozó próba Gyakor feladat az (,Y) kétváltozós ormáls eloszlásra voatkozóa a H : r (, Y) r kétoldal ullhpotézs elleőrzése, például a H : r ellehpotézssel szembe. Fotos megjegyez, hogy a próba egybe a v.v.-kompoesek függetleségére voatkozó próba s, mert kétváltozós ormáls eloszlás esetébe az r korrelácós együttható volta és a v.v.-k függetlesége ekvvales (.4.. pot).

Az r-re voatkozó rˆ potbecslés, mt v.v., mely más oldalról r-re voatkozó megfgyelések tekthető: ( x x)( y y) r ˆ :, ( x x) ( y y) ahol x és y a két mtaátlag, mt az E(), lletve E(Y) várható érték becslése. Ismeretes, hogy a hely érvéyességű jelöléssel írt rˆ t : rˆ v.v. a H hpotézs feállása eseté közelítőleg t-eloszlású - paraméterrel. A t v.v.-t választjuk próbastatsztkáak az alábbak szert. A t v.v.-ra voatkozó t ' megfgyelés: rˆ t':. (9) rˆ Abból, hogy a t próbastatsztka v.v. H : r gaz volta eseté közelítőleg t-eloszlású - paraméterrel, már adódk egy lehetséges eljárás a jele ellehpotézsek megfelelő kétoldal próbára: Ha t' -re a kétoldal próbáak megfelelő kétoldal krtkus értékekre - t, < t <, t áll fe, akkor H -t valószíűség szte H elleébe elfogadjuk (más szóval az elfogadás tartomáy a (- t,, t, ) tervallum). Ellekező esetbe a H hpotézst elvetjük. Ha az mtaelemszám kellőe agy, akkor t helyett, jó közelítéskét a t u, krtkus értéket s haszálhatjuk. Másrészt a krtkus, t értékből természetese számíthatuk adott mellett krtkus rˆ -értéket s. Megjegyzés: Ha kcsy, akkor csak vszoylag agy rˆ értékeket tekthetük -tól szgfkása külöbözőek. Például, ha =, akkor =,5 eseté az rˆ -ra voatkozó krtkus érték abszolút értéke számítással,63-ak adódk. Vagy például ha =33, akkor =,5 eseté a voatkozó krtkus rˆ érték,344.

Példa A..3. pot másodk példájába egy korrelácós együttható becslésére a -,469 érték adódott. A mtaelemszám 7 volt. Vzsgáljuk - =,95-os valószíűség szte a korrelácós együttható voltára voatkozó H ullhpotézst a H : r ellehpotézssel szembe. Megoldás A kétoldal krtkus érték t 5,, 5 =,3. A próbastatsztkára voatkozó megfgyelés:,469 5 t ',.,469 Utóbb érték a (-,3,,3) elfogadás tartomáyba esk, így a H : r = ullhpotézst fet H elleébe elfogadjuk. 3.3.5. A Fsher-traszformácó alapuló módszer két leárs korrelácós együttható azoosságáak elleőrzésére A ullhpotézs tehát H : r r. Ellehpotézs lehet például H : r r. Ezt a kétoldal próbát em ormáls eloszlású v.v.-k esetébe s gyakra haszálják. Legye a két v.v.-ra voatkozó mta elemszáma és. Térjük át először s a (9) formula szert ˆr és ˆr v.v.-król azok F (rˆ ) ú. Fsher-traszformáltjára: F(ˆ r ) rˆ l rˆ, F(ˆ r ) rˆ l rˆ. Ismeretes, hogy ha a H : r r hpotézs gaz, akkor a

z : F( rˆ ) F( rˆ ) 3 3 v.v. közelítőe stadard ormáls eloszlású. Eek megfelelőe a H hpotézsre voatkozó kétoldal krtkus érték kétoldal próba és - valószíűség szt eseté azo z érték, melyre a fet kétoldal H hpotézsre tektettel P ( z z z ), vagys melyre z-ek közelítőe stadard ormáls eloszlása matt ( z ) / (vö. a... potbel ) példával kapcsolatos 3) megjegyzésbe az krtkus érték köye meghatározható. u p értékről modottakkal). Eek alapjá a z Példa Patkáyokra voatkozó tauláséletta kísérletbe egy útvesztő (labrtus) bejárásáak megtaulásához szükséges, apokba mért dőt és a taulás folyamat sorá elkövetett ap tévesztések átlagos számát vzsgálták kotrollcsoportba és treírozott csoportba (ld. 5.. pot Példa s). A csoportok egyedszáma mkét estbe volt (a két csoportelemszám azoosságáak cs szerepe). A ullhpotézs szert a két csoporto belül, a taulás dő és a ap átlagos tévesztésszám közt korrelácós együttható ( r kotroll =,934 és r treírozot t =,83) külöbsége em szgfkás. Vzsgáljuk a H ullhpotézst - =,95-os szte a H : " H em áll fe" ellehpotézs mellett. Megoldás A krtkus érték u,5,96 (vö. az előbb említett Megjegyzéssel, lletve a II. táblázat utolsó sorával. Tehát az elfogadás tartomáy (-,96,,96). A traszformált korrelácós együtthatók: l,934,934,689,83 és l, 9.,83 3

Ezért a z próbastatsztkára voatkozó megfgyelés:,689,9,93. / 7 / 7 Utóbb a fetebb elfogadás tartomáyba esk, tehát a két korrelácós együttható azoosságára voatkozó H ullhpotézst,95-os szgfkaca szte H elleébe elfogadjuk (Hajtma 968, 56. oldal). 3.3.6. A Spearma-féle ragkorrelácós együttható voltára voatkozó próba Ez a kétoldal próba kellőe agy mtaelemszám esetébe mde kétdmezós (, Y) v.v.- ra alkalmazható. A próba az r leárs korrelácós együtthatóra voatkozó smertetett próba aalogoja, ameybe a (9) formulába rˆ helyett az.4.. potba bevezetett jelölések megfelelőe ˆ -t íruk. A t v.v. és a t megfgyelés jelölést egyszerűség kedvéért em változtattuk meg. A (kétoldal) krtkus értékek meghatározása a t-táblázat (II. táblázat) segítségével törtéhet. Példa A..3. potba egy példába egy tízelemű mta esetébe a Spearma-féle korrelácós együttható becslésére, egybe megfgyelésre a,93 érték adódott. Vzsgáljuk - =,95-os valószíűség szte a H : = ullhpotézst a H : ellehpotézs elleébe. Megoldás Az ellehpotézs természetére való tektettel kétoldal próbát alkalmazuk. A voatkozó t-eloszlás paramétere -=8, ezért a krtkus érték a kétoldal próbára voatkozóa, ld. II. táblázat, t 8,. 5=,36. Az elfogadás tartomáy tehát a (-,36,,36) tervallum. 4

A próbastatsztkára voatkozó megfgyelés értéke: 8 t ',93 6,784,93. Utóbb az elfogadás tartomáyo kívül esk, ezért a H : = ullhpotézst,95-os valószíűség szte H elleébe elvetjük. 3.3.7. A Kedall-féle ragkorrelácós együttható voltára voatkozó próba Ez a kétoldal próba s alkalmazható mde kétdmezós (,Y) v.v.-ra, kellőe agy mtaelemszám mellett, ameybe a két v.v.-ra voatkozó megfgyeléssorozatoko belül cseek azoos értékek, lletve kapcsolt ragok, ld. a..3. potot. Legye a ullhpotézs: H :. Az ellehpotézs lehet H :. Legye a kétoldal próbáak megfelelő valószíűség szt. A..3. potba smertettük a ˆ = próbastatsztka a ( A B) ( ) A B K : ( ( )( 5) potbecslést (A és B jeletését lásd ott). A / /8) (3) v.v. Kellőe agy -re feáll, hogy a H hpotézs gaz volta eseté K közelítőleg stadard ormáls eloszlású. Eek megfelelőe a fet H kétoldal ellehpotézs mellett, kétoldal próbát alkalmazva a hozzávetőleges elfogadás tartomáy u, u ), ahol ( u ) /, ( ld. (3) formula. (Ha ak például a emegatvtását eleve kzárjuk, és így egyoldal ellehpotézskét a ' H : 5

hpotézst fogalmazzuk meg, akkor egyoldal próbát alkalmazuk és a krtkus tartomáy * valószíűség szte a (, ) tervallum, ahol ( u * ). ) A közelítés u lehetőséget mellőző, egzakt vzsgálattal kapcsolatba ld. Vcze és Varbaova 993, 3.4.. pot. Példa A..3. potba az. példába ˆ -ra a,5 értéket kaptuk. Végezzük a ullhpotézsre voatkozó hpotézsvzsgálatot - =,95-os, majd - =,99-os valószíűség szte a H ellehpotézssel szembe, lletve, 95 -os szte a ellehpotézssel szembe. ' H Megoldás A stadard ormáls eloszlással kapcsolatos - =,95-os, lletve,99-os valószíűség szt mellett, kétoldal próbára voatkozó krtkus érték,96, lletve,58.,95-os valószíűség szt mellett az egyoldal próbára voatkozó krtkus érték,65. Esetükbe a mtaelemszám, A=34, B=. A (3) formula szert próbastatsztkára voatkozó K megfgyelés értéke K ' 3 95 /8,57. Utóbb agyobb,96-ál és ksebb,58-ál, tehát a ullhpotézst H-gyel szembe,95-os valószíűség szte elvetjük,,99-os valószíűség szte elfogadjuk. H -t a ' H * ellehpotézssel szembe, 95 -os szte, az u, 65 egyelőségre tektettel,,65<,57 matt elvetjük.,5 6

Táblázatok. Táblázat. A stadard ormáls eloszlásfüggvéy értéke emegatív x argumetumokra. Negatív x argumetumra a függvéyérték a ( x) ( x) relácó alapjá számítható 7

II. Táblázat. A kétoldal t-próba szgfkaca sztekre és paraméterekre. t, krtkus értéke külöböző 8

III. táblázat. Az egyoldal F-próba F, m, krtkus értéke éháy szgfkaca sztre és (, m)= f, ) paraméterre. ( f 9

III. Táblázat folytatása 3

III. Táblázat folytatása. 3

III.Táblázat folytatása. 3

IV. Táblázat. Az (egyoldal) khí-égyzet próba m, krtkus értéke éháy szgfkaca sztre és m paraméterre. 33

V. Táblázat. A Kolmogorov-próba D krtkus értéke,5 szgfkaca sztre és éháy mtaagyságra. 34

VI. Táblázat. A Ma Whtey-féle U- próba vagy Wlcoxo-féle ragszámösszeg- próba U, krtkus értéke,5 szgfkaca sztre és éháy, m mtaagyság párra. m 35