A SOKASÁGI ARÁNY MEGHATÁROZÁSÁRA IRÁNYULÓ STATISZTIKAI ELJÁRÁSOK VÉGES SOKASÁG ÉS KIS MINTÁK ESETÉN LOLBERT TAMÁS 1



Hasonló dokumentumok
? közgazdasági statisztika

? közgazdasági statisztika

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Függvénygörbe alatti terület a határozott integrál

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

2.6. Az ideális gáz fundamentális egyenlete

Statisztika. Eloszlásjellemzők

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

2. LOGIKAI FÜGGVÉNYEK MEGADÁSI MÓDSZEREI. A tananyag célja: a többváltozós logikai függvények megadási módszereinek gyakorlása.

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Feladatok és megoldások a 11. heti gyakorlathoz

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Egyszerő kémiai számítások

VII. A határozatlan esetek kiküszöbölése

Statisztika II. előadás és gyakorlat 2. rész

VASBETON ÉPÜLETEK MEREVÍTÉSE

Matematika I. 9. előadás

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

BIOMATEMATIKA ELŐADÁS

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

1. A radioaktivitás statisztikus jellege

Programozási tételek felsorolókra

Nevezetes sorozat-határértékek

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

A MATEMATIKAI STATISZTIKA ELEMEI

Statisztikai hipotézisvizsgálatok

kritikus érték(ek) (critical value).

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

2. fejezet. Számsorozatok, számsorok

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

Matematikai statisztika

A heteroszkedaszticitásról egyszerûbben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Fluidizált halmaz jellemzőinek mérése

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

STATISZTIKA II. kötet

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

A matematikai statisztika elemei

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Települési fejlődési pályák a Csereháton

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

Matematikai statisztika

Kalkulus II., második házi feladat

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

A Secretary problem. Optimális választás megtalálása.

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

VILLAMOS ENERGETIKA Vizsgakérdések (BSc tavaszi félév)

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

Statisztika 1. zárthelyi dolgozat március 21.

3 1, ( ) sorozat általános tagjának képletét, ha

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Volumetrikus elven működő gépek, hidraulikus hajtások (17. és 18. fejezet)

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Populáció nagyságának felmérése, becslése

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

Információs rendszerek elméleti alapjai. Információelmélet

Kényszereknek alávetett rendszerek

A figurális számokról (IV.)

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

Egy lehetséges tételsor megoldásokkal

Bruttó kereslet Nettó kereslet (1) 5. elıadás: Vétel és eladás indulókészlettel; Intertemporális választások. Indulókészlet

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Backtrack módszer (1.49)

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz

Matematika B4 I. gyakorlat

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

1. Írd fel hatványalakban a következõ szorzatokat!

2 x. Ez pedig nem lehetséges, mert ilyen x racionális szám nincs. Tehát f +g nem veszi fel a 0-t.

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Gyakorló feladatok II.

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

A primitív függvény létezése. Kitűzött feladatok. határérték, és F az f egy olyan primitívje, amelyre F(0) = 0. Bizonyítsd be,

IFFK 2013 Budapest, augusztus Stróbl András*, Péter Tamás**

I. rész. Valós számok

A G miatt (3tagra) Az egyenlőtlenségek két végét továbbvizsgálva, ha mindkét oldalt hatványozzuk:

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

10.M ALGEBRA < <

3. Számelmélet. 1-nek pedig pontosan három. Hány pozitív osztója van az n számnak? OKTV 2012/2013; I. kategória, 1. forduló

Átírás:

ÓDSZERTAI TAULÁYOK A SOKASÁGI ARÁY EGHATÁROZÁSÁRA IRÁYULÓ STATISZTIKAI ELJÁRÁSOK VÉGES SOKASÁG ÉS KIS ITÁK ESETÉ LOLBERT TAÁS 1 A ckk ő célja aak vzsgálata, hogy az elleőrzés gyakorlatba széles körbe haszált és oktatott agytás becslőüggvéy (1 lye eltételekkel alkalazható a sokaság aráy eghatározására (attrbute saplg ks ták eseté. A téa általáos egközelítése céljából több becslés eljárást s egvzsgáltuk, d a hagyoáyos tavétel egközelítés, d a bayes egközelítés területéről. A tavétel statsztka egközelítését alkalazva egszületett egy új becslőüggvéy (3, eze kívül egalkotásra került két kokrét bayes tervallubecslés, valat egy vegyes szeléletű becslés s. Az egyes becslőüggvéyek elezése egutatta, hogy a sokaság aráy elvárt egbízhatóságú becsléséhez legalább 150-00 eleű ta szükséges a agytás (1 becslőüggvéyel, ezzel szebe a több becslés kelégítő ódo űködk ksebb tákra s. Az oratív prort haszáló bayes becslések agyságredekkel szűkebb tervalluot adak, aeybe helyes prort haszáluk. A becslésekről szóló részt kegészít a hpotézsvzsgálat, továbbá az Álla Szávevőszékél s haszált IDEA evű köyvvzsgálat szotver egelelő oduljaak rövd leírása. TÁRGYSZÓ: Sokaság aráy. Attrbute saplg. Hpergeoetra eloszlás. egbízhatóság szt. A statsztka eljárások egyre otosabb szerepet tölteek be a pézügy-gazdaság elleőrzés területé. Az elleőrzés egyk legotosabb ukcója az, hogy bzoyosságot szerezze egy adott szervezet, szervezet egység, vagy tézéyredszer egelelő űködésről, és gyakra elerül az géy, hogy eghatározzuk a bzoyos szepotokak (attrbute, characterstc egelelő egyedek (például szabálytala kzetések vagy egyéb téves trazakcók stb., aket a későbbekbe ősített egyedekek oguk evez sokaság aráyát. Terészetese a legtöbb esetbe az audtor eltűr egy áls hbaaráyt, de ha az átvlágítás sorá arra a következtetésre jut, hogy a valós hbaaráy ezt eghaladja, akkor kéytele elarasztaló véleéyt kad az adott szervezetről. 1 A szerző köszöetet od dr. Huyad Lászlóak, akek javaslatára e tauláy egszületett, és aak elkészítését kezdettől ogva elügyelte. Köszöet llet Káa Zoltát, alapos lektor ukájáért, továbbá az Álla Szávevőszék vezetőt és ukatársat, külööse dr. Csapod Pált és dr. Lórát Zoltát, hogy lehetővé tették a ckk egírását, és taácsakkal javítottak aak őségé. Statsztka Szele, 8. évolya, 004. 1. szá

1054 LOLBERT TAÁS ylvávaló, hogy elesleges kapactásokat voa el az összes trazakcó tételes elleőrzése, ezért bevett gyakorlat a tavétel és a tából való következtetés. Ezzel együtt azoba otos elvárás, hogy ezek a következtetések egalapozottak (statsztkalag alátáaszthatóak és összehasolíthatóak legyeek, ezért szükséges, hogy a következtetésekél eltütessük a egbízhatóság sztet. A haza és ezetköz elleőrzés gyakorlatba legkább a 95 százalékos egbízhatóság szt haszálata hoosodott eg. A tauláy az aráybecslés eljárásokat tekt át. Alapozó statsztka köyvekbe többyre a vsszatevéses tavétel esetére alkalazható, oráls eloszlással való közelítése alapuló becslőüggvéyt utatják be. Az elleőrzés szaka azoba jellegéből adódóa kzárólag vsszatevés élkül tavétel tervekkel oglalkozk, továbbá szté az elleőrzés szaka sajátossága att szgorúa csak véges sokaságokat, és jellezőe ks (100 tételél ksebb egyedszáú tákat vzsgálak. Ezért dokolt egvzsgáluk, lye becslőüggvéyek készíthetők a sokaság aráyra lye keretek közt. Hagsúlyoz kell, hogy a sokaság végességéből következőe a sokaság aráy e vehet el bárlye értéket; eek elleére az eljárásokat úgy vezetjük be, hogy gyele kívül hagyjuk az eloszlások, lletve a lehetséges értékek dszkrét jellegét, és a tárgyalás sorá a köyebb érthetőség kedvéért több esetbe olytoosak eltételezzük őket. A téa tárgyalása sorá hallgatólagosa többször k oguk haszál egy olya eltevést, a az egész elleőrzést szuperpopulácós kotextusba helyez. Egy adott elleőrzés sorá tpkusa adott szervezet(ek adott dőszakra voatkozó tevékeységét vzsgáljuk, és a specáls esetektől eltektve cs okuk eltételez, hogy a vzsgált dőszak ügyeete érdebe eltért a e vzsgált dőszakok ügyeetétől, lletve alteratív egközelítésbe, hogy a vzsgált szervezet ügyeete eltér a hozzá hasoló szervezetek ügyeetétől. Ebből következőe a vzsgált sokaság aga s egy táak tekthető, kokréta egy végtele sokaságból vett eta-táak, aelyek eloszlásáról a korább elleőrzés tapasztalatok alapjá ár kooly előzetes seretekkel s redelkezhetük. Példakét elíthetjük a szávtel szabálytalaságok előordulás gyakorságát, elyek agysága több évre vsszatektve s stabl, redszersajátosságokat tükröző paraéter. 1. BECSLÉS előtt rátérék a becslések részletes tárgyalására, vezessük be a következő jelöléseket: Legye a sokaság egyedszáa, a sokaság ősített egyedeek száa, és pedg a ta hasoló értéke (adott esetbe haszál ogjuk a P = és a p = jelöléseket s. Legye a becslés sorá elkövethető elsőajú (tavétel hba rögzített valószíűsége (tehát 1 a egbízhatóság szt, tektsük továbbá az eleű sokaságból yerhető, külöböző keetelű ták S:={S} halazát. Első eladatuk a potbecslés lesz, a e okoz külöösebb ehézséget. Egy ta keetelé az, paraétereket értjük.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1055 1.1. Potbecslés A sokaság aráy potbecslése első egközelítésbe a egelelő tabel értékkel ( P ˆ = p = törték. A tabel érték torzítatlaul becsül a sokaság értéket: ( P E ˆ 1 1 = E = E( = =, ugyas jele eltételek ellett hpergeoetra eloszlást követ, és a hpergeoetra eloszlás várható értéke. Alteratív egoldást kíál a potbecslésre a bayes egközelítés. Ehhez prorkét szolgál, ha a sokaság hbaszáról eltesszük, hogy boáls eloszlású (, paraéterekkel, ahol P 0 a korább elleőrzés tapasztalatokból sert, redszersajátosságot tükröző stabl paraéter. A ta hbaszááról tudjuk, hogy adott sokaság hbaaráy ellett,, paraéterű hpergeoetra eloszlást követ, tehát így ár eghatározható (potosabba posteror eloszlása s. A posteror eloszlás seretébe több- éle elve s (például a posteror eloszlás várható értéke, edája, ódusza, stb. készíthető potbecslés, de ezek részletezését terjedel okok att ellőzzük. Céljakak egelel, ha becsült értékkét a posteror eloszlás óduszát adjuk eg, tehát azt a sokaság hbaaráyt, aely ellett legvalószíűbb a kapott ta előordulása. Választásukat egyrészt dokolja a ódusz vszoylag köyű eghatározhatósága, ásrészt pedg vozóvá tesz a axu lkelhood szerű terpretálhatóság s. egjegyezék, hogy hátráya s va a ódusz választásáak, ugyas az aúgy jól vselkedő (értsd: haraggörbe-szerű eloszlásokak dszkrét esetbe két aúgy szoszédos ódusza s lehet. Az egyértelűség kedvéért következetese a agyobb óduszt ogjuk haszál. Gyakorlatba a ódusz eghatározásához de [ ; + ] paraéterre k kell száol a posteror valószíűséget, és eg kell keres azt az -et, ahol ez elvesz a axuát: P (1 P ( =. P (1 P [ ; + ] Isert, és ellett ez a száítás agyo köye elvégezhető, például az Excel elhaszálásával. Eek elleére ost levezetük egy eljárást, avel egyszerűbbe s eghatározható a ódusz helye. Algebra átalakításokkal gazolható, hogy a posteror valószíűségeloszlást a következő gyakorságüggvéyel adhatjuk eg: P 0

1056 LOLBERT TAÁS ( ( = P0 (1 P0. Ezt a orulát egvzsgálva látszk, hogy a gyakorságüggvéyek bárely eseté egyásak az x-tegely (a üggetle változó, jele esetbe eté való eltoltja, ezért elégséges csak az = 0 esetre elvégez a száítást, a több értéket az x ( = 0 ( x azoosság elhaszálásával kapjuk. Ha = 0, a következő, egyszerűsített orulát kapjuk: ( = P0 (1 P0. egységy övekedésekor ez a következőképpe változk eg: ( + 1 = ( + 1 P0 1 P 0. Ez a üggvéy -be ooto csökke, tehát a (legagyobb ódusz aál a legksebb -él lesz, ahol a üggvéy értéke egyél ksebb (több ódusz eseté a e axáls óduszokra a oototás att a háyados értéke 1. Ezt a eltételt elírva az =0-ra a ódusz helye: = + 1 1, = 0 ( P0 ahol jelöl a elelé kerekítés űveletét. Ez elhaszálva kapjuk a végleges bayes potbecslést: Pˆ =0 + =. 1.. Itervallubecslés Az tervallubecslés kérdése és tulajdosága korátse olya kdolgozottak a szakrodaloba, t a potbecslésé. Elegedő arra utal, hogy az tervallubecslés tulajdoságat többyre a ek egeleltethető teszt tulajdoságaból száraztatják. Ezért dokolt egy kcst részletesebbe beutat az tervallubecslés elélet alapjat, külöös tektettel a hagyoáyos és a bayes szelélet egységes kezelésére, valat a dszkrét eloszlásokból adódó és radozálással egoldható probléákra. 1..1. Elélet bevezetés Forálsa az tervallubecslés egy olya halazértékű leképezés, aely egy adott tához és egbízhatóság szthez hozzáredel a valós száegyees egy tervalluát úgy, hogy az egelelje bzoyos elvárásokak. Azoba az, hogy k ezek az elvárások, ár korátse lye agától értetődő.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1057 1. ábra. Itervallubecslés θ a (S θ (S Sokaság paraéter értéke S Az S keetelű tához tartozó tervallubecslés. A tavétel lehetséges keetele A kodecatervallu látszólag egyértelű deícója ( az az tervallu, aely a becsül kívát sokaság jellezőt adott valószíűséggel tartalazza potatla abba az értelebe, hogy e határozza eg a valószíűség ezőt, azaz azt, hogy lye populácó kell kszáíta, hez kell vszoyíta a valószíűséget. 3 A valószíűség ezőt többéleképpe lehet eghatároz. A terészetes deícó a teljes valószíűség ező. Ez azt jelet, hogy valószíűség változóak tektjük d a becsül kívát sokaság paraétert, d pedg a tát. 4 Ilyekor a kodecatervallu deícójába az összes lehetséges sokaságból vett összes elképzelhető tá kell kszáol a leedés valószíűségét, a az 1. ábrá azt jelet, hogy a besatírozott rész területéek k kell tee a teljes terület egbízhatóság sztek egelelő százalékát. Eek az értelezések egy specáls esete a hagyoáyos (tavétel statsztkához kötődk. A tavétel statsztka egyk alapeltevése, hogy a becsül kívát sokaság jellező seretle ugya, de égse valószíűség változó. A egbízhatóság szt ebbe az esetbe úgy s értelezhető, t egy eltételes valószíűség, ahol a eltételt a kokrét sokaság jelet. egelítedő, hogy ezzel tökéletese összhagba va az tervallubecslés alapozó statsztka taköyvekbe található terpretácója: sételt tavétel eseté az esetek átlagosa ( 1 100 százalékába gaz az, hogy az így száított tervallu leed a keresett sokaság jellezőt. ylvávaló, hogy ha egy becslés ebbe az értelebe teljesít a kodecatervallu-becslés krtéruat, akkor a teljes valószíűség ező ézve s teljesít azt. (Lásd a. ábrát. Egy ásk specáls esetekét tárgyalható a bayes elogás, ahol a becsült tervallu a sokaság jellező értékét az adott keetelű ták halazá ed le előre rögzített valószíűséggel. Az első specáls esethez hasolóa ost s de, e deícó szert 3 A következőkbe elváltva, szoakét ogo haszál a valószíűség, várható érték és a érték ogalakat. Ez egegedhető, hsze egy eseéy bekövetkezés valószíűsége egegyezk az eseéy karaktersztkus üggvéyéek várható értékével. 4 A sokaság paraéter valószíűség változókét való kezelése t arra korábba ár utaltuk legköyebbe szuperpopulácós egközelítéssel deologzálható, tehát azzal, hogy a vzsgált sokaság aga s egy agyobb, adott esetbe végtele eleszáú sokaságból, a szuperpopulácóból vett ta.

1058 LOLBERT TAÁS kodecatervallu-becslés egarad kodecatervallu-becslések a teljes valószíűség ező törtéő értelezés alapjá s. 5. ábra. A tavétel statsztka kodecatervallua θ 1 θ θ 3 Sokaság paraéter értéke A tavétel lehetséges keetele A sokaság paraéter tetszőleges értéke ellett a kodeca tervalluok egbízhatóság szttel egegyező háyada tartalazza az adott paraétert. 3. ábra. Bayes kodecatervalluok Sokaság paraéter értéke A tavétel lehetséges keetele A sötétített részek bekövetkezés valószíűsége de keetel ellett a egbízhatóság szttel egyezk eg. A továbbakba kodecatervallu becslésé a következőt értjük: Az ( 1 100 százalékos egbízhatóság szthez tartozó kodecatervallubecslések evezzük azt az tervallubecslést, aely a teljes valószíűség ező száolva az esetek ( 1 100 százalékába tartalazza a keresett sokaság jellezőt. (Az ábrá a besatírozott rész területéek kell ktee a teljes terület ( 1 100 százalékát, 5 Köye látható, hogy a egbízhatóság szt a bárs értékek (az adott tához redelt tervallu vagy tartalazza, vagy e tartalazza a sokaság értéket átlagát jelet. A eltételes valószíűségekbe szereplő eltételek teljes eseéyredszert alkotak, tehát a teljes ező értelezett várható érték ezekek a eltételes várható értékekek a súlyozott átlaga. Közsert, hogy az átlag dg a legksebb és a legagyobb átlagoladó érték közé esk, és ebbe az esetbe az összes átlagoladó érték egegyezk.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1059 egyéb eltevések cseek. A korábba leírtakból következk, hogy ez a deícó d a bayes statsztka, d pedg a tavétel statsztka kodecatervallu ogaláak általáosítása. Az tervallubecslés lye hosszú elvezetését az dokolta, hogy a két deált specáls esetből teljese ás tervallukészítés eljárás következk. Az eleez kívát probléa (sokaság aráy becslése adott egbízhatóság szt ellett leegyszerűsíthető a következő probléára: Isert, és ellett készítsük kodecatervallu-becslést -re. 6 Eek a eladatak a egoldása azért egyszerűbb, vel az S:={S } halazak ost csak az taeleszáú eleet kell egvzsgál, elyeket a továbbakba -el, a tába lévő ősített egyedek száával reprezetáluk. Az tervallukészítés ódszerek beutatásához tektsük tehát az és összes lehetséges értékét, továbbá az adott -hez tartozó tervallubecslést tartalazó, + 1 sorból ( = 0 és + 1 oszlopból ( = 0 álló átrxot. 0 1 3 4 5 6 7 8 9........ 0 X X X X 1 X X X X X X X X X X 3 X X X X X X 4 X X X X X X. X X X X X X X. X X X X X X X. X X X X X X X A bayes tervallukészítés eljárás sorá először eghatározzuk de -hez eltételes (posteror eloszlásüggvéyét; az tervalluot úgy kapjuk, hogy eghatározzuk eze eloszlás egbízhatóság sztek egelelő kvatlset. ylvávaló, hogy az így kapott tervallubecslés kodecatervallu-becslés, hsze de ellett a tartalazás eltételes valószíűsége egyelő a egbízhatóság szttel. Szót kell ejteük arról a gyakorta elerülő ehézségről, hogy a probléa dszkrét jellege att e található egelelő kvatls, előordulhat, hogy egy adott ég alatta va a keresett értékek, a szoszédja vszot ár elette. Ebbe az esetbe a következő eljárást követjük. Első lépéskét alaptervalluak tektjük azt a legbővebb tervalluot, aely az elélet kvatlseke belül esk, ajd ehhez az alaptervalluhoz képezzük a radozált tervalluot. A radozált tervallu úgy keletkezk, hogy az alaptervalluot a következő szabály alapjá kbővítjük a szoszédos eleel (a példát az tervallu alsó végpotjára írjuk el, a első végpot eseté aalóg ódo járuk el. 6 Köye látható, hogy az eredet eladat egoldását az egyszerűsített eladat egoldásáak -el való osztásával kapjuk.

1060 LOLBERT TAÁS Tektsük az alaptervallu alsó végpotját, tehát azt az a értéket, aely alzálja az F( a plct egyelet 7 bal oldalát (ekkor ylvá F( a 1 <. Legye p olya, hogy p F( a 1 + (1 p F( a =. A radozált tervallu alsó végpotja p valószíűséggel a 1, 1 p valószíűséggel pedg a. A tavétel statsztka lozóájából következő tervallukészítés eljárás eél összetettebb: egy adott 0 -hoz úgy redeljük az a ( 0 és ( 0 tervalluvégpotokat, hogy azok alzálják a Pr ( > 0 a, lletve a Pr ( < 0 plct egyeletek bal oldalát. vel az F( eltételes eloszlásüggvéy dkét változójába ooto, ezért a et plct egyeletek köye egoldhatók. Köye látható továbbá, hogy azo -ek halaza, elyekre egy adott bee va az a ( és ( alkotta tervalluba, szté tervallu, éspedg olya tervallu, aek tetszőleges eleére Pr ( x > és Pr ( x <. Ebből következk, hogy tetszőleges ellett a tartalazás eltételes valószíűsége e agyobb, t ( 1 100 százalék. 8 Az a eladatuk, hogy radozálással kbővítsük ezt a becslést úgy, hogy az torzítatla legye (agyarul hogy a tartalazás eltételes valószíűsége de ellett egegyezze a egbízhatóság szttel. Ezt a következő ódo ogjuk egte. 0 1 3 4 5 6 7 8 9........ 0 X X X X X 1 X X X X X X X X X X X 3 X X X X X X X 4 X X X X X X X X. X X X X X X X X. X X X X X X X X X. X X X X X X 7 A kovecóak egelelőe F (x:=pr( < x jelöl az eloszlásüggvéyt, azaz aak valószíűségét, hogy a valószíűség változó az arguetuál ksebb értéket vesz el. 8 A tavétel statsztka tervallukészítés eljárását szokás az úgyevezett pvot üggvéyek deálásával bevezet. A pvot üggvéy olya valós értékű üggvéy, aelyek két arguetua a ta és a becsül kívát sokaság jellező, továbbá a üggvéy a becsül kívát sokaság jellezőbe olytoos és ooto, valat eloszlása üggetle a becsül kívát sokaság jellezőtől. egutatható, hogy az F ( eltételes eloszlásüggvéyek eleget teszek a pvot üggvéyel szebe táasztott követeléyekek, aből pedg következk, hogy a et leírt tervallukészítés eljárás egelel az F ( eltételes eloszlásüggvéy t pvot üggvéy elhaszálásával való tervallukészítés eljárásak.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1061 Az ábrá az egyes sorokba látható, orál szedésű X-szel jelölt tervalluokat a Pr( > 0, lletve a Pr( < 0 plct egyeletek -be közös eg- oldása adják. A vastagított X-szel jelölt, radozált értékek ogják bztosíta, hogy de eseté az X-szek által kjelölt (üggőleges!!! tervallu értéke (az oszlopo belül súlya egegyezze a egbízhatóság szttel. Eze kívül azoba egy ásk krtéruak s eleget kell tee a radozált értékekek: de -re a radozálás olyaat végé a becslések tervalluak kell arada (például a et táblázat = 4, = 4, 5 cellába a 4;4 cella csak a 4;5 cellával együtt kerülhet kválasztásra. ylvávalóa ezekek a krtéruokak csak úgy lehet egelel, ha egyrészről egy adott kvastagítás kválasztás valószíűségét az őt tartalazó oszlop eltételes eloszlása határozza eg (például, alsó radozált végpot eseté a kválasztás valószíűség p, Pr( + F( = 1 plct egyelet egoldása p, -re, ásrészről pedg a vízsztese egyás ellett lévő kvastagítások kválasztása ügg egyástól. Szerecsére ez egtehető, ugyas az F( eltételes eloszlásüggvéy -be ooto csökkeő, azaz sét csak alsó radozált végpotokra elírva p, > p, 1. Ezt gyelebe véve, 1 radozált kválasztására csak abba az esetbe kerülhet sor, ha, ár kválasztásra került, és lyekor, 1 kválasztás valószíűsége p, 1 p,. p x, x j< x j A radozálás techka kvtelezését a gyakorlatba a következő, ekvvales ódo tehetjük eg: Legye a tabel érték, és legye I( a tabel értékhez a Pr ( > 0 a, lletve a Pr ( < 0 plct egyeletek által adott alaptervallu. Tektsük az tabel értékhez az I( 1, I( és I( + 1 tervalluokat! Köye látható, hogy az alsó radozáladó értékek I( 1 \ I(, a elsők pedg I( + 1 \ I(. Az egyes radozáladó értékekhez a et leírt ódo képezhetjük a p, valószíűségeket. ost az alsó értékekre beutatjuk, hogya lehet kválaszta az tervallu radozált alsó határát (a első határ eseté aalóg ódo kell eljár. Ha I( 1 \ I( elee, + 1,, +, akkor legye p := p,, : = p p. Köye látható, hogy ha, + 1,, + potecáls alsó határokhoz ezeket a kválasztás valószíűségeket redeljük, akkor az lye ódo kapott tervalluok ellett a becslésük torzítatla lesz.

106 LOLBERT TAÁS Ey elélet bevezetés utá vzsgáljuk eg pár kokrét becslés eljárást. 1... A tavétel statsztkához kapcsolódó becslések A tavétel statsztka ebbe az esetbe a bayes szelélettel szebeálló hagyoáyos (klasszkus, egyes bayes egogalazás szert ortodox statsztkát jelet. A eltételeket lletőe ebbe az alejezetbe tehát a vzsgálat tárgyát képező P, lletve sokaság paraétert e tektjük valószíűség változóak. agytás alapeset (1. Kduló potuk a taköyvekbe s részletese tárgyalt becslés, aely eseté a vsszatevéses agy ta eseté a oráls eloszlással való közelítés jogosak tűk. Ez az eset, t a bevezetőbe elítettük, e elel eg az elleőrzés tavétel követeléyeek, de tt, t kduló potot, etalot tektjük. Az eljárás a következő: végtele (legalább több ezres agyságredű sokaságból, vagy pedg ksebb sokaságból, de vsszatevéssel törtéő tavétel eseté a tába található ősített eleek száa boáls eloszlást követ. A tabel hbaaráyról (p P ( 1 P bzoyítható, hogy szté boáls eloszlású, továbbá E(p=P és Var(p=, ahol P jelöl a sokaság hbaaráyt. Ha { p, (1 p} 10 (tehát legalább 10 hbás és 10 e hbás eleet találtuk a tába, akkor a ta hbaaráyáak traszoráltja közelítőleg stadard oráls eloszlást követ, aből az tervallubecslés: p z ± 1 p (1 p, ahol z a stadard oráls eloszlás egelelő kvatlse. 1 Az elleőrzés gyakorlatba a gazdaság olyaatok jellegéből adódóa 5-10 százalékál agyobb aráyú hbát ár koolyabb kockázat téyezőkét szokás gyelebe ve. Ha ezek alapjá egvzsgáljuk eek a ódszerek az alkalazás lehetőséget, kderül, hogy legalább többszáz eleű ta szükséges az p 10 eltétel teljesítéséhez, a a gyakorlat alkalazások esetébe általába e valósul eg, így a közelítő eljárás alkalazása torzítást vsz az tervallubecslésbe. Tovább torzításra ad okot a odell kezdet eltevése, azaz a végtele sokaságból, vagy pedg vsszatevéssel törtéő tavétel. A vsszatevés élkül tavétel eseté a tabel hbaaráy varacáját csökket egy 1 < 1 szorzó, ezért tehát eek a eltevések a egszegése elvleg jó ráyú torzítást okoz. A teljes torzítás értékéről aaltkusa ehéz potosa ylatkoz, de ha összevetjük ezt a becslést a később beutatásra kerülő 3 becslőüggvéyükkel, látható, hogy a taéret övekedésével (és a kválasztás aráy ullához tartásával a két becslés s kovergál egyáshoz. Az egyes becslés eljárások potos torzítás értékét Excel segítségével eghatároztuk, eek részleteről bővebbe a 4. rész száol be.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1063 Vsszatevés élkül ta egzakt hpergeoetra eloszlás (. A hpergeoetra eloszlás ellett tervallubecslés (a továbbakba: eseté a eltételes eloszlás a következő gyakorságüggvéy szert ( üggőleges kuulálásával adódk: x x Pr ( = x =, ha ax( 0, + x (,, egyébkét 0. utá eghatároztuk az, 1 és + 1 ellett alaptervalluokat és a p értékeket, véletleszá-geerátorral kválaszthatjuk a radozált tervalluvégpotokat. Az elleőrzés szaka egyk etaloak tekthető szotveréek, az IDEÁ-ak a tavétel odulja s az eljárást haszálja azzal az eltéréssel, hogy radozálás helyett dg a legkozervatívabb (a radozálással kapható legbővebb tervalluot adja eg. Hpergeoetra eloszlás - oráls közelítés (3. A közelítő eljárások bevezetésére aak dejé őkét azért került sor, vel sokág e álltak redelkezésre táblázatok a hpergeoetra eloszláshoz, így valalye olytoos eloszlással helyettesítették a dszkrét eloszlást. vel a becslés végső célja a hbaaráy eghatározása, a közelítő eljárásokba és szerepét általába és vesz át, és eze kívül legtöbbször gyel- e kívül hagyják az előbb háyadosok dszkrét jellegéből adódó sajátosságokat s, így e kerül sor radozálásra se. A korábba leírt tervallukészítés eljárás gyelebevételével ele ódo köye készíthetük közelítő ódszerrel becslőüggvéyt. Jele esetbe közelítsük a eltételes eloszlást olya oráls eloszlással, elyek várható értéke és varacája egegyezk a egelelő hpergeoetra eloszláséval. A oráls eloszlás kvatls értéket haszálva egy adott P sokaság hbaaráy ellett azo tabel hbaaráyok (x halaza, aelyekhez tartozó tervallubecslések tartalazzák P-t: P (1 P P (1 P x P z ; P + z. 1 1 1 1 A kostrukcó sorá azzal a eltevéssel élük, hogy bárely x tabel hbaaráy kodeca tervallu végpotjához tartozó sokaság hbaaráy et deált halazáak x a határpotja. vel olytoos közelítést alkalazuk, ez a eltevés tartható, továbbá látszk, hogy ebbe az esetbe a kodeca tervallu első végpotja a halaz alsó határa lesz, és ordítva. Írjuk el ezt egyeletredszer orájába: x P (1 P 1 = P z, 1

1064 LOLBERT TAÁS x P (1 Pa 1 a = Pa + z. 1 A eladatuk az, hogy ebből az egyeletredszerből kejezzük P -t és P -et. Köyye látható, hogy átredezés és égyzetre eelés utá a két egyelet ugyaúgy og kéz, és vel szté köye látható, hogy P -ba, lletve P -be ásodokú egyeletet kapuk, P lesz a ksebbk, és P a agyobbk gyök. a Az egyelet egoldásához először s végezzük el a p ( 1 p a utá egyeletük az x = p ± c orát ölt. Átredezve és égyzetre eelve: Isét átredezve: x xp + p = c p (1 p. ( + c p (x + c p + x = 0. Felírva a egoldóképletet és tovább redezve: a a c = z helyettesítést, 1 1 p 1, x + c = x + c 0,5 = ± c + c ± (x + c ( + c ( + c 4( + c x x(1 x 0,5 + c. ( + c = Bevezetve a λ = (poztív, 1-él ksebb száal való helyettesítést: + c 1 x(1 x 0,5 (1 0,5 [ λx + (1 λ 0,5] ± z λ λ + (1 λ 1, = 1. p Vegyük észre, hogy, és 0 határértékbe az x z ± 1 eseté 1 λ és 1 1, így becslésük x(1 x alakot ölt (ez egegyezk az 1 becsléssel.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1065 Ezt a eglepőe szép orájú, kovex kobácót tartalazó becslőüggvéyt ehéz vola tutív ódo előállíta, de a tesztekből k og derül, hogy az elélet kostrukcóval összhagba ks ták eseté s gyakorlatlag torzítatla tervalluokat ad. 1..3. Bayes szeléletű becslések (B A kodecatervallu-becslés bayes szeléletű deícóját, lletve a becslésre adott kostrukcós eljárást egvzsgálva látható, hogy a teljes valószíűség ező tervalluokkal való leedettségéek értéke általába e egyeletes az egyes sokaság aráyok eté: ez aatt va, hogy a prorba szereplő eloszlásak egelelőe bzoyos sokaság aráyok túlreprezetáltak a becslésbe. debből következk az s, hogy elvleg a bayes szeléletű becslőüggvéyek jóval potosabb (szűkebb tervalluokat eredéyezek; ás kérdés, hogy eze tervalluok ex-post egbízhatóságát hogya beolyásolja, ha a pror jeletőse eltér a valóságtól. vel az F ( eltételes eloszlás de -re olya, hogy a hozzá tartozó eltételes sűrűségüggvéy övekedésével egyre kább egy potra (éspedg -re ko- cetrálódk, a prortól üggetleül de tervallubecslés = értékre og ráhúzód, ha. Kérdés azoba, hogy vajo ez a kovergeca lye gyors, tehát hogy az elleőrzésbe haszálatos taéretek ellett éreztet-e a hatását. Fotos tud, hogy a pror esetleges helytele egválasztása lye értékbe képes beolyásol agát a becslést, és így az audtor által kalakított véleéyt s. Egy bayes szeléletű tervallubecslés elkészítéséhez két dolog serete szükséges: egyrészről serük kell az F ( eltételes eloszlást, ásrészről pedg az pror eloszlását. Az sert statsztka összeüggések att F ( -et a hpergeoetra eloszlás értéket elhaszálva kaphatjuk eg, á eloszlásával kapcsolatosa többéle eltevéssel s élhetük: (B1a. Az első lehetséges eltevés, hogy akro szeléletbe aak a valószíűsége ( P 1, hogy egy adott egyed redelkezk azzal a bzoyos jellegzetességgel, a korább elleőrzés tapasztalatokból sert, redszersajátosságot tükröző, stabl paraéter. Egy lye végtele agyságú szuperpopulácót eltételezve a vzsgált sokaságra jellező sokaság aráy valószíűség változó, aely (, P 1 paraéterű boáls eloszlást követ; (B1b. Egy ásk lehetséges eltevés a vzsgált szervezetél, vagy hasoló szervezetekél leolytatott korább elleőrzések eprkus tapasztalata alapul. Ezek alapjá szté egadható aak a valószíűsége ( P, hogy egy adott egyed redelkezk azzal a bzoyos jellegzetességgel, így a sokaság aráy sét csak boáls eloszlású, (, P paraéterekkel; (B. Ha egy adott jellező sokaság aráyáról hosszú dőre vsszaeőe redelkezük eggyelésekkel, és úgy találjuk, ez a sokaság aráy eloszlásába stabl, akkor ezt az eprkus adatsort s elhaszálhatjuk a becslésükhöz; (B3. Végül haszálhatuk e oratív prorkét egyeletes eloszlást. Az első két eltevés ellett a következő posteror gyakorságot kapjuk:

LOLBERT TAÁS 1066 [ ] + = P P P P ; (1 (1 (, ha [ + ] ;, egyébkét 0. vel a posteror valószíűség egegyezk aak valószíűségével, hogy a earadó eleű sokaságba hbás ele található, ezért a et képlet a következő alakra egyszerűsíthető:, a terészetese algebra átalakításokkal s köye belátható. P P + = (1 ( Ebből a orulából ktűk, hogy a posteror gyakorság e változk, ha és azoos ódo változk, így eáll az a a + = (0 ( és összeüggés. + = (0 ( Az eprkus adatsor alapjá de sokaság hbaaráyhoz hozzáredelhető egy eprkus bekövetkezés valószíűség, aek elhaszálásával egadható a sokaság hbaszá pror eloszlása s. Pr e ( p A posteror valószíűségek: [ ] + = e e Pr Pr ; (. Egyeletes eloszlású pror ellett a posteror gyakorság a következő: [ ] + = ; (, ha [ + ] ;, egyébkét 0. A posteror eloszlásra a korábba leírt eljárást kell alkalaz: először s eg kell határoz az alaptervallu végpotjat az ( a F plct egyelet alzálásával, lletve az 1 1 ( ( ( + = + F F axalzálásával, ahol a et üggvéyek 1-g való kuulálásával adódk. Ezek utá kell elvégez a F( (

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1067 radozálást 1, lletve + 1 értékekre a a 1 F( + 1 p = kválasztás valószíűségek elhaszálásával. ( + 1 F( a p = a és a ( 1 x + A köyebb kezelhetőség kedvéért bevezetük egy közelítő ódszert a B1 becsléssel kapható tervallu eghatározására. vel eáll az ( = + ( x összeüggés, és = 0 ellett posteror eloszlása, P paraéterű boáls eloszlás, ezért eltételes posteror várható értéke ( P +, eltételes posteror szórása pedg ( ( P(1 P. Ezt gyelebe véve átalakítások utá a bayes gyorsbecslés képlete: κ P (1 P + (1 κ P ± z, 1 ahol κ =, azaz a kválasztás aráy. Ez a képlet a következő ódo terpretálható: A sokaságból kválasztott eleű tába a hbaaráy. A tavételkor khagyott részbe található hbák száa előzetes eltevésük szert (, P paraéterű boáls eloszlást követ. A becslést eek a két részek az átlagolásával kapjuk. Ez a becslés azért csak közelítés, vel a boáls rész kvatlset csak közelítve határoztuk eg. 1..4. Egy vegyes becslés ódszer A tavétel statsztka keretébe tárgyalt agytás becslés ódszerből külső orácó elhaszálásával egy ks tákra hatékoya alkalazható hbrd (xb1 hozható létre. Elékeztetőül: az 1 agytás becslés eljárás sorá p tabel hbaaráyhoz hozzáredeltük a p ± z tervalluot. Abba az esetbe, ha p (1 p 1 előzetes tapasztalatokkal ( P 0 redelkezük a hbaaráyról, ezt a becslés sorá legkább a stadard hba eghatározásáál haszálhatjuk el. Az új becslőüggvéyük: a P p ± z P0 (1 P ˆ 0 1. Ez a becslés bayes tervallubecsléskét s elogható azzal a eltételezéssel, hogy a sokaság hbaaráy pror eloszlása a potra kocetrálódk. P 0

1068 LOLBERT TAÁS ylvávaló, hogy ez a becslőüggvéy torzított, és a torzítás aszptotkusa se szűk eg. Azoba ks ták eseté, ha P valóba P 0 közelébe szóródk, ez a becslés jóval egbízhatóbb, tha a stadard hbát s a tából határozák eg.. HIPOTÉZISVIZSGÁLAT Egy pézügy-gazdaság elleőrzés leolytatásakor a egvzsgált ta alapjá több esetbe ylatkoz kell arról s, hogy a hbák gyakorsága e lép túl egy előre rögzített sztet. A hpotézsvzsgálat hagyoáyos elélete szert ez törtéhet egyrészt úgy, hogy a ta eredéye alapjá egodjuk, ekkora bzoyossággal jelethetjük ezt k 9 (lásd H1 ódszer, de törtéhet úgy s, hogy egy előre rögzített bzoyosság szt ellett kjeletjük, hogy elogadható, vagy e elogadható ez a kjeletés 10 (lásd H ódszer. A hagyoáyos eljárással szebe a bayes hpotézsvzsgálat alapvetőe arról ylatkozk, hogy a ta kább a hpotézst, vagy aak tagadását táasztja-e alá..1. Hagyoáyos hpotézsvzsgálat A hpotézsvzsgálat hagyoáyos leolytatásakor tát veszük a sokaságból, és a ta keeteléhez hozzáredeljük a dötésüket: vagy egodjuk a bzoyosság értékét, vagy elogadjuk/elutasítjuk az állítást rögzített bzoyossággal. Az elogadott keeteleket elogadás tartoáyak, az elutasított keeteleket elutasítás tartoáyak evezzük. A továbbakba evezzük (ullhpotézsek azt az állítást, hogy a sokaságbel hbák gyakorsága eghaladja az előre rögzített sztet ( P > P h, ahol Ph az elleőrzés szakyelvbe tolerálható hbaaráy éve sert eység; eek ellehpotézse (vagy ás éve az alteratív hpotézs az, hogy a sokaság hbaszáa e haladja eg ezt a sztet ( P P h. dezek ellett dötésükkel két ajta hbát követhetük el: A ta alapjá tévese elutasítjuk a hpotézst, tehát aak elleére, hogy a valós hbaszázalék eghaladja a rögzített sztet, ezt égse ogadjuk el. (elsőajú hba. A ta alapjá tévese elogadjuk a hpotézst, tehát aak elleére, hogy a valós hbaszázalék alatta arad a rögzített sztek, e vetjük el a hpotézst (ásodajú hba. A hpotézsvzsgálat (próba egbízhatóság sztje aak valószíűségét utatja eg, hogy a ta alapjá helyese ogadjuk-e el a ullhpotézst. Köye látható, hogy ez pot az elsőajú hba elkövetés valószíűségéek kopleetere, így ha az elsőajú hba elkövetés valószíűsége (ás éve szgkacaszt, a egbízhatóság szt 1. A próba erejéek szokás evez aak a valószíűségét, hogy a helytele hpotézst helyese elutasítjuk. Adott egbízhatóság szt ellett ylvávaló cél, hogy a próba erejét axalzáljuk. 9 Ez vezet az ú. p-érték kocepcóhoz. 10 Ez valójába a klasszkusak száító eya Pearso tesztelés elv, lletve stratéga.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1069 Az eddgeket egy átrxba szokás összeoglal: Elogadjuk (eltételes valószíűség Elutasítjuk (eltételes valószíűség Hpotézs gaz Helyes dötés (1 Elsőajú hba ( Hpotézs has ásodajú hba ( Helyes dötés (1 vel e serjük a valós sokaság hbaaráyt, ezért dötésük egbízhatóságáról se tuduk potosa ylatkoz; aak valószíűsége, hogy a tavétel keeteléhez előre hozzáredelt dötésük lye valószíűséggel lesz helyes, ügg a valós sokaság aráytól. vel azoba F( p P P -be ooto csökke, ezért a helyese elogadó dötés valószíűsége P P h halazo P h eállása eseté a legksebb, és eatt kjelethető egy adott dötésről, hogy legalább eyre egbízható. A továbbakba ezt ogjuk egbízhatóság sztek evez. H1. Abba az esetbe, ha a hpotézsvzsgálat célja a egvzsgált ta alapjá egoda, hogy ekkora legksebb szgkacaszt ellett lehet elutasíta a hpotézst, orálsa a következő értéket kell kszáoluk. Pr ξ > p P, ahol ξ hpergeoetra eloszlású valószíűség változó, P, és paraéterekkel, ( h továbbá p a tából száított hbaaráy; ez a valószíűség ogja egad a egbízhatóság sztet. A képlet kszáolásához egyszerűe a hpergeoetra eloszlás gyakorságat kell p -g kuulál. H. Terjedel okok att e térük a próbakészítés eljárásokra, ezért doklás élkül kjeletjük, hogy ez esetbe a legjobb próbák elogadás tartoáya adott taéret ellett dg tervallu. vel a ta hbaaráyáak ullhpotézs ellett eloszlása sert, a eladatuk eze eloszlás egbízhatóság sztek egelelő kvatlsét egkeres. A kvatls általába tt se lehetséges érték, ezért szükséges lehet a krtkus érték radozált eghatározása a becslés eljárásokál ár egsert ódo. A krtkus érték eghatározása utá össze kell vet a tából kapott értéket a krtkus értékkel: aeybe a krtkus érték eghaladja a tabel értéket, elutasítjuk a hpotézst, egyéb esetbe vszot e áll ódukba elvet eze a egbízhatóság szte. Az elleőrzés szakába, és ezzel összhagba az IDEA szotverbe a egbízhatóság sztet az eddg leírtakhoz képest éképp eltérő ódo értelezk. Deálják az ala és béta kockázatot, aelyek értelezése a következő: ala kockázat: aak a dötések a axáls bekövetkezés valószíűsége, hogy a valós hbaaráy eghaladja a tolerálható hbaaráyt, közbe valójába ksebb egy, úgyevezett alsó hbaaráyál. (Ez a kockázat a et ullhpotézs eseté hasolít a ásodajú hba deícójához. béta kockázat: aak a dötések a axáls bekövetkezés valószíűsége, hogy a valós hbaaráy e haladja eg a tolerálható hbaaráyt, közbe valójába égs eghaladja. Az ala és béta kockázatok kopleeteret evezk ala és béta egbízhatóság sztek, tehát a korábba bevezetett egbízhatóság szt deícóak a béta egbízhatóság szt a egelelője abba az esetbe, ha a ullhpotézs P >. P h h.. Bayes hpotézsvzsgálat A bayes hpotézsvzsgálat léyege, hogy összevetjük a hpotézs és az ellehpotézs ta ellett bekövetkezéséek valószíűségét. A valószíűségek eghatározásához

1070 LOLBERT TAÁS ugyaazt az eljárást követjük, t az tervallubecslés eseté, evezetese első lépéskét eghatározzuk a tából kapott értékhez posteror valószíűségeloszlását. A dötés szabály ezek utá az, hogy összevetjük a hpotézst a posteror eloszlás edájával: ha a edá a agyobb, akkor elvetjük a hpotézst, ellekező esetbe elogadjuk azt. Az előbb leírtakat egordítva és oralzálva, a bayes hpotézsvzsgálat a következő ódo törték. 1. eghatározzuk az F( P p posteror eloszlást de p ellett;. A hpotézskét szereplő P -hoz hozzáredeljük azt a legagyobb p -t, aely ellett ég 1 F ( P h p h. h 3. Ha a tából szárazó p, elogadjuk a hpotézst, ellekező esetbe elutasítjuk. p h h 11 3. A HIBAETES ITÁBÓL LEVOHATÓ KÖVETKEZTETÉSEK Ha a tavételt követőe a tába e találtuk hbát, a korábba sertetett (egzakt hpergeoetra eloszlást haszáló becsléshez szükséges eltételes gyakorságok a következő ódo alakulak. = 0 1 Pr ( = 0 1 ( ( 1 ( 1 + 1 + 1 Probléa lehet, ha a radozált alsó végpot agyobb, t a radozált első végpot, a terészetese elletodás. Ezt a jeleséget az tesz lehetővé, hogy = 0 - ál F( de eseté kostas zérus, így e létezk az alaptervallu. (Elékeztetőül: egy adott 0-hoz tartozó alaptervalluak evezzük az a ( 0 és ( 0 végpotok által eghatározott tervalluot, ha azok alzálják a Pr ( > 0 a, lletve a Pr ( < 0 plct egyeletek bal oldalát. áskét egogalazva: cs olya, aely a radozált tervalluok degykébe szerepele. A probléa egoldása lehet például, ha az alsó és első végpotok radozálással való eghatározása e üggetle egyástól. Ebbe az esetbe de értékhez hozzáredelük p kválasztás valószíűségeket (degyk szgorúa ksebb lesz egyél, hsz cs alaptervalluuk. Redezzük övekvő sorredbe -eket! vel p F( tulajdoságaból következk, hogy a p 1 + háyadosok ooto ogyó sorop 11 Bár tartallag azoos ezzel az eredet bayes tesztelés stratéga, eg kell elíte, hogy az otta keretek közt a dötést az ú. posteror esélyháyados (posteror odds alapjá hozzák eg. A posteror odds a ullhpotézs és az ellehpotézs a posteror bekövetkezés valószíűségeek háyadosa; ha ez agyobb 1-él, akkor a ullhpotézs, ha ksebb 1-él, az ellehpotézs javára dötük.

A SOKASÁGI ARÁYOK EGHATÁROZÁSA 1071 zatot alkotak, ezért egutatható, hogy létezek olya tervalluok, és az tervalluokhoz redelt kválasztás valószíűségek, elyekre bárely -ek az előbb tervalluokba való tartalazás valószíűsége potosa p. Ha agyo alacsoy ( p << a korább tapasztalatok alapjá várható hbaaráy, eggyelt hba élkül ta ellett elerülhet olya géy, hogy bzoyos egbízhatóság szte kjeletsük: a vzsgált sokaságba cs léyeges hba. Adott szuperpopulácós hbaaráy ( p ellett aak a valószíűsége, hogy a teljes sokaságba cs hba: ( 1 p, ugyas ez egegyezk aak valószíűségével, hogy a p hbaaráyú végtele sokaságból a véletleszerűe kválasztott tétel egyke se hbás. Ezért tehát ahhoz, hogy 1 egbízhatóság szte a ta alapjá kjelethessük, hogy a sokaságba cs hba, a szükséges taagyság: l(1 =, l(1 p ahol l a terészetes alapú logartust jelöl. A gyakorlat alkalazás szepotjából ez a ódszer csak akkor haszos, ha alacsoy ugya (<5, de az egy trazakcóra eső elleőrzés költség agyo agas (például külső szakértőt kell géybe ve, vagy túlzott dőráordítást jeletee a pótlólagos 5-10 trazakcó elleőrzése. 4. A BECSLÉSI ELJÁRÁSOK ÉRTÉKELÉSE A becslés eljárások torzítás értékét a egbízhatóság szt jele tauláy első elébe adott deícója szert a teljes valószíűség ező kell vzsgál. A teljes valószíűség ező a korábba leírtak alapjá tartalazza az összes lehetséges sokaság-ta orgatóköyvet. Egy kokrét sokaság-ta pároshoz tartozó valószíűség az sert azoosság alapjá elírható Pr( = Pr( Pr( alakba, így vel a tavétel terv seretébe Pr ( s sert elegedő Pr ( eghatározása. Ehhez azoba eltevésekkel kell élük agáról a sokaságról. A sokaságról való lehetséges eltevéseket, továbbá azok doklását részletese kejtettük a bayes becslések bevezetésekor. Jeleleg céljakhoz ebből csak azt kell keel, hogy a teljes valószíűség ező értelezett egbízhatóság szt tekthető a tavétel statsztka parcáls (adott sokaság aráy ellett sételt tavételt eltételező egbízhatóság sztjeből vett Pr ( súlyozású átlagak. A becslés eljárások értékelésekor első lépésbe külöböző sokaság- és taéretek ellett 15 százalék alatt sokaság hbaaráyokra Excel segítségével eghatároztuk a parcáls egbízhatóság szteket. A B1 és xb1 eljárások eseté a sokaság- és taéret ellett paraéterkét szerepelt a eltételezett hbaaráy s, terészetese ás-ás terpretácóval. A tavétel statsztka becsléseek kostrukcójukból adódóa de sokaság aráy ellett kostas 95 százalékos parcáls egbízhatóságot kell(ett vola utatuk, ezzel szebe a bayes szeléletű becslésektől, külööse a B1 becsléstől, ez e elvárható.

107 LOLBERT TAÁS Az értékelés ásodk szakaszára éppe azért volt szükség, vel a B1 becslés egbízhatóságáak prortól való üggése az első szakasz eredéyeből közvetleül e volt egállapítható. A ásodk szakaszba tehát az első szakasz eredéyet a szuperpopu- Pr súlyokkal átlagoltuk. lácós hbaaráy 0-15 százalék között értékere kszáított ( A bayes szeléletű B becsléscsaládról e tuduk uverzáls érvéyel ylatkoz, de vel ez a becslés áteetet képez a tszta B1 és B3 esetek közt, tulajdosága s várhatóa valahol a kettő között találhatóak: él kevesebb orácóval redelkezük a jellező előordulás valószíűségéről él kevésbé összpotosul az eprkus eloszlás egy értékre aál kább a B3 jellező érvéyesülek, a egyeletesebb parcáls egbízhatóságot de hosszabb (potatlaabb tervalluokat jelet. 4.1. Az első szakasz eredéye A becslőüggvéyek egbízhatóságáak elezéséhez explct ódo eghatároztuk adott és ellett de lehetséges sokaság hbaaráy ellett, hogy a becsült tervalluok hpergeoetra eloszlását eltételezve az esetek háy százalékába tartalazzák 1 -et (lletve a valós sokaság hbaaráyt. Ezzel párhuzaosa eghatároztuk egy várható tervalluhosszt s de becsléshez de sokaság hbaaráyra. Az EXCEL-lel készült száítások éháy eredéyét a Függelék 1-4. ábrá utatják. Ezek példakét az = 600 sokaság eleszá és a szokásos 95 százalékos egbízhatóság ellett az = 30 (ksta és az = 150 (agyta esetekbe utatják a parcáls (eprkus egbízhatóságot, lletőleg a várható tervalluhosszt. Az eredéyekből ktűk, hogy egyrészről az 3 becslés torzítása a többségébe e, vagy alg lép túl a 1,5- százalékpotot, ásrészről a torzítás hol poztív, hol egatív ráyú. Ezzel szebe az elleőrzés szakrodaloba ajálott 1 becslés akár 5-15 százalékpoty torzítást s tartalaz. Az eredéyeket tartalazó grakoo a valós sokaság hbaaráy övekedésével eglepő perodctás gyelhető eg az 1 és 3 becslésekél rögzített és ellett. Eze kívül eggyelhető, hogy a becslések egbízhatóság görbéjéek alakja gyakorlatlag érzéketle a sokaság agyságáak változásara, aből az a következtetés voható le, hogy a egbízhatóságot elsősorba a taéret beolyásolja (a kválasztás aráy övekedése a övekedéssel aráyos egbízhatóság szt övekedést okoz az 1 becslésél, 13 de a grako alakját érdebe se az 1, se az 3 becslésél e változtatja eg. A tavétel statsztka becslőüggvéye e tartalaz selye közelítő eljárást és eatt torzítást se, at a vzsgálat s alátáasztott. Az oratív prorral való B1 becslés a szuperpopulácós hbaaráy köryezetébe poztív, azo kívül egatív ráyba torzított. A poztív torzítás tartoáy agysága ordította aráyos a sokaság éretével, hozzávetőlegese,5 (=1500 és 5 (=300 százalékpot között ozog. A taéret (kválasztás aráy változása a poztív torzítás tartoáy éretét kevésbé, kább a (parcáls egbízhatóság görbe alakját beolyásolja: él agasabb a kválasztás aráy, a becslés (parcáls egbízhatósága prortól 1 A radozálást úgy vettük gyelebe, hogy az adott orgatóköyvre a tartalazást kódoló 0-1 száok helyett a tartalazás valószíűségét tütettük el. 13 Az 1 becslésél tapasztalt túlzott egbízhatóság szt övekedés például a statsztka szakrodaloba ajálott ódo a potbecsléshez hozzáadott-kvot értékek (1-kválasztás aráy téyezővel való szorzásával korrgálható.