Valószín ségszámítás és statisztika



Hasonló dokumentumok
Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Statisztika 1. zárthelyi dolgozat március 21.

A matematikai statisztika elemei

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztikai hipotézisvizsgálatok

BIOMATEMATIKA ELŐADÁS

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Statisztika 1. zárthelyi dolgozat március 18.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Matematikai statisztika

Hipotézis-ellenırzés (Statisztikai próbák)

Statisztikai programcsomagok

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Kutatói pályára felkészítı modul

Matematika B4 I. gyakorlat

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Komputer statisztika

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Tartalomjegyzék. Pemutáció 5 Ismétléses permutáció 8 Variáció 9 Ismétléses variáció 11 Kombináció 12 Ismétléses kombináció 13

VII. A határozatlan esetek kiküszöbölése

Hipotézis vizsgálatok

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

Valószín ségszámítás és statisztika

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

3.1. A Poisson-eloszlás

Biomatematika 2 Orvosi biometria

Diszkrét matematika II., 3. előadás. Komplex számok

Normális eloszlás paramétereire vonatkozó próbák

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

A figurális számokról (IV.)

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

kritikus érték(ek) (critical value).

? közgazdasági statisztika

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Valószín ségszámítás és statisztika

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Kalkulus II., második házi feladat

Valószínűségszámítás alapjai szemléletesen

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

V. Deriválható függvények

Gyakorló feladatok II.

Komplex számok. d) Re(z 4 ) = 0, Im(z 4 ) = 1 e) Re(z 5 ) = 0, Im(z 5 ) = 2 f) Re(z 6 ) = 1, Im(z 6 ) = 0

1. A radioaktivitás statisztikus jellege

Abszolút folytonos valószín ségi változó (4. el adás)

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

18. Differenciálszámítás

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Feladatok és megoldások a 11. heti gyakorlathoz

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Valószínűségszámítás

Bevezetés a hipotézisvizsgálatokba

Eseményalgebra, kombinatorika

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

1. A KOMPLEX SZÁMTEST A természetes, az egész, a racionális és a valós számok ismeretét feltételezzük:

Statisztika (jegyzet)

1.1 Példa. Polinomok és egyenletek. Jaroslav Zhouf. Első rész. Lineáris egyenletek. 1 A lineáris egyenlet definíciója

Hipotézis vizsgálatok

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

A statisztika részei. Példa:

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

[Biomatematika 2] Orvosi biometria

Gazdasági matematika II. tanmenet

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Statisztika Elıadások letölthetık a címrıl

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

VALÓSZÍNŰSÉGSZÁMÍTÁS KÉPLETTÁR

Sorozatok A.: Sorozatok általában

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Feladatok megoldása. Diszkrét matematika I. Beadandó feladatok. Bujtás Ferenc (CZU7KZ) December 14, feladat: (A B A A \ C = B)

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Átírás:

Valószí ségszámítás és statisztika oktatási segédayag Kupá Pál

Tartalomjegyzék fejezet Valószí ségszámítási alapfogalmak 5 Eseméyek 5 M veletek eseméyekkel 5 2 A valószí ség fogalma 7 3 Valószí ségi változók 9 4 Nevezetes eloszlások 0 4 Diszkrét eloszlások 0 4 Biomiális eloszlás 0 42 Hipergeometrikus eloszlás 43 Poisso eloszlás 2 44 Geometriai eloszlás 3 42 Folytoos eloszlások 4 42 Egyeletes eloszlás 4 422 Normális eloszlás 4 423 t-eloszlás 5 424 χ 2 khi-égyzet) eloszlás 6 2 fejezet Bevezetés a statisztikába 7 2 Statisztikai mita, gyakoriság 7 22 A mita számszer jellemz i 8 23 Statisztikai becslések 2 23 Potbecslés 2 232 Itervallumbecslés 22 232 A várható érték becslése 22 24 Statisztikai hipotézisek vizsgálata 26 24 Egymitás u-próba 26 242 Egymitás t-próba 28 243 χ 2 -próba szórásvizsgálatra 28 3

TARTALOMJEGYZÉK 4 244 Kétmitás u-próba 29 245 Kétmitás t-próba 30 246 F-próba 30 25 Korreláció és regresszióaalízis 33 Irodalomjegyzék 36

FEJEZET Valószí ségszámítási alapfogalmak Eseméyek Modell: determiisztikus vagy sztochasztikus Kísérlet eredméye=elemi eseméy, jel ω, ω 2, Az elemi eseméyek halmazát jel Ω = {ω, ω 2, } = {ω i }, i I Eseméyek P Ω) -ba: biztos eseméy=midig bekövetkezik - azoosítjuk Ω-val lehetetle eseméy=soha em következik be - jel A P Ω) elletét eseméye=akkor következik be mikor A em - jel A Példa ) Kocka dobás: Ω = {ω, ω 2,, ω 6 } ahol ω i = a kocka i potot mutat elemi eseméy A =páros szám={ω 2, ω 4, ω 6 } A = páratlaszám = {ω, ω 3, ω 5 } Az egyszer ség kedvéért az elemi eseméyeket {, 2,, 6} = Ω alakba is felírhatjuk 2) Két kocka dobása: a kockákat külöböz ek tekitjük például piros, illetve kék szí ek) tehát az elemi eseméyek redezett párost alkotak:, ), 2), 6) Ω : 2, ) 2, 2) 2, 6) 6, ) 6, 2) 6, 6) A =a két kocka azoos potszámot mutat={, ), 2, 2),, 6, 6)} B =a kockák összege 0={4, 6), 6, 4), 5, 5), 5, 6), 6, 5), 6, 6)} 3) Pézérme dobása: Ω = { fej, írás } 4) Két érme dobása: Ω = { fej fej, fej írás, írás fej, írás írás } A =az érmék azoos jelt mutatak={ fej fej, írás írás } M veletek eseméyekkel A, B P Ω) 5

ESEMÉNYEK 6 eseméyek összeadása: A + B = A B - az az eseméy amely akkor következik be ha az A vagy a B bekövetkezik eseméyek szorzása: A B = A B - az az eseméy amely akkor következik be ha az A és a B bekövetkezik elletétes eseméy: A akkor következik be ha A em következik be eseméyek külöbsége A B = A B 2 Tétel A P Ω) halmaz a,,, m veletre ézve Boole algebrát képez, vagyis az alábbi tulajdoságok érvéyesülek: asszociativitás: A B C) = A B) C, A B C) = A B) C kommutativitás: A B = B A, A B = B A elyelési tulajdoság: A A B) = A, A A B) = A disztributivitás: A B C) = A B) A C), A B C) = A B) A C), komplemeter képzés: A A = Ω, A A = 3 Defiíció A P Ω),,,, Ω, ) struktúrát eseméytérek evezzük Az említett m veletekre az alábbi tulajdoságok is érvéyesülek: de Morga azoosságok: A B = A B, A B = A B, idempotecia: A A = A, A A = A, Ω =, = Ω, A = A 4 Defiíció Az A, B P Ω) eseméyeket egymást kizáróak evezzük ha egy-id be em következhetek be: A B = 5 Defiíció Az {A, A 2, } redszer az A P Ω) eseméy egy felbotását partícióját) képezi ha A i A j =, i j, A i = A i I Ha a Ω tér felbotását végeztük akkor azt modjuk, hogy {A, A 2, } egy teljes eseméy-redszer

2 A VALÓSZÍN SÉG FOGALMA 7 6 Defiíció Az A P Ω) algebrát alkot ha A A A A A, B A A B A Az Ω, A) párost eseméy-mez ek evezzük véges vagy végtele) 2 A valószí ség fogalma Feltételezzük, hogy Ω véges és az ω i elemi eseméyek el fordulásáak esélye azoos!) 7 Defiíció Az A P Ω) eseméy klasszikus értelembe vett valószí ségé az alábbi törtet értjük: 8 Példa P A) = A ak kedvező esetek száma összes eset ) Dobókocka A=a kocka 2 potot mutat 2-es), P A) = B=páros 6 szám, P B) = 3 6 2) Két dobókocka A=a két kocka 2, 6)-ost mutat, P A) = B=midkét 36 kocka azoos számot mutat, P B) = 6 C=a kockák összege 36 0, P C) = 6 3) Domió játék 36 egyformát emeljük ki 7 28 6, 6) 6, 5) 6, ) 6, 0) 5, 5) 5, 0), ), 0) 0, 0) Aak a valószí sége, hogy 9 Példa Osztozkodási feladat) Feltételezve, hogy egy játék megyeréséhez 0 csatát kell megyerie az A, illetve B játékosokak, hogya kell elosztai a yereméyt ha 8 7 állásál az A játékos javára) a játék félbemarad? Bizoyítás Figyelembe véve, hogy maximum 4 további csata eldöti a játék meetét a yereméyt a hátramaradt csaták yerési esély aráyába osztjuk el A lehetséges kimeetelek a következ k:

2 A VALÓSZÍN SÉG FOGALMA 8 A yer aaaa aaab aaba abaa baaa aabb abab baab abba baba bbaa B yer bbbb bbba bbab babb abbb ahol például babb azt jeleti, hogy az els, a harmadik és a egyedik csatát a B játékos yerte, a másodikat pedig az A játékos Természetese a fölösleges csatákat em szokták lejátszai Tehát aak a valószí sége, hogy A yer =, 6 míg B yerési esélye = 5 A yereméyt ugyaebbe az aráyba kell elosztai a 6 két játékos között A valószí ség axiomatikus értelmezése 0 Defiíció Valószí ségek evezük egy P : A [0, ] leképezést melyre az alábbi tulajdoságok érvéyesülek: P A) 0; P Ω) = biztos eseméy valószí sége =); P A B) = P A) + P B), ha A B = A Ω, A, P ) hármast valószí ségi-mez ek evezzük Tétel Tulajdoságok ) P ) = 0 2) P A ) = P A) 3) P B A) = P B) P A B) 4) A B P A) P B) 5) P A B) = P A) + P B) P A B) 6) P A B) P A) + P B) 2 Példa Domió játék Mi aak a valószí sége, hogy a következ kogurációt folytassuk? 3, 4) 4, 0) 0, 0) 0, 3) 3, 2) 3, 4) 4, 0) 0, 0) 3, 4) 4, 0) 0, 0) 0, 3) 3 Defiíció Feltételes valószí ség P B) 0): P A B) = P A B) P A)

3 VALÓSZÍN SÉGI VÁLTOZÓK 9 Teljes valószí ség és Bayes képlet: Ha A i az Ω egy teljes felbotását jeleti és B Ω Szorzási képlet: P B) = P A ) P A B) + P A 2 ) P A2 B) + P A B) = P A) P A B) 4 Defiíció Az A és B eseméyek függetleek ha P A B) = P B) 5 Tétel Ha A és B függetleek akkor P A B) = P A) P B) Ω, ω i 3 Valószí ségi változók X : ω i x Diszkrét vv X Ω) = {x, x 2,, x } lehetséges értékek P X = x i ) = p i X vv eloszlása eloszlása: X : x x 2 x p p 2 p ) 6 Példa Dobókocka X : 2 6 6 6 6 ) 7 Defiíció Eloszlásfüggvéy: F : R R 3) F x) = P X < x) Tulajdoságok: F ) = 0; F ) = F szakadásos lépcs s) F mooto övekv

8 Példa X : 9 Tétel 4 NEVEZETES ELOSZLÁSOK 0 0 2 3 2 6 0, x, ] ), x, 0] 3 akkor F x) = 5, x 0, 2] 6, x 2, ) P a X < b) = F b) F a) Bizoyítás A = X < a, B = X < b P a X < b) = P A B) = P B A) = P B) P A B) = P B) P A) = F b) F a) 20 Példa Mote Carlo rulett 0-36 0=zöld, páratla,3,,35)= piros, páros 2,4,,36)= fekete Ha eurót teszük fel pirosra és piros jö ki yerük egy eurót, külöbe elveszítjük az eurót Az általuk yert összeg egy X vv Adjuk meg a vv eloszlását, az eloszláfggv, ábrázolás Várható érték, szórás Mi törtéik akkor ha a 0-ra egy fél eurót visszakapuk a másik fél a baké)? 2 Példa 2 kocka összege egy S vv Adjuk meg az S eloszlását, várható értékét, szórását! Ha X, Y vv a két kocka által mutatott potok, milye összefüggés va az S és az X, Y, illetve a várható értékek és szórások között? 22 Példa Játék 2 kocka Ha az összeg 2 vagy 2 kapok 8 lejt, ha az összeg 7 a leggyakoribb) kapok 2 lejt Ezekívül zetek lejt A yert összeg egy X vv Adjuk meg a vv eloszlását, az eloszláfggv, ábrázolás Várható érték, szórás Korrekt játék? 4 Nevezetes eloszlások 4 Diszkrét eloszlások 4 Biomiális eloszlás Ha egy kísérlet folyamá egy A eseméy valószí sége p = P A) em módosul, akkor aak a valószí sége, hogy kísérletb l az A eseméy k-szor el forduljo: 4) b, k; p) = C k p k q k), ahol q = p Az eloszlás jól modellezhet egy urával amelybe N golyó va ezek közül N egy szí piros) N N ) más szí fehér)) és amelyb l - visszatevéssel -

4 NEVEZETES ELOSZLÁSOK kiemelük -szer egy-egy golyót Ha A-val jelöljük a kiemelt golyó piros eseméyt amiek a valószí sége N := p, akkor aak valószí sége, hogy az kiemelt N golyóból k-szor piros forduljo és k)-szor fehér) a 4) képlettel kapjuk meg 23 Példa Egy dobozba 7 piros és 3 fehér golyó va 2 alkalommal visszatevéssel) kiemelük egy-egy golyót Mi a valószí sége aak, hogy a piros golyó 8 -szor szerepelje? A=a golyó piros p = 7, b 2, 8; p) = 7 ) 8 3 4 0 C8 2 0 0) = 023 24 Példa Egy dobókockát 0 -szer dobuk fel Mi a valószí sége, hogy legalább 8-szor lesz páros szám? A=páros szám p =, b 0, 8; p)+b 0, 9; p)+b 0, 0; p) = 8 2+ 2 C8 0 2) 2) C0 9 9 2) 2) + C 0 ) 0 ) 0 0 2 2 = 00547 25 Defiíció Egy X vv biomiális eloszlást követ ha eloszlása ) k 42) X : Cp k k q k) k=0,, 26 Tétel A 42) biomiális eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D 2 X) = pq 27 Példa Egy dobókockát 4-szer dobuk fel Jel X-el a páros számok megjeleéséek a vv Adjuk meg az X eloszlását Mi a valószí sége aak, hogy legfeljebb 3-ast dobuk? A = páros szám P A) = X : 2 C4 0 ) 0 ) 4 C ) ) 3 2 2 4 C 2 ) 2 2 2 4 2 2 0 2 3 4 P "legfeljebb 3") = P X = 0) X = ) X = 2) X = 3)) = P X = 0)+ P X = ) + P X = 2) + P X = 3) = P X = 4) = 5 6 42 Hipergeometrikus eloszlás Az eloszlás jól szemléltethet az urás modellel: Egy urába va N golyó amib l N piros Az urából kiemelük golyót visszatevés élkül Aak a valószí sége, hogy a kiemelt golyókból potosa k golyó lesz piros: ) 2 4 6 ) 43) P, k) = Ck N C k C N N N

4 NEVEZETES ELOSZLÁSOK 2 A feti képletbe feltételezzük, hogy a létezési feltételek teljesülek: N, stb 28 Példa Egy urába 5 piros és 3 fehér golyó va Visszatevés élkül kiemelük 6 golyót Mi a valószí sége, hogy a kiemelt golyókból potosa 4 piros? P 6, 4) = C4 5 C2 3 = 05357 C8 6 29 Defiíció Egy X vv hipergeometrikus eloszlást követ ha eloszlása 44) X : k C k N C k N N C N k=0,, 30 Tétel A 44) hipergeometrikus eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D 2 X) = pq ), N ahol p = N N, q = p 3 Példa Adjuk meg az X vv ha X a 6/49 Lottó yer számaiak a valószí ségi változója Mi a valószí sége, hogy legalább 5-ös találatuk legye? Számítsuk ki az átlagot, illetve a szórást! ) 0 2 3 4 5 6 X : C 0 6 C6 43 C 6 49 C 6 C5 43 C 6 49 C 2 6 C4 43 C 6 49 C 3 6 C3 43 C 6 49 0324 5420 398386 P legalább 5 találat") = P "potosa 5 találat")+p "potosa 6 találat") = + = 852 5420 398386 0 5 = 6, p = 6 MX) = 6 6 = 073, átlagba 073 találatuk lesz! 49 49 D 2 X) = 6 6 43 49 49 5 48) = 057 DX) = 076 43 Poisso eloszlás 32 Defiíció Egy X vv λ > 0 paraméter Poisso eloszlást követ ha eloszlása: ) 45) X : k λ k k! e λ k=0,,2, 33 Tétel A 45) Poisso eloszlást követ X vv várható értéke, szóráségyzete: M X) = λ, D 2 X) = λ

4 NEVEZETES ELOSZLÁSOK 3 A Poisso eloszlás a biomiális eloszlás határesetekét is értelmezhet : és λ = p álladó, ugyais ) k λ λ k = ) lim b, k, p) = lim C k p k p) k! = lim k! k)! = λk k! lim! λ ) λ k)! k ) λ k) = λk k! e λ 34 Példa A λ = paraméter Poisso eloszlása k = 2-re P X = 2) = 3 3) 2 e 3 = 00398 és az X eloszlása: 2! ) 0 2 3 X : 0765 02388 00398 λ3 3! e λ 44 Geometriai eloszlás Aak a valószí sége, hogy egy A eseméy csak) a k-ik kísérletél következze be: ahol p = P A), q = p P = pq k, 35 Példa Mi a valószí sége, hogy egy pézérme feldobásáál csak az 5 -ik dobásál legye fej? P = ) 4 2 2 = 32 36 Defiíció Egy X vv geometriai eloszlást követ ha eloszlása: ) k 46) X : pq k k=,2, 37 Tétel A 46) geometriai eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D2 X) = p p 2 38 Példa Jel X-el azt a vv ami az érme csak) a k-ik dobásáál mutat fejet Adjuk meg az X eloszlását és várható értékét ) 2 3 4 5 X :, és M X) = 2 2 4 8 6 32

42 Folytoos eloszlások 42 Egyeletes eloszlás 4 NEVEZETES ELOSZLÁSOK 4 39 Defiíció Egy X vv egyeletes eloszlást követ ha s r ségfüggvéye: { x [a, b] b a) 47) f x) = 0 külöbe 40 Tétel A 47) egyeletes eloszlást követ X vv várható értéke, szóráségyzete: M X) = a + b 2, D2 X) = b a)2 2 422 Normális eloszlás Az Euler-féle gamma fggv 4 Defiíció Euler-féle gamma fggv evezzük az alábbi fggv-t: Γ p) = ˆ p =, 2 a gamma függvéy értéke Γ ) = Γ 2) = ˆ 0 ˆ e x dx = e x 0 = 0 x p e x dx, p > 0 ˆ xe x dx = x e x) ) dx = x e x 0 + ˆ e x dx =, 0 illetve további p pozitív egészekre: Γ p + ) = ˆ 0 ˆ x p e x dx = x p e x) dx = x p e x) 0 0 ˆ + p x p e x dx = pγ p) vagyis 0 0 0 48) Γ p + ) = pγ p) A 48)-b l következik, hogy Γ p + ) = p p ) Γ ), és 49) Γ p + ) = p!,

4 NEVEZETES ELOSZLÁSOK 5 vagyis a Γ függvéy általáosítása a faktoriális függvéyek 42 Tétel Euler-féle tükrözési képlet 40) Γ x) Γ x) = π si πx Az el bbi tételb l x = -re következik, hogy 2 ) 4) Γ = π 2 43 Defiíció Gauss-féle itegrál I = ˆ 0 e x2 dx A Gauss itegrál kifejezhet a gamma függvéy segítségével: ) ˆ Γ = x 2 e x dx = π, 2 0 ahoa x = t 2 változócserével következik dx = 2t dt és ˆ t 2 ) 2 e t 2 2t dt = π vagyis 0 ˆ 0 e t2 dt = π 2 44 Defiíció Egy X vv m, σ m R, σ R +) paraméter ormális eloszlást követ ha s r ségfüggvéye: f x) = σ 2π e 2 x m σ ) 2, x R Az m és σ jeletése: M X) = m várható érték, D X) = σ a szórás 423 t-eloszlás 45 Defiíció Egy X vv t Studet) ν-szabadságfokú eloszlást követ ha s r ségfüggvéye: f x) = Γ ) ν+ 2 Γ ) ν 2 νπ ) + x 2 ν+, x R 2 ν Ha ν az eloszlás közelíti a stadard ormális eloszlást

424 χ 2 khi-égyzet) eloszlás 4 NEVEZETES ELOSZLÁSOK 6 46 Defiíció Egy X vv ν-szabadságfokú χ 2 eloszlást követ ha s r ségfüggvéye: f x) = x ν 2 2 e x 2 2 ν 2 Γ ), x R ν 2

2 FEJEZET Bevezetés a statisztikába 2 Statisztikai mita, gyakoriság Alapsokaság =a statisztikai meggyelés tárgyát képez egyedek összessége, halmaza Statisztikai mita=az alapsokaságból kiválasztott egyedekhez tartozó adatok A mita kiválasztásáál gyeli kell, hogy a mita reprezetatív legye, vagyis az adott sokaságot jellemezze Egy X,, X mita elemei is valószí ségi változók mert értékük jel x,, x ) a mitázási techikától vagyis a véletlet l függ Ezeket a változókat függetleek és azoos eloszlásúak tekitjük A bel lük képzett valószí ségi változók statisztikai függvéyekek vagy egyszer e statisztikák ak evezzük Mivel ezeket tapasztalati úto szerezzük empirikus vagy tapasztatlati statisztikákak evezzük 7

22 A MINTA SZÁMSZER JELLEMZŽI 8 22 A mita számszer jellemz i Jelöljük X, X 2, X egy mita elemeit Mitaátlagak mitaközép, empirikus várható érték) evezzük az alábbi mér számot 22) X = X + + X i= = X i Ha X -el toljuk el az X mitát akkor eek a várható értéke ulla Xi X ) = 0 i= Az átláthatóság érdekébe gyakra csoportosítjuk az adatokat például övekv sorredbe), vagy osztályokba redezzük 47 Példa Az X : 6, 2, 7, 2, 5, 3, 7, 3, 4, 6, 4, 5, 4, 8, 4, 5, 6, 7, 5, 9, 5, 3, 5, 6, 6, 7, 6, 7, 5, 7, 3, 8, 2, 8, 5, 6, 8, 3, 6, 5 mita átlaga X = 6 + 2 + + 2)/40 = 5325 A mita átláthatóbb ha övekv sorredbe redezzük X : 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, illetve csoportosítjuk X i 2 3 4 5 6 7 8 9 f i 3 5 4 9 8 6 4, ahol f i az X i gyakorisága Az alábbi ábrá látható a megfelel empirikus eloszlás és az eloszlásfüggvéy ABRA eloszlasfggveps Az adatokat gyakra osztályokra botjuk osztály oszt közép X i gyakoriság f i rel gyak g i kumulált rel gyak i g i 2 4 3 2 2/40 2/40 5 6 55 7 7/40 29/40 7 9 8 /40 Az osztályok száma általába= -hez közeli érték, de szükség szerit változtatható az osztályok száma, hossza Csoportosított adatok eseté az átlag: 222) X = f X + + f k X k k i= = f ix i f + + f k 48 Példa Az el bbi mitát véve alapul a mitaátlag X = 3 2+5 3+4 4+9 5+8 6+6 7+4 8+ 9 3+5+4+9+8+6+4+ = 5 325, vagy az osztály csoportosítást véve alapul X = 3 2+55 7+8 40 = 5 437 5 Habár az utolsó eredméy em egyezik meg potosa az el bbivel, az osztályokra

22 A MINTA SZÁMSZER JELLEMZŽI 9 való csoportosítás haszos mert megköyíti az adatok feldolgozását f leg agy számú mita eseté A mitára egy másik jellemz adat a módusz, vagyis a leggyakrabba el forduló adat Az el bbi példába Mod = 5 mivel eek a legagyobb a gyakorisága= 9 Egy másik szám amivel jellemezhet a mita a mediá, illetve általáosítása a kvartilisek, kvatilisek A mediá a mita közepét jelöli, vagyis ha X X a redezett mita, akkor 223) Me = { Xm+ ha = 2m + Xm +X m+ ha = 2m 2 Az els, második és harmadik kvartilis a mita egyedét, felét, háromegyedét jelöli A második kvartilis megegyezik a mediáal A p-kvatilisek a kvartilisek általáosításai 49 Példa Az adott mita mediája Me = 5, és az els, második, harmadik kvartilise egyel redre 4, 5, 7-el A mitaterjedelem a mita legagyobb és legkisebb érték közötti külöbség 224) R = X X Az említett mér számoko kívül szóródási mutatókat is számítuk A tapasztalati szóráségyzet s 2, a mitaelemek mitaközépt l való eltérései égyzetéek átlaga, azaz 225) s 2 X X ) 2 + + X X ) 2 i= Xi X ) 2 = = Kis miták esetébe a korrigált tapasztalati szóráségyzetet s 2 haszáljuk: 226) s 2 X X ) 2 + + X X ) 2 i= Xi X ) 2 = = A tapasztalati s, illetve korrigált szórás s 227) s = s 2 = 228) s = s 2 = i= i= Xi X ) 2, Xi X ) 2

A 227),228)-b l következik, hogy 22 A MINTA SZÁMSZER JELLEMZŽI 20 s s = vagyis agy értékre a két szórás megegyezik Csoportosított adatok eseté a szórásokat a 229) 220) s = s = k k i= f i i= f i Xi X ) 2 Xi X ) 2 képletekkel számítjuk ki ahol k a csoportosítás utá létrejött osztályok számát jelöli Az Excelbe a következ függvéyekkel számítjuk ki az ismertetett paramétereket: ÁTLAG), MÓDUSZ), MEDIÁN), SZÓRÁSP), SZÓRÁS)

23 STATISZTIKAI BECSLÉSEK 2 23 Statisztikai becslések A mitavételezés els dleges célja, hogy iformációkat szolgáltasso az alapsokaság jellemz ire, például a várható értékre, szórásra 23 Potbecslés Egy becslés akkor tekithet jóak ha eleget tesz legalább az egyikek az alábbi követelméyekek: torzítatla, hatásos, kozisztes, elégséges 50 Tétel A mitaátlag torzítatla becslést ad az X alapsokaság várható értékére, vagyis 23) M X ) = M X) Bizoyítás A várható érték additivitását és homogeitását felhaszálva következik, hogy M X ) ) X + + X = M = M X + + X ) = M X ) + + M X )) = M X) + + M X)) = M X) = M X) 5 Tétel Az empirikus korrigált szóráségyzet torzítatla becslést ad az X alapsokaság D 2 X) szóráségyzetére, vagyis M s 2) = D 2 X) s 2 = Bizoyítás i= Xi X ) 2 Xi 2 + i= = i= X 2 2X X = i= ) Xi 2 + X 2 2X i X = Xi 2 + i= Xi 2 + X 2 2X 2 = i= X 2 2X i= Xi 2 X 2 i= X i = Figyelembe véve, hogy M X ) = M X), M X i ) = M X) következik M s 2) = ) M Xi 2 X 2 = ) M X 2 i M Xi ) 2) M X 2) M X ) ) 2 = i= i= D 2 X i ) D 2 X ) = D2 X) 2 D2 X) = D2 X), i= i=

23 STATISZTIKAI BECSLÉSEK 22 tehát a s 2 torzított becslést ad, viszot becslése torzítatla M s 2 ) = D 2 X) s2 =: s 2 a korrigált empirikus szórás 52 Tétel Az empirikus korrigált szóráségyzet kozisztes becslést ad az X alapsokaság D 2 X) szóráségyzetére, vagyis lim D2 s 2) = 0 232 Itervallumbecslés Az el bbi fejezett l eltér e ebbe a fejezetbe egy szimmetrikus) kodecia megbízhatósági) itervallumot állapítuk meg amely agy valószí séggel tartalmazza az alapsokaság jellemz jét Az említett agy valószí séget p) -vel jelöljük, kodecia megbízhatósági) szit ek evezzük és a leggyakrabba 099, 095 vagy 090 értékeket veszi fel A megfelel p értéket 00, 005, 0) tévedési vagy szigikaciaszit ek evezzük Egy X valószí ségi változó m,σ paraméter, ormális eloszlás úak evezzük jele X N m, σ)) ha s r ségfüggvéye: f x) = σ x m) 2 2π e 2σ 2, x R ABRA ormeloszlaseps Az X változót stadard ormális eloszlásúak evezzük ha X N 0, ) Aak a valószí ségét, hogy az X kisebb legye egy adott x értékél az F eloszlásfüggvéyel fejezzük ki: P X < x) = F x) = σ 2π ABRA ormeloszlasfggveps 232 A várható érték becslése ˆ x e t m)2 2σ 2 dt 53 Tétel Ha X,, X N m, σ) ormális eloszlású változók akkor X = X ) + + X σ N m, Bizoyítás M X ) ) X + + X = M = D 2 X ) ) = D 2 X + + X M X i ) = m = m i= = 2 i= D 2 X i ) = 2 σ2 = σ2,

23 STATISZTIKAI BECSLÉSEK 23 ahoa D X ) = σ 2 = σ 54 Következméy Az 232) u = X m σ változó stadard ormális eloszlású u N 0, ) Ajálott a stadard eloszlás el yeit szimmetria, egyszer bb képlet, táblázatba megadott értékek) kihaszáli ezért a 232) stadardizálással bármely N m, σ) ormális eloszlás visszavezethetük a N 0, ) stadard ormális eloszlásra Mivel u N 0, ) a kodecia-itervallumot a 0-ra szimmetrikusa [ u p, u p ] fogjuk meghatározi 233) P u p X m σ < u p ) = p Következik, hogy tehát ahoa Φ u p ) Φ u p ) = p, 2Φ u p ) = p, 234) Φ u p ) = p 2, ahol Φ a stadard eloszlás eloszlásfüggvéye Az 234) képletb l kiszámítható u p értéke 235) u p = Φ p ), 2 amiek segítségével megszerkesztjük a kodecia-itervallumot u p X m σ < u p A m veletek elvégzése utá kapjuk az m várható értékre igaz a alábbi egyel tleség X u p σ < m X + u p σ

23 STATISZTIKAI BECSLÉSEK 24 Tehát az m kodecia-itervallumakét haszáljuk a ] σ σ 236) X u p, X + u p, ami azt jeleti hogy az alapsokaság m várható értéke p valószí séggel esik ebbe az itervallumba Az Excelbe a ϕ ormális s r ség eloszlást, illetve Φ eloszlásfüggvéyt a NORMELOSZL) függvéyel számítjuk ki Az eloszlásfüggvéy iverzét a INVERZNORM) függvéyel számítjuk ki 55 Példa Az el bbi példa adataira határozzuk meg a kodecia-itervallumot 95%-os megbízhatósági szite ha az alapsokaság szórása ismert σ = 83 Az u p = ) = 96, tehát a kodecia-itervallum 5325 96 83 40, 5325 + 96 83 Φ 005 2 = 47579, 5892], vagyis 95%-os valószí séggel az alapsokaság várható értéke ebbe az itervallumba található Nagyobb valószí ség eseté az itervallum b vül Például 99%-os megbízhatósági szite u p = 25758 és az itervallum 45797, 60703] Ha az alapsokaság szórása ismeretle akkor σ helyett az s mita korrigált szórást helyettesítve az u 232) kifejezésbe a 237) t = X m s valószí ségi változót kapjuk, amely egy szabadságfokú t Studet) eloszlású valószí ségi változó A 233) hasolóa, a t-eloszlás táblázatából kikeressük azt a t p értéket amelyre P t p X m s t p ) = P t t p ) = p, vagyis aak a valószí sége, hogy t értéke a [ t p, t p ] itervallumba esse egyel p)-vel, ami ekvivales azzal, hogy aak a valószí sége, hogy az alapsokaság m várható értéke a 40 ] 238) [X t p s, X + t p s ], kodecia itervallumba esse egyel p)-vel

23 STATISZTIKAI BECSLÉSEK 25 Ha az el bbi példába a szórás ismeretle akkor helyette haszáljuk a korrigált szórást s = 832, a t-eloszlás táblázatából p = 095 és df = 39 szabadságfokak megfelel a t p = 20227 érték, tehát a kodecia-itervallum [ 5325 20227 832, 5325 + 20227 832 ] = [4739 4, 590 6] 40 40 A t-eloszlásfüggvéyt az Excelbe a TELOSZLÁS) függvéyel, az iverzét INVERZT)-vel számítjuk ki

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 26 24 Statisztikai hipotézisek vizsgálata A statisztikai vizsgálatok sorá hipotéziseket feltételezéseket) teszük az alapsokaság bizoyos jellemz ire várható érték, szórás, eloszlás, függetleség, stb) A vizsgálat egy alap- vagy ullhipotézis jel H 0 ) és egy ellehipotézis jel H) felállításából áll majd ezek helyességéek elle rzéséb l Például, ha egy X alapsokaságra szereték leelle rizi, hogy a várható értéke M X) = m egyel e egy m 0 értékkel akkor a ullhipotézis 24) H 0 : M X) = m 0 A vele szembe felállítadó ellehipotézis kétféle lehet: kétoldali vagy egyoldali A kétoldali ellehipotézis 242) H : M X) m 0 míg az egyoldali 243) H : M X) < m 0 vagy H : M X) > m 0 Alapszabálykét, ha elfogadjuk a ullhipotézist elvetjük az ellehipotézist és fordítva, ha elvetjük a ullhipotézist elfogadjuk az ellehipotézist Az eljárást amellyel a ullhipotézist elfogadjuk vagy elvetjük statisztikai próbáak evezzük A dötést statisztikai függvéyek segítségével hozzuk meg amit a mitából számítuk ki bizoyos p megbízhatóság szit mellett Eek elleére, a dötés eredméye, mivel valószí ségi értékek alapjá hozzuk, lehet hibás is Els fajú hibát követük el ha elvetjük az igaz H 0 hipotézist Másodfajú hibát követük el ha elfogadjuk a hibás H 0 hipotézist A hibás dötés valószí sége az els - és másodfajú hiba valószí ségeiek összegéb l adódik P hiba) = P els fajú hiba) + P másodfajú hiba) Az alábbi táblázat a helyes és hibás dötéseket szemlélteti H 0 igaz H 0 hamis H 0 elfogadása helyes dötés másodfajú hiba H 0 elvetése els fajú hiba helyes dötés 24 Egymitás u-próba Feltételezzük, hogy adott egy X N m, σ) ormális eloszlású valószí ségi változó amelyek m várható értékét em, de σ

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 27 szórását ismerjük Vizsgáli szereték, hogy a várható érték M X) = m megegyezike egy m 0 értékkel Eek érdekébe egy X, X 2,, X elem mitát veszük amelyek X átlaga csak közelítei fogja m értékét Ha a ullhipotézis H 0 : M X) = m 0 igaz a kétoldali ellehipotézissel szembe akkor a H : M X) m 0 244) u = X m 0 σ próbafüggvéy stadard ormális eloszlású u N 0, ), és p valószí séggel esik a [ u p, u p ] kodecia-itervallumba, ahol u p a táblázatból kiolvasott, p szitek megfelel érték Tehát a H 0 ullhipotézist elfogadjuk ha 245) u u p, vagyis az u bee va az elfogadási tartomáyba Ebbe az esetbe azt modjuk, hogy az alapsokaság várható értéke és az m 0 feltételezett érték külöbsége em szigikás A ullhipotézist elvetjük az ellehipotézist elfogadjuk) ha 246) u > u p, vagyis ha az u a kritikus tartomáyba va Ebbe az esetbe az alapsokaság várható értéke és az m 0 feltételezett érték között szigikás eltérés va 56 Példa Egy gépet 55 cm pálcikák vágására állították be A beállítás elle rzésére egy 40 elem mitát veszek: 6, 2, 7, 2, 5, 3, 7, 3, 4, 6, 4, 5, 4, 8, 4, 5, 6, 7, 5, 9, 5, 3, 5, 6, 6, 7, 6, 7, 5, 7, 3, 8, 2, 8, 5, 6, 8, 3, 6, 5 p = 5%-os tévedési szite, kell-e állítai a gépe ha a pálcikák hosszáak szórása ismert σ = A pálcikák hossza ormális eloszlást követ amiek szórása ismert A várható értékre a hipotézisek H 0 : M X) = 55 H : M X) 55

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 28 A mita átlaga X = 5325, tehát a 244) képletb l u = 5325 55 40 = 06 8, és a táblázatból u p=005 = 96 Mivel u u p a ullhipotézist elfogadjuk, vagyis 095 valószí séggel az alapsokaságba a pálcikák hossza em tér el szigikása az 55 értékt l, a gép jól m ködik 242 Egymitás t-próba A legtöbbször a ormális eloszlású alapsokaság szórását em ismerjük Ebbe az esetbe a Studet-féle eloszlást haszáljuk A ullhipotézis elle rzésére a H 0 : M X) = m 0 247) t = X m 0 s próbastatisztikát haszáljuk, ahol a mitaszám, X a mitaátlag és s a mita korrigált szórása Az u próbához hasolóa a ullhipotézist p szigikacia szite fogadjuk el ha 248) t t p ahol t p értékét a Studet-féle táblázatból határozzuk meg szabadságfok és p szigikaciáak megfelel e 57 Példa Ha az el bbi példába a pálcikák szórása ismeretle akkor t = 5325 55 832 40 = 0604 4, és a p = 005 szigikacia szitek, illetve df = 39 szabadságfokak megfelel a t p = 20227 érték Mivel t t p következik, hogy 095 megbízhatósági szite a ullhipotézist elfogadjuk Az alábbi ábrá látszik, hogy a t számított érték bee va a megbízhatósági tartomáyba ABRA megbizhattartomeps Az Excelbe lásd ZPRÓBA), TPRÓBA) 243 χ 2 -próba szórásvizsgálatra A hipotézis vizsgálatot szórásra is elvégezhetjük Feltételezzük, hogy X N m, σ) egy ormális eloszlású valószí ségi változó és vizsgáli szereték, hogy a szórás értéke D 2 X) = σ megegyezik-e egy σ 0 értékkel, vagyis származhat-e egy adott mita σ 0 szórású alapsokaságból? A ull-illetve

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 29 ellehipotézisek H 0 : σ = σ 0 H : σ σ 0 kétoldali ellehipotézis H : σ < σ 0 vagy σ > σ 0 egyoldali ellehipotézis A kiválasztott elem mitába kiszámítjuk az s 2 korrigált szóráségyzetet és a χ 2 próbastatisztikát 249) χ 2 ) s 2 =, σ0 2 majd összehasolítjuk a táblázatbeli χ 2 khi-égyzet) értékkel Ha χ 2 bee va a megbízhatósági tartomáyba 240) χ 2 < χ 2 akkor a ullhipotézist elfogadjuk 58 Példa Az adott mita származhat-e egy alapsokaságból amelyek szórása kisebb mit 5? A mita agysága = 40, és a korrigált szórás s = 83, tehát χ 2 = 39 832 5 2 = 58 048, míg a táblázatbeli érték χ 2 = 5457, tehát a 240) em teljesül, a ullhipotézist elvetjük 95%-os megbízhatóság mellett 244 Kétmitás u-próba Legye X N m X, σ X ) és Y N m Y, σ Y ) két függetle, ormális eloszlású valószí ségi változó, amelyekek ismerjük a σ X, illetve σ Y szórásait Legye X, X 2, és Y, Y 2, a változók egy X, illetve Y elem mita Vizsgáli kell, hogy a két sokaság várható értéke megegyezik-e Ha 24) H 0 : M X) = M Y ) ullhipotézis teljesül a 242) 243) H : M X) M Y ) ellehipotézissel szembe, akkor az H : M X) < M Y ) vagy M X) > M Y ) 244) u = X Y σ 2 X X + σ2 Y Y

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 30 próbastatisztika N 0, ) eloszlású, ahol X, Y az adott miták átlagai Az egymitás próbához hasolóa, a számított u változó p valószí séggel esik a [ u p, u p ] kodecia-itervallumba, ahol u p a táblázatból kiolvasott, p szitek megfelel érték Tehát a H 0 ullhipotézist elfogadjuk ha 245) u u p és ebbe az esetbe azt állítjuk, hogy a két mita várható értékei között ics szigikás eltérés 245 Kétmitás t-próba Az el bbi alpothoz hasolóa az X N m X, σ X ) és Y N m Y, σ Y ) miták várható értékéek a vizsgálatát végezzük ha a miták szórásai ismeretleek de feltehet e azoosak Ebbe az esetbe a 24) ullhipotézis helyességét a 246) t = X Y s X + Y X + Y 2 szabadságfokú Studet-eloszlású próbastatisztikával végezzük, ahol S a két mita alapjá becsült közös szórás 247) S 2 = X ) s 2 X + Y ) s 2 Y, X + Y 2 és s X, s Y a két mita korrigált szórása A H 0 242) ullhipotézist elfogadjuk ha t a [ t p, t p ] megbízhatósági itervallumba esik, vagyis t t p A kétmitás t-próba csak azoos szórású mitára alkalmazzuk, eek elle rzésére viszot az F-próbát Fisher) haszáljuk 246 F-próba Az F-próbával két X N m X, σ X ) és Y N m Y, σ Y ) függetle változó szórásaiak D X) = σ X, illetve D Y ) = σ Y összehasolítását végezzük A ullhipotézis 248) H 0 : σ X = σ Y és a megfelel egyoldali, illetve kétoldali hipotézisek

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 3 249) 2420) H : σ X σ Y H : σ X < σ Y vagy σ X > σ Y Jelöljük S 2, illetve s 2 -el a két alapsokaságból kiválasztott mita korrigált szóráségyzeteiek maximumát, illetve miimumát 242) S 2 = max ) s 2 X, s 2 Y, s 2 = mi ) s 2 X, s 2 Y és jelöljük DF, illetve df -el a megfelel miták szabadságfokát Képezzük a 2422) F = S2 s 2 statisztikát amely DF, df ) szabadságfokú F-eloszlást követ A Fisher táblázatból kikeressük a F p p-szigikacia szitek megfelel értéket és ha 2423) F F p, akkor a H 0 hipotézist p szigikacia szite elfogadjuk, vagyis a szórások közötti eltérés a véletleek tulajdoítható A kétmitás próbáak az alkalmazásához szükséges a szórások egyel sége amit az F-próbával vizsgáluk) Ha ez em teljesül akkor a Welch próbát alkalmazzuk 59 Példa Két terület ph értékét mérve az alábbi mitákat kapták X i 63 62 60 63 67 64 67 66 Y j 62 6 62 60 64 64 63 67 60 62 Állítható-e, hogy a két terület talaj ph várható értéke megegyezik 95% megbízhatósági szite? Bizoyítás A két mita átlagai X = 64, Y = 625 és korrigált szórásai s X = 02507, s Y = 022 Az alapsokaság várható értékére a ull-hipotézisek H 0 : M X) = M Y ) és kétoldali ellehipotézis H : M X) M Y )

24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 32 Mivel az alapsokaság szórásait em ismerjük a kétmitás t-próbát haszáljuk, de ehhez a szórások egyel ségét kell leelle rizi F-próbával H 0 : D X) = D Y ) H : D X) D Y ) A 242) képletb l S 2 = 02507 2 = 0062 85, s 2 = 022 2 = 00 498 6, és DF = X = 7, df = Y = 9, majd 2422)-b l F 0062 85 = = 260 5 A 7, 9) 00 498 6 szabadságfok és p = 005 -ek megfelel kétoldali Fisher táblázatbeli érték F p = 497 Mivel F < F p a szórások egyel ségére voatkozó ullhipotézist elfogadjuk σ X = σ Y ) A továbbiakba a t-próbát haszálva vizsgáljuk, hogy a két várható érték egyel -e A 247) képletb l S 2 = 8 ) 025072 + 0 ) 022 2 = 00528, 8 + 0 2 majd 246)-b l t 64 625 = = 376 2 00528 + 8 0 A t-eloszlás táblázatba 8 + 0 2 szabadságfok és p = 005 szigikacia szitek t p = 22 érték felel meg ahoa t < t p, tehát a ullhipotézist megtartjuk, vagyis a két talaj ph várható értéke egyel ek tekithet az adott szigikacia szite a külöbség a véletleek tulajdoítható)

25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 33 25 Korreláció és regresszióaalízis A korreláció-aalízis két változó X és Y kapcsolatáak szorosságát vizsgálja A regresszióaalízis a változók közötti összefüggést függvéyszer e írja le A leíró függvéyt regressziós függvéyek evezzük A változók közötti szorosságot a korrelációs együtthatóval mérjük ρ = M X M X)) Y M Y ))) D2 X) D 2 Y ) amely és közötti értékeket vesz fel = ρ M XY ) M X) M Y ) D X) D Y ) Ha X és Y függetleek akkor ρ = 0 fordítva viszot em igaz Ha ρ = 0 akkor azt modjuk, hogy X és Y korrelálatlaok Az X és Y között aál szorosabb a kapcsolat miél közelebb va ρ abszolút értéke -hez X és Y között Y = ax + b lieáris kapcsolat va ρ = Legye X, X 2,, X és Y, Y 2,, Y két elem mita a két alapsokaságból Az r tapasztalati korrelációs együttható i= Xi X ) Y i Y ) 25) r = Yi Y ) = 2 i= Xi X ) 2 i= 252) = i= X iy i i= X i i= X2 i i= X i) 2 i= Y i ) i= Y i 2 ) i= Y i) 2 Statisztikai próbával kell eldötei, hogy az alapsokaságok amelyb l az X és Y miták származak korreláltak-e vagy sem Jelöljük ρ-val az alapsokaságok korrelációs együtthatóját Ekkor a ull, illetve ellehipotézis: H 0 : ρ = 0 H : ρ 0 a próba statisztika pedig 253) t ρ = r, r 2 2

25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 34 amely df = 2 szabadságfokú t eloszlást követ Ha egy adott p megbízhatósági szitek a t ρ bee va az elfogadási tartomáyba t p, t p ), akkor a ullhipotézist elfogadjuk, külöbe elvetjük Ha a korrelációs együttható 0 és X, Y ormális eloszlásúak, akkor függetleek is, külöbe csak korrelálatlaok Ha X ás Y között lieáris kapcsolat va akkor Y = ax + b és a mitákat felhaszálva becslést kell adi az a és b paraméterekre Az egyik módszer az úgy evezett legkisebb égyzetek módszere A módszer abba áll, hogy az y = ax + b egyees és a mitába szerepl potok közötti függ leges távolságok égyzeteiek összege miimális legye ABRA lmeps Matematikailag a 254) F a, b) = Y i ax i + b)) 2 mi i= kétváltozós függvéy meghatározását jeleti A stacioárius potok { F a = 0 F b = 0, amiek megoldása a következ lieáris egyeletredszerhez vezet { i= 2 y i ax i b) X i ) = 0 i= 2 Y i ax i b) ) = 0, amely átredezve az alábbi ormálegyeletredszert eredméyezi { b + a i 255) X i = i Y i b i X i + a i X2 i = i X, iy i amiek megoldása 256) b = i= X i= iy i X i i= Y i i= X2 i i= X i) 2, a = Y bx 60 Példa Hat páciesél az alábbi vércukorszitet mérték: X i pácies kora 43 2 25 42 57 59 Y i vércukorszit 99 65 79 75 87 8

25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 35 Számítsuk ki a miták korrelációs együtthatóját, majd taulmáyozzuk, hogy létezik-e összefüggés a kor és a vércukorszit között X = X i = 43+59 = 4667, Y = 8, D 2 X) = 6 D 2 Y ) = 09333, Xi X)Y i Y ) DX) DY ) = 05298 Xi X) 2 = 2068056, r = Egy 095 = p megbízhatósági szite a kor és a vércukorszit kapcsolatáak a feltárásához felállítjuk a ull, illetve ellehipotézist: H 0 : ρ = 0, H : ρ 0, 05298 majd a 253) képlettel kiszámítjuk a t ρ próbastatisztikát: t ρ = = 05298 2 6 2 2494 Mivel p = 095 szite t p = 27764 df = 6 2 = 4) a t ρ t p, t p ) t ρ bee va az elfogadási tartomáyba), tehát a ullhipotézist ics okuk elveti, vagyis a kor és a vércukorszit korrelálatla változók

Irodalomjegyzék [] Balogh Gábor, Visual Basic és Excel programozás, Computerbooks Kiadó, Budapest, 200 [2] Bara S, et al, Bevezetés a matematikai statisztikába, Debrecei Egyetem Kiadó, Debrece, 2005 [3] Baráth Cs, Ittzés A, Ugrósdy Gy: Biometria, Mez gazda Kiadó, Budapest, 996 [4] Bálit Gy, Statisztika: elmélet és gyakorlat, Scietia Kiadó, Kolozsvár, 2009 [5] Ciucu G, Craiu V, S cuiu I, Probleme de statistic matematic, Editura Tehic, Bucure³ti, 974 [6] Cseke V, A valószí ségszámítás és gyakorlati alkalmazásai, Dacia Köyvkiadó, Kolozsvár, 982 [7] Dekiger G, Valószí ségszámítás, Taköyvkiadó, Budapest, 978 [8] Dekiger G, Valószí ségszámítási gyakorlatok, Taköyvkiadó, Budapest, 977 [9] Jáosa A, Adatelemzés számítógéppel, Perfekt Kiadó, 2005 [0] Kelly, J, Microsoft Excel: utilizare, Teora, Bucuresti, 2000 [] Korpás Attiláé szerk), Általáos statisztika I-II, Nemzeti Taköyvkiadó, Budapest, 996 [2] Köves P, Páriczky G, Általáos statisztika, Közgazdasági és Jogi Köyvkiadó, Budapest, 975 [3] Maczel J, szerk), Statisztikai módszerek alkalmazása a mez gazdaságba, Mez gazdasági Kiadó, Budapest, 983 [4] Nash JC, Teachig statistics with Excel ad other spreadsheets, Computatioal Statistics ad Data Aalysis, 2008 [5] Obádovics Gy, Valószí ségszámítás és matematikai statisztika, Scolar Kiadó, Budapest, 200 [6] Perczelé Zalai M, Biometria a kertészetbe, Kertészeti Egyetem, Budapest, 996 [7] Podmaiczky L, Illés BCs, A számítógépes tervezés lehet ségei a mez gazdaságba, Pao Agrártudomáyi Egyetem, Gödöll, 997 [8] Sachs, L, Agewadte statistik, 4kiad, Spriger Verlag, Berli-Heidelberg-New York, 974 [9] Váradi Zs, Az Excel fortélyai em csak haladókak, M szaki Köyvkiadó, Budapest, 997 36