Negyedik fejezet. meglehetősen nagy, de az is lehet, hogy az X szín 5 évvel ezelőtt elő sem fordult. Tehát két. P (a ξ b, c η d)

Hasonló dokumentumok
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

1. Példa. A gamma függvény és a Fubini-tétel.

Készítette: Fegyverneki Sándor

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Gazdasági matematika II. vizsgadolgozat, megoldással,

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

BIOMATEMATIKA ELŐADÁS

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

A valószínűségszámítás elemei

3. Lineáris differenciálegyenletek

A valószínűségszámítás elemei

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószínűségi változók. Várható érték és szórás

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

A mérési eredmény megadása

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

2 (j) f(x) dx = 1 arcsin(3x 2) + C. (d) A x + Bx + C 5x (2x 2 + 7) + Hx + I. 2 2x F x + G. x

Matematika A2 vizsga mgeoldása június 4.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

(Independence, dependence, random variables)

Valószínűségszámítás összefoglaló

Megoldások MATEMATIKA II. VIZSGA (VK) NBT. NG. NMH. SZAKOS HALLGATÓK RÉSZÉRE (Kérjük, hogy a megfelelő szakot jelölje be!

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Számítógépes döntéstámogatás. Statisztikai elemzés

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

[Biomatematika 2] Orvosi biometria

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

KOVÁCS BÉLA, MATEMATIKA I.

Gyakorló feladatok I.

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Abszolút folytonos valószín ségi változó (4. el adás)

előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

NEVEZETES FOLYTONOS ELOSZLÁSOK

Kvadratikus alakok és euklideszi terek (előadásvázlat, október 5.) Maróti Miklós, Kátai-Urbán Kamilla

Matematika III előadás

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

Matematika II. 1 sin xdx =, 1 cos xdx =, 1 + x 2 dx =

Matematikai geodéziai számítások 6.

A maximum likelihood becslésről

Matematikai geodéziai számítások 6.

GVMST22GNC Statisztika II.

Számelméleti alapfogalmak

Vektorok, mátrixok, lineáris egyenletrendszerek

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

4. Laplace transzformáció és alkalmazása

Matematika szigorlat június 17. Neptun kód:

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

Matematika (mesterképzés)

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

Sztochasztikus folyamatok alapfogalmak

LINEÁRIS ALGEBRA. matematika alapszak. Euklideszi terek. SZTE Bolyai Intézet, őszi félév. Euklideszi terek LINEÁRIS ALGEBRA 1 / 40

I. feladatsor. 9x x x 2 6x x 9x. 12x 9x2 3. 9x 2 + x. x(x + 3) 50 (d) f(x) = 8x + 4 x(x 2 25)

MATE-INFO UBB verseny, március 25. MATEMATIKA írásbeli vizsga

Együ ttes e s vetü leti eloszlá s, sü rü se gfü ggve ny, eloszlá sfü ggve ny

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC

VALÓSZÍNŰSÉGSZÁMÍTÁS. MSc. Órai Feladatok

0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles

T obbv altoz os f uggv enyek integr alja. 3. r esz aprilis 19.

Bevezetés. Valószínűségszámítás 2 előadás III. alk. matematikus szak. Irodalom. Egyéb info., számonkérés. Cél. Alapfogalmak (ismétlés)

Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.

Tantárgy kódja Meghirdetés féléve 3 Kreditpont 4 Összóraszám (elm+gyak) 2+2

Kétváltozós függvények differenciálszámítása

1. Oldja meg a z 3 (5 + 3j) (8 + 2j) 2. Adottak az A(1,4,3), B(3,1, 1), C( 5,2,4) pontok a térben.

Mátrixok 2017 Mátrixok

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Nemparaméteres próbák

Adatok statisztikai értékelésének főbb lehetőségei

sin x = cos x =? sin x = dx =? dx = cos x =? g) Adja meg a helyettesítéses integrálás szabályát határozott integrálokra vonatkozóan!

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Korreláció és lineáris regresszió

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Matematikai geodéziai számítások 5.

Keresztmetszet másodrendű nyomatékainak meghatározása

Gazdasági matematika II. tanmenet

Matematika I. Vektorok, egyenesek, síkok

Szélsőérték feladatok megoldása

Markov-láncok stacionárius eloszlása

i p i p 0 p 1 p 2... i p i

2. SZÉLSŽÉRTÉKSZÁMÍTÁS. 2.1 A széls érték fogalma, létezése

Meghatározás: Olyan egyenlet, amely a független változók mellett tartalmaz egy vagy több függvényt és azok deriváltjait.

Megjegyzés: jelenti. akkor létezik az. ekkor

valós számot tartalmaz, mert az ilyen részhalmazon nem azonosság.

Matematika II képletek. 1 sin xdx =, cos 2 x dx = sh 2 x dx = 1 + x 2 dx = 1 x. cos xdx =,

5. előadás - Regressziószámítás

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Eloszlások jellemzése. Momentumok. Medián és kvantilis. Karakterisztikus függvény

Feladatok az 5. hétre. Eredményekkel és teljesen kidolgozott megoldásokkal az 1,2,3.(a),(b),(c), 6.(a) feladatokra

Feladatok és megoldások a 13. hétre

Átírás:

Negyedik fejezet Többdimenziós eloszlások Több valószínűségi változó együttes vizsgálatához nem elegendő az egyes változók eloszlásának ismerete. Ez a tény jól érzékelhető a következő hétköznapi életből vett pédából. Tegyük fel, hogy ismerjük a magyar személygépkocsik kor szerinti eloszlását, és szín szerinti eloszlását. E két adat alapján nem tudjuk megmondani, hogy mi a valószínűsége, hogy egy 5 éves autó X színű. Lehetséges, hogy 5 évvel ezelőtt X a legnagyobb divatszín volt, így ez a valószínűség meglehetősen nagy, de az is lehet, hogy az X szín 5 évvel ezelőtt elő sem fordult. Tehát két véletlen mennyiségre vonatkozó kérdések nem válaszolhatók meg az egyes változók eloszlása ismeretében, a sztochasztikus kapcsolatot a két eloszlás maga nem tartalmazza. Egy elvontabb, de ugyanilyen következtetésre vezető példa: Ha ξ és η jelöli a két valószínűségi változót, akkor ξ és η eloszlásfüggvénye semmit nem mond például a P (a ξ b, c η d) valószínűségről, ami az ún. együttes eloszlás segítségével adható meg. Az együttes eloszlás az a fogalom, amely különböző valószínűségi változók egymással való sztochasztikus kapcsolatát kifejezi. 4.. A többdimenziós eloszlás- és sűrűségfüggvény A ξ és η valószínűségi változók együttes eloszlásfüggvénye az a kétváltozós F : IR 2 IR + függvény, amelyre F (x, y) = P (ξ < x, η < y) (x, y IR). (4..) Az F eloszlásfüggvény mindkét változójában növekedő és balról folytonos. Amennyiben ξ és η független, akkor P (ξ < x, η < y) = P (ξ < x)p (η < y), és F (x, y) = F ξ (x)f η (y), tehát két független valószínűségi változó együttes eloszlása egyszerűen a két eloszlásfüggvény szorzata. Ha létezik olyan f : IR 2 IR + függvény, amelyre F (x, y) = x y f(u, v) dv du, (4..2) akkor ezt ξ és η együttes sűrűségfüggvényének nevezzük. (Szokás azt is mondani, hogy f a (ξ, η) valószínűségi vektorváltozó sűrűségfüggvénye.) (4..2) megfordítása a 2 F (x, y) = f(x, y) (4..3) x y

2 4. A TÖBBDIMENZIÓS ELOSZLÁS- ÉS SŰRŰSÉGFÜGGVÉNY formula. Ebben az esetben (ξ, η) folytonos valószínűségi vektor változóról beszélünk. Ha a ξ és η valószínűségi változóknak van együttes sűrűségfüggvénye, akkor ξ-nek és η-nak külön-külön is van f ξ és f η sűrűségfüggvénye. f ξ (x) = + f(x, y) dy, f η (y) = + f(x, y) dx. (4..4) Az f ξ és f η sűrűségfüggvényeket a (ξ, η) valószínűségi vektorváltozó peremsűrűségeinek nevezzük. Az f ξ -re vonatkozó képletet a következőképpen láthatjuk be. Ha (4..2)-ben végrehajtjuk az y + határátmenetet, akkor a F ξ (x) = x + f(u, v) dv du formulát kapjuk. Ezt x szerint differenciálva a bal oldalon ξ sűrűségfüggvénye, a jobb oldalon pedig az együttes sűrűségfüggvény második változó szerinti integrálja adódik, (4..4)-nek megfelelően. A (4..) és (4..2) képletek kombinációja a P (ξ < x, η < y) = x y f(u, v) dv du formula, ami nagy mértékben általánosítható. A bal oldalon annak a valószínűsége áll, hogy a (ξ, η) véletlen pont a síknak az A = (u, v) IR 2 : u < x, v < y} részhalmazába esik, a jobb oldal pedig az együttes sűrűségfüggvénynek ezen halmazon vett kettős integrálja. Ez az összefüggés nem csak erre a speciális negyedsíkra, hanem a síknak bármilyen A részhalmazára teljesül: P ((ξ, η) A) = f(u, v) du dv (4..5) Az eddigiekben az egyszerűség kedvéért csak két valószínűségi változó együttes eloszlásés sűrűségfüggvényével foglalkoztunk. A definíciók és formulák természetes módon akárhány valószínűségi változóra is kiterjeszthetők. Ha ξ, ξ 2,..., ξ n n darab valószínűségi változó, akkor az együttes sűrűségfüggvényük n-változós függvény, x, x 2,..., x n változókkal, és például (4..3)-ban n-szeres deriválás, (4..4)-ben egy (n )-szeres, (4..5)-ben egy n-szeres integrálás lesz. Kettőnél több valószínűségi változó főleg a normális eloszlással kapcsolatban fog a továbbiakban szerepelni. 4.. példa: Tegyük fel, hogy két véletlen történés következik be egy időtartam, például egy óra alatt. A ξ valószínűségi változó jelenti egy bizonyos szállítmány beérkezésének az idejét, η pedig annak a szállító vállalathoz intézett telefonhívásnak az idejét, amelyben a szállítmányról érdeklődnek. Tételezzük fel, hogy mind ξ mind η egyenletes eloszlású. Ennek alapján az együttes eloszlásuk nem meghatározott, tehát további feltevésre van szükség. Legyen ξ és η egymástól független. Ekkor az együttes sűrűségfüggvényük: ha x, y, f(x, y) = egyébként. A

A sűrűségfüggvény tartója az a halmaz, ahol nullától különböző értékeket vesz fel tehát az egységnégyzet. Az együttes sűrűség ismeretében számos ξ-re és η-ra vontatkozó kérdésre válaszolhatunk. Például: mi a valószínűsége, hogy η < ξ? Annak a valószínűségét számoljuk tehát ki, hogy azelőtt telefonálnak, hogy a szállítmány beérkezett. P (η < ξ) = x f(x, y) dy dx = x dy dx = 2. 3 Az előző példában az együttes sűrűségfüggvény állandó a tartóján. Általában azt mondjuk, hogy a ξ és η valószínűségi változók együttesen egyenletes eloszlásúak az A IR 2 halmazon, ha együttes sűrűségfüggvényük f(x, y) = c ha (x, y) A, különben. Mivel egy sűrűségfüggvény integrálja, a c állandó az A halmaz területének reciproka. Figyelmeztetés: Két együttesen egyenletes eloszlású valószínűségi változó nem mindig független! 4.2. példa: Egy berendezés A és B részegységének meghibásodási idejét a ξ és az η valószínűségi változó fejezi ki. Együttes sűrűségfüggvényük: f(x, y) = 2e (x+2y) ha x, y, különben. Mi annak a valószínűsége, hogy (i) A és B legalább egy évig nem mondja fel a szolgálatot, (ii) B előbb megy tönkre mint A? Az (i) esetben a P (ξ, η ), (ii)-ben P (η < ξ) valószínűség a kérdés. számolással: P (ξ, η ) = = P (η ξ) = = e x dx x 2e (x+2y) dx dy 2e 2y dy = e e 2 = e 3 =.5, 2e (x+2y) dy dx = e x dx x e x ( e 2x )dx = 2 3. 2e 2y dy Egyszerű 4.3. példa: A ξ és η valószínűségi változók együttes sűrűségfüggvénye a következő: 2 ha x és y x, h(x, y) = egyébként. Határozzuk meg ξ és η peremsűrűségfüggvényét!

4 4.2 FÜGGETLENSÉG Az együttes sűrűség tartója az a háromszög, amelynek csúcsai a (, ), (, ) és (, ) pont. Így ξ és η egyaránt a [, ] intervallumban veszi fel értékeit, de nem akárhogy, mivel y kisebb, mint x. Tehát f ξ (x) = f ξ (x) = x 2x ha x egyébként, 2dy = 2x, f η (y) = f η (y) = y 2dx = 2( y). 2( y) ha y egyébként. Érdemes hangsúlyozni, hogy annak ellenére, hogy (ξ, η) együttesen egyenletes eloszlású, a peremeloszlások még csak nem is egyenletesek, és nem is függetlenek. 4.2. Függetlenség Azt feltételezzük, hogy a folytonos ξ és η valószínűségi változóknak létezik együttes sűrűségfüggvénye. Ha ξ és η független, akkor együttes eloszlásfüggvényükre igaz, hogy amiből differenciálással adódik F (x, y) = F ξ (x)f η (y), f(x, y) = f ξ (x)f η (y). (4.2.) Azt is szoktuk mondani, hogy függetlenség esetén az együttes sűrűségfüggvény tényezőkre bomlik (faktorizál). 4.. tétel: Azt feltételezzük, hogy a ξ és az η valószínűségi változóknak létezik együttes sűrűségfüggvénye. Ekkor ξ és η pontosan akkor függetlenek, ha (4.2.) fennáll. 4.4. példa: A 4.2. példában szereplő ξ és η valószínűségi változók függetlenek, mert amint megmutatható együttes sűrűségfüggvényük szorzattá bomlik. Valószínűségi változók különböző transzformáltjainak eloszlását nem olyan könnyű meghatározni, de van néhány eset, amelyben egyszerű dolgunk van. Most két független valószínűségi változó összegének eloszlás- ill. sűrűségfüggvényét fogjuk kiszámolni. Tehát legyenek ξ és η függetlenek, ζ = ξ + η. A ζ < z esemény azt jelenti, hogy a (ξ, η) pont az y = z x egyenes által határolt (alsó) félsíkba esik. Jelöljük A-val ezt a félsíkot. F ζ (z) = P (ζ < z) = f ξ (x)f η (y) dx dy A kettős integrálban helyettesítést hajtunk végre: u = x + y, v = y. Ez a transzformáció az A félsíkot az u v sík u = z függőleges egyenese által határolt baloldali félsíkba viszi. A transzformáció függvénydeterminánsa, ezért z F ζ (z) = f ξ (u v)f η (v) du dv = f ξ (u v)f η (v) dv du. Differenciálással kapjuk ζ sűrűségfüggvényét B f ζ (z) = A f ξ (z v)f η (v) dv, (4.2.2) és ezt az f ξ és f η sűrűség konvolúciójának nevezzük.

4.5. példa: Legyenek ξ és η független, azonos eloszlású valószínűségi változók. Közös sűrűségfüggvényük e x ha x, és y f(x, y) = egyébként. Számítsuk ki ξ + η sűrűségfüggvényét! A konvolúció (4.2.2) képletét kell használni. Mivel ξ és η pozitív értékeket vesz fel, a ξ + η valószínűségi változó g sűrűségfüggvénye negatív z értékekre. Ha z >, akkor g(z) = f ξ (z x)f η (x) dx = z e (z x) e x dx = ze z. Megemlítjük, hogy ez a g függvény egy másodrendű gamma eloszlás sűrűségfüggvénye, lásd (3.2.2)-t. 5 4.3. Több valószínűségi változó függvényei Ha a ξ, ξ 2,..., ξ n valószínűségi változók együttes eloszlása ismeretes, akkor egy n változós h függvényre a h(ξ, ξ 2,..., ξ n ) valószínűségi változó eloszlása meghatározott. Leggyakrabban, például a statisztikában, a ξ + a 2 ξ 2 +... + a n ξ n alakú lineáris kifejezések fordulnak elő, és ξ, ξ 2,..., ξ n teljesen független változók. 4.6. példa: ξ, ξ 2 független N(, σ) eloszlású valószínűségi változók. Határozzuk meg az η = ξ 2 + ξ2 2 valószínűségi változó sűrűségfüggvényét! A függetlenség miatt ξ, ξ 2 együttes sűrűségfüggvénye f(x, y) = = 2πσ exp ( 2 x2 /2σ 2 ) exp ( y 2 /2σ 2 ) 2πσ exp ( 2 (x2 + y 2 )/2σ 2 ). Először η eloszlásfüggvényét számoljuk ki. ( ) F η (z) = P ξ 2 + ξ2 2 < z = P (ξ 2 + ξ2 2 < z 2 ) = x 2 +y 2 <z 2πσ exp ( 2 2 (x2 + y 2 )/2σ 2 ) dx dy. Itt a kettős integrált a z sugarú körlemezen vesszük. Célszerű áttérni polárkoordinátákra. 2π ( z ) F η (z) = r exp ( r 2 /2σ 2 ) dr dθ 2πσ 2 = z r exp ( r 2 /2σ 2 ) dr = exp ( z 2 /2σ 2 ). σ 2

6 4.4 KOVARIANCIA ÉS KORRELÁCIÓS EGYÜTTHATÓ A sűrűségfüggvényt differenciálással kapjuk: f η (z) = d dz F η(z) = σ 2 z exp ( z 2 /2σ 2 ). (4.3.) (A σ = esetben ez 2-szabadságfokú χ 2 -eloszlás.) Ez az eloszlás a statisztikai vizsgálatokban játszik fontos szerepet. Legelterjedtebben a χ 2 próbát alkalmazzuk, ha arról akarunk dönteni, hogy az adott minta jellemezhető-e egy bizonyos, általunk feltételezett eloszlással. A következő tételt valószínűségi változók függvényének várható értékéről bizonyítás nélkül közöljük. 4.2. tétel: Ha a ξ és ξ 2 valószínűségi változók együttes sűrűségfüggvénye f, és h tetszőleges kétváltozós függvénye ξ és ξ 2 -nek, akkor M(h(ξ, ξ 2 )) = h(x, y)f(x, y) dx dy. 4.7. példa: A ξ és η valószínűségi változók együttes sűrűségfüggvénye a következő: 2 ha x és y x, f(x, y) = egyébként. Határozzuk meg ξη várható értékét! Az előző tétel szerint az xyf(x, y) kifejezést kell integrálni a (,), (,) és (,) pontokkal meghatározott háromszögön, azaz M(ξη) = 2 xy dx dy = 2 H ( x ) xy dy dx = x 3 dx = /4. 4.4. Kovariancia és korrelációs együttható Legyen ξ és η két tetszőleges valószínűségi változó. Egymástól való függőségüket mérhetjük az ( ) M (ξ M(ξ))(η M(η) (4.4.) várható értékkel, amit kovarianciának nevezünk. (A kovariancia jelölésére a σ ξ,η, vagy Cov(ξ, η) jelölés használatos.) Ha ξ és η független, akkor kovarianciájuk. A 2.2 tételből adódik, hogy a kovariancia a M(ξη) M(ξ)M(η) (4.4.2) formában is írható. A kovariancia segítségével értelmezhető egy másik összefüggőségi mérőszám, a korrelációs együttható: r = M[(ξ M(ξ))(η M(η))] σ(ξ)σ(η) (4.4.3)

A korrelációs együttható és közé esik, és abszolút értékben az értéket csak akkor veszi fel, ha ξ és η egymásnak lineáris függvénye, azaz vannak olyan a és b számok, hogy ξ = aη+b. A 2.7 és 4.3 feladat két nem független, de korrelációs együtthatójú (azaz korrelálatlan) valószínűségi változóra ad példát. A korrelálatlanság tehát még nem jelent függetlenséget. A korrelációs együttható egy szög koszinuszaként értelmezhető, ha a ξ és η valószínűségi változókat olyan vektorként képzeljük el, amelyek hossza a szórásuk. A σ 2 (ξ + η) = σ 2 (ξ) + σ 2 (η) + 2rσ(ξ)σ(η) (4.4.4) összefüggésben a háromszög-geometria koszinusztételére ismerhetünk. 4.8. példa: A ξ és η valószínűségi változók együttes sűrűségfüggvénye a következő: 2 ha x és y x, h(x, y) = egyébként. Számoljuk ki ξ és η korrelációs együtthatóját! A 4.3. példa tartalmazza a peremsűrűségeket, felhasználásukkal kiszámoljuk ξ és η várható értékét: M(ξ) = M(η) = x 2x dx = 2 3, σ2 (ξ) = y 2( y) dy = 3, σ2 (η) = Végül a 4.7. példából tudjuk, hogy M(ξη) = /4 és így (x 2/3) 2 2x dx = 8, (y /3) 2 2( y)dy = 8. 7 r = M(ξη) M(ξ)M(η) σ(ξ)σ(η) = 2. Több valószínűségi változó esetén a páronkénti kovarianciákat és korrelációs együtthatókat egy-egy mátrixban foglalhatjuk össze. Legyen (ξ, ξ 2,..., ξ n ) n valószínűségi változó. Azt a C mátrixot, amelynek i-edik sorának j-edik eleme a Cov(ξ i, ξ j ) kovariancia, a valószínűségi változók kovarianciamátrixának nevezzük. Hasonlóan definiáljuk az R korrelációmátrixot a páronkénti korrelációs együtthatókkal. Mivel bármely valószínűségi változónak önmagával vett korrelációs együtthatója, az R mátrix diagonálisa csupa egyesből áll. 4.3. tétel: C és R pozitív szemidefinit mátrix, és közöttük a C = S R S kapcsolat áll fent, ahol a közönséges mátrixszorzást jelöli, és S = Diag(σ(ξ ), σ(ξ 2 ),..., σ(ξ n )) egy olyan diagonális mátrix, amely a szórásokból áll. Megjegyezzük, hogy egy mátrix pozitiv szemidefinit volta azt jelenti, hogy a mátrix X t X alakú valamilyen X mátrixra, amelynek transzponáltja X t. Pozitív szemidefinit mátrix sajátértékei nemnegatívak.

8 4.5 A TÖBBDIMENZIÓS NORMÁLIS ELOSZLÁS 4.5. A többdimenziós normális eloszlás A ξ, ξ 2,..., ξ n valószínűségi változók együttes eloszlását normálisnak nevezzük, ha együttes sűrűségfüggvényük B ( f(x, x 2,..., x n ) = (2π) exp n 2 n i= n j= ) b ij (x i m i )(x j m j ) (4.5.) alakú, ahol m, m 2,..., m n valós számok és B = (b ij ) egy n n-es szimmetrikus pozitív definit mátrix. Mind az m i paraméterek, mind pedig a B mátrix valószínűségelméleti jelentéssel bír. Az m i szám nem más mint ξ i várhatóértéke, a B mátrix pedig a C kovariancimátrix inverze. A vektor-mátrix írásmóddal (4.5.) jóval tömörebbé válik: B f(x) = (2π) exp ( < B(x m), (x m) > ) n 2 = C (2π) n exp ( 2 < C (x m), (x m) > ) 4.9. példa: Ellenőrizzük, hogy az alábbi kétváltozós függvény kétdimenziós normális eloszlás sűrűségfüggvénye-e! f(x, y) = ( π 3 exp 2 ) 3 (x2 xy + y 2 ) Keressük meg az eloszlás kovarianciamátrixát! Azt kell megvizsgálni, hogy az adott függvény (4.5.) alakú-e. Először a kitevőt nézzük meg. (4.5.)-ben az áll, hogy ( b (x m ) 2 + (b 2 + b 2 )(x m )(y m 2 ) + b 22 (y m 2 ) 2 ), 2 ami akkor lesz 2 3 (x2 xy + y 2 ), ha B = ( ) 4/3 2/3 = 2 2/3 4/3 3 ( ) 2, 2 és m = m 2 =. B determinánsa 4/3, és a kis számolással kapott 4/3 (2π) 2 = π 3 összefüggés azt mutatja, hogy f (4.5.) alakú. A kovarianciamátrix B inverze, ami a lineáris algebrában tanultak alapján számolható ki, és ( ) 2 nek 2 2 adódik.

Ha a (ξ, ξ 2,..., ξ n ) valószínűségi változók együttes eloszlása normális (azaz (4.5.) alakú), akkor ξ, ξ 2,..., és ξ n külön-külön is normális eloszlásúak. Az egyszerűség kedvéért szorítkozzunk az n = 2 esetre, és legyen ξ i N(m i, σ i ) eloszlású. Ha r a ξ és ξ 2 valószínűségi változók korrelációs együtthatója, akkor együttes sűrűségük 9 ( f(x, y) = 2πσ σ exp 2 r 2 2( r 2 ) [ (x m ) 2 2r x m y m 2 + (y m 2) 2 ]) σ 2 σ σ 2 σ2 2 (4.5.2) alakú. Megfigyelhetjük, hogy r = esetén az együttes sűrűségfüggvény faktorizál egy x-től és egy y-től függő sűrűségfüggvény szorzatára, tehát ilyenkor ξ és ξ 2 függetlenek. 4.4. tétel: Ha két valószínűségi változó együttes eloszlása normális, és a változók korrelálatlanok, akkor függetlenek is. Mint azt már több ízben hangsúlyoztuk, teljes általánosságban a korrelálatlanság nem vonja maga után a függetlenséget. A tételben az együttes eloszlás normalitásának a feltételezése igen lényeges. 4.. példa: Mi a 4.9. példában szereplő együttes eloszlással adott valószínűségi változók korrelációs együtthatója? A korrelációs együtthatót az együttes sűrűségfüggvény (4.5.2)-vel való összevetésével kaphatjuk meg: π 3 = 2πσ σ, 2 r 2 amiből 3 = 4σσ 2 2( 2 r 2 ). A szórásnégyzetek a 4.9. példából ismert kovarianciamátrixból kipotyognak, σ 2 = σ2 2 =, és r = /2. 4.5. tétel: Ha a ξ és ξ 2 valószínűségi változók együttes eloszlása normális, akkor bármilyen λ, λ 2 R esetén λ ξ + λ 2 ξ 2 normális eloszlású. ξ és ξ 2 is normális eloszlású. Ez a tétel azt is jelenti, hogy ha az együttes eloszlás normális, akkor a peremeloszlások is normálisak. 4.. példa: Határozzuk meg a 4.9. példában szereplő együttes eloszlással adott valószínűségi változók peremeloszlását! A peremeloszlások normálisak, így elegendő tudnunk várható értéküket és szórásukat. Ezek kiderülnek a 4.9. példából. Tehát mindkét peremeloszlás standard normális. 4.2. példa: Legyen ξ egy véletlenszerűen kiválasztott házaspárból a nő, ξ 2 pedig a férfi testmagassága. Tételezzük fel, hogy ξ és ξ 2 együttesen normális eloszlású, ξ várható értéke 69 cm, szórása 5 cm, ξ 2 várható értéke 77 cm, szórása 5 cm, továbbá ξ és ξ 2 korrelációs együtthatója.68. Mi a valószínűsége, hogy egy feleség magasabb a férjénél?

4.6 A FELTÉTELES SŰRŰSÉGFÜGGVÉNY ÉS A REGRESSZIÓ A P (ξ ξ 2 > ) valószínűséget kell kiszámolni. A 4.4. tétel szerint ξ ξ 2 normális eloszlású. M(ξ ξ 2 ) = 69 77 = 8 σ 2 (ξ ξ 2 ) = σ 2 (ξ ) + σ 2 (ξ 2 ) 2Cov(ξ, ξ 2 ) = 25 + 25 2.68 5 5 = 6 Így ξ ξ 2 szórása 4 és η = (ξ ξ 2 + 8)/4 standard normális eloszlású. ξ ξ 2 > ekvivalens η > 2 egyenlőtlenséggel. Ezért P (ξ ξ 2 > ) = P (η > 2) = Φ(2) = 2.3%. Tehát 2.3 % annak a valószínűsége, hogy egy feleség magasabb a férjénél. 4.6. A feltételes sűrűségfüggvény és a regresszió Legyen ξ és η két olyan folytonos valószínűségi változó, amelyek f együttes sűrűségfüggvénye létezik. Tudjuk, hogy ekkor η-nak van sűrűségfüggvénye, és tegyük fel, hogy f η (y) >. Rögzített y mellett f(x y ) = f(x, y ) (4.6.) f η (y ) egy sűrűségfüggvény, hiszen f(x y ) dx = f η (y ) f(x, y ) dx = f η (y ) f η(y ) =. f(x y )-t ξ-nek az η = y feltételre vonatkozó feltételes sűrűségfüggvényének nevezzük. Az x f(x y ) sűrűségfüggvényhez tartozó valószínűségi változóra a ξ feltéve η = y elnevezést, és a ξ η = y jelölést használjuk. A ξ η = y feltételes valószínűségi változó arról ad felvilágosítást, hogy ξ milyen valószínűséggel veszi fel értékeit feltéve, hogy η-ról tudunk valamit, nevezetesen, hogy η = y. Ha ξ és η függetlenek, akkor f(x y ) = f(x, y ) f η (y ) = f ξ(x)f η (y ) f η (y ) = f ξ (x). 4.3. példa: ξ és η együttes sűrűségfüggvénye +xy f(x, y) = ha < x < 2 és < y <, 3 különben. Írjuk fel az f(x y ) feltételes sűrűségfüggvényt! Először η peremsűrűségét számoljuk ki. ha < y <, egyébként f η (y) =. f η (y) = 2 + xy 3 dx = 2 + 2y 3 A feltételes sűrűségfüggvény definíciója alapján + xy ha < x <, < y <, f(x y ) = 2 + 2y különben.

Azt a függvényt, amelyik y -hoz az M(ξ η = y ) várható értéket rendeli, a ξ valószínűségi változó η-ra vonatkozó regressziójának, vagy elméleti regressziójának nevezzük. Az y M(ξ η = y) függvény a regressziós görbe. Ha ξ és η független, akkor mint fent láttuk a ξ és a ξ η = y változók azonosak, ezért ξ-nek az η-ra vonatkozó regressziója az M(ξ) állandó függvény. A regressziós görbe meredeksége ξ és η sztochasztikus összefüggését mutatja. Legjobban látszik ez abban az esetben, amikor ξ és η együttes eloszlása normális. (Az egyszerűség érdekében tételezzük fel, hogy ξ és η várható értéke.) Ekkor az u = M(ξ η = v) regressziós görbe az u = rσ(η)/σ(ξ) egyenes. (r jelöli a korrelációs együtthatót.) 4.4. példa: Egy hőkezelési folyamattal kapcsolatban ξ a kezelés időtartama és η a kezelés által kiváltott keményedés mélysége. (ξ-t másodpercben, η-t mm-ben mérjük.) Egy modell szerint ξ és η együttes eloszlása normális, M(ξ) = 8, M(η) = 9, σ(ξ) = 4.8, σ(η) = 2 és a korrelációs együttható r =, 87. (a) Adja meg az x M(η ξ = x) regressziót! (b) Számolja ki a feltételes sűrűségfüggvényt, a kezelés hossza 5 másodperc feltételre vonatkozóan! (c) Mi a valószínűsége, hogy a keményedés mélysége 9 és 2 mm közé esik, feltéve, hogy a hőkezelés időtartama 5 másodperc? Az m = 8, m 2 = 9, σ = 4.8, σ 2 = 2, r =.87 adatok felhasználásával (4.5.2)-be helyettesítve felírjuk az f együttes sűrűségfüggvényt, és azt elosztjuk ξ-nek az f ξ sűrűségfüggvényével. Így kapjuk az ( f(y x) =.336 exp 2 (y.36x 2.52) 2 ) (4.6.2) 2 feltételes sűrűségfüggvényt, amely normális. Kiolvassuk, hogy 2 a szórásnégyzete és.36x+2.52 a várhatóértéke. A (b) kérdés válaszához úgy jutunk, hogy (4.6.2)-ben x = 5-öt helyettesítünk. Így egy normális ζ valószínűségi változót kapunk, amelynek 7.92 a várható értéke és 2 a szórása. A (c) kérdés megválaszolásához a P (9 ζ 2) valószínűséget kell megadni, ami standardizálással Φ(3.5) Φ(.92) =.777. A mérnöki-statisztikai problémákban gyakran ismerjük két sztochasztikusan összefüggő valószínűségi változó néhány össszetartozó értékpárját, és keressük a változók közötti kapcsolat legjobb lineáris közelítését. Adott ξ és η. Ha η-t Aξ + B alakban akarjuk közelíteni, A és B értékét úgy kell meghatározni, hogy az η (Aξ + B) valószínűségi változó szórása a lehető legkisebb legyen. A g(a, B) = M((η (Aξ + B)) 2 ) = M(η 2 ) + A 2 M(ξ 2 ) + B 2 2AM(ξη) 2BM(η) + 2ABM(ξ) függvény minimumát az ismert módon parciális deriválással határozzuk meg. Az adódik, hogy A = Cov(ξ, η) Cov(ξ, η), B = M(η) D 2 (ξ) D 2 (ξ) η legjobb megközelítése a legkisebb négyzetek értelmében. A regressziós görbékkel a következő fejezetben részletesen foglalkozunk. (4.6.3)

2 4.7 A SZTOCHASZTIKUS FOLYAMAT 4.7. A sztochasztikus folyamat Egy időtől függő véletlen mennyiséget sztochasztikus folyamatnak nevezünk. Itt nem célunk a sztochasztikus folyamatok kimerítő ismertetése, elsősorban a Poisson-folyamat példájára szorítkozunk. A Poisson-folyamat jól szemléltethető a polimerizáció egyszerű valószínűségelméleti modelljén. A polimerizáció láncmolekulák növekedési folyamata, amelynek során a már kialakult lánchoz újabb és újabb monomer csoport kapcsolódik. A láncok végének összekapcsolódását az egyszerű modellben kizárjuk, és azt gondoljuk, hogy a láncmolekula és a monomer csoport véletlen találkozásakor a csoport hozzákötődik a lánchoz, és annak hosszát eggyel megnöveli. η legyen az a véletlen időtartam, ami az első monomer csoport kapcsolódásáig eltelik, η 2 időtartam múlva kötődik a második csoport az első kapcsolódása után, és így tovább. Tehát η, η 2,... valószínűségi változók egy sorozata. A valóságban ezek a véletlen időtartamok nagyon rövidek, ez azonban elvi megfontolásainkat nem zavarja. Mivel η i egy,,emlékezet nélküli várakozási idő, η i exponenciális eloszlású kell, hogy legyen, mondjuk α i paraméterrel, és feltételezhető, hogy az η i valószínűségi változók teljesen függetlenek. Amennyiben a polimerizáció során bizonyos körülmények változatlanok (például hőmérséklet, a nagy feleslegben jelenlévő szabad monomerek koncentrációja, stb.), akkor feltételezhető, hogy η, η 2... azonos eloszlásúak, azaz α i = α, i-től függetlenül. Vizsgáljuk meg, hogy t idő eltelte után milyen hosszúak a láncmolekulák! Jelölje N t azt a valószínűségi változót, amely a t időpontban véletlenül választott lánc hosszát adja meg. N t értékei pozitív egész számok és P (N t n) = P (η + η 2 +... + η n t), (4.7.) azaz a láncmolekula hossza pontosan akkor nagyobb vagy egyenlő mint n a t időpontban, ha az η, η 2,..., η n várakozási idők összege legfeljebb t. (4.7.)-ből kiindulva számoljuk ki N t eloszlását. Nyilván P (N t = n) = P (N t n) P (N t n ). (4.7.2) Érdemes bevezetni a ξ n = η + η 2 +... + η n valószínűségi változót. Mivel független változókat adunk össze, ξ n momentumgeneráló függvénye ( α ) n M(e tξn ) = (4.7.3) α t (a 2. példa és 2.4 tétel alapján), amiből a Laplace-transzformáció táblázatát használva kapjuk, hogy ξ n sűrűségfüggvénye f n (x) = αn (n )! xn e αx (x > ). (4.7.4) (Különben (3.2.2)-vel összevetve megállapítható, hogy ez gamma eloszlás.) Némi parciális integrálással látszik, hogy t t P (N t = n) = f n (x) dx f n (x) dx = (αt)n e αt. (4.7.5) n! Tehát N t Poisson-eloszlású, αt paraméterrel. Amit így megkonstruáltunk, az a Poisson-folyamat. Tételezzük fel, hogy minden t IR + számra adott egy X t valószínűségi változó úgy, hogy (a) X, (b) ha t < s < t 2 <... < s n, akkor az X s X t, X s2 X t2,..., X sn X tn függetlenek, valószínűségi változók (c) X s X t Poisson-eloszlású α(s t) paraméterrel, ha s > t. Az ilyen (X t ) valószínűségiváltozócsaládot α intenzitású Poisson-folyamatnak nevezzük. A (b) és (c) feltételek úgy fogalmazhatók meg,

3 hogy a folyamat növekményei (diszjunkt időintervallumokban) függetlenek, és Poisson-eloszlásúak az időintervallumok hosszával arányos paraméterrel. Ellenőrizhető, hogy a fent konstruált N t folyamat eleget tesz az (a)-(c) feltételeknek, tehát egy konkrét példa az absztrakt Poisson-folyamatra. A példában a folyamat α intenzitása a reakciósebességgel függ össze, α az időegység alatt bekövetkezett átlagos láncnövekedés, másként a vizsgált nulladrendű reakció sebességi együtthatója. 4.5. példa: Egy polimerizációs folyamatot Poisson-féle sztochasztikus folyamat ír le. Miután a polimerizáció percig folyt, a láncmolekulák átlagosan 28 monomercsoportból álltak. Még hány percig kell folytatni az eljárást ahhoz, hogy a molekulaláncok 95 %-a tartalmazzon legalább 2 monomer csoportot? Legyen λ a folyamat intenzitása, ekkor perc után a láncok eloszlása λ paraméterű Poisson-eloszlás. A Poisson-eloszlás várható értéke maga a paraméterérték, így λ = 28 és λ = 28. Kiszámoljuk, hogy milyen Λ paraméterű Poisson-eloszlásra igaz, hogy a 2-nál nagyobb értékeket 95 % valószínűséggel vesz fel. Ehhez a n=2 Λ n n! e Λ =.95 egyenletet kell megoldani Λ-ra. Ez numerikusan, számítógép segítségével lehetséges, Λ = 44, 575 (lásd függelék). A (t + )λ = Λ egyenletekből kapjuk a megoldást, t = Λ/λ = 3.87. 4.6. példa: Mi a magyarázata annak a tapasztalati ténynek, hogy a polimerek lánchosszának eloszlása akkor is Poisson-eloszlás, ha a reakciósebesség a polimerizáció során időben változik? Gondoljunk arra, hogy a polimerizáció 3 percig α intenzitással folyik, és 3 perc után megváltozik az intenzitása β-ra. Ekkor a lánchossz t > 3-ra N (α) 3 + N (β) t 3. Ezért összegük is Poisson- Itt mindkét változó Poisson-eloszlású, és egymástól függetlenek. eloszlású a 3.2 tétel következtében. Poisson-folyamattal írható le egy üzletbe betérő vásárlók száma, vagy egy telefonközpontba beérkező hívások száma is.