(Independence, dependence, random variables)

Hasonló dokumentumok
Valószínűségi változók. Várható érték és szórás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

i p i p 0 p 1 p 2... i p i

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

BIOMATEMATIKA ELŐADÁS

Készítette: Fegyverneki Sándor

[Biomatematika 2] Orvosi biometria

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

[Biomatematika 2] Orvosi biometria

Együ ttes e s vetü leti eloszlá s, sü rü se gfü ggve ny, eloszlá sfü ggve ny

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

A valószínűségszámítás elemei

Eloszlások jellemzése. Momentumok. Medián és kvantilis. Karakterisztikus függvény

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Matematika A1a Analízis

0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Backhausz Ágnes 1. Bevezetés A valószínűség elemi tulajdonságai... 5

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Abszolút folytonos valószín ségi változó (4. el adás)

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Segítség az outputok értelmezéséhez

Gazdasági matematika II. vizsgadolgozat, megoldással,

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

2014. szeptember 24. és 26. Dr. Vincze Szilvia

Korreláció és Regresszió

1. Hányféle sorrendben vonulhat ki a pályára egy focimeccsen a tizenegy kezdő játékos?

Regressziós vizsgálatok

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

yf X (y)dy a af X (y)dy = a P (X a)

VIK A1 Matematika BOSCH, Hatvan, 5. Gyakorlati anyag

36 0,3. Mo.: 36 0,19. Mo.: 36 0,14. Mo.: 32 = 0, = 0, = 0, Mo.: 32 = 0,25

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Matematika III előadás

Adatok statisztikai értékelésének főbb lehetőségei

Kutatásmódszertan és prezentációkészítés

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Valószín ségelmélet házi feladatok

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematikai alapok és valószínőségszámítás. Valószínőségszámítási alapok

Valószín ségszámítás és statisztika

Korrelációs kapcsolatok elemzése

1. Példa. A gamma függvény és a Fubini-tétel.

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Valószínűségelmélet. Pap Gyula. Szegedi Tudományegyetem. Szeged, 2016/2017 tanév, I. félév

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Többváltozós függvények Feladatok

Gazdasági matematika II. Tantárgyi útmutató

Feladatok és megoldások a 13. hétre

Korreláció számítás az SPSSben

Valószínűségszámítás összefoglaló

Lengyelné Dr. Szilágyi Szilvia április 7.

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Többváltozós lineáris regresszió 3.

Matematika A2 vizsga mgeoldása június 4.

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Matematikai geodéziai számítások 6.

Bevezetés. Valószínűségszámítás 2 előadás III. alk. matematikus szak. Irodalom. Egyéb info., számonkérés. Cél. Alapfogalmak (ismétlés)

A valószínűségszámítás elemei

Elliptikus eloszlások, kopuláik. 7. előadás, március 25. Elliptikusság tesztelése. Arkhimédeszi kopulák

Sztochasztikus folyamatok alapfogalmak

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

azonosságot minden 1 i, l n, 1 j k, indexre teljesítő együtthatókkal, amelyekre érvényes a = c (j) i,l l,i

Biomatematika 2 Orvosi biometria

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

4.2. Tétel: Legyen gyenge rendezés az X halmazon. Legyen továbbá B X, amelyre

Matematikai geodéziai számítások 6.

Osztályozóvizsga követelményei

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Függvények július 13. f(x) = 1 x+x 2 f() = 1 ()+() 2 f(f(x)) = 1 (1 x+x 2 )+(1 x+x 2 ) 2 Rendezés után kapjuk, hogy:

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

13. előadás. Matlab 7. (Statisztika, regresszió, mérési adatok feldolgozása) Dr. Szörényi Miklós, Dr. Kallós Gábor. Széchenyi István Egyetem

Matematika B4 VIII. gyakorlat megoldása

Valószínűségszámítás és statisztika a fizikában március 12.

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

GVMST22GNC Statisztika II.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Matematika III előadás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Számítógépes döntéstámogatás. Statisztikai elemzés

A maximum likelihood becslésről

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

valós számot tartalmaz, mert az ilyen részhalmazon nem azonosság.

Tantárgy kódja Meghirdetés féléve 3 Kreditpont 4 Összóraszám (elm+gyak) 2+2

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Átírás:

Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér, 2 kék és 1 piros golyót tartalmaz. Visszatevés nélkül húzunk 3-at. Jelölje X és Y a húzott fehér és piros golyók számát. Határozzuk meg X és Y együttes eloszlását! Y 1 Összesen X 3 2 1/2 1/2 2 1 3 2 = 1 6/2 3/2 9/2 6 2 2 6/2 3/2 9/2 3 1/2 1/2 3 Összesen 13/2 7/2 1 A sárgák a marginális eloszlások (X és Y eloszlása, ha a másikat nem nézzük) Értékek és feltételes valószínűségek! Y feltételes eloszlása, feltéve, hogy X = 1: Y feltételes eloszlása, feltéve, hogy X = : X feltételes eloszlása, feltéve, hogy Y = : Y 1 p 6/9 3/9 1 Y 1 p 1 1 X 1 2 3 p 6/13 6/13 1/13 1 Két folytonos változó együttes sűrűségfüggvénye Olyan f(x, kétváltozós függvény, amelynek integrálja az x,y sík bármely részhalmazán megadja annak a valószínűségét, hogy a két változó egy, a halmazba eső értékpárt vesz fel. Pl. egy téglalapra y2 x2 y1 x1 dxdy= P( x1 < X x2, y1 < Y y2 ) Együttes eloszlásfüggvény Az együttes sűrűségfüggvény integrálfüggvénye y F(x, = P(X < x, Y < = x f ( s, t) dsdt y 1 y 2 x 1 x 2

Marginális sűrűség-, és eloszlásfüggvények Ezek tulajdonképpen. X és Y sűrűség-, és eloszlásfüggvényei a másik változót nem tekintve. f(x,. ) = f(., = dy, dx Például Feltételes sűrűség-, és eloszlásfüggvények f ( x y= y ) = f ( x, y ) y ) dx A marginális eloszlásfüggvények ezek integrálfüggvényei. Példák Kétdimenziós egyenletes eloszlás egy négyzeten Egy 3 hosszúságú szakaszon egymástól függetlenül, találomra felveszünk két pontot X és Y legyen a két pontnak a szakasz egyik végpontjától való távolsága. Az együttes sűrűségfüggvény: f ( x, 1 = 9 ha < x< 3, egyébként < y< 3 Fázistér: Kétdimenziós normális eloszlás A sűrűségfüggvény (x,y,z) koordinátarendszerben: Bármely, az (x, síkra merőleges sík a felületből haranggörbét metsz ki. (Ezek azonban nem sűrűségfüggvények, mert görbe alatti területük nem 1.) Gyakorló feladat: mennyi F(.5,2)? A sűrűségfüggvény szintvonalas ábrázolása: A szintvonalak körök vagy ellipszisek.

Függetlenség és összefüggés két valószínűségi változó között (Independence, dependence, random variables) Két diszkrét valószínűségi változót (X és Y) függetlennek nevezünk, ha X megfigyelése semmiféle információt nem ad Y-ra nézve, az X-szel kapcsolatos bármely esemény független az Y-nal kapcsolatos bármely eseménytől Y feltételes eloszlása bármely X=x i feltétel mellett ugyanaz, és megegyezik Y feltétel nélküli eloszlásával is, bármely i, j-re a P(Y=y j X=x i )=P(Y=y j ), bármely i, j-re a P(Y=y j, X=x i )=P(Y=y j )P(X=x i ), az együttes eloszlás valószínűségeit a marginális valószínűségek összeszorzásával kapjuk. Két folytonos valószínűségi változót (X és Y) függetlennek nevezünk, ha X megfigyelése semmiféle információt nem ad Y-ra nézve,... a változók együttes sűrűségfüggvényét a marginális sűrűségfüggvények összeszorzásával kapjuk: h(x, = f(x) g(. Következmény: A függetlenség szimmetrikus reláció Ha két valószínűségi változó (X és Y) nem független, akkor X megfigyeléséből kaphatunk információt Y-ra nézve, illetve diszkrét változókra o Y feltételes eloszlása az X=x i feltételek nem mindegyike mellett ugyanaz, o van olyan i, j pár, amelyre P(Y=y j, X=x i ) P(Y=y j )P(X=x i ), o az együttes eloszlás valószínűségei nem mind egyeznek meg a megfelelő marginális valószínűségek szorzatával, folytonos változókra o a változók együttes sűrűségfüggvénye különbözik a marginális sűrűségfüggvények szorzatától: h(x, f(x) g(. Két valószínűségi változó közötti összefüggés erősségének mérése "asszociációs mértékek" (measures of association) Mennyi információt ad az X megfigyelése az Y-ra nézve? Tipikus számszerűsítés: - semmit (függetlenek), 1 - a lehető legtöbbet (?) Figyelem! Ha X és Y nem függetlenek, akkor viszonyuk igen sokféle lehet és nem is feltétlenül szimmetrikus! (Például ha X: életkor, Y: korcsoport)

Relatív hibacsökkenésen, illetve bizonytalanság-csökkenésen alapuló mértékek (PRE - proportional reduction of error, PRU - prop. red. of uncertaint Goodman és Kruskal-féle lambda mérték Y-ra tippelünk X ismerete nélkül legjobb tipp: Y=3, tévedési valószínűség:.5 Y-ra tippelünk X ismeretében a) ha X=1, akkor a legjobb tipp: Y=1, tévedési valószínűség:.2/.4 =.5 b) ha X=2, akkor a legjobb tipp: Y=3, tévedési valószínűség:.2/.6 =.333 Tévedési valószínűség összességében:.4.5 +.6.333 =.4 (teljes valószínűség tétele!) A relatív hibacsökkenés mértéke: λ Y X = (.5.4) /.5 =.2 Ha szimmetrikus mértékre van szükség: λ szimm = (λ Y X + λ X Y ) / 2 Több, ezen az elven működő mérték létezik, számolhatnak entrópiával, szórással 1.2.1.1.4 2.1.1.4.6.3.2.5 1 A függetlenségtől való eltérést számszerűsítő mértékek Mennyire tér el az X és Y együttes eloszlása a függetlentől? Cramer-féle V mérték 1.2.1.1.4 2.1.1.4.6.3.2.5 1 1.12.8.2.4 2.18.12.3.6.3.2.5 1 A jobb oldali táblázat mutatja, hogy ugyanilyen marginálisok mellett a független eloszlás mi volna: A két eloszlás eltérését az alábbi mértékkel mérjük: (.2.12) 2 /.12 + (.1.8) 2 /.8 + (.1.2) 2 /.2 +... osztva (a sorok és oszlopok száma közül a kisebbik 1) -gyel Független eloszlásokra V=, maximálisan erős eloszlásokra V=1 Speciális mértékek dichotom (bináris, két-értékű, -1) változókra X Y 1.1.3.4 1.2.4.6.3.7 1 Esélyhányados (odds ratio) OR = p 11 p 22 / p 12 p 21 =.1.4/.3.2 =.666 Figyelem! Értékkészlete nem a [,1], hanem a ],[, és függetlenség esetén értéke 1 (azaz a és 1 közötti OR értékek negatív összefüggést jeleznek)! Logit Az esélyhányados logaritmusa, és közötti értékkészletű, és függetlenség esetén értéke (itt már a negatív összefüggéshez negatív érték tartozik). Yule-féle Y mérték Y = (p 11 p 22 p 12 p 21 ) / (p 11 p 22 + p 12 p 21 ) = (OR 1) / (OR+1) Értékkészlete [ 1,1], függetlenség esetén értéke. Korreláció Verbális definíciója már volt: ( kisebbel kisebb, nagyobbal nagyobb stb.) Pearson-féle korrelációs együttható (correlation coefficient) Lineáris összefüggést mér az X és Y változók között, maximális erősségű összefüggés esetén értéke 1 vagy 1, függetlenség esetén értéke. Mi a maximális erősségű lineáris összefüggés? Y = a X + b (az összefüggés pozitív, ha a >, negatív, ha a < )

Figyelem! A korrelációs együttható definíciója: Nemlineáris összefüggésre, akármilyen erős is, nem lesz 1 vagy 1! A értékből nem következik a függetlenség (lehet nemlin. összefüggés is!) cov( X, Y ) R(X,Y) vagy corr(x,y) = S( X ) S( Y ) Matematikai definíciójához először a kovarianciát definiáljuk: cov(x,y) = E[{(X E(X)}{(Y E(Y)}] = E(XY) E(X)E(Y) Látszik a párhuzam a varianciával (nevét is ez indokolja): cov(x,x) = E(X 2 ) E(X) 2 = var(x) Továbbá (a várható érték tulajdonságaiból): cov(x, ax+b) = a var(x) cov(x,y) =, ha X és Y függetlenek