Példák: tojások száma egy madárfészekben (egy adott madárfaj esetén), egy egyed testhőmérséklete (adott faj és ivar esetén), a következő buszon az uta

Hasonló dokumentumok
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A valószínűségszámítás elemei

Valószínűségi változók. Várható érték és szórás

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria

Biomatematika 2 Orvosi biometria

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Biomatematika 8. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Folytonos valószínűségi változó: Lehetséges értéei egy folytonos tartományt alotna. Minden egyes érté 0 valószínűségű, csa tartományona van pozitív va

(Independence, dependence, random variables)

Készítette: Fegyverneki Sándor

[Biomatematika 2] Orvosi biometria

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Valószín ségszámítás és statisztika

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Valószínűségszámítás összefoglaló

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

A valószínűségszámítás elemei

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Elemi statisztika fizikusoknak

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

1. Kombinatorikai bevezetés

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

Normális eloszlás tesztje

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

36 0,3. Mo.: 36 0,19. Mo.: 36 0,14. Mo.: 32 = 0, = 0, = 0, Mo.: 32 = 0,25

BIOMATEMATIKA ELŐADÁS

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Gazdasági matematika II. tanmenet

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Abszolút folytonos valószín ségi változó (4. el adás)

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Eloszlások jellemzése. Momentumok. Medián és kvantilis. Karakterisztikus függvény

Biomatematika 2 Orvosi biometria

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Adatok statisztikai értékelésének főbb lehetőségei

Populációbecslések és monitoring

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Populációbecslések és monitoring

Segítség az outputok értelmezéséhez

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

i p i p 0 p 1 p 2... i p i

A Statisztika alapjai

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

6. Előadás. Vereb György, DE OEC BSI, október 12.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Területi sor Kárpát medence Magyarország Nyugat-Európa

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Változók eloszlása, középértékek, szóródás

Valószín ségszámítás és statisztika

[Biomatematika 2] Orvosi biometria

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI


Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Tartalomjegyzék Szitaformulák Példák a szitaformulára Mintavételezés Bayes-tétel... 17

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Vérsejtszámlálás. Bürker kamra

A konfidencia intervallum képlete: x± t( α /2, df )

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Az ész természetéhez tartozik, hogy a dolgokat nem mint véletleneket, hanem mint szükségszerűeket szemléli (Spinoza: Etika, II. rész, 44.

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Osztályozóvizsga követelményei

Gyakorló feladatok a 2. dolgozathoz

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Villamosmérnök A4 4. gyakorlat ( ) Várható érték, szórás, módusz

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

A leíró statisztikák

Matematika III. 3. A valószínűségszámítás elemei Prof. Dr. Závoti, József

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 3. MA3-3 modul. A valószínűségszámítás elemei

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Átírás:

Valószínűségi változók (véletlen változók, random variables) Változó: Névvel ellátott érték. (Képzeljünk el egy fiókot. A fiók címkéje a változó neve, a fiók tartalma pedig a változó értéke.) Valószínűségi változó: Olyan változó, melynek értéke szám értékét véletlen tényezők is befolyásolják meghatározhatóak a lehetséges értékei és azok valószínűségei Az eseményeknek a valószínűségi változók lehetséges értékei felelnek meg. Sokszori megfigyelés után sejthetjük, hogy melyik értéknek mennyi a valószínűsége, illetve bizonyos értéktartományokba esésnek mennyi a valószínűsége.

Példák: tojások száma egy madárfészekben (egy adott madárfaj esetén), egy egyed testhőmérséklete (adott faj és ivar esetén), a következő buszon az utasok száma, borjú születési testtömege. A formális matematikai definíció bonyolult (nem tanuljuk). A két legfontosabb kérdés: Mik a változó lehetséges értékei? (véges sok? végtelen sok? folytonos tartomány?) Hogyan adhatjuk meg a valószínűségeket az összes lehetséges eseményre? A valószínűségi változókat nagybetűkkel, a konkrét számértékeket kisbetűkkel szokás jelölni, pl. P(X=x) úgy olvasandó, hogy annak a valószínűsége, hogy az X valószínűségi változó éppen az x értéket veszi fel.

A valószínűségek értékekhez vagy intervallumokhoz hozzárendelése a modell, amely lehet empirikus (sok madárfészek megfigyeléséből, vagy sok borjú lemázsálásából) vagy elméleti megfontolásokon alapuló (pl. a céllövésnél feltételezve, hogy minden lövés egymástól függetlenül p valószínűséggel lesz tízes, utána kombinatorikával továbbszámolva). Két típust különböztetünk meg, a diszkrét és folytonos változókat. Ennek csupán technikai okai vannak (másképp számolunk velük, a folytonosnál összeg helyett integrál lesz).

Diszkrét valószínűségi változó Véges sok lehetséges értéke van, vagy megszámlálhatóan végtelen sok lehetséges értéke van. Megszámlálhatóan végtelen = végtelen sok, de sorba rendezhetőek Példák véges sok értékre: Céllövöldében 10 lövésből az eltört pálcák száma Egy fészekben a tojások száma Példák végtelen sok értékre: A céllövöldében hányat kell lőnünk, mire eltörik az első pálca Kockadobálásnál hányadikra kapunk először hatost

Folytonos valószínűségi változó: Lehetséges értékei egy folytonos tartományt alkotnak. Minden egyes érték 0 valószínűségű, csak tartományoknak van pozitív valószínűségük Példák: időpont 9 és 10 óra között (lehetséges értékek: 9 és 10 közötti valós számok) testhőmérséklet születési testtömeg A geometriai valószínűséggel kapcsolatban találkoztunk ilyen példákkal; a geometriai valószínűségi modellben feltettük, hogy az azonos hosszúságú (területű, térfogatú) tartományokhoz azonos valószínűség tartozik ( egyenletes eloszlás ), de vannak olyan modellek is, amelyekben ez nem igaz

Diszkrét vagy folytonos? Mindig rajtunk áll, hogy egy jelenséget diszkrét vagy folytonos változóval modellezünk. Ha például az előbbi időpontot elegendő perc pontossággal mérni, akkor választhatjuk azt a diszkrét modellt, amelyben a lehetséges értékek 9:00, 9:01, 9:02,... 9:59, 10:00. A választás két dolgon múlik: melyik típus ad realisztikusabb modellt az adott jelenségre a feltett kérdések megválaszolásához szükséges számítások melyik modellben egyszerűbbek.

Diszkrét valószínűségi változó eloszlása Diszkrét valószínűségi változó eloszlása: a változó lehetséges értékei és a hozzájuk tartozó valószínűségek. Az eloszlást célszerűen táblázatos formában lehet megadni. (Ha a változó értékei megszámlálhatóan végtelen halmazt alkotnak, akkor a táblázat végtelen hosszú lesz )

1. példa: jelölje az X valószínűségi változó egy kockadobás eredményét. X eloszlása: x 1 2 3 4 5 6 1 1 1 1 1 1 P(X=x) 6 6 6 6 6 6 2. példa: most dobjunk kétszer a kockával és jelölje Y a nagyobbik számot. Y eloszlása: y 1 2 3 4 5 6 1 3 5 7 9 11 P(Y=y) 36 36 36 36 36 36 Vegyük észre, hogy ha az összes valószínűséget összeadjuk, mindig 1-et kapunk. (Ezt az összefüggést számításaink ellenőrzésére is felhasználhatjuk.)

Várható érték Diszkrét valószínűségi változó várható értéke (=átlagérték, expected value, mean value): a lehetséges értékeknek az értékekhez tartozó valószínűségekkel súlyozott összege. Jelentése: ha a változót sokszor megfigyeljük és a megfigyelt értékek átlagát vesszük, kb. ezt kapjuk (ez az érték a változónak nem feltétlenül lehetséges értéke, lásd pl. kockadobás) Jelölése: az X változó várható értékét E(X)-szel jelöljük Képlete a fenti definíciónak megfelelően: E(X) = Σ p i x i, ahol az x i -k jelölik a változó értékeit és a p i -k az értékekhez tartozó valószínűségeket Ha a változó értékkészlete végtelen, akkor ez az összeg is végtelen lehet A példabeli X változó várható értéke: E(X) = 6 1 1 + 6 1 2 + 6 1 3 + 6 1 4 + 6 1 5 + 6 1 6 = 6 21 = 3.5

A várható értékre vonatkozó számolási szabályok Két változó összegének várható értéke: E(S+T) = E(S) + E(T) Két változó különbségének várható értéke: E(S T) = E(S) E(T) Változó számszorosának várható értéke: E(α S) = α E(S) Változók lineáris kombinációjának várható értéke: E(α S+β T)=αE(S)+βE(T) Két független változó szorzatának várható értéke: E(ST) = E(S)E(T)

Feltételes eloszlás Feltételes eloszlás: Az X változónak az F eseményre, mint feltételre vett feltételes eloszlását úgy kapjuk, hogy X-nek csak azokat az értékeit tekintjük, amelyekre az F feltétel teljesül, a hozzájuk tartozó valószínűségek pedig a P( X = x i F ) feltételes valószínűségek lesznek. Példa: Dobjunk kétszer egy kockával és jelölje Y a nagyobbik számot. Y feltételes eloszlása, feltéve, hogy mindkét dobott szám páratlan: y 1 3 5 1 3 5 P(Y=y F) 9 9 9 A feltételes eloszlásra is igaz, hogy ha az összes valószínűséget összeadjuk, 1-et kapunk (amit most is jól használhatunk számításaink ellenőrzésére).

Feltételes várható érték Feltételes várható érték: ugyanúgy definiáljuk és ugyanúgy számoljuk, mint a feltétel nélküli várható értéket, de a feltételes eloszlásból. Egy fontos összefüggés (a teljes valószínűség tételének megfelelője, nevezhetnénk akár a teljes várható érték tételének is): Hogyan kaphatjuk meg egy változó feltétel nélküli várható értékét, ha ismerjük a feltételes várható értékét az F i feltételekre, melyek együtt teljes eseményrendszert alkotnak? E(Y) = ΣE(Y F i )P(F i )

Nevezetes diszkrét eloszlások: modellek gyakorisági adatokra (count data) Diszkrét egyenletes eloszlás Véges sok érték, mind ugyanakkora valószínűséggel: X : x x,..., 1, 2 xn 1 P i,..., n ( X = x ) =, i= 1,2 n Példák: Kockadobás Urna-modell: cédulákra számokat írunk, és egyet kihúzunk. Várható érték: E( X ) = n x i

Hipergeometrikus eloszlás (visszatevés nélküli mintavétel) N egyedből álló populációból, amelyben valamely tulajdonsággal K egyed rendelkezik, egy n különböző elemből álló véletlen mintát veszünk. Az X valószínűségi változó a mintába került, az adott tulajdonsággal rendelkező egyedek száma. Hallgatólagos feltevés: minden lehetséges minta egyformán valószínű! Példa: Egy kutyamenhely 72 lakója közül 18 fajtatiszta. X: tíz találomra választott kutya között a fajtatiszták száma. N = 72, K = 18, n = 10. X lehetséges értékei a 0 és n közötti számok. A k értékhez (k = 0, 1, 2,..., n) tartozó valószínűség így számolható: P ( X = k) = K k N K n k N n Valójában egy eloszlás-családról van szó, annyi különböző eloszlásról, ahányféleképpen az N, K, n paraméterek megválaszthatók (ezek a megjegyzések a többi eloszlásra is vonatkoznak). Várható érték: E ( X ) = K n N

Binomiális eloszlás (visszatevéses mintavétel, ismételt megfigyelések) Azonos körülmények között, egymástól függetlenül n-szer elvégzünk egy megfigyelést vagy kísérletet, amelyben egy bizonyos kimenetel valószínűsége p. Az X valószínűségi változó a szóban forgó kimenetel bekövetkezéseinek száma. X lehetséges értékei a 0 és n közötti számok. Példák: ötször feldobunk két pénzt és számoljuk, hányszor jön ki FF. X: a FF dobások száma, n = 5, p = 0.25. X: 7 gyermekes családban a lányok száma, n = 7, p = 0.5 n = k k A k értékhez (k = 0, 1, 2,..., n) tartozó valószínűség P( X = k) p ( 1 p) Az eloszlás paraméterei az n és a p (ez is eloszlás-család, a tagokat az n és a p jellemzi). Várható érték: E(X) = np n k

Speciális eset: visszatevéses mintavétel (mint a kutyamenhelyen, de a megvizsgált kutyát visszaengedjük; ekkor csak a p = K / N arány számít, pl. ha a kutyák negyede fajtatiszta, mindegy, hogy 4-ből 1, vagy 400-ból 100; és most n > K is lehetséges). A binomiális eloszlást használják közelítő megoldásként a visszatevés nélküli mintavétel esetén is, ha a minta kicsi a populációhoz képest, hagyományosan, ha n 0.05 N. A binomiális modell érvényességéhez mindig meg kell gondolni a következőket: A megfigyelések függetlennek tekinthetők? A p valószínűség minden megfigyelésre azonos? Példa: Egér a labirintusban, 10 futás, X: hányszor találja meg a sajtot 1 percen belül. n = 10, p =??? p állandó? Nem hasznosítja az előző futások tapasztalatait? Talán minden futáshoz át kellene rendezi a labirintust?

Poisson eloszlás (spontán előfordulások száma egy adott tartományban) Számoljuk, hogy egy adott idő alatt, egy adott területen, térfogatban, egy adott anyagmennyiségben hányszor figyelhetünk meg egy eseményt Példák: X: hány kutya jön be a kapun egy nap alatt, Y: hány elefánt létható egy légifelvételen, Z: hány szem borsót találunk egy adag rizibiziben, X lehetséges értékei a nem negatív számok: 0, 1, 2, 3,.... Gyakorlati esetekben mindig van felső korlátot, de elméletileg nem érdemes korlátozni. k λ = k = e k! A k értékhez (k = 0, 1, 2, 3, 4,...) tartozó valószínűség, ( ) λ Az eloszlás paramétere λ, jelentése az előfordulások átlagos száma (a Poisson eloszlás is egy család, családtagjait λ azonosítja). Várható érték: E(X) = λ P X

Hallgatólagos feltételezések, amelyekből a valószínűségek fenti képlete kijön: Az előfordulások átlagos száma arányos az időtartam, terület, stb. nagyságával (fél nap alatt átlagosan fele annyi kutya, öt adag rizibiziben átlagosan ötször annyi szem borsó, stb.), A nem átfedő időtartamokban, területrészeken, stb. megfigyelt gyakoriságok függetlenek egymástól (pl. a délelőtt és délután érkező kutyák száma). Gyakran olyan binomiális eloszlású változók közelítésére használják, amelyeknek n paramétere igen nagy, p paramétere pedig igen kicsi. Tehát, ha egy ritka esemény (p kicsi) bekövetkezéseit számoljuk egy kísérlet nagyszámú ismétlése során (n nagy), akkor ennek a változónak az eloszlása jól közelíthető a Poisson-eloszlással, mégpedig a λ = np paraméterű Poissonnal (mert ugyanaz az átlaguk!). Alkalmazások: baktérium ill. vérsejt számlálás, esőcseppek eloszlása, nyomdai hibák egy könyvben, kórházban születések, ill. halálozások napi száma, stb.

Negatív binomiális eloszlás Számoljuk, hogy (azonos körülmények között egymástól függetlenül) hányszor kell ismételni egy megfigyelést addig, amíg egy mindegyik ismétléskor p valószínűségű esemény k-szor bekövetkezik. A véletlen szám nem a szükséges ismétlések száma, hanem a szükséges ismétlések száma mínusz k (csak azért, hogy a lehetséges értékek itt is 0, 1, 2,... legyenek). Az eloszlás paraméterei p és k. Bár a negatív binomiális eloszlásnak ez a szokásos származtatása, ebből egyáltalán nem látszik, hogy miért alkalmas gyakorisági adatok modellezésére. Egy másik származtatás szerint (amit precízen elég körülményes megfogalmazni) a negatív binomiális eloszlás előáll, mint különböző paraméterű Poisson eloszlások keveréke. A részleteket nem tárgyaljuk.

Poisson eloszlással, ha 0.1 np 10. Binomiális eloszlás közelítése Az eloszlás paramétere λ = np Normális eloszlással, ha np 5 és nq 5, ahol q=1-p Az eloszlás N ( np, npq)

Középértékek vagy helyzeti mutatók Ha a véletlen változót egyetlen jellemző értékkel kellene leírni, melyik szám lenne az? Ne felejtsük el, hogy az egyetlen számmal jellemzés mindig információveszteséggel jár, nem mutatja az értékek szóródását, variabilitását. Várható érték ( X) A kiugró értékek nagyon el tudják húzni! Módusz E = x p x ) Az az x k érték, amelyhez tartozó p k valószínűség maximális, vagyis a leggyakrabban előforduló érték. Nem mindig egyértelmű egy eloszlás lehet unimodális, bimodális, multimodális stb. Kettőnél több módusz esetén nem használjuk. i ( i

Medián Olyan értelemben közepes x érték, hogy sem az x-nél kisebb, sem pedig az x-nél nagyobb értékek együttes valószínűsége nem haladja meg az 1/2-et, azaz P(X<x) 1/2, és P(X>x) 1/2. Kvantilisek A p-kvantilis olyan x érték, hogy az x-nél kisebb értékek együttes valószínűsége nem haladja meg a p-t, az x-nél nagyobb értékek valószínűsége pedig nem haladja meg az (1-p)-t, azaz P(X<x) p és P(X>x) (1-p). Az 1/2-kvantilis épp a medián. Az 1/4-kvantilis az alsó kvartilis (Q1), a 3/4-kvantilis a felső kvartilis (Q3). A p-kvantilist 100p-percentilisnek is szokás nevezni. Vigyázat! Angol nyelvterületen a mean szót nem feltétlenül az átlagra használják, így aztán ugyanazokból az adatokból különböző érdekcsoportok különböző eredményeket tudnak számolni!

Szóródási mutatók diszkrét változókra Ezek csak a szóródást mutatják, a helyzetet nem. Interkvartilis terjedelem: Az alsó és felső kvartilis különbsége IQR = Q 3 -Q 1. Terjedelem A maximális és a minimális érték különbsége

Szórásnégyzet vagy variancia ("átlagos négyzetes eltérés") A változó várható érték körüli koncentráltságát, illetve szóródását fejezi ki. Nemnegatív. nagy variancia: a változó értékei erősen szórtak kis variancia: a változó a várható értéke körül koncentrálódik 0 variancia: egyetlen lehetséges (nem 0 valószínűségű) érték van Jelölés: σ 2 ( X ) vagy var(x) Matematikailag a szórásnégyzet a változó várható értékétől való négyzetes eltérésének várható értéke, vagyis var(x) = E{(X E(X)) 2 } = E(X 2 ) E(X) 2 Diszkrét változó szórásnégyzetének kiszámítása: var(x) = x i 2 p i ( x i p i ) 2

A variancia tulajdonságai var(ax) = a 2 var(x) var(x+y) = var(x) + var(y) var(ax+by) = a 2 var(x) + b 2 var(y) bármely a R-re ha X és Y függetlenek következik az előző kettőből Szórás A szórás a variancia négyzetgyöke

Három nevezetes eloszlás várható értéke és varianciája: várható érték variancia binomiális np np(1-p) Poisson λ λ negatív binomiális k p k(1 p 2 p) hip.geo. és binom.: var < átlag, Poisson: var = átlag, neg.bin.: var > átlag (overdispersion)