Statisztikai alapismeretek (folytatás) 3. elıadás (5-6. lecke) Az alapsokaság fıbb jellemzıi () 5. lecke Folytonos változó megoszlásának jellemzése A sokasági átlag és szórás Átlag és szórás tulajdonságai alkalmazás minta-átlagokra
Folytonos esetben az ismérv sőrőségfüggvénye egy nemnegatív p(x) vagy f(x) folytonos függvény, amely alatt a terület egységnyi. Ilyen például a jól ismert Gauss-féle haranggörbe. A sőrőségfüggvény lényege a sokaságnak az a részaránya, amely a és b érték közé esik, a sőrőségfüggvény alatti terület mérıszáma az (a, b) intervallum fölött, képletben P ( a x < b) p( x)dx Itt a P a probability (valószínőség) szóra utal. b = a
Az eloszlásfüggvény, F(x) az alapsokaság azon részaránya, amelybe tartozó egyedeken a szóban forgó X ismérv értéke x-nél kisebb. Más szóval, F(x) annak a valószínősége, hogy egy véletlenszerően választott egyeden X<x lesz, azaz F(x)=P(X<x). Az alapsokaság (a,b) intervallumba tartozó egyedeinek részarányát a sőrőségfüggvénnyel és az eloszlásfüggvénnyel is kifejezhetjük: P b ( a x < b) = p( x) dx = F( b) F( a) a
Várható érték (sokasági átlag) és szórás Az alapsokaság átlagát várható értéknek nevezzük, a továbbiakban µ-vel jelöljük, az alapsokaság szórásának jele σ. Ez az alapsokaság két legfontosabb paramétere. Képzésük a mintabeli megfelelıik értelemszerő kiterjesztésével történik: diszkrét esetben k p x k, folytonos esetben µ a sőrőségfüggvény súlypontja. = µ x ( ) σ = ( x µ ) p( ) + + k x k µ = xp( x)dx σ = ( x µ ) p( x)dx
Kvalitatív változó jellemzıi Kvalitatív sokasági átlagról nem beszélünk Variabilitását diverzitás mutatókkal mérhetjük. Legyenek az egyes kategóriákba sokasági relatív gyakoriságai p 1, p,..., p c, összegük 1 (100%) Simpson-Yule féle diverzitási index D S-Y =1- p k, maximális értéke 1-1/c Shannon-Weaver féle diverzitási index D S-W =- p k ln(p k ), maximális értéke ln(c), ahol c a kategóriák száma (Mindkettı akkor maximális, ha p 1 = p =...= p c )
Ismeretek a várható értékrıl A várható értéket a továbbiakban µ szimbólum mellett E(.) vel is jelöljük, tehát µ= E(X). Két alapvetı tulajdonsága: E(a +c 1 X 1 + c X + )= a +c 1 E(X 1 ) + c E(X ) + ahol X 1, X,...X n tetszıleges véletlen változók és a, c 1, c.. tetszıleges konstansok. Speciálisan: E(a)=a; E(cX)=cE(X); E(X+Y)= E(X)+E(Y);E(X-Y)=E(X)-E(Y) A várható érték egy másik fontos tulajdonsága: E(XY)=E(X)E(Y), ha X és Y függetlenek
Ismeretek a sokasági varianciáról és szórásról Sem a szórás, sem a variancia általában nem additívak Ha viszont X 1, X,...X n függetlenek, akkor Var(a +c 1 X 1 + c X + )= c 1 Var(X 1 ) + c Var(X ) + ahol a, c 1, c.. tetszıleges konstansok. Speciálisan: Var(a)=0; Var(cX)=c Var(X), és ha X és Y függetlenek, akkor Var(X+Y)= Var(X)+Var(Y); Var(X-Y)=Var(X)+Var(Y)
A sokasági átlag és variancia szabályainak néhány következménye a mintára vonatkozóan(1) Felhasználva,hogy a minta elemei X 1, X,...X n független változók (azaz egyikük felvett értéke sem befolyásolja a többi elem felvehetı értékét), igazolhatók az alábbiak A mintabeli relatív gyakoriság (f/n) - várható értéke azonos a sokasági relatív gyakorisággal (p) - varianciája pedig: Var (f/n) = p(1- p)/n
A sokasági átlag és variancia szabályainak néhány következménye a mintára vonatkozóan() A minta átlagának ( X a mintavétel elıtt) - várható értéke azonos a sokasági átlaggal E( X )= µ - varianciája pedig: Var ( X) = σ /n - így az átlag szórása σ = σ/ n X
A sokasági átlag és variancia szabályainak néhány következménye a mintára vonatkozóan (3): Két minta-átlag eltérésének várhatóértéke és szórása Tekintsünk két (idegen) sokaságot (1. és.), paramétereik µ 1 és σ 1 illetve µ és σ. Vegyünk az 1. sokaságból n 1 elemő mintát, a.-ból n elemőt, az átlagokat (a mintavétel elıtt) jelölje rendre X ill. Y. Jelölje D a két átlag eltérését, ennek várható értéke és szórása jelentıs szerepet kap a további vizsgálatokban
Két minta-átlag eltérésének (folytatás) Megmutatható, hogy - az eltérés várható értéke µ = E( X Y ) = µ µ D 1 - és a varianciája σ 1 σ = Var( X Y) = + D n1 σ n - Speciálisan ha σ 1 = σ = σ, akkor és ha emellett n 1 = n = n, akkor 1 1 σ = + D n1 n σ σ σ = D n
KÖSZÖNÖM TÜRELMÜKET
6. lecke: Fontosabb sokasági eloszlások Binomiális, hipergeometrikus és Poisson eloszlás Exponenciális eloszlás Normális eloszlás, standard normális eloszlás Statisztikai (normálisokból származtatott) eloszlások
Fontosabb sokasági eloszlások Diszkrét változók eloszlás-típusai - Binomiális eloszlás - Hipergeometrikus eloszlás - Poisson eloszlás Folytonos változók eloszlás-típusai - Egyenletes eloszlás - Exponenciális eloszlás - Normális eloszlás - Normálisból származtatott eloszlások
Binomiális eloszlás Végezzünk n kísérletet, melyek mindegyikében p=p(a) eséllyel következik be a bennünket érdeklı A esemény és q=1-p eséllyel nem következik be (ilyen pl. a visszatevéses mintavétel is véges sokaságnál) Legyen X az A bekövetkezésének száma az n kísérletbıl, X nyilván diszkrét véletlen változó, melynek lehetséges értékei 0,1,,.., n. Az X változó eloszlását n, p paraméterő binomiális eloszlásnak nevezzük. Az X=k esemény valószínőségét p k - val jelölve, kimutatható, hogy n k n k pk = P( X = k) = p q, ( k = 0,1,,..., n) k X várható értéke és varianciája: µ = np σ = npq
Hipergeometrikus eloszlás Egy N elemő sokaságban legyen valamely A tulajdonságú egyedek száma S, ezek aránya p=s/n és visszatevés nélkül válasszunk ki n egyedet. Legyen X a kiválasztottak között az A tulajdonságúak száma. X diszkrét változó, melynek lehetséges értékei 0, 1,,.,min(S,n) Az X véletlen változó eloszlását n,n,s paraméterő hipergeometrikus eloszlásnak nevezzük. Az X=k esemény valószínőségét p k -val jelölve, kimutatható, hogy pn k n k n 1 = P( X = k) = ; ( k = 0,1,, n) µ = np, σ = npq 1 N N 1 n qn p k...
A Poisson eloszlás (ritka események eloszlása) a binomiális eloszlás határesete, ha n igen nagy és p pici. Ekkor az np =µ jelöléssel az X=k eset valószínősége: k µ µ pk = P( X= k) = e, ( k= 0,1,,... ) k! A Poisson eloszlású X valószínőségi változó várható értéke és szórásnégyzete egyaránt a µ paraméter. Példa: ha egy területen bizonyos növény vagy rovaregyedek véletlenszerően szóródnak, akkor az egységnyi területre esı X egyedszám Poisson eloszlású, µ az egységnyi területre esı átlagos egyedszámot jelenti
Exponenciális eloszlás Alkatrészek élettartama, rovarok túlélési ideje a rovarirtó szer kipermetezésétıl számítva (és általában véletlen idıtartamok, távolságok) közelítıen exponenciális eloszlásúak λx sőrőségfüggvénye p x = λ e ha x 0 különben p x = eloszlásfüggvénye F(x) = 1 e -λx (x>0) ( ) ( ) 0 várható értéke 1/λ, szórása ugyanennyi Felezési idınek nevezzük azt a T értéket, amelyre F(T) = ½, azaz T = (ln )/λ 0,69/λ
Normális eloszlás A normális eloszlás a legfontosabb folytonos eloszlás 1 1 sőrőségfüggvénye ( ) ( x µ ) p x exp = σ ahol µ és σ a normális eloszlású ismérv várható értéke ill. a szórása, képe a Gauss-féle haranggörbe π A normális eloszlás-család tehát két-paraméterő, jelöljük N( µ,σ)-val. E családban a µ=0 és σ=1 paraméterő esetet standard normális eloszlásnak nevezik. A sőrőségfüggvényét p(x) helyett konvencionálisan φ(u) - val jelölik, eloszlásfüggvénye pedig F(x) helyett Φ(u). σ
Normális eloszlás sőrőségfüggvénye µ
F(x) számítása Φ(u)-ból (Normális eloszlás folyt.) A Φ(u) és a φ(u) függvény táblázatba foglalva megtalálható minden statisztika témájú könyvben (Excelbıl is kikereshetı) Tetszıleges N( µ, σ ) eloszlás eloszlásfüggvény értéke F(x) kiszámítható a standard normális eloszlásfüggvénybıl. Az átszámítás : x µ F µ, σ ( x) = Φ σ Eszerint egy N( µ,σ) eloszlású alapsokaságnak az (a,b) közbeesı egyedeinek részaránya:
P(a x<b) számítása Φ(u)-ból (Normális eloszlás folyt.) Az átszámítási formula szerint egy N( µ,σ) eloszlású alapsokaságnak az (a,b) közbe esı egyedeinek részaránya: ahol P ( a x < b) = F( b) F( a) = Φ( ) Φ( ) b µ a µ ub = és u a = σ σ Megjegyezzük, hogy tetszıleges eloszlású X változó standardizáltjának nevezzük az ( X µ ) σ változót. Ennek várható értéke mindig 0 és szórása 1 X = u b u a
Normális eloszlás(ok)ból képzett statisztikai eloszlások (1) Véletlen változók függvényei is véletlen változók. 1) Lognormális eloszlásúnak nevezzük X változót, ha logx normális eloszlású. ) n független standard normális eloszlású véletlen változó négyzetösszege n szabadságfokú chi eloszlású valószínőségi változó, tehát: χ = 1 X + X +... + X n ahol az X i valószínőségi változók független, N(0,1) eloszlásúak. A függetlenség durván azt jelenti, hogy nincsenek kapcsolatban egymással (de erre még kitérünk).
Normális eloszlás(ok)ból képzett statisztikai eloszlások () 3) A t-eloszlás Legyen X standard normális eloszlású és χ [ n ] khi eloszlású változó, legyenek függetlenek. Ekkor a t[ n ] = véletlen változó eloszlását n-szabadságfokú t- eloszlásnak hívjuk (Student-eloszlás) χ X n
Normális eloszlás(ok)ból képzett statisztikai eloszlások (3) 3) Az F-eloszlás Két független chi eloszlású valószínőségi változó legyen χ [ m ] és χ [ n] Ekkor az χ [ m] / m F[ m, n] = χ / [ n] n hányados F-eloszlású, m,n szabadságfokokkal.
KÖSZÖNÖM TÜRELMÜKET