Biometria. Gergó Lajos 2012.

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Biometria. Gergó Lajos 2012."

Átírás

1 Biometria Gergó Lajos 2012.

2 Tartalomjegyzék 1. Valószínűségszámítási bevezető Bevezető példák, definíciók Valószínűségi változó Normális eloszlású valószínűségi változó Statisztikai módszerek Gyakorisági- és sűrűséghisztogram Várható érték és szórás becslése Regresszió, korreláció Nevezetes eloszlások a statisztikában t-eloszlás F-eloszlás χ 2 -eloszlás Becslések Pontbecslések Intervallum becslések Statisztikai hipotézisvizsgálat Próbák Korrelációs t-próba Egymintás t-próba F-próba Kétmintás t-próba Variancia-analízis χ 2 -próbák

3 TARTALOMJEGYZÉK 3 3. Diszkrét eloszlások Poisson-eloszlás Binomiális-eloszlás Hipergeometrikus-eloszlás Példák Statisztikai táblázatok 52

4 1. fejezet Valószínűségszámítási bevezető 1.1. Bevezető példák, definíciók Az első fejezetben szeretnénk megismertetni az olvasókat a valószínűségszámítás alapjaival, leginkább egyszerű példákon keresztül. A terjedelem korlátai miatt nem tehetünk mindig pontos kijelentéseket, de törekszünk a lehető legprecízebb definíciókra, tételkimondásokra. Akkor tekintsük is az első példánkat, ami az egy darab dobókockával történő dobást írja le. Egy kísérlet lehetséges kimeneteleinek halmazát a valószínűségszámításban eseménytérnek nevezik és általában az Ω (görög nagy omega) betűvel jelölik. Esetünkben ez Ω = {1,2,3,4,5,6} Az Ω halmaz tetszőleges részhalmazát eseménynek nevezzük, tekintsünk erre is példákat. 1. A 1 : 6-ost dobok, halmazjelöléssel: A 1 = {6} Ω 2. A 2 : prímszámot dobok, A 2 = {2,3,5} Ω 3. A 3 : legalább kettest dobok, A 3 = {2,3,4,5,6} Ω 4. A 4 : páros számot dobok, A 4 = {2,4,6} Ω 4

5 1.1 Bevezető példák, definíciók 5 Az egy elemet tartalmazó eseményeket elemi eseményeknek nevezzük. Példáink közül az A 1 egy elemi esemény, a többi példánk viszont nem elemi esemény. Létezik még két kiemelt, külön nevet kapó esemény, ezek pedig a lehetetlen esemény ( ), valamint a biztos esemény (Ω). Egyszerűen látható, hogy események uniója, metszete, különbsége, és (Ω-ra vonatkozó) komplementere is esemény lesz. Ezek jelölésére a valószínűségszámítás területén általában a következőket használják (unió),, vagy (metszet), \ (különbség), A (A esemény komplementere). Láthatjuk, hogy a metszetet szorzásjellel szokás jelölni, aminek oka, hogy független események valószínűsége egyenlő az események valószínűségeinek szorzatával. Az események definíciója után térjünk rá a valószínűség definíciójára. Egy esemény valószínűségének meghatározásakor az eseményhez egy számot rendelünk a [0, 1] intervallumból. Ez tulajdonképpen egy P, az események halmazán értelmezett függvény segítségével történik. A függvény eseményhez rendelt értéke lesz az adott esemény valószínűsége. A függvénynek bizonyos tulajdonságokkal rendelkeznie kell, hogy valószínűségről beszélhessünk. Egy példa az ilyen tulajdonságok rögzítésére a Kolmogorov-féle axiómarendszer 1. 0 P (A) 1, azaz a valószínűség egy 0 és 1 közötti érték; 2. P ( ) = 0, azaz a lehetetlen esemény valószínűsége 0; 3. P (Ω) = 1, a biztos eseményé pedig 1; 4. A B = P (A B) = P (A)+P (B), azaz ha A és B egymást kizáró események, akkor a két esemény uniójának valószínűsége megegyezik az események valószínűségeinek összegével; ( n ) 5. A i A j = (i j) P A i = n P (A i ), azaz a 4. feltétel véges sok, egymást kizáró eseményre is alkalmazható. Ennek egy n további fontos esete, amikor A i = Ω, azaz az A i események

6 6 1. Valószínűségszámítási bevezető ( n ) teljes eseményrendszert alkotnak, és ekkor P A i = 1. Megjegyeznénk, hogy természetesen nem csak a Kolmogorov-féle valószínűség létezik, vannak sokkal bonyolultabbak is, de ez az egyik legelterjedtebb modell, mi ezt fogjuk használni a továbbiakban. Példaképpen nézzük a már említett, kockadobáshoz tartozó eseményeket, és valószínűségeiket: P(A 1 ) = 1 6, P(A 2) = 3 6 = 1 2, P(A 3) = 5 6, P(A 4) = 3 6 = 1 2. Most térjünk át egy kicsit bonyolultabb példára, tekintsük azt, amikor két különböző dobókockával (piros, kék) dobunk. Ekkor Ω = {(1,1),(1,2),...,(1,6),(2,1),...,(2,6),...,(6,6)} az eseménytér, Ω = 36. Megjegyeznénk, hogy fontos az a feltétel, hogy különböző kockákkal dobtunk, mert ebben az esetben - úgymond- számít a sorrend, míg ha egyformák lennének a kockák, akkor nem, és bonyolultabb lenne a modell. Példák eseményekre 1. A 1 : legalább 11 a két dobott szám összege, A 1 = {(5,6),(6,5),(6,6)} Ω,P(A 1 ) = A 2 : a két dobott számból legalább egy 1-es van, A 2 = {(1,1),(1,2),...,(1,6),(2,1),(3,1),...,(6,1)} Ω,P(A 2 ) = A 3 : a két dobott szám között pontosan egy 1-es van, A 3 = {(1,2),(1,3),...,(1,6),(2,1),(3,1),...,(6,1)} Ω,P(A 3 ) = A 4 : dupla 1-est dobtunk, A 4 = {(1,1)} Ω,P(A 4 ) = Valószínűségi változó E két példa után megpróbáljuk definiálni a valószínűségi változót, ám mivel a bevezetőben is említettük, hogy nem egy matematikailag tökéletesen precíz mű elkészítése a célunk, hanem a tanulmányok során

7 1.2 Valószínűségi változó 7 elsajátítandó tananyag könnyű megértését segítő jegyzet, ezért csak bizonyos szemléletes definíciót nyújtunk. Tehát legyen ξ (görög betű, ejtsd: kszí) egy valószínűségi változó, erről mondjunk egyelőre annyit, hogy bizonyos szempontból mér valamit, értékeit egy rögzített halmazból veheti fel. A szemléletes definícióhoz mutassunk példákat 1. ξ 1 valószínűségi változó: méri egy kockadobás eredményét 2. ξ 2 valószínűségi változó: méri két kockával történő dobás esetén a dobott számok összegét 3. ξ 3 valószínűségi változó: méri egy embercsoport testmagasságát 4. ξ 4 valószínűségi változó: méri egy embercsoport testhőmérsékletét 5. ξ 5 valószínűségi változó: méri valamely termék súlyát Precízebben fogalmazva a valószínűségi változó az eseménytéren értelmezett függvény, mely minden egyes eseményhez egy számot rendel Definíció. Egy ξ valószínűségi változót diszkrét eloszlású valószínűségi változónak nevezünk, ha megszámlálható (véges, vagy megszámlálhatóan végtelen) számú értéket vehet fel, különben folytonos eloszlásúnak nevezzük. A példákban említett valószínűségi változók közül ξ 1 és ξ 2 diszkrét eloszlásúak, ξ 1 lehetséges értékei: 1,2,3,4,5,6, míg ξ 2 lehetséges értékei: 2,3,4,...,12. ξ 3,ξ 4,ξ 5 valószínűségi változók pedig folytonos eloszlásúak, lehetséges értékeiket egy adott intervallumból vehetik fel Definíció. Egy ξ valószínűségi változó eloszlásfüggvényén az alábbi F : R [0,1] függvényt értjük, ahol definíció szerint. F(x) = P(ξ < x) 1.3. Megjegyzés. F monoton növekedő függvény.

8 8 1. Valószínűségszámítási bevezető 1.4. Megjegyzés. Ha ξ diszkrét eloszlású valószínűségi változó, lehetséges értékei: x 1,x 2,..., akkor F(x) = x i <xp(ξ = x i ) alakban számítható. Folytonos eloszlású valószínűségi változók esetén gyakran létezik egy úgynevezett sűrűségfüggvény (f : R [0, + )), amely segítségével felírható az eloszlásfüggvény F(x) = x f(t)dt alakban Megjegyzés. + f(t) dt = 1 egyenlőségnek minden sűrűségfüggvény esetén teljesülnie kell. 1. Példa Vizsgáljuk meg megint az egy kockával történő dobást, de most ebben az általánosabb tárgyalásmódban, azaz legyen ξ valószínűségi változó a kockadobás eredménye. Ekkor a lehetséges értékei: 1, 2, 3, 4, 5, 6. Nézzük meg az eloszlásfüggvényét, amelyet könnyen megkaphatunk az 1.4 megjegyzésbeli képlet alkalmazásával: F(x) = 0, ha x 1, F(x) = 1, ha 1 < x 2, 6. F(x) = 5, ha 5 < x 6, 6 F(x) = 1, ha x > 6.

9 1.2 Valószínűségi változó 9 2. Példa ξ valószínűségi változó méri az óra két mutatója által közrezárt kisebbik szöget, 0 ξ π a lehetséges értékek. Ekkor az eloszlásfüggvény megadható x, ha x [0,π] π F(x) = P(ξ < x) = 0, ha x < 0 1, ha x > π alakban, valamint ebben az esetben megadható a valószínűségi változó sűrűségfüggvénye is 1, ha x [0,π] f(x) = π 0, különben formában. Továbbá ellenőrizhető, hogy a sűrűségfüggvény, és az eloszlásfüggvény közti összefüggés fennáll, azaz teljesül az F(x) = x f(t) dt egyenlőség Definíció (Várható érték). A ξ valószínűségi változó várható értékén a következő számot értjük M(ξ) = µ = i x i P(ξ = x i ) diszkrét esetben, míg folytonos esetben az M(ξ) = µ = + xf(x)dx számot.

10 10 1. Valószínűségszámítási bevezető 1.7. Definíció (Szórásnégyzet). A ξ valószínűségi változó szórásnégyzete (varianciája) a D 2 (ξ) = M ( (ξ µ) 2) = M ( ξ 2) (M(ξ)) 2 mennyiség. Diszkrét esetben számítható (x i µ) 2 P(ξ = x i ) formában, folytonos esetben pedig alakban. i + (x µ) 2 f(x)dx 1.8. Definíció (Szórás). A ξ valószínűségi változó szórása (standard eltérése) a σ = M ( (ξ µ) 2) = D 2 (ξ) = D(ξ) mennyiség. 1. Példa Vizsgáljuk meg egy kockadobás várható értékét µ = 6 x i P(ξ = x i ) = i 1 6 = 7 2, i ehhez két megjegyzést fűznénk, mint látjuk, a várható érték nem feltétlenül a lehetséges értékek közül való (három és felet nem tudunk dobni), viszont várható, hogy sok dobás átlaga közel lesz ehhez az értékhez, tehát ilyen szempontból mégis egy olyan mérőszámot fejez ki, mint amit a neve sugall. 2. Példa Nézzük meg, mit tudunk mondani az óramutatós példánál ξ várható értékéről µ = + xf(x)dx = π 0 x 1 π dx = π 2, tehát azt kaptuk, hogy a közrezárt szög várhatóan derékszög.

11 1.2 Valószínűségi változó Normális eloszlású valószínűségi változó A továbbiakban egy nagyon fontos folytonos eloszlású valószínűségi változóval fogunk foglalkozni részletesebben, mégpedig a normális eloszlású valószínűségi változóval Definíció. A ξ valószínűségi változó normális eloszlású, ha sűrűségfüggvénye f(x) = 1 2πσ e (x µ)2 2σ 2, (x R) alakban adott. F(x) = 1 x 2πσ e (t µ)2 2σ 2 dt, (x R) alakban számítható az eloszlásfüggvénye, viszont sajnos ezt zárt alakban nem lehet kifejezni. A következő ábrán a µ = 2.5, σ = 1.5 paraméterekkel rendelkező normális eloszláshoz tartozó sűrűségfüggvényt szemléltetjük. 0.3 f(x) µ σ µ µ+σ Látható, hogy a normális eloszlású változók sűrűségfüggvénye egy haranggörbe lesz, amelynek maximuma van a µ pontban, valamint inflexiós

12 12 1. Valószínűségszámítási bevezető pontjai vannak a µ±σ pontokban, továbbá természetesen ± -ben 0 a határértéke. Kiszámítható, hogy ezen eloszlás szerinti valószínűségi változó várható értéke pontosan a paraméterként megadott µ, míg szórása szintén a paraméterként adott σ lesz Definíció. Normális eloszlás esetén a µ = 0, σ = 1 esetnek külön neve van, az ilyen valószínűségi változót standard normális eloszlású valószínűségi változónak nevezzük. Sűrűségfüggvénye f(x) = 1 e x2 2 2π alakban adott. Standard normális eloszlás esetén az eloszlásfüggvényt nem F-fel, hanem Φ-vel jelölik és alakban számíthatóak az értékei. Φ(x) = 1 x 2π e t2 2 dt Megjegyzés. Ez a Φ függvény a valószínűségszámítás területén nagyon komoly szerepet játszik, sok helyen kerül elő, és mivel elég bonyolult a képlete, általában minden könyvben megtalálhatóak táblázatolva az értékei, egy elég sűrű felosztáson véve. Viszont a sűrűségfüggvény szimmetrikus a 0-ra, ezért természetesen csak x > 0 esetben szokták táblázatolni a függvényértékeket, ugyanis a szimmetria tulajdonság felhasználásával kiszámítható Φ( x) = 1 Φ(x) alakban tetszőleges helyen a helyettesítési értéke Megjegyzés. Ha ξ (µ, σ) paraméterű normális eloszlású ξ µ valószínűségi változó, akkor egy standard normális eloszlású σ valószínűségi változót fog megadni. Tehát tetszőleges normális eloszlású változót vissza tudunk vezetni standard normálisra, és így használhatjuk a táblázatolt értékeket. Példaként határozzunk meg három, speciális valószínűségértéket.

13 1.2 Valószínűségi változó 13 P( ξ µ > σ) 0.32, P( ξ µ > 2σ) 0.05, P( ξ µ > 3σ) Innen látható például, hogy körülbelül 68% valószínűséggel a(µ σ, µ+σ) intervallumba esik a változó értéke. Végül szemléltetésképpen rajzoljuk fel a standard normális eloszláshoz tartozó sűrűségfüggvény grafikonját is, azaz amikor µ = 0, σ = f(x) 68% Esetünkben a változó 68%-os valószínűséggel a [ 1, 1] intervallumba esik, továbbá a [ 2, 2] intervallumba már 95% valószínűséggel esik bele, végül szinte teljesen biztos, hogy a [ 3, 3] intervallumba bele fog esni a változónk felvett értéke, egészen pontosan ez a valószínűség 99.8%, de ez látszik az ábránkon is, mert a sűrűségfüggvény 3-nál és 3-nál már erősen közelít a 0-hoz. A pontos értékekhez lapozzunk a jegyzet 53. oldalára, ahol megtaláljuk a Φ függvény táblázatát.

14 2. fejezet Statisztikai módszerek A rövid valószínűségszámítási bevezető után most szeretnénk bemutatni az alapvető statisztikai módszereket, definíciókat, természetesen példákkal illusztrálva. Első lépésben tisztázzuk, hogy mi is a statisztika feladata. Tegyük fel, hogy adott egy konkrét valószínűségi változó (konkrét mérés), a statisztika során ezt szeretnénk jobban megismerni, jellemezni bizonyos kívánt szempontok alapján. A következő kérdés az lehetne, hogy milyen módon, mi alapján szeretnénk, tudjuk ezt megtenni. A válasz egyszerű, nem ismerjük a valószínűségi változó tulajdonságait, csak véges sok adat (mérés) áll rendelkezésünkre, és ebből szeretnénk minél többet megtudni a valószínűségi változóról. A rendelkezésre álló adatokat mintának nevezik a statisztikában. Ezen minta elemeit a x 1,x 2,...,x n betűkkel jelöljük, n-et a minta méretének, vagy elemszámának nevezzük Definíció (Statisztikai következtetés). Statisztikai következtetésnek hívjuk, amikor egy ismeretlen paraméterű, de ismert eloszlású (pl. normális) valószínűségi változó paraméterére következtetünk egy adott minta alapján. A gyakorlatban ezt arra használhatjuk, hogy egy populáción, vagy populációkon vett mérések, megfigyelések alapján teszünk következtetéseket a populációra vonatkozóan. 14

15 2.1 Gyakorisági- és sűrűséghisztogram Gyakorisági- és sűrűséghisztogram Legyen adott x 1,x 2,...,x n minta, ahol a minta mérete, n legyen nagy (50-100). Rendezzük a mintát, és jelöljük ennek az elemeit a = x 1,x 2,...,x n 1,x n = b, tehát a jelölje a legkisebb, míg b a legnagyobb mintaelemet. Ezek után osszuk fel az [a, b] intervallumot r egyenlő részre az y k = a + b a k (k = 0,1,...,r) osztópontokkal. A gyakorlatban r r értéke általában 5-14 között helyezkedik el. Jelölje ezek után f k az [y k 1,y k ) intervallumba eső mintaelemek számát. Ezek alapján már definiálhatjuk egy intervallum relatív gyakoriságát a hányadossal. q k = f k n 2.2. Definíció. Egy x 1,x 2,...,x n mintához tartozó grafikont gyakorisági hisztogramnak nevezünk, ha az [y k 1,y k ) intervallumokon rendre f az k y k y k 1 értékeket veszi fel (egyébként pedig 0-t). Ellenőrizhető, hogy ilyenkor a grafikon által bezárt terület pontosan a minta mérete, azaz n lesz, ugyanis n f k n T = (y k y k 1 ) = f k = n. y k y k 1 k= Definíció. Egy x 1,x 2,...,x n mintához tartozó grafikont sűrűséghisztogramnak nevezünk, ha az [y k 1,y k ) intervallumokon q rendre a k y k y k 1 értékeket veszi fel (egyébként pedig 0-t). Ekkor a grafikon által közrezárt terület pedig 1-gyel lesz egyenlő, ami az előzőek alapján nagyon egyszerűen látható. A sűsűségi hisztogram jól közelíti a sűrűségfüggvényt, ha n nagy, így ha kiválasztunk tetszőleges α, β értékeket (a α < β b), akkor a P(α ξ < β) valószínűségre jó közelítést tudunk adni a sűrűséghisztogram [α, β] intervallum feletti területével. Tehát ha egy h (szakaszonként állandó) függvényként tekintünk a sűrűségi hisztogramra, akkor P(α ξ < β) β α k=1 h(x) dx

16 16 2. Statisztikai módszerek összefüggést tudjuk felírni Megjegyzés. Mivel egy konkrét α érték feletti terület 0 (mivel az intervallum hossza ilyenkor 0), ezért mindig csak intervallumba esés valószínűségéről szokás beszélni. A könnyebb megértés elősegítésére nézzük a következő mintát a sűrűséghisztogramra vonatkozóan. q 3 y 3 y 2 q 3 q n 2 q 2 q n 1 q 1 y 0 y 1 y 2 y 3 y n 3 y n 2 y n 1 q n y n Az ábrán a téglapok belsejében szereplő q k értékek az adott téglalap területét mutatják. Tudjuk, hogy ezen területek összege pedig 1-et ad ki Várható érték és szórás becslése Ebben a részben adott egy µ várható értékű, σ szórású ξ valószínűségi változó, de mi nem ismerjük sem µ, sem σ értékét, ezekre szeretnénk becslést kapni, szintén egy statisztikai minta segítségével.

17 2.2 Várható érték és szórás becslése Definíció (Mintaátlag). Az n x = 1 n x i számot a minta átlagának nevezzük. Erről a mennyiségről elmondhatjuk, hogy jól közelíti a várható értéket, tehát x µ Definíció (Variancia). Az s 2 x = 1 n 1 n (x i x) 2 számot pedig a minta varianciájának nevezzük. Ekkor s x σ, azaz a minta varianciájának négyzetgyöke jól becsli a ξ valószínűségi változó szórását. Az s x mennyiséget tapasztalati szórásnak nevezzük Megjegyzés. Néha könnyebb számolnunk, ha x i minta helyett egy y i mintával dolgozunk, amire teljesül, hogy y i = x i A ( i = 1,2,...,n, tetszőleges, alkalmas A R értékkel). Vizsgáljuk is meg a megjegyzésben említett esetet bővebben. Először tekintsük az y i minta átlagát, n n n y = 1 n y i = 1 n (x i A) = 1 n x i A = x A, tehát ha minden elemet A-val eltolunk, akkor a minta átlaga is A-val tolódik el. Ezek után nézzük meg, mi történik a tapasztalati varianciával, s 2 y = 1 n 1 n (y i y) 2 = 1 n 1 = 1 n 1 n (x i A (x A)) 2 = n (x i x) 2 = s 2 x, tehát azt kaptuk, hogy az eltolás valóban nem változtat a tapasztalati szóráson, tehát ha kényelmesebb, akkor valóban számolhatunk az y i mintával.

18 18 2. Statisztikai módszerek Példa Számítsuk ki az x 1 = 55,x 2 = 52,x 3 = 56 minta átlagát, és varianciáját! ebből s 2 x = 1 2 x = = 163 3, [ ( ) 2 +( ) 2 +( ) ] lenne, de ez elég bonyolult kifejezés, inkább használjuk fel az előző megjegyzésben említetteket. Legyen y i = x i 52, így a minta: y 1 = 3,y 2 = 0,y 3 = 4, a mintaátlag pedig y = 7. Ezek után nézzük meg 3 az y i minta varianciáját, amiről tudjuk, hogy megegyezik az x i minta varianciájával: [ ( s 2 x = s 2 y = ) 2 +( ( ) 7 ) ] 2 = 3 [ (2 = 1 ) ( ) ( ) ] 2 5 = = Megjegyzés. Tanácsként megemlítenénk, hogy a mintaátlagot, és a minta varianciáját is 1 tizedesjeggyel pontosabban számítsuk, mint ahogyan az adatok megadásra kerültek, természetesen kerekítéssel. A továbbiakban ismerkedjünk meg két hibafogalommal Definíció (Minta hibája). Egy x 1,x 2,...,x n minta hibáján az adatoknak az x átlagtól való eltérését nevezzük. Ezt az s x szórás méri. Ezek alapján, mint említettük, a hibát az s x mennyiséggel mérhetjük. Egy N (µ, σ) eloszlású változó esetén a 2s x mennyiséggel adható egy 95% megbízhatóságú becslés, ez az úgynevezett hibakorlát, valamint a 3s x mennyiséggel adható egy 99.8% megbízhatóságú becslés, amit pedig biztos hibakorlátnak szokás nevezni.

19 2.2 Várható érték és szórás becslése Definíció (Az átlag hibája). Egy x 1,x 2,...,x n mintára vonatkozó x átlag szórását standard hibának nevezzük, és így jelölhetjük, számíthatjuk ki: s x = s x, n ahol n a megszokott módon a minta elemszámát jelöli. Példa Egerek testhőmérsékletét mérték, ebből készítettek egy 15 elemű mintát, az alábbi értékekkel (x 1,x 2,...,x 15 ): 36.8, 36.2, 37.1, 36.7, 36.9, 37.0, 36.9, 37.4, 36.9, 36.6, 36.7, 36.1, 36.8, 36.4, 37.0 C Határozzuk meg a minta átlagát, tapasztalati szórását, szórásnégyzetét, a standard hibát, valamint adjuk meg a biztos hibakorlátot is, majd ellenőrizzük, hogy mit kaptunk. Megoldás: A számítások során a megfelelő számú tizedesjegyig kerekítünk, viszont a kényelmesség, és átláthatóság miatt egyenlőségjellel írjuk le a megoldásokat. A minta átlaga A minta szórásnégyzete x = 1 15 s 2 x = 1 14 Ebből a minta szórása x i = (x i x) 2 = s x = s 2 x = 0.34 A standard hiba s x = s x n = 0.09 A biztos hibakorlát pedig egyszerűen adódik 3s x = 1.02

20 20 2. Statisztikai módszerek formában. Ezek után vegyük észre, hogy miért is nevezik biztos hibakorlátnak ezt a mennyiséget. Ehhez nézzük meg, hogy a 15 mintaelemből mennyi esik bele az [x 3s x,x+3s x ] intervallumba. Első lépésben határozzuk meg ezt az intervallumot, ami nem más, mint [35.75, 37.79]. Innen már látszik, hogy az összes mintaelem ebben az intervallumban helyezkedik el Definíció (Metodikai hiba). Ebben az esetben párhuzamos méréseket végzünk, rendre n 1,n 2,...,n k elemű mintákat készítve: x (1) 1,x (1) 2,...,x (1) n 1 x (2) 1,x(2) 2,...,x(2) n 2. x (k) 1,x(k) 2,...,x(k) n k Ezen adatokból kiszámítjuk a Q x (1),Q x (2),...,Q x (k) értékeket a következő módon: n j ( ) 2 Q x (i) = x (i) j x (i) j=1 Ebből kapjuk az úgynevezett metodikai hibát alakban. k Q x (j) s m = j=1 k (n j 1) j=1 A metodikai hiba tulajdonképpen a módszernek, eljárásnak a hibáját adja meg.

21 2.3 Regresszió, korreláció Definíció (Relatív szórás). Egy minta átlagának (x), valamint szórásának (s x ) felhasználásávaldefiniálható az úgynevezett relatív szórás módon. V = s x x 100% A relatív szórás, mint mérőszám akkor lehet segítségünkre, amikor méréseket szeretnénk összehasonlítani Regresszió, korreláció Az átlagra, és szórásra vonatkozó különböző definíciók, becslések, példák után térjünk át a következő témakörre, ami nem más, mint a regresszió, korreláció. Ezek közül is először ismerkedjünk meg a regresszió fogalmával. A regresszió feladatában azzal foglalkozunk, hogy két adott valószínűségi változó között van-e valamiféle kapcsolat, egy bizonyos függvényen keresztül. Pl. ξ = f(η), ahol f egy tetszőleges függvény. Mi csak a lineáris regresszióval fogunk részletesebben foglalkozni Definíció (Regressziós egyenes). Legyen adott két minta ξ : x 1,x 2,...,x n η : y 1,y 2,...,y n Ekkor az (x i,y i ) (i = 1,2,...,n) pontokra a legkisebb négyzetek módszerével illesztett egyenest regressziós egyenesnek nevezzük. A definícióban említett egyenes egyenlete y = ax+b alakban adott, és tudjuk, hogy a megoldás nem lesz más, mint a = n n x i y i y n x i x 2 i x n, x i

22 22 2. Statisztikai módszerek b = y ax Tekintsük a következő jelöléseket: n n Q xy = x i y i y x i = Q x = n (x i x)(y i y) (2.1) n n x 2 i x x i, (2.2) amely jelölések majd fontos szerepet fognak játszani a kovariancia, és korreláció definiálása során Megjegyzés. A metodikai hibánál definiált Q x mérőszám megegyezik az itt említettekkel, csak kissé más formában írtuk fel. Ezekkel a jelöléseket felhasználva alakban kapjuk a megoldást. a = Q xy Q x, b = y ax Megjegyzés. A legkisebb négyzetek módszere bármilyen elrendeződésű pontokra felírja a feltételeknek megfelelő egyenest, tehát az eljárás sikeressége semmit nem jelent a két változó közötti lineáris kapcsolat tekintetében. Ezek után rá is térünk a már említett kovariancia definíciójára Definíció (Kovariancia, korreláció). Adott két minta x 1,x 2,...,x n és y 1,y 2,...,y n. A két mintára vonatkozó kovariancián (együttes ingadozáson) az s xy = Q xy n 1 mennyiséget értjük. A két minta korrelációs együtthatója pedig alakban adódik. r = s xy s x s y = Q xy Qx Q y

23 2.3 Regresszió, korreláció Megjegyzés. Megmutatható, hogy r Megjegyzés. Vegyük észre, hogy a lineáris regresszió során kapott a, valamint az s xy és az r mennyiségek számlálója rendre Q xy, nevezőik pedig pozitívak, így az előjelük szintén megegyezik, és csakis Q xy előjelétől függ Megjegyzés. Ha r = 0, akkor azt mondjuk, hogy a két minta korrelálatlan. Továbbá r > 0 esetén pozitív korrelációról, míg r < 0 esetén negatív korrelációról beszélhetünk. Ha r 1, akkor igen erős a korreláció (összefüggés) a két minta között Megjegyzés. Ha két normális valószínűségi változó korrelálatlan, azaz r = 0, akkor függetlenek is. Példa Adott a következő két minta: x i : 5, 3, 1,1,3 y i : 8,10,9,12,11 Határozzuk meg a regressziós egyenest, és a korrelációs együtthatót! Ezek meghatározásához szükségünk lesz Q xy,q x,q y értékeire. Q xy = 5 x i y i y 5 x i = 30 10( 5) = 16 Q x = 5 x 2 i x 5 x i = 45 ( 1)( 5) = 40 Továbbá Q y = 5 5 yi 2 y y i = = 10 a = Q xy Q x = = 0.4 b = y ax = ( 1) = 10.4

24 24 2. Statisztikai módszerek Ezek alapján megadható a regressziós egyenesünk egyenlete alakban. A korrelációs együttható pedig r = Q xy = Qx Q y y = 0.4x = 4 5 = 0.8 módon adódik. Ezek után térjünk rá megint egy új témakörre, ami inkább a valószínűségszámítási bevezetőhöz tartozik, ugyanakkor legtöbbször csak a statisztikák készítésénél használják, ezért mi is itt említjük meg Nevezetes eloszlások a statisztikában Három különböző, a statisztikában sokat használt eloszlást fogunk megemlíteni, ezek a t-eloszlás, az F-eloszlás, valamint a χ 2 -eloszlás (khínégyzet). Továbbá bemutatjuk az ezen eloszlásokhoz tartozó táblázatok használatát is t-eloszlás Legyen adott egy (µ,σ)-normális eloszlású valószínűségi változó által meghatározott x 1,x 2,...,x n minta. Ezek alapján kiszámítjuk az x és az s x értékeket. Ekkor az x µ s x n 1 szabadságfokú, t-eloszlású lesz. A t-eloszlás eloszlásfüggvénye nem állítható elő explicit formában, de hasonlóan a standard normális eloszlás esetéhez, a kívánt értékeket egy táblázatból kikereshetjük magunknak. A t-eloszláshoz tartozó táblázat megtalálható az 54. oldalon. A használatához nézzünk egy rövid ismertetést, leírást, majd egy példát. A táblázat első oszlopból olvasható le a kívánt szabadsági fok, ez alapján ki tudjuk választani a keresett értékünk sorát, majd az első

25 2.4 Nevezetes eloszlások a statisztikában 25 sorban szereplő valószínűségek alapján meghatározhatjuk a keresett értéknek az oszlopát is, ilyen módon pedig már rendelkezésünkre is fog állni a kívánt érték. Példa Legyen n = 3, a kívánt valószínűség 0.05, ekkor n 1 = 2 sort, és a 0.05 értékhez tartozó oszlopot kell néznünk, így a keresett értékünk a lesz. Ennek jelentése nem más, mint P ( t > 4.303) = 0.05, azaz ez a bizonyos t-eloszlású változó 0.05 valószínűséggel esik a [ 4.303, 4.303] intervallumon kívülre. Nézzünk egy ábrát a t-eloszláshoz tartozó sűrűségfüggvényről. Az ábra az 5 szabadságfokú t-eloszlást szemlélteti t p 2 1 t p Tudjuk, hogy egy sűrűségfüggvény integrálja a számegyenes felett mindig 1-et kell adjon. Az itt jelölt t p küszöbszám azt adja meg, hogy a 0 körül mekkora környezetben kell vennünk az integrált, hogy 1 p értéket kapjunk, azaz hogy a változó pontosan 1 p valószínűséggel essen a [ t p,t p ] intervallumba. Ebből viszont következik, hogy annak a valószínűsége, hogy ezen kívül esik, pontosan p lesz, ez pedig nem mást fejez ki, mint amit az előző példánknál felírtunk. Megjegyeznénk, hogy mi minden esetben ezt a verzióját fogjuk használni a t-táblázatnak, amit kétoldali vizsgálatnak szokás nevezni, ugyanis, mint az ábrán is látható, mindkét oldalon egyenlő részeket

26 26 2. Statisztikai módszerek veszünk a számegyenesből. Ugyanakkor létezik egyoldali vizsgálat is a t-eloszlásra, ennek jelentése, hogy a valószínűségen belül nem az abszolút értéket, hanem a konkrét értéket vizsgáljuk, és arra szeretnénk bal-, vagy jobboldali becslést kapni. Továbbá megjegyeznénk, hogy a kétoldali küszöbértékekből egyszerűen kiszámíthatóak az egyoldali vizsgálathoz szükséges küszöbértékek, egészen pontosan a p valószínűségű egyoldali vizsgálathoz tartozó t p érték megegyezik a kétoldali megegyező szabadságfokkal rendelkező t 2p értékkel F-eloszlás Legyenek adottak egy(µ, σ)-normális eloszlású valószínűségi változó által meghatározott x 1,x 2,...,x n és y 1,y 2,...,y m minták. Ekkor az s 2 x s 2 y F-eloszlású lesz n 1,m 1 szabadságfokokkal. A továbbiakban válasszuk úgy a törtet, hogy s 2 x s 2 y > 1 teljesüljön, azaz ha nem teljesül, akkor cseréljük meg a két mintát. Az F-eloszláshoz tartozó értékeket szintén egy táblázatban találhatjuk meg, mégpedig az 55. oldaltól kezdődően. A használathoz itt is adunk egy kis leírást, majd egy konkrét példával még világosabbá tesszük az alkalmazást. Először is, állapítsuk meg a nevező szabadságfokát, ami jelöléseink szerint m 1. Keressük meg azt az oldalt, ahol ezen szabadságfok szerepel a táblázat első oszlopában. Ez kijelöl nekünk két táblázatban 5-5 sort. Ezek után nézzük meg a számláló szabadságfokát is, ami jelöléseinkkel n 1 lesz. Ezt az értéket keressük ki a megfelelő táblázat első sorából, így már csak 5 lehetőség maradt meg. Ezek után vegyük figyelembe a kívánt valószínűséget, amit a táblázat 2. oszlopában találunk, és máris megkaptuk a keresett értékünket.

27 2.4 Nevezetes eloszlások a statisztikában 27 Példa Legyen n = 21, m = 13, a kívánt megbízhatóság pedig 0.01, ekkor a nevező szabadságfoka m 1 = 12 lesz, azaz a szóbajöhető 8 oldalnyi táblázatból számunkra már csak az 57. és 58. oldalon található két táblázat lesz fontos, azoknak is a 12-es szabadságfokhoz tartozó 5-5 sora. Ezek után nézzük a számláló szabadságfokát, ez n 1 = 20 lesz, amivel már csak az 58. oldalon szereplő táblázatrészt kell néznünk. Végül felhasználjuk a kívánt valószínűséget is, ami esetünkben 0.01, azaz 1% volt, így a keresett értékünk a 3.86 lett. Ennek jelentése pedig a következő: ( ) s 2 P x > 3.86 = 0.01, (2.3) s 2 y azaz ez a bizonyos F-eloszlású valószínűségi változó 1% valószínűséggel vesz fel 3.86-nál nagyobb értéket. Az általános esethez még egy ábrát is beszúrnánk, hogy az a t p küszöbindex valójában mit jelent t p 3 4 Az ábrán az 5, 2 szabadsági fokokhoz tartozó F-eloszlás sűrűségfüggvénye látható, amiről tudjuk, hogy integrálja a számegyenesen 1-et ad. A t p küszöbérték azt adja meg, hogy honnantól kezdve kell integrálnunk, hogy pontosan p legyen a fennmaradó [t p,+ ) intervallum felett vett integrál. Azt pedig tudjuk, hogy a sűrűségfüggvény integrálja egy intervallum felett pontosan azt adja meg, hogy a változó milyen valószínűséggel esik az intervallumba, esetünkben

28 28 2. Statisztikai módszerek a [t p,+ ) intervallumba, ami pedig nem mást jelent, mint a 2.3 pontban leírt valószínűség χ 2 -eloszlás Adott egy (µ, σ) paraméterű normális eloszlású változóból származó x 1,x 2,...,x n minta. Ekkor n ( xi x σ ) 2 n 1 szabadságfokú χ 2 -eloszlású lesz. A χ 2 -eloszlás táblázata a 63. oldalon található. Mivel használata megegyezik a t-táblázatéval, itt csak egy rövid példát említünk meg. Példa Legyen ismét n = 3, a kívánt valószínűség pedig Ebben az esetben szintén az n 1 = 2 értékhez tartozó sort, és a 0.05 értékhez tartozó oszlopot kell néznünk, így a keresett értékünk a lesz. Látjuk, hogy a használat során ugyanazt kellett tennünk valóban, mint a t-eloszlás esetében, viszont jelentésben van eltérés a kettő között. Mégpedig a példában említettek jelentése a következő: ( n ( ) 2 xi x P > 5.991) = 0.05, σ azaz ez a bizonyos χ 2 -eloszlású, nemnegatív valószínűségi változó 0.05 valószínűséggel vesz fel nél nagyobb értéket. Nézzükmegaχ 2 -eloszlásnakisasűrűségfüggvényét, mégpedigamikor a szabadságfok értéke 3.

29 2.5 Becslések t p Lényegében itt is ugyanazt látjuk a grafikonon, mint amit az F- eloszlásnál láthattunk, a sűrűségfüggvény természetesen nem egyezik meg az ottanival, de a szemléletes jelentés megegyezik. Amit észrevehetünk az ábrán, hogy ez a sűrűségfüggvény elég kis értékeket vesz fel a 0 közelében is, és így a küszöbértékekre picit nagyobb értékeket kaphatunk, mint amit az F-eloszlásnál láthattunk. Ezek után térjünk rá a konkrét statisztikai módszerek tárgyalására Becslések Pontbecslések A pontbecslések során a valószínűségi változó egy paraméterének becslését szeretnénk megkapni egy bizonyos értékkel. Az ilyen típusú becslésekről az előzőekben már volt szó, csak az ismétlés kedvéért röviden megemlítjük. x µ, azaz a mintaátlaggal becsültük a várható értéket, s 2 x σ 2, azaz a tapasztalati szórásnégyzettel becsültük az elméleti szórásnégyzetet, valamint ha ezt így konkrétan nem is mondtuk

30 30 2. Statisztikai módszerek ki, a tapasztalati korrelációs együtthatóval becsülhetjük az elméleti korrelációs együtthatót (r ρ). Mivel ezeket a módszereket ott részletesebben tárgyaltuk, lépjünk is tovább Intervallum becslések Az intervallum becslések során a paraméterre egy úgynevezett megbízhatósági intervallumot adunk meg, ami azt jelenti, hogy megadunk egy intervallumot, amibe adott valószínűséggel esik a keresett ismeretlen paraméter. Várható érték intervallum becslése. Adott egy (µ, σ) paraméterű normális eloszlásból származó x 1,x 2,...,x n minta, ekkor mint tudjuk x µ s x n-1 szabadságfokú t-eloszlású lesz. Ekkor a t-eloszlás táblázatát felhasználva n 1 és 1 p ismeretében keressük ki a megfelelő értéket, legyen ez t p. Láttuk, hogy ennek a jelentése nem más, mint ( ) x µ P > t p = 1 p, s x ezzel ekvivalens állításként már megkapjuk a kívánt formát, mégpedig a következőek szerint. Nézzük meg, hogy az abszolútértékes kifejezés 1 p valószínűséggel nagyobb, mint t p, ám ekkor teljesül az is, hogy p valószínűséggel kisebb, mint t p. Írjuk is fel ezt. ( ) x µ P < t p = p, itt ha kibontjuk az abszolút értéket, akkor ( P t p < x µ ) < t p = p s x s x

31 2.5 Becslések 31 alakot kapjuk, amiben minden ismert, csak a keresett µ nem. Ha átrendezzük P ( x t p s x < µ < x+t p s x ) = p, majd a valószínűséghez tartozó zárójeleken belül tovább alakítással P (x t p s x < µ < x+t p s x ) = p, amivel pontosan egy p megbízhatóságú intervallumbecslését kaptuk a várható értéknek. Példa Adottak a következők: x = 3,s x = 6,n = 9, határozzuk meg a 95%-os megbízhatósági intervallumot a várható értékre vonatkozóan. A megoldáshoz szükségünk lesz a táblázatból t p értékére, valamint még szükséges s x ismerete is, viszont ezt kiszámíthatjuk a tanult módon s x = s x n = 6 3 = 2, míg a táblázatból kikeresett t p = kapjuk. Innen az előzőek szerint < µ < , tehát a várható érték 95% valószínűséggel a[ 1.612, 7.612] intervallumba esik. Példa Nézzünk egy, a gyakorlathoz közelebb álló példát is. Tabletták hatóanyagtartalmának a vizsgálatát végezzük el, és a következő 9 értéket kapjuk mg-ban mérve 25.6, 25.3, 24.1, 25.3, 25, 24.7, 25.3, 24.4, 25.6 Adjunk 90%, majd 99%-os megbízhatósági intervallumot a várható értékre. Amegoldáshozelőször szükségünklesz x éss x értékére. Ezek akövetkezők lesznek: x =

32 32 2. Statisztikai módszerek s x = s x = = Továbbá tudjuk, hogy 9 elemű a minta, tehát a szabadsági fokunk 8 lesz. Először nézzük a 90%-os megbízhatósági intervallumot, azaz amikor p értéke 0.9 lesz. t p meghatározásához a táblázatban a 8-as értékhez tartozó sorban kell keresni, és 1 p = 0.1-hez tartozó oszlopban. Itt azt találjuk, hogy t p = 1.86, így a 90%-os megbízhatósági intervallumra < µ < adódik, azaz µ 90%-os valószínűséggel a [24.71, 25.36] intervallumba esik. Nézzük meg, mi a helyzet a 99%-os megbízhatósági intervallummal. Itt már nem részletezzük a számításokat, ebben az esetben t p = 3.355, így a megbízhatósági intervallum pedig a [24.44, 25.62] intervallum lesz. Láthatjuk, hogy ugyan szélesebb intervallumot kaptunk ebben az esetben, viszont ez az intervallum megbízhatóbb becslést ad a várható értékre vonatkozóan Statisztikai hipotézisvizsgálat Ebben az alfejezetben, mint a cím is mutatja, a hipotézisvizsgálattal fogunk foglalkozni. A vizsgálat lényege, hogy megfogalmazunk egy állítást egy valószínűségi változóval kapcsolatban, ezt fogjuk hipotézisnek nevezni, majd egy statisztikai próbával ellenőrizzük az állításunkat, és az eredmények alapján vagy elfogadjuk, vagy elvetjük a hipotézist. Nézzük meg, hogy mik a leggyakoribb hipotézisek: Létrejön-e valamilyen megváltozás (pl. gyógyszer hatására) Van-e különbség (pl. férfi és nő között) Van-e kapcsolat (pl. kor és vérnyomás között) A megfogalmazott hipotézisünket, állításunkat nullhipotézisnek nevezzük, és H 0 -lal jelöljük. Példák H 0 : M(ξ) = a

33 2.6 Statisztikai hipotézisvizsgálat 33 H 0 : M(ξ) = M(η) H 0 : D(ξ) = D(η) A hipotézisvizsgálat lépései. Először is feltesszük, hogy adott egy x 1,x 2,...,x n mintánk az adott hipotézishez. Ebből a mintából készítünk egy statisztikai változót(legyen ez st), aminek ismert az eloszlása(feltéve, hogy H 0 igaz). Ezek után megadunk egy valószínűséget, ez lesz az úgynevezett szignifikancia szint, amilyen bizonyossággal szeretnénk elvégezni a hipotézisvizsgálatot, ez legtöbbször 5%, de lehet 1%-os is, sőt ha nagyon megbízható vizsgálatra lenne szükség, akkor akár 0.1%-ot is vehetünk. Ezek után ismét a megfelelő táblázatra lesz szükségünk, ahonnan is kikeressük a megfelelő t p értéket, majd a következőt tesszük: st t p esetén elfogadjuk a nullhipotézist, st > t p esetén pedig elvetjük. Ennek kapcsán egy új fogalom kerülhet bevezetésre, mégpedig a hiba fogalma. A hipotézisvizsgálat során két különböző típusú, úgynevezett statisztikai hibáról beszélhetünk, az elsőfajú, illetve a másodfajú hibáról Definíció (Elsőfajú statisztikai hiba). Elsőfajú hibáról akkor beszélünk, ha a nullhipotézisünk ugyan igaz, viszont mi a számítások alapján mégis elvetjük. Az elsőfajú hiba valószínűsége pontosan megegyezik a szignifikancia szinttel Definíció (Másodfajú statisztikai hiba). Másodfajú hibáról pedig akkor beszélünk, ha a nullhipotézisünk nem áll fenn, viszont a számítások alapján mégis elfogadjuk. Az alapok megemlítése után térjünk rá a konkrét hipotézisvizsgálati eljárásokra, a statisztikai próbákra.

34 34 2. Statisztikai módszerek 2.7. Próbák Korrelációs t-próba A korrelációs t-próba alkalmazása során arra a kérdésre keressük a választ, hogy vajon két normális eloszlású változó független-e egymástól. Ennek eldöntésére természetesen rendelkezésünkre áll a két változóból származó x 1,x 2,...,x n és y 1,y 2,...,y n minta. A nullhipotézisünk, hogy a két változó független, azaz H 0 : ρ = 0 A próbához természetesen szükség lesz egy szignifikancia szintre, első lépésben megválasztjuk ezt. Majd kiszámítjuk az r tapasztalati korrelációs együtthatót, és ebből elkészítjük a t = n 2 r 1 r 2 statisztikát, amely n-2 szabadságfokú, t-eloszlású lesz, amennyiben H 0 igaz. Majd a már megszokott módon a t-eloszláshoz tartozó táblázatból kikeressük a megfelelő t p értéket, és megvizsgáljuk, hogy vajon t < t p feltétel teljesül-e. Amennyiben igen, akkor elfogadjuk a nullhipotézist, ellenkező esetben pedig elvetjük, az adott szignifikancia szint mellett. Ebben az esetben szokás azt is mondani, hogy szignifikáns (azaz H 0 nem igaz), illetve nem szignifikáns (H 0 igaz) a kapcsolat. Példa Adott a következő két minta: x : 0.1, 0.2, 0.3, 0.4, 0.5, 0.8, 1 y : 40, 3, 0, 18, 4, 22, 25 Vizsgáljuk meg a két változó kapcsolatát. Először számítsuk ki a korrelációs együtthatót, majd végezzük el a korrelációs t-próbát is! Első lépésben számítsuk is ki a tapasztalati korrelációs együtthatót r = Q xy Qx Q y

35 2.7 Próbák 35 alapján. Ehhez határozzuk meg Q x,q y,q xy értékeit a 22. oldalon található 2.1 és 2.2 képletek alapján. A könnyebb átláthatóság kedvéért foglaljuk táblázatba a szükséges adatokat. x i y i x i y i x 2 i Továbbá x = 3.3 7, y = 4 7, így Q x = = Q y = = Q xy = = Innen már megkaphatjuk a keresett korrelációs együttható értékét r = = módon. Ebből azt láthatjuk, hogy r 1, tehát erősnek látszik a korreláció a két változó között. Nézzük meg, hogy a korrelációs t-próba milyen eredményt szolgáltat nekünk. t = =

36 36 2. Statisztikai módszerek Most lapozzunk a t-eloszláshoz tartozó táblázatunkhoz, az 54. oldalra, és keressük ki az 5%-os szignifikancia szinthez tartozó 5 szabadsági fokkal rendelkező küszöbértéket. Azt találjuk, hogy t p = 2.571, majd nézzük meg, hogy t t p teljesül-e. Azt kapjuk, hogy nem, így elvetjük a nullhipotézisünket, tehát elvetjük, hogy független lenne a két változó, vagy a másik szóhasználatunkkal élve szignifikáns a kapcsolat a két változó között. Térjünk rá a következő próbánkra, ami nem más, mint az egymintás t-próba Egymintás t-próba Az egymintás t-próbát arra használhatjuk, hogy megállapítsuk, vajon egy bizonyos beavatkozás hatására megváltozik-e egy adott tulajdonság. Vizsgálhatjuk például egy gyógyszer hatásosságát, testhőmérséklet, vérnyomás szempontjából. Alkalmazása. Méréseinket egy n elemű, N (µ, σ) eloszlású változóból származó mintán végezzük. Adottak a beavatkozás előtti mért értékek (e i ), valamint a beavatkozás utániak (u i ), ezekből kiszámítjuk a különbséget, megváltozást (x i = u i e i ), és ezt fogjuk a mintának tekinteni. Ezek után a nullhipotézisünk állítása, hogy a várható érték 0, azaz H 0 : µ = 0, a beavatkozásnak nincs hatása, x az adott mintán csak véletlenül lett 0-tól különböző. A eljárások, számítások pedig a következőek szerint zajlanak le. Először is kiszámítjuk a t = x s x statisztikát, amely n 1 szabadságfokú t-eloszlású lesz, amennyiben H 0 igaz.

37 2.7 Próbák 37 Majd ismét a t-eloszláshoz tartozó táblázatból kikeressük a megfelelő szignifikancia szinthez tartozó t p küszöbértéket, és megvizsgáljuk, hogy teljesül-e a t t p összefüggés. Amennyiben igen, akkor H 0 nullhipotézist elfogadjuk, különben pedig elvetjük Megjegyzés. Figyeljünk, mit is jelent ebben az esetben, ha elfogadjuk a nullhipotézisünket. Ez azt jelenti, hogy 0 a várható érték, tehát várhatóan nem történik változás a gyógyszer hatására, ha elvetjük a nullhipotézist, az jelenti azt, hogy hatásos a gyógyszer. Szokás élni a szignifikáns a változás szóhasználattal is ebben az esetben. Példa Lázcsillapító hatását vizsgáljuk lázas betegeken, a táblázatban e i az i. beteg láza a gyógyszer bevétele előtt, u i az utána mért érték, x i pedig az eltérés a két érték között. e i u i x i x 2 i Amire még szükségünk lesz, az x = 7 8 = 0.875, valamint s x, amit kiszámíthatunk a szokásos módon s 2 x = segítségével módon. s x = =

38 38 2. Statisztikai módszerek Ezek után már nincs más, mint kiszámítani a t statisztikát t = = 2.862, majd keressük ki a 7 szabadsági fokhoz, és 5%-os szignifikancia szinthez tartozó küszöbértéket a t-eloszlás táblázatából. Ott azt találjuk, hogy t p = Ezek után vizsgáljuk meg, hogy t t p teljesül-e. Nem teljesül, így elvetjük a nullhipotézist, tehát szignifikáns a változás, azaz hatásos a gyógyszer F-próba Az F-próba segítségével azt tudjuk ellenőrizni, hogy két normális eloszlású változónak megegyezik-e a szórása. Azaz H 0 : σ 1 = σ 2 lesz a nullhipotézisünk ebben az esetben. Alkalmazása. Adott a két mintánk: x 1,x 2,...,x n és y 1,y 2,...,y m. Ezekből kiszámítjuk az s 2 x és s2 y varianciákat, és elkészítjük az F = s2 x s 2 y statisztikát. Fontos, hogy itt is úgy válasszuk meg a törtet, hogy nagyobb legyen, mint 1. Az így kapott statisztika n 1,m 1 szabadságfokokkal rendelkező F-eloszlású lesz. Megválasztunk egy kívánt szignifikancia szintet, legyen ez p, majd kikeressük az F-eloszlás táblázatából a megfelelő szabadsági fokok mellett, és p 2 valószínűséghez tartozó küszöbértéket, ez legyen tp 2. Amennyiben F t p, akkor elfogadjuk a nullhipotézist, különben 2 pedig elvetjük. Példa Adott a következő minta 63,65,63,63,67,65,

39 2.7 Próbák 39 továbbá tudjuk, hogy van egy másik mintánk, amely m = 10 elemű, és a varianciája s 2 y = 16. Hasonlítsuk össze a két minta szórását 5%-os szinten! Ehhez csak s 2 x értékére lesz szükségünk, ehhez használjuk fel a 2.2 fejezetben leírt trükköt, és a minta elemeiből vonjunk ki 63-at, így az új mintánk 0,2,0,0,4,2 lesz. Könnyen kiszámítható, hogy x = 4 a mintaátlag. 3 Ebből s 2 x = 1 ( ) = = 8 3, így már ki tudjuk számítani a statisztikát F = s y = 16 8 = 6. s x 3 Ezek után keressük ki az F-eloszlás táblázatából (55 62 oldal) a 9,5 szabadsági fokokhoz, és p = 2.5%-os szinthez tartozó értéket 2 t p 2 = 6.68, mivel 6 < 6.68, ezért elfogadjuk a nullhipotézist, és azt mondjuk, hogy a szórások közötti eltérés nem szignifikáns Megjegyzés. Láthatjuk, hogy a számítások során megcseréltük a két mintát, és az x került a nevezőbe, míg y a számlálóba, ennek oka, hogy a törtnek 1-nél nagyobbnak kell lennie. Természetesen a szabadsági fokokat is meg kell cserélni ilyenkor, azért is lett a példában (9,5) az (5,9) helyett Kétmintás t-próba Ezzel a próbával két csoport közötti, bizonyos tulajdonság szerinti különbözőségét lehet vizsgálni, feltéve, hogy a minták normális eloszlásúak, függetlenek, és azonos szórással rendelkeznek. Ezt a különbözőséget, vagy éppen azonosságot a várható értékek segítségével

40 40 2. Statisztikai módszerek fogjuk megállapítani, így a nullhipotézisünk is a várható értékekre vonatkozik H 0 : M(ξ) = M(η), tehát a nullhipotézisünk, hogy megegyeznek a várható értékek, nincs különbség a két csoport között az adott tulajdonság szempontjából. Alkalmazása. Mindenekelőtt adott két minta x 1,x 2,...,x n és y 1,y 2,...,y m, valamint egy kívánt szignifikancia szint, p. Ezekből kiszámítjuk az Qx +Q y s m = n+m 2 közös szórást, majd ebből a t = x y s m 1 n + 1 m statisztikát, amely n + m 2 szabadságfokú t-eloszlású lesz. Ezek utánmegkeressük a táblázatbanat p értéket, majdamegszokott módon döntünk. Amennyiben t t p, akkor elfogadjuk H 0 hipotézist, ebben az esetben azt mondhatjuk, hogy nem szignifikáns a különbség, ellenkező esetben pedig elutasítjuk, és azt mondjuk, hogy szignifikáns a különbség. Példa 8 dohányzó, és 8 nem dohányzó nő bizonyos tulajdonságát vizsgáljuk, és a következőket kapjuk n = 8 m = 8 x = y = Q x = 28 Q y = 98 s x = 2 s y = s x = s y = t-próbával döntsük el, van-e különbség a két csoport között, azaz a két elméleti várható érték eltér-e egymástól. Mindezt tegyük 5%-os szignifikancia szint mellett.

41 2.7 Próbák 41 Első lépésben számítsuk ki a metodikai hibát s m = = 9 = 3, majd ennek segítségével már egyszerűen megkaphatjuk a statisztikát t = = = 2.268, ezek után a t-eloszlás táblázatából keressük ki a megfelelő szignifikancia szinthez, és a 14 szabadsági fokhoz tartozó értéket t p = 2.145, elvégezve az összehasonlítást, azt kapjuk, hogy t > t p, így elutasítjuk a nullhipotézist, tehát azt kapjuk, hogy a két csoport között szignifikáns a különbség Variancia-analízis A variancia-analízissel arra keressük a választ, hogy vajon két változó független-e egymástól, vagy sem. Megjegyeznénk, hogy ezt már vizsgáltuk a korrelációs t-próbával is, azonban itt mások lesznek az alkalmazhatósági feltételeink, valamint mindig jól jön, ha egy dolgot nem csak egy módszerrel tudunk megvizsgálni, hanem többféle eljárásunk is van rá. Az alkalmazhatósághoz elég, hogy az egyik változónk (η) normális eloszlású legyen. A nullhipotézis formában adott. H 0 : a két változó független

42 42 2. Statisztikai módszerek Alkalmazása. Választunk egy szignifikancia szintet, legyen ez esetünkben p = 5%. Ezután kiszámítjuk a következőket Q r := Q2 xy Q x, majd ebből valamint s 2 r := Q r Q h := Q y Q r, s 2 h := Q h n 2, ahol n az első minta elemszáma. Ezen adatokból elkészítjük az F = s2 r s 2 h statisztikát, amely H 0 fennállása esetén 1,n 2 szabadságfokú F- eloszlású lesz. Megkeressük az adott szignifikancia szinthez tartozó t p értéket, és amennyiben F t p, akkor elfogadjuk a nullhipotézist, különben pedig elutasítjuk Megjegyzés. Vigyázzunk, hogy az F-próbával ellentétben itt nem -höz, hanem a p-hez tartozó értéket keressük ki a táblázatból! p Megjegyzés. Természetesen itt is élhetünk a szokásos szóhasználattal, miszerint szignifikáns a kapcsolat, illetve nem szignifikáns a kapcsolat a két változó között. Példa Adottak a következők n = 12, Q x = 5, Q y = 50, Q xy = 10, p = 0.05 a kérdés az, hogy vajon a két minta között van-e összefüggés. Vizsgáljuk meg ezt az állítást korrelációs t-próbával, és a variancia-analízis eszközeivel is!

43 2.7 Próbák 43 Először tekintsük a t-próbát, amihez szükségünk lesz a korrelációs hányados meghatározására ebből t = 10 r = Q xy 10 = Qx Q y 5, = = A táblázatból kikeresve a megfelelő értéket, azt kapjuk, hogy t p = 2.228, így elutasítjuk a két változó függetlenségét, tehát azt kaptuk, hogy szignifikáns a különbség. Nézzük, mit ad a variancia-analízis. Vegyük sorban a számításokat: Q r = Q2 xy Q x = = 20 s2 r = 20, Q h = Q y Q r = = 30 s 2 h = 3, ebből pedig F = 20 3 = lesz a statisztikánk. Ez (1, 10) szabadság fokú F-eloszlású lesz, így a táblázatból kikeresve a megfelelő értéket kapjuk, hogy t p = 4.96, mivel F > t p, így elvetjük a nullhipotézist. Tehát ebben az esetben is azt kaptuk, hogy szignifikáns a függés Megjegyzés. A két módszer lényegében ugyanazt adja, sőt lehet tudni azt is, hogy t 2 = F összefüggés fennáll, amit akár ellenőrzésre is lehet használni. Nézzük is meg ezt az összefüggést a példánkban: t 2 = = 20 3 = F,

44 44 2. Statisztikai módszerek itt valóban teljesült. De nézzük meg, általában miért igaz ez az összefüggés. Ehhez kicsit alakítgassuk a t 2 kifejezést. t 2 r 2 = (n 2) 1 r = (n 2) r 2 r 2 Q y = (n 2), 2 1 Q2 xy Q xq y Q y Q2 xy Q x itt használjuk fel, hogy r 2 Q y = Q r azt kapjuk, hogy Q r t 2 = (n 2) = (n 2) Q r = s2 r Q y Q r Q h s 2 h = F, amivel beláttuk az állításunkat χ 2 -próbák A χ 2 -próba általában nem számszerű adatokra vonatkozó próbát jelent. Nézzük is sorra a különböző használati lehetőségeit. Két csoport összehasonlítása bizonyos szempontból Ebben az esetben adott két csoport (A és B), valamint egy tulajdonság, ami alapján össze kívánjuk hasonlítani a két csoportot. Ehhez adott egy úgynevezett négymezős táblázat, a következő formában tulajdonság: + tulajdonság: - A a b a+b B c d c+d a+c b+d a+b+c+d = n ahol a, b, c, d nem mérési adatokat jelentenek, hanem darabszámokat. Ebben az esetben nagyon fontos, hogy a használhatóságnak van egy feltétele, miszerint min(a+b,c+d) min(a+c,b+d) > 5n feltételnek teljesülnie kell, egyébként sajnos nem használható a módszer. Ebben az esetben a nullhipotézisünk, hogy nincs különbség a két csoport között az adott tulajdonság szempontjából.

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Gazdasági matematika II. vizsgadolgozat megoldása A csoport Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Statisztika Elıadások letölthetık a címrıl

Statisztika Elıadások letölthetık a címrıl Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel

Részletesebben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O 1. Mit nevezünk elemi eseménynek és eseménytérnek? A kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük. Az adott kísélethez tartozó elemi események halmazát eseménytérnek nevezzük, jele: X 2.

Részletesebben

Abszolút folytonos valószín ségi változó (4. el adás)

Abszolút folytonos valószín ségi változó (4. el adás) Abszolút folytonos valószín ségi változó (4. el adás) Deníció (Abszolút folytonosság és s r ségfüggvény) Az X valószín ségi változó abszolút folytonos, ha van olyan f : R R függvény, melyre P(X t) = t

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei Alapfogalmak BIOSTATISZTIKA ÉS INFORMATIKA A valószínűségszámítás elemei Jelenség: minden, ami lényegében azonos feltételek mellett megismételhető, amivel kapcsolatban megfigyeléseket lehet végezni, lehet

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Dr. Karácsony Zsolt. Miskolci Egyetem november

Dr. Karácsony Zsolt. Miskolci Egyetem november Valószínűségszámítás és Matematikai statisztika Dr. Karácsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tanszék 2013-2014 tanév 1. félév Miskolci Egyetem 2013. november 11-18 - 25. Dr. Karácsony

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás paramétereire vonatkozó próbák Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású

Részletesebben

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Szűk elméleti összefoglaló Valószínűségi változó: egy függvény, ami az eseményteret a valós számok halmazára tudja vetíteni. A val.

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.22. Valószínűségi változó Véletlentől függő számértékeket (értékek sokasága) felvevő változókat valószínűségi változóknak nevezzük(jelölés: ξ, η, x). (pl. x =

Részletesebben

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Gazdasági matematika II. vizsgadolgozat megoldása, június 10 Gazdasági matematika II. vizsgadolgozat megoldása, 204. június 0 A dolgozatírásnál íróeszközön kívül más segédeszköz nem használható. A dolgozat időtartama: 90 perc. Ha a dolgozat első részéből szerzett

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

1. Példa. A gamma függvény és a Fubini-tétel.

1. Példa. A gamma függvény és a Fubini-tétel. . Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! A1 A2 A3 (8) A4 (12) A (40) B1 B2 B3 (15) B4 (11) B5 (14) Bónusz (100+10) Jegy NÉV (nyomtatott nagybetűvel) CSOPORT: ALÁÍRÁS: ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! 2011. december 29. Általános tudnivalók:

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ Megoldások Harmadik fejezet gyakorlatai 3.. gyakorlat megoldása ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4;, 3 normális eloszlású P (ξ 8 ξ 5 feltételes valószínűségét (.3. alapján számoljuk.

Részletesebben

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás SZDT-01 p. 1/23 Biometria az orvosi gyakorlatban Számítógépes döntéstámogatás Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Gyakorlat SZDT-01 p.

Részletesebben

6. Függvények. 1. Az alábbi függvények közül melyik szigorúan monoton növekvő a 0;1 intervallumban?

6. Függvények. 1. Az alábbi függvények közül melyik szigorúan monoton növekvő a 0;1 intervallumban? 6. Függvények I. Nulladik ZH-ban láttuk: 1. Az alábbi függvények közül melyik szigorúan monoton növekvő a 0;1 intervallumban? f x g x cos x h x x ( ) sin x (A) Az f és a h. (B) Mindhárom. (C) Csak az f.

Részletesebben

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség.

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. 1. tétel Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. A valószínűségszámítás tárgya: véletlen tömegjelenségek vizsgálata. véletlen: a kísérlet kimenetelét

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József Matematika III. 9. : Statisztikai hipotézisek Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Egyenletek, egyenlőtlenségek VII.

Egyenletek, egyenlőtlenségek VII. Egyenletek, egyenlőtlenségek VII. Magasabbfokú egyenletek: A 3, vagy annál nagyobb fokú egyenleteket magasabb fokú egyenleteknek nevezzük. Megjegyzés: Egy n - ed fokú egyenletnek legfeljebb n darab valós

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Gyakorló feladatok I.

Gyakorló feladatok I. Gyakorló feladatok I. a Matematika Aa Vektorüggvények tárgyhoz (D D5 kurzusok) Összeállította: Szili László Ajánlott irodalmak:. G.B. Thomas, M.D. Weir, J. Hass, F.R. Giordano: Thomas-féle KALKULUS I.,

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

Eloszlás-független módszerek 13. elıadás ( lecke)

Eloszlás-független módszerek 13. elıadás ( lecke) Eloszlás-független módszerek 13. elıadás (25-26. lecke) Rangszámokon alapuló korrelációs együttható A t-próbák és a VA eloszlásmentes megfelelıi 25. lecke A Spearman-féle rangkorrelációs együttható A Kendall-féle

Részletesebben

Gazdasági matematika II. vizsgadolgozat, megoldással,

Gazdasági matematika II. vizsgadolgozat, megoldással, Gazdasági matematika II. vizsgadolgozat, megoldással, levelező képzés Definiálja az alábbi fogalmakat! 1. Kvadratikus mátrix invertálhatósága és inverze. (4 pont) Egy A kvadratikus mátrixot invertálhatónak

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk Valószínűségszámítás 8. feladatsor 2015. november 26. 1. Bizonyítsuk be, hogy az alábbi folyamatok mindegyike martingál. a S n, Sn 2 n, Y n = t n 1+ 1 t 2 Sn, t Fn = σ S 1,..., S n, 0 < t < 1 rögzített,

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben 1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások Megoldások 1. Oldd meg a következő egyenleteket! (Alaphalmaz: Z) a) (x 1) (x + 1) 7x + 1 = x (4 + x) + 2 b) 1 2 [5 (x 1) (1 + 2x) 2 4x] = (7 x) x c) 2 (x + 5) (x 2) 2 + (x + 1) 2 = 6 (2x + 1) d) 6 (x 8)

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy Valószínűségszámítás. zárthelyi dolgozat 009. október 5.. Egy osztályba 3-an járnak. Minden fizikaórán a a többi órától függetlenül a tanár kisorsol egy felelőt, véletlenszerűen, egyenletesen, azaz mindig

Részletesebben

Függvények Megoldások

Függvények Megoldások Függvények Megoldások ) Az ábrán egy ; intervallumon értelmezett függvény grafikonja látható. Válassza ki a felsoroltakból a függvény hozzárendelési szabályát! a) x x b) x x + c) x ( x + ) b) Az x függvény

Részletesebben

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János BUDAPESTI MŐSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM KÖZLEKEDÉSMÉRNÖKI KAR JÁRMŐELEMEK ÉS HAJTÁSOK TANSZÉK Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János Budapest 2008

Részletesebben

Számelmélet Megoldások

Számelmélet Megoldások Számelmélet Megoldások 1) Egy számtani sorozat második tagja 17, harmadik tagja 1. a) Mekkora az első 150 tag összege? (5 pont) Kiszámoltuk ebben a sorozatban az első 111 tag összegét: 5 863. b) Igaz-e,

Részletesebben

Gazdasági matematika II. tanmenet

Gazdasági matematika II. tanmenet Gazdasági matematika II. tanmenet Mádi-Nagy Gergely A hivatkozásokban az alábbi tankönyvekre utalunk: T: Tóth Irén (szerk.): Operációkutatás I., Nemzeti Tankönyvkiadó 1987. Cs: Csernyák László (szerk.):

Részletesebben