Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Hasonló dokumentumok
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

6. Előadás. Vereb György, DE OEC BSI, október 12.

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Biomatematika 2 Orvosi biometria

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Valószínűségszámítás összefoglaló

[Biomatematika 2] Orvosi biometria

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Abszolút folytonos valószín ségi változó (4. el adás)

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

A valószínűségszámítás elemei

Készítette: Fegyverneki Sándor

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Matematikai alapok és valószínőségszámítás. Normál eloszlás

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Gazdasági matematika II. tanmenet

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Valószínűségi változók. Várható érték és szórás

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak

1. Példa. A gamma függvény és a Fubini-tétel.

Bevezetés a hipotézisvizsgálatokba

A Statisztika alapjai

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

A mérési eredmény megadása

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

A leíró statisztikák

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

y ij = µ + α i + e ij

III. Képességvizsgálatok

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Folyadékszcintillációs spektroszkópia jegyz könyv

Nemparaméteres próbák

Többváltozós lineáris regressziós modell feltételeinek

A valószínűségszámítás elemei

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Normális eloszlás paramétereire vonatkozó próbák

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Biostatisztika Összefoglalás

Valószín ségszámítás és statisztika

Biostatisztika VIII. Mátyus László. 19 October

Kettőnél több csoport vizsgálata. Makara B. Gábor

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Adatok statisztikai értékelésének főbb lehetőségei

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 8. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika elméleti összefoglaló

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Több valószínűségi változó együttes eloszlása, korreláció

KÖVETKEZTETŐ STATISZTIKA

Hipotézis vizsgálatok

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

[Biomatematika 2] Orvosi biometria

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Számítógépes döntéstámogatás. Statisztikai elemzés

(Independence, dependence, random variables)

1. Gauss-eloszlás, természetes szórás

A pont példájának adatai C1 C2 C3 C

Átírás:

Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Véletlen hiba: gyelembe nem vett, egyenként kis hatású változók ingadozásainak összessége, a hiba átlagértéke a mérési szám növelésével nullához tart. Sokaság és minta: pl. sörösüvegek milliói... De ez véges sokaság - végtelen sokaság pl. egy tömegmérés eredménye. Mérés: a sokaság egy elemének kiválasztása, véges számmal ismételve az lesz a minta, a mérés mintavétel. Valószín ségi változó: értéke nem állandó, bizonyos valószín séggel esik adott határok közé. (lehet diszkrét - folytonos) Relatív gyakoriság és valószín ség Vett minta sokaság eloszlása. végtelen sokaság: relatív gyakoriság megfelel je a valószín ség (relatív gyakoriság: el fordulások száma osztva az összes érték el fordulásának számával) végtelen sok mérésnél a minta azonos a sokasággal. Ekkor a relatív gyakoriság = valószín ség. A valószín ség a relatív gyakoriság határértéke minta esetén. Folytonos valószín ségi változó s r ség- és eloszlásfüggvénye Osztályba sorolás: x az ossztály szélessége, x i az osztály közepe, az osztályindex Téglalapok területe intervallumba es elemek számával n i Területek összege minta elemszámával (N) 1. ábra. A gyakorisági hisztogram 1

Relatív gyakorisági hisztogram: a téglalapok területe osztva az összterülettel n i N A terület összege 1! Els esetben a magasság n i x, második esetben n i (N x). Ha N (növeljük a minta elemszámát), és az osztályok szélességét csökkentjük ( x 0) a valószín ség s r ségfüggvényt kapjuk meg: 2. ábra. Valószín ség s r ségfüggvény Értelmezése: rel. gyak. lim = f(x) (1) N, x 0 x P (x 0 < x < x 0 + x) = x0 + x x 0 f(x)dx f(x 0 ) x (2) Kumulatív relatív gyakoriság: a valószín ségi változó x i vagy annál kisebb értéket vesz fel. 3. ábra. kum. rel. gyak. lim = F (x) (3) N x 2

F(x) az eloszlásfüggvény! F (x i ) = xi f(x)dx (4) Értelmezése: F (x i ) = P (x x i ) (5) F ( ) = + F(x), f(x) ismerete a sokaság ismeretét jelenti! f(x)dx = 1 (6) A várható érték (E(x) is használatos) M[x = + xf(x)dx = µ (7) A sokaság várható értéke megegyezik a valódi értékkel - ha nincs rendszeres hiba. M[φ(x) = + φ(x)f(x)dx (8) M[c x = c M[x; M[c = c (9) M[x 1 + x 2 +... + x k = M[x 1 + M[x 2 +... + M[x k (10) Minél inkább igaz, hogy a relatív gyakoriság egyenl a valószín séggel, annál jobban megközelíti x a várható értéket. x = 1 N N x i (11) A medián: az az érték, amelynél nagyobbat a valószín ségi változó ugyanolyan valószín séggel vesz fel, mint kisebbet: i=1 F (µ e ) = 1 2 (12) Tapasztalati medián: sorba rendezve a középs érték, páratlan elemszám esetében a két középs átlaga! Tekintsük példának okáért a következ számsorozatot, amelyek akár mérési sorozatot is reprezentálhatnak: 51, 49, 50, 52, 48, 51, 250, 49, 52, ahol a hetedik érték szemmel láthatólag er sen kilóg a többi pont közül, amelyet nyugodtan tekinthetünk mérési hibának is. A különböz módon képzett középértékek a következ eredményeket adják: 3

aritmetikai: A = 1 n n a i = 72, 44 i=1 geometriai: G = n n a i = 60, 03 i=1 harmonikus: H = n n i=1 1 a i = 55, 10 négyzetes: Q = n i=1 a2 i n = 95, 86 A median eljárás a valódi értékhez közelebb es 51-et fogja szolgáltatni. A módusz: a valószín ségi változók legnagyobb valószín ség értéke, a s r ségfüggvény maximumhelye (lehet több is, de ez ritka). A tapasztalati módusz a legnagyobb gyakorisági osztály osztályindexe. Egycsúcsos, szimmetrikus eloszlás esetén a módusz és a medián egybeesik a várható értékkel, egyébként nem feltétlenül. 4. ábra. 4

A variancia (szórásnégyzet) V ar[x = + (x M[x) 2 f(x)dx = Azaz a várható értékt l való eltérés négyzetének várható értéke. Jelölés még D 2 [x és σ 2 x. Számítástechnikailag jobb kifejezés! + (x µ) 2 f(x)dx = M[(x µ) 2 (13) V ar[x = M[x 2 µ 2 ; µ = M[x (14) V ar[c x = c 2 V ar[x (15) A szórásnégyzet: V ar[x 1 + x 2 +... + x k = V ar[x 1 + V ar[k 2 +... + V ar[x k (16) s 2 x = 1 N N (x i x) 2 (17) i=1 DOF (degrees of freedom): ha tudom a pontos értéket N, ha a méréseinkb l származik inkább N-1! Normális (Gauss) eloszlás: sok, egymástól független, egyenként kis hatású tényez hatása adódik össze. S r ség- és eloszlásfüggvénye: F (x) = f(x) = 1 [ σ 2π exp (x µ)2 2σ 2 + 1 σ 2π exp [ (ξ µ)2 2σ 2 (18) dξ (19) 5. ábra. Várható értéke és varianciája: M[x = µ; V ar[x = σ 2 (20) Szokásos jelölés még: N(µ, σ 2 ); pl. N(0, 1) (21) 5

Ha F(x) értékeit táblázatban akarjuk megadni, 3D-s kellene, mivel F(x) µ és σ 2 értékeit is tartalmazza! Transzformáció kellene! A normalizált (standardizált) normális eloszlás (u-eloszlás) Legyen u egy valószín ségi változó: Ekkor A s r ségfüggvény u = x µ σ (22) [ x µ M[u = M = M[x µ = 0 σ σ (23) [ x µ V ar[u = V ar = 1 V ar[x = 1 σ σ2 (24) P (x a) = F (a) = f(u) = 1 2π exp a 1 σ 2π exp ) ( u2 (25) 2 [ 1 [ x µ 2 dx (26) 2 σ Ez a vonalkázott terület a 6. ábrán! u deníciójából és mivel dx = σdu ua 1 P (x a) = exp [ u2 du = F (u a ) (27) 2π 2 ahol u a = a µ σ Tehát annak a valószín sége, hogy x a egyenl u u a = (a µ)/σ. Lásd 6. ábra b., része! (28) 6

6. ábra. 1., példa Mi annak a valószín sége, hogy x normális eloszlású valószín ségi változó ebbe az intervallumba esik: (µ σ, µ + σ)? Ezt a 7. ábra szemlélteti. Ekkor igaz, hogy P (µ σ < x µ + σ) = F (µ + σ) F (µ σ) (29) és u felso = µ + σ µ σ = 1 (30) u also = µ σ µ σ = 1 (31) A táblázatból látjuk, hogy F(1)=0,84134. Mivel f(x) szimmetrikus függvény F ( ) = 1 és F ( a) = 1 F (a). Így F ( 1) = 1 F (1) = 0, 15866, ezzel Vagyis a valószín ség 68%. Hasonló számítással adódik: P (µ σ < x µ + σ) = 0, 68268 (32) 7

7. ábra. Intervallum ±σ ±2σ ±3σ P 0,68268 0,9545 0,9973 1. táblázat. 8

2., példa Egy x jel, N(µ, σ 2 ) normális eloszlású valószín ségi változó értékei milyen szimmetrikus intervallumban vannak 95%-os, illetve 99%-os valószín séggel? u alsó és fels értékének segítségével! Tudjuk, hogy α jelenti, hogy ezen kívül van, azaz jobb- és baloldalt α/2 ennek a valószín sége, lásd 8. ábra! 8. ábra. 9

A táblázatból látjuk: α 0,05 0,01 1 α 0,95 0,99 1 α/2 0,975 0,995 u 1,96 2,58 2. táblázat. Visszatérve az eredeti x változóra: x also = µ σ u α/2 ; x felso = µ + σ u α/2 (33) α 0,05 0,01 x also µ 1, 96σ µ 2, 58σ x felso µ + 1, 96σ µ + 2, 58σ 3. táblázat. 3., példa Analitikai mérlegen tömegmérés esete. Tudjuk, a tömeg µ = 5, 00000 g, a variancia négyzetgyöke σ = 10 4 g és a mérés normális eloszlású. a., Egy mérés eredménye 99%-os biztonsággal (valószín séggel) milyen szimmetrikus intervallumba esik? P [ u α/2 < u u α/2 = 1 α = 0, 99 (34) u = x µ σ = x 5, 00000 10 4 (35) P [ µ u α/2 σ < x µ + u α/2 σ = 0, 99 (36) A táblázatból látjuk, hogy α = 0, 01-hez u α/2 = 2, 58 tartozik, ezzel P (5, 00000 2, 58 10 4 < x 5, 00000 + 2, 58 10 4 ) = 0, 99 (37) A mérés eredménye 99%-os valószín séggel a (4,99974; 5,00026) tartományba esik, a 4. már bizonytalan! jegy b., Több mérési eredmény átlagának hibája mekkora intervallumba esik 99%-os biztonsággal? Itt P [ u α/2 < u u α/2 = 1 α = 0, 99 (38) u = x µ σ/ n (39) 10

a hiba pedig (x µ). P [ u α/2 σ/ n < x µ u α/2 σ/ n = 0, 99 (40) P [ 2, 58 10 4 / n < x µ 2, 58 10 4 / n = 0, 99 (41) n hibaintervallum fele csökkenés mértéke 2 1, 82 10 4 0,707 3 1, 49 10 4 0,578 4 1, 29 10 4 0,500 5 1, 15 10 4 0,446 6 1, 05 10 4 0,408 7 0, 97 10 4 0,378 4. táblázat. Látható, hogy 4 méréssel a hiba a felére, 7 méréssel majdnem a harmadára csökkenthet! c., Hány mérés után csökken a középérték hibája 95%-os biztonsággal ±10 4 alá? P [ u α/2 < u u α/2 = 1 α (42) u = x µ σ/ n (43) P [ u α/2 σ/ n < x µ u α/2 σ/ n = 1 α (44) Tehát a követelmény: x µ < 10 4, azaz u σ/ n < 10 4. Mivel σ = 10 4 ; u α/2 n < 1; n > [ u α/2 2 (45) A táblázatból u α/2 = 1, 96, ezért n > 1, 96 2 = 3, 86 vagyis n=4 elég. Centrális határeloszlási tétel: bármilyen eloszlású sokaságból vett minták számtani középértékei - elég nagy minta esetén (min. 30-50) - közelít leg normális eloszlást követnek az eredeti eloszlás várható értéke körül. Ezért van sok normális eloszlású változó! A χ 2 eloszlás: Vegyünk egy N(µ, σ 2 ) normális eloszlású sokaságból ν elem mintát: x 1, x 2,..., x i, x ν. Ezekb l u i = x i µ σ normalizált normális eloszlású [N(0,1) valószín ségi változók képezhet k. A χ 2 eloszlású valószín ségi változót így kapjuk: (46) χ 2 = u 2 1 + u 2 2 +... + u 2 i +... + u 2 ν = ν u 2 i (47) i=1 11

A négyzetösszeg szabadságifok-számán a lineáris rendszer szabadságifok-számát értjük. A lineáris rendszer szabadsági fokát megkapjuk, ha a változók számából levonjuk a köztük lév lineáris összefüggések számát. Mivel itt a tagok egymástól függetlenek, az összeadandók száma (ν) megegyezik a szabadsági fokok számával. Az eloszlás s r ségfüggvénye csak a ν paramétert tartalmazza: f ν (χ 2 ) Várható értéke és varianciája: A t-eloszlás (Student-eloszlás) 9. ábra. M[χ 2 = ν; V ar[χ 2 = 2ν (48) u és χ 2 egymástól független valószín ségi változó. Az els N(0,1) eloszlású, a második χ 2 eloszlású ν szabadsági fokkal. Legyen t egy új valószín ségi változó: t = u χ 2 ν Ehhez az úgynevezett Student-eloszlás tartozik. Ennek egyetlen paramétere ν, a szabadsági fok. Ha ν a t-eloszlás tart a normális eloszláshoz. A gyakorlatban ν > 30 esetben ez igaz... A középértékre vonatkozó (49) t = x µ s/ n is t-eloszlású n-1 szabadsági fokkal, ahol s a szórás. A t-eloszlás szimmetrikus: F [ t α/2 = 1 F [ t1 α/2 (50) (51) Nem túl elegáns jelöléssel: t 1 α/2 helyett t α/2 12

10. ábra. 11. ábra. 13