Szakdolgozat. Miskolci Egyetem. Matematikai statisztikai feladatok szemléltetése MATLAB programcsomag segítségével

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Szakdolgozat. Miskolci Egyetem. Matematikai statisztikai feladatok szemléltetése MATLAB programcsomag segítségével"

Átírás

1 Szakdolgozat Miskolci Egyetem Matematikai statisztikai feladatok szemléltetése MATLAB programcsomag segítségével Készítette: Papp Andrea 5. évfolyam, programtervező informatikus Témavezető: Dr. Karácsony Zsolt egyetemi docens Miskolc, 2015.

2 Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Matematikai Tanszék Szám: Szakdolgozat Feladat Papp Andrea (AO4CO0) programtervező informatikus jelölt részére. A szakdolgozat tárgyköre: Matematikai statisztika A szakdolgozat címe: Matematikai statisztikai feladatok szemléltetése MATLAB programcsomag segítségével. A feladat részletezése: A matematikai statisztika fontos tételeinek pontos kimondása. A MATLAB programcsomag, ezen belül a Statistics Toolbox és a grafikus felhasználói interfész (GUI) részletes bemutatása. A statisztika jelentősége napjainkban, alkalmazási területei. Normális eloszlások ábrázolása a MATLAB programcsomagban. χ 2 eloszlás szemléltetése a MATLAB programcsomagban. Quantiles-Quantiles plot bemutatása, szemléltetése. A függvények ábrázolásának haszna, felhasználási módja később az egyetemi oktatásban. Témavezető: Dr. Karácsony Zsolt, egyetemi docens A feladat kiadásának ideje: október szakfelelős 2

3 Eredetiségi Nyilatkozat Alulírott Papp Andrea; Neptun-kód: AO4CO0 a Miskolci Egyetem Gépészmérnöki és Informatikai Karának végzős programtervező informatikus szakos hallgatója ezennel büntetőjogi és fegyelmi felelősségem tudatában nyilatkozom és aláírásommal igazolom, hogy Matematikai statisztikai feladatok szemléltetése MATLAB programcsomag segítségével című szakdolgozatom saját, önálló munkám; az abban hivatkozott szakirodalom felhasználása a forráskezelés szabályai szerint történt. Tudomásul veszem, hogy szakdolgozat esetén plágiumnak számít: szószerinti idézet közlése idézőjel és hivatkozás megjelölése nélkül; tartalmi idézet hivatkozás megjelölése nélkül; más publikált gondolatainak saját gondolatként való feltüntetése. Alulírott kijelentem, hogy a plágium fogalmát megismertem, és tudomásul veszem, hogy plágium esetén szakdolgozatom visszautasításra kerül. Miskolc, év hó nap Hallgató 3

4 1. A szakdolgozat feladat módosítása szükséges (módosítás külön lapon) nem szükséges dátum témavezető(k) 2. A feladat kidolgozását ellenőriztem: témavezető (dátum, aláírás): konzulens (dátum, aláírás): A szakdolgozat beadható: dátum témavezető(k) 4. A szakdolgozat szövegoldalt program protokollt (listát, felhasználói leírást) elektronikus adathordozót (részletezve) egyéb mellékletet (részletezve) tartalmaz dátum témavezető(k) 5. bocsátható A szakdolgozat bírálatra nem bocsátható A bíráló neve: dátum szakfelelős 6. A szakdolgozat osztályzata a témavezető javaslata: a bíráló javaslata: a szakdolgozat végleges eredménye: Miskolc, a Záróvizsga Bizottság Elnöke 4

5 Tartalomjegyzék 1. Bevezetés 7 2. Elméleti háttér Rövid történeti bevezetés a matematikai statisztikába Valószínűség eloszlások Nevezetes diszkrét és abszolút folytonos eloszlások Hisztogramok A lineáris interpoláció Khí-négyzet próba Quantile-Quantile plot P-P plot A MATLAB programcsomag bemutatása A MATLAB történeti áttekintése Grafikus felhasználói interfész bemutatása A MATLAB Statistics Toolbox bemutatása Eloszlásfüggvények a MATLAB-ban Khí-négyzet (χ 2 ) eloszlás a MATLAB programcsomagban Hisztogramok kirajzolása a MATLAB programcsomagban Fejlesztői dokumentáció Rendszerkövetelmények feladat - Normális eloszlások Khí-négyzet (χ 2 ) eloszlás Quantiles-Quantiles plot Összefoglalás 40 Irodalomjegyzék 41 Adathordozó használati útmutató 42 5

6 Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani a számomra legfontosabb személyeknek, amiért segítették szakdolgozatom elkészítését és végig mellettem álltak. Köszönet Dr. Karácsony Zsoltnak, amiért támogatásával, tanácsaival és odafigyelésével egyre jobbá és jobbá tehettem a szakdolgozatomat. Köszönet a szüleimnek, testvéreimnek és közeli rokonaimnak, amiért hittek bennem és bíztattak szakdolgozatom elkészítése alatt. Külön köszönet a barátaimnak, lakótársaimnak és hozzám közel állóknak, ugyancsak a belém vetett hitükért, a sok biztató szóért és amiért tolerálták a szakdolgozatomra szánt időm és energiám. 6

7 1. fejezet Bevezetés Szakdolgozatom célja egy olyan program létrehozása volt a MATLAB nevű programcsomagban, amely bemutatja a matematikai statisztika alapvető függvényeit, eljárásait a felhasználóknak. A statisztikát tanuló hallgatóság sokkal könnyebben megérti a megtanulandó elméleti anyagokat, ha a gyakorlati ábrákat hozzá tudja kapcsolni. Programtervező informatikus hallgatóként elegendő kihívást éreztem egy ilyen jellegű téma megválasztásában. Szakdolgozatom több részből áll, de a legnagyobb hangsúlyt a legismertebb eloszlásfüggvényekre fektettem. A MATLAB programcsomagban egy könnyen átlátható grafikus felhasználói felületet hoztam létre, ahol a felhasználó megtekintheti az egyes eloszlások eloszlásfüggvényének kirajzolását, azok normalitásának vizsgálatát. Kiemelten foglalkoztam a normális eloszlásfüggvénnyel. Ennek paraméterezése, kirajzoltatása fontos lehet diáktársaim számára. Szerettem volna megfoghatóvá tenni a szórás és várható érték fogalmát, hogy az utánam következő generáció tudjon mibe kapaszkodni és láthassa azt, amit tanul. Szakdolgozatom második témaköre a χ 2 sűrűségfüggvényének vizsgálata. Szimuláció segítségével szemléltetem, hogy a normális eloszlásfüggvény négyzeteinek összege tart a χ 2 eloszláshoz. Ez az összehasonlítás szintén nagyon fontos lehet diáktársaimnak, hiszen így nem csak a definíciót kell memorizálni és elfogadni, hanem valóban szemmel látható a közelítés a két függvény között. Végül, a Q-Q plotra fektettem nagy hangsúlyt, ami egy fontos eljárás volt a statisztikai tanulmányaim során, azonban nehezen sikerült elsajátítanom ennek célját és lényegét az órákon. A programban, amit készítettem, paraméterezés segítségével összehasonlítható két-két eloszlásfüggvény. Az elfogadás vagy elvetés megállapítása igaz, hogy szabad szemmel történik, de jól kivehető az eloszlások megegyezése vagy különbözősége. A program, amelyet létrehoztam, remélhetőleg nagy segítséget fog majd nyújtani egyetemünkön a matematikai statisztikát oktató tanáraink számára. Az előadásokon elhangzott elméleti anyagok így majd könnyebben átláthatóbbak lesznek a hallgatóság számára. A kutató munka a Miskolci Egyetem stratégiai kutatási területén működő Mechatronikai és Logisztikai Kiválósági Központ keretében valósult meg. 7

8 2. fejezet Elméleti háttér 2.1. Rövid történeti bevezetés a matematikai statisztikába Eredetileg ma már ritka, elavultnak számító értelmezés szerint a statisztika matematikai eszközöket igénybe vevő államháztartástant jelentett, vagyis azon módszerek gyűjteményét és elméletét, amelyek segítségével az újkorban kialakuló modern államok számon tarthatták erőforrásaikat és a társadalmi problémákat (népesség, termelés, betegségek stb.). Erre utal a szó etimológiája is, minthogy a szót az újlatin statisticum collegium ("államtanács") és az olasz statista ("államférfi", politikus) kifejezésekből származtatják. A statisztika atyja, Gottfried Achenwall is ilyen értelemben használta e szót munkáiban ("az állam tudománya"), először 1749-ben. A szó mai értelmét ("az adatgyűjtés és adatfeldolgozás általános tudománya") csak a tizenkilencedik század elején nyerte el. [8] Az évek során gyors fejlődésnek indultak a matematikai ismeretek, legfőkébb a valószínűségszámítás, illetve kialakultak különböző adatszerzési és mintavételi technikák is. Ez előbbi eredménye a következtető statisztika, utóbbié pedig a mai szintű leíró statisztika. "A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen fogalmazhatjuk meg: "Következtetés tapasztalati adatokból események ismeretlen valószínűségeire vagy valószínűségi változók ismeretlen eloszlásfüggvényeire és ezek paramétereire." (Vincze, 1975) Továbbá a matematikai statisztika feladata olyan módszerek kidolgozása, amelyek segítségével tapasztalati adatokból a keresett elméleti értékekre a lehető legtöbb információt nyerhetjük. De feladata maguknak a kísérleteknek a tervezése és számuk optimalizálása is." [4] 2.2. Valószínűség eloszlások A matematikai statisztika szemléletmódja szerint a megfigyelendő mennyiség valószínűségi változó. Jelöljük ezt a valószínűségi változót ξ-vel. Figyeljük meg ξ-t n-szer, egymástól függetlenül. Jelölje ξ 1, ξ 2,..., ξ n a megfigyelési eredményeket. Ezeket a megfigyelési eredményeket nevezzük mintának. Azonban ξ 1, ξ 2,..., ξ n -t sem egy szám n- esnek tekintjük, hanem olyan objektumnak, amely magába sűríti a megfigyelések eredményeként adódó összes lehetséges szám n-est. Így az ξ 1, ξ 2,..., ξ n mennyiségeket is 8

9 valószínűségi változóknak tekintjük. [2] A ξ valószínűségi változó eloszlásfüggvénye F (x) = P (ξ x), ahol P a valószínűséget jelöli. Elevenítsünk fel pár fontos megnevezést a matematikai statisztikából: 1. Egy F : R R függvény akkor és csak akkor eloszlásfüggvénye valamely valószínűségi változónak, ha - monoton nemcsökkenő; - balról folytonos; - lim x F (x) = 1, lim x F (x) = A ξ-t diszkrétnek nevezzük, ha csak megszámlálható sok értéket vehet fel. Ekkor eloszlásfüggvénye F (x) = P (ξ = x i ) i:x i x alakú. 3. Az ξ-t abszolút folytonosnak nevezzük, ha eloszlásfüggvénye előáll F (x) = x f(t)dt alakban. Ekkor f-et nevezzük sűrűségfüggvénynek. A tételek és definíciók Fazekas István jegyzetéből származnak, bővebben itt olvashatunk róluk: [2]. 9

10 Nevezetes diszkrét és abszolút folytonos eloszlások Binomiális eloszlás A legismertebb és legfontosabb diszkrét eloszlás a binomiális eloszlás. Fontos szerepe van a statisztikában, ugyanis már középiskolás korunkban is találkozhattunk vele, például egy ilyen feladat formájában: Egy kalapban M piros és N M fehér golyó van (M < N). Visszatevéssel kihúzunk n darab golyót. Tehát: Ismételgessünk egy kísérletet n-szer azonos körülmények között, egymástól ( függetlenül. Jelölje ξ egy p valószínűségű A esemény bekövetkezéseinek számát. p = M ) Ekkor ξ eloszlása binomiális: N p k = P (ξ = k) = ( ) n p k (1 p) n k, k = 0, 1,..., n. k [3] [lásd: 13.,14. oldal] A binomiális eloszlásfüggvényt a MATLAB programcsomagban a binocdf(x,n,p) parancskóddal tudjuk generálni, inverzét pedig a binoinv(s,n,p) utasítással ábra. Binomiális eloszlás 100 elemű mintára, 0.5 valószínűséggel. 10

11 A diszkrét eloszlásfüggvényekről a továbbiakban nem foglalkozom elméleti szinten, mivel a szakdolgozat programjában sem szerepel. Fontosabb szerepet kapnak a folytonos eloszlások. Normális eloszlás A legfontosabb folytonos eloszlás a statisztikában. A minta leggyakrabban (közelítőleg) normális eloszlású. A statisztikai eljárások is sokszor (aszimptotikusan) normális eloszlású mennyiségeket eredményeznek, vagy normális eloszlásból származókat. Legyen µ R, σ > 0. Az η normális eloszlású, ha a sűrűségfüggvénye: f(x) = 1 ) ( σ 2π exp (x µ)2, < x <. 2σ 2 Azt, hogy az η valószínűségi változó normális eloszlást követ, a következő módon szoktuk jelölni: η N(µ, σ 2 ). Ha µ=0 (várható érték) és σ=1 (szórás) akkor a valószínűségi változót standard normális eloszlásúnak nevezzük. Jelölje a sűrűségfüggvényét ϕ és az eloszlásfüggvényét Φ. Ha ξ standard normális eloszlású, akkor az η = σξ + m valószínűségi változó F eloszlásfüggényére jellemző, hogy ( ) x µ F (x) = Φ. σ Ez alapján minden normális eloszlású valószínűségi változó lineáris függvényként kapható a standard normálisból. A normális eloszlású valószínűségi változók néhány fontosabb tulajdonsága: 1. Ha η N(µ, σ 2 ), akkor bármilyen nullától különböző valós a és bármilyen valós b szám esetén a ξ = a η + b valószínűségi változó is normális eloszlást követ, pontosabban ξ N(a µ + b, a 2 σ 2 ). Az eloszlás ezen tulajdonságán alapul a standardizálás módszere: ha η N(µ, σ 2 ), akkor η µ N(0, 1). σ 2. Normális eloszlású független valószínűségi változók összege is normális eloszlású. Pontosabban ha η 1 N(µ 1, σ 2 1) és η 2 N(µ 2, σ 2 2) független valószínűségi változók, akkor η 1 + η 2 N(µ 1 + µ 2, σ σ 2 2). [1] [lásd: 17. oldal] 11

12 2.2. ábra. Normális eloszlások sűrűségfüggvénye. A türkiz színű függvény várható értéke -2, szórása 0.5. A többi görbe várható értéke 0, szórásuk pedig 5 (kék), 1 (zöld) és 0.2 (piros). A zöld színnel jelölt függvény a standard normális eloszlás, aminek várható értéke 0, szórása pedig 1. A standard normális 1 eloszlás maximuma -nél van. A normális eloszlás sűrűségfüggvénye folytonos és 2π szimmetrikus. 12

13 Egyenletes eloszlás Ha egy véges intervallumra úgy dobunk egy pontot, hogy az intervallum bármely részintervallumára annak hosszával arányos valószínűséggel essen, akkor a pont x- koordinátája egyenletes eloszlású. A ξ valószínűségi változót az [a, b] intervallumon egyenletes eloszlásúnak nevezzük, ha eloszlásfüggvénye 0, ha x a, x a F (x) =, ha a < x b, b a 1 ha b < x. [3] [lásd: 10.oldal] 2.3. ábra. Az egyenletes eloszlás eloszlásfüggvénye, ha a=1 és b=4. Az egyenletes eloszlás sűrűségfüggvénye egyébként f(x) = 0. f(x) = 1, ha a x b, b a 2.4. ábra. Az egyenletes eloszlás sűrűségfüggvénye, ha a=1 és b=4. 13

14 Exponenciális eloszlás A ξ valószínűségi változót λ paraméterű exponenciális eloszlásúnak nevezzük, ha eloszlásfüggvénye: F (x) = { 0, ha x 0, 1 e λx, ha x > 0. ahol λ > 0 rögzített ábra. Az exponenciális eloszlás eloszlásfüggvénye. Az exponenciális eloszlás élettartamok és várakozási idők eloszlásaként lép fel. Az exponenciális eloszlás és a vele kapcsolatos más eloszlások a sorbanállás-elméletben és a megbízhatóság-elméletben használatosak. [3] [lásd: 10. oldal] Az exponenciális eloszlás sűrűségfüggvénye: f(x) = { 0, x 0, λe λx, x > ábra. Az exponenciális eloszlás sűrűségfüggvénye λ = 1 esetén. 14

15 2.7. ábra. Az exponenciális eloszlás sűrűségfüggvénye λ = 3 esetén. Khí-négyzet (χ 2 ) eloszlás A khí-négyzet eloszlást többek között a statisztikák ellenőrzésére használják, az elméleti és a megfigyelt értékek kiértékelésénél, összehasonlításánál. Ha ξ 1, ξ 2,..., ξ k független, normális eloszlású valószínűségi változók, akkor a négyzeteik összege k χ 2 = a khí-négyzet eloszlást követi, k szabadságfokkal. [9] [lásd: 24., 26. oldal] Itt bemutatnám a Gamma-eloszlást (Γ) is, hiszen a χ 2 -eloszlás a Γ-eloszlás egy speciális esete. A ξ valószínűségi változó p-edrendű λ paraméterű Γ-eloszlást követ, ha sűrűségfüggvénye 0, ha x 0, f(x) = λ p x p 1 e λx, ha x > 0, Γ(p) i=1 ahol Γ(p) a gamma-függvény, λ és p pedig pozitív. Ha p = n 2 és λ = 1 2, akkor ξ-t n szabadságfokú χ2 -eloszlásúnak nevezzük. A gamma-függvény: ξ 2 i Γ(α) = 0 u α 1 e u du A Gamma-eloszlás és függvény forrása Fazekas István: Matematikai statisztika című jegyzete. [2] 15

16 A ξ1, 2 ξ2, 2..., ξk 2 mennyiségeket nemcentralitási paramétereknek nevezzük. Ha a nemcentralitási paraméter 0, akkor centrált χ 2 -eloszlásról beszélünk. (Ha jelző nélkül említjük a χ 2 -eloszlást, akkor általában centráltra gondolunk.) [9] [lásd: 15., 26. oldal] 2.8. ábra. χ 2 eloszlás 4 szabadságfokkal Hisztogramok Tekintsünk egy ξ 1, ξ 2,..., ξ n mintát. Osszuk fel a számegyenest y 0 < y 1 < < y r osztópontokkal. Tegyük fel, hogy minden mintaelem beleesik az (y 0, y r ) intervallumba. Jelölje v i az [y i 1, y i ) intervallumba eső mintaelemek számát, i = 1,..., r. Rajzoljunk az [y i 1, y i ) intervallum fölé a v i -vel arányos területű téglalapot, i = 1,..., r. Így megkapjuk a hisztogramot. Ha a téglalapok összterülete n, akkor a gyakorisági hisztogramhoz jutunk. Pontosabban a gyakorisági hisztogram az az f n valós függvény, melyre v i, ha x [y i 1, y i ), i = 1,..., r, f n (x) = (y i y i 1 0, ha x / [y 0, y r ). Ha a téglalapok összterülete 1, akkor a sűrűséghisztogramot kapjuk. Ekkor az i-edik v i téglalap magassága n(y i y i 1 ). A hisztogram alapján következtethetünk az eloszlásra. Az eloszlás (feltételezett) jellegének figyelembe vételével érdemes a hisztogramot megszerkeszteni. A későbbi kiértékelés során figyelembe kell venni, hogy az osztópontokat a mintától függetlenül vettük-e fel. Az osztópontok sűrítésével, vagy ritkításával érhetjük el, hogy a hisztogram ne legyen se túl durva, se ne "ugráljon". Ha a minta feltételezhetően abszolút folytonos eloszlásból származik, akkor a sűrűséghisztogramból következtethetünk a sűrűségfüggvény alakjára. 16

17 Ha az eloszlás diszkrét, akkor a hisztogram helyett a relatív gyakoriságot ábrázoló oszlopdiagramot rajzolhatjuk fel. A hisztogramok leírását Fazekas István: Bevezetés a matematikai statisztikába című könyvéből idéztem. [1] [lásd: 11. oldal] 2.9. ábra. Hisztogram a MATLAB programcsomagban. 17

18 2.4. A lineáris interpoláció Az interpoláció alapfeladatát a következőképpen fogalmazhatjuk meg: Ismerjük egy f : R R függvény a x 1 x 2 <... < x n b pontokban felvett értékeit, azaz az y = f(x) y i = f(x i )(i = 1,..., n) függvényértékeket. Az f(x) függvényt, amely lehet a teljes [a, b] intervallumon vagy csak {x i } n i=1 pontokban ismert, egy olyan, általában könnyen kiszámítható h(x) függvénnyel közelítjük (vagy helyettesítjük), amelyre fennáll, hogy y i = h(x i )(i = 1,..., n). Az {x i } n i=1 pontokat interpolációs alappontoknak, a feltételt interpolációs feltételnek vagy interpolációs alap-egyenletrendszernek nevezzük. Az interpolációs feltétel teljesülése esetén azt reméljük, hogy a h(x) = h(x i ){x i } n i=1, {y i } n i=1 interpoláló függvény az (x i, x i+1 ) intervallumokban jól közelíti az f(x) függvényt. [5] A lineáris interpolációt a program 2. feladatában alkalmaztam, ahol nagy segítségemre volt a hisztogram és a χ 2 függvény közelítésénél Khí-négyzet próba A (Pearson-féle) khí-négyzet (χ 2 ) próbát arra használják a statisztikában, hogy diszkrét eloszlású változókat vizsgáljanak, mégpedig ha szeretnénk megállapítani, hogy két kategoriális változó között van-e kapcsolat. Azaz, hogy eltérnek-e a véletlen szintjétől az egyes kategóriában várható gyakoriságok. A próba elvégzéséhez a megfigyelések standardizálására van szükség. Ha az összes standardizált eltérést összeadjuk, a Pearson féle χ 2 próbát kapjuk. A próbát csak akkor lehet elvégezni, ha a minták eloszlása a χ 2 eloszlást közelíti. A minta minél nagyobb, annál egyszerűbben teljesül az előfeltétel. Kis minta esetén kisebb a valószínűsége a szignifikancia szint elérésének (vagyis a nullhipotézis hibás elfogadásának I. fajú hiba). Szemben a parametrikus próbákkal, a χ 2 próbánál nem előfeltétel a mért változók normál eloszlása (mivel diszkrét változókra végezzük a próbát, a normál eloszlás pedig folytonos). 18

19 2.6. Quantile-Quantile plot A qq-plot egy grafikus elemzési mód, az eloszlás illeszkedésének vizsgálására alkalmas függvény. A megfigyelt és az illesztett eloszlás kétdimenziós ábrázolása. Az eloszlásfüggvény q-kvantilise az az érték, amelynél q valószínűséggel kapunk kevesebbet. A qqplot(x,y) az x és y vektorokbeli minták azonos eloszlását vizsgálja. Ha a + jelekkel meghúzott görbe közel van az egyeneshez, akkor az egyforma eloszlás elfogadható. A módszer: a két minta empirikus kvantiliseit ábrázolja egymással szemben. Ennek a tesztnek az alapgondolata az, hogy alapadatainkat standardizáljuk, majd elkészítjük empirikus eloszlásfüggvényüket. Ezt követően az eloszlásfüggvény értékeit a normális eloszlásfüggvény inverze szerint transzformáljuk, és ha az eredeti eloszlás valóban normális volt, akkor a kiinduló adatok és az oda-vissza transzformált értékek megegyeznek, azaz ha ezek mindegyikét egy-egy pont két koordinátájának tekintjük, akkor az így kapott pontok egy egyenesen helyezkednek el. Ha a változó csak közelítőleg normális (és természetesen a gyakorlatban ez a jellemző eset), akkor a pontok egy origón átmenő 45 fokos egyenes körül szóródnak. Az így készített pontdiagramot, amely tehát kedvező esetben egy 45 fokos egyenest rajzol ki vagy közelít meg, Q-Q ábrának nevezzük, és a normalitás grafikus tesztelésére használjuk. A tesztelés természetesen nem olyan szigorú, mint a hagyományos tesztek esetén, hiszen a döntés (elfogadás vagy elutasítás) csak ránézés alapján történik, ám az esetek jó részében egy ilyen ábra hozzáértő megtekintése helyes döntést eredményez ábra. Normális eloszlások illeszkedésvizsgálata MATLAB programban. 19

20 P-P plot Bár a Q-Q plot szélesebb körben használatos, meg kell hogy említsük még a Q-Q plot párját is, a ppplot függvényt, ami a Probability-Probability rövidítése, de szokás Percent-Percent plotnak is hívni. A P-P plotot a statisztikában ugyancsak eloszlásfüggvények vizsgálatára használják. Két kumulatív eloszlásfüggvény egyezésének vizsgálatára szolgál ábra. Két eloszlásfüggvény összehasonlítása P-P plottal. 20

21 3. fejezet A MATLAB programcsomag bemutatása 3.1. A MATLAB történeti áttekintése A MATLAB egy speciális programrendszer, amely numerikus számítások elvégzésére lett kifejlesztve. A The MathWorks által kifejlesztett programrendszer képes mátrix számítások elvégzésére, függvények és adatok ábrázolására, algoritmusok implementációjára és felhasználói interfészek kialakítására. A MATLAB-ot (Matrix Laboratory) az 1970-es évek elején Cleve Moler kezdte el fejleszteni, az akkori Új-Mexikói Egyetem Számítástudományi intézetének elnöke. Kezdetben csak a diákjai munkáját tervezte megkönnyíteni, hogy ezen keresztül el tudják érni a LINPACK és EISPACK csomagokat Fortran tudás nélkül. Hamarosan elterjedt más egyetemek hallgatói és munkatársai között is, és így eros érdeklodésre tett szert az alkalmazott matematikával foglalkozók körében. Jack Little 1983-ban, Molernél tett látogatása során felismerte a MATLAB-ban lévo lehetoségeket. Nem sokkal ezután csatlakozott Molerhez és Steve Bangert-hez, majd újraírták a MATLAB-ot C nyelven, és megalapították a The MathWorks-öt 1984-ben. Ezek az újraírt könyvtárak JACKPAC néven váltak ismertté ben a MATLAB-ot ismét újraírták, hogy újabb módszereket alkalmazzon a mátrixokkal való muveletekre, ebbol született a LAPACK csomag. A MATLAB eloször az irányítástechnikával foglalkozók körében lett alkalmazva, ami Little szakterülete volt, de gyorsan elterjedt más területeken is. Manapság szintén használatos még az oktatásban, különösen a lineáris algebra és numerikus analízis szemléltetésében, és népszeru a képfeldolgozással foglalkozó kutatók között is ben a hivatalos források alapján a MATLAB több, mint 1 millió felhasználóval rendelkezett. A Matlab leírása Selling István diplomamunkájából származik. [7] 21

22 3.2. Grafikus felhasználói interfész bemutatása A MATLAB programcsomag fontos részét képezi a grafikus felhasználói interfész, azaz a Graphical User Interface (GUI). Egy GUI egy grafikus ablak vagy ablakok, amelyeken vezérlő elemek vannak, amik segítségével a felhasználónak lehetősége van interaktív feladatok végrehajtására, és ehhez nincs szükség szkriptek készítésére, vagy parancsok beírására a parancssorba. Ehhez a GUIDE-t (Graphical User Interface Design Environment) használjuk. A funkció eléréséhez egyszerűen gépeljük be a parancssorba a guide parancsot. Ezzel meghívódik a guide függvény és a MATLAB feldob egy ablakot, ahol lehetőségünk van kiválasztani, hogy milyen új GUI-t készítsünk, illetve a korábban létrehozottak közül melyiket nyissuk meg. Ha a guide parancs paraméterébe megadjuk a már korábban elkészített interfészünk nevét, akkor megnyitja a MATLAB (ha a megfelelő munkakönyvtárban van). A GUI a felhasználótól függ, várja a vezérlők kezelését és erre ad válaszokat. Minden egyes vezérlőnek, és magának a GUI-nak is van legalább egy rutinja, ami gyakorlatilag egy végrehajtható MATLAB kód. Ezek a rutinok callback néven ismertek, mivel gyakorlatilag egy hívást intéznek a MATLAB felé, hogy az végrehajtsa a megfelelő feladatot. Ezen callback rutinok mind a felhasználó tevékenységétől függően aktiválódnak, például a felhasználó megnyom egy gombot, kattint az egérrel, kiválaszt egy elemet egy legördülő menüből, begépel egy értéket, vagy csak egyszerűen egy vezérlő felett elhúzza az egeret. Ezeket eseményeknek nevezzük, és ezek bekövetkeztekor a GUI válaszeseményt generál. Ezt a típusú programozást eseményvezérelt programozásnak nevezzük. A callback rutinok aszinkron működésűek, a szoftvertől független események váltják ki őket. A MATLAB esetében a legtöbb esemény a felhasználó GUI-val való interakciójának eredménye, de van lehetőségünk úgy megírni az interfészünket, hogy az más események hatására váltódjon ki, például egy fájl létrehozására, megnyitására. Kétféleképpen lehet felépíteni a MATLAB grafikus interfészünket, ennek egyik módja a GUIDE használata, a másik pedig a GUI programozása. Mindkét módszernek 22

23 vannak előnyei és hátrányai is, így a legcélszerűbb a kettőt együtt, egymás mellett használni. [7] A vezérlők Push button: egy nyomógombot hoz létre. Slider: az interfészen való navigálásra "csúszkát" hozhatunk létre. Radio button: több választási lehetőség esetén ezzel tudunk egyet kiválasztani. Check box: több választási lehetőség esetén ezzel többet is kiválaszthatunk. Edit text: szöveges beviteli mezőt hozunk létre. Static text: felhasználó által nem változtatható szöveges mezőt hozunk létre. Pop-up menu: felnyit egy választási listát, ahonnan a felhasználó az egérrel választhat egyet. Listbox: egy elemlistát hozunk vele létre, ahonnan a felhasználónak lehetősége van több elem kiválasztására is. Toggle button: létrehoz egy nyomógombot, aminek két álapota van. Ha a felhasználó rákattint, benyomódik, és így is marad, míg a felhasználó nem kattint rá megint. Table: egy táblázatot tudunk ezzel a paranccsal létrehozni. Axes: képek és MATLAB által készített függvények megjelenítésére szolgáló vezérlő. Panel: ezen vezérlő segítségével tudunk más vezérlőket egy csoportba rendezni. Ha a vezérlő elemeket panelekbe rendezzük, akkor egyszerűbben értelmezhető, és átláthatóbb GUI-t készíthetünk. Button group: hasonlít a Panel vezérlőhöz, viszont az külön Radio button és Toggle button vezérlők összefoglalására használható. ActiveX control: ActiveX vezérlőket hozhatunk vele létre. 23

24 3.1. ábra. Graphical User Interface felülete A MATLAB Statistics Toolbox bemutatása A Matlab Statistics Toolbox az utóbbi évek fejlesztései nyomán gazdag statisztikai eszközrendszerré vált. Azonban több szempontból különbözik az olyan speciális statisztikai programcsomagoktól, mint pl. a SAS vagy az SPSS adatkezelő rendszerek. Nem az átlagos, statisztikát alkalmazó szakemberek igényeinek felel meg, hanem inkább kutatói segédeszköz. Elsősorban azok számára hasznos, akik egyéb feladataik megoldására a Matlabot alkalmazzák, így a statisztikáért sem kell mindig más rendszerhez folyamodniuk. A statisztika kutatói számára az egész Matlab-rendszer kitűnően szolgálja az új eljárások gyors programozását és a modellek szimulációval való vizsgálatát. Ehhez a Statistics Toolboxból a sűrűségfüggvények, az eloszlásfüggvények és inverzeik, valamint a véletlenszám generátorok nagy segítséget nyújtanak. [9] [lásd: 15., 26. oldal] Több, mint 40 eloszlással tud számolni ez az eszköztár, többek között: 1. Diszkrét eloszlások (a minták egész értékűek) 2. Folytonos eloszlások (a minták valós értékűek) 3. Többváltozós eloszlások (a minták vektor értékűek) A Statistics Toolbox statisztikai algoritmusokat és eszközöket tartalmaz, segítségével egyszerűen tudunk adatokat modellezni illetve elemezni. Használhatjuk regresszióhoz vagy modell alapú prediktív szabályozáshoz. Véletlen számokat generálhatunk a Monte Carlo szimulációhoz, vagy statisztikai függvényeket adatfeltáró analízishez és hipotézis tesztekhez. A Statistics Toolbox alkalmas kulcsfontosságú változók illetve felülvizsgált és felülvizsgálat nélküli gépi tanuló algoritmusok létrehozására, valamint döntési fákat, hierarchikus klaszterezést, k-legközelebbi szomszéd keresőt, Gauss-keveréket és rejtett Markov 24

25 modelleket is megoldhatunk ennek segítségével ábra. Eloszlás illesztés a Statistics Toolbox-ban. Leíró statisztikai függvények a Statistics Toolboxban Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az adatokból viszonylag könnyen kiszámítható paramétereket leíró statisztikáknak (vagy ritkán, de pontosabban: leíró statisztikai függvényeknek) nevezzük. Sok ilyen van, két legfontosabb csoportjuk az úgynevezett elhelyezkedési (measures of location or central tendency) és a szóródást jellemző paraméterek (measures of spread). Az elhelyezkedési paraméterek azt az értéket igyekeznek megadni, ami körül a mintánk elemei csoportosulnak (ilyen például az átlag és a medián) míg a szóródási paraméterek azt igyekeznek jellemezni, hogy értékeink mennyire szorosan vagy lazán helyezkednek el ekörül a pont körül (például szórás). Előfordul, hogy a minta elemeiről nem csak egyfajta adattal rendelkezünk. Kétféle adat esetén, így összetartozó értékpárok jönnek létre. Az értékpárok közötti összefüggésről adnak információt a kapcsolatot jellemző paraméterek (measures of correlation). [6] 25

26 Véletlenszámok generálása A véletlenszámok a sztochasztikus szimulációkhoz nélkülözhetetlenek. A Statistics Toolboxban... rnd(paraméterek,mátrixméret) egy (pszeudo) véletlenszámokból álló mátrixot állít elő. Ha ξ a [0,1]-en egyenletes eloszlású, akkor F 1 (ξ) eloszlásfüggvénye F lesz. A Statistics Toolbox ezt a tényt és számos más eljárást is használ, hogy egyenletesből más eloszlású véletlenszámokat generáljon. A randtool demonstrációs program a véletlenszámokat mutatja be úgy, hogy hisztogramot illeszt a generált mintához. [9] [lásd 15., 24. oldal] 3.3. ábra. Normális eloszlás mintára Randtool-ban. 26

27 3.4. Eloszlásfüggvények a MATLAB-ban A MATLAB programcsomagban a következő parancsokkal tudjuk generálni az egyes eloszlásfüggvényeket: - pdf - Probability density functions (Valószínűségi sűrűségfüggvények) - cdf - Cumulative distribution functions (Kumulatív eloszlásfüggvények) - inv - Inverse cumulative distribution functions (Inverz kumulatív eloszlásfüggvények) - stat - Distribution statistics functions (Statisztikai eloszlásfüggvények) - fit - Distribution fitting functions (Eloszlás-illesztés függvények) - like - Negative log-likelihood functions (Negatív log-likelihood függvények) - rnd - Random number generators (Random számok generálása) A programban, amit készítettem, leginkább a valószínűségi sűrűségfüggvényeket (pdf) és random számok generálását (rnd) használtam: Az Y=normrnd(µ, σ) normális eloszlású véletlen számokat generál, a két paramétere pedig a várható érték (µ) és a szórás (σ). A paraméterek lehetnek vektorok, mátrixok, vagy többdimenziós tömbök, amelyek azonos méretűek. Az Y=normrnd(µ, σ, m, n,...), vagy Y=normrnd(µ, σ, [m, n,...]) egy m x n-es tömböt generál a paraméterek mellé. A várható érték és a szórás paraméterek lehetnek vektorok, mátrixok, vagy többdimenziós tömbök, amelyek azonos méretűek Y-nal. Az Y=pdf(név,X,A) parancsban a név a sűrűségfüggvény nevét jelöli. Az A a paraméter értéket adja meg az eloszláshoz, az X pedig a sűrűség értékeit értékeli ki. Ha az X és A tömböket jelöl, akkor azonos méretűeknek kell lenniük. Ha X egy skalár, akkor kibővíthető egy állandó mátrixszá, hogy az azonos méretű legyen A-val és így fordítva. Az Y=pdf(név,X,A,B) kétparaméteres sűrűségfüggvényre vonatkozik, ahol a paraméterek értékeit az A és a B jelöli. Ha az X, A és B tömbök, akkor azonos méretűeknek kell lenniük. Az Y=pdf(név,X,A,B,C) parancs az előzőekhez hasonló, csak itt háromparaméteres változatról beszélünk. A nevezetes eloszlások megnevezése mindegyik parancsban ugyanaz. Ezekből pár darab: Béta eloszlás: beta Binomiális eloszlás: bino Khí-négyzet eloszlás: chi2 Exponenciális eloszlás: exp Gamma eloszlás: gam Normális eloszlás: norm Poisson eloszlás: poiss 27

28 3.5. Khí-négyzet (χ 2 ) eloszlás a MATLAB programcsomagban A nemcentrált χ 2 sűrűségfüggvényének kiszámolása: ncx2pdf(x,n,lambda). A centrált χ 2 sűrűségfüggvény: chi2pdf(x,n). Ha meg szeretnénk különböztetni a χ 2 eloszlást a nem-centrális χ 2 eloszlástól, akkor szokás centrális χ 2 eloszlásnak is nevezni. Ez az eloszlás széles körben használatos a valószínűség-eloszlások között, a statisztikai területén, például a hipotézisek ellenőrzésekor, vagy egy konfidencia-intervallum létrehozásakor. A χ 2 eloszlás valószínűség sűrűségfüggvénye (ahol Γ a gamma-eloszlást jelöli): x (k/2) 1 e ( x/2 ), ha x 0, k f(x; k) = 2 k/2 Γ 2 0, más esetben ábra. χ 2 eloszlás szemléltetése 1, 4 és 8 szabadságfokkal MATLAB-ban. 28

29 3.6. Hisztogramok kirajzolása a MATLAB programcsomagban Az A=hist(Y) paranccsal tudunk hisztogramot kirajzolni, például egy Y mátrixra. Y elemeit egyenlő távolságú oszlopokba teszi és visszatér az elemek számaihoz minden oszlopban. A=hist(Y,M), ahol M egy skalárt jelent. Az A=hist(Y,X), ahol X egy vektort jelent, visszaadja az Y eloszlását. Az [N,X]=hist(...) visszaadja a pozícióját a binközpontú X-nek. A hist(...) kimenő argumentumok nélkül hozza létre az eredményt ábra. χ 2 eloszlás hisztogramja MATLAB-ban. 29

30 4. fejezet Fejlesztői dokumentáció A szakdolgozatomhoz készített programot a MATLAB programcsomag R2012a változatában készítettem, a Statistics Toolbox felhasználásával. Két fő statisztikai függvényt/eljárást emeltem ki szakdolgozatomban, ezek a Khí-négyzet eloszlás valamint a Q-Q-plot függvény Rendszerkövetelmények Szoftverkövetelmények: - A MATLAB programcsomag R2008b vagy annál frissebb verziója - Statistics Toolbox kiegészítő Hardverkövetelmények: - Intel Pentium 4 processzor vagy annál fejlettebb - Minimum 2 GB memória A program megnyitásához először indítsuk el a cimlap.m MATLAB fájlt. Futtatáshoz nyomjuk meg az F5 billentyűt. Ekkor felugrik egy kis ablak, a program felülete. Itt tudunk választani a 3 feladat közül: 30

31 feladat - Normális eloszlások Bevezetés A panel megtervezésekor az volt a fő szempont, hogy egy olyan kezelőfelületet alakítsunk ki a normális eloszlás megjelenítéséhez, amelyen: - egyszerre több, különböző várható érték és szórás paraméterekkel ellátott normális eloszlást összehasonlíthassunk; - ezeket a paramétereket mi magunk is állíthassuk; - adjunk lehetőséget nagyon kevés, de akár több (legfeljebb tíz) normális eloszlás kirajzolására; - adjunk lehetőséget arra is, hogy amennyiben a beállított számú eloszlásból nincs szükségünk mindegyikre (de nem akarjuk visszacsökkenteni a kirajzolt mormális eloszlások számát), ki- és bekapcsolhassuk a már megjelenített normális eloszlásokat; - mindezt egy olyan felületen, ahol az X és Y tengelyt módosíthatjuk, így az esetleges részletekre is ráközelíthetünk; - a szerkesztéshez, ki- és bekapcsoláshoz szükséges beazonosítást a színekkel nagyon egyszerűvé tegyük (így tudjuk, hogy melyik gombra kattintva tudjuk szerkeszteni illetve elrejteni az adott normális eloszlás görbéjét); - mindezt valós időben tehessük meg. A tervezés végeredménye lett ez a panel, mely a fenti kritériumoknak tökéletesen eleget is tesz. 31

32 Rövid ismertetése az elkészült felületnek: A bal alsó sarokban található egymás fölött a Leírás és a Vissza gomb. A panel fő területét a grafikon tölti ki, amelynek fehér háttérszíne van, és amelyen alapesetben három eloszlást rajzolunk ki. A Leírás gombra kattintva megnyithatjuk a panel rövid magyarázatát, segítséget kaphatunk a panel használatához. A Bezár gombbal ki tudunk lépni a leírásból, illetve az első feladatot is be tudjuk zárni a Vissza gombbal és így visszatérünk a program főmenüjébe, ahonnan más feladatot is kiválaszthatunk. A panel fő területét a grafikon tölti ki, amelynek fehér háttérszíne van, és amelyen alapesetben három eloszlást rajzolunk ki. A grafikon alatt és a grafikontól bal oldalra egy-egy csúszkát találhatunk, melyeknek semmilyen felirata nincs. Ezek a grafikon X és Y tengelyének nyújtását, illetve összehúzását szolgálja, továbbá a felirat hiánya is azért van, mert a pozícióik önmagában is árulkodóak: a grafikon X tengelyéhez simul az X tengely mértékét változtató csúszka, míg az Y tengelye mellett található az Y tengely manipulálására képes csúszka. A feladathoz, azaz a normális eloszlásokhoz kapcsolódó legfontosabb rész a felület felső részén, a grafikon fölött található,a Függvények száma feliratú gyűjtőpanelt, amelyen színes gombok, jelölőnégyzetek és rádiógombok találhatóak, továbbá ezen gyűjtőpanel alatt két csúszkát, melyek mindegyikétől balra található a jelképes neve és az érték, melyet reprezentálnak. A megjelenített eloszlások görbéjének mindegyikének módosíthatjuk a paramétereit. Az éppen szerkesztésre kiválasztott eloszlás görbéjét a színe alapján tudjuk meghatározni: amely görbét épp szerkesztjük, annak a színében pompáznak a grafikon fölötti csúszkák. A szerkesztésre kiválasztott görbét egész egyszerűen szerkeszthetjük a csúszkák mozgatásaival. Láthatjuk, hogy a felső csúszka az eloszlás m paraméterét módosítja, míg az alsó a σ (szórás) paraméter értékét módosítja. Láthatjuk, hogy amellett, hogy a görbe maga változik valós időben, a görbétől balra lévő érték is változik. Így könnyen le tudjuk olvasni az aktuálisan beállított paraméterünk pontos értékét. Mivel az értékeket pontosan nem mindig egyszerű beállítani csúszkákkal, a csúszkáktól balra lévő szövegdobozt - amelyben megjelenítjük az adott paramétere értékét - is lehet szerkeszteni. Ezzel lehetőség van pl. a standard normális eloszlás ábrázolására a grafikonon (ahol m = 0 és σ = 1 ). A szerkesztés úgymond vice-versa (oda-vissza) működik: ha a szövegdobozt szerkesztjük, a csúszka értéke változni fog, és ha a csúszkát szerkesztjük, a szövegdoboz értéke fog változni. Így ha csak szeretnénk játszani az értékekkel, elég a csúszkát mozgatnunk, de ha pontos értékeket kívánunk megadni a programban, arra is nyújtunk lehetőséget. Amennyiben más eloszlás görbéjét szeretnénk változtatni, más gombra kell kattintani. Alapesetben csupán az első három eloszlást szerkeszthetjük, hiszen csak az első három eloszlást rajzoljuk ki a program indulásakor. Ez a funkció a program egészére igaz: amennyiben pl. az első 7 db eloszlást rajzoljuk ki, akkor csak az első 7 eloszlás görbéjét szerkeszthetjük, a és 10. görbét nem, hiszen nincs értelme úgy szerkeszteni a görbe értékét, hogy nem látjuk a változásokat. Ahhoz, hogy több, vagy kevesebb görbét rajzoljunk ki, a megfelelő szám alatti rádió- 32

33 gombra kell kattintanunk. Felmerülhet a kérdés, hogy ha már állítható a kirajzolt eloszlások száma a rádiógombokkal, mi szükség van arra, hogy egyesével jelenítsük meg, vagy rejtsük el a kirajzolt eloszlások görbéit? A válasz a fent írt szempontokból következik: szerettük volna minél könnyebben használhatóvá tennünk a panelt. Az volt a jelölőnégyzetek alapötlete, hogy lehetséges, hogy épp nincs szükségünk az összes megjelenített eloszlás görbéjére, viszont szükségünk van olyanra is, amely valahol a "végén" van. Ekkor, ha a jelölőnégyzetek nem lennének, az alábbi lehetőségeink állnának rendelkezésünkre: - nem veszünk tudomást a nem szükséges görbékről (elég nehéz, ha pont az 1. és 10. görbe kell, és közöttük van 8 másik); - a többi görbe értékét átállítjuk, hogy ne látszódjanak, így ne legyenek útban (ekkor lehetséges, hogy amiket átállítanánk, pont szükségünk lenne rájuk egy későbbi kirajzolás esetén a már beállított értékekkel, ez esetben ezek a beállítások elvesznének); - amely görbére szükségünk van, de "túl nagy a száma", a paramétereit rámásoljuk egy kisebb számú görbére, és csak addig jelenítjük meg (itt ugyanaz a probléma, mint az előzőnél: lehet, hogy a kisebb számú görbe paramétereire szükségünk lenne, amit így felülírunk). Ezen problémák miatt döntöttem a jelölőnégyzetek bevezetése mellett. Így például ha gondosan beállítottuk mind a tíz görbe értékét, de csak az első és a hetedik görbét szeretnénk megjeleníteni - például összehasonlítás gyanánt -, elég, ha csak levesszük a kirajzolási görbék számát 10-ről 7-re, és 2-től 6-ig ideiglenesen elrejtjük a grafikonokat. Mindennek tetejében a fentebb írt X és Y tengelyek manipulálására is lehetőség van: bele lehet "közelíteni", vagy "távolodni" lehet az értékektől. A leírásból látszik, hogy igyekeztünk minden problémára kitérni, az, hogy egy olyan felületet alkossunk meg a normális eloszlás ábrázolására, amellyel a legtöbb ábrázolási kérdést, problémát lefedhessük egy egyszerű, mégis könnyen használható kezelőfelülettel. 33

34 Teszteredmények A következő ábrákon különböző teszteredményeket láthatunk, a várható érték és a szórás megváltoztatása után: 34

35 4.3. Khí-négyzet (χ 2 ) eloszlás Ebben a részben azt vizsgáljuk, hogy a normális eloszlások négyzeteinek összege ténylegesen a χ 2 eloszlásra illeszkedik. A panel hasonló tervek alapján lett elkészítve, mint amiket figyelembe vettünk az 1. feladat elkészítésénél, azaz egy átlátható, mégis sokoldalú prezentációs felületet szerettünk volna bemutatni. Nyomokban az 1. feladatban kialakított kezelőfelületét helyeztem át ide: ugyanúgy a grafikon szerepel a panel középpontjában, mellette és alatta az X és Y tengelyek manipulációs csúszkái ugyanúgy megvannak, ahogyan a bal alsó sarokban a megfelelő Leírás és Vissza gombok. Ugyanúgy van egy gyűjtőpanel a grafikon fölött, de egyrészt a fenti gyűjtőpanel alatt már egy másik, kisebb gyűjtőpanel helyezkedik el, továbbá ezektől balra is egy harmadik, jóval kisebb gyűjtőpanelt látunk. A legkissebb panel, amely az Ábrázolási mód feliratot viseli, a 2. feladat legfontosabb funkciói közötti váltást teszi lehetővé: egy görbés módban csak egyetlen görbét rajzolunk ki, míg több görbés esetben értelemszerűen többet. Egy görbés mód esetében amennyiben rákattintunk az egyik színes gombra - amely nem az éppen most kirajzolt görbe -, átvált rá a program, amelyet ráadásul egy animáció keretében tesz meg. Megjegyezzük, hogy ezek a számok a Khí-négyzet szabadásgfokát reprezentálja. A χ 2 eloszlást közelíthetjük standard normális eloszlással is, amely egy kék oszlopokból álló hisztogramot alkot. Ez mutatja, hogy a görbe valóban a χ 2 eloszlás görbéjét ábrázolja. A megfelelő jelölőnégyzettel be-ki kapcsolható a χ 2 hisztogramos közelítésének kirajzolása. Természetesen ez is paraméterezhető, megadható az oszlopok száma (m), és a 35

36 közelítés mintájának nagysága (n). Amennyiben a χ 2 eloszlás hisztogramos közelítése is engedélyezve van, valamelyik színes gombra rákattintva a hisztogram is frissül. Az adott szabadságfok kiírásra kerül a megfelelő színnel (és annak komplementerszínével ellátott háttérrel) a grafikon fölött jobb oldalt. Van lehetőség a teljes átmenet kirajzolására is, a legfelső panelen lévő A teljes átmenet kirajzolása gombbal. Ezzel, akármelyik szabdságfokon állunk, onnan tesz egy "kört", interpolációs animációval kirajzolódik a függvény az összes szabadságfokkal 1-től 10-ig. Amennyiben a Több görbés üzemmódra váltunk a bal oldali kicsi panelen, a grafikon és a grafikon feletti panel is megváltozik: a grafikon felett már csak egy panelt látunk, és a szabadságfok sem kerül kirajzolásra. Ebben a módban tudjuk összehasonlítani a különböző szabadságfokú χ 2 görbéket egymással. Ez a felület egyszerűbb, mint az első feladatban látott: csak engedélyezni/letiltani lehet egy-egy szabadságfokú χ 2 eloszlás kirajzolását, hogy összehasonlítsuk egymással: nincs is szükség az 1. feladatban bemutatott komplexitásra, hiszen ezen az ábrán nincs módunk módosítani a görbék paramétereit. A felületen található egy A teljes átmenet kirajzolása gomb. Erre kattintva az átmenet elindul és végigmegy mind a 10 szabadságfokon. Ennél a résznél alkalmaztam a lineáris interpolációt, hogy a függvényt közelítse a hisztogram. Teszteredmények Jól megfigyelhető, hogy nem érdemes túl kicsi oszlopszámot választani a hisztogram kirajzolásánál, mert akkor az összeadott normális eloszlások nem lapulnak rá a χ 2 függvényére. 36

37 Túl nagy oszlopszám esetén sem látszik, hogy rálapulnának az oszlopok a függvényre: 37

38 4.4. Quantiles-Quantiles plot Bevezetés A feladatot igyekeztem továbbra is jól átláthatóvá tenni, így amellett, hogy a feladatba tett eloszlásokat parametrizálhatjuk, csupán három eloszlást tartalmaz, melyek folytonosak: - a normális eloszlást, - az egyenletes eloszlást, - és az exponenciális eloszlást. Mivel össze akarjuk őket hasonlítani egymással, két gyűjtőpanelre volt szükség, melyeknek ugyanaz a tartalma (természetesen a háttérben más változókkal dolgoznak). A program lényege röviden: az a két eloszlás kerül összehasonlításra QQ-plottal (és kerül az összehasonlítás eredménye kirajzolásra), amely bal oldalt és jobb oldalt ki van választva. Például ha kiválasztjuk a bal oldalon a normális eloszlást, jobb oldalon pedig az egyenletes eloszlást, a program ezeket hasonlítja össze (természetesen ugyanez érhető el, csak más eredményekkel, hogyha a normális eloszlást a jobb oldali panelen választjuk ki, az egyenletes eloszlást pedig a balon). A program előnye, hogy egymással is összehasonlíthatjuk az eloszlásokat, hiszen kiválaszthatjuk ugyanazt az eloszlást mindkét panelen, ezzel tesztelhetjük, hogy a QQ-plot valóban helyesen működik. A megfelelő eloszlások megfelelő paramétereit módosíthatjuk mindkét panelen. A generált minták számosságát (n érték minden eloszlás végén) is módosíthatjuk, ebből is láthatjuk, hogy a QQ-plot mindig a kisebb értékkel dolgozik. 38

39 Bár a QQ-plot tesztelése csak ránézés alapján történik, ám az esetek jó részében egy ilyen ábra hozzáértő megtekintése helyes döntést eredményez. A következő ábrán például jól látható, hogy különböző eloszlások vizsgálata esetén a + jelek nem illeszkednek az egyenesre (két végén eltérnek): A munka végeztével a Vissza gombbal lehet visszamenni a kezdőfelületre, illetve a Bezárás gombbal be is lehet zárni az egész programot. 39

40 5. fejezet Összefoglalás A program megírásának ötlete egy olyan észrevétellel kapcsolatban merült fel, mely szerint egy könnyen kezelhető, átlátható felületen demonstrált eredmény a hallgatóságban mélyebb nyomot hagy és azt könnyebben megérti, mint hogy ha csak tisztán elméleti szinten hall róla. Ennek érdekében először irodalomkutatást végezve összegyűjtöttem a valószínűségi eloszlásokhoz szükséges elméleti hátteret, majd utánanéztem, hogy milyen lehetőségeim vannak ezek bemutatására. Így akadtam a MATLAB programcsomagra és annak a Statistics ToolBox eszköztárára. Segítségemre volt még a MATLAB programcsomag grafikus felhasználói interfésze, így a programot egy könnyen átlátható felületre tudtam helyezni. A készített programot igyekeztem a lehető leghasználhatóbbra megírni, mivel már a programcsomag fejlesztésének az elején azt a célt tűztem ki magam elé, hogy az elkészült program egyfajta könnyen használható szemléltető segédeszköz lehessen a matematikai statisztikával foglalkozó tanároknak és diákoknak. Az eloszlásokat és tesztelési eljárásokat szemléltető képek megkönnyítik majd a hallgatók tanulását. 40

41 Irodalomjegyzék [1] Fazekas István (szerk.): Bevezetés a matematikai statisztikába (Kossuth Egyetemi Kiadó, Debrecen, 2000) [2] Fazekas István: Matematikai statisztika jegyzete alapján [3] Fazekas István (szerző): Valószínűségszámítás (számítógépes segédlet) Debreceni Egyetem, 2000 [4] Fegyverneki Sándor: Valószínűségszámítás és matematikai statisztika, 2011, Miskolci Egyetem [5] Házy Attila: Lineáris algebra numerikus módszerei, 7. előadás anyaga, Miskolci Egyetem [6] Leíró statisztikai függvények [7] Selling István: Leghosszabb szériák vizsgálata (diplomamunka) Miskolci Egyetem, 2013 [8] Statisztikai bevezetésről szóló oldal forrása: [9] Stoyan Gisbert: MATLAB (frissített kiadás, 2005) 41

42 Adathordozó használati útmutató A szakdolgozat CD mellékletén az alábbi könyvtárak találhatóak meg: Felhasználói dokumentáció: itt található a felhasználói dokumentáció pdf formátumban. Szakdolgozat: a szakdolgozatot tartalmazza pdf formátumban. Program: a PappAndrea nevezetű mappát tartalmazza, mely a szakdolgozat programcsomagja. A programcsomag indítása: cimlap.m Ahhoz, hogy a program megfelelően működjön, a forrásfájlokat másoljuk át a merevlemezre vagy pendrive-ra. A program futtatásához szükséges a MATLAB programcsomag (ajánlott verzió: R2012a), valamint a MATLAB Symbolic Math Toolbox kiegészítőjére. A program könnyebb használatához vagy a használata közben felmerülő nehézségek kiküszöböléséhez érdemes elolvasni a mellékleten található Felhasználói dokumentáció/felhasznaloi_dokumentacio.pdf fájlt. 42

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.22. Valószínűségi változó Véletlentől függő számértékeket (értékek sokasága) felvevő változókat valószínűségi változóknak nevezzük(jelölés: ξ, η, x). (pl. x =

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Adatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008.

Adatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008. Adatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008. Változáskezelés Verzió Dátum Változás Pont Cím Oldal Kiadás: 2008.10.30. Verzió: 2.0. Oldalszám: 2 / 11 Tartalomjegyzék 1.

Részletesebben

Bevezető. Mi is az a GeoGebra? Tények

Bevezető. Mi is az a GeoGebra? Tények Bevezető Mi is az a GeoGebra? dinamikus matematikai szoftver könnyen használható csomagolásban az oktatás minden szintjén alkalmazható tanításhoz és tanuláshoz egyaránt egyesíti az interaktív geometriát,

Részletesebben

Számítógépes döntéstámogatás. Statisztikai elemzés

Számítógépes döntéstámogatás. Statisztikai elemzés SZDT-03 p. 1/22 Számítógépes döntéstámogatás Statisztikai elemzés Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-03 p. 2/22 Rendelkezésre

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

SCILAB programcsomag segítségével

SCILAB programcsomag segítségével Felhasználói függvények de niálása és függvények 3D ábrázolása SCILAB programcsomag segítségével 1. Felhasználói függvények de niálása A Scilab programcsomag rengeteg matematikai függvényt biztosít a számítások

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László Gyakorló feladatok Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László I/. A vizsgaidőszak második napján a hallgatók %-ának az E épületben, %-ának a D épületben,

Részletesebben

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Mi a véletlen? Determinisztikus vs. Véletlen esemény? Véletlenszám: számok sorozata, ahol véletlenszerűen követik egymást az elemek Pszeudo-véletlenszám

Részletesebben

Diplomamunka. Miskolci Egyetem. Leghosszabb szériák vizsgálata. Készítette: Selling István Mérnök Informatikus MSc jelölt

Diplomamunka. Miskolci Egyetem. Leghosszabb szériák vizsgálata. Készítette: Selling István Mérnök Informatikus MSc jelölt Diplomamunka Miskolci Egyetem Leghosszabb szériák vizsgálata Készítette: Selling István Mérnök Informatikus MSc jelölt Témavezető: Dr. Karácsony Zsolt egyetemi docens Miskolc, 2013 Miskolci Egyetem Gépészmérnöki

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Megyei tervezést támogató alkalmazás

Megyei tervezést támogató alkalmazás TeIR (Területfejlesztési és Területrendezési Információs Rendszer) Megyei tervezést támogató alkalmazás Felhasználói útmutató 2015. május Tartalomjegyzék 1. BEVEZETŐ... 3 2. AZ ALKALMAZÁS BEMUTATÁSA...

Részletesebben

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Gazdasági matematika II. vizsgadolgozat megoldása, június 10 Gazdasági matematika II. vizsgadolgozat megoldása, 204. június 0 A dolgozatírásnál íróeszközön kívül más segédeszköz nem használható. A dolgozat időtartama: 90 perc. Ha a dolgozat első részéből szerzett

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

1/8. Iskolai jelentés. 10.évfolyam matematika

1/8. Iskolai jelentés. 10.évfolyam matematika 1/8 2009 Iskolai jelentés 10.évfolyam matematika 2/8 Matematikai kompetenciaterület A fejlesztés célja A kidolgozásra kerülő programcsomagok az alább felsorolt készségek, képességek közül a számlálás,

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei Alapfogalmak BIOSTATISZTIKA ÉS INFORMATIKA A valószínűségszámítás elemei Jelenség: minden, ami lényegében azonos feltételek mellett megismételhető, amivel kapcsolatban megfigyeléseket lehet végezni, lehet

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

A SZAKMAI GYAKORLAT KÖVETELMÉNYEI

A SZAKMAI GYAKORLAT KÖVETELMÉNYEI A SZAKMAI GYAKORLAT KÖVETELMÉNYEI FELSŐFOKÚ RENDSZERGAZDA MÉRNÖKINFORMATIKUS-ASSZISZTENS FELSŐOKTATÁSI SZAKKÉPZÉSI SZAK Az akkreditált tanterv alapján a szakmai gyakorlat kredit- és időtartama: 30 kredit,

Részletesebben

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 5. gyakorlat 013/14. tavaszi félév 1. Folytonos eloszlások Eloszlásfüggvény és sűrűségfüggvény Egy valószínűségi változó, illetve egy eloszlás eloszlásfüggvényének egy

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

Függvények ábrázolása

Függvények ábrázolása Függvények ábrázolása Matematikai függvényeket analitikusan nem tudunk a matlabban megadni (tudunk, de ilyet még nem tanulunk). Ahhoz, hogy egy függvényt ábrázoljuk, hasonlóan kell eljárni, mint a házi

Részletesebben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben 1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel

Részletesebben

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA SZDT-03 p. 1/24 Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás

Részletesebben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi

Részletesebben

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta Közlemény Biostatisztika és informatika alajai. előadás: Az orvostudományban előforduló nevezetes eloszlások 6. szetember 9. Veres Dániel Statisztika és Informatika tankönyv (Herényi Levente) már kaható

Részletesebben

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny Szűk elméleti összefoglaló Valószínűségi változó: egy függvény, ami az eseményteret a valós számok halmazára tudja vetíteni. A val.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 2 II. A valószínűségi VÁLTOZÓ És JELLEMZÉsE 1. Valószínűségi VÁLTOZÓ Definíció: Az leképezést valószínűségi változónak nevezzük, ha

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk Valószínűségszámítás 8. feladatsor 2015. november 26. 1. Bizonyítsuk be, hogy az alábbi folyamatok mindegyike martingál. a S n, Sn 2 n, Y n = t n 1+ 1 t 2 Sn, t Fn = σ S 1,..., S n, 0 < t < 1 rögzített,

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Matematikai geodéziai számítások 10.

Matematikai geodéziai számítások 10. Matematikai geodéziai számítások 10. Hibaellipszis, talpponti görbe és közepes ponthiba Dr. Bácsatyai, László Matematikai geodéziai számítások 10.: Hibaellipszis, talpponti görbe és Dr. Bácsatyai, László

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak

Részletesebben

Dr. Karácsony Zsolt. Miskolci Egyetem november

Dr. Karácsony Zsolt. Miskolci Egyetem november Valószínűségszámítás és Matematikai statisztika Dr. Karácsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tanszék 2013-2014 tanév 1. félév Miskolci Egyetem 2013. november 11-18 - 25. Dr. Karácsony

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 6. MA3-6 modul A statisztika alapfogalmai SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról szóló 1999.

Részletesebben

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70 Valószínűségszámítás és matematikai statisztika Baran Ágnes Gyakorlat MATLAB Baran Ágnes Gyakorlat 1 / 7 Véletlenszám generátorok randi(n,n,m) n m pszeudorandom egész szám az [1, N]-en adott diszkrét egyenletes

Részletesebben

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének 6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük

Részletesebben

Mechatronika segédlet 3. gyakorlat

Mechatronika segédlet 3. gyakorlat Mechatronika segédlet 3. gyakorlat 2017. február 20. Tartalom Vadai Gergely, Faragó Dénes Feladatleírás... 2 Fogaskerék... 2 Nézetváltás 3D modellezéshez... 2 Könnyítés megvalósítása... 2 A fogaskerék

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK MATEMATIK A 9. évfolyam 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK KÉSZÍTETTE: CSÁKVÁRI ÁGNES Matematika A 9. évfolyam. 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK Tanári útmutató 2 MODULLEÍRÁS A modul

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Statisztikai módszerek 7. gyakorlat

Statisztikai módszerek 7. gyakorlat Statisztikai módszerek 7. gyakorlat A tanult nem paraméteres próbák: PRÓBA NEVE Illeszkedés-vizsgálat Χ 2 próbával Homogenitás-vizsgálat Χ 2 próbával Normalitás-vizsgálataΧ 2 próbával MIRE SZOLGÁL? A val.-i

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ Megoldások Harmadik fejezet gyakorlatai 3.. gyakorlat megoldása ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4;, 3 normális eloszlású P (ξ 8 ξ 5 feltételes valószínűségét (.3. alapján számoljuk.

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

IBM SPSS Modeler 18.2 Újdonságok

IBM SPSS Modeler 18.2 Újdonságok IBM SPSS Modeler 18.2 Újdonságok 1 2 Új, modern megjelenés Vizualizáció fejlesztése Újabb algoritmusok (Python, Spark alapú) View Data, t-sne, e-plot GMM, HDBSCAN, KDE, Isotonic-Regression 3 Új, modern

Részletesebben

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis SZDT-09 p. 1/36 Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Logisztikus regresszió

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Az első számjegyek Benford törvénye

Az első számjegyek Benford törvénye Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm

Részletesebben

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Gazdasági matematika II. vizsgadolgozat megoldása A csoport Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége

Részletesebben

Első egyéni feladat (Minta)

Első egyéni feladat (Minta) Első egyéni feladat (Minta) 1. Készítsen olyan programot, amely segítségével a felhasználó 3 különböző jelet tud generálni, amelyeknek bemenő adatait egyedileg lehet változtatni. Legyen mód a jelgenerátorok

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás Véletlenszám generátorok és tesztelésük Tossenberger Tamás Érdekességek Pénzérme feldobó gép: $0,25-os érme 1/6000 valószínűséggel esik az élére 51% eséllyel érkezik a felfelé mutató oldalára Pörgetésnél

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika Bevezetés 1. előadás, 2015. február 11. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Heti 2 óra előadás + 2 óra

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben