Valószínűségszámítás és statisztika

Hasonló dokumentumok
Valószínűségszámítás és statisztika

Matematikai statisztika

Bevezető Mi a statisztika? Mérés Csoportosítás

Tudnivalók a tantárgyról. Leíró és matematikai statisztika. Tudnivalók a tantárgyról/2. A tananyagról. Honlap: zempleni.elte.hu

[GVMGS11MNC] Gazdaságstatisztika

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Biomatematika 2 Orvosi biometria

Matematikai statisztika c. tárgy oktatásának célja és tematikája

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószínűségszámítás összefoglaló

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A Statisztika alapjai

Sta t ti t s i zt z i t k i a 3. előadás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

36 0,3. Mo.: 36 0,19. Mo.: 36 0,14. Mo.: 32 = 0, = 0, = 0, Mo.: 32 = 0,25

Valószín ségszámítás és statisztika

Adatok statisztikai értékelésének főbb lehetőségei

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

Sta t ti t s i zt z i t k i a 1. előadás

Matematikai statisztika

Valószínűségi változók. Várható érték és szórás

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Gazdasági matematika II. Tantárgyi útmutató

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Kísérlettervezés alapfogalmak

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Készítette: Fegyverneki Sándor

2. előadás. Viszonyszámok típusai

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

[Biomatematika 2] Orvosi biometria

Függetlenségvizsgálat, Illeszkedésvizsgálat

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Segítség az outputok értelmezéséhez

A valószínűségszámítás elemei

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Elemi statisztika fizikusoknak

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

A valószínűségszámítás elemei

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

} számtani sorozat első tagja és differenciája is 4. Adja meg a sorozat 26. tagját! A = { } 1 pont. B = { } 1 pont. x =

Leíró és matematikai statisztika

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

KÖVETKEZTETŐ STATISZTIKA

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

egyetemi jegyzet Meskó Balázs

Nemparaméteres próbák

Abszolút folytonos valószín ségi változó (4. el adás)

Normális eloszlás paramétereire vonatkozó próbák

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

[Biomatematika 2] Orvosi biometria

1. Hányféle sorrendben vonulhat ki a pályára egy focimeccsen a tizenegy kezdő játékos?

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Biostatisztika Összefoglalás

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Statisztika elméleti összefoglaló

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Dr. Karácsony Zsolt. Miskolci Egyetem november

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Valószín ségszámítás és statisztika

Matematika A3 Valószínűségszámítás, 0. és 1. gyakorlat 2013/14. tavaszi félév

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztika Elıadások letölthetık a címrıl

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

1. Név:... Neptun Kód:... Feladat: Egy összeszerel½o üzemben 3 szalag van. Mindehárom szalagon ugyanazt

Biometria gyakorló feladatok BsC hallgatók számára

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

y ij = µ + α i + e ij

Kísérlettervezés alapfogalmak

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

( 1) i 2 i. megbízhatóságú a levont következtetése? A matematikai statisztika eszközeivel értékelje a kapott eredményeket!

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Biostatisztika Összefoglalás

Statisztikai alapfogalmak

Kutatásmódszertan és prezentációkészítés

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Átírás:

Valószínűségszámítás és statisztika Programtervező informatikus szak esti képzés Varga László Valószínűségelméleti és Statisztika Tanszék Matematikai Intézet Természettudományi Kar Eötvös Loránd Tudományegyetem Honlap: www.cs.elte.hu/~vargal4 E-mail: vargal4@cs.elte.hu 2015. december 3. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 1 / 45

Tudnivalók a tantárgyról Kötelező irodalom: az előadásokon elhangzottak Ajánlott irodalom: Csiszár Villő honlapján elérhető két jegyzet: Valószínűségszámítás (http://www.cs.elte.hu/~villo/esti/valszam.pdf), Statisztika (http://www.cs.elte.hu/~villo/esti/stat.pdf) kimondottan az estis prog.inf. szakosoknak készültek Baróti, Bognárné,...: Valószínűségszámítás prog.mat.-os jegyzet Denkinger: Valószínűségszámítás közgazdászoknak készült könyv Baron: Probability and statistics for computer scientists informatikus hallgatóknak készült angol nyelvű könyv Vizsga: Írásbeli, 120 perces, 100 pont a maximum Számológépen kívül semmit se lehet használni (papírt is adok) 1 0-29,99 2 30-49,99 Osztályozás: 3 50-64,99 4 65-79,99 5 80-100 Lesz feladatmegoldás is. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 2 / 45

Tudnivalók a tantárgyról Kötelező irodalom: az előadásokon elhangzottak Ajánlott irodalom: Csiszár Villő honlapján elérhető két jegyzet: Valószínűségszámítás (http://www.cs.elte.hu/~villo/esti/valszam.pdf), Statisztika (http://www.cs.elte.hu/~villo/esti/stat.pdf) kimondottan az estis prog.inf. szakosoknak készültek Baróti, Bognárné,...: Valószínűségszámítás prog.mat.-os jegyzet Denkinger: Valószínűségszámítás közgazdászoknak készült könyv Baron: Probability and statistics for computer scientists informatikus hallgatóknak készült angol nyelvű könyv Vizsga: Írásbeli, 120 perces, 100 pont a maximum Számológépen kívül semmit se lehet használni (papírt is adok) 1 0-29,99 2 30-49,99 Osztályozás: 3 50-64,99 4 65-79,99 5 80-100 Lesz feladatmegoldás is. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 2 / 45

Tudnivalók a tantárgyról A tananyag az idő függvényében exponenciálisan nehezedik. A tananyag teljes mértékben egymásra épül ha valaki lemarad, utána szinte egy mukkot se fog érteni A félév menete (terv): 1-8. előadás: valószínűségszámítás ( 60%) 9-13. előadás: statisztika ( 40%) Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 3 / 45

A valószínűségszámítás Matematikai tudomány Kezdete: 1654 De Méré lovag kockajáték 100 évvel később Pascal oldja meg Axiomatikus felépítés: 1933, A.N. Kolmogorov A 20. században számos új terület fejlődött belőle: matematikai statisztika (Fisher), játékelmélet (Neumann János), információelmélet (Shannon), sztochasztikus folyamatok, véletlen gráfok elmélete Magyar vonatkozások: Jordán Károly, Pólya György, Rényi Alfréd Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 4 / 45

Feladatok E1.) Egy szabályos kockával egyszer dobunk. a.) Mik lesznek a kísérletet leíró eseménytér pontjai? b.) Határozzuk meg az elemi események valószínűségét! c.) Mennyi a valószínűsége, hogy páros számot dobunk? d.) 100-szor feldobtuk a kockát, a kapott eredményeket (gyakoriságokat) a következő táblázat tartalmazza: 1 2 3 4 5 6 Összesen 15 18 17 19 15 16 100 Határozd meg annak a relatív gyakoriságát, hogy páros számot dobtunk! e.) Szimulációval becsüljük meg annak a valószínűségét, hogy páros számot kaptunk! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 5 / 45

Feladatok A szimuláció eredménye Relatív gyakoriság 0.0 0.2 0.4 0.6 0 2000 4000 6000 8000 10000 Független kísérletek száma E2.) Legyen A,B,C három esemény. Írjuk fel formálisan annak az eseménynek a valószínűségét, hogy közülük a.) pontosan k b.) legfeljebb k esemény következik be (k = 1, 2, 3). Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 6 / 45

Feladatok E3.) [Középszintű matematika érettségi, 2015.] Két különböző színű szabályos dobókockával egyszerre dobunk. Adja meg annak a valószínűségét, hogy a dobott számok szorzata prímszám lesz! Egy "remek" megoldás élő adásban: Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 7 / 45

Feladatok E4.) Mintavétel: Adott N különböző termék, amik között van M selejtes. Veszünk n elemű mintát a.) visszatevés nélkül; b.) visszatevéssel. Mennyi a valószínűsége, hogy az n termékből pontosan k selejtest sikerült kiválasztanunk, amennyiben számít a kihúzás sorrendje? Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 8 / 45

Feladatok E5.) Névjegy probléma. Tegyük fel, hogy n ember véletlenszerűen összekeveri a névjegyét (esernyőjét)! Számoljuk ki annak a valószínűségét, hogy senki sem a sajátját kapja! Hova tart ez a valószínűség n esetén? Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 9 / 45

Feladatok E6.) Monty Hall probléma. 3 ajtó közül kell a játékosnak választania. Egy mögött nyeremény (autó) van, a másik kettő mögött kecske. Először kiválasztunk egy ajtót magunknak, de nem nyitjuk ki, majd a műsorvezető kinyit egy másik, kecskés ajtót. Ezek után dönthetünk: kitartunk az eredeti választásunk mellett, vagy a harmadik, még bezárt ajtót választjuk inkább. Mi a jobb stratégia a kettő közül? Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 10 / 45

Feladatok E7.) Egy tesztes vizsgánál minden kérdésre 5 válaszlehetőség közül kell a helyeset kiválasztani. A vizsgázó 0,6 valószínűséggel tudja az egyes kérdésekre a helyes választ, ekkor biztosan helyes választ fog bejelölni. Ha nem tudja a választ, akkor tippel. Ha a vizsgázó egy kérdésre helyes választ adott, akkor mi a valószínűsége, hogy tényleg tudta is a helyes választ? E8.) Mutass példát olyan (Ω, A, P) valószínűségi mezőre és ezekben olyan A, B, C eseményekre, amelyekre a.) A, B és C páronként függetlenek, azonban nem teljesen függetlenek; b.) P(A B C) = P(A)P(B)P(C) teljesül, azonban az A, B, C események nem teljesen függetlenek! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 11 / 45

Feladatok E9.) Állapítsuk meg X eloszlását a következő esetekben: a.) X: hány hallgatót kell végigkérdezni, mire az első bak jegyűt megtalálom; b.) X: lottóhúzásnál (5-ös lottó) a 4-gyel oszthatók száma; c.) Léggömbökre lövöldözünk, az egyes léggömböket 0, 1 valószínűséggel találom el. X: lövések száma, míg a 3. léggömböt ki nem lövöm; d.) X: október 1-jén a csillaghullások száma; e.) Egy üzemben előállított termékek 5%-a III. osztályú. X: 20 terméket kiválasztva, a III. osztályúak száma. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 12 / 45

Feladatok E10.) Három befektetési lehetőség közül választhatunk: bankszámla, fix éves 3, 3%-os kamattal; egy 5 éve futó befektetési alap, ami a korábbi tapasztalatok alapján 50% eséllyel 3%-os hozamot, vagy 50% eséllyel 5%-os éves hozamot nyújt; egy részvény, a több éves tőzsdei adatok alapján azt látjuk, hogy 50% eséllyel 10%-ot veszít értékéből, vagy 50% eséllyel 20%-ot nő a részvény értéke egy év alatt. Melyik befektetést tartod a legjobbnak? Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 13 / 45

Feladatok E11.) Határozzuk meg az alábbi nevezetes diszkrét eloszlások várható értékét és szórását: a.) indikátor; b.) binomiális; c.) geometriai; d.) Poisson. E12.) Egy szabályos érmét kétszer feldobunk. Legyen X értéke 1, ha az első dobás fej, és 0, ha az első dobás írás. Legyen Y értéke 1, ha a második dobás fej, és 0, ha a második dobás írás. Mutassuk meg, hogy U = X + Y és V = X Y korrelálatlanok, de nem függetlenek! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 14 / 45

Feladatok E13.) Eloszlásfüggvény a következő függvény? 0 x 0 [x] F(x) = 2 0 < x 2 ahol [x]: x egészrésze 1 2 < x E14.) Eloszlásfüggvény a következő függvény? Ha igen, van sűrűségfüggvénye? { 1 9 ha x > 3 F(x) = x 2 0 ha x 3 Határozzuk meg a következő értékeket: P(X = 4) P(2 < X < 4) P(X > 4) EX EX 5 Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 15 / 45

Feladatok E15.) Határozzuk meg az alábbi nevezetes abszolút folytonos eloszlások várható értékét és szórását: a.) egyenletes; b.) exponenciális; c.) standard normális. E16.) Mely c-re { lesz kétdimenziós sűrűségfüggvény az alábbi? c(x + y) ha (x, y) (0, 2) 2 f X,Y (x, y) = 0 különben Adjuk meg a peremsűrűségfüggvényeket és a következő értékeket: P(X < 1, Y < 1) EX DY R(X, Y ) Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 16 / 45

E17.) Egy vállalatnál dolgozó alkalmazottak fizetése (e Ft-ban) a.) E(100, 400); b.) 100+Bin ( 400, 8) 3 ; c.) Exp ( 1 250) eloszlást követ. Becsüljük meg a centrális határérték-tétellel annak a valószínűségét, hogy az alkalmazottak átlagfizetése nagyobb 300 ezer Ft-nál, ha a vállalatnál n = 10, 20, 50, 100, 200 ember dolgozik! Vessük ezt össze a tényleges valószínűségekkel! E18.) Nagyon sokszor dobálva egy szabályos kockával, hova tart (és milyen értelemben) a dobások átlagos értéke? Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 17 / 45

E19.) Adott egy X valószínűségi változó. Célunk a p = P(X A) valószínűség becslése. Ennek érdekében az X-et generáló véletlen kísérletet N alkalommal egymástól függetlenül megismételjük, így N adódó természetes becslés: ˆp = 1 N I(X i A). a.) Határozzuk meg a becslés várható értékét és szórását! b.) Mennyire pontos a becslés? Becsüljük a P( p ˆp < ε) valószínűséget a Csebisev-egyenlőtlenséggel és a centrális határeloszlás-tétellel, ha ε > 0 kicsi valós szám! c.) Legyen α > 0 kicsi valós szám. Hányszor hajtsuk végre a kísérletet, hogy P( p ˆp < ε) 1 α teljesüljön? i=1 Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 18 / 45

E20.) Legalább hány embert kell megkérdezni egy közvélemény-kutatásnál, ha egy 10%-os párt támogatottságát (az eltérést a várható támogatottságtól) legalább 95%-os valószínűséggel 0,01-nél kisebb eltéréssel szeretnénk megbecsülni? a.) Számoljunk a Csebisev-egyenlőtlenséggel! b.) Számoljunk a centrális határeloszlás-tétellel! c.) Szimulációval nézzük meg, hogy hány embert kell megkérdezni különböző támogatottságú pártok esetén! Megkérdezendo emberek száma 0 10000 30000 50000 Csebisev CHT 0.0 0.2 0.4 0.6 0.8 1.0 Párt támogatottsága Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 19 / 45

A statisztika fogalma és ágai Statisztika: a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység. Ágai: Leíró statisztika: magában foglalja az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket Matematikai statisztika: matematikai tudomány, a valószínűségi változókkal jellemezhető jelenségek leíró adatainak feldolgozásáról, értelmezéséről és felhasználásáról szóló tudományos módszertan Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 20 / 45

Leíró statisztikai alapfogalmak I. Statisztikai egység: a statisztikai vizsgálat tárgyát képező egyed Statisztikai sokaság: a megfigyelés tárgyát képező egyedek összessége, halmaza. Röviden: sokaság. Példák: a magyar társadalom, a Ferrari tulajdonosok. Statisztikai ismérv: a sokaság egyedeit jellemző tulajdonság. Röviden: ismérv. Ismérvváltozatok: az ismérvek lehetséges kimenetelei. Például ha az ismérv a hallgatók neme, akkor az ismérvváltozatok: fiú ( 1), lány ( 0). Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 21 / 45

Leíró statisztikai alapfogalmak II. Az ismérvek típusai I. minőségi ismérv: az egyedek számszerűen nem mérhető tulajdonsága mennyiségi ismérv: az egyedek számszerűen mérhető tulajdonsága. Két fajtájukat különböztetjük meg: diszkrét: véges vagy megszámlálhatóan sok értéket vehet fel folytonos: egy adott intervallumon belül kontinuum számosságú értéket felvehet időbeli ismérv: az egységek időbeli elhelyezésére szolgáló rendezőelvek területi ismérv: az egységek térbeli elhelyezésére szolgáló rendezőelvek Az ismérvek típusai II. közös ismérvek: tulajdonságok, amik szerint a sok. egyedei egyformák megkülönböztető ismérv: azok a tulajdonságok, amik szerint a sokaság egyedei különböznek egymástól Legyen a sokaság: szobában lévő hallgatók. Példák ismérvekre: minőségi: szemszín, nem közös: orrok száma diszkrét mennyiségi: testvérek száma megkülönböztető: testsúly folytonos mennyiségi: testmagasság időbeli: születési idő területi: születési hely Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 22 / 45

Leíró statisztikai alapfogalmak III. Mérési skálák (mérési szintek): Névleges (nominális): a számok csak ún. kódszámok, amik a sokaság egyedeinek azonosítására szolgálnak. Ezek között matematikai relációkat és műveleteket nincs értelme végezni. Pl. a hallgatók neme. Sorrendi (ordinális): a sokaság egyedeinek valamely tulajdonság alapján sorba való rendezése. Az egyedek tulajdonsága közötti különbséget nem lehet mérni. Pl. a hallgatók jegyei egy tárgyból. Intervallumskála: a skálaértékek különbségei is valós információt adnak a sokaság egyedeiről. A skálán a nullpont meghatározása önkényes. Ilyen skálákhoz mértékegység is tartozik. Pl. hőmérséklet. Arányskála: a skálának van valódi nullpontja is. Minden matematikai művelet elvégezhető ezekkel a számokkal. Pl. a hallgatók magassága. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 23 / 45

Leíró statisztikai alapfogalmak IV. Statisztikai sor: a sokaság egyes jellemzőinek felsorolása. Az ismérvek fajtája szerint beszélhetünk minőségi, mennyiségi, időbeli és területi sorokról. A statisztikai sorok további csoportosítása: Csoportosító sor: a sokaság egy megkülönböztető ismérv szerinti osztályozásának eredménye; az adatok összegezhetők (van Összesen sor) Összehasonlító sor: a sokaság egy részének a sokaságot egy megkülönböztető ismérv szerinti osztályozásának eredménye; az adatok nem összegezhetők Leíró sor: különböző fajta, gyakran eltérő mértékegységű statisztikai adatokat tartalmaz Például ha egy statisztikai sor tartalmazza az osztályteremben a hallgatókat nemek szerint, akkor ez a sor minőségi csoportosító sor. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 24 / 45

Leíró statisztikai alapfogalmak V. Statisztikai tábla: a statisztikai sorok összefüggő rendszere. A statisztikai táblák fajtái: Egyszerű tábla: nem tartalmaz csoportosítást, nincs benne összegző sor Csoportosító tábla: egyetlen csoportosító sort tartalmaz Kombinációs vagy kontingenciatábla: legalább két csoportosító sort tartalmaz Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 25 / 45

Leíró statisztikai alapfogalmak VI. Statisztikai adat: valamely sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési eredmény. A statisztikai adatok fajtái: Alapadatok: közvetlenül a sokaságból származnak (méréssel, megszámlálással) Leszármaztatott adatok: alapadatokból műveletek eredményeként adódnak (pl. átlagolással, osztással) A statisztikai adatok nem mindig pontosak a mért és a tényleges adat eltérhet egymástól, például kerekítési okokból. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 26 / 45

Leíró statisztikai alapfogalmak VII. A statisztikai elemzések egyik lefontosabb eszközei a viszonyszámok (néha: indikátorok). A viszonyszám két statisztikai adat hányadosa. Jelölések: V = A B, ahol V : viszonyszám; A: a viszonyítás tárgya; B: a viszonyítás alapja. A viszonyszámok fajtái: Megoszlási: a sokaság egy részének a sokaság egészéhez való viszonyítása Koordinációs: a sokaság egy részénak a sokaság egy másik részéhez való viszonyítása Dinamikus: két időpont vagy időszak adatának hányadosa Intenzitási: különböző fajta adatok viszonyítása egymáshoz; gyakran a mértékegységük is eltérő. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 27 / 45

E21.) Egy vállalatnak 10 telephelye van. Három telephely dolgozóinak megoszlása életkor szerint: Életkor (év) 2. telephely 8. telephely 9. telephely 18 30 20 20 30 31 40 20 30 20 41 50 20 30 50 50 62 20 20 10 Összesen 80 100 110 Milyen típusú a tábla és milyen típusú sorokat tartalmaz? Határozd meg a táblázatbeli csoportosítás alapját képző ismérvek típusát és azok mérési skáláját! E22.) Az alábbi mondatokban milyen viszonyszámok rejtőznek? Azok milyen típusúak? Add meg kiszámításuk pontos képletét! a.) Egy 25 fős csoportban a lányok részaránya 40%. b.) Idén 180, a tavalyihoz képest 10%-kal kevesebb hallgató vette fel a Diszkrét matematika tantárgyat. c.) Marika összesen 2000 km-es nyaralása alatt autója átlagfogyasztása 8 l/100 km volt. d.) Az ELTE-n 4000 diák van, az egy tanárra jutó diákok száma 20. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 28 / 45

A statisztikai elemzés lépései 1.) Tervezés a.) Mit vizsgálunk b.) Hogyan gyűjtjük az adatokat c.) Előzetes sejtések, hipotézisek megfogalmazása 2.) Terepmunka adatgyűjtés 3.) Adatbevitel, kódolás (ha szükséges) 4.) Adatok validálása (biztosan rossz értékek kiszűrése, mint például életkornál a 9999) 5.) Adatelemzés, adatellenőrzés: leíró statisztikákkal, grafikonok készítése 6.) Hibás adatok kijavítása vagy kihagyása 7.) Adatelemzés, statisztikai következtetések levonása a matematikai statisztika módszereivel 8.) Az eredmények értelmezése, visszacsatolás Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 29 / 45

Fontos leíró statisztikai ábrák I. Interkvartilis terjedelem: IQR = Q 3 Q 1 Boxplot ábra (Box&Whiskers diagram) ez fekvő, de lehet álló is ahol a betűk a következő értékeket jelentik: A = max{x 1, Q 1 1, 5 IQR} B = Q 1 C = Me D = Q 3 E = min{x n, Q 3 + 1, 5 IQR} F: kieső érték (outlier) azokat az adatpontokat tüntetjük fel, amik A-n vagy E-n kívülre esnek Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 30 / 45

Fontos leíró statisztikai ábrák II. Hisztogram Ha a mennyiségi ismérv folytonos vagy sok ismérvérték van, akkor alkalmas módon osztályokat képezünk, majd minden egyes adatot pontosan egy osztályhoz rendeljük. A hisztogram az osztályok gyakoriságait ábrázolja. A számítás lépései (hüvelykujjszabályként használható): az osztályok száma: k = min{k : 2 k > n} ha azonos hosszúságú (h) osztályközöket akarunk létrehozni, akkor h = x n x 1 k az i. osztályba esés gyakorisága: f i Gyakoriságok 0 1 2 3 4 5 12 14 16 18 20 22 Lemerülési ido (óra) Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 31 / 45

E23.) Azonos felhasználási körülmények között megmérték 15 azonos típusú mobiltelefon akkumulátorának lemerülési idejét teljes feltöltöttségről: (óra) 18 16 15 20 12 16-15 23 14 11 17 15 200 19 18 20 a.) Nézd át nagy vonalakban az adatokat, reálisak-e! Próbáld meg kijavítani az esetleges adathibákat! b.) Ábrázold a tapasztalati eloszlásfüggvényt! Számítsd ki és értelmezd a 16 helyen! c.) Elemezd a lemerülési időt az alapstatisztikák: az átlag, a korrigált tapasztalati szórás, szórási együttható és boxplot ábra (kvartilisek) segítségével! Értelmezd is az eredményeket! d.) Készíts alkalmas sávszélességű hisztogramot! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 32 / 45

Megoldás (értelmezések) a.) Adatjavítás: -15 és 200, a helyes értékek vélhetően 15 és 20 b.) Az akkumulátorok 3/8-ad része 16 óránál hamarabb merült le. c.) Az akkumulátorok átlagosan 16,8 óra alatt merültek le. Az egyes akkumulátorok lemerülési ideje az átlagos lemerülési időtől átlagosan 3,19 órával, azaz 18,96%-kal tért el. Az akkumulátorok negyede (25%-a) legfeljebb 15 óra alatt lemerült, míg háromnegyede legalább 15 órán keresztül ébren volt. Az akkumulátorok fele (50%-a) legfeljebb 16,5 óra alatt lemerült, míg háromnegyede legalább 16 és fél órán keresztül ébren volt. Az akkumulátorok háromnegyede (75%-a) legfeljebb 19,75 óra alatt lemerült, míg háromnegyede legalább 19,75 órán keresztül ébren volt. Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 33 / 45

E24.) LeBron James a 2013/14-es szezonban 100 szabaddobásából 75-öt dobott be. Célunk ezen információ alapján annak a becslése, hogy James egy mérkőzése alatt egy szabaddobást milyen valószínűséggel dob be. a.) Adjuk meg a mintateret és a paraméterteret! b.) Adjunk torzítatlan becslést az ismeretlen paraméterre! c.) Határozzuk meg az ismeretlen paraméter maximum likelihood becslését, majd tegyük torzítatlanná! d.) Határozzuk meg az ismeretlen paraméter momentum-becslését! E25.) Minden nap a Mester utca megállónál szállok fel a 4-es/6-os villamosok valamelyikére. E hét munkanapjain az alábbi várakozási időket mértem (perc): 1,2 2 1,5 3 2,1 A várakozási időről tegyük fel, hogy exponenciális eloszlású. a.) Adjuk meg a mintateret és a paraméterteret! b.) Határozzuk meg az ismeretlen paraméter maximum likelihood becslését! c.) Határozzuk meg az ismeretlen paraméter momentum-becslését! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 34 / 45

E26.) Legyen X 1,..., X n független, azonos abszolút folytonos eloszlású valószínűségi változók sorozata. Adjuk meg X 1 és X n eloszlás- és sűrűségfüggvényét! E27.) Egy véletlen szám generátorral 20 véletlen számot állítunk elő egy ismeretlen (a, b) intervallumból. A kapott véletlen számok sorrendbe téve és (egyszerűség kedvéért) egészre kerekítve: 10 11 12 13 13 14 17 19 21 22 23 24 25 27 31 31 32 35 36 38 a.) Adjuk meg a mintateret és a paraméterteret! b.) Határozzuk meg az ismeretlen paraméterek maximum likelihood becslését! c.) Tegyük torzítatlanná az ML-becsléseket! d.) Határozzuk meg a paraméterek momentum-becslését! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 35 / 45

Q-Q plot Illeszkedésvizsgálat "szemmel" Az illesztett eloszlás kvantiliseit vetjük össze a tapasztalati kvantilisekkel, azaz a következő pontokat ábrázoljuk: ( F 1 ( k n+1 ), x k ) ahol F: az illesztett eloszlás k = 1,..., n eloszlásfüggvénye xk a k. rendezett mintaelem Be szokták húzni a 45 fokos egyenest és minél jobban rásimulnak a pontok az egyenesre, annál jobbnak tekinthető az illeszkedés. Nem helyettesíti a statisztikai próbákat Sample Quantiles Sample Quantiles 3 1 1 2 3 0 1 2 3 4 5 3 2 1 0 1 2 3 Theoretical Quantiles 3 2 1 0 1 2 3 Theoretical Quantiles Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 36 / 45

Hipotézisvizsgálat menete I. 1.) Elsőfajú hiba (α) valószínűségének lefixálása, ami jellemzően 1% és 10% közötti, tipikusan 5% Megbízhatóság=1-α, általában %-osan írjuk 2.) Nullhipotézis (H 0 ) felírása sokévi, megszokott, elvárt értékeknek megfelelő paramétertartomány 3.) Alternatív hipotézis (H 1 ) felírása a minta alapján bennünket érdeklő kérdésnek megfelelő paramétertartomány 4.) A probléma megoldására alkalmas próba vagy próbák kiválasztása feltételek ellenőrzése 5.) Próbastatisztika kiszámítása 6.) Kritikus érték kiszámítása, kritikus tartomány (X k ) megállapítása 7.) Döntés: x X k erős döntés, H 1 -et elfogadjuk, H 0 -t elvetjük/elutasítjuk x X e gyenge döntés, H 1 -et elutasítjuk, H 0 -t nem tudjuk elutasítani Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 37 / 45

Hipotézisvizsgálat menete II. 1.) Elsőfajú hiba (α) valószínűségének lefixálása 2.) Nullhipotézis (H 0 ) felírása 3.) Alternatív hipotézis (H 1 ) felírása 4.) A probléma megoldására alkalmas próba vagy próbák kiválasztása 5.) Számítógéppel dolgozva, az előző fólián lévő 5.)-6.)-7.) helyett dönthetünk az ún. p-érték alapján is: p-érték < α x X k H 1 -et elfogadjuk p-érték: azon elsőfajú hiba valószínűség, amire a kritikus érték megegyezik a próbastatisztikával Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 38 / 45

E28.) Egyre több problémát okoz, hogy hackerek megszerzik valaki jelszavát, és így titkos információk kerülnek ki. Informatikus kollégánknak az jut az eszébe, hogy ne csak a leütött karakterek helyességét ellenőrizzük, hanem azt is, hogy az egyes karaktereket milyen gyorsan üti le a jelszó valódi tulajdonosa. A vállalat igazgatója 10 karakteres jelszóval rendelkezik, a begépelés során az egyes karakterek leütése közti idők az alábbiak (mp): 0,14 0,2 0,21 0,23 0,18 0,4 0,31 0,24 0,29 Tegyük fel, hogy a leütési időközök normális eloszlást követnek. a.) Vizsgáljuk meg Q-Q plot segítségével, hogy a minta normális eloszlásúnak tekinthető-e! b.) Adjunk 95%-os megbízhatóságú konfidenciaintervallumot a leütési időközök várható értékére és szórására! c.) Vizsgáljuk meg azt a hipotézist, hogy a leütési időközök várható értéke meghaladja-e a 0,2 mp-et (és a 0,18 mp-et?)! d.) A rendszerbe éjjel 2-kor lépnek be az igazgató jelszavával, a következő leütési időközöket regisztráltuk (mp): 0,2 0,23 0,25 0,2 0,28 0,44 0,35 0,3 0,49 Döntsünk arról a hipotézisről, hogy vajon feltörték-e a jelszót! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 39 / 45

E29.) Valaki azt állítja, hogy a klíma változik, és ezt azzal véli bizonyítottnak, hogy az elmúlt 10 évben 2-szer is volt jégeső december 2-án, pedig korábban az egyes évekre a jégeső valószínűsége a hivatalos adatok alapján csupán p = 0, 1 volt. Írjuk fel a hipotéziseket, a próbát és állapítsuk meg az elsőfajú hiba valószínűségét, valamint az erőfüggvényt a p = 0, 2 pontban! E30.) Egy gyártó megfigyelte, hogy 100, általa előállított SSD merevlemezen 5 év használat után hány hibás szektort talál az ezek felkutatására készített szoftver: Hibás szektorok száma 0 1 2 3 4 5 7 Összesen Gyakoriságok 45 35 12 5 1 1 1 100 Vizsgáljuk meg, hogy a szektorhibák száma Poisson-eloszlást követ-e! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 40 / 45

E31.) Egy webtervező azt gyanítja, hogy az általa létrehozott internetes vásárlás honlapján a vásárlások mértéke összefügg azzal, hogy milyen nap van a héten. Ennek a sejtésnek az ellenőrzésére egy héten kereszül adatokat gyűjt összesen 3758 látogatót számlált meg: Vásárlás H K Sz Cs P Sz V Össz. Nem vásárolt 399 261 284 263 393 531 502 2633 1 vásárlás 119 72 97 51 143 145 150 777 Több vásárlás 39 50 20 15 41 97 86 348 Összesen 557 383 401 329 577 773 738 3758 Alkalmas statisztika próbával döntsünk arról, hogy helyes-e a webtervező sejtése! Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 41 / 45

E32.) Regresszió Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 42 / 45

Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 43 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Néhány híres idézet a statisztikáról: Winston Churchill (Goebbels?): "Csak annak a statisztikának hiszek, amit én magam hamisítottam." Mark Twain (Disraeli?): "Van kis hazugság, van nagy hazugság és vannak a statisztikák." Joszif Sztálin: "Egyetlen ember halála tragédia, milliók halála csak egy statisztika." Alphonse Allais (francia író volt): "Statisztikusok kimutatták, hogy a háborúk alatt érzékelhetően megnő a halálozás a katonaságnál." Ben Bernanke (az USA központi bankjának elnöke volt 2006 és 2014 között): "Az aggregált statisztikák lényeges információkat rejthetnek el." "Statistics are used much like a drunk uses a lamppost: for support, not illumination." Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 44 / 45

Konzultációs és vizsgaidőpontok Megnevezés Nap Időpont Hely pótzh dec. 14.,hétfő 16:00 0-805 1. vizsga dec. 21., hétfő 16:00 0-803 konzultáció/megtekintés jan. 6., szerda 16:00 3-309 2. vizsga jan. 7., csütörtök 16:00 0-803 konzultáció/megtekintés jan. 20., szerda 16:00 3-309 3. vizsga jan. 21., csütörtök 16:00 0-803 konzultáció/megtekintés jan. 27., szerda 16:00 3-309 4. vizsga: UV jan. 28., csütörtök 16:00 0-803 megtekintés jan. 29., péntek 16:00 3-309 Varga László (ELTE) Valószínűségszámítás és statisztika 2015. december 3. 45 / 45