1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

Hasonló dokumentumok
Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Statisztika október 27.

Matematikai statisztika

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

Statisztika 1. zárthelyi dolgozat március 21.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Matematika B4 I. gyakorlat

Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/ félév Arató Miklós

BIOMATEMATIKA ELŐADÁS

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Kutatói pályára felkészítı modul

A matematikai statisztika elemei

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Statisztika. Eloszlásjellemzők

1. A radioaktivitás statisztikus jellege

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Biomatematika 2 Orvosi biometria

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika 1. zárthelyi dolgozat március 18.

VII. A határozatlan esetek kiküszöbölése

Microsoft Excel Gyakoriság

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Matematikai statisztika

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

18. modul: STATISZTIKA

Statisztikai hipotézisvizsgálatok

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

1. elıadás: Bevezetés. Számonkérés. Irodalom. Valószínőségszámítás helye a tudományok között. Cél

Sta t ti t s i zt z i t k i a 3. előadás

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Kutatásmódszertan és prezentációkészítés

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

A brexit-szavazás és a nagy számok törvénye

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Segítség az outputok értelmezéséhez

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

Matematikai statisztika

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Bevezető Mi a statisztika? Mérés Csoportosítás

Gyakorló feladatok II.

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

6. feladatsor. Statisztika december 6. és 8.

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

2. előadás. Viszonyszámok típusai

Statisztikai alapfogalmak

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Elemi statisztika fizikusoknak

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

[GVMGS11MNC] Gazdaságstatisztika

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

A statisztika részei. Példa:

Egy lehetséges tételsor megoldásokkal

Méréstani összefoglaló

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Statisztika I. 2. előadás. Előadó: Dr. Ertsey Imre

V. Deriválható függvények

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

STATISZTIKA. Gyakorló feladatok az első zh-ra

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Populáció nagyságának felmérése, becslése

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

Feladatok és megoldások a 11. heti gyakorlathoz

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

matematikai statisztika

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

A Statisztika alapjai

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR

Minta JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A MATEMATIKA EMELT SZINTŰ ÍRÁSBELI 2. FELADATSORHOZ

2. fejezet. Számsorozatok, számsorok

Átírás:

Matematikai statisztika előadás survey statisztika MA szakosokak 206/207 2. félév Zempléi Adrás. előadás: Bevezetés Irodalom, követelméyek A félév célja Matematikai statisztika tárgya Törtéet Alapfogalmak Irodalom Jegyzet Korpás Attiláé: Általáos Statisztika I-II Taköyv Bolla-Krámli: Statisztikai következtetések elmélete R.A.Johso-G.K. Bhattacharyya: Statistics Példatár Móri-Szeidl-Zempléi: Matematikai statisztika példatár Program: R Számokérés A tárgy felvételéhez a valószíűségszámítás c. tárgy elvégzése szükséges Vizsga: írásbeli, később egyeztetedő időpotba, az előző félévhez hasolóa Lehet vizsgapotot szerezi az előadásoko is (írásba, villámkérdések megválaszolásával) A potszám 30%-át a kozultációs gyakorlato megíradó dolgozattal lehet megszerezi Cél Matematikai statisztika alapjaiak ismertetése Leíró statisztika Becsléselmélet Hipotézisvizsgálat Alkalmazási készség kialakítása A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia (közvéleméykutatások) Természettudomáyok Meteorológia (pl. klímaváltozás) Geetika (chiptechológia) Pézügyi adatok stb.

Törtéet Népszámlálások már az ókorba is voltak Táblázatokat a biztosítók már többszáz éve haszálak Maga a tudomáy fiatal tudomáy, alig 00 éves a múltja Agliai mezőgazdasági alkalmazások voltak az elsők Fejlődése felgyorsult az utóbbi évtizedekbe (számítógépek jóvoltából) Statisztikai adatok Valamely sokaság jellemzőjére voatkozó mért vagy számított eredméy Alapadat: közvetleül a sokaságból méréssel vagy leszámlálással kapott eredméy Származtatott adat: alapadatokból műveletek eredméyekét kapjuk Alapadatok Legyeek potosak Álljaak időbe redelkezésre Legyeek költséghatékoyak Forrásuk: Kimutatások, yilvátartások Adatgyűjtések (teljes körű vagy részleges) Az adatok potossága Általába korlátozott a potosságuk Abszolút hiba: ε= V-M ahol V a valóságos adat és M a mért adat. Gyakorlatba em tudjuk meghatározi, ezért felső becslést aduk rá. Megadható úgy is, hogy csak a szigifikás számjegyek jeleek meg az adatba. Relatív hiba: az abszolút hiba és a mért érték háyadosa: ε/m Statisztikai ismérvek A sokaság egyedeit jellemző tulajdoság. Lehetséges kimeetelei az ismérvváltozatok. Az ismérvek által adott iformációk alapjá az ismérvek lehetek: Időbeliek Területiek Meyiségiek Miőségiek. Adatok típusai (skálák) Nomiális: csak gyakoriságot tuduk számoli (em, foglalkozás, emzetiség): miőségi ismérv Ordiális (redezett): pl. értékelés szavakkal (rossz-közepes-jó), sorred egyértelmű, kvatilisek számolhatók Itervallum (pl. hőmérséklet: külöbség egyértelmű, de háyados em) Aráy (itt mide matematikai művelet értelmes), ez szerecsére a leggyakoribb 2

Populáció Azo egyedek összessége, akikről iformációt szereték gyűjtei (pl. Budapest lakói) Elvileg lehetséges a teljeskörű felmérés, de a gyakorlatba legikább mitákkal dolgozuk A mita: a téylegese összegyűjtött adatok összessége Adatok (matematikai defiíció) Mitavétel a populációból: eredméye a (statisztikai) mita A mitavétel módja is léyeges (legegyszerűbb eset: bármelyik elem ugyaakkora valószíűséggel kerül a mitába) A mitavétel eredméye: (statisztikai) mita: x,x 2,,x (számsorozat) Ugyaakkor egy másik, hasoló mitavételél más mitát kapák, azaz az adott mita véletle kísérlet eredméye. Ha a mita véletle jellegét vizsgáljuk: X,X 2,,X valószíűségi változó-sorozat. Léyeges külöbség a valószíűségszámításhoz képest: az eloszlása em (vagy csak részbe) ismert. Matematikai statisztika helye a tudomáyok között Matematikai tudomáy, mert a valószíűségszámítás eredméyeire épül. Ugyaakkor a statisztika mideapi alkalmazása em midig kellőe precíz (teljesülek-e a feltételek?) Ezért léyeges, hogy a valószíűségszámítási eredméyeket alkalmazva fogalmazzuk meg következtetéseiket. Példák. Egy hóapba 0 hurrikát figyeltük meg. Mit godoluk, meyi hurriká lesz jövőre ugyaebbe a hóapba? 2. Egy közvéleméykutatás sorá azt kaptuk, hogy 000 emberből 400 választaá az adott pártot. Mások szerit a párt 50%-ot fog kapi. Előfordulhat-e ez? Mekkora eséllyel? Statisztikai elemzés lépései Tervezés (mit vizsgáluk, hogya gyűjtjük az adatokat) Adatgyűjtés Kódolás (ha szükséges) Elleőrzés: leíró statisztikákkal Elemzés: matematikai statisztika módszereivel Leíró statisztika Nem a véletle hatását vizsgálja, haem a kokrét mita megjeleítése, jellemzőiek kiszámítása a feladata. Adatok elredezhetők táblázatba (fotos: forrás feltütetése), illetve ábrázolhatók grafikusa. 3

Statisztikai táblák Megfelelő formával ellátott statisztikai sorok összefüggő redszere Cél: tömör, számszerű jellemzés Egyszerű tábla: leíró sorokból áll Csoportosító táblák: tartalmazak összesítő rovatot is (lehet beük összehasolítás is) Kombiációs vagy kotigeciatábla: két ismérv szeriti kombiációs csoportosítás. Midkét iráyba tartalmaz összesítést. Csoportosító táblázatok Gyakra szükség va csoportosításra Sok adat Természetes ismérv-csoportok Felosztás a megkülöböztető ismérv szerit, sok ismérvváltozat eseté osztályozás kell Eredméy: egy ismérv szeriti csoportosító táblázat Tartalmazhat gyakoriságot vagy relatív gyakoriságot Osztály Megfigyelések száma O f O k f k Összese N Tapasztalati eloszlás Mide megfigyeléshez (x,x 2,,x ) / súlyt redel. Valószíűségeloszlás! Mitaátlag éppe eek az eloszlásak a várható értéke. Tapasztalati eloszlás eloszlásfüggvéye: tapasztalati eloszlásfüggvéy: F (lépcsősfüggvéy). F (z)=k/, ( ) ( ) ha x () 0 =-, x () x + = k z xk Ha a mita X,X 2,,X valószíűségi változó-sorozat, F (z) is valószíűségi változó. a/ 0.0 0.2 0.4 0.6 0.8.0 Példa ormális eloszlás közelítése, =0 30 40 50 60 70 z a/ 0.0 0.2 0.4 0.6 0.8.0 ormális eloszlás közelítése, =00 30 40 50 60 70 z Kumulált gyakorisági sorok Táblázatos megfelelője a tapasztalati eloszlásfüggvéyek: megadja, hogy az adott osztályköz felső határáak megfelelő és aál kisebb értékek háyszor (ill. milye aráyba) fordulak elő. Lehet lefele is kumuláli: az adott osztályköz alsó határáak megfelelő és aál agyobb értékek háyszor (ill. milye aráyba) fordulak elő. Értékösszegsor Az osztályokhoz az azokba tartozó megfigyelések ismérvértékeiek az összegét redeli Ha a gyakorisági sor osztályközökkel va megadva és csak a megoszlás ismert, akkor becsüljük (osztályközép és gyakoriság szorzata). Lehet relatív értékösszegsort is képezi (a teljes értékösszeggel elosztva az osztályok értékösszegét) 4

Grafikus ábrázolás Oszlopdiagram: a gyakoriságokkal aráyos az oszlopok magassága Meyiségi ismérvekre: Gyakorisági poligo Hisztogram Megoszlás szemléltetése lehetséges kördiagrammal is. Hisztogram (meyiségi ismérvekre) Adataikat osztályokba soroljuk (midegyiket potosa egybe, pl. az i-edik osztály: a i x<a i+ ), a csoportok relatív gyakoriságai (r i ) megegyezek az osztály fölé rajzolt téglalap területével, tehát a téglalap magassága m i = r i /(a i+ -a i ). Összterület: (hasoló a sűrűségfüggvéyhez) Potszámok grafikus ábrázolása Frequecy 0 0 20 30 40 Példák Túl sok osztály Potszámok grafikus ábrázolása 20 30 40 50 60 70 80 potszám Frequecy 0 50 00 50 200 250 300 350 Túl kevés osztály Potszámok grafikus ábrázolása 20 30 40 50 60 70 80 90 potszám Példák Jó osztályszám Frequecy Lehet általáos formulát is készítei, -/3 - al aráyos itervallumszám az opt. 0 50 00 50 200 20 30 40 50 60 70 80 potszám Gyakorló példák. Tegyük fel, hogy a mitákba szereplő 4 ember életkora a következő: 2,35,45,6. Rajzoljuk fel a tapasztalati eloszlásfüggvéyt! 2. Tegyük fel, hogy az alábbi, csoportosított adataik vaak. Számítsuk ki a mitába az átlagos életkort. Ábrázoljuk az adatokat hisztogrammal. életkor 20-30 30-40 40-70 gyakoriság 5 7 8 Középértékek: átlag Mitaátlag: x... x x : ha az egyes értékek (l i ) gyakoriságai (f i ) adottak: x Ha csak az osztályközökbe eső értékek gyakoriságát ismerjük, az egyes értékeket becsüljük az osztályközéppel és alkalmazzuk az előző képletet. fl... fkl : k 5

Mediá A sorbaredezett mita középső eleme (ha páros sok eleme va: a két középső átlaga). Közelítés osztályközös gyakoriságokra: f ' me Me x 2 l h f x : l a mediát magába foglaló osztály alsó határa f me : kumulált gyakoriság a mediát megelőző osztályig bezárólag f me : a mediát magába foglaló osztály gyakorisága h: a mediát magába foglaló osztály szélessége. : a mita elemszáma me Módusz A leggyakoribb (tipikus) érték. Az eloszlás lehet uimodális, bimodális vagy polimodális (egy-, két- vagy többmóduszú). Meghatározása: A gyakorisági poligo maximumhelye (a modális osztályköz középértéke). Közelítése em szimmetrikus esetbe Mo x mo f0 f0 2 f0 f0 f0 Ahol x mo a móduszt tartalmazó osztály alsó határa f 0 a móduszt tartalmazó osztály gyakorisága f 0- a móduszt tartalmazó osztályt megelőző osztály gyakorisága f 0+ a móduszt tartalmazó osztályt követő osztály gyakorisága h a móduszt tartalmazó osztály szélessége h Tapasztalati kvatilisek Elméleti kvatilis: abszolút folytoos, szigorúa mooto F eseté q z =F - (z) Általába: if{x:f(x)>z} A tapasztalati eloszlás kvatilisei: tapasztalati kvatilisek. Esetleg lieáris iterpolációval lehet potosítai a becsléseiket. z=/2: mediá. z=/4, 3/4: kvartilisek Kvatilisek kiszámítása Osztályközös gyakorisági sorból p f Qp xi f i ' i Ahol x i a kvatilist tartalmazó osztály alsó határa a mita elemszáma f i- kumulált gyakoriság a kvatilist tartalmazó osztályt megelőző osztállyal bezárólag f i a kvatilist tartalmazó osztály gyakorisága h i a kvatilist tartalmazó osztály szélessége h i Alapstatisztikák grafikus megjeleítése Az egyes dobozok az alsó kvartilistól Gam2 a felső kvartilisig tartaak. Középvoal a mediá. T5 A voalak a teljes terjedelmet Norm felölelik, ha ez az egyes iráyokba em agyobb a kvartilisek közötti külöbség.5- Ui05 boxplot szereséél. Ha eze kívül is vaak potok, azokat külö-külö jeleíti meg. -4-2 0 2 4 6 6