Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Hasonló dokumentumok
Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Statisztika október 27.

Statisztika 1. zárthelyi dolgozat március 21.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Matematikai statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

BIOMATEMATIKA ELŐADÁS

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Matematika B4 I. gyakorlat

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Kutatói pályára felkészítı modul

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Komputer statisztika

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Gyakorló feladatok II.

1. A radioaktivitás statisztikus jellege

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Statisztika 1. zárthelyi dolgozat március 18.

fogalmazva a nagy számok törvénye azt mondja ki, hogy ha vesszük n független és

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

A matematikai statisztika elemei

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

3.1. A Poisson-eloszlás

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

A brexit-szavazás és a nagy számok törvénye

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

Valószínűségszámítás alapjai szemléletesen

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév

VII. A határozatlan esetek kiküszöbölése

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Lajkó Károly Kalkulus I. példatár mobidiák könyvtár

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Nevezetes sorozat-határértékek

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Matematika I. 9. előadás

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

2. fejezet. Számsorozatok, számsorok

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli tételek. Készítette: Szántó Ádám Tavaszi félév

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Statisztikai hipotézisvizsgálatok

? közgazdasági statisztika

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Fourier sorok FO 1. Trigonometrikus. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

Metrikus terek. továbbra is.

Valószínűségszámítás

Statisztika gyakorlat Geológus szakirány

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

V. Deriválható függvények

A statisztika részei. Példa:

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Függvényhatárérték-számítás

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

ANALÍZIS I. TÉTELBIZONYÍTÁSOK ÍRÁSBELI VIZSGÁRA

min{k R K fels korlátja H-nak} a A : a ξ : ξ fels korlát A legkisebb fels korlát is:

(d) x 6 3x 2 2 = 0, (e) x + x 2 = 1 x, (f) 2x x 1 = 8, 2(x 1) a 1

Wiener-folyamatok definiciója. A funkcionális centrális határeloszlástétel. Norbert Wienerre, a második pedig egy Brown nevű XIX. században élt angol

Hajós György Versenyre javasolt feladatok SZIE.YMÉTK 2011

Egy lehetséges tételsor megoldásokkal

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

FELADATOK A KALKULUS C. TÁRGYHOZ

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Analízis I. gyakorlat

1. elıadás: Bevezetés. Számonkérés. Irodalom. Valószínőségszámítás helye a tudományok között. Cél

3. Valószínűségszámítás

Diszkrét matematika II., 3. előadás. Komplex számok

1 n. 8abc (a + b) (b + c) (a + c) 8 27 (a + b + c)3. (1 a) 5 (1 + a)(1 + 2a) n + 1

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

10.M ALGEBRA < <

A primitív függvény létezése. Kitűzött feladatok. határérték, és F az f egy olyan primitívje, amelyre F(0) = 0. Bizonyítsd be,

2.1. A sorozat fogalma, megadása és ábrázolása

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

2. gyakorlat - Hatványsorok és Taylor-sorok

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

18. Differenciálszámítás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

Átírás:

Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 5. Megjegyzések. A tétel feltételei gyegíthetőek: elég, ha a függetle, azoos eloszlású változók várható értéke véges. Az állítás is erősíthető: valószíűségű kovergecia is bizoyítható. Ez azt jeleti, hogy P{: (X +X + +X )/ m} =. Ha =[0,] és P(A) az A hossza, akkor az valószíűségű kovergecia léyegébe a szokásos potokéti kovergecia. Ez em következik a sztochasztikus kovergeciából. A törvéy em jeleti azt, hogy az eddig em szerepelt értékek a jövőbe a vártál gyakoribbak leszek, haem csupá az eloszlás szerit kapott agyszámú érték állítja helyre a várt gyakoriságokat. További tételek A agy számok törvéyéek legelső verzióját még Beroulli bizoyította, idikátorváltozókra: eszerit azoos körülméyek között elvégzett függetle kísérletekél tetszőleges eseméy relatív gyakorisága tart az eseméy valószíűségéhez. (Az előző speciális esete: X idikátorváltozó.) Szimuláció Gyegé összefüggő valószíűségi változókra is átvihető a tétel Valódi határeloszlások Kérdés: lehet-e emelfajult valószíűségi változó a határérték? Tétel: ha X, X,... függetle valószíűségi változók, b számsorozat, melyre b és (X +X +...+ X )/b X valószíűséggel, akkor X valószíűséggel álladó. Gyege (eloszlásbeli) kovergecia Defiíció. X X gyegé, ha az eloszlásfüggvéyeikre teljesül: F (z) F(z) az F mide folytoossági potjába. Megjegyzés. Ez a kovergecia em mod semmit a valószíűségi változók közelségéről. =[0,], P= hosszúság, X =I [0,0.5] X=I [0.5,] eseté F (z)=f(z), azaz teljesül a gyege kovergecia. A gyege kovergecia következik a sztochasztikusból. A fetiekből az is látszik, hogy a határértékek csak az eloszlása érdekes. Tulajdoságok Azt em célszerű megköveteli, hogy F mide potjába teljesüljö a kovergecia: X = -/ (az / értéket felvevő elfajult eloszlású v.v.) eseté X X= 0 valószíűséggel. F (0)=, de F(0)=0 (F balról folytoos). A többi potba teljesül a kovergecia: F (z) 0, ha z<0, F (z) =, ha z>0. Ha X X sztochasztikusa, akkor X X gyegé is.

Cetrális határeloszlás tétel Legyeek X, X,, X,... függetle, azoos eloszlású valószíűségi változók. Tegyük fel, hogy =D (X) véges (m:=e(x i )). Tekitsük a stadardizált összegüket: X... X m Z : Ekkor Z gyegé kovergál a stadard ormális eloszláshoz, azaz X... X m P z ( z ) ahol a stadard ormális eloszlás eloszlásfüggvéye. Általáosítások Ha em azoos eloszlásúak a tagok, további feltételekre (pl. magasabb mometumok létezése, hasoló agyságredű összeadadók) va szükség. Gyege összefüggőség esetére is általáosítható a tétel. Stabilis eloszlások A ormális eloszlás kitütetett szerepe azo alapult, hogy teljesítette az ú. stabilitást: ha X,Y függetle, F eloszlásfüggvéyűek, akkor tetszőleges a,b eseté megadhatók számok, hogy ax+by eloszlásfüggvéye F(z+). (Azaz ax+by ugyaabba az eloszláscsaládba tartozik, mit az összeadadók.) Belátható, hogy függetle, azoos eloszlású változók összegéek ormálás utái határeloszlása csak stabilis lehet. Ugyaakkor mide ilye stabilis eloszlás elő is áll határeloszláskét. A cetrális határeloszlás tétel következméye, hogy ics más véges szórású stabilis eloszlás. Ugyaakkor em véges szórású va: pl. a Cauchy eloszlás, melyek sűrűségfüggvéye f(x)=/(+x ) A cetrális határeloszlás tétel lokális változata Legyeek X, X,, X,... függetle, azoos eloszlású valószíűségi változók. Tegyük fel, hogy =D (X) véges (m:=e(x i )) valamit, hogy abszolút folytoosak, szakaszokét folytoos sűrűségfüggvéyel. Tekitsük a stadardizált összegüket (Z ) és tegyük fel, hogy legalább egy -re Z sűrűségfüggvéye korlátos. Ekkor a Z változó f sűrűségfüggvéye (mely a tagok abszolút folytoossága miatt létezik) kovergál a stadard ormális eloszlás sűrűségfüggvéyéhez, azaz f ( t) e t Az idikátorváltozók esete Tétel (Moivre-Laplace) Legyeek X, X,, X,... függetle, azoos p paraméterű idikátorváltozók. Ekkor Y=X +X + +X biomiális eloszlású (,p) paraméterrel. k P( Y k) p ( p) k k e p( p) ( kp) p( p) A közelítés egyeletese jó olya k értékekre, melyek legfeljebb (p(-p)) vel térek el p-től (azaz a biomiális eloszlás cetrális tagjai jól közelíthetőek a megfelelő ormális eloszlás sűrűségfüggvéyével). biomiális eloszlás A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia (közvéleméykutatások) Természettudomáyok Meteorológia (pl. klímaváltozás) Geetika (chiptechológia) Pézügyi adatok stb.

Törtéet Táblázatokat a biztosítók már többszáz éve haszálak Maga a tudomáy fiatal tudomáy, alig 00 éves a múltja Agliai mezőgazdasági alkalmazások voltak az elsők Fejlődése felgyorsult az utóbbi évtizedekbe (számítógépek jóvoltából) Populáció Az a sokaság, amiek a jellemzőire kivácsiak vagyuk. Példák: Gyártmáyok Magyarország szavazópolgárai A Ft/Euro árfolyam api változásai Legtöbbször ics mód teljes körű (00%-os) adatfelvételre. Mita A populációból kiválasztott részhalmaz, amelyre voatkozóa az adatok redelkezésre állak. Mivel a mitavétel véletle, ezért a mitaelemek valószíűségi változók. Fotos szempot a reprezetativitás. Gyakorlatba legtöbbször feltesszük, hogy a mitaelemek függetleek. Adatok Mitavétel a populációból: eredméye a (statisztikai) mita A mitavétel módja is léyeges (legegyszerűbb eset: bármelyik elem ugyaakkora valószíűséggel kerül a mitába) Példa: Nem jó, ha a büfébe kérdezzük meg a diákokat az előadásról (em lesz reprezetatív) A mitavétel eredméye: (statisztikai) mita: x,x,,x számsorozat, az X,X,,X valószíűségi változó-sorozat realizációja. Matematikai statisztika helye a tudomáyok között Matematikai tudomáy, mert a valószíűségszámítás eredméyeire épül. Ugyaakkor a statisztika mideapi alkalmazása em midig kellőe precíz (teljesülek-e a feltételek?) Ezért léyeges, hogy a valószíűségszámítási eredméyeket alkalmazva fogalmazzuk meg következtetéseiket. (Párhuzamosa fogjuk tauli a valószíűségszámítást.) Példák. Egy hóapba 0 hurrikát figyeltük meg. Mit godoluk, meyi hurriká lesz jövőre ugyaebbe a hóapba?. Egy közvéleméykutatás sorá azt kaptuk, hogy 000 emberből 400 választaá az adott pártot. Mások szerit a párt 50%-ot fog kapi. Előfordulhat-e ez? Mekkora eséllyel? 3

Statisztikai elemzés lépései Tervezés (mit vizsgáluk, hogya gyűjtjük az adatokat) Adatgyűjtés Kódolás (ha szükséges) Elleőrzés: leíró statisztikákkal Elemzés: matematikai statisztika módszereivel Leíró statisztika Nem a véletle hatását vizsgálja, haem a kokrét mita megjeleítése, jellemzőiek kiszámítása a feladata. Adatok elredezhetők táblázatba (fotos: forrás feltütetése), illetve ábrázolhatók grafikusa. Adatok típusai (skálák) Nomiális: csak gyakoriságot tuduk számoli (pl. em, emzetiség) Ordiális (redezett): pl. értékelés szavakkal (rossz-közepes-jó), sorred egyértelmű, kvatilisek számolhatók Itervallum (pl. hőmérséklet: külöbség egyértelmű, de háyados em) Aráy (itt mide matematikai művelet értelmes), ez szerecsére a leggyakoribb Grafikus megjeleítés Ne legye túl Heti forgalom, MFt, XXZZ áruház boyolult! 35 30 Példák: 5 0 oszlopdiagram 5 0 X tegely: csoportok, 5 0 típusok S/R S/N T/R T/N Y tegely: Forgalom (Mio.Ft) gyakoriságok, értékek S/N S/R T/N kördiagram T/R Potszámok grafikus ábrázolása Hisztogram Adataikat osztályokba soroljuk (midegyiket potosa egybe, pl. az i-edik osztály: a i x<a i+ ), a csoportok relatív gyakoriságai megegyezek az osztály fölé rajzolt téglalap területével. Összterület: Példák Nics általáos érvéyű képlet az osztályok számára, általába /3 al lehet aráyos 0 50 00 50 00 0 30 40 50 60 70 80 potszám 4

0 0 0 0 30 50 0 0 0 30 40 0 5 Hallgatói adatok 60 70 Magasság 80 90 00 cm Cipőméret 36 4 48 38 40 44 46 Utazás apota 5 5 0 0 40 60 80 0 0 40 60 0 5 35 Testsúly 40 50 60 70 80 90 00 0 kg Taulás hetete 0 5 0 5 0 5 óra Sörök hetete Figyeljük meg az eloszlások alakját! Középértékek Mitaátlag: x... x x : ha az egyes értékek (l ) i gyakoriságai (f ) i adottak: fl... fklk x : Mediá: a sorbaredezett mita középső eleme (ha páros sok eleme va: a két középső átlaga). Kvartilisek: egyedelőpotok (/4-3/4, illetve 3/4-/4 aráyba osztják fel a redezett mitát) Az átlag érzékey a kiugró értékekre, a mediá viszot em. 0 00 00 300 400 perc 0 5 0 5 0 5 30 35 üveg boxplot Hallgatói adatok V V V3 V4 V5 Mi. :60.0 Mi. : 45.00 Mi. :36.00 F:95 Mi. :.000 st Qu.:7.0 st Qu.: 64.00 st Qu.:4.00 N:7 st Qu.:.000 Media :78.0 Media : 7.00 Media :43.00 Media : 5.000 Mea :77. Mea : 7.8 Mea :4.8 Mea : 6.036 3rd Qu.:8.0 3rd Qu.: 80.5 3rd Qu.:44.00 3rd Qu.: 8.000 Max. :98.0 Max. :0.00 Max. :48.00 Max. :4.000 V6 V7 Mi. : 0.0 Mi. : 0.000 st Qu.: 60.0 st Qu.: 0.000 Media : 9.5 Media :.000 Mea :04. Mea : 3.57 3rd Qu.:0.0 3rd Qu.: 5.000 Max. :360.0 Max. :34.000 Az egyes dobozok az alsó kvartilistól a felső kvartilisig tartaak. Középvoal a mediá. Gam A voalak a teljes terjedelmet felölelik, ha ez T5 Norm Ui05 az egyes iráyokba em agyobb a kvartilisek közötti külöbség.5- szereséél. Ha eze kívül is vaak potok, azokat külö-külö jeleíti meg. -4-0 4 6 Példa adatbázis: Napi középhőmérséklet 95-988 között Jauár -i középhõmérsékletek A hallgatói adatok emekéti botásba Magasság Testsúly -5 0 5 cm perc 60 70 80 90 36 40 44 48 0 00 00 300 Cipőméret Utazás apota kg óra üveg 50 70 90 0 5 0 5 0 0 5 5 5 35 Taulás hetete Sörök hetete Vajo melyik esetbe szigifikás az eltérés? Budapest Kompolt 5