Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Hasonló dokumentumok
Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Statisztika október 27.

Matematikai statisztika

Statisztika 1. zárthelyi dolgozat március 21.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

BIOMATEMATIKA ELŐADÁS

Matematika B4 I. gyakorlat

1. A radioaktivitás statisztikus jellege

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

6. feladatsor. Statisztika december 6. és 8.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Kutatói pályára felkészítı modul

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

A statisztika részei. Példa:

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

Statisztika 1. zárthelyi dolgozat március 18.

18. Differenciálszámítás

Statisztikai hipotézisvizsgálatok

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Egy lehetséges tételsor megoldásokkal

Populáció nagyságának felmérése, becslése

Statisztika gyakorlat Geológus szakirány

Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások

Kutatásmódszertan és prezentációkészítés

Feladatok és megoldások a 11. heti gyakorlathoz

[Biomatematika 2] Orvosi biometria

A matematikai statisztika elemei

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

Biomatematika 2 Orvosi biometria

A brexit-szavazás és a nagy számok törvénye

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

VII. A határozatlan esetek kiküszöbölése

V. Deriválható függvények

? közgazdasági statisztika

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis-ellenırzés (Statisztikai próbák)

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/ félév Arató Miklós

Elemi statisztika fizikusoknak

Gyakorló feladatok II.

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Statisztika. Eloszlásjellemzők

Minta JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A MATEMATIKA EMELT SZINTŰ ÍRÁSBELI 2. FELADATSORHOZ

STATISZTIKA I. x ÁR. x ÁR. x ÁR. x ÁR. Számosállat. Egységhozam. Termelési érték, árbevétel. Az ár. Hogyan lehet ezeket összehasonlítani?

Biosta'sz'ka és informa'ka

16. Az AVL-fa. (Adelszon-Velszkij és Landisz, 1962) Definíció: t kiegyensúlyozott (AVL-tulajdonságú) t minden x csúcsára: Pl.:

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

18. modul: STATISZTIKA

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

Hajós György Versenyre javasolt feladatok SZIE.YMÉTK 2011

A FUNDAMENTÁLIS EGYENLET KÉT REPREZENTÁCIÓBAN. A függvény teljes differenciálja, a differenciális fundamentális egyenlet: U V S U + dn 1

A leíró statisztikák

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

GAZDASÁGI MATEMATIKA 1. ANALÍZIS

6. Előadás. Vereb György, DE OEC BSI, október 12.

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

Matematikai statisztika

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

A Statisztika alapjai

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Komputer statisztika

Kolónia-stimuláló faktorok (CSF)

24. Kombinatorika, a valószínűségszámítás elemei

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

Matematika I. 9. előadás

1. elıadás: Bevezetés. Számonkérés. Irodalom. Valószínőségszámítás helye a tudományok között. Cél

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

6. Számsorozat fogalma és tulajdonságai

Átírás:

Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 16. A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia (közvéleméykutatások) Természettudomáyok Meteorológia (pl. klímaváltozás) Geetika (chiptechológia) Pézügyi adatok stb. Törtéet Táblázatokat a biztosítók már többszáz éve haszálak Maga a tudomáy fiatal tudomáy, alig 100 éves a múltja Agliai mezőgazdasági alkalmazások voltak az elsők Fejlődése felgyorsult az utóbbi évtizedekbe (számítógépek jóvoltából) Populáció Az a sokaság, amiek a jellemzőire kivácsiak vagyuk. : Gyártmáyok Magyarország szavazópolgárai A Ft/Euro árfolyam api változásai Legtöbbször ics mód teljes körű (100%-os) adatfelvételre. Mita A populációból kiválasztott részhalmaz, amelyre voatkozóa az adatok redelkezésre állak. Mivel a mitavétel véletle, ezért a mitaelemek valószíűségi változók. Fotos szempot a reprezetativitás. Gyakorlatba legtöbbször feltesszük, hogy a mitaelemek függetleek. Adatok Mitavétel a populációból: eredméye a (statisztikai) mita A mitavétel módja is léyeges (legegyszerűbb eset: bármelyik elem ugyaakkora valószíűséggel kerül a mitába) Példa: Nem jó, ha a büfébe kérdezzük meg a diákokat az előadásról (em lesz reprezetatív) A mitavétel eredméye: (statisztikai) mita: 1, 2,, számsorozat, az X 1,X 2,,X valószíűségi változó-sorozat realizációja. 1

Matematikai statisztika helye a tudomáyok között Matematikai tudomáy, mert a valószíűségszámítás eredméyeire épül. Ugyaakkor a statisztika mideapi alkalmazása em midig kellőe precíz (teljesülek-e a feltételek?) Ezért léyeges, hogy a valószíűségszámítási eredméyeket alkalmazva fogalmazzuk meg következtetéseiket. 1. Egy hóapba 10 hurrikát figyeltük meg. Mit godoluk, meyi hurriká lesz jövőre ugyaebbe a hóapba? 2. Egy közvéleméykutatás sorá azt kaptuk, hogy 1000 emberből 400 választaá az adott pártot. Mások szerit a párt 50%-ot fog kapi. Előfordulhat-e ez? Mekkora eséllyel? Statisztikai elemzés lépései Tervezés (mit vizsgáluk, hogya gyűjtjük az adatokat) Adatgyűjtés Kódolás (ha szükséges) Elleőrzés: leíró statisztikákkal Elemzés: matematikai statisztika módszereivel Leíró statisztika Nem a véletle hatását vizsgálja, haem a kokrét mita megjeleítése, jellemzőiek kiszámítása a feladata. Adatok elredezhetők táblázatba (fotos: forrás feltütetése), illetve ábrázolhatók grafikusa. Adatok típusai (skálák) Nomiális: csak gyakoriságot tuduk számoli (pl. em, emzetiség) Ordiális (redezett): pl. értékelés szavakkal (rossz-közepes-jó), sorred egyértelmű, kvatilisek számolhatók Itervallum (pl. hőmérséklet: külöbség egyértelmű, de háyados em) Aráy (itt mide matematikai művelet értelmes), ez szerecsére a leggyakoribb Grafikus megjeleítés Ne legye túl Heti forgalom, MFt, XXZZ áruház boyolult! 35 30 : 25 20 oszlopdiagram 15 10 X tegely: csoportok, 5 0 típusok S/R S/N T/R T/N Y tegely: Forgalom (Mio.Ft) gyakoriságok, értékek S/N S/R T/N kördiagram T/R 2

Potszámok grafikus ábrázolása Hisztogram Adataikat osztályokba soroljuk (midegyiket potosa egybe, pl. az i-edik osztály: a i <a i+1 ), a csoportok relatív gyakoriságai megegyezek az osztály fölé rajzolt téglalap területével. Összterület:1 Frequecy Nics általáos érvéyű képlet az osztályok számára, általába 1/3 al lehet aráyos 0 50 100 150 200 20 30 40 50 60 70 80 potszám Frequecy Frequecy Frequecy 10 20 0 10 30 50 0 10 20 30 40 0 5 Hallgatói adatok 160 170 Magasság 180 190 200 cm Cipőméret 36 42 48 38 40 44 46 Utazás apota Frequecy Frequecy Frequecy 15 25 0 20 40 60 80 0 20 40 60 0 5 35 Testsúly 40 50 60 70 80 90 100 110 kg Taulás hetete 0 5 10 15 20 25 óra Sörök hetete Figyeljük meg az eloszlások alakját! Középértékek Mitaátlag: 1... : ha az egyes értékek (l ) i gyakoriságai (f ) i adottak: f1l1... fklk : Mediá: a sorbaredezett mita középső eleme (ha páros sok eleme va: a két középső átlaga). Kvartilisek: egyedelőpotok (1/4-3/4, illetve 3/4-1/4 aráyba osztják fel a redezett mitát) Az átlag érzékey a kiugró értékekre, a mediá viszot em. 0 100 200 300 400 perc 0 5 10 15 20 25 30 35 üveg boplot Hallgatói adatok V1 V2 V3 V4 V5 Mi. :160.0 Mi. : 45.00 Mi. :36.00 F:95 Mi. : 1.000 1st Qu.:172.0 1st Qu.: 64.00 1st Qu.:41.00 N:17 1st Qu.: 2.000 Media :178.0 Media : 72.00 Media :43.00 Media : 5.000 Mea :177.2 Mea : 72.18 Mea :42.28 Mea : 6.036 3rd Qu.:182.0 3rd Qu.: 80.25 3rd Qu.:44.00 3rd Qu.: 8.000 Ma. :198.0 Ma. :110.00 Ma. :48.00 Ma. :24.000 V6 V7 Mi. : 0.0 Mi. : 0.000 1st Qu.: 60.0 1st Qu.: 0.000 Media : 92.5 Media : 1.000 Mea :104.1 Mea : 3.527 3rd Qu.:120.0 3rd Qu.: 5.000 Ma. :360.0 Ma. :34.000 Az egyes dobozok az alsó kvartilistól Gam2 a felső kvartilisig tartaak. Középvoal a mediá. A voalak a teljes terjedelmet felölelik, ha ez T5 Norm Ui05 az egyes iráyokba em agyobb a kvartilisek közötti külöbség 1.5- szereséél. Ha eze kívül is vaak potok, azokat külö-külö jeleíti meg. -4-2 0 2 4 6 3

Példa adatbázis: Napi középhőmérséklet 1951-1988 között Jauár 1-i középhõmérsékletek A hallgatói adatok emekéti botásba Magasság Testsúly -5 0 5 cm perc 160 170 180 190 36 40 44 48 0 100 200 300 Cipőméret Utazás apota kg óra üveg 50 70 90 110 5 10 15 20 0 5 15 25 35 Taulás hetete Sörök hetete Vajo melyik esetbe szigifikás az eltérés? Budapest Kompolt Matematikai statisztika A mita: valószíűségi változó-sorozat realizációja. A belőle számolt statisztikák eloszlásáak vizsgálatához magukat a valószíűségi változókat haszáljuk, em pedig a realizációál kapott számértékeket. Statisztika: a mita függvéye (val.változó). statisztikára: miimum, maimum, mitaátlag terjedelem: X () - X 1 () Becslések A mitából kiszámolt értékek tekithetőek a vizsgált populációra voatkozó közelítésekek. Ezek tulajdoságait (meyire potosak/megbízhatóak) a valószíűségszámítás eszközeivel tudjuk vizsgáli. Becslések tulajdoságai Torzítatlaság. valós paramétert becslük a T(X) statisztikával. Ez torzítatla, ha, E T (X ) mide paraméterértékre. torzítatla becslésekre: Valószíűség becslése relatív gyakorisággal. Várható érték becslése mitaátlaggal Poisso eloszlás paraméterére: mitaátlag Becslési módszerek Eddig: ad hoc módszerek Általáos eljárás kellee Példa: valószíűség becslése, kísérletből. Jelölje k a sikeresek számát (X i i=1,..., idikátormita) P k k X i k p (1 p) i1 k Most p függvéyébe ézzük, k rögzített (elevezés: likelihood függvéy). 4

y y A likelihood függvéy maimumhelye logikus választás a valószíűség becsléséek 0.00 0.05 0.10 0.15 likelihood függvéy, =100 k=5, ma=0.05 k=25,ma=0.25 k=50,ma=0.5 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.1 0.2 0.3 likelihood függvéy, =20 k=1, ma=0.05 k=5,ma=0.25 k=10,ma=0.5 0.0 0.2 0.4 0.6 0.8 1.0 A módszer általáosa L( ; f ( f ( i ) i1 (a likelihood függvéy) maimumhelye lesz a θ paraméter maimum likelihood becslése. Ha a függvéy deriválható, a loglikelihood függvéy l ; l f ( l f ( ) maimumhelye deriválással l( ; l f ( i1 megoldásakét megtalálható ( i i1 l f ( i ) 0 valószíűségre: relatív gyakoriság Poisso eloszlás paraméterére: Epoeciális eloszlás paraméterére: 1/ 5