Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Hasonló dokumentumok
Matematikai statisztika

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

Valószínőségszámítás

? közgazdasági statisztika

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

? közgazdasági statisztika

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Statisztika 1. zárthelyi dolgozat március 21.

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Változók függőségi viszonyainak vizsgálata

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika. Eloszlásjellemzők

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

Lineáris regresszió. Statisztika I., 4. alkalom

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Feladatok és megoldások a 11. heti gyakorlathoz

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

A matematikai statisztika elemei

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Regresszió. Fő cél: jóslás Történhet:

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

Regresszió és korreláció

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

BIOMATEMATIKA ELŐADÁS

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

A sokaság/minta eloszlásának jellemzése

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Regresszió és korreláció

A heteroszkedaszticitásról egyszerûbben

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

FELADATOK MÉRÉSELMÉLET tárgykörben. 1. Egy műszer osztálypontossága 2.5, a végkitérése 300 V. Mekkora a mérés abszolút hibája?

Regresszió számítás. Mérnöki létesítmények ellenőrzése, terveknek megfelelése. Geodéziai mérések pontok helyzete, pontszerű információ

Valószínőségszámítás helye a tudományok között. Véletlen tömegjelenségek. Történeti áttekintés 1. Modellezés. Történeti áttekintés 3.

Kutatói pályára felkészítı modul

2. METROLÓGIA ÉS HIBASZÁMíTÁS

STATISZTIKA II. kötet

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

Bevezetés a hipotézisvizsgálatokba

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

A Secretary problem. Optimális választás megtalálása.

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Geostatisztika I. Dr. Szabó Norbert Péter. BSc geográfus alapszak hallgatóinak

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Reakciómechanizmusok leírása. Paraméterek. Reakciókinetikai bizonytalanságanalízis. Bizonytalanságanalízis

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Változók közötti kapcsolatok vizsgálata

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél

Variancia-analízis (folytatás)

Matematika B4 I. gyakorlat

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

1. elıadás: Bevezetés. Számonkérés. Irodalom. Valószínőségszámítás helye a tudományok között. Cél

A MATEMATIKAI STATISZTIKA ELEMEI

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Befektetett munka. Pontosság. Intuícióra, tapasztalatra épít. Intuitív Analóg Parametrikus Analitikus MI alapú

Korreláció- és regressziószámítás

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

Intelligens adatelemzés ea. vázlat 1. rész

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

1. A radioaktivitás statisztikus jellege

V. Deriválható függvények

Geostatisztika. Dr. Szabó Norbert Péter. BSc műszaki földtudományi alapszak hallgatóinak

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Geostatisztika c. tárgy a BSc földrajz alapszak hallgatóinak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hajós György Versenyre javasolt feladatok SZIE.YMÉTK 2011

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Statisztika feladatok

ICH Harmonised Tripartite Guideline. Stability Testing of New Drug Substances and Products (Q1A(R2)), 2003

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Átírás:

Matematka statsztka elıadás III. éves elemzı szakosokak Zemplé Adrás 9. elıadásból részlet

Y közelítése függvéyével Gyakor eset, hogy em smerjük a számukra érdekes meység Y potos értékét pl. holap részvéy-árfolyam, vízállás, dıjárás. Va vszot formácók hozzá kapcsolódó meységrıl, ma értékek. Feladat: olya f 0 megtalálása, amelyre f 0 a lehetı legjobb 0 0 közelítése Y-ak. Matematkalag: f 0 a megoldása a m Y f szélsıérték-problémáak legksebb égyzetes becslés. Ha az együttes eloszlás smert em teljese reáls, de a megfgyelések alapjá közelíthetı, akkor megoldható a feladat. gyébkét közelítés: például Nadarajah módszerével hasoló a Parze-Roseblatt becsléshez. f

A várható érték optmumtulajdosága Állítás. A m a Y a feladat megoldása ay. Bzoyítás. Y-a Y -ay+a a szert derválva adódk, hogy valóba Y a mmumhely. A mmum értéke D Y. Ugyaígy: tetszıleges értéke eseté Y adja a mmumot, azaz általáosa Y a megoldás.

Közelítés Nadarajah módszerével h Yk r ˆ h k A Parze-Roseblatt tétel feltétele eseté ez kozsztes becslése az Y regresszóak.

Példa F Ay érmével dobtuk újra, amey fejet kaptuk érmével dobva. Csak azt tudjuk, hogy háy fejet kaptuk a másodk dobásál. Közelítsük eek segítségével az elsı dobás eredméyét. Például F0 esetre: P 0 0 0 P F, F 0 0 0 Az eredméyek: F, F4/3, F0/3. P F P F 0 0 P P

Optmum a leárs függvéyek körébe m a, b Y [ a + b] gyszerőbbe megoldható Nem kell az együttes eloszlás A megoldás derválással: Y [ a + b] Y + b + a + a Y b Y ab +

0 ] [ + + Y b a b a Y a 0 ] [ + + Y a b b a Y b a Y b b Y a a Y b b Y a a Y Y a Y Y a Y Y Y b

Az a+b egyees tulajdosága z a legksebb égyzetes eltérést adó a leárs függvéyek között a fet megoldás valóba mmum levezés: regresszós egyees Átmegy az,y poto Példa: Kockával dobuk, majd ha k az eredméy, az,,k cédulák közül húzuk egyet. Nem tudjuk a húzás eredméyét, csak a kockadobásét. Hogya tppeljük a húzott számra a legksebb égyzetes eltérést adó becslést keressük? h Kkk+/ az uverzálsa legjobb közelítés, tehát a legjobb leárs közelítés s.

eltér 54.93 - - 0 eltér 8.5 - - 0 z -3 - - 0 3 z - - 0 3 eltér.58-3 - - 0 eltér 0.47 - - 0 z - - 0 3 z - - 0

Leárs modell Y a +b+ε a magyarázó változó értéke, ε függetle, azoos eloszlású hba. ε 0, Dε σ, általába feltesszük, hogy ormáls eloszlású. a,b a becsüledı együtthatók ΣY -a +b m Megoldás: a y y, bˆ y ˆ a ˆ

Leárs modell Y a +b+ε a magyarázó változó értéke, ε függetle, azoos eloszlású hba. ε 0, Dε σ, általába feltesszük, hogy ormáls eloszlású. a,b a becsüledı együtthatók ΣY -a +b m Megoldás: a y y, bˆ y ˆ a ˆ

A becslések szórása σ D aˆ σ, Db ˆ + Az * potba elırejelzett érték aˆ * + bˆ és eek szórása σ + * A szórásbecslésél σ helyett aak becsült értékét haszáljuk: ˆ σ y a ˆ bˆ

Hpotézsvzsgálat/ H 0 :a0 tesztelése t-próbával: a t ˆ bbıl kofdeca tervallum s kapható a-ra b a y t ˆ

Hpotézsvzsgálat/ H 0 :b0 tesztelése t-próbával: b t ˆ bbıl kofdeca tervallum s kapható b-re b a y t ˆ

Szóródások Teljes gadozás: Rezduáls égyzetösszeg: y y y y y y b a y ˆ ˆ A megmagyarázott varabltás részaráya: y y b a y ˆ ˆ y y y y R éppe a tapasztalat korrelácós együttható égyzete

R0.56 R0.73 cpõméret 38 40 4 44 46 cpõméret 38 40 4 44 46 65 70 75 80 85 90 magasság R0.83 65 70 75 80 85 90 magasság R0.9 A regresszó vzsgálata cpõméret 38 40 4 44 46 cpõméret 38 40 4 44 46 65 70 75 80 85 90 magasság 65 70 75 80 85 90 magasság

R0.03 65 70 75 80 85 90 magasság R0.33 40 50 60 70 80 90 magasság cpõméret 3 34 36 38 40 4 44 46 cpõméret 35 40 45 50 55 60 R0.80 00 0 40 60 80 magasság R0.87 00 0 40 60 80 00 0 40 magasság cpõméret 30 40 50 60 70 80 90 cpõméret 0 40 60 80

z -0-5 0 5 0 korr 0.67-0 -5 0 5 0 z -0-8 -6-4 - 0 korr 0.4-0 -8-6 -4-0 A tapasztalat korrelácó vzsgálata z - - 0 3 korr -0.8 z 0 5 0 korr 0.94 Ige érzékey a kugró értékekre - 0 0 5 0

Általáosított leárs modell Több magyarázó változót s bevohatuk a modellbe: Y β +ε ahol Y,ε hosszú vektorok, k-as mátr smert értékekbıl, β pedg k hosszú smeretle paramétervektor. Y β. A legksebb égyzetek módszere A megoldás: ε β ' ' Yβ ' Yβ ' ˆ ' ' Y '

A becslés tulajdosága Torzítatla Kovaracamátr: ' ' ˆ ˆ σ β β β β Ha ε ormáls eloszlású, akkor a legksebb égyzetes becslés egyúttal ML becslés s. Példák: leárs regresszó, szórásaalízs. ' ˆ ˆ σ β β β β

Hpotézsvzsgálat a leárs modellbe A vzsgált hpotézs: H 0 : βh ' 0 ahol H rk-as mátr r<k, raghr. A valószíőségháyados próba statsztka: F Y ˆ ' β ' Y ˆ β ' Y ˆ β ' Y ˆ ˆ ' Yβ ' Yβ ' ˆ β ' -k/r F a H 0 eseté F eloszlású r,-k szabadság fokkal. Akkor utasítjuk el H 0 t, ha F agy. '

Vegyes kapcsolat Nomálskálá és aráyskálá értelmezett smérv kapcsolata. Példák: Mukahely vs. fzetés Tursták emzetség vs. ap költésük Nem vs. magasság stb. Ábrázolás: potok osztályokét

Példa Moatsgehalt der Frma SY -tegely: aráyskálá mért smérv y-tegely: omáls skálá mért változó Az adatok eft-ba Ksegítı: 70,80,00,0,30,40 Adm. 0,50,60, 00,50,30,360,380 Vezetı: 80,300,450,50,600,750 Arbetstyp Hlfskraft Leter Adm. 00 00 300 400 500 600 700 TFt 006.Ja.

Vegyes kapcsolat szorosságáak mérıszáma: H Részátlag az -edk osztályra: : megfgyelések száma az -edk osztályba,...,k Vezetı: 466,67 TFt +,+ Adm.: 4,5 TFt Ksegítı: 06,67 TFt Fıátlag: 69 TFt. Négyzetösszegek az osztályokba: Vezetı: 33 Adm.: 70950 Sw, +, Ksegítı: 3933 Négyzetösszeg az osztályok között: S b 39863 H S b /S b + S w 0,58 S H0,763 b +,...+,, +... +, +... + k k

Szóráselemzés gy vagy több faktor külöbözı sztje mérük eredméyeket pl. termésátlagokat A kérdés: mely faktorok hatak z s leárs modell: Y β +ε, ahol 0- mátr.

gyszeres osztályozás gy faktor külöbözı sztje mérük. Y j a j +ε j a j a faktor j-edk sztjéek a hatása, j,...,k,,...,. ε j függetle, azoos, N0,σ eloszlású, N +...+ k. z s Y β +ε alakú. A ullhpotézs: a sztek cseek hatással, azaz a a... a k z s H 0 : βh ' 0 alakú, tehát F-próba végezhetı.

Az F-próba A H 0 mellett a csk csoportok között és csb csoporto belül szóráségyzetek háyadosa em túl agy és az eloszlása smert: MS csk MS csb -kss csk k-ss csb eloszlása F df dfcsk,df csb

Az F-eloszlás.500 A 0 és 5 szabadság fokokhoz tartozó F eloszlás sûrûségfüggvéye.5 0.750 0.375 0.000 0 3 4

Példa. csoport. csoport ---------- ----------. megfgyelés 6. megfgyelés 3 7 3. megfgyelés 5 ---------------------------------------------- Átlag 6 Négyzetösszeg ---------------------------------------------- Teljes átlag 4 Teljes égyzetösszeg 8

A szóráselemzés táblázata +----------+--------------------------------+ Forrás Szórások elemzése +------+----+------+------+------+ SS df MS F p +----------+------+----+------+------+------+ Hatáscsk 4.0 4.0 4.0.008 Hba csb 4.0 4.0 +----------+------+----+------+------+------+

Mult-Faktor ANOVA gy tpkus kísérletbe em csak egyetle haem több faktort s fgyelembe kell ve. ze faktorok hatását kell elleırzés alatt tarta. Példa: két faktor esete. Y jm a j +ε jm a j az elsı faktor -edk és a másodk faktor j-edk sztjéek a hatása,,...,k, j,...,l, m,...,. ε jm függetle, azoos, N0,σ eloszlású. z s Y β +ε alakú.

Hpotézsek Va-e kölcsöhatás? kkor H 0 : cs kölcsöhatás, azaz a j a,...,k, j,...,l. a. j+ a.. Ha elfogadható, hogy cs kölcsöhatás, akkor vzsgálható, hogy az egyes faktorok hatak-e. Például az elsı faktorra:,...,k a. a.. zek s F-próbával vzsgálhatóak. 0 0

rıs kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor

Gyege kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor

Ncs kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor