FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hasonló dokumentumok
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Több valószínűségi változó együttes eloszlása, korreláció

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Statisztika elméleti összefoglaló

y ij = µ + α i + e ij

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

5. előadás - Regressziószámítás

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

egyetemi jegyzet Meskó Balázs

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Hipotézis vizsgálatok

Korreláció és lineáris regresszió

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

A maximum likelihood becslésről

A leíró statisztikák

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Bevezetés a hipotézisvizsgálatokba

[Biomatematika 2] Orvosi biometria

Többváltozós lineáris regressziós modell feltételeinek

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Statisztika Elıadások letölthetık a címrıl

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

[Biomatematika 2] Orvosi biometria

A Statisztika alapjai

Mérési hibák

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Számítógépes döntéstámogatás. Statisztikai elemzés

Least Squares becslés

Matematikai statisztikai elemzések 6.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

KÖVETKEZTETŐ STATISZTIKA

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Diagnosztika és előrejelzés

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Regressziós vizsgálatok

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Kísérlettervezés alapfogalmak

Biostatisztika VIII. Mátyus László. 19 October

Hipotézis vizsgálatok

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

LINEÁRIS MODELLBEN május. 1. Lineáris modell, legkisebb négyzetek elve

Biometria gyakorló feladatok BsC hallgatók számára

Bevezetés a Korreláció &

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A mérési eredmény megadása

Mérési adatok illesztése, korreláció, regresszió

Normális eloszlás paramétereire vonatkozó próbák

Lineáris regressziószámítás 1. - kétváltozós eset

Túlélés analízis. Probléma:

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Regresszió számítás az SPSSben

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Nemparaméteres próbák

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Likelihood, deviancia, Akaike-féle információs kritérium

Kísérlettervezés alapfogalmak

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

1. zárthelyi,

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Kutatásmódszertan és prezentációkészítés

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Átírás:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8

VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus értéket pl. a korrelációs együttható vagy az ún. feltételes várható értéket, azaz a regressziós függvényt használjuk. Ez a függvény normális eloszlást feltételezve egy egyenes (többdimenziós esetben sík). Mivel számos eset erre visszavezethető és könnyen számolható, így nagyon gyakran alkalmazzák előrejelzésre. Először a becslések meghatározását és az eredmények vizsgálatát tekintsük át egy egyenesre vonatkozó problémán keresztül. A regressziós egyenes meghatározása Adott Keressük azt az egyenest, amelyre minimális. Ez azt jelenti, hogy minimalizáljuk az véletlennek tekintett reziduumok négyzetösszegét. Vezessük be a következő jelöléseket: Ekkor a regressziós egyenes együtthatói A hibák, a konfidencia-intervallumok és a hipotézisvizsgálatok leírásához bevezetett jelölésekben az tapasztalati szórásra utal. a korrigált Két egyenes összehasonlítása Adott két mérési adatsor, amelyek alapján elkészíthető két regressziós egyenes. Feladatunk annak vizsgálata mikor

egyezik meg a két egyenes statisztikailag. Adott két minta. A mintaelem számok és A formulákban az 1 illetve 2 indexek az aktuális mintára utalnak. A és regressziós együtthatók összehasonlításához először végezzük el a következő -próbát: A további lépéseinket az -próba alapján két irányba folytathatjuk: 1. Ha az -próba elfogad, azaz feltehetjük, hogy a szórásnégyzetek megegyeznek, akkor a statisztika közelítőleg Student-eloszlású szabadságfokkal. 2. Ha az -próba elutasít, azaz feltehetjük, hogy a szórásnégyzetek különböznek, akkor elég nagy minták esetén a statisztika közelítőleg Student-eloszlású szabadságfokkal, ahol Regressziós egyenesekre vonatkozóan sokszor csupán ezt a párhuzamossági kérdést vizsgálják. Ha elfogadtuk a párhuzamossági hipotézist, akkor a regressziós együttható most már a két minta adataiból a becsülhető. Hátra van még azonban az egyenesek azonosságára vonatkozó döntés kérdése. Ezt további két részre kell bontanunk. 1. Ha akkor a közös regressziós együttható megadható formában is. 2. Ha akkor az biztosítja a regressziós egyenesek azonosságát, így azt kell megvizsgálnunk. A szokásos kétmintás -próba alkalmas ennek eldöntésére. Ha nem szükséges a párhuzamosság, akkor közvetlenül alkalmazható a következő -próba: ahol az egyesített mintára vonatkozó érték.

2. REGREssZIÓs MÓDsZEREK Elsőként tekintsük a többszörös lineáris regressziót. Ez nem más, mint az egyszerű lineáris regresszió általánosítása arra az esetre, amikor legalább két magyarázó változó van. Legyen a többszörös regresszió egyenlete, ahol a darab független (magyarázó) változó, amelyek kapcsolódnak az (függő) változóhoz. Az adatok egy dimenziós tér pontjainak tekinthető. A a regressziós együttható. Egyenként nincs jelentésük viszont együtt fontos szerepet játszanak az előrejelzésében. Legyen értékeinek Jelölje a várható értékek mátrixát a mátrix elemeihez. Feltesszük, hogy ahol Legyen elemeit reziduumoknak nevezzük. Ekkor Ha nemszinguláris, akkor a regressziós módszerek lényege a következő eredményekben foglalható össze: 1. A a legkisebb négyzetes paraméterbecslés a vektorra. 2. A a maximum-likelihood becslése, ha dimenziós normális eloszlású. 3. 4. Legyen akkor az egységmátrix. 5. Ha normális eloszlású, akkor dimenziós normális eloszlású. 6. Normalitást feltételezve a maximum-likelihood becslése 7. így a torzítatlan becslése.

8. Ha normális eloszlású, akkor 9. és függetlenek. 10. Bármely lineáris kombinációra (ha nincs normalitás akkor is) a minimális szórásnégyzetű lineáris torzítatlan becslés. Hipotézisvizsgálat Normalitás feltételezése esetén azaz Student-eloszlású, ahol A hipotézis vizsgálatára a teszt statisztika éppen megfelelő. Sőt ez alapján értékére konfidenciaintervallum készíthető. Az illesztett egyenlet minőségének a vizsgálata az előzőek alapján. Néhány használatos mérőszám A reziduumok négyzeteinek az összege Az átlagtól való négyzetes eltérések teljes összege Népszerű még a négyzetes többszörös korrelációs együttható Erre teljesül, hogy és azt szokás mondani, ha közel van egyhez, akkor jó az illeszkedés. Vigyázat és direkten nem összehasonlíthatók, hiszen az egyik esetben csak egy, míg a másik esetben paramétert becsültünk. Egy másik mérőszám sorozat az előző négyzetek átlaga (a torzítatlanság figyelembe vétele): ahol az ún. korrigált ("adjusted") PÉLDA

Példa: Adottak a következő megfigyelési adatok: Ekkor Ha meg akarjuk vizsgálni a hipotézist, ekkor a választással ez átírható a hipotézissé. Viszont amelyből következik elutasítása, hiszen a kritikus érték -ös szinten Digitális Egyetem, Copyright Fegyverneki Sándor, 2011