Lineáris regresszió. Statisztika I., 4. alkalom

Hasonló dokumentumok
Regresszió. Fő cél: jóslás Történhet:

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Statisztika feladatok

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Kísérlettervezési alapfogalmak:

4 2 lapultsági együttható =

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Adatelemzés és adatbányászat MSc

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Minősítéses mérőrendszerek képességvizsgálata

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Adatok statisztikai értékelésének főbb lehetőségei

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

A sokaság/minta eloszlásának jellemzése

Adatsorok jellegadó értékei

Többváltozós Regresszió-számítás

ADATREDUKCIÓ I. Középértékek

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

ADATREDUKCIÓ I. Középértékek

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Méréselmélet: 5. előadás,

TÉRBELI STATISZTIKAI VIZSGÁLATOK, ÁTLAGOS JELLEMZŐK ÉS TENDENCIÁK MAGYARORSZÁGON. Bihari Zita, OMSZ Éghajlati Elemző Osztály OMSZ

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Laboratóriumi kontrollkártya használata Tananyag. Készítette: Muránszky Géza vegyészmérnök Oktató: Lőrinc Anna minőségirányítási előadó

Többváltozós lineáris regressziós modell feltételeinek

Véletlenszám generátorok. 6. előadás

ÁLTALÁNOS STATISZTIKA

Foglalkoztatáspolitika. Modellek, mérés.

Digitális Domborzat Modellek (DTM)

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

OKTATÁSGAZDASÁGTAN. Készítette: Varga Júlia Szakmai felelős: Varga Júlia június

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

? közgazdasági statisztika

Matematikai geodéziai számítások 6.

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

ADATREDUKCIÓ I. Középértékek

EM algoritmus. A feladat: egy valószínűség eloszlás valmilyen paraméterét(vektorát) akarjuk becsülni részlegesen megfigyelhető.

Matematikai geodéziai számítások 6.

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Integr alsz am ıt as. 1. r esz aprilis 12.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Empirikus nehézségek. Termelési és költségfüggvények - elmélet. Termelési és költségfüggvények elmélet, folyt. Becslés három megközelítés

Regressziós vizsgálatok

Pénzügyi menedzsment

Kettőnél több csoport vizsgálata. Makara B. Gábor

Intelligens elosztott rendszerek

Max-stabilis folyamatok. 6. előadás, március 29. Smith (1990) konstrukciója. Példák

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc

VÁROS- ÉS INGATLANGAZDASÁGTAN

Valószínűségszámítás összefoglaló

Mesterséges Intelligencia MI

A DETERMINÁCIÓS EGYÜTTHATÓRÓL

Statisztikai. Statisztika Sportszervező BSc képzés (levelező tagozat) Témakörök. Statisztikai alapfogalmak. Statisztika fogalma. Statisztika fogalma

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Indirekt térfogat-vizualizáció. Fourier térfogat-vizualizáció. Tomográfiás rekonstrukció. Radon-transzformáció. A Fourier vetítő sík tétel

Matematikai statisztika

? közgazdasági statisztika

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

Principal Component Analysis

I. A közlekedési hálózatok jellemzői II. A közlekedési szükségletek jellemzői III. Analitikus forgalom-előrebecslési modell

Keresztkorreláció vizsgálata statisztikai teszttel

[Biomatematika 2] Orvosi biometria

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Regresszió és korreláció

Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.

Fizikai és kémiai tulajdonságok számolása

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Nemparaméteres eljárások

Átírás:

Lneárs regresszó Statsztka I., 4. alkalom

Lneárs regresszó Ha két folytonos változó lneárs kapcsolatban van egymással, akkor az egyk segítségével elıre jelezhetjük a másk értékét. Szükségünk van a függı és független változó kválasztására, de ez nem jelent okság kapcsolatot! Azt sem jelent, hogy megértettük volna a kapcsolatot, de az összefüggés segíthet a megértését a kapcsolatnak és legfıképp releváns elırejelzésenk lehetnek. Példák: Évszakok váltakozása és az ókor görögök. Képességteszt és adott pozícóban való beválás. Felvétel vzsgapontszám és egyetem elımenetel. Adott áruckkel szemben atttőd és vásárlás hajlandóság. Kapcsolat szubjektív erıssége és nterakcók het gyakorsága. Ha az elırejelzés egy változó segítségével történk, akkor egyváltozós lneárs regresszó számításnak nevezzük az eljárást.

Lneárs regresszó Mnél szorosabb két változó kapcsolata, annál ksebb lesz az elırejelzés hbája. Pl. Egy varrónıvel szemben elégedettséget szeretnénk elıre jelezn egy varrás gyorsaság teszt alapján. Számos már dolgozó varrónıvel elvégezzük a tesztet, és nformálódunk fınökük munkájukkal való elégedettségérıl. Pl. korrelácóval megvzsgáljuk, hogy a számszerősített két változó összefügg-e egymással. Amennyben a teszt használhatónak tőnk, regresszós egyenest llesztünk az adatokra, hogy a teszt alapján a fınök elégedettségét bármely teszt érték esetén elıre jelezhessük. 4 - -4 X3-6 -3 - -1 1 Ábra a Máth jegyzetbıl. X1

Lneárs regresszó A lneárs kapcsolat természetesen egy egyenessel ragadható meg a legjobban. Ezt regresszós egyenesnek nevezzük. Az általános képlete egy egyenesnek:: Y = β X + β1 β β 1 konstans, az a pont ahol az egyenes metsz az y tengelyt, az az érték, am a legjobb becslés x= esetén a változó súlya, azt fejez k, hogy x egységny változása mekkora növekedést déz elı y becslésében A becslés csak tökéletes kapcsolat esetén lenne hbamentes (r=1 vagy r= -1). Az eljárás elnevezésének háttere: Sr Francs Galton a 19. században kutatta gyermekek genetkus meghatározottságát. Úgy fogalmazta meg eredményet, hogy a gyermekek magassága a szülık magasságához képest regredál az átlagosság rányába. A jelenség generalzálható teszt-reteszt sztuácókra, ez s mutatja, hogy a regresszós hatás egy természetes jelenség.

Lneárs regresszó A becslés csak tökéletes kapcsolat esetén lenne hbamentes (r=1 vagy r= -1). = β + β X + ε Y 1 A lehetı legksebb hbájú becslés a cél. A hbáról feltételezzük, hogy független X-tıl és átlaga nulla. A négyzetes hba mnmalzálására épülı legksebb négyzetek segítségével számolhatjuk becslését. A becslések normáls eloszlásúak, így tesztelhetı, hogy nullával egyenlıek-e a populácó szntjén. β = 1 ( X X )( Y ( X β = Y X 1 β X ) Y ) SE( β ) = σ 1 SE( β ) = σ 1 ( N 1) s x 1 X + N ( N 1) s x ˆ σ = ) Y Y N

Két változó kapcsolata Ha két változó normáls eloszlású, akkor csak lneárs kapcsolat képzelhetı el közöttük, azaz, ha nncs közöttük lneárs kapcsolat, akkor függetlenek egymástól. Ha két változó normáls eloszlású és korrelácójuk nulla, akkor függetlenek egymástól, ha korrelácójuk nullától különbözk, akkor lneárs kapcsolatban vannak, és ez a kapcsolat egy egyenessel megragadható. Fontos a korrelácó mértéke s (r=.1) A regresszós egyenes segítségével egyk változó értékének smeretében a másk változó értékét elıre jelezhetjük. Meg kell határoznunk a függı és független változót, k kell számítanunk a regresszós együtthatókat (, és β ). β 1 Ha a független változó értéke köz nem szerepel egy érték, de a megfgyelt tartományban van (megfgyelt mn. és max. érték között), akkor következtethetünk a függı változó értékére (nterpolácó), ha a megfgyelt tartományon kívül van, akkor ezt nem tehetjük meg (extrapolácó). β 1 Ha a független változó súlya ( ) a populácó szntjén különbözk nullától, akkor a független változó hatása szgnfkáns.

Lneárs regresszó A lneárs regresszó termnológája megtévesztı: -függı változó -független változó -változó hatása Csak akkor beszélhetünk okság kapcsolatról, ha random kísérletbıl származó adatokkal dolgozunk és mnden más, a vzsgált kapcsolat szempontjából releváns, tényezıt kontrollálunk. (A független változót m manpuláljuk és a személyeket random módon soroltuk a függı változó szernt csoportokba). Ha megfgyelésrıl van szó, számos külsı tényezı befolyással lehet mnd a függı, mnd a független változóra, okság kapcsolatról megfgyelés esetén nem beszélhetünk.

Lneárs regresszó Ha a regresszó tökéletes elırejelzésre ad lehetıséget, azaz a megfgyelt értékek, pontdagrammon ábrázolva tökéletesen lleszkednek egy egyenesre, akkor szokás függvénykapcsolatról beszéln. Pl. Eladott termék száma, eladásból származó bevétel. Az esetek döntı többségében azonban csak úgynevezett statsztka kapcsolatról van szó, ahol az elırejelzés nem tökéletes, az elırejelzés hbája vzuálsan a pontok távolsága az llesztett egyenestıl. Pl. az anya ntellgencájával próbáljuk bejósoln a gyermek ntellgencáját.

Lneárs regresszó Az általános képlete egy egyenesnek: β β 1 Y = β + β1x az a pont ahol az egyenes metsz az y tengelyt azt fejez k, hogy x egységny változása mekkora növekedést déz elı y-ban ˆ =β ˆ + ˆ β X Y = Y X 1 ε = Y ˆ ˆ β ( β + 1X ) = Y Yˆ Y ˆ β ˆ + ε = + β1x A becslés csak tökéletes kapcsolat esetén lenne hbamentes (r=1 vagy r= -1). a becslés hbája. ε A lehetı legksebb hbájú becslés a cél. A hbáról feltételezzük, hogy független X-tıl és átlaga nulla. A négyzetes hba mnmalzálására épülı legksebb négyzetek eljárás segítségével számolhatjuk és becslését. β β 1

Lneárs regresszó A becslés hbája: ε = Y ˆ ˆ β ( β + 1X ) = Y Yˆ A regresszós egyenes hbája, az ún. rezduáls hba vagy hbavaranca: ˆ Res = E[( Y Y ) ] = E[ ε ] = E[( ε ) ] = σ ε σ = σ + σ Y ˆ Y ε ss Y = ss Yˆ + ss ε R = ss ss Yˆ Y Az R négyzet érték, a determnácós együttható, azt mutatja meg, hogy az Y változó varancájának mekkora részét tudjuk megragadn az y becsült értékével. Ez pontosan a korrelácó négyzete lesz.