1. A standard lineáris regressziós modell és feltevései

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "1. A standard lineáris regressziós modell és feltevései"

Átírás

1 Tartalom Tartalomjegyzék 1. A standard lineáris regressziós modell és feltevései A standard lineáris modell modellfeltevései A standard modellfeltevések értelme és jelentősége A mintavételi eloszlás és hasznosítása A mintavételi eloszlás szemléltetése MC-szimulációval Mintavételi eloszlás hibanormalitás mellett és hasznosítása A standard lineáris regressziós modell és feltevései 1.1. A standard lineáris modell modellfeltevései Regresszió a sokaságban és a modellfeltevések értelme A sokasági regressziót a következő formában fogjuk felírni (megfigyelési egységek szintjén: E felírás leíró erejét megszorítjuk Y i = β 1 + β 2 X i β k X ik + U i A megszorítások tartalmilag kifejezik, hogy U i modellezhetetlen zaj kell legyen ( fehér zaj hiba Ezek fennállása esetén tudjuk az OLS bizonyos előnyös tulajdonságait bizonyítani Az OLS standard modellfeltevési Az ún. standard lineáris modell feltevései: 1. Linearitás 2. Nincs egzakt multikollinearitás 3. Erős (vagy szigorú exogenitás 4. Homoszkedaszticitás 5. Autokorrelálatlanság Most megvizsgáljuk ezeket egyesével Linearitás A modell alakja tehát Avagy mátrixosan: Y i = β 1 + β 2 X i β k X ik + U i Y = Xβ + U 1

2 Nincs egzakt multikollinearitás Egzakt multikollinearitásnak nevezzük, ha az adatmátrix nem teljes oszloprangú Tehát: az oszlopok között lineáris kapcsolat van (valamelyik változó előállítható a többi lineáris kombinációjaként Érezhető, hogy nem túl szerencsés: minek használjuk egyáltalán azt a változót...? (Úgyis lineáris kombinációt képezünk a többiből is! a hatások nem lesznek szétválaszthatóak Sőt: az OLS becslőfüggvényéből az is látszik, hogy ilyenkor teljesen elakadunk: X T X szinguláris, ha X nem teljes oszloprangú, márpedig ezt invertálni kéne Nincs egzakt multikollinearitás A feltétel tehát: az adatmátrix 1 valószínűséggel legyen teljes oszloprangú: ( P rank X = k = 1 Ez implikálja, hogy n k (kevesebb mint k-dimenziós vektorból nincs k független Érdemes megfigyelni, hogy a multikollinearitás egy mintában is elképzelhető jelenség (ezért is hivatkozhattunk rá úgy, hogy X nem teljes oszloprangú, de mi a tulajdonságot a sokaságban akarjuk kikötni, ezért az állítás az X-re kell vonatkozzon. Itt viszont csak annak van értelme, hogy majdnem biztosan (azaz 1 valószínűséggel követeljük meg. A másik alapvető szemléletes példa a multikollinearitásra az, ha van konstans a modellben és valamelyik magyarázó változónak nincs szórása (az összes megfigyelés ugyanaz rá. Könnyű elképzelni (pl. két dimenzióban, hogy nem lehet semmilyen regressziós egyenest húzni akkor, ha minden pontunk egymás fölött van. Végezetül megjegyezzük, hogy gyakorlati jelentősége annak is lesz, ha ugyan nincs egzakt multikollinearitás, de van változó ami elég jól előállítható a többi lineáris kombinációjaként. Ezzel a kérdéskörrel fontossága miatt külön fogunk foglalkozni. Erős exogenitás A feltétel azt köti ki, hogy E E ( U i X 2, X 2,..., X k = ( U i X = avagy (kissé közismertebb, szokásosabb jelöléssel Tehát: a hibák feltételes várható értéke, feltéve valamennyi megfigyelést, nulla Fae mintavételezésnél ez erre egyszerűsödik, hogy minden i = 1, 2,..., n-re E ( U i X i = konst, ez pedig ha van tengelymetszet a modellben azzal ekvivalens, hogy E ( U i X i = minden i-re (ekkor ugyanis mindig elérhető, hogy a konstans a nulla legyen Tartalma: a hibák bizonyos értelemben (ún. várható érték függetlenség függetlenek a magyarázó változóktól 2

3 Ahhoz, hogy az állandó E ( U i X i csak a lehessen, annyi kell, hogy EUi = teljesüljön (ezután már toronyszabállyal következik az állítás. Azért mondtuk, hogy ez konstans jelenléte esetén bizonyosan teljesül, mert ekkor, ha EU i = a lenne, akkor áttérhetnénk az eredeti β -ról β a konstansra, így elérve, hogy EU i = legyen. Az tehát, hogy az állandó feltételes várható érték szükségképp nulla, csak egy egyszerű technikai feltétel konstans jelenléte esetén. Megjegyezzük, hogy az OLS természetesen mindig olyan reziduumokat fog adni, melyek korrelálatlanok a magyarázó változókkal, de itt egyrészt egy sokasági feltételről van szó, másrészt és ez a fontosabb az E ( U i X i állandósága szigorúan erősebb követelmény mint a korrelálatlanság. (Ezt a fogalmat szokás várható érték függetlenségnek (mean independence nevezni. Lássuk is ezt be, a jelölés megkönnyítése végett hívjuk egyszerűen U-nak és X-nek a két változónkat (és megismételjük, a várható érték függetlenségi feltevésünk az, hogy E ( U X állandó, és, mellesleg, így egyenlő EU-val. Ekkor egyik oldalról E (UX = E [ E ( UX X ] = E [ XE ( U X ] = E [ XE (U ] = EXEU, így U és X korrelálatlanok (cov (U, X = E (UX EUEX; ezzel bebizonyítottuk, hogy a várható érték függetlenség implikálja a korrelálatlanságot. Másik oldalról, tekintsük példaként az X N (, 1 változót és egy olyan U változót melyre E ( U X = X 2. Ekkor EX =, EU = E [ E ( U X ] = E ( X 2 = D 2 X = 1 és E (UX = E [ E ( UX X ] = E [ XE ( U X ] = E ( X 3 =, így tehát a változók korrelálatlanok, de nyilván nem várható érték függetlenek. A várható érték függetlenség tehát szigorúan erősebb fogalom, mint a korrelálatlanság. Érdemes azt is megjegyezni, hogy viszont szigorúan gyengébb mint az igazi függetlenség! (Ez könnyen belátható. Függetlenség esetén minden feltételes eloszlás ugyanaz, márpedig ha két eloszlás egyezik, akkor nyilván a várható értékük is egyezik. Másik oldalról tekintsünk egy origó körüli < r < R körgyűrűre koncentrált egyenletes eloszlást. Ez nyilván várható érték független (a feltételes várható érték konstans nulla, viszont természetesen nem független. Lényegében arról van szó, hogy a függetlenség a feltételes eloszlások teljes egyezőségét követeli meg, míg a várható érték függetlenség csak annyit, hogy a feltételes eloszlások várható értéke legyen egyező. (A feltételes szórás már kapásból lehet eltérő. A várható érték függetlenség tehát egyfajta középút a könnyen ellenőrizhető, de keveset adó korrelálatlanság és az erős, de nehezen ellenőrizhető függetlenség között. Nézzünk végezetül egy példát az erős exogenitásra és sérülésére, hogy világosabb legyen a tartalma. Tegyük fel, hogy emberek fizetését regresszáljuk ki az oktatásban töltött éveik számával (tehát az előbbi az eredmény-, az utóbbi az egyetlen magyarázó változó. Ekkor a hibába vélhetően olyan tényezők fognak beleszámítani, mint a nem-oktatással összefüggő munkaalkalmasság, a munkamorál, a szakmai tapasztalat stb. Az egyszerűség kedvéért mondjuk, hogy csak a legelső adja a hibát. Ekkor a szigorú exogenitás feltétele, a várható érték függetlenség azt fogalmazza meg, hogy a munkaalkalmasság feltételes várható értéke minden képzettség, mint feltétel mellett legyen ugyanakkora, tehát, hogy ne függjön a képzettségtől. (Amint mondtuk, konstans jelenléte esetén ez mellesleg azt jelenti, hogy nulla is legyen ez az állandó feltételes várható érték. Baj akkor van, ha a képzettség különböző szintjei mellett a várható munkaalkalmasság nem állandó tehát például a magasabb képzettségűeknek a munkaalkalmasságuk is nagyobb, azaz a nagyobb képzettséggel egyúttal a munkaalkalmasság is emelkedik. Ekkor megsérül a szigorú exogenitási feltétel. Épp innen kapta a feltétel a nevét: olyasmit fejez ki, hogy a magyarázó változókhoz képest exogén információ az, ami a hibákban össze van fogva. (Ez nyilván nem teljesül a fenti esetben. E problémán nyilván segíthetünk azzal, ha valamilyen módon operacionalizáljuk a munkaalkalmasságot, és bevonjuk magyarázó változóként. (Ez már mutat a kihagyott változó problémájára, amit hamarosan említeni fogunk. Sajnos azonban ez nem univerzális gyógyír, hiszen az ilyen 3

4 megoldás jellegéből adódóan azt igényli, hogy tudjuk azonosítani, hogy mely változók rontják el a szigorú exogenitást (és persze ezeket mérni, modellbe bevonni is tudjuk. Egyébként az ilyen változókat, különösen a biostatisztikában confounding (zavaró változóknak is szokták nevezni. Általánosabb megoldást csak az nyújthat(na, ha kontrollált kísérletet tudunk végezni. A példánál maradva: kísérleti alanyokat lehetőség szerint véletlenszerűen két csoportba osztjuk, és mindegyik csoport különböző, általunk megszabott képzettséget kap, majd utána vizsgáljuk, hogy mekkora lesz a fizetésük... Amint ez a példa is jól illusztrálja, számos társadalmi-gazdasági kérdésben a kísérlet végzése lehetetlen (olyan apróságokról nem beszélve, hogy az optimális az lenne, ha az emberek nem tudnák, hogy melyik csoportba tartoznak, azaz mennyi képzésben részesültek stb...., így ilyenkor megfigyeléses adatokra kell támaszkodnunk. Az erős exogenitás következményei Toronyszabály miatt a feltétel nélküli várható érték is nulla: [ ( E E U i X ] = EU i = E ( = Minden magyarázó változó ortogonális minden hibára (vagyis nem csak a sajátjára: cov ( X ik, U j = vagy (ezzel egyenértékűen, hiszen EUi = E ( X ik U j = (minden i, j-re Az erős exogenitás sérülésének tipikus esetei Van olyan változó, ami lényeges magyarázó változó lenne (tehát valódi (sokasági β-ja nem nulla, de mégsem szerepel a modellben, miközben legalább egy magyarázó változóval korrelál (kihagyott változó esete, omitted variable bias Mérési hiba magyarázó változónál (tehát a mérési változók valódi értékét nem, csak valamilyen zajjal terhelve tudjuk mérni Szimultaneitás (többegyenletes modelleknél Az első eset szolgáltatja a talán legjellemzőbb példákat a korreláció nem implikál kauzalitást statisztikai alapelvére. A második és harmadik kérdéskör boncolgatása meghaladja jelen kurzus kereteit. Végül megjegyezzük, hogy idősoros esetben ez nagyon erős feltétel (hiszen például azt jelenti, hogy a magyarázó változóknak a múltbeli, a jelenbeli és a jövőbeli hibákra is ortogonálisnak kell lenniük!, ami sokszor nem teljesül. (Példaként gondoljunk egy egyszerű késleltetett eredményváltozós modellre. Az erős exogenitás sérülésének kezelése A problémát orvosolhatjuk a megfelelő(bb modellspecifikációval, függően attól, hogy pontosan mi a baj oka illetve bizonyos statisztikai eszközök is a rendelkezésünkre állnak, ilyen az instrumentális változós (IV becslés (kétfázisú legkisebb négyzetek módszere stb. E kérdések meghaladják jelen kurzus kereteit. 4

5 Homoszkedaszticitás A feltétel azt köti ki, hogy D (U 2 i X = σ 2 (i-től függetlenül! vagy (ezzel egyenértékűen, ( hiszen E U i X = E (U 2i X = σ 2 minden i = 1, 2,..., n-re Tartalma: a hibák különböző megfigyelésekhez tartozó szórása állandó (nem függ attól, hogy melyik megfigyelésről van szó avagy másként megfogalmazva ugyanez a becsült értékek szóródása a tényleges körül állandó Fae mintavételezésnél ez arra egyszerűsödik, hogy minden i = 1, 2,..., n-re σ 2 i = D 2 ( U i X i = σ 2 Jellemzően keresztmetszeti adatoknál felmerülő kérdés (hamarosan foglalkozunk is vele bővebben Fae mintavételezésnél az automatikusan teljesül, hogy D 2 U i konstans, de ez kevés: nekünk a feltételes szórás állandósága is kell a standard modellfeltevések között. Autokorrelálatlanság A feltétel azt köti ki, hogy cov ( U i, U j = vagy (ezzel egyenértékűen, hiszen EUi = E ( U i U j = (minden i, j = 1, 2,..., n, i j-re Tartalma: a különböző megfigyelésekhez tartozó hibák korrelálatlanok egymással Fae mintavételezésnél ez automatikusan teljesül Elsősorban idősoros adatok kérdésköre, most nem is foglalkozunk vele bővebben A gyakorlatban persze sokszor nem tekinthetőek a mintáink fae-nak. Egy nevezetes eset arra, amikor emiatt keresztmetszeti adatbázisnál is felléphet az autokorreláció, a térbeli autokorreláció jelensége. A homoszkedaszticitás és az autokorrelálatlanság jelentősége Mindkettő ( felfogható úgy, mint az U i hibák kovarianciamátrixára (ami nem más mint E UU T, hiszen EU =, ezt már a korábbiakból tudjuk vonatkozó megkötés Homoszkedaszticitás: a kovarianciamátrix főátlójában ugyanazok az elemek (σ 2 vannak (ugye itt vannak a szórásnégyzetek! Autokorrelálatlanság: a kovarianciamátrix főátlóján kívüli elemek nullák (a mátrix diagonális A kettő együtt: a kovarianciamátrix σ 2 I alakú (szokás az ilyet skalármátrixnak is nevezni A hibák kovarianciamátrixa alatt az előbbi definíciók miatt elsődlegesen a feltételes kovarianciamátrixot értjük, de ebből toronyszabállyal természetesen következik, hogy az állítások a feltétel nélküli kovarianciamátrixra is fennállnak. 5

6 A hiba tartalma A hibaváltozóban tömörülő hatások: Kihagyott változók Helytelen függvényforma (pl. nemlineáris hatások Mérési hibák Megmagyarázhatatlan (előre nem látható, nem modellezhető véletlen hatások A jó (ld. mindjárt tulajdonságait leírják a fenti standard modellfeltevések Mintavételileg rögzített magyarázó változók Egyszerűbb tárgyalások azt feltételezik, hogy a magyarázó változók mintavételileg rögzítettek (mintha determinisztikusan megszabhatnánk az értéküket: X i igazából x i Ennek két baja van: 1. Nem annyira szép és elegáns (nyilván ez speciális esete a mi tárgyalásunknak! 2. Megkérdőjelezhető az alkalmazása alapvetően nem-experimentális tudományokban (mint a közgazdaságtan... Az előnye, hogy egyszerűsít: ekkor a hiba feltételes és feltétel nélküli eloszlása ugyanaz lesz, a X jellegű feltételek elhagyhatóak emiatt a modellfeltevések a következőkre egyszerűsödnek: Erős exogenitás: EU i = minden i = 1, 2,..., n-re Homoszkedaszticitás: D 2 U i = σ 2 minden i = 1, 2,..., n-re Autokorrelálatlanság: E ( U i U j = minden i j = 1, 2,..., n 1.2. A standard modellfeltevések értelme és jelentősége A mintavételi helyzet hatásai Az adatbázisunk alapján megkaptuk a regressziós egyenest ( β De vigyázat: az adatbázis csak egy minta az eladásra kínált lakások sokkal bővebb sokaságából a β i paraméterek annak hatását is tükrözik, hogy konkrétan milyen mintát választottunk Mintavételi ingadozás lép fel (még akkor is, ha tökéletes a mintavétel, ennek tehát semmi köze pl. a reprezentativitáshoz Tehát: az egyes β i paraméterek mintáról-mintára ingadoznak : minden mintából más paramétereket kapnánk (Természetesen reméljük, hogy az ingadozás kellemes tulajdonságokkal bír, például a valós érték körül történik, szorosan körülötte stb., erről később 6

7 Az OLS mint becslőfüggvény Ha ismernénk az egész sokaságot, akkor arra lefuttatva megkaphatnánk a tökéletes (azaz: sokasági β i paramétereket (értsd: nem terheli őket mintavételi hiba Ezeket nevezzük elméleti (vagy sokasági regressziós koefficienseknek (többváltozós normálisra láttuk is az értékeit Tehát: van egy sokasági paraméter, amit mi mintából próbálunk megsaccolni... ismerős? Ez épp a becslés statisztikai feladata! Az OLS tehát egy becslőfüggvény! (Mint az x csak kicsit bonyolultabb... ezért a kalap Vizsgálhatóak tehát a tulajdonságai, mint becslőfüggvény Gauss Markov tétel Amennyiben a standard modellfeltevések közül teljesül a: Linearitás Nincs egzakt multikollinearitás Erős (vagy szigorú exogenitás akkor az OLS szolgáltatatta becslések torzítatlanok és konzisztensek Ha ezen felül teljesül a: Homoszkedaszticitás Autokorrelálatlanság akkor az OLS szolgáltatta becslések hatásosak (minimális varianciájuk is BLUE-tulajdonság Ezt röviden úgy szokták megfogalmazni, hogy ha valamennyi standard modellfeltétel teljesül, akkor az OLS szolgáltatta becslések BLUE-k: Best (minimális varianciájú Linear (lineáris a mintaelemekben Unbiased (torzítatlan Ezért (is szeretjük az OLS-t! Hibák normalitása A hibák normalitása nem része a standard modellfeltevéseknek Azaz: a BLUE-ság akkor is megvalósul, ha a hibák eloszlása nem normális De néhány (BLUE-ságon felüli dologhoz jól jön, például hipotézis-tesztelés (mi is mindjárt ki fogjuk használni (Miért épp a normalitás merül fel? Azért mert sok gyakorlati esetben a hibában számos, egymástól független hatás adódik össze centrális határeloszlás-tétel! nem 7

8 Hibák normalitása Ha elfogadjuk a feltevést (precízen: U feltételes eloszlása feltéve X-et többváltozós normális, akkor azt kapjuk természetesen a standard modellfeltevéseket is használva, hogy U X N n (, σ 2 I Ez láthatóan nem függ X-től így persze a hibák feltétel nélküli eloszlása is N n (, σ 2 I 2. A mintavételi eloszlás és hasznosítása 2.1. A mintavételi eloszlás szemléltetése MC-szimulációval A mintavételi tulajdonságok szemléltetése Monte Carlo szimulációval Számos konkrét véletlen mintát veszünk egy előre specifikált populációból (véletlenszámgenerátort használunk Lényegében: empirikusan vizsgálunk egy elméleti kérdést Most a valódi sokasági eloszlás (ugye kivételesen most tudjuk! ( (77 ( 42 (X, Y N, 2, , Ezért a valódi regressziós egyenes, a már látottak szerint: E ( Y X = X 4 +,2857X Szimulációs paraméterek: n = 1 elemű minta a fenti sokaságból, 1 ismétlés A szimuláció eredményei: 1. futtatás col Y =,444 +,345X col2 versus col1 (with least squares fit col1 8

9 A szimuláció eredményei: 2. futtatás col Y = 1,75 +,39X col2 versus col1 (with least squares fit col1 A szimuláció eredményei: 3. futtatás 1 8 Y = 1,33 +,33X col2 versus col1 (with least squares fit 6 4 col col1 A szimuláció eredményei: 4. futtatás Y = 5,55 +,261X col2 versus col1 (with least squares fit col col1 A szimuláció eredményei: 5. futtatás 9

10 Y = 5,15 +,284X col2 versus col1 (with least squares fit col col1 A szimuláció eredményei: konstans,14,12 Test statistic for normality: Chi-square(2 = 1,5 [,649] beta_1 N(3,996 3,3149,1 Density,8,6,4, beta_1 A szimuláció eredményei: meredekség 12 Test statistic for normality: Chi-square(2 =,33 [,8479] beta_2 N(,28569, Density 6 4 2,2,25,3,35,4 beta_2 A szimuláció eredményei: mindkét becsült paraméter együtt 1

11 ,45,4,35 beta_2,3,25,2, beta_ Mintavételi eloszlás hibanormalitás mellett és hasznosítása Változó relevanciája Definíció (Változó relevanciája. Egy változót relevánsnak nevezünk, ha a sokasági paramétere nem nulla: β i. Elárulom, hogy a β i becsült regressziós koefficiensek mintavételi ingadozását a következő összefüggés írja le: β i β i t n k ŝe ( βi Ez hibanormalitásnál egzakt, egyébként (aszimptotikus közelítés a CHT miatt Hipotézisvizsgálat változó relevanciájára Ez alapján már konstruálhatunk próbát változó relevanciájának vizsgálatára: 1. H : β i = 2. Ekkor (azaz ha ez fennáll! a t emp,i = ( βi βi kifejezés n k szabadságfokú t-eloszlást követ (nulleloszlás ŝe 3. Számítsuk ki a konkrét t emp,i -t a mintánkból és döntsük el, hogy hihető-e, hogy t n k -ból származik Hipotézisvizsgálat változó relevanciájára A hipotézisvizsgálat elvégzéséhez szükséges minden tudnivalót a nullhipotézisen kívül összefoglal tehát a következő kifejezés (a későbbiekben is ezt a sémát fogjuk használni hipotézisvizsgálatok megadására: β i t emp,i = ŝe ( βi H t n k. E próba precíz neve: változó relevanciájára irányuló (parciális t-próba 11

12 Példa változó relevanciájának vizsgálatára Az alapterület példáján: hihető-e, hogy a,2964,18 = 27,43 ebből az eloszlásból származik:.5 t( Jellemzés: kritikus érték, p-érték A gretl outputján Konfidenciaintervallum a paraméterekre Ez alapján könnyen szerkeszthető CI is, 1 α megbízhatósági szintre: β i ± t 1 α/2 ŝe ( βi. A gretl-ben (1 α =,95: 12

13 Mi az összefüggés a CI és a p-érték között? Modell egészének relevanciája Az előbbi próba azért volt parciális mert egy változó irrelevanciáját vizsgálta Felmerül a kérdés, hogy definiálható-e a modell egészének irrelevanciája Igen, mégpedig úgy, hogy valamennyi magyarázó változó együttesen is irreleváns: H : β 1 = β 2 =... = β k = Rövid jelölés arra, hogy β 1 = és β 2 = stb. és β k = (semmilyen más eset jelölésére ne használjuk az egyenlőségláncot! Figyelem: az egyszerre nulla mindegyik több mint, hogy külön-külön nulla mindegyik! Modell egészének relevanciája A modell egészének irrelevanciájára magyarul azt jelenti, hogy a modell nem tér el lényegesen a nullmodelltől Implikálja, hogy minden magyarázó változó külön-külön is irreleváns (tartalmazza ezeket a hipotéziseket előbb teszteljük a modell egészének irrelevanciáját, és csak ennek elvetése utána teszteljük a változókat parciálisan A próba konkrét alakja: Modell egészének relevanciája F emp = A tesztstatisztika átírható mint RSS/ (k 1 H Fk 1,n k ESS/ (n k RSS/ (k 1 ESS/ (n k = R 2 / (k 1 (1 R 2 / (n k Persze: a nem tér el lényegesen a nullmodelltől úgy is megfogalmazható, hogy az R 2 nem tér el lényegesen a nullától (H : R 2 = is mondható lett volna 13

14 Modell egészének relevanciája A próba neve: a modell egészének relevanciájára irányuló (globális F -próba Szokás ANOVA-próbának is nevezni (a T SS = ESS + RSS variancia-felbontáson alapszik; számlálóban és nevezőben a fokszámmal normált szórásnégyzetek vannak Tipikus eredményközlés az ún. ANOVA-táblában: 14

Regresszió a mintában: következtetés

Regresszió a mintában: következtetés Ferenci Tamás tamas.ferenci@medstat.hu 2018. február 7. Tartalom Az OLS elv és használata a lineáris regresszió becslésére 1 Az OLS elv és használata a lineáris regresszió becslésére Az OLS-elv A lineáris

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Bevezetés az ökonometriába

Bevezetés az ökonometriába Bevezetés az ökonometriába Többváltozós lineáris regresszió: mintavételi vonatkozások és modelljellemzés Ferenci Tamás MSc 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Harmadik

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

A többváltozós lineáris regresszió 1.

A többváltozós lineáris regresszió 1. 2018. szeptember 17. Lakásár adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó változók segítségével Legegyszerűbb eset - kétváltozós

Részletesebben

Lineáris regressziószámítás 1. - kétváltozós eset

Lineáris regressziószámítás 1. - kétváltozós eset Lineáris regressziószámítás 1. - kétváltozós eset Orlovits Zsanett 2019. február 6. Adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó

Részletesebben

A standard modellfeltevések, modelldiagnosztika

A standard modellfeltevések, modelldiagnosztika A standard modellfeltevések, modelldiagnosztika Ferenci Tamás tamas.ferenci@medstat.hu 2018. február 7. Tartalom Tartalomjegyzék 1. Erős exogenitás 1 2. Heteroszkedaszticitás 3 2.1. A heteroszkedaszticitás

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

5. előadás - Regressziószámítás

5. előadás - Regressziószámítás 5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Többváltozós Regresszió-számítás

Többváltozós Regresszió-számítás Töváltozós Regresszió-számítás 3. előadás Döntéselőkészítés módszertana Dr. Szilágyi Roland Korreláció Célja a kacsolat szorosságának mérése. Regresszió Célja a kacsolatan megfigyelhető törvényszerűség

Részletesebben

Ökonometriai modellek paraméterei: számítás és értelmezés

Ökonometriai modellek paraméterei: számítás és értelmezés Ökonometriai modellek paraméterei: számítás és értelmezés Írta: Werger Adrienn, Renczes Nóra, Pereszta Júlia, Vörösházi Ágota, Őzse Adrienn Javította és szerkesztette: Ferenci Tamás (tamas.ferenci@medstat.hu)

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Diagnosztika és előrejelzés

Diagnosztika és előrejelzés 2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Bevezetés az ökonometriába

Bevezetés az ökonometriába Bevezetés az ökonometriába Többváltozós regresszió: nemlineáris modellek Ferenci Tamás MSc 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Hetedik előadás, 2010. november 10.

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

1. Ismétlés Utóbbi előadások áttekintése IV. esettanulmány Uniós országok munkanélkülisége... 1

1. Ismétlés Utóbbi előadások áttekintése IV. esettanulmány Uniós országok munkanélkülisége... 1 Tartalom Tartalomjegyzék 1. Ismétlés 1 1.1. Utóbbi előadások áttekintése.................................. 1 2. IV. esettanulmány 1 2.1. Uniós országok munkanélkülisége................................

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék Dummy változók használata Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Hetedik fejezet Tartalom IV. esettanulmány 1 IV. esettanulmány Uniós országok munkanélkülisége

Részletesebben

Bevezetés a Korreláció &

Bevezetés a Korreláció & Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Mi a véletlen? Determinisztikus vs. Véletlen esemény? Véletlenszám: számok sorozata, ahol véletlenszerűen követik egymást az elemek Pszeudo-véletlenszám

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Principal Component Analysis Principal Component Analysis Definíció Ortogonális transzformáció, amely az adatokat egy új koordinátarendszerbe transzformálja úgy, hogy a koordináták

Részletesebben

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése

Részletesebben

Ökonometria I. Ferenci Tamás április 10.

Ökonometria I. Ferenci Tamás április 10. 1 Ökonometria I. Ferenci Tamás tamas.ferenci@medstat.hu 2018. április 10. 2 Tartalomjegyzék 1. Út az ökonometriához 5 1.1. Bevezetés, alapgondolatok................................. 5 1.1.1. A közgazdasági

Részletesebben

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Nyolcadik fejezet Tartalom V. esettanulmány 1 V. esettanulmány Csődelőrejelzés 2 Általános gondolatok 3 becslése

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2 Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

Többváltozós lineáris regressziós modell feltételeinek tesztelése II. Többváltozós lineáris regressziós modell feltételeinek tesztelése II. - A magyarázó változóra vonatkozó feltételek tesztelése - Optimális regressziós modell kialakítása - Kvantitatív statisztikai módszerek

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari

Részletesebben

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK

LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK 2004 november 29. 1.) Lisztbogarak súlyvesztése 9 lisztbogár-csapat súlyát megmérték, (mindegyik 25 bogárból állt, mert egyenként túl kis súlyúak

Részletesebben

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei A Gauss-Jordan elimináció, mátrixinvertálás Gauss-Jordan módszer Ugyanazzal a technikával, mint ahogy a k-adik oszlopban az a kk alatti elemeket kinulláztuk, a fölötte lévő elemeket is zérussá lehet tenni.

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv Mérések, mérési eredmények, mérési bizonytalanság A mérések általános és alapvető metrológiai fogalmai és definíciói mérés Műveletek összessége, amelyek célja egy mennyiség értékének meghatározása. mérési

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés

II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés Nagyon könnyen megfigyelhetjük, hogy akármilyen két számmal elindítunk egy Fibonacci sorozatot, a sorozat egymást követő tagjainak

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Matematikai statisztika Gazdaságinformatikus MSc október 8. lineáris regresszió. Adatredukció: Faktor- és főkomponensanaĺızis.

Matematikai statisztika Gazdaságinformatikus MSc október 8. lineáris regresszió. Adatredukció: Faktor- és főkomponensanaĺızis. i Matematikai statisztika Gazdaságinformatikus MSc 6. előadás 2018. október 8. 1/52 - Hol tartottunk? Modell. Y i = β 0 + β 1 X 1,i + β 2 X 2,i +... + β k X k,i + u i i minden t = 1,..., n esetén. X i

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

III. Kvantitatív változók kapcsolata (korreláció, regresszió) III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással

Részletesebben

Line aris f uggv enyilleszt es m arcius 19.

Line aris f uggv enyilleszt es m arcius 19. Lineáris függvényillesztés 2018. március 19. Illesztett paraméterek hibája Eddig azt néztük, hogy a mérési hiba hogyan propagál az illesztett paraméterekbe, ha van egy konkrét függvényünk. a hibaterjedés

Részletesebben

Számítógépes döntéstámogatás. Statisztikai elemzés

Számítógépes döntéstámogatás. Statisztikai elemzés SZDT-03 p. 1/22 Számítógépes döntéstámogatás Statisztikai elemzés Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-03 p. 2/22 Rendelkezésre

Részletesebben