A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )"

Átírás

1 Kabos: Adatelemzés Regresszió-1 Regresszió (az adatelemzésben): Y (x n ) = l(x n ) + ε n, n = 1, 2,.., N, ahol ε 1,.., ε N független N(0, σ 2 ) eloszlású valószínűségi változók, és σ ismeretlen paraméter, és l( ) ismert paraméteres függvény, és {x 1, x 2,.., x N } ismert értékek. Lineáris regresszió: l(x n a, b) = a + b x n ahol a és b ismeretlen paraméterek. Bemenő adatok: {(x 1, y 1 ), (x 2, y 2 ),.., (x N, y N )} ahol y n egy megfigyelés Y (x n )-re, n = 1, 2,.., N A modellben az X és Y változó szerepe nem egyenrangú: Y (x n ) valószínűségi változó, mely az X = x n esemény bekövetkezése mellett van értelmezve. X lehet valószínűségi változó (pl ha X=testmagasság és Y =testsúly, akkor Y (x n ) eloszlása írja le a populációban az x n testmagasságú emberek testsúlyának eloszlását), de az is lehet, hogy X nem-valószínűségi jellegű (pl x 1, x 2,.., x n ismert időpontok, amikor Y megfigyelhető). Lin.regresszió legkisebb négyzetes (LS) paraméterbecslése: az l(x a, b) függvény a és b paramétereinek azon értékei, melyre a ( 2 y n l(x n a, b)) négyzetösszeg a eléri a minimumát. Jelölés: â és ˆb és ˆσ 2 a lineáris regressziós modell paramétereinek LS becslése, és ŷ n SSQ Y = SSQ Y.R = SSQ Y.W = = l(x n â, ˆb) ( y n y ) 2 ( ŷ n ŷ ) 2 ( y n ŷ n ) 2 (az Y változón megfigyelt teljes SSQ) (a regresszió által megmagyarázott SSQ) (a meg nem magyarázott SSQ)

2 Kabos: Adatelemzés Regresszió-2 Ezek között a mennyiségek között fennáll az ANOVA egyenlet: SSQ Y = SSQ Y.R + SSQ Y.W Jegyezzük meg, hogy az ŷ n -ek átlaga = y n -ek átlaga, képletben: ŷ = 1 ŷ n = 1 y n = y N N és a lin.regressziós LS egyenes átmegy a (x, y ) ponton. LS paraméterbecslések: ˆσ 2 = 1 N 2 SSQ SCP XY Y.W és ˆb = SSQ X és â = y x ˆb ahol x = 1 N x n és SCP XY = (x n x ) (y n y ) SSQ X = (x n x ) 2 és SSQ Y = (y n y ) 2 r XY = SCP XY SSQX SSQ Y (tapasztalati korrelációs együttható) A tapasztalati korrelációs együttható négyzete: r 2 XY = SSQ Y.R SSQ Y A H 0 : b = 0 hipotézis azt jelenti, hogy az X változónak nincs lineáris hatása az Y változóra, de azt nem jelenti, hogy X és Y függetlenek lennének. H 0 vizsgálára a próbastatisztika S = (N 2) SSQ Y.R SSQ Y.W S F 1,(N 2) (szavakban: S eloszlása 1, (N 2) szab.fokú F ), ha H 0 igaz. Egyoldali próbát kell végezni, azaz a 0.05 szignifikancia szintű elfogadási tartomány felső határa az F 1,(N 2) eloszlás 0.95 kvantilise.

3 Kabos: Adatelemzés Regresszió-3 A regressziós egyenes illeszkedésére vonatkozó próbák, illetve a modell egyes paramétereire vonatkozó próbák az alábbi állításokon alapulnak: SSQ Y.W khi-négyzet eloszlású (N 2 szabadságfok mellett), SSQ Y.R khi-négyzet eloszlású (1 szabadságfok mellett) és függetlenek, â szórásnégyzete = 1 N σ2, ˆb szórásnégyzete = 1 SSQ X σ 2 Durbin-Watson próba statisztikája / N S = (y n ŷ n ) (y n 1 ŷ n 1 ) (y n ŷ n ) 2, ahol az n=2 y indexek úgy vannak rendezve, hogy x 1 x 2... x N teljesüljön. Ez a teszt azt vizsgálja, hogy az x-ben szomszédos y reziduumokban kimutatható-e autokorreláció. Regressziós függvény (a matematikai statisztikában) az l(x) = E { Y X = x } feltételes várhatóérték. Belátható, hogy ha {(x 1, y 1 ), (x 2, y 2 ),.., (x N, y N )} EVM az (X, Y ) valószínűségi változópárra, melynek eloszlása kétdimenziós normális, akkor l(x) lineáris függvény, melynek paramétereire az előző lapon írtak szerint lehet becslést adni ill. hipotézisvizsgálatot végezni. A lineáris regresszió LS paraméterbecslései max. likelihood tulajdonságúak és torzítatlanok. LS függvényillesztés: adott a G = { } g(x a, b, c, d,...) paraméteres függvény-család, az {(x 1, y 1 ), (x 2, y 2 ),.., (x N, y N )} ponthalmazhoz ( ) 2 megkeressük G azon elemét, melyre a y n g(x n a, b) négyzetösszeg eléri a minimumát.

4 Kabos: Adatelemzés Regresszió-4 Akkor beszélünk lineáris LS függvényillesztésről, amikor G az a, b, c,.. paraméterekben lineáris, tekintet nélkül arra, hogy az x argumentumban lineáris-e. Fix osztópontokkal vett szakaszonként lineáris függvényillesztés: { } G = szakaszonként lineáris, az osztópontokban (is) folytonos függvény függvény-családból választjuk ki az {(x 1, y 1 ), (x 2, y 2 ),.., (x N, y N )} ponthalmazhoz LS értelemben legjobban illeszkedő függvényt. Spline függvényillesztés egyik legegyszerűbb változatában G szakaszonként harmadfokú polinomokból áll, melyek az osztópontokban (is) folytonosak, első és második deriváltjaik szintén. G minden elemén értelmezve van egy simasági pontszám (a simább függvény kisebb pontszámot kap). A másik tekintetbe vett tényező az {(x 1, y 1 ), (x 2, y 2 ),.., (x N, y N )} pontoktól vett LS távolság. A felhasználó megadhat egy váltószámot (trade-off), amely meghatározza, hogy a célfüggvény milyen arányban vegye számításba a függvény simaságát, és milyen arányban az illeszkedést. A spline módszer ezekután kiválasztja a G családból a célfüggvény szerinti optimális elemet (optimalizálva az osztópontok számát és elhelyezkedését is). Fontos észrevenni, hogy az LS függvényillesztés és az azt követő módszerek tárgyalásakor nem volt szó statisztikai modellről, így itt a statisztikai következtetés szokott módszereit nem használhatjuk. Az itt elmondott heurisztikus eljások az elemzési gyakorlatban eléggé elterjedtek. Léteznek olyan standard statisztikai modellek, melyek hasonlóan flexibilisek, ámde ezek többnyire sztochasztikus szimuláción alapulnak, és eléggé intenzív a számításigényük.

5 Lineáris Regresszió Temperature monthly averages, April, temperature ave years Az évek áprilisi havi középhőmérsékleti adatok és a (legkisebb négyzetek módszerével illesztett) regressziós egyenes. A megfigyelt adatokat zöld színű, a regressziós egyenest piros pontok jelzik. Az egyenes elhelyezkedése olyan, hogy a "lehető legközelebb" legyen az összes megfigyelt adathoz. A pont "távolsága" a regressziós egyenestől nem a mértani távolság szerint értendő. A mértanban az egyenesre merőlegesen kell mérni a távolságot, itt mindig az y-tengellyel párhuzamosan. Estimate Std. Error t value Pr(> t ) (Intercept) (Slope) A lineáris regressziós becslés szerint az egyenes meredeksége 0.05 szinten szignifikáns, értéke pozitív. A számítás SSQ Y.R és SSQ Y.W értelmezésével kezdődik:

6 Lineáris regresszió Temperature monthly averages, April, temperature ave ŷ n y n ŷ n y n years A meg nem magyarázott négyzetösszeg = SSQ Y.W = (y n ŷ n ) 2 = a mintabeli értékek y n (zöld pont) és a regressziós egyenesen a megfelelő ŷ n (piros pont) távolságnégyzeteinek összege. A megmagyarázott négyzetösszeg = SSQ Y.R = (ŷ n ŷ ) 2

7 április hónapjainak napi átlaghőmérsékletei, boxplot ábrázolásban. A szaggatott vonal a mintaterjedelem (range), a doboz az interkvartilis, a fekete csillag a medián helyét jelenti. A kiugró értéket különálló pont ábrázolja. A piros pont = havi átlaghőmérséklet. Regresszió: X az évek , Y: a 3000 áprilisi napi átlaghőmérséklet Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) (Slope) R-squared: F-statistic: on 1 and 2998 DF, p-value: Regresszió: X az évek , Y: a 100 áprilisi havi átlaghőmérséklet Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) (Slope) R-squared: F-statistic: on 1 and 98 DF, p-value: Az együtthatók becslése változatlan, de változik az SH, a megmagyarázott szórásnégyzet aránya, a szignif szint.

8 Széria-korrelációs teszt Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) (Slope) <2e-16 *** Multiple R-squared: F-statistic: on 1 and 98 DF, p-value: < 2e-16

9 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** (Slope) < 2e-16 *** Multiple R-squared: F-statistic: on 1 and 98 DF, p-value: < 2e-16 Az ábrákon jól látjuk, hogy az első példában valóban lineáris kapcsolat van a két változó között, viszont a második példában nem. Arra kell felfigyelni, hogy az R 2 (korreláció négyzet) statisztika nem mutatja ezt a különbséget, sőt a 2. példában egy picit még nagyobb is a korreláció, mint az 1. példában. Kiválóan mutatja viszont a különbséget a Durbin-Watson széria-korrelációs teszt, mely az 1. példában nem szignifikáns, viszont a 2. példában igen.

10 érmedobás Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 9.883e e <2e-16 *** (Slope) 6.561e e <2e-16 *** Multiple R-squared: F-statistic: 3.24e+04 on 1 and DF, p-value:< 2e-16 A lineáris regresszió (az N = mintanagyság ellenére) teljesen félrevezető eredményt ad, a regressziós egyenesnek sem a tengelymetszete, sem a meredeksége nem különbözhetne szignifikánsan 0-tól.

11

12 ISSP sport2007 adatfelvétel. tesmagasság és testsúly adatok Lineáris regresszió, két csoport WEIGHT Finland Uruguay HEIGHT Egy ábrán látjuk a finn (piros) és az uruguayi (kék) mintát, és a két mintára külön-külön illesztett regressziós egyenest. A Finnországi mintanagyság N = 1328 az átlagos magasság = cm, átlagos súly = kg Az Uruguayi mintanagyság N = 1298 az átlagos magasság = cm, átlagos súly = kg A két minta együtt: N = 2626 az átlagos magasság = cm, átlagos súly = kg Azt vizsgáljuk, különbözik-e a két mintában 1. a testsúly, 2. a testmagasság, 3. a testsúly és a testmagasság kapcsolata.

13 Regression HEIGHT ~ COUNTRY Analysis of Variance Table Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** COUNTRY <2e-16 *** Regression WEIGHT ~ COUNTRY Analysis of Variance Table Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** COUNTRY e-11 *** A regresszió magyarázó változója (COUNTRY) kétértékű, és azt jelzi, hogy az illető melyik országban él. A regresszió kimeneti változója a (HEIGHT) testmagasság ill. a(weight) testsúly. Az eredmények azt mutatják, hogy szignifikáns különbség van finnek és urugayiak között, mind testsúly, mind testmagasság tekintetében.

14 A most következő regressziós elemzésben becsült együtthatók: a tengelymetszet, az országonként különböző tengelymetszet, a testmagasság regressziós együtthatója, a testmagasság országonként különböző regressziós együtthatója. Multiple Regression WEIGHT ~ COUNTRY + HEIGHT + HEIGHT:COUNTRY Analysis of Variance Table Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** COUNTRY HEIGHT < 2e-16 *** HEIGHT:COUNTRY Multiple R-squared: F-statistic: on 3 and 2622 DF, p-value: < 2.2e-16 Ha azokat a statisztikusokat követjük, akik a nem szignifikáns tényezőket eltávolítják a modellből, akkor az országonként különböző együtthatók kiesnek. Ezzel azt a választ kapjuk a bevezetőben írt 3. kérdésre, hogy ugyanaz a regressziós egyenes írja le a testsúly és testmagasság kapcsolatát mindkét országban.

15 Ebben az elemzésben a következő sorrendben vonjuk be a magyarázó változókat a modellbe: COUNTRY, HEIGHT, COUNTRY&HEIGHT interakcó Sequential ANOVA Analysis of Variance Table Model 1: WEIGHT ~ 1 Model 2: WEIGHT ~ COUNTRY Model 3: WEIGHT ~ COUNTRY + HEIGHT Model 4: WEIGHT ~ COUNTRY + HEIGHT + COUNTRY:HEIGHT Res.Df RSS Df Sum of Sq F Pr(>F) e-14 *** < 2.2e-16 *** Az eredmény úgy értelmezhető, hogy a COUNTRY önmagában jelentős magyarázóerőt képvisel, de a HEIGHT bevonása után az interakciós tagra már nincs szükség.

16 Ebben az elemzésben a következő sorrendben vonjuk be a magyarázó változókat a modellbe: HEIGHT, COUNTRY, HEIGHT&COUNTRY interakcó Sequential ANOVA Analysis of Variance Table Model 1: WEIGHT ~ 1 Model 2: WEIGHT ~ HEIGHT Model 3: WEIGHT ~ HEIGHT + COUNTRY Model 4: WEIGHT ~ HEIGHT + COUNTRY + HEIGHT:COUNTRY Res.Df RSS Df Sum of Sq F Pr(>F) < 2e-16 *** * Az eredmény úgy értelmezhető, hogy a COUNTRY még a HEIGHT bevonása után is eléggé jelentős magyarázóerőt képvisel, de az interakciós tagra már nincs szükség.

17 Lineáris regresszió, két csoport WEIGHT Finland Uruguay HEIGHT Finland Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** (Slope) <2e-16 *** Multiple R-squared: F-statistic: on 1 and 1326 DF, p-value: < 2e-16 Uruguay Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** (Slope) <2e-16 *** Multiple R-squared: F-statistic: 416 on 1 and 1296 DF, p-value: < 2e-16

18 Lineáris regresszió, két csoport WEIGHT ~ polinom(height) WEIGHT Finland Uruguay HEIGHT Finland Coefficients: Estimate Std.Error t value Pr(> t ) (Intercept) (Slope) (2nd order) * Multiple R-squared: F-statistic: on 2 and 1325 DF, p-value: < 2e-16 Uruguay Coefficients: Estimate Std.Error t value Pr(> t ) (Intercept) *** (Slope) *** (2nd order) e-05 *** Multiple R-squared: F-statistic: on 2 and 1295 DF, p-value: < 2e-16

19 Transzformált regresszió, két csoport log(weight) ~ HEIGHT WEIGHT Finland Uruguay HEIGHT Finland Multiple R-squared: F-statistic: on 1 and 1326 DF, p-value: < 2e-16 Uruguay Multiple R-squared: F-statistic: on 1 and 1296 DF, p-value: < 2e-16 A lineáris regressziós illeszkedés R 2 értékét felülmúlja a 2-rendű polinomiális illesztés, ezt felülmúlja a log transzormált illesztése, mindez azonban nem jelent statisztikai bizonyítékot arra, hogy a legjobban illeszkedő modell írja le legjobban az összefüggést.

20 Kvantilis regresszió HEIGHT WEIGHT : 0.95 kvantilis : 0.75 kvantilis : 0.5 kvantilis : 0.25 kvantilis : 0.05 kvantilis LS regresszió: a ( y n l(x n )) 2 min feltételt teljesítő egyenest választjuk. 0.5-kvantilis (=medián) regresszió: ugyanez, csak a y n l(x n ) min feltételt teljesítő egyenest választjuk. q kvantilis regresszió: legyen h(t) = { q t, ha t 0 (1 q) t, ha t < 0 és a h ( y n l(x n ) ) min feltételt teljesítő egyenest választjuk.

21 Monoton regresszió 300 EUR/HUF JUL AUG SEP SEP OCT OCT NOV DEC DEC JAN FEB MAR MAR APR08 Monoton növekedő függvény f(x), ha x 1 < x 2 esetén f(x 1 ) f(x 2 ) teljesül. Monoton növekedő LS regresszió: ( 2 y n g(x n )) min feltételt teljesítő g G függvényt választjuk. Ez a g görbe egy lépcsősfüggvény. Az algoritmus az x-ek tartományát osztópontokkal intervallumokra osztja, a g függvény értéke egy-egy intervallumon belül nem változik, és egyenlő az ebbe az intervallumba eső x-ekhez tartozó y-ok átlagával. Ahol az EUR/HUF értéke folyamatosan emelkedik, ott ezek az intervallumok egészen rövidek (egy-egy nap), ahol EUR/HUF ingadozik, ott hosszabb intervallumok vannak (2008 október közepétől december végéig egy intervallum).

22 Lokális függvényillesztés Fix osztópontokkal vett szakaszonként lineáris függvényillesztésnél az x változó értéktartományában megadott osztópontok (az 1. példában egyenletesen elhelyezett 4 osztópont szerepel) meghatározta szakaszokon lineáris, az osztópontokban folytonosan illeszkedő töröttvonal közelíti az adathalmazt. A bemutatott példák rávilágítanak arra, hogy az osztópontok önkényes meghatározása jelentősen befolyásolja az eljárás megbízhatóságát.

23

24 A spline regressziós függvény itt alkalmazott változatában szakaszonként harmadfokú polinomokból áll, melyek az osztópontokban másodrendben folytonosan illeszkednek, ami azt jelenti, hogy az osztópontokban a függvény baloldali és jobboldali határértéke egyenlő, és ugyanez teljesül az első deriváltakra és a második deriváltakra is. A bemutatott 1. példában a spline függvény simább, de kevésbé illeszkedik az adathalmaz pontjaihoz, a 2. és a 3. példában a spline függvény egyre kevésbé sima, de ennek árán egyre jobb az adathalmaz pontjaihoz való illeszkedés.

25

Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet

Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet Kabos: Statisztika II. Összefüggésvizsgálat 11.9 Slide 1 Slide 1 Slide 1 Összefüggésvizsgálat 2. Regresszió és ANOVA Összefüggésvizsgálat összehasonlítása 2. Regresszió és ANOVA Összefüggésvizsgálat összehasonlítása

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,

Részletesebben

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2 Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Statisztikai becslés

Statisztikai becslés Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Statisztika II előadáslapok. 2003/4. tanév, II. félév Statisztika II előadáslapok 3/4 tanév, II félév BECSLÉS ÉS HIPOTÉZISVIZSGÁLAT Egyik konzervgyár vágott zöldbabot exportál A szabvány szerint az üvegek nettó töltősúlyának az átlaga 3 g, a szórása 5 g Az

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

III. Kvantitatív változók kapcsolata (korreláció, regresszió) III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással

Részletesebben

: az i -ik esélyhányados, i = 2, 3,..I

: az i -ik esélyhányados, i = 2, 3,..I Kabos: Adatelemzés Ordinális logisztikus regresszió-1 Többtényezős regresszió (az adatelemzésben): Y közelítése b 1 X 1 + b 2 X 2 +... + b J X J alakban, y n = b 1 x n,1 + b 2 x n,2 +... + b J x n,j +

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Bevezetés a Korreláció &

Bevezetés a Korreláció & Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

Logisztikus regresszió október 27.

Logisztikus regresszió október 27. Logisztikus regresszió 2017. október 27. Néhány példa Mi a valószínűsége egy adott betegségnek a páciens bizonyos megfigyelt jellemzői (pl. nem, életkor, laboreredmények, BMI stb.) alapján? Mely genetikai

Részletesebben

Regresszió számítás az SPSSben

Regresszió számítás az SPSSben Regresszió számítás az SPSSben Kvantitatív statisztikai módszerek Petrovics Petra Lineáris regressziós modell X és Y közötti kapcsolatot ábrázoló egyenes. Az Y függ: x 1, x 2,, x p p db magyarázó változótól

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

Lineáris regresszió vizsgálata resampling eljárással

Lineáris regresszió vizsgálata resampling eljárással Lineáris regresszió vizsgálata resampling eljárással Dolgozatomban az European Social Survey (ESS) harmadik hullámának adatait fogom felhasználni, melyben a teljes nemzetközi lekérdezés feldolgozásra került,

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

A többváltozós lineáris regresszió 1.

A többváltozós lineáris regresszió 1. 2018. szeptember 17. Lakásár adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó változók segítségével Legegyszerűbb eset - kétváltozós

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Számítógépes döntéstámogatás. Statisztikai elemzés

Számítógépes döntéstámogatás. Statisztikai elemzés SZDT-03 p. 1/22 Számítógépes döntéstámogatás Statisztikai elemzés Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-03 p. 2/22 Rendelkezésre

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Diagnosztika és előrejelzés

Diagnosztika és előrejelzés 2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

c adatpontok és az ismeretlen pont közötti kovariancia vektora

c adatpontok és az ismeretlen pont közötti kovariancia vektora 1. MELLÉKLET: Alkalmazott jelölések A mintaterület kiterjedése, területe c adatpontok és az ismeretlen pont közötti kovariancia vektora C(0) reziduális komponens varianciája C R (h) C R Cov{} d( u, X )

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Lineáris regressziószámítás 1. - kétváltozós eset

Lineáris regressziószámítás 1. - kétváltozós eset Lineáris regressziószámítás 1. - kétváltozós eset Orlovits Zsanett 2019. február 6. Adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála a független változó: névleges vagy sorrendi vagy folytonos skála BIOMETRIA2_NEMPARAMÉTERES_5 1 Y: visszafizeti-e a hitelt x: fizetés (életkor)

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687) STATISZTIKA 10. Előadás Megbízhatósági tartományok (Konfidencia intervallumok) Sir Isaac Newton, 1643-1727 Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Részletesebben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Khi-négyzet eloszlás. Statisztika II., 3. alkalom Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Minitab 16 újdonságai május 18

Minitab 16 újdonságai május 18 Minitab 16 újdonságai 2010. május 18 Minitab 16 köszöntése! A Minitab statisztikai szoftver új verziója több mint hetven újdonságot tartalmaz beleértve az erősebb statisztikai képességet, egy új menüt

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton Osztályozás, regresszió Nagyméretű adathalmazok kezelése Tatai Márton Osztályozási algoritmusok Osztályozás Diszkrét értékkészletű, ismeretlen attribútumok értékének meghatározása ismert attribútumok értéke

Részletesebben

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program Regresszió számítás GeoEasy V2.05+ Geodéziai Kommunikációs Program DigiKom Kft. 2006-2010 Tartalomjegyzék: Egyenes x változik Egyenes y változik Egyenes y és x változik Kör Sík z változik Sík y, x és z

Részletesebben

5. előadás - Regressziószámítás

5. előadás - Regressziószámítás 5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Többváltozós Regresszió-számítás

Többváltozós Regresszió-számítás Töváltozós Regresszió-számítás 3. előadás Döntéselőkészítés módszertana Dr. Szilágyi Roland Korreláció Célja a kacsolat szorosságának mérése. Regresszió Célja a kacsolatan megfigyelhető törvényszerűség

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Populációbecslés és monitoring. Eloszlások és alapstatisztikák Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk

Részletesebben

Korreláció, regresszió. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Korreláció, regresszió. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet Korreláció, regresszió Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet Két folytonos változó közötti kapcsolat Tegyük fel, hogy 6 hallgató a következő válaszokat adta egy felmérés

Részletesebben

Alkalmazott statisztika feladatok

Alkalmazott statisztika feladatok Alkalmazott statisztika feladatok 1. Leíró statisztikák és grakonok 1.1. a. Olvassuk be a Davis adatsort a car vagy a cardata csomagból! Ábrázoljuk a weight változó boxplotját, majd értelmezzük az outlier

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

13. Túlélési analízis. SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D.

13. Túlélési analízis. SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D. 13. Túlélési analízis SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D. Túlélési analízis Eredetileg biológiai és orvosi alkalmazásoknál használták Egyéb alkalmazások pl. szociológia, ipar, közgazdaságtan

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Az egyenlőtlenség mindkét oldalát szorozzuk meg 4 16-al:

Az egyenlőtlenség mindkét oldalát szorozzuk meg 4 16-al: Bevezető matematika kémikusoknak., 04. ősz. feladatlap. Ábrázoljuk számegyenesen a következő egyenlőtlenségek megoldáshalmazát! (a) x 5 < 3 5 x < 3 x 5 < (d) 5 x

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások. 1. Az alábbi hozzárendelések közül melyik függvény? Válaszod indokold!

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások. 1. Az alábbi hozzárendelések közül melyik függvény? Válaszod indokold! Megoldások 1. Az alábbi hozzárendelések közül melyik függvény? Válaszod indokold! A: Minden emberhez hozzárendeljük a munkahelyének nevét. B: Minden valós számhoz hozzárendeljük az ellentettjét. C: Minden

Részletesebben

1. Görbe illesztés a legkissebb négyzetek módszerével

1. Görbe illesztés a legkissebb négyzetek módszerével GÖRBE ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL. Görbe illesztés a legkissebb négyzetek módszerével Az előző gyakorlaton megismerkedtünk a korrelációs együttható fogalmával és számítási módjával. A korrelációs

Részletesebben