Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet"

Átírás

1 Kabos: Statisztika II. Összefüggésvizsgálat 11.9 Slide 1 Slide 1 Slide 1 Összefüggésvizsgálat 2. Regresszió és ANOVA Összefüggésvizsgálat összehasonlítása 2. Regresszió és ANOVA Összefüggésvizsgálat összehasonlítása 2. Freedman: fejezet Regresszió és ANOVA összehasonlítása Freedman: fejezet Slide 2 Slide 2 Slide 2 Slide 3 Slide 3 Slide 3 Összehasonlító példák Freedman: fejezet áprilisi havi középhőmérsékletei áprilisi napi középhőmérsékletei Az Összehasonlító első példában példák a magyarázó változó 100 értéke mellett a függő áprilisi változó havi 100 középhőmérsékletei értékét (havi átlag) elemezzük áprilisi napi középhőmérsékletei Az Összehasonlító első példában példák a magyarázó változó 100 értéke mellett a függő áprilisi változó havi100 középhőmérsékletei értékét (havi átlag) elemezzük áprilisi napi középhőmérsékletei Az első példában a magyarázó változó 100 értéke mellett a függő változó 100 értékét (havi átlag) A második példában a magyarázó változó 100 értéke elemezzük. mellett 3000 nap (=100*30) adatait elemezzük, a magyarázó változó 100 értéke mellett ezért: A második csak az példában részt a magyarázó ábrázoltuk változó (a számítások 100 értékea többi mellett részre 3000is nap kiterjednek), (=100*30) adatait elemezzük, a magyarázó boxplot ábra: változó egymás 100 értéke mellémellett helyezett ezért: napi átlag, medián, A második csak az interkvartilis példában részt arange, magyarázó ábrázoltuk mintaterjedelem. változó (a számítások 100 értékea többi mellett részre 3000is nap kiterjednek), (=100*30) adatait elemezzük, a magyarázó boxplot ábra: változó egymás 100 értéke mellémellett helyezett ezért: napi átlag, medián, csak az interkvartilis részt range, ábrázoltuk mintaterjedelem. (a számítások a többi részre is kiterjednek), boxplot ábra: egymás mellé helyezett napi átlag, medián, interkvartilis range, mintaterjedelem.

2 Kabos: Statisztika II. Összefüggésvizsgálat Lineáris Regresszió April, Lineáris Regresszió April, years Az évek áprilisi Lineáris havi középhőmérsékleti Regresszió adatok és a (legkisebb négyzetek módszerével illesztett) regressziós egyenes. A megfigyelt adatokat 1900 zöld 1920 színű, April, 1940a regressziós egyenest 2000 piros pontok jelzik. years Az évek áprilisi havi középhőmérsékleti adatok és a Az egyenes (legkisebb elhelyezkedése négyzetek módszerével olyan, hogy illesztett) a "lehető regressziós legközelebb" egyenes. legyen A az megfigyelt összes megfigyelt adatokat zöld adathoz. színű, a A regressziós pont "távolsága" egyenest piros a regressziós pontok egyenestől jelzik. nem a mértani távolság szerint értendő. A mértanban az egyenesre merőlegesen kell mérni a távolságot, Az egyenes elhelyezkedése olyan, hogy a "lehető legközelebb" itt mindig legyen az az y-tengellyel összes megfigyelt párhuzamosan. adathoz. A pont "távolsága" a regressziós egyenestől nem a mértani távolság szerint értendő. A mértanban az egyenesre merőlegesen kell mérni a távolságot, itt mindig az y-tengellyel párhuzamosan (Intercept) (Slope) years (Intercept) A lineáris regressziós becslés szerint az egyenes meredeksége (Slope) Az évek áprilisi havi középhőmérsékleti adatok és a 0.05 szinten szignifikáns, értéke pozitív. (legkisebb négyzetek módszerével illesztett) regressziós egyenes. A lineáris megfigyelt regressziós adatokat becslés zöld színű, szerint a regressziós az egyenes egyenest meredeksége piros A számítás 0.05 pontok szinten SSQ jelzik. Y.R szignifikáns, és SSQ Y.W értéke értelmezésével pozitív. kezdődik: A Az számítás egyenes elhelyezkedése SSQ Y.R SSQolyan, Y.W értelmezésével hogy a "lehető kezdődik: legközelebb" legyen az összes megfigyelt adathoz. A pont "távolsága" a regressziós egyenestől nem a mértani távolság szerint értendő. A mértanban az egyenesre merőlegesen kell mérni a távolságot, itt mindig az y-tengellyel párhuzamosan. (Intercept) (Slope) A lineáris regressziós becslés szerint az egyenes meredeksége 0.05 szinten szignifikáns, értéke pozitív. A számítás SSQ Y.R és SSQ Y.W értelmezésével kezdődik:

3 Kabos: Statisztika II. Összefüggésvizsgálat április hónapjainak napi átlaghőmérsékletei, boxplot ábrázolásban. A szaggatott vonal a mintaterjedelem (range), a doboz az interkvartilis, a fekete csillag a medián helyét jelenti. A kiugró értéket különálló pont ábrázolja. A piros pont = havi átlaghőmérséklet. Regresszió: X az évek , Y: a 3000 áprilisi napi átlaghőmérséklet (Intercept) április hónapjainak napi átlaghőmérsékletei, 0 (Slope) boxplot ábrázolásban. A szaggatott vonal a mintaterjedelem R-squared: (range), F-statistic: a doboz az interkvartilis, on 1 and 2998 DF, a fekete p-value: csillag a medián helyét jelenti. A kiugró értéket különálló pont ábrázolja. A piros Regresszió: pont = X havi az évek átlaghőmérséklet , Y: a 100 áprilisi havi átlaghőmérséklet Regresszió: X Estimate az évek Std , Error t value Pr(> t ) (Intercept) Y: (Slope) a 3000 áprilisi napi átlaghőmérséklet R-squared: F-statistic: Estimate on 1 Std. and 98 Error DF, t p-value: Pr(> t ) (Intercept) (Slope) Az együtthatók becslése változatlan, de változik az SH, R-squared: a megmagyarázott szórásnégyzet aránya, a szignif szint. F-statistic: on 1 and 2998 DF, p-value: Regresszió: április X az évek hónapjainak , napi átlaghőmérsékletei, boxplot Y: a 100 ábrázolásban. áprilisi havi átlaghőmérséklet A szaggatott vonal a mintaterjedelem (range), a doboz az interkvartilis, a fekete csillag a medián helyét (Intercept) jelenti A kiugró értéket különálló pont 0 ábrázolja. A (Slope) piros pont = havi átlaghőmérséklet R-squared: F-statistic: on 1 and 98 DF, p-value: Regresszió: X az évek , Az Y: a együtthatók 3000 áprilisi becslése napi átlaghőmérséklet változatlan, de változik az SH, a megmagyarázott szórásnégyzet aránya, a szignif szint. (Intercept) (Slope) R-squared: F-statistic: on 1 and 2998 DF, p-value: Regresszió: X az évek , Y: a 100 áprilisi havi átlaghőmérséklet (Intercept) (Slope) R-squared: F-statistic: on 1 and 98 DF, p-value: Az együtthatók becslése változatlan, de változik az SH, a megmagyarázott szórásnégyzet aránya, a szignif szint.

4 Kabos: Statisztika II. Összefüggésvizsgálat Slide 4 Slide 4 Slide 4 Slide 5 Slide 5 Slide 5 Slide 6 Slide 6 Slide 6 Fontos tudni, hogy a regressziós becslések csak az átlagokon (piros pontok) alapulnak. Ez a becslés legkisebb négyzetes természete miatt van, az azonos x-hez Fontostartozó tudni, y-ok hogy(egy a regressziós hónaponbecslések belüli) belső csak az szórását átlagokon az(piros illesztésnél pontok) egyáltalán alapulnak. nemezveszi a becslés figyelembe. legkisebb négyzetes természete miatt van, az azonos x-hez Fontostartozó tudni, y-ok hogy(egy a regressziós hónaponbecslések belüli) belső csak az szórását átlagokon az(piros illesztésnél pontok) egyáltalán alapulnak. nemezveszi a becslés figyelembe. legkisebb négyzetes természete miatt van, az azonos x-hez tartozó y-ok (egy hónapon belüli) belső figyelembe. A példában a 3000 napi átlagra vett regressziós becslés azért egyezik meg a 100 havi átlagra vett regressziós becsléssel, mert minden x-hez ugyanannyi A(=30) példában y tartozik. a 3000Ha napi ez nem átlagra ígyvett lenne, regressziós akkor az becslés átlagokat azért a hozzájuk egyezik meg tartozó a 100 pontok havi számával átlagra vett regressziós súlyozottanbecsléssel, kell számolni. mert minden x-hez ugyanannyi A(=30) példában y tartozik. a 3000Ha napi ez nem átlagra ígyvett lenne, regressziós akkor az becslés átlagokat azért a hozzájuk egyezik meg tartozó a 100 pontok havi számával átlagra vett regressziós súlyozottanbecsléssel, kell számolni. mert minden x-hez ugyanannyi (=30) y tartozik. Ha ez nem így lenne, akkor az Az átlagokat összes apontot hozzájuk figyelembe tartozókell pontok venni számával az SH, r 2 és a szignifikancia súlyozottan kell számításánál. számolni. Mindkét példában a regresszió szignifikáns 0.05-on (a AzHösszes 0 hipotézist pontotel figyelembe kell utasítani). kell venni az SH, r 2 és a szignifikancia A számított regressziós számításánál. együttható az Mindkét átlaghőmérséklet példábanévenkénti a regresszió szignifikáns C fokos 0.05-on emelkedését (a AzHösszes 0 hipotézist pontot jelzi. el figyelembe kell utasítani). kell venni az SH, r 2 és a Megjegyezzük, szignifikancia A számított regressziós számításánál. hogy a meteorológiai együttható azkutatásban ennél Mindkét átlaghőmérséklet sokkal példában pontosabb évenkénti a regresszió modelleket szignifikáns Chasználnak. fokos 0.05-on emelkedését (a H 0 hipotézist jelzi. el kell utasítani). Megjegyezzük, A számított regressziós hogy a meteorológiai együttható azkutatásban ennél átlaghőmérséklet sokkal pontosabb évenkénti modelleket Chasználnak. fokos emelkedését jelzi. szórását az illesztésnél egyáltalán nem veszi Megjegyezzük, hogy a meteorológiai kutatásban ennél sokkal pontosabb modelleket használnak.

5 Kabos: Statisztika II. Összefüggésvizsgálat Slide 7 Slide 7 Slide 7 Slide 8 Slide 8 Slide 8 Slide 9 Slide 9 Slide 9 Ha az X magyarázó változó szám-értékű, akkor regressziós, ha kategória-értékű akkor ANOVA modell szerint számolunk. Ezt Ha az a főszabályt X magyarázó tiszteletben változó szám-értékű, tartva három akkor példában mutatjuk regressziós, be ha ugyanazokra kategória-értékű az adatokra akkor ANOVA párhuzamosan a modell regressziós szerint és számolunk. Ha az X magyarázó az ANOVA változómodell szám-értékű, számításokat. akkor Ezt a főszabályt tiszteletben tartva három példában regressziós, ha kategória-értékű akkor ANOVA mutatjuk be ugyanazokra az adatokra párhuzamosan modell szerint számolunk. a regressziós és az ANOVA modell számításokat. Ezt a főszabályt tiszteletben tartva három példában ANOVA mutatjukegyenlet: be ugyanazokra SSQ Y = azssq adatokra Y.B + SSQ párhuzamosan Y.W Az a regressziós ANOVA SSQ és az Y.B ANOVA : a modell modell által számításokat. megmagyarázott SSQ rész mindig nagyobb, mint a regressziónál ANOVA egyenlet: a megfelelő SSQ Y SSQ = SSQ Y.B + SSQ Y.W Y.R Ennek Az ANOVA az az SSQ oka, Y.B hogy : a a modell regressziónál által van egy plusz kikötés: megmagyarázott az azonos SSQ x-hez rész tartozók mindig átlagait nagyobb, egy mint a ANOVA egyenlet: SSQ Y = SSQ Y.B + SSQ Y.W egyenesre regressziónál vetítjük. a megfelelő Az eredmény SSQ Y.R Az ANOVA SSQ kétféle lehet: az Y.B : a modell által előbbi Ennek példában az az oka, ezhogy a feltétel a regressziónál rontott azvan illeszkedés egy plusz megmagyarázott SSQ rész mindig nagyobb, mint a szignifikanciáján, kikötés: az azonosaz x-hez utóbbiban tartozók javított. átlagait egy regressziónál a megfelelő SSQ Y.R egyenesre vetítjük. Az eredmény kétféle lehet: az Ennek az az oka, hogy a regressziónál van egy plusz előbbi példában ez a feltétel rontott az illeszkedés kikötés: az azonos x-hez tartozók átlagait egy szignifikanciáján, az utóbbiban javított. egyenesre vetítjük. Az eredmény kétféle lehet: az előbbi Ha csakpéldában két különböző ez a feltétel x van, rontott akkor azregressziós illeszkedés szignifikanciáján, egyenes átmegy mindkét az utóbbiban részmintánál javított. az átlagnak megfelelő ponton. Ha Ebben csak az két esetben különböző a regresszió x van, akkor és az ANOVA a regressziós négyzetösszegei egyenes átmegy egymással mindkét részmintánál megegyező értéket az átlagnak adnak, a megfelelő szab.fokok ponton. Ha csak két különböző és a szignifikancia x van, akkor is megegyezik. a regressziós Ebben az esetben a regresszió és az ANOVA egyenes átmegy mindkét részmintánál az átlagnak négyzetösszegei egymással megegyező értéket adnak, megfelelő ponton. a szab.fokok és a szignifikancia is megegyezik. Ebben az esetben a regresszió és az ANOVA négyzetösszegei egymással megegyező értéket adnak, a szab.fokok és a szignifikancia is megegyezik.

6 Kabos: Statisztika II. Összefüggésvizsgálat April, and 25-years-April averages April, and 25-years-April averages years Regresszió: X az értéktartomány a négy kvartilisközépe: 1913, 1938, 1963, 1988 April, Y: az X-hez tartozó and 25-years-April év április averages havi átlaghőmérsékletei Estimate Std. years Error t value Pr(> t ) (Intercept) (Slope) Regresszió: X az értéktartomány a négy kvartilisközépe: 1913, 1938, 1963, 1988 Y: az X-hez tartozó 25 év április havi átlaghőmérsékletei Multiple R-squared: F-statistic: on 1 and 98 DF, p-value: ANOVA: (Intercept) X és Y ugyanaz, mint fent, de a négy 0 kvartilisközéppontot (Slope) nem illesztjük egy egyenesre Multiple R-squared: Estimate Std Error t value Pr(> t ) (Intercept) F-statistic: on and 98 DF, p-value: factor factor factor középpontot nem illesztjük years egy egyenesre Multiple R-squared: F-statistic: Estimate on 3 Std. and Error 96 DF, t p-value: Pr(> t ) (Intercept) factor2 1913, 1938, 1963, A factor3 regresszió kevesebb négyzetösszeget magyaráz, de kevesebb factor4 szab.fokkal, ezért jobb az F szignifikanciája Multiple (Intercept) R-squared: F-statistic: (Slope) on 3 and DF, p-value: ANOVA: X és Y ugyanaz, mint fent, de a négy kvartilis- Regresszió: X az értéktartomány a négy kvartilisközépe: Y: az X-hez tartozó 25 év április havi átlaghőmérsékletei Multiple R-squared: A regresszió kevesebb négyzetösszeget magyaráz, de F-statistic: on 1 and 98 DF, p-value: kevesebb szab.fokkal, ezért jobb az F szignifikanciája. ANOVA: X és Y ugyanaz, mint fent, de a négy kvartilisközéppontot nem illesztjük egy egyenesre (Intercept) factor factor factor Multiple R-squared: F-statistic: on 3 and 96 DF, p-value: A regresszió kevesebb négyzetösszeget magyaráz, de kevesebb szab.fokkal, ezért jobb az F szignifikanciája.

7 Kabos: Statisztika II. Összefüggésvizsgálat November, and 25-years-November averages November, and 25-years-November averages years Regresszió: X az értéktartomány a négy kvartilisközépe: 1913, 1938, 1963, 1988 November, Y: az X-hez tartozó and 25-years-November év november averages havi átlaghőmérsékletei Estimate Std. years Error t value Pr(> t ) (Intercept) (Slope) Regresszió: X az értéktartomány a négy kvartilisközépe: 1913, 1938, 1963, 1988 Y: az X-hez tartozó 25 év november havi átlaghőmérsékletei Multiple R-squared: F-statistic: on 1 and 98 DF, p-value: ANOVA: (Intercept) X és Y ugyanaz, mint fent, de a négy 0 kvartilisközéppontot (Slope) nem illesztjük egy egyenesre Multiple R-squared: Estimate Std Error t value Pr(> t ) (Intercept) F-statistic: on and 98 DF, p-value: factor factor factor középpontot nem illesztjük years egy egyenesre Multiple R-squared: F-statistic: Estimate on 3 Std. and Error 96 DF, t p-value: Pr(> t ) (Intercept) , 1938, 1963, 1988 factor Az factor3 ANOVA több négyzetösszeget magyaráz, és noha több factor4 szab.fokkal, mégis jobb az F szignifikanciája Multiple (Intercept) R-squared: F-statistic: (Slope) on 3 and DF, 1.68 p-value: ANOVA: X és Y ugyanaz, mint fent, de a négy kvartilis- Regresszió: X az értéktartomány a négy kvartilisközépe: Y: az X-hez tartozó 25 év november havi átlaghőmérsékletei Multiple R-squared: Az ANOVA több négyzetösszeget magyaráz, és noha F-statistic: on 1 and 98 DF, p-value: több szab.fokkal, mégis jobb az F szignifikanciája. ANOVA: X és Y ugyanaz, mint fent, de a négy kvartilisközéppontot nem illesztjük egy egyenesre (Intercept) factor factor factor Multiple R-squared: F-statistic: on 3 and 96 DF, p-value: Az ANOVA több négyzetösszeget magyaráz, és noha több szab.fokkal, mégis jobb az F szignifikanciája.

8 Kabos: Statisztika II. Összefüggésvizsgálat April, and 50-years-April averages April, and 50-years-April averages years Regresszió: X 1 = 1926 (az középpontja) és X 2 =1976 (az Temperature tartomány monthly averages, középpontja) April, Y: az X-hez tartozó év április havi átlaghőmérsékletei and 50-years-April averages years (Intercept) factor Regresszió: X 1 = (az középpontja) és X 2 =1976 (az tartomány középpontja) Y: az X-hez tartozó év április havi átlaghőmérsékletei R-squared: F-statistic: on 1 and 98 DF, p-value: ANOVA: (Intercept) X és Y ugyanaz, mint a Regressziónál factor Df Sum Sq Mean Sq F value Pr(>F) factor Residuals R-squared: F-statistic: on 1 and 98 DF, p-value: ANOVA: X és Y ugyanaz, mint a Regressziónál SSQ Y.B = Df Sum 1940 Sq Mean 1960Sq F 1980 value 2000 Pr(>F) factor SSQ Y.W = years Residuals SSQ Y = Regresszió: X F = 7.086*98/ = 1926 (az középpontja) és = R 2 X= 2 = / (az = tartomány középpontja) Y: az X-hez tartozó év április havi átlaghőmérsékletei SSQ Y.B = SSQ Y.W = (Intercept) SSQ Y = F factor = 7.086*98/ = R 2 = 7.086/ = R-squared: F-statistic: on 1 and 98 DF, p-value: ANOVA: X és Y ugyanaz, mint a Regressziónál Df Sum Sq Mean Sq F value Pr(>F) factor Residuals SSQ Y.B = SSQ Y.W = SSQ Y = F = 7.086*98/ = R 2 = 7.086/ = Slide 10 ANOVA teljesen korrekt alkalmazásának feltételei: csoportonkénti normalitás, szórás-homogenitás, a csoportok függetlensége.

9 ANOVA teljesen korrekt alkalmazásának feltételei: csoportonkénti normalitás, Slide 10 szórás-homogenitás, ANOVA a csoportok teljesen függetlensége. korrekt alkalmazásának feltételei: csoportonkénti normalitás, Slide 10 szórás-homogenitás, Kabos: Statisztika II. Összefüggésvizsgálat a csoportok függetlensége. Slide 11 Slide 11 Slide 12 Slide 12 Robosztusság a matematikai statisztikában körültekintően (de bonyolultan) definiált fogalom, melyet a statisztikai ismeretterjesztők lazán, többféle értelemben Robosztusság használnak. a matematikai Az a módszer statisztikában robosztusabb, amelyik körültekintően kevésbé(de érzékeny bonyolultan) valamely definiált fogalom, (meghatározandó) melyet a statisztikai alkalmazási ismeretterjesztők feltétel lazán, megsértésére. többféle értelemben használnak. Az a módszer robosztusabb, amelyik kevésbé érzékeny valamely (meghatározandó) alkalmazási feltétel megsértésére. Az ANOVA robosztus a csoportonkénti normalitás feltételének megsértésére, közelítően korrekt módon használható a normálistól nem nagyon eltérő eloszlások Az ANOVAesetén. robosztus Vannak a csoportonkénti a normalitástnormalitás nem feltételező feltételénekanova megsértésére, alternatívák közelítően (pl Friedman-teszt), korrekt módon de használható ezek másodfajú a normálistól hibája általában nem nagyon lényegesen eltérő nagyobb, eloszlásokmint esetén. az ANOVA-nak, Vannak a normalitást midőn anem normálistól való feltételező eltérés ANOVA nem nagy alternatívák (lásd: Hipotézisvizsg. (pl Friedman-teszt), értékelése de ezek másodfajú előadás, kiugró hibája értékek). általában lényegesen nagyobb, mint az ANOVA-nak, midőn a normálistól való eltérés nem nagy (lásd: Hipotézisvizsg. értékelése előadás, kiugró értékek). Slide 13 Az ANOVA robosztus a csoportonkénti szórások homogenitásának megsértésére, közelítően korrekt módon használható a nem nagyon eltérő csoportonkénti szórások esetén. Azt meg kell jegyezni, hogy ismertek az ANOVA olyan alternatívái (pl. Welch-próba), melyek nem feltételezik a a szórások egyenlőségét, miközben a másodfajú hiba nem nő lényegesen. Slide 14 Az ANOVA alkalmazásában a csoportok mintavételi függetlensége fontos feltétel. Ha ez nem teljesül (pl. a férfiak és nők testmagasságának eltérését olyan mintán vizsgáljuk, ahol házaspárok vannak a mintában), akkor más eljárást kell használni (pl. páros próbák).

10 homogenitásának megsértésére, közelítően korrekt módon használható a nem nagyon eltérő Slide 13 csoportonkénti Az ANOVA robosztus szórásoka esetén. csoportonkénti Azt megszórások kell jegyezni, homogenitásának hogy ismertek megsértésére, az ANOVA közelítően olyan korrekt alternatívái módon használható (pl. Welch-próba), a nem nagyon melyek eltérő nem Slide 13 feltételezik csoportonkénti a a szórások egyenlőségét, esetén. Azt meg miközben kell a Kabos: Statisztika másodfajú jegyezni, hogy hiba II. ismertek nem nő az lényegesen. ANOVA Összefüggésvizsgálat olyan alternatívái (pl. Welch-próba), melyek nem feltételezik a a szórások egyenlőségét, miközben a másodfajú hiba nem nő lényegesen. Slide 14 Slide 14 Az ANOVA alkalmazásában a csoportok mintavételi függetlensége fontos feltétel. Ha ez nem teljesül (pl. a férfiak és nők testmagasságának eltérését olyan mintán Az ANOVA vizsgáljuk, alkalmazásában ahol házaspárok a csoportok vannak mintavételi a mintában), függetlensége akkor fontos más feltétel. eljárást Hakell ezhasználni nem teljesül (pl. (pl. páros a férfiak próbák). és nők testmagasságának eltérését olyan mintán vizsgáljuk, ahol házaspárok vannak a mintában), akkor más eljárást kell használni (pl. páros próbák). Slide 15 Slide 15 Nem keverendő össze a robosztusság kérdése, és az eljárások hatékonyságának kérdése. Például ha a csoportonkénti eloszlásoknak normalitástól való eltérése Nem keverendő nagy, össze akkoracsak robosztusság az egyik kedvezőtlen kérdése, és az jelenség, eljárásokhogy hatékonyságának az ANOVA elsőfajú kérdése. hibája Például meghaladja a az csoportonkénti előírt értéket, eloszlásoknak a másik az, hogy normalitástóla másodfajú valóhiba is eltérése jelentősen nagy, megnő. akkor csak az egyik kedvezőtlen jelenség, hogy az ANOVA elsőfajú hibája meghaladja az előírt értéket, a másik az, hogy a másodfajú hiba is jelentősen megnő. Slide 16 A Y = l(x) + ε lineáris regresszió teljesen korrekt alkalmazásának feltételei: Y l(x) normális eloszlású, l(x) lineáris Y -ben, Y szórása állandó X-ben, az Y -ra vett megfigyelések függetlenek. Slide 17 A lineáris regresszió a normalitás, a linearitás és a szórások állandósának megsértésére robosztus, közelítően korrekt módon használható ezeket a feltételeket nem nagyon sértő esetekben. Ha a megfigyelések függetlensége nem teljesül, más eljárásokat (pl idősor-elemzés) kell használni.

11 A Y = l(x) + ε lineáris regresszió teljesen korrekt alkalmazásának feltételei: Slide 16 Y l(x) normális eloszlású, A Y l(x) = l(x) lineáris + εylineáris -ben, regresszió teljesen korrekt alkalmazásának Y szórása állandó feltételei: X-ben, Slide 16 Yaz Y l(x) -ra vett normális megfigyelések eloszlású, függetlenek. Kabos: Statisztika l(x) lineáris II. Y -ben, Összefüggésvizsgálat Y szórása állandó X-ben, az Y -ra vett megfigyelések függetlenek. Slide 17 Slide 17 A lineáris regresszió a normalitás, a linearitás és a szórások állandósának megsértésére robosztus, közelítően korrekt módon használható ezeket a feltételeket A lineáris regresszió nem nagyon a normalitás, sértő esetekben. a linearitás és a Ha szórások a megfigyelések állandósának függetlensége megsértésére nem robosztus, teljesül, más eljárásokat közelítően korrekt (pl idősor-elemzés) módon használható kell használni. ezeket a feltételeket nem nagyon sértő esetekben. Ha a megfigyelések függetlensége nem teljesül, más eljárásokat (pl idősor-elemzés) kell használni. Slide 18 Slide 18 A lineáris regressziónak számos robosztus alternatívája ismert (pl. lokális regresszió), melyek alkalmazása mindig egyedi megítélést igényel, de általában A lineáris jelentősen regressziónak nő aszámos másodfajú robosztus hiba. Mint láttuk, alternatívája a linearitás ismert sérülése (pl. lokális esetén regresszió), a regresszió melyek kézenfekvő alkalmazásaalternatívája mindig egyedi azmegítélést ANOVA. igényel, de általában jelentősen nő a másodfajú hiba. Mint láttuk, a linearitás sérülése esetén a regresszió kézenfekvő alternatívája az ANOVA. Slide 19 Illeszkedésvizsgálat (kategória értékű változóra) Freedman: 28. fejezet 1-3. Slide 20 Egy képzeletbeli országban 10M ember lakik: 30% szőke, 10% barna, 60% fekete. N = 200 fős mintát vettünk, a mintabeli hajszín gyakoriságok: f szőke = 70, f barna = 25, f fekete = 105 a hajszín gyakoriságok várhatóértékei: e szőke = 60, e barna = 20, e fekete = 120

12 Slide 19 Illeszkedésvizsgálat (kategória értékű változóra) Illeszkedésvizsgálat (kategória értékű változóra) Slide 19 Kabos: Statisztika Freedman: II. 28. fejezet Összefüggésvizsgálat Slide 20 Slide 20 Freedman: 28. fejezet 1-3. Egy képzeletbeli országban 10M ember lakik: 30% szőke, 10% barna, 60% fekete. N = 200 fős mintát vettünk, a Egy mintabeli képzeletbeli hajszín országban gyakoriságok: 10M ember lakik: f 30% szőke szőke = 70,, 10% f barna barna = 25,, 60% f fekete. fekete = 105 a N hajszín = 200 fős gyakoriságok mintát vettünk, várhatóértékei: e a mintabeli szőke = 60, hajszín e gyakoriságok: barna = 20, e fekete = 120 f szőke = 70, f barna = 25, f fekete = 105 a hajszín gyakoriságok várhatóértékei: e szőke = 60, e barna = 20, e fekete = 120 Slide 21 Slide 21 S = (f szőke e szőke ) 2 e szőke + (f barna e barna ) 2 e barna + (f fekete e fekete ) 2 e fekete ez a statisztika mutatja, hogy megfelelően illeszkedik-e S = (f szőke e szőke ) 2 a mintabeli + (f barna e barna ) 2 e gyakoriság + eloszlás (f fekete e fekete ) 2 az szőke e barna e fekete alapsokasági eloszláshoz. ez a statisztika mutatja, hogy megfelelően illeszkedik-e a mintabeli gyakoriság eloszlás az alapsokasági eloszláshoz. Slide 22 Ha a minta EVM, akkor az S eloszlása χ 2 2 (szavakban: 2 szab.fokú khi-négyzet) melynek a táblázat szerint a 0.95 kvantilise = S = (70 60) (25 20) ( )2 120 = = = Slide 23 H 0 : a mintavétel EVM H 0 vizsgálatára a végzett khi-négyzet próbánál (0.05 szignifikancia szinten) az elfogadási tartomány felső határa = A próbastatisztika S = ezért a H 0 hipotézist elfogadjuk.

13 Slide 22 Ha a minta EVM, akkor az S eloszlása χ 2 2 (szavakban: 2 szab.fokú khi-négyzet) melynek a táblázat szerint a 0.95 kvantilise = Ha a minta EVM, akkor az S eloszlása χ 2 2 (szavakban: (70 60)2 2 szab.fokú (25 20)2khi-négyzet) ( )2 S = + + = melynek 60 a táblázat szerint 20 a 0.95 kvantilise 120 = Slide 22 Kabos: Statisztika = ( = )2 II. (25 20)2 Összefüggésvizsgálat ( ) S = + + = = = Slide 23 Slide 23 H 0 : a mintavétel EVM H 0 vizsgálatára a végzett khi-négyzet próbánál (0.05 szignifikancia szinten) az elfogadási tartomány H felső 0 : a határa mintavétel = EVM A H 0 próbastatisztika vizsgálatára a végzett S = khi-négyzet próbánál ezért (0.05 a szignifikancia H 0 hipotézist szinten) elfogadjuk. az elfogadási tartomány felső határa = A próbastatisztika S = ezért a H 0 hipotézist elfogadjuk. Slide 24 Slide 24 Megjegyezzük, hogy ha csak a fekete/nem-fekete eloszlást nézzük, akkor az N = 200 elemű EVM p = 0.6 alapsokasági arány mellett amegjegyezzük, várható gyakoriság = 120, ennek SHja = hogy ha csak a fekete/nem-fekete eloszlást nézzük, 200 akkor 0.6 az 0.4 N = elemű EVM p = 0.6 alapsokasági arány mellett a várható gyakoriság = 120, ennek SHja = = = miatt a 95%-os megbízhatósági tartomány: 120 ± Slide 25 A megfigyelt f fekete = 105 kívül esik e tartományon. Ha csak a fekete/nem-fekete komponenst vizsgáljuk (z-próbával), akkor 0.05 szignifikancia szinten a H 0 hipotézist elutasítjuk. Slide 26 Ugyanezt az eljárást egy másik példán megbeszéltük a z-próba kapcsán. Abban a példában (0.05 szignifikancia szinten) a komponensek egyenként vizsgálva a null-hipotézis elfogadására vezettek, miközben a khi-négyzet próba eredménye szignifikáns eltérést jelzett, a null-hipotézist el kellett utasítani. Azt látjuk, hogy a különböző statisztikai próbák a

14 = miatt a 95%-os megbízhatósági tartomány: 120 ± Slide = miatt a A megfigyelt f fekete = 105 kívül esik e tartományon. 95%-os megbízhatósági tartomány: 120 ± Ha csak a fekete/nem-fekete komponenst vizsgáljuk Slide 25 (z-próbával), akkor 0.05 szignifikancia szinten a H 0 Kabos: Statisztika hipotézist A megfigyelt elutasítjuk. II. f fekete = 105 kívülösszefüggésvizsgálat esik e tartományon Ha csak a fekete/nem-fekete komponenst vizsgáljuk (z-próbával), akkor 0.05 szignifikancia szinten a H 0 hipotézist elutasítjuk. Slide 26 Slide 26 Slide 27 Slide 27 Ugyanezt az eljárást egy másik példán megbeszéltük a z-próba kapcsán. Abban a példában (0.05 szignifikancia szinten) a komponensek egyenként vizsgálva Ugyaneztaaznull-hipotézis eljárást egy másik elfogadására példánvezettek, megbeszéltük miközben a z-próba akapcsán. khi-négyzet Abban próba a példában eredménye (0.05 szignifikáns eltérést szignifikancia jelzett, szinten) a null-hipotézist a komponensek el kellett egyenként utasítani. Azt vizsgálva látjuk, a null-hipotézis hogy a különböző elfogadására statisztikai vezettek, próbák a hipotézist miközben a más-más khi-négyzet szempontból próba eredménye ellenőrzik. szignifikáns eltérést jelzett, a null-hipotézist el kellett utasítani. Azt látjuk, hogy a különböző statisztikai próbák a hipotézist más-más szempontból ellenőrzik. Figyelem: a statisztikusok hanyag szóhasználatában a khi-négyzet próba nevet az illeszkedésvizsgálat mellett (több más, különböző próbával együtt) a most Figyelem: következő a statisztikusok khi-négyzethanyag függetlenségvizsgálatra szóhasználatábanis használjuk. a khi-négyzet próba nevet az illeszkedésvizsgálat mellett (több más, különböző próbával együtt) a most következő khi-négyzet függetlenségvizsgálatra is használjuk. Slide 28 Függetlenségvizsgálat kategória-értékű változókra Freedman: 28. fejezet Slide 29 Egy képzeletbeli országban 10M ember lakik. Tudjuk, hogy 68% kékszemű, 32% zöldszemű, 30% szőkehajú, 10% barnahajú, 60% feketehajú. Ezek az adatok leírják a szem- és a hajszín marginális eloszlását, de nem határozzák meg azt, hogy mi a szem- és hajszín együttes eloszlása.

15 Slide 28 Slide 28 Függetlenségvizsgálat kategória-értékű változókra Függetlenségvizsgálat kategória-értékű Freedman: változókra 28. fejezet Kabos: Statisztika II. Osszefüggésvizsgálat 2. Kabos: Statisztika II. Összefüggésvizsgálat Slide 29 Slide 29 Slide 30 Slide 30 Freedman: 28. fejezet Egy képzeletbeli országban 10M ember lakik. Tudjuk, hogy 68% kékszemű, 32% zöldszemű, 30% Egy képzeletbeli szőkehajú, 10% országban barnahajú, 10M ember 60% feketehajú. lakik. Ezek Tudjuk, az adatok hogy leírják a szem- és a hajszín marginális 68% kékszemű, eloszlását, 32% zöldszemű, de nem határozzák meg azt, hogy 30% szőkehajú, mi a szem- 10% és hajszín barnahajú, együttes 60% eloszlása. feketehajú. Ezek az adatok leírják a szem- és a hajszín marginális eloszlását, de nem határozzák meg azt, hogy mi a szem- és hajszín együttes eloszlása. Feltesszük, hogy a szem- és a hajszín függetlenek, miközben tiszteletben tartjuk a marginálisokról előbb mondottakat. AFeltesszük, szem- és hajszín hogy a szem- együttes és aeloszlása hajszín (ezer függetlenek, fő): miközben szem \ haj tiszteletben szőke tartjuk barna a fekete marginálisokról összesen előbb mondottakat. kékszemű A szem- és hajszín együttes eloszlása (ezer fő): zöldszemű szem \ haj 960 szőke 320 barna 1920 fekete 3200 összesen összesen kékszemű zöldszemű összesen Slide 31 Először a teljes lakosságra vetített arányszámokkal kitöltjük a marginális sort és oszlopot: szem \ haj szőke barna fekete összesen kékszemű 0.68 zöldszemű 0.32 összesen Slide 32 Ezután kitöltjük az üresen maradt cellákat a megfelelő marginálisaik szorzatával: szem \ haj szőke barna fekete összesen kékszemű zöldszemű összesen

16 Először a teljes lakosságra vetített arányszámokkal kitöltjük a marginális sort és oszlopot: szem \ haj szőke barna fekete összesen Slide 31 Először a teljes lakosságra vetített arányszámokkal kitöltjük kékszemű a marginális sort és oszlopot: 0.68 zöldszemű szem \ haj szőke barna fekete összesen 0.32 Slide 31 összesen Kabos: Statisztika kékszemű II. Összefüggésvizsgálat zöldszemű 0.32 összesen Slide 32 Slide 32 Ezután kitöltjük az üresen maradt cellákat a megfelelő marginálisaik szorzatával: szem \ haj szőke barna fekete összesen Ezután kitöltjük az üresen maradt cellákat a megfelelő kékszemű marginálisaik szorzatával: zöldszemű szem \ haj szőke barna fekete összesen 0.32 összesen kékszemű zöldszemű összesen Slide 33 Slide 33 A Szignifikanciapróbák összefoglalóban egy általános jelölés szerepel: X \ Y Y = 1 Y = 2 Y = 3 marginális A Szignifikanciapróbák összefoglalóban egy általános jelölés X = szerepel: 1 p 1,1 p 1,2 p 1,3 p 1,+ X = \ Y 2 Y p = 2,1 1 Y p = 2,2 2 Y p = 2,3 3 marginális p 2,+ marginális X = 1 p +,1 1,1 p +,2 1,2 p +,3 1,3 p +,+ 1,+ X = 2 p 2,1 p 2,2 p 2,3 p 2,+ marginális p +,1 p +,2 p +,3 p +,+ Slide 34 A függetlenség azt jelenti, hogy P {X = i Y = j} = P {X = i} azaz p i,j = p i,+ teljesül minden (i, j) párra p +,j Például i = 2 és j = 3 esetén P {zöldszemű feketehajú} = P {zöldszemű} p 2,3 = p +,3 0.6 = 0.32 = p 2,+ Slide 35 Ez azért megy ilyen szépen, mert az együttes eloszlás táblázatát a szorzási szabállyal készítettük, ezzel okoztuk a két változó függetlenségét. Ugyanezen marginális eloszlások tiszteletben tartása mellett tudunk nem-független együttes eloszlásokat is készíteni.

17 A függetlenség azt jelenti, hogy P {X = i Y = j} = P {X = i} azaz p i,j = p i,+ teljesül minden (i, j) párra p Slide 34 A +,j függetlenség azt jelenti, hogy Például = 2 és j 3 esetén P {X = i Y = j} = P {X = i} azaz P p i,j {zöldszemű feketehajú} = P {zöldszemű} = p 2,3 Slide 34 = i,+ teljesül minden (i, j) párra p +,j p +,3 0.6 = 0.32 = p 2,+ Kabos: Statisztika Például i = 2II. és j = 3 esetén Összefüggésvizsgálat P {zöldszemű feketehajú} = P {zöldszemű} p 2,3 = p +,3 0.6 = 0.32 = p 2,+ Slide 35 Slide 35 Slide 36 Slide 36 Ez azért megy ilyen szépen, mert az együttes eloszlás táblázatát a szorzási szabállyal készítettük, ezzel okoztuk a két változó függetlenségét. Ugyanezen Ez azért megy marginális ilyen szépen, eloszlások mert tiszteletben az együttes tartása eloszlás mellett táblázatát tudunk a szorzási nem-független szabállyal együttes készítettük, eloszlásokat ezzel is készíteni. okoztuk a két változó függetlenségét. Ugyanezen marginális eloszlások tiszteletben tartása mellett tudunk nem-független együttes eloszlásokat is készíteni. Az alapsokasági relatív gyakoriságokat megszorozzuk az alapsokaság létszámával (itt 10M), és így kapjuk a bevezetőben mutatott gyakoriság eloszlási kereszt-táblát. Az alapsokasági relatív gyakoriságokat megszorozzuk Az az alapsokaság alapsokasági létszámával relatív gyakoriságokat (itt 10M), és a így statisztikus kapjuk a szleng bevezetőben totál-százalékos mutatott gyakoriság táblának is eloszlási mondja, ezenkívül értelemszerűen kereszt-táblát. használják a sorszázalékos és oszlopszázalékos Az alapsokasági relatív tábla elnevezéseket gyakoriságokat is. a statisztikus szleng totál-százalékos táblának is mondja, ezenkívül értelemszerűen használják a sorszázalékos és oszlopszázalékos tábla elnevezéseket is. Slide 37 Két kategória-értékű változó függetlenségének vizsgálata khi-négyzet próbával Modell: az X változó alapsokaságbeli értékei X = 1, 2,.., I az Y változó alapsokaságbeli értékei Y = 1, 2,.., J Hipotézis: H 0 : X és Y függetlenek Minta: az (X, Y ) változópárra vett N elemű EVM. Az adatok a gyakoriság kereszt-táblázatban: X \ Y Y = 1... Y = J marginális Slide 38 X = 1 f 1,1... f 1,J f 1, f i,j... X = I f I,1... f I,J f I,+ marginális f +,1... f +,J N = f +,+ f i,j = az {X = i} és {Y = j} mintabeli együttes

18 vizsgálata khi-négyzet próbával Modell: Slide 37 az Két X kategória-értékű változó alapsokaságbeli változó értékei függetlenségének X = 1, 2,.., I vizsgálata az Y változó khi-négyzet alapsokaságbeli próbával értékei Y = 1, 2,.., J Modell: Hipotézis: H 0 : X és Y függetlenek Slide 37 az Minta: X változó az (X, alapsokaságbeli Y ) változópárra értékei vett N X elemű = 1, 2, EVM..., I Kabos: Statisztika az Az Y adatok változó II. a gyakoriság alapsokaságbeli kereszt-táblázatban: értékei Összefüggésvizsgálat Y = 1, 2,.., J Hipotézis: H 0 : X és Y függetlenek Minta: az (X, Y ) változópárra vett N elemű EVM. Az adatok a gyakoriság kereszt-táblázatban: X \ Y Y = 1... Y = J marginális Slide 38 Slide 38 Slide 39 Slide 39 X = 1 f 1,1... f 1,J f 1,+... X \ Y Y... = Y f = i,j J marginális... I X = 1 f I,1 1, f I,J 1,J f I,+ 1,+ marginális... f... +, f +,J i,j N = f... +,+ f i,j az {X = i} és {Y = j} mintabeli együttes X = I f I,1... f I,J f I,+ előfordulásainak gyakorisága. marginális f +,1... f +,J N = f +,+ f i,j = az {X = i} és {Y = j} mintabeli együttes előfordulásainak gyakorisága. Ha X és Y függetlenek, akkor f i,j várhatóértéke = e i,j = f i+ f +j f ++ várhatóértéke Ez Ha az X állítás és Y függetlenek, precízebben akkor fogalmazva: ha X és Y függetlenek, akkor e i,j torzítatlan becslés N p i,j -re. f i,j várhatóértéke = e i,j = f i+ f +j várhatóértéke Másrészt f i,j torzítatlan becslés f ++ N p i,j -re, akár Ez teljesül az állítás X és precízebben Y függetlensége, fogalmazva: akár nem. ha X és Y függetlenek, akkor e i,j torzítatlan becslés N p i,j -re. Másrészt f i,j torzítatlan becslés N p i,j -re, akár teljesül X és Y függetlensége, akár nem. Slide 40 A függetlenségvizsgálat próbastatisztikája: I J (f i,j e i,j ) 2 S = mely χ 2 (I 1) (J 1) i=1 j=1 e i,j (szavakban: (I 1) (J 1) szab.fokú khi-négyzet) eloszlású közelítőleg, ha H 0 igaz. Slide 41 A χ 2 közelítés javítására szolgál 2 2 tábláknál a Yates-korrekció (a technikai részleteket nem tanuljuk). Ha 2 2 táblánál a marginális eloszlások rögzítettek, akkor a Fisher egzakt teszt alkalmazása indokolt (ez a helyzet például a korábban említett két mintás medián próbánál). A Fisher egzakt teszt a visszatevés nélküli mintavételnél szerepelt hipergeometrikus eloszláson alapul (az egyéb

19 A függetlenségvizsgálat próbastatisztikája: I J (f i,j e i,j ) 2 S = mely χ Slide 40 2 (I 1) (J 1) e i=1 j=1 i,j A függetlenségvizsgálat próbastatisztikája: (szavakban: (I 1) (J 1) szab.fokú khi-négyzet) I J (f eloszlású közelítőleg, i,j e i,j ) 2 S = ha Hmely 0 igaz. χ Slide 40 2 (I 1) (J 1) e i=1 j=1 i,j Kabos: Statisztika II. Összefüggésvizsgálat (szavakban: (I 1) (J 1) szab.fokú khi-négyzet) Slide 41 Slide 41 eloszlású közelítőleg, ha H 0 igaz. A χ 2 közelítés javítására szolgál 2 2 tábláknál a Yates-korrekció (a technikai részleteket nem tanuljuk). Ha 2 2 táblánál a marginális eloszlások rögzítettek, A χ 2 közelítés akkor javítására a Fisher szolgál egzakt 2 teszt 2 tábláknál alkalmazása a indokolt Yates-korrekció (ez a helyzet (a technikai például részleteket a korábban nememlített két tanuljuk). mintásha medián 2 2próbánál). táblánál aamarginális Fisher egzakt eloszlások teszt arögzítettek, visszatevésakkor nélküli a Fisher mintavételnél egzakt teszt szerepelt alkalmazása hipergeometrikus indokolt (ez a helyzet eloszláson például alapul a korábban (az egyéb említett technikai két mintás részleteket medián próbánál). nem tanuljuk). A Fisher egzakt teszt a visszatevés nélküli mintavételnél szerepelt hipergeometrikus eloszláson alapul (az egyéb technikai részleteket nem tanuljuk). Slide 42 Slide 42 A megtévesztő szóhasználat miatt fokozott figyelem szükséges ahhoz, hogy mindig a feladatnak megfelelő khi-négyzet próbát használjuk. A megtévesztő szóhasználat miatt fokozott figyelem szükséges ahhoz, hogy mindig a feladatnak megfelelő khi-négyzet próbát használjuk.

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n ) Kabos: Adatelemzés Regresszió-1 Regresszió (az adatelemzésben): Y (x n ) = l(x n ) + ε n, n = 1, 2,.., N, ahol ε 1,.., ε N független N(0, σ 2 ) eloszlású valószínűségi változók, és σ ismeretlen paraméter,

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,

Részletesebben

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi

Részletesebben

Statisztikai becslés

Statisztikai becslés Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés

Részletesebben

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok Eloszlás-független módszerek (folytatás) 14. elıadás (7-8. lecke) Illeszkedés-vizsgálat 7. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok elemzésére Illeszkedés-vizsgálat Gyakorisági sorok

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Statisztikai módszerek 7. gyakorlat

Statisztikai módszerek 7. gyakorlat Statisztikai módszerek 7. gyakorlat A tanult nem paraméteres próbák: PRÓBA NEVE Illeszkedés-vizsgálat Χ 2 próbával Homogenitás-vizsgálat Χ 2 próbával Normalitás-vizsgálataΧ 2 próbával MIRE SZOLGÁL? A val.-i

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont) VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26 ANOVA,MANOVA Márkus László 2013. március 30. Márkus László ANOVA,MANOVA 2013. március 30. 1 / 26 ANOVA / MANOVA One-Way ANOVA (Egyszeres ) Analysis of Variance (ANOVA) = szóráselemzés A szórásokat elemezzük,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Az első számjegyek Benford törvénye

Az első számjegyek Benford törvénye Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm

Részletesebben

Eloszlás-független módszerek 13. elıadás ( lecke)

Eloszlás-független módszerek 13. elıadás ( lecke) Eloszlás-független módszerek 13. elıadás (25-26. lecke) Rangszámokon alapuló korrelációs együttható A t-próbák és a VA eloszlásmentes megfelelıi 25. lecke A Spearman-féle rangkorrelációs együttható A Kendall-féle

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Khi-négyzet eloszlás. Statisztika II., 3. alkalom Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet Függetleségvizsgálat Virág Katali Szegedi Tudomáyegyetem, Bolyai Itézet Függetleség Függetleség Két változó függetle, ha az egyik változó megfigyelése a másik változóra ézve em szolgáltat iformációt; azaz

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Varianciaanalízis 4/24/12

Varianciaanalízis 4/24/12 1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 8. rész: Statisztikai eszköztár: Alapfokú statisztikai ismeretek Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Nyolcadik rész Statisztikai eszköztár: Alapfokú statisztikai

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

V. Gyakorisági táblázatok elemzése

V. Gyakorisági táblázatok elemzése V. Gyakorisági táblázatok elemzése Tartalom Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét változók segítségével Diszkrét változók kapcsolatvizsgálata Példák

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

III. Kvantitatív változók kapcsolata (korreláció, regresszió) III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással

Részletesebben

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás paramétereire vonatkozó próbák Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású

Részletesebben

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék Dummy változók használata Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Hetedik fejezet Tartalom IV. esettanulmány 1 IV. esettanulmány Uniós országok munkanélkülisége

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

IV. Változók és csoportok összehasonlítása

IV. Változók és csoportok összehasonlítása IV. Változók és csoportok összehasonlítása Tartalom Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta

Részletesebben

kritikus érték(ek) (critical value).

kritikus érték(ek) (critical value). Hipotézisvizsgálatok (hypothesis testing) A statisztikának egyik célja lehet a populáció tulajdonságainak, ismeretlen paramétereinek a becslése. A másik tipikus cél: valamely elmélet, hipotézis empirikus

Részletesebben

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157. Kiváltott agyi jelek informatikai feldolgozása 2018 Statisztika - Gyakorlat Kiss Gábor IB.157. kiss.gabor@tmit.bme.hu Példa I (Vonat probléma) Aladár 25 éves és mindkét nagymamája él még: Borbála és Cecília.

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2 Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Biometria gyakorló feladatok BsC hallgatók számára

Biometria gyakorló feladatok BsC hallgatók számára Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90

Részletesebben

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi

Részletesebben

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

[Biomatematika 2] Orvosi biometria. Visegrády Balázs [Biomatematika 2] Orvosi biometria Visegrády Balázs 2017. 03. 20. Khí-négyzet (χ 2 ) Próba Ha mérés során kapott adatokról eleve tudjuk, hogy nem követik a normális vagy más ismert eloszlást, akkor a korábban

Részletesebben