Matematikai statisztikai elemzések 5.
|
|
- Zsombor Takács
- 10 évvel ezelőtt
- Látták:
Átírás
1 Matematikai statisztikai elemzések 5. Kapcsolatvizsgálat: asszociáció, vegyes kapcsolat, korrelációszámítás. Varianciaanalízis Prof. Dr. Závoti, József
2 Matematikai statisztikai elemzések 5.: Kapcsolatvizsgálat: asszociáció, korrelációszámítás. Varianciaanalízis Prof. Dr. Závoti, József Lektor: Bischof, Annamária Ez a modul a TÁMOP /1/A Tananyagfejlesztéssel a GEO-ért projekt keretében készült. A projektet az Európai Unió és a Magyar Állam Ft összegben támogatta. v 1.0 Publication date 2010 Szerzői jog 2010 Nyugat-magyarországi Egyetem Geoinformatikai Kar Kivonat Ez a modul a kapcsolatvizsgálat alapfogalmaival és fő feladataival ismerteti meg az Olvasót. Két mennyiség kapcsolatának feltárása a mindennapi életben is nagy jelentőséggel bír. A kapcsolat számszerűsítése különös jelentőséget nyer. A modul rendkívül gazdag példaanyagot tartalmaz, amely megkönnyítheti a kapcsolatvizsgálati módszerek elsajátítását. Jelen szellemi terméket a szerzői jogról szóló évi LXXVI. törvény védi. Egészének vagy részeinek másolása, felhasználás kizárólag a szerző írásos engedélyével lehetséges.
3 Tartalom 5. Kapcsolatvizsgálat: asszociáció, (egyszeres osztályozás) Bevezetés Sztochasztikus kapcsolat Asszociációs együtthatók Vegyes kapcsolat elemzése Kétváltozós korrelációszámítás Rangkorreláció Lineáris korrelációs együttható Varianciaanalízis (egyszeres osztályozás) A varianciaanalízis módszere Többváltozós korrelációszámítás Többváltozós korrelációs mérőszámok Előrejelzés Összefoglalás iii
4 A táblázatok listája 5.1. Az ANOVA-tábla: iv
5 5. fejezet - Kapcsolatvizsgálat: asszociáció, Bevezetés Jelen modul a Matematikai statisztikai elemzések tárgy ötödik fejezete, modulja. Az itt következő ismeretek megértéséhez javasoljuk, hogy olvassa el a Tárgy korábbi moduljainál írottakat. Amennyiben ez még nem lenne elég a megértéshez, akkor forduljon a szerzőhöz segítségért. Jelen modul célja, hogy az Olvasó megismerkedjen a kapcsolatvizsgálat alapfogalmaival. Ezt a fejezetet úgy is nevezhetnénk, hogy kétváltozós statisztika. A természetben, a gazdaságban nagyon fontos, hogy felismerjük, hogy két dolog kapcsolatban van-e egymással, vagy függetlenek egymástól. Két adatrendszer kapcsolatvizsgálatának legegyszerűbb eseteiből kiindulva egyre bonyolultabb modelleken át jutunk el a többváltozós korreláció fogalmához. A szórásanalízis leghatékonyabb esetének tárgyalását bevezetésnek, kedvcsinálónak tartjuk a módszer további lehetőségeinek tanulmányozásához Sztochasztikus kapcsolat A statisztikai ismérvek közötti kapcsolatok szorossága a teljes függetlenség és a függvényszerű determinisztikus meghatározottság között széles skálán mozoghat: Függvényszerű kapcsolat esetén az egyik ismérv szerinti hovatartozás egyértelműen meghatározza a másik ismérv szerinti hovatartozást. Függetlenség esetén az egyik ismérv szerinti hovatartozás semmilyen hatással nincs a másik ismérv szerinti hovatartozásra Sztochasztikus kapcsolat átmenet a függvényszerű kapcsolat és a teljes függetlenség között; az egyik ismérv szerinti hovatartozás a másik ismérv szerinti hovatartozás valószínűségét határozza meg. A statisztika a sztochasztikus kapcsolatok vizsgálatával foglalkozik. A kapcsolatban álló ismérvek fajtája alapján három esetet különböztetünk meg: Asszociáció: két mennyiségi ismérv közötti kapcsolat szorosságának mérésére Vegyes kapcsolat: egy mennyiségi és egy minőségi ismérv Korreláció: két mennyiségi ismérv A sztochasztikus kapcsolatban szereplő két tényező: független változó, azaz az ok szerepét betöltő tényező függő változó / eredményváltozó, azaz az okozat szerepét betöltő tényező A vizsgálathoz az adatokat célszerű egy ú.n. kombinációs táblában (kontingencia tábla) elrendezni. Kombinációs tábla állapota a különböző kapcsolatok mellett: (1) Függvényszerű kapcsolat esetén a tábla minden sorában és oszlopában csak egy nullától különböző gyakoriság van. 1
6 (2) Függetlenség esetén a peremmegoszlási viszonyszámok szorzata egyenlő az együttes megoszlási viszonyszámmal. (3) Sztochasztikus kapcsolatnál a kombinációs táblára számítható megoszlási viszonyszámok eltérnek egymástól. A kombinációs tábla általános sémája: 1-es ismérv 2. ismérv 1. ismérvváltozat 2. ismérvváltozat... n. ismérvváltozat Összesen 1. ismérvváltozat f 11 f 12 f 1n f ismérvváltozat f 21 f 22 f 2n f m. ismérvváltozat f m1 f m2 f mn f m. Összesen f. 1 f. 2 f. n f..=n f ij: gyakorisági értékek f. j, f i.: peremgyakoriságok Asszociációs együtthatók Két minőségi ismérv közötti sztochasztikus kapcsolat szorosságát az ú.n. asszociációs együtthatókkal mérjük. 1. Youle- féle asszociációs együttható: Csak alternatív (2-változatú) ismérvek esetén használható. Ebben az esetben a kombinációs tábla 2*2-es. Belátható, hogy: Az előjel a kapcsolat irányát mutatja. A számérték 0 közeli függetlenség esetén, 1 teljes meghatározottságnál. 1. Csuprov-féle asszociációs együttható:, ahol, s,t: az ismérvváltozatok száma, 2
7 Alternatív ismérvek esetén: T értékének határai: T értéke 0, ha nincs kapcsolat a két ismérv között, 1 pedig függvényszerű kapcsolatnál. 1. Cramer-féle asszociációs együttható: A Csuprov-együttható felső határának esetlegességét kiküszöbölhetjük, ha T értékét osztjuk annak maximumával. Így jutunk az ú.n. Cramer-féle asszociációs együtthatóhoz Egyértelműen adódik, hogy C értéke 0, ha nincs kapcsolat a két ismérv között, 1 függvényszerű kapcsolat esetén. Példa: Egyik felsőoktatási intézmény oktatóitól megkérdezték, hogy milyen intézménytípust tartanának ideálisnak. A megkérdezettek megoszlása a két kérdésre (irányítás és az oktatók teljesítményének értékelése) adott válaszok szerint: Irányítás Teljesítményértékelés Centralizált Nagyfokú önállóság Összesen Egyéni Kollektív Összesen Jellemezze a két kérdésre adott válasz közötti összefüggést megfelelő mutatószám segítségével! Megoldás: Mivel két minőségi ismérv szerepel a feladatban, és mindegyik két-két ismérv-változattal, így Csuprov-, Cramer- és Yule-mutatókat számolhatunk. Irányítás Teljesítményértékelés Centralizált Nagyfokú önállóság Összesen Egyéni f 00 =25 f 01 =95 f 0 =120 3
8 Kollektív f 10 =15 f 00=65 f 1 =80 Összesen f 0 =40 f 1 =160 f = =n=200 Csuprov- és Cramer- mutató: mivel s=t=2, így T max=1, tehát C=T: Yule-mutató: A két ismérv között gyenge a kapcsolat Vegyes kapcsolat elemzése Vegyes kapcsolatról akkor beszélünk, ha az oksági (független változó) minőségi ismérv, az okozat (függő változó) pedig mennyiségi. A vegyes kapcsolatban szereplő ismérvek közötti kapcsolat szorosságát az ú.n. szóráshányadossal (H-mutató) mérjük. Ennek definiálásához szükséges az alábbi mennyiségek bevezetése: Jelölések: m: minőségi ismérv változatainak száma n j: minőségi ismérv szerint csoportosított részsokaságok elemszámai x ij: ismérvértékek : minőségi ismérv szerint csoportosított részsokaságok átlagai részátlag : fősokaság átlaga - főátlag s j: részsokaságok szórásai 4
9 Innen, ezért teljes eltérés, belső eltérés, külső eltérés Könnyen belátható, hogy : teljes szórásnégyzet az ismérvértékeknek a főátlagtól való eltérései által okozott szórás : részsokaságon belüli szórásnégyzet : belső szórásnégyzet az ismérvértékeknek a megfelelő részátlagoktól való eltérései által okozott szórás : külső szórásnégyzet a részátlagoknak a főátlagtól való eltérései által okozott szórásnégyzet Tétel: A szórásnégyzetek között fennáll a következő összefüggés: A tétel bizonyításától eltekintünk. Következmények: 1. Ha 5
10 2. Ha, Vezessük be a következő mennyiséget: Definíció: Szórásnégyzet hányados: Megjegyzés: H 2 értékét %-ban is ki szoktuk fejezni. Szóráshányados (H-mutató): Állítás: Belátható, hogy. H 2 =0, ha és H 2 =1, ha Értelmezés: H 2 értéke megmutatja, hogy a mennyiségi ismérv valamely változatához való tartozás milyen mértékben (hány százalékban) határozza meg a minőségi ismérvhez való tartozást. H értéke pedig megmutatja, hogy milyen szoros a kapcsolat a minőségi és mennyiségi ismérv között. Példa 1: A következő táblázat egy társasház háztartásainak megoszlását tartalmazza a 15 évesnél idősebb háztartás-tagok gazdasági aktivitása és a első félévi villamosenergia-fogyasztás szerint: A háztartás tagjainak gazdasági aktivitása Háztartások száma n j Átlagos villamos energia fogyasztás (kwh) Aktív ,3 Inaktív ,7 Vegyes ,3 Összesen: n = 68 Ismeretes, hogy az egyes háztartások által felhasznált energia mennyisége átlagosan 221 kwh-val különbözik a társasházakra jellemző átlagtól. Állapítsa meg, hogy a háztartások jellege befolyásolja-e a villamosenergia-fogyasztást! Megoldás: 6
11 A háztartások tagjainak gazdasági aktivitása minőségi ismérv, míg az Átlagos villamos energiafogyasztás mennyiségi ismérv. Így a feladatban vegyes kapcsolatot kell jelle-meznünk. Erre a szóráshányados- (H) és szórásnégyzet-hányados (H 2 ) mutatók szolgálnak. 1. lépés: A feladat szövegéből kiolvasható adatok: Adott a teljes szórás (az egyedi adatok főátlagtól való átlagos eltérése): σ=221. A minőségi ismérv ismérv-változatainak száma: m=3. 2. lépés: A főátlag meghatározása: (a részátlagok súlyozott számtani középe, mivel egy adott érték n j háztartás egyedi adatainak átlaga) 3. lépés: A külső eltérés négyzetösszeg meghatározása (a részátlagok főátlagtól vett eltérés-négyzetösszege): (súlyozott!) Ebből a külső szórásnégyzet: 4. lépés: A szórás-hányados és a szórásnégyzet-hányados meghatározása: A két ismérv között közepesnél gyengébb a kapcsolat. A gazdasági aktivitás 11,6%-ban határozza meg a villamosenergia-fogyasztás szóródását. Példa 2: Vizsgálták a nemek és a házimunkával töltött idő kapcsolatát. nem válaszolók száma (n j) házimunka (óra) átlag szórás férfi nő Összesen
12 Határozza meg, hogy mennyire szoros a kapcsolat a nemhez való tartozás és a házimunkával töltött idő mennyisége között! Megoldás: A nemhez tartozás minőségi ismérv, a házimunkával töltött órák pedig mennyiségi ismérv, így vegyes kapcsolatról van szó, tehát a H és H 2 mutatókat kell meghatározni és értelmezni. 1. lépés: A táblázat értelmezése: Az egyes emberek által végzett házimunka időtartama nincs a táblázatban feltüntetve, hanem csak a nemenkénti részátlagok, és ezen értékek szórása. A minőségi ismérv változatainak száma: m=2. 2. lépés: A főátlag meghatározása: (a részátlagok súlyozott számtani középe, mivel egy adott érték n j fő (férfi vagy nő) adatainak átlaga) 3. lépés: A belső eltérés négyzetösszeg meghatározása (az egyedi értékeknek a megfelelő részátlagoktól vett eltérés-négyzetösszege): 4. lépés: A külső eltérés négyzetösszeg meghatározása (a részátlagok főátlagtól vett eltérés-négyzetösszege): 5. lépés: A teljes eltérés négyzetösszeg meghatározása: Mivel, így, ebből SST=SSB+SSK= 1804,5+2861,1 = 4665,6. 6. lépés: A szórás-hányados és a szórásnégyzet-hányados meghatározása: A nemhez való tartozás és a házimunkával eltöltött idő között szoros a kapcsolat. A nemhez való tartozás 61,32%-ban határozza meg a házimunkával töltött idő szóródását. 8
13 Kétváltozós korrelációszámítás Rangkorreláció A rangkorrelációs kapcsolat szorosságának mérésére használható legegyszerűbb mutatószám a Spearman-féle rangkorrelációs együttható. Ismeretes, hogy a sorrendi (ordinális) mérési szintű változók értékeinek csak a sorrendje jelent valódi információt, amit az értékek rendszerint 1-től n-ig növekvő rangszámaival szokás kifejezni. A továbbiakban az X változó szerinti rangsort X i -vel, az Y szerintieket Y i -vel jelöljük. Ha egy változónak több egyforma értéke fordul elő, akkor ezekhez azon rangszámok súlyozatlan számtani átlagát szokás hozzárendelni, melyeket akkor kapnánk, ha az adott értékek nem lennének egyformák. Az ilyen rangszámokat kapcsolt rangoknak nevezzük. Ha a rangszámok között nincs, vagy csak kevés kapcsolt rang van, akkor a Spearman-féle rangkorrelációs együttható az alábbi formulával számítandó:, ahol d i = X i - Y i értéke mindig a -1 és +1 határok közé esik. A érték az X i és Y i rangszámsorozat tökéletes egyezését jelzi, míg a esetben a kétféle sorozat pontosan fordítottja egymásnak. Végül, ha, a két rangsor között nincs kapcsolat. Példa: 10 vállalkozás jövedelmezőség és likviditás szerinti rangsorolása: Vállalkozás Jövedelmezőség Likviditás szerinti rangszámok A 8 5 B 10 8 C 9 10 D 5 4 E 2 3 F 7 7 G 3 1 H 4 6 I 1 2 J 6 9 Jellemezze a jövedelmezőség és likviditás közötti kapcsolat szorosságát a rangkorrelációs együtthatóval! Megoldás: 9
14 X i Y i d i d i n=10 Vagyis a jövedelmezőség és a likviditás között szoros kapcsolat van Lineáris korrelációs együttható Definíció: A korrelációszámítás két minőségi ismérv kapcsolatának intenzitását és irányát méri. A korrelációszámítás lehetővé teszi, hogy értelmezzük az ismérvek közötti kapcsolat irányát. Ha az egyik ismérv növekedésével párhuzamosan a másik is növekszik, pozitív irányú, ellenkező esetben negatív irányú kapcsolatról szokás beszélni. A kapcsolat iránya azonban csak akkor értelmezhető, ha a két ismérv közötti kapcsolat monoton természetű. Definíció: A C xy kovariancia mutató az X és Y változó együttingadozásának összefoglaló mérőszáma. A C xy kovariancia egyedi adatok esetén az alábbi formulával számítandó:, ahol, innen A C xy kovariancia önmagában az X és Y közötti kapcsolat tényét és irányát képes jelezni. Ha ugyanis X és Y között pozitív irányú kapcsolat van, akkor X átlagnál nagyobb értékek többnyire Y átlagnál nagyobb, X átlagnál kisebb értékei pedig rendszerint az Y átlagnál kisebb értékeivel együtt fordulnak elő a megfigyelt sokaság egységeinél. Így a kovariancia számlálójában szereplő lesz, ami a C xy -t is pozitívvá teszi. Az X és Y közötti negatív irányú kapcsolat esetén ezzel szemben a C xy is negatív lesz. szorzatok többsége pozitív szorzatok túlnyomó többsége, s így Ha viszont X és Y között nincs kapcsolat, akkor a pozitív és negatív előjelű kiegyenlítik egymást, így C xy értéke 0 lesz. szorzatok összességükben 10
15 Nem alkalmas viszont C xy önmagában a kapcsolat szorosságának jellemzésére, mert C xy nagysága nemcsak a vizsgált ismérvek közötti kapcsolat szorosságától, hanem az ismérvek szóródásának mértékétől is függ. Ez abból is jól látszik, hogy az X és Y mértékegységének változtatása C xy nagyságát is megváltoztatja. Bizonyítható azonban, hogy Tétel: Legyen. Ekkor Tétel: Ha nem létezik lineáris kapcsolat két ismérv között, akkor Definíció: Lineáris korrelációs együttható:, ahol A fenti két tétel segítségével belátható, hogy A korrelációt általában mintából becsüljük: Megjegyzések állítások: Az r korrelációs együttható kiküszöböli a kovariancia hátrányát. A korrelációs együttható ugyanis a kovarianciával szemben már a [-1;1] intervallumba eső, ún. normált szorossági mérőszám. Az r = 1 ill. r = -1 esetben X és Y között lineáris kapcsolat van: mindig létezik olyan és konstans, ami mellett teljesül minden i értékre. Az állításnak a megfordítása is igaz. A és r előjele mindig azonos. Az r korrelációs együttható abszolút értéke az X és Y közötti lineáris kapcsolat szorosságát méri, előjele pedig a kapcsolat irányát mutatja. Az r = 0 esetben nincs lineáris kapcsolat X és Y között. Az r korrelációs együttható négyzetét determinációs együtthatónak nevezzük. r 2 et százalékos alakban szokás kifejezni, értéke azt mutatja meg, hogy az X i értékek hány százalékban határozzák meg az Y i értékeket. 11
16 Mind a determinációs együttható, mind a korrelációs együttható, mind a kovariancia szimmetrikus X-ben és Y- ban. Ez annyit jelent, hogy e mutatók értéke nem függ attól, hogy a két változó közül melyik az X és melyik az Y. Példa: A járműiparág kilenc cégének forgalmi és foglalkoztatási adatait tartalmazza az alábbi táblázat: Foglalkoztatottak száma (efő) x i Forgalom (mft) y i Határozza meg a lineáris korrelációs együtthatót! Megoldás: Össz: x i y i ,78 55,78-175,22 101,78 10, ,22 139,22-191, ,22 63,56 28,56 17,56-3,44-13,44-14,44-17,44-29,44-31, , , , ,57-144, , , , , , , , , , , , , , , , , , ,20 11,86 180, , ,31 866, , ,2 2 Az átlagtól való eltérések: A foglalkoztatottak számának átlaga: A forgalom átlaga: A lineáris korrelációs együttható: 12
17 A foglalkoztatottak száma és a forgalom között szoros a kapcsolat Varianciaanalízis (egyszeres osztályozás) A varianciaanalízis módszere A varianciaanalízis módszere annak a kérdésnek az eldöntésére alkalmazható, hogy egy minőségi és egy mennyiségi ismérv esetén van-e kapcsolat a minőségi ismérv ismérvváltozatához való tartozás és a mennyiségi ismérv között. Vagyis, az ellenőrizendő nullhipotézisünk az, hogy kettőnél több azonos szórású, normális eloszlású valószínűségi változónak azonos-e a várható értéke is. A hipotézisek: létezik legalább egy olyan indexpár, hogy nem egyenlőek a várható értékek A hipotézisvizsgálat során F-próbát fogunk végezni. Ennek oka a következő: Az adatoknak a főátlagtól való eltéréseiből számolt teljes eltérés-négyzetösszeget ill, az ebből származtatott teljes-szórásnégyzetet (SST, ill. σ) két tényező összegére bontjuk: az egyes elemeknek a csoportátlagtól való eltéréseinek négyzetösszegére (SSB, ill. σ B), valamint a csoportátlagoknak a főátlagoktól vett eltérésnégyzetösszegére (SSK, ill. σ K) Az ezekből képzett hányados nagyságrendje már jól jellemzi a hipotézisvizsgálatunk tárgyát: nagy hányados nagy különbségre utal, az 1 körüli érték viszont kicsire. Mivel a szórásnégyzetek χ 2 -eloszlásúak, így hányadosukat F-eloszlással tesztelhetjük. Állításaink bizonyításaitól eltekintünk. Számolásunk eredményeit Fisher nyomán az ú.n. ANOVA-táblázatban (Analysis of Variance) szokás összefoglalni. Ennek felépítése egyszeres osztályozásnál a következő: Szórás oka Eltérés négyzetösszeg Szabadság fok Közepes szórásnégyzet Számolt F Faktorhatás SSK m-1 Hiba v. maradék SSB m(n-1)= N-m SST n A táblázatban szereplő mennyiségek kiszámítása: 1. eset: 13
18 Ha,, vagyis ha a minőségi ismérv egyes változataihoz ugyannyi adat tartozik. N a mintaelemszám, m a minőségi ismérv változatainak száma. Az eltérés-négyzetösszegek: A szórásnégyzetek:, Ezek alapján a próbafüggvény: A táblázatból kikeresendő kritikus érték pedig: 2. eset: Ha, legyen, A próbafüggvény: A kritikus érték: Mivel jobboldali kritikus tartományunk van, H 0-t elfogadjuk, ha elvetjük, vagyis H 1-et fogadjuk el., ellenkező esetben 14
19 Példa 1: Kapcsolatvizsgálat: asszociáció, Öt különböző típusú személyautónak megvizsgálták a benzinfogyasztását. Az autókat 5 gépkocsivezető hosszabb szakaszon tesztelte és az alábbi benzinfogyasztásokat tapasztalták (l/100km): BMV AUDI VW OPEL FIAT α = 0.05 biztonsági szinten döntse el, hogy az autók benzinfogyasztása között van-e szignifikáns eltérés! Megoldás:, azaz az egyes autók átlagfogyasztása 100 km-en várhatóan megegyezik. Létezik autótípus, melynek fogyasztása, nem egyezik meg a többivel. Számoljuk ki az ANOVA-táblázathoz szükséges adatokat: m=5 a mennyiségi ismérv változatainak száma n j=5 csoporton belüli mintaelemszám N=mn j=55=25 mintaelemszám mennyiségi ismérv értékei szignifikancia-szint BMV ,7 11,34 AUDI ,1 11,62 VW ,1 8,82 OPEL ,7 10,54 FIAT ,0 8,8 Össz: 255,6= 15
20 Főátlag: A χ 2 -eloszlás táblázatából: 5.1. táblázat - Az ANOVA-tábla: Szórás oka Eltérés négyzetösszeg Szabadság fok Közepes szórásnégyzet Számolt F Faktorhatás SSK=36,4656 m-1=4 Hiba v. maradék SSB=13,5344 m(n-1)= N- m=20 SST=50 n-1= ábra Tehát f az elutasítási tartományba esik. Így 5%-os szignifikancia-szinten az autók átlagos fogyasztása között van eltérés. Példa Egy élelmiszerbolt sajtforgalma a hét kiválasztott napjain: A nap megnevezése Megfigyelt Eladott sajtmennyiség 16
21 napok száma (kg) Hétfő (H) 6 30, 40, 54, 34, 44, 50 Egyéb hétköznap (E) 10 49, 43, 30, 59, 35, 46, 42, 35, 36, 43 Szombat (Sz) 6 52, 58, 57, 70, 54, 53 Összesen: 22 - Feltételezve, hogy az eladott sajtmennyiség a hét háromféle napjain azonos szórású normális eloszlást követ, ellenőrizzük 5%-os szignifikancia szinten azt a nullhipotézist, hogy a hét elején, hét közben és hét végén eladott mennyiség várható értéke azonos! Megoldás: H 0: A három nap-típuson az eladott sajtmennyiség várható értéke azonos. H 1: Valamelyik időszakban az eladott mennyiség eltér a többitől. m=3 a mennyiségi ismérv változatainak száma n 1=6 csoportokon belüli mintaelemszám n 2=10 n 3=6 N= n 1+ n 2+ n 3=6+10+6=22 mintaelemszám mennyiségi ismérv értékei szignifikancia-szint n i H E Sz Össz: 1014 N=22 Főátlag: 17
22 A kritikus érték: Az ANOVA-tábla: Szórás oka Eltérés négyzetösszeg Szabadság fok Közepes szórásnégyzet Számolt F Faktorhatás SSK=1042,9 m-1=2 Hiba v. maradék SSB=1276,9 m(n-1)= N- m=19 SST=50 mn= N-1= ábra Tehát f az elutasítási tartományba esik. Így 5%-os szignifikancia-szinten elutasítjuk azt a nullhipotézist, hogy a hét elején, hét közben és hét végén eladott mennyiség várható értéke azonos Többváltozós korrelációszámítás A kétváltozós korrelációs modell azzal a feltételezéssel él, hogy a megfigyelt eredményváltozó csupán egyetlen magyarázóváltozó hatására jött létre. Azonban a jelenségek többségére inkább az igaz, hogy kialakulásukért több tényező a felelős. (pl.: egy használtautó eladási ára nemcsak a korának, de a futott kilométereknek is a függvénye.) Ezeket a jelenségeket már nem lehet az eddig ismertetett kétváltozós korrelációs modellek segítségével modellezni, szükség van a magyarázó változók számának kiterjesztésére. A változók közötti kapcsolatot a korrelációs mérőszámokkal lehet meghatározni. Többváltozós korrelációnál többfajta mérőszámot lehet meghatározni Többváltozós korrelációs mérőszámok 1. Páronkénti korrelációs együtthatók 18
23 Két változó közötti kapcsolat szorosságának mérésére a páronkénti korrelációs együtthatók alkalmazhatók. Ezeket az értékeket mátrixformában szokás megadni:, ahol Az R korrelációs mátrix a főátlójára szimmetrikus, hiszen pl.: y és x 1 közötti kapcsolat éppen olyan szoros, mint az x 1 és y közötti kapcsolat. Leggyakrabban m=2. Ebben az esetben a páronkénti korrelációs együtthatók: ahol a d értékek a megfelelő változók átlagtól való eltérései. 1. Parciális korrelációs együtthatók A parciális korrelációs együttható azt mutatja meg, hogy milyen szoros valamelyik magyarázó és függő változó kapcsolata, ha a többi magyarázó változó hatását mind a vizsgált magyarázó változóból, mind a függő változóból kiszűrjük. m=2 esetén,,, Valamennyi korrelációs együtthatóra igaz, hogy értéke 0 és 1 között mozog. Az a kedvező eset, amikor 1-hez közeliek az értékek, hiszen ez azt jelenti, hogy a vizsgált változók közötti kapcsolat szoros. Amikor azonban az a kérdés, hogy mennyire jó az illeszkedés, akkor a korrelációs együtthatók négyzetét, azaz a determinációs együtthatót kell meghatározni Előrejelzés Amikor már tudott, hogy a felállított modell megfelelően tükrözi a valóságot, már nyugodtan lehet előrejelzéseket készíteni. Ezúttal is van lehetőség egy adott pontban felvehető átlagos és egyedi érték kiszámítására. Az eljárásra ismételten igaz, hogy a kétváltozós regressziónál alkalmazotthoz igen hasonló, attól csupán a t-eloszlás szabadságfokában és a standard hibák kiszámításában tér el. Adott pont mellett az eredményváltozó által felvehető értékre a keresett intervallum: átlagos érték keresése esetén a standard hiba:, míg egyedi értékre vetítve:, 19
24 Példa: Kapcsolatvizsgálat: asszociáció, Tíz egyetemi hallgatóra vonatkozó adatokat vizsgálva határozzuk meg, hogy milyen összefüggés van a Statisztika zárthelyi dolgozat eredménye (y), a felkészülési idő (x 1) és az intelligencia hányados (x 2) között! Felkészülési idő (óra) x 1 IQ x 2 Eredmény (%) y a) Határozza meg az R korrelációs mátrixot! d 1 d 2 d 1*d 2 dy dy*d 1 dy*d 2 2 d 1 2 d 2 dy 2-1,5-6,4 9,6-9,2 13,8 58,88 2,25 40,96 84,64-4,5-5,4 24,3-21,2 95,4 114,48 20,25 29,16 449,44 1,5 13,6 20,4 13,8 20,7 187,68 2,25 184,96 190,44 3,5-10,4-36,4 6,8 23,8-70,72 12,25 108,16 46,24 0,5 4,6 2,3 4,8 2,4 22,08 0,25 21,16 23,04-4,5 11,6-52,2-11,2 50,4-129,92 20,25 134,56 125,44 8,5-7,4-62,9 28,8 244,8-213,12 72,25 54,76 829,44 5,5-4,4-24,2 19,8 108,9-87,12 30,25 19,36 392,04-7,5-5,4 40,5-32,2 241,5 173,88 56,25 29, ,84-1,5 9,6-14,4-0,2 0,3-1,92 2,25 92,16 0,04 20
25 -93,00 802,00 54,20 218,5 714, ,60 Értelmezés: A felkészülési idő és az elért eredmény között nagyon szoros, pozitív korrelációs kapcsolat van (r = 0,9625), de az IQ és az eredmény között nincs szignifikáns kapcsolat (r = 0,0359), vagyis az eredményt a legnagyobb mértékben a felkészülési idő befolyásolja. A felkészülési idő és az IQ között laza, negatív irányú kapcsolat van, vagyis a magasabb IQ-val rendelkezők kevesebb időt fordítanak felkészülésre. A korrelációs mátrix: b) Határozza meg a parciális korrelációs együtthatókat! Értelmezés: A parciális korrelációs együtthatók már jóval szorosabb kapcsolatokat mutatnak. Azonos IQ esetén a felkészülési idő és az eredmény között nagyon szoros pozitív kapcsolat van. Azonos felkészülési idő esetén, az IQ és az elért eredmény között szintén nagyon szoros pozitív irányú kapcsolat van. A magyarázó változó között is nagyon szoros, negatív irányú kapcsolat van, vagyis a magasabb IQ-val rendelkezők kevesebb időt fordítanak a tanulásra Összefoglalás 1. A közlekedésbiztonsági szervek 1000 személyi sérüléses közúti balesetet vizsgáltak meg a következő ismérvek szerint: milyen súlyos volt a baleset és a sérült viselt-e biztonsági övet. A kapott eredmények az alábbiak: 21
26 Baleset Övet viselt nem viselt Összesen Kapcsolatvizsgálat: asszociáció, Könnyű Súlyos Halálos Összesen Mérje le, hogy milyen szoros a kapcsolat a két ismérv között! 1. Egy gazdasági ág dolgozói köréből származó 150 elemű véletlen minta megoszlása nemek és iskolai végzettség szerint: Nemek Felsőfokú Középfokú Alapfokú iskolai végzettség Összesen Férfi Nő Összesen Számítsa ki és értelmezze a nem ismérve és az iskolai végzettség közötti kapcsolat szorosságát jelző mutatószám értékét! 1. Vizsgálták a nemek és a házimunkával töltött idő kapcsolatát. nem válaszolók száma (n j) házimunka (óra) átlag szórás férfi nő Összesen 1000 Határozza meg, hogy van-e összefüggés a nemhez való tartozás és a házimunkával töltött idő mennyisége között! 1. Egy budapesti vállalatnál a foglalkoztatottak körében felmérték a közlekedésre fordított napi időt. Az eredményeket az alábbi tábla tartalmazza: Állandó Foglalkoztatotta A közlekedésre fordított 22
27 lakóhely k száma idő Kapcsolatvizsgálat: asszociáció, napi átlaga (perc) Budapest Vidék Összesen: 100 A vállalat egészénél az egyes dolgozók közlekedésre fordított ideje átlagosan 40%-kal tér el az átlagtól. Számítsa ki és értelmezze a H 2 és H mutatót! 1. A búzakalász hossza (cm) és a kalászonkénti szemszám (db) közti kapcsolatot 9 véletlenszerűen kiválasztott kalász esetén a következő táblázat mutatja: hossz 10,2 9,5 8,6 8,3 8,1 8,1 7,7 7,3 7,1 szemszám a. Számolja ki a Spearman-féle rangkorrelációs együtthatót! b. Határozza meg a lineáris korrelációs együtthatót! 1. Az A luxus, a B sedan és egy C széria autótípus meghibásodásait vizsgálták. A három autótípus 5-5 darabjának a garancia idő alatti meghibásodásait adja meg az alábbi táblázat: A B C α = 0.05 szignifikancia szinten döntsük el, hogy a három modell meghibásodásainak átlaga megegyezik-e 1. Három kórház azonos fajta betegséggel kezelt távozó betegei közül véletlenszerűen kiválasztottak néhányat, és megkérdezték tőlük, hogy hány napot töltöttek a kórházban. az eredményeket a következő táblázat mutatja: Kórház Betegek száma A kórházban töltött napok száma A 5 13, 14, 11, 16, 10 B 9 20, 22, 18, 16, 10, 11, 17, 17, 20 C 6 13, 9, 10, 11, 12, 13 Vizsgálja meg 5 százalékos szignifikancia-szinten, hogy a három kórházban töltött idő lehet-e egyforma hosszú az adott fajta betegségben szenvedők körében! 23
28 1. Számolja ki a parciális korrelációs együtthatót! 2. Vizsgálja meg a szállítás költsége (y) a szállítási távolság (x 1) és a szállítási tömeg (x 2) közötti összefüggést! távolság (km) tömeg (t) költség (eft) a. Vezesse le az R korrelációs mátrixot! b. Határozza meg a parciális korrelációs együtthatókat! Irodalomjegyzék Hunyadi - Vita : Statisztika közgazdászoknak, KSH, Budapest, 2002 Keresztély,Sugár,Szarvas: Statisztika példatár közgazdászoknak, BKE, Nemzeti Tankönyvkiadó, 2005 Korpás A. : Általános statisztika I-II., Nemzeti Tankönyvkiadó, Budapest, 1996 Csanády V., Horváth R., Szalay L.: Matematikai statisztika, EFE Matematikai Intézet, Sopron, 1995 Závoti, Polgárné, Bischof: Statisztikai képletgyűjtemény és táblázatok, NYME Kiadó, Sopron, 2009 Csernyák L.: Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest, 1990 Obádovics J. Gy.: Valószínűségszámítás és matematikai statisztika, Scolars Kiadó, Budapest, 2003 Reimann J., - Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1991 Solt Gy. : Valószínűségszámítás, Műszaki Könyvkiadó, Budapest, 1971 Denkinger G. : Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest,
Matematikai statisztikai elemzések 5.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések. MSTE modul Kapcsolatvizsgálat: asszociáció vegyes kapcsolat korrelációszámítás. Varianciaanalízis
Korrelációs kapcsolatok elemzése
Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az
Statisztika II. BSc. Gyakorló feladatok I. 2008. február
1) Egyik felsıoktatási intézmény oktatóitól megkérdezték, hogy milyen intézménytípust tartanának ideálisnak. A megkérdezettek megoszlása a két kérdésre (irányítás és az oktatók teljesítményének értékelése)
Függetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
Matematikai statisztikai elemzések 6.
Matematikai statisztikai elemzések 6. Regressziószámítás: kétváltozós lineáris és nemlineáris regresszió, többváltozós regresszió Prof. Dr. Závoti, József Matematikai statisztikai elemzések 6.: Regressziószámítás:
Matematikai statisztikai elemzések 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 6. MSTE6 modul Regressziószámítás: kétváltozós lineáris és nemlineáris regresszió, többváltozós
2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
Kvantitatív statisztikai módszerek
Kvantitatív statisztikai módszerek 1. konzultáció tárgyjegyző Dr. Szilágyi Roland Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály
Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József
Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József Matematika III. 2. : Eseményalgebra Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027 Tananyagfejlesztéssel
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Matematikai statisztikai elemzések 2.
Matematikai statisztikai elemzések 2. Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás Prof. Dr. Závoti, József Matematikai statisztikai elemzések 2.: Helyzetmutatók, átlagok, Prof. Dr. Závoti,
Matematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József
Matematika III. 8. A szórás és a szóródás egyéb Prof. Dr. Závoti, József Matematika III. 8. : A szórás és a szóródás egyéb Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
Statisztikai alapfogalmak
Statisztika I. KÉPLETEK 2011-2012-es tanév I. félév Statisztikai alapfogalmak Adatok pontossága Mért adat Abszolút hibakorlát Relatív hibakorlát Statisztikai elemzések viszonyszámokkal : a legutolsó kiírt
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
Korreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Matematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
Regressziós vizsgálatok
Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet
GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő
Matematikai statisztikai elemzések 2.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 2. MSTE2 modul Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás egyéb mérőszámai.
VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)
VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket
Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József
Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József Matematika III. 4. : A valószínűségi változó és jellemzői Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul
Varianciaanalízis 4/24/12
1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft
Gyak1: b) Mo = 1857,143 eft A kocsma tipikus (leggyakoribb) havi bevétele 1.857.143 Ft. c) Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft Gyak2: b) X átlag = 35 Mo = 33,33 σ = 11,2909 A = 0,16 Az
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
Matematikai geodéziai számítások 10.
Matematikai geodéziai számítások 10. Hibaellipszis, talpponti görbe és közepes ponthiba Dr. Bácsatyai, László Matematikai geodéziai számítások 10.: Hibaellipszis, talpponti görbe és Dr. Bácsatyai, László
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
GVMST22GNC Statisztika II.
GVMST22GNC Statisztika II. 4. előadás: 9. Kétváltozós korreláció- és regressziószámítás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Korrelációszámítás
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 7. MA3-7 modul Helyzetmutatók, átlagok, kvantilisek SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról
Korreláció számítás az SPSSben
Korreláció számítás az SPSSben Kvantitatív statisztikai módszerek Petrovics Petra Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi
Matematikai geodéziai számítások 5.
Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP
Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus
Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú
Matematikai statisztikai elemzések 1.
Matematikai statisztikai elemzések 1. A statisztika alapfogalmai, feladatai, Prof. Dr. Závoti, József Matematikai statisztikai elemzések 1.: A statisztika alapfogalmai, feladatai, statisztika, osztályozás,
Matematikai statisztikai elemzések 3.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzek 3. MSTE3 modul Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl SZÉKESFEHÉRVÁR
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység
KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:
STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
Biomatematika 13. Varianciaanaĺızis (ANOVA)
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:
Kutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot
Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József
Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József Matematika III. 9. : Statisztikai hipotézisek Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027
Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József
Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József Matematika III. 5. : Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP
Biostatisztika VIII. Mátyus László. 19 October
Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.
Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November
A leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Bevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)
5.4: 3 különböző talpat hasonlítunk egymáshoz Varianciaanalízis. hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik) hipotézis: Létezik olyan μi, amely nem egyenlő a többivel (Van
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
Khi-négyzet eloszlás. Statisztika II., 3. alkalom
Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként
Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem
Statisztika I 2 előadás: Statisztikai táblák elemzése Kóczy Á László koczylaszlo@kgkuni-obudahu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Eddig statisztikai alapfogalmak
Matematikai statisztikai elemzések 4.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 4. MSTE4 modul Hipotézisvizsgálat: alapfogalmak, egymintás és kétmintás próbák. Illeszkedés-
Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58
u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ
Egyszempontos variancia analízis. Statisztika I., 5. alkalom
Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 4. MA3-4 modul A valószínűségi változó és jellemzői SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról
Matematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
Bevezető Mi a statisztika? Mérés Csoportosítás
Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető
TANTÁRGYI ÚTMUTATÓ. Statisztika 1.
I. évfolyam BA TANTÁRGYI ÚTMUTATÓ Statisztika 1. TÁVOKTATÁS Tanév 2014/2015 II. félév A KURZUS ALAPADATAI Tárgy megnevezése: Statisztika 1. Tanszék: Módszertani Tantárgyfelelős neve: Sándorné Dr. Kriszt
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 6. MA3-6 modul A statisztika alapfogalmai SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról szóló 1999.
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 1. MA3-1 modul. Kombinatorika
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 1. MA3-1 modul Kombinatorika SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról szóló 1999. évi LXXVI.
Biometria gyakorló feladatok BsC hallgatók számára
Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90
Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat
Viszonyszámok Viszonyszám Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a viszonyítandó adat Viszonyítás tárgya (viszonyítandó adat) B: a viszonyítás alapja V viszonyítadóadat
Matematikai statisztikai elemzések 4.
Matematikai statisztikai elemzések 4. Hipotézisvizsgálat: alapfogalmak, egymintás és kétmintás próbák. Prof. Dr. Závoti, József Matematikai statisztikai elemzések 4.: Hipotézisvizsgálat: alapfogalmak,
Matematikai geodéziai számítások 5.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr Bácsatyai László Matematikai geodéziai számítások 5 MGS5 modul Hibaterjedési feladatok SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Kettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk
Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22
Bevezetés a Korreláció &
Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv
Sztochasztikus kapcsolatok
Sztochasztikus kapcsolatok Petrovics Petra PhD Hallgató Ismérvek közötti kapcsolat (1) Függvényszerű az egyik ismérv szerinti hovatartozás egyértelműen meghatározza a másik ismérv szerinti hovatartozást.
[GVMGS11MNC] Gazdaságstatisztika
[GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)
Többváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi
Többváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari
III. Kvantitatív változók kapcsolata (korreláció, regresszió)
III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással
[Biomatematika 2] Orvosi biometria. Visegrády Balázs
[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés
Populációbecslés és monitoring. Eloszlások és alapstatisztikák
Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk
STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció
Módszertani Intézeti Tanszéki Osztály
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012. Név:... Kód:...... Eredmény:..... STATISZTIKA I. VIZSGA; NG KM ÉS KG TQM SZAKOKON MINTAVIZSGA Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető
Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció