Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o)



Hasonló dokumentumok
Statisztika. Eloszlásjellemzők

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Feladatok és megoldások a 11. heti gyakorlathoz

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

? közgazdasági statisztika

? közgazdasági statisztika

Változók függőségi viszonyainak vizsgálata

Regresszió és korreláció

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

Regresszió és korreláció

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

A sokaság/minta eloszlásának jellemzése

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Matematikai statisztika

A matematikai statisztika elemei

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra)

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A MATEMATIKAI STATISZTIKA ELEMEI

Korreláció- és regressziószámítás

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

PDF created with FinePrint pdffactory Pro trial version Irodalom.

Megjegyzés: Amint már előbb is említettük, a komplex számok

A Secretary problem. Optimális választás megtalálása.

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

i 0 egyébként ábra. Negyedfokú és ötödfokú Bernstein polinomok a [0,1] intervallumon.

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970

Valószínűségszámítás. Ketskeméty László

Valószínőségszámítás

Járattípusok. Kapcsolatok szerint: Sugaras, ingajárat: Vonaljárat: Körjárat:

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Függvénygörbe alatti terület a határozott integrál

Arrhenius-paraméterek becslése közvetett és közvetlen mérések alapján

Ökonometria. /Elméleti jegyzet/

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

1. Írd fel hatványalakban a következõ szorzatokat!

Bizonyítások. 1) a) Értelmezzük a valós számok halmazán az f függvényt az képlettel! (A k paraméter valós számot jelöl).

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Regresszió. Fő cél: jóslás Történhet:

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Megoldás a, A sebességből és a hullámhosszból számított periódusidőket T a táblázat

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

4 2 lapultsági együttható =

2.10. Az elegyek termodinamikája

Matematika B4 I. gyakorlat

Diszkrét Matematika 1. óra Fokszámsorozatok

Valószínűségszámítás összefoglaló

NEMPARAMÉTERES ELJÁRÁSOK

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

Statisztika segédlet*

Korrelációs kapcsolatok elemzése

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Tuzson Zoltán A Sturm-módszer és alkalmazása

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

1. Gyökvonás komplex számból

3. Számelmélet. 1-nek pedig pontosan három. Hány pozitív osztója van az n számnak? OKTV 2012/2013; I. kategória, 1. forduló

BIOMATEMATIKA ELŐADÁS

Matematikai statisztika

Statisztika 1. zárthelyi dolgozat március 21.

A heteroszkedaszticitásról egyszerûbben

Kutatói pályára felkészítı modul

7. MÉRÉSEK KIÉRTÉKELÉSE FÜGGVÉNYILLESZTÉSSEL

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

A Sturm-módszer és alkalmazása

STATISZTIKA II. kötet

Wilcoxon-féle előjel-próba. A rangok. Ismert eloszlás. A nullhipotézis megfogalmazása H 1 : m 0 0. A medián 0! Az eltérés csak véletlen!

Statisztikai hipotézisvizsgálatok

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Sorozatok A.: Sorozatok általában

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

Kalkulus II., második házi feladat

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

STATISZTIKAI MÓDSZEREK

Átírás:

Ismérvek között kapcsolatok szorosságáak vzsgálata 1. Egy ks smétlés: mérés skálák (Huyad-Vta: Statsztka I. 5-6. o) A külöböző smérveket, eltérő mérés sztekkel (skálákkal) ellemezhetük. a. évleges (omáls) mérés skála: az egységekhez redelhető smérvértékek (akár számok akár em) alapá csak azt tuduk megállapíta, hogy az egységek az adott smérv szempotából egyezőek-e vagy sem. Műveleteket em tuduk velük végez. Példa: lakhely típusa smérv smérvértéke: főváros, város, község. A mérés szt évleges, hsze ez alapá csak azt tuduk megállapíta, hogy egy egyed más típusú települése él-e mt egy másk egyé, de em modhatuk, hogy a város több vagy obb mt a község. Szté semm értelme em lee ezeket eloszta egymással vagy kvo őket egymásból, még akkor sem ha az smérvértékeket számmal elölék. b. Sorred (ordáls) skála: em csak az smérvértékek külöbsége hordoz formácót, haem azok sorrede s. Példa: érdemegyek (smérvértékek: 1,, 3, 4, 5). Tuduk, hogy ak ötöst kapott, az emcsak eltér attól, ak égyest kapott, haem obba s telesített. Tehát va értelme sorredbe helyez az egyedeket az érdemegy alapá. Ugyaakkor ylvávalóa sem a kvoásak, sem az osztásak em lee értelme: az egyes és a kettes között más a külöbség, mt a kettes és a hármas között. Az sem lee gaz, hogy ak kettest kapott az kétszer olya ó volt, mt ak egyest, vagy, hogy az egyes a ketteshez úgy aráylk, mt a kettes a égyeshez. c. ülöbség (tervallum) skála: az smérvértékek külöbségeek va értelme (va mértékegység s), ugyaakkor az aráyokat em tuduk értelmez. Eek oka, hogy a külöbség skálá mérhető smérvek esetébe a ulla pot ökéyese va kelölve. Példa: Celsus-féle hőmérséklet skála. 10 C és 0 C között a külöbség ugyaay mt 0 C és 30 C között. Ugyaakkor em modhatuk, hogy a 10 C kétszer melegebb, mt az 5 C, vagy, hogy a 0 C pot ayszor melegebb a 10 C-ál, mt a 10 C az 5 C-ál. elátható, hogy eek az az oka, hogy a Celsus-féle skála ulla pota (lletve a 100 C s) ökéyese került megállapításra: 0 C em elet a hőmérséklet háyát. d. Aráyskála: Az smérvértékek aráya s értelmezhetőek, a ulla pot em ökéyese va megállapítva. Példa: az smérv a hav övedelem. Ha valakek 00 ezer fort a hav övedelme, akkor arra yugodta modhatuk, hogy kétszer ay, mt a 100 ezer fortos övedelem és, hogy ez a két övedelem pot úgy aráylk egymáshoz, mt az 1 mlló fortos övedelem az 500 ezres övedelemhez. A ulla pot em ökéyes, hsze a ulla fort övedelem a övedelem háyát elöl. Az smérvek között kapcsolat szorosságát az smérvek mérés skáláától függőe a következő eszközökkel vzsgálhatuk: 1. Mdkét smérv mőség vagy terület (azaz omáls mérés sztű): asszocácó. Az egyk smérv terület vagy mőség (azaz omáls mérés sztű), a másk smérv (változó) pedg meység (azaz legalább külöbség skálá mért): vegyes kapcsolat 3. Mdkét smérv meység: korrelácó.

Asszocácó: Megfgyeltük, hogy egy három szíbe (pros, kék, zöld) gyártott termékből a férfak és a ők mey darabot vásároltak. (Azaz két mőség smérvük va: termék szíe, és a vásárló eme). Vao va-e kapcsolat a vásárló eme, és a választott szí között? pros kék zöld összese férfak 10 15 0 45 ők 0 10 5 35 összese 30 5 5 80 Az általáos elölésekkel: pros kék zöld összese férfak f 11 f 1 f 13 f 1. ők f 1 f f 3 f. összese f.1 f. f.3 A fet kotgecatáblába a sorok és az oszlopok utolsó adata peremgyakorságokak evezzük. A feladat megoldásához készítsük el a fet tábla egy olya verzóát, amelybe feltételeztük az smérvek függetleségét. Ha a két smérv függetlee, akkor a gyakorságok kszámíthatóak a peremgyakorságokból a következő módo: f *. f. f Azaz ha a szí és a vásárló eme függetleek leéek egymástól, akkor az f 11 gyakorság helyé a következő gyakorság szerepele: * f.1 f1. 4530 f11 16,875 80 Így elkészíthetük a kotgecatáblát a feltételezett gyakorságokkal: pros kék zöld összese férfak 16,875 14,065 14,065 45 ők 13,15 10,9375 10,9375 35 összese 30 5 5 80 A taköyv 16. oldalá látható kh-égyzet teststatsztkát a valós és a feltételezett valószíűségekből a következő módo számolhatuk k: r c * f f * f 1 1, ahol r a sorok, c pedg az oszlopok száma. Jele példába: (10 16,875) (15 14,065) (0 14,065) (0 13,15) (10 10,9375) 16,875 14, 065 14, 065 13,15 10,9375 (5 10,9375) 1, 751 10,9375 Az, hogy a fet statsztka ullától eltér, már elz, hogy a két smérv között va kapcsolat. Az asszocácó egyk gyakor mérőszámát, a Cramer-féle asszocácós együtthatót a következő módo számolhatuk k: C m(( r 1),( c 1))

Ahol a m((r-1),(c-1)) függvéy azt elet, hogy a sorok lletve az oszlopok számából vouk k egyet, és a ksebb értéket vegyük fgyelembe. Azaz, mvel ebbe a példába két sor és három oszlop volt (az összesítő oszlop és sor em számít!) Azaz: 1, 751 C 0,3917 m(( r 1),( c 1)) 801 A Cramer-féle mutató értéke 0 és 1 között értékeket vehet fel. Értéke 0 a két smérv függetlesége, 1 pedg a két smérv determsztkus kapcsolata eseté. A fet érték egy a közepesél gyegébb kapcsolatra utal a vásárló eme, és a választott szí között. Vegyes kapcsolat: Példa: egy vállalatál megfgyeltük a férfak és a ők keresetet (ezer fort/hó): Férfak: 10, 83, 65, 190, 30, 10, 130, 190 ők: 70, 65, 90, 100, 10, 130 Vao va-e összefüggés a kereset (meység smérv) és a em (mőség smérv) között? Az átlagbért és a szórást kszámoluk az egyes kategórákba, azaz a részsokaságokra (ezt em részletezem, a képletek smertek). Az egyes kategórákra (emekre) kszámolt átlagok a részátlagok. észítsük el a táblát a megoldáshoz: em Létszám Átlagbér (ezer ft/hó) (részátlagok, Y ) Szóráségyzet Szórás (ezer ft/hó) férf 8 141 858,5 53,46 ő 6 95,83 570,14 3,88 összese 14 Illetve számoluk k az átlagbért és a szórást az egész sokaságra (utóbb a teles szórás), azaz férfakra és őkre együttese: Y 11,7 ezer ft/hó, a teles szórás pedg 48,76 ezer ft/hó A taköyv 149-150. oldalá található meg a módszer részletes leírása. A léyeg, hogy a teles szóráségyezet (σ ) felotható két szóráségyzet összegére: Ahol σ a külső szórás és azt mutata meg, hogy a részátlagok átlagosa meyre térek el a főátlagtól, míg σ a belső szórás és azt mutata meg, hogy az egyes részsokaságokhoz tartozó megfgyelések (a ők lletve külö a férfak) meyre térek el átlagosa a saát részátlaguktól. Láthatuk, hogy ha a fet szóráségyzetekből (lletve a szórásokból) kettőt smerük, a harmadk már azokból kszámolható. A teles szóráségyzetet smerük, hsze az: 48, 76 377, A külső szóráségyzet a következő módo számolható k: M 1 8 (14111, 7) 6 (95,8311, 7) ( Y Y ) 499,6 14 1

Vagys a külső szóráségyzet em más, mt az egyes részátlagokak a sokaság egészéek átlagától vett égyzetes eltéréséek az egyes részsokaságokba tartozó egyedek számával súlyozott számta átlaga. A belső szóráségyzet tehát: 377, 499,6 1877, 6 Természetese k lehete számol a belső szóráségyzetet s: M 1 8858, 5 6570,14 1877,6, am egybe a számításak próbáa s. A 1 14 megoldásuk helyes. A vegyes kapcsolat szorosságáak leírásához a H mutatót haszáluk fel, am em más, mt az Y smérv (fzetés) szóráségyzetéek az X smérv (em) által magyarázott háyada. 499,6 H 1 0,1 377, Azaz ebbe a példába azt találuk, hogy a em a fzetésekbe megfgyelhető külöbségek 1%-át magyarázza. Ez gyege vegyes kapcsolatra utal. orrelácó: ét meység smérv között kapcsolat szorosságát mérhetük ezzel a mutatóval. Példa: a övedelem és a fogyasztás kapcsolatát elemeztük Egyé Fogyasztás Jövedelem (ezer ft) (ezer ft) 1 100 10 90 140 3 140 160 4 180 00 5 110 10 6 1 300 7 10 150 összese - - Vzsgáluk meg a két smérv között kapcsolat szorosságát! Az egyk kulcsfotosságú statsztka a kovaraca: Y Y X X dydx 1 1 cov( y, x), ahol dy Y Y, dx X X Ha a kovaraca értéke ulla, akkor a két változó között leárs kapcsolat cs. A kovaraca előele a kapcsolat ráyára utal. Poztív kovaraca eseté magasabb x értékekhez általába magasabb y értékeke társulak, míg egatív kovaraca eseté a kapcsolat ráya s egatív, azaz magasabb x értékekhez általába alacsoyabb y értékeke társulak. A kapcsolat szorosságáról azoba a kovaraca em ad táékoztatást.

A két smérv között kapcsolat szorosságáak mérésére a kovaracáál alkalmasabb mutató a korrelácós együttható. 1 cov( y, x) r( y, x) y x dy dx 1 dy dx dy dx 1 1 1 1 A korrelácós együttható -1 és 1 között értékeket vehet fel. Ha r=0, akkor a két változó között cs leárs kapcsolat. A korrelácós együttható előele, megőrzve a kovaraca előelét, a kapcsolat ráyára utal. Azaz poztív korrelácós együttható eseté magasabb x értékek általába magasabb y értékekkel párosulak, míg egatív együttható eseté magasabb x értékekhez általába alacsoy y értékek tartozak. Mél közelebb kerül az együttható értéke a 1-hez vagy -1-hez, aál erősebb a kapcsolat. Specáls eset ha r=1 vagy r=-1. Ekkor azt moduk, hogy x és y között determsztkus kapcsolat va, azaz ha smerük x értékét potosa (bzoytalaság, hba élkül) meg tuduk határoz y értékét s. Azaz y=a+b*x, ha r=1, és y=a-b*x, ha r=-1. Számoluk k a korrelácós együttható értékét! dy Egyé Fogyasztás övedelem (ezer ft) (ezer ft) dy dx dy dx dydx 1 100 10-36 -50 196 500 1800 90 140-46 -30 116 900 1380 3 140 160 4-10 16 100-40 4 180 00 44 30 1936 900 130 5 110 10-6 -50 676 500 1300 6 1 300 76 130 5776 16900 9880 7 10 150-16 -0 56 400 30 összese - - 0 0 107 400 15960 dx dydx 1 15960 cov( y, x) 80, azaz va kapcsolat a övedelem és a fogyasztás között, 7 ráya pedg poztív. dy dx 15960 1 (, ) 0,934 107400 dy dx 1 1 r y x A fet korrelácós együttható erős, poztív kapcsolatra utal a övedelem és a fogyasztás között. Magasabb övedelmekhez magasabb fogyasztás társul. A korrelácós együtthatóból számítható a determácós együttható (r ), amelyek értelmezése a H együtthatóhoz hasoló: megmutata, hogy x változó segítségével az y változó szóráségyzetéek mekkora háyadát magyaráztuk. r 0,934 0,87, azaz a övedelem a fogyasztás szóráségyzetéek 87,%-át magyarázza.