ÁLTALÁNOS STATISZTIKA

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "ÁLTALÁNOS STATISZTIKA"

Átírás

1 Berzseny Dánel Főskola ÁLTALÁNOS STATISZTIKA műszak menedzser alapszak Írta: Dr. Köves János Tóth Zsuzsanna Eszter Budapest 006

2 Tartalomjegyzék. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA A VALÓSZÍNŰSÉG FOGALMA A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA A TELJES VALÓSZÍNŰSÉG TÉTELE BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE") ESEMÉNYEK FÜGGETLENSÉGE LEÍRÓ STATISZTIKA A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI AZ ADATOK ÁBRÁZOLÁSA TAPASZTALATI ELOSZLÁSOK A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI AZ INGADOZÁS MÉRŐSZÁMAI AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK ESETTANULMÁNY LEÍRÓ STATISZTIKAI ELEMZÉS VISZONYSZÁMOK KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK A KAPCSOLAT SZEMLÉLTETÉSE AZ ELŐJEL KORRELÁCIÓS EGYÜTTHATÓ A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ AUTO- ÉS KERESZTKORRELÁCIÓ IDŐSOROK ELEMZÉSÉNÉL VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK A VALÓSZÍNŰSÉGI VÁLTOZÓ VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI BINOMIÁLIS ELOSZLÁS POISSON-ELOSZLÁS EXPONENCIÁLIS ELOSZLÁS NORMÁLIS (GAUSS-) ELOSZLÁS A KÖZPONTI HATÁRELOSZLÁS TÉTELE STATISZTIKAI DÖNTÉSEK ALAPELVEI ESETPÉLDA DÖNTÉSI ALAPMODELL DÖNTÉSI MÁTRIX A DÖNTÉSI FOLYAMAT LOGIKÁJA DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI BECSLÉS A BECSLÉS TULAJDONSÁGAI A PONTBECSLÉS MÓDSZEREI INTERVALLUMBECSLÉS... 09

3 8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA VARIANCIAANALÍZIS KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE A REGRESSZIÓS BECSLÉS PONTOSSÁGA FELHASZNÁLT ÉS AJÁNLOTT IRODALOM FÜGGELÉK: TÁBLÁZATOK

4 . VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 4

5 .. A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA A véletlen jelenség fogalma: A tömegjelenség fogalma: 5

6 .. A VALÓSZÍNŰSÉG FOGALMA A valószínűség fogalma A n f(a) f ( A) g( A) n lm n g( A) P( A) Készítette: Erde János. ábra: A valószínűség fogalma.3. A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE (Kolmogorov 93/3) I. Egy tetszőleges A esemény bekövetkezés valószínűsége 0 P(A). II. A bztos esemény valószínűsége, azaz P(Ω). III. Ha A és B egymást kzáró események, azaz A B 0, akkor P(A+B) P(A) + P(B). 6

7 .4. A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI Klasszkus valószínűség-meghatározás: Geometra úton: Valószínűségszámítás tételek segítségével: Emprkus adatokból: Elmélet eloszlások segítségével: Szubjektív becsléssel: 7

8 .5. A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN 8

9 . VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE Valószínűségszámítás Valószínűségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 9

10 .. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK Tétel: Ha A és B egy eseményalgebra két tetszőleges eseménye, akkor annak valószínűsége, hogy közülük legalább egy bekövetkezk: P( A + B) P( A) + P( B) P( A B) Bzonyítás: Tétel: Ha A esemény bekövetkezése maga után vonja a B esemény bekövetkezését, azaz A B, akkor: P( B A) P( B) P( A) és P( A) P( B) Bzonyítás: Feladat: Mutassuk k, hogy P(A) 0,7 és P(B) 0,9 esetén P(A B) 0,6. 0

11 Feladat: Próbagyártás után két szempontból vzsgáljuk a késztermékeket. Az A esemény azt jelent, hogy a vzsgált gyártmány anyaghbás, a B esemény pedg azt, hogy mérethbás. Az A esemény P(A)0,5, a B esemény P(B)0,3 és az A B esemény P(A B)0,08 valószínűséggel következk be. M a valószínűsége annak, hogy valamely késztermék hbátlan? Feladat: Egy skola tanulónál a jeles matematka és a jeles fzka osztályzatokat fgyeljük. A következő eseményeket vezetjük be tetszőlegesen kválasztott tanulókra: A: jeles osztályzata van matematkából, B: jeles osztályzata van fzkából. Ismeretesek a következők: annak valószínűsége, hogy egy véletlen kválasztott tanulónak jelese van fzkából: P(B)0,; hogy jelese van matematkából és fzkából: P(A B)0,09; hogy a matematka és fzka tárgyak közül legalább egykből jeles az osztályzata: P(A+B)0,6. M a valószínűsége annak, hogy egy tetszőlegesen kválasztott tanulónak jeles osztályzata van matematkából?

12 .. A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA Defnícó: Ha A és B egy eseményalgebra két eseménye és P(B)>0, akkor a P( A B) P( A B) PB ( ) hányadost az A eseménynek a B eseményre vonatkoztatott feltételes valószínűségének nevezzük.

13 Feladat: Egy szállítmány 96 %-a megfelel a mnőség előírásoknak, s ezek 75 %-a első osztályú. Mekkora a valószínűsége annak, hogy egy találomra kválasztott darab első osztályú? Feladat: Egy telefonfülke előtt állunk és várjuk, hogy az előttünk beszélő befejezze a beszélgetést. Az llető beszélgetés dőtartama (τ) véletlen esemény, melyre érvényes a következő: P 3 ( τ t) e a.) Határozzuk meg annak a valószínűségét, hogy a beszélgetés 3 percnél tovább tart! b.) Menny annak a valószínűsége, hogy a beszélgetés tovább 3 percnél tovább tart, feltéve, hogy eddg 3 percnél tovább tartott? c.) Menny annak a valószínűsége, hogy a beszélgetés t+3 percnél tovább tart, feltéve, hogy t percnél tovább tartott? t 3

14 Feladat: Egy börtönben három elítéltet tartanak fogva: A-t, B-t és C-t. A következő napon egyküket felakasztják. A börtönőr tudja kt akasztanak fel, de nem szabad elárulna. Az A fogoly a következőt kérdez a börtönőrtől: "Áruld el a másk két fogoly közül egy olyannak a nevét, akt holnap nem akasztanak fel. Ha mndketten szabadok lesznek, akkor döntsd el magadban, hogy knek a nevét mondod. Ezzel nem árulsz el ttkot, mert azt már tudom, hogy egykük szabad lesz." A börtönőr ném gondolkodás után így válaszolt: "Nem, ez nem volna emberséges veled szemben. Most úgy gondolod, hogy /3 valószínűséggel akasztanak fel. Ha elárulom a többek közül egy olyannak a nevét, akt nem akasztanak fel, akkor az esélyed megnövekednek, úgy fogod gondoln, hogy / valószínűséggel akasztanak fel. Nem tudnál nyugodtan aludn". Helyesen érvelt-e a börtönőr? 4

15 .3. A TELJES VALÓSZÍNŰSÉG TÉTELE Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy tetszőleges esemény, akkor: n P( A) P( AB k) P( Bk) k Bzonyítás: 5

16 Feladat: Az MBA programban a "Kvanttatív módszerek" vzsgán a férfak 60 %-a, a hölgyek 80 %-a szerepel skeresen. A férfak az évfolyam 45 %-át teszk k. Mekkora a valószínűsége, hogy egy találomra kválasztott hallgató skeresen szerepel a vzsgán? Feladat: Három műszak azonos terméket gyárt. Egy adott napon az összes termékből az I. műszakban 40%, a II. és III. műszakban 30-30% készül. Az átlagos selejtarányok: I. műszak 5%, II. műszak 7%, III. műszak 0%. Az összes termékből a MEO egy darabot kválaszt, mekkora a valószínűsége, hogy az hbátlan? 6

17 Feladat: Egy gyártóberendezés munkadejének /3 részében az A terméket, /6 részében a B terméket, a többben pedg a C terméket gyártja. Az A termék gyártásakor az erre fordított dő 0%-ában áll a berendezés, a B termék gyártása közben végg dolgozk, míg a C termék gyártásakor a munkadő 5%-ában áll. Mekkora a valószínűsége annak, hogy egy találomra kválasztott dőpontban áll a berendezés? Feladat: Egy üzem 8 berendezése egyforma terméket gyárt. Az első három gép együttvéve 4% selejtet termel, a következő négy gépnél együttvéve 3% a selejt, míg az utolsó gép selejtaránya,5%. Az elkészült termékeket egy helyen gyűjtk. Mekkora a valószínűsége, hogy egy véletlenszerűen kválasztott darab selejtes lesz? 7

18 .4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE") Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy olyan esemény, amelyre P(A)>0, akkor: ahol: PB ( A) k P( A B ) P( B ) n k P( A B ) P( B ) k P(B k A) P(B k ) posteror" valószínűségek, pror" valószínűségek. Bzonyítás: 8

19 Feladat: Alkatrész-ellátásnál a pótalkatrészt 40%-ban a I. szállító szállítja 0% selejttel, 60%-ban pedg a II. szállító szállítja 0% selejttel. Az alkatrészraktárból kvettünk egy pótalkatrészt és azt találtuk, hogy hbás. Mekkora a valószínűsége, hogy a kválasztott alkatrész a II. szállítótól jött? Feladat: Egy üzemből kkerülő áru 75% valószínűséggel I. osztályú. A készterméket megvzsgálják. Annak a valószínűsége, hogy a vzsgálat során az I. osztályú terméket nem I. osztályúnak mnősítk %. Annak a valószínűsége, hogy egy nem I. osztályú terméket I. osztályúnak mnősítenek 5%. Mekkora a valószínűsége annak, hogy egy olyan termék, amelyk egy vzsgálat során I. osztályú mnősítést kapott, valóban I. osztályú? 9

20 Feladat: Egy folyóban bekövetkező halpusztulásért 3 par üzem lehet felelős. Tapasztalatok szernt a mérgező anyag kbocsátásának valószínűsége az egyes üzemeknél: 0%, 50% és 30%. A mérések szernt az egyes üzemek szennyvízkbocsátása esetén a halpusztulás valószínűsége: 60%, 5% és 5%. Menny a halpusztulás teljes valószínűsége? Mekkora bírságot szabjon k a Ft-os halkárért a bíróság, ha nem smeretes, k a szennyezés kbocsátója a három üzem közül? (A bírságok összege a teljes halkár.) Feladat: Bertrand problémája: tekntsünk három szekrényt, amelyek mndegykében két fók van. Az első szekrény mndkét fókjában egy-egy aranygolyó, a másodk szekrény egyk fókjában arany-, a másodkban ezüstgolyó, a harmadk szekrény mndkét fókjában ezüstgolyó van. Találomra választunk egy szekrényt (azaz bármelyket egyenlő valószínűséggel választhatjuk), khúzunk egy fókot és abban aranygolyót találunk. Mekkora a valószínűsége annak, hogy az első szekrényt választottuk? 0

21 Feladat: Egy rodában 3 munkatárs dolgozk párhuzamosan azonos típusú ügyratok ntézésén. Az első naponta 0 aktával végez, a másodk nap 5, a harmadk nap 5 aktával. Az egyes munkatársaknál naponta átlagosan 0,3; 0,9; 0,5 db hbásan kezelt ügyrat található. Az összesített nap mennységből találomra kveszünk egy aktát és azt rossznak találjuk. Mekkora a valószínűsége, hogy azt az első munkatárs készítette?

22 .5. ESEMÉNYEK FÜGGETLENSÉGE Defnícó: A és B események (sztochasztkusan) függetlenek, ha P(A B)P(A) P(B). Az A esemény független B eseménytől, ha a P(A B) feltételes valószínűség nem függ a feltételtől: P( AB ) P( A B) P( A) PB ( ) Tétel: Ha A és B függetlenek, akkor A és B, A és B, valamnt A és B s függetlenek. Bzonyítás: Tétel: Ha három esemény páronként független, még nem bztos, hogy "teljesen függetlenek", azaz még teljesül az s, hogy: P(A B C)P(A) P(B) P(C) Feladat: Két kockával dobunk. Jelentse A azt az eseményt, hogy az első kockával párost dobunk, B azt az eseményt, hogy a másodk kockával páratlant dobunk és C azt az eseményt, hogy mndkettővel párost, vagy mndkettővel páratlant dobunk. A, B és C események teljesen függetlenek-e? Defnícó: Az A, A,... A n események teljesen függetlenek, ha közülük kválasztott tetszőleges számú eseményre teljesül, hogy az együttes bekövetkezésük valószínűsége egyenlő az egyes valószínűségek szorzatával.

23 3. LEÍRÓ STATISZTIKA Valószínűségszámítás Valószínűségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 3

24 3.. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A számszerű nformácó, annak mérése és elemzése alapvető szerepet játszk a társadalm és gazdaság jelenségek elemzésében. E számszerű adatok a legtöbb esetben azzal a sajátossággal rendelkeznek, hogy a megfgyelésük, a feldolgozásuk, elemzésük és az elemzés eredményenek felhasználása tudományos módszereket gényel. A statsztka módszerek között említhetünk meglehetősen egyszerű eljárásokat, és természetesen vannak ennél bonyolultabb, összetettebb matematka-statsztka módszerek. Magának a statsztka módszertannak -a konkrét vzsgálat tárgya alapján- szokás többféle ágát megkülönböztetn, a sokféle csoportosítás lehetőség közül a m szempontunkból célszerű különválasztan a leíró és a következtető statsztka vlágát. A kettő között lényeg különbség a következőkben ragadható meg: a leíró statsztka célja a vzsgálat tárgyát képező jelenség tömör, számszerű jellemzése az adatok elemzése és rendezése alapján (pl. 0 évente tartott népszámlálások adatanak feldolgozása); míg a következtető statsztka célja mnt azt a később fejezetekben látn fogjuk a mntából történő következtetés és általánosítás a teljes sokaságra vonatkozóan (pl. néhány ezer háztartás jövedelm adataból megfelelő pontossággal megbecsülhető, hogy a magyar lakosság körében mlyen jövedelm különbségek vannak). A leíró statsztka a megfgyelt adatok bemutatását, összefoglaló jellemzését tűz k célul, és ehhez az elemzéshez sokoldalú eszköztárt kínál, ebben a fejezetben célunk ennek az eszköztárnak a bemutatása. 3.. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI Ha a célnak megfelelően összegyűjtött adathalmaz áll rendelkezésünkre, akkor a következtetések felé tett első lépésünk a mnta feldolgozása, ennek kérdéskörével foglalkozk a leíró statsztka. A statsztka leírás célja a mnta adatanak átteknthető formába történő rendezése, tömörítése, az adatok grafkus megjelenítése, ábrázolása és egyes jellemző értékenek meghatározása. Így az adatok feldolgozásának kettős célja van: egy grafkus kép, pontosabban egy tapasztalat eloszláskép produkálása; a másk pedg statsztka mutatók meghatározása. A leíró statsztka e területe közül egyedül a rendezés, tömörítés pusztán technkanak tűnő, az adatok ábrázolása és a statsztka jellemzők meghatározása lényeges szemlélet, a sztochasztkus gondolkodást, látást megalapozó területek. A statsztka jellemzők segítségével a nagyszámú adat jellegzetességet néhány adatba sűrítve próbáljuk megragadn. A statsztka jellemzőket általában három fő csoportba soroljuk, éppen az alapján, hogy az adatok mlyen jellegzetességét ragadják meg: a középértékek: az adathalmaz közös, tpkus, jellegzetes, általános vonásat kísérlk megragadn egy-egy szám segítségével. az ngadozásmutatók: az egyed, különös, specáls, sajátos, eltérő jellegzetességek mértékét mutatják meg. az eloszlás alakjára jellemző egyéb mérőszámok: aszmmetra mértékét, az adatok eloszlásának lapultságát, csúcsosságát jellemző mutatók. Bármlyen adathalmaz esetén a feladatunk az, hogy alkalmas módon jelenítsük meg az adatokat, számítsunk jellemző középérték-mutatót és ngadozásmutatót s, mvel a középértékek átlagoló, összemosó hatását éppen az ngadozásmutatók tudják ellensúlyozn, míg az ngadozásmutatók pont ezt 4

25 a jellemző értéket nem tudják megragadn. Ezért a korrekt statsztka leíráshoz legalább egy-egy jellemző szükséges mndkét mutatócsoportból. Az egyed mérésekből származó adatok lehetnek dszkrétek és folytonosak. A dszkrét adatok szükségképpen ugrásszerűen változnak. Például a számlálás alapján nyert adatok dszkrét típusúak (pl. téves telefonhívások száma, balesetek száma, adott dőszak alatt bekövetkező gépmeghbásodások száma stb.). A folytonos adatok általában mérésből származnak. Jellemzőjük, hogy egy adott ntervallumon belül elvleg bármlyen értéket felvehetnek. A mérés korláta matt ezek az adatok s ugrásszerűen változnak, de az ugrások nagysága a mérőeszköztől függ, maguk az adatok lényegüket tekntve folytonosak (pl. átmérő, nyúlás, gépkocs abroncsok futásteljesítménye, nedvességtartalom) AZ ADATOK ÁBRÁZOLÁSA A leíró statsztka jelentős részben az adatok átteknthető ábrázolásával foglalkozk, így fontos eszköze a táblázatok és dagramok. Ezeknél a dagramoknál, táblázatoknál az egyes értékek összehasonlítása áll előtérben, a grafkus ábrázolásoknál azonban nem mndg fontosak az értékek, sok esetben a vzsgált jelenséggel kapcsolatban azok megoszlása, egymáshoz való vszonya, aránya árulkodóbb. A táblázatok, dagramok lehetővé teszk nagyobb adathalmazok áttekntő ábrázolását, és vszonylag egyszerű őket elkészíten. A grafkonok a pontos értékek megadása nélkül s gyors áttekntést adnak, nagy terjedelmű mnták egészen egyszerű grafka elemekre támaszkodva válnak átteknthetővé. Néhány példa: A hba típusa Szabvány Kum. Relatív Kum. rel. Gyakorság jelölése gyakorság gyakorság gyak. Gömb alakú gázzárvány ,% 53,% Gázzárvány-halmaz ,7% 70,7% Átolvadás hány ,5% 80,3% Összeolvadás hány ,% 88,4% Gyökátfolyás ,7% 9,% Hernyó alakú gázzárvány ,0% 93,% Gyökoldal szélkolvadás ,0% 95,% Egy oldalról hegesztett kötésben átolvadás hány 40 4,4% 96,6% Hely szélkolvadás, éles bemetszés nélkül 55 44,4% 98,0% Alapanyag-varrat között összeolvadás hány ,7% 98,6% Wolfrám zárvány ,7% 99,3% Egyenetlen varratfelület ,7% 00,0%. ábra: Az adatok táblázatba rendezése 5

26 3. ábra: Oszlopdagram 4. ábra: Kördagram 5. ábra: Sávdagram 6

27 Adatok ábrázolása pktogram segítségével: 6. ábra: Vonaldagram Az összes szőlőtermelés felhasználása 7. ábra 7

28 3.4. TAPASZTALATI ELOSZLÁSOK A nagy számú statsztka adat átteknthetőségét lehetővé tesz, feldolgozását egyszerűsít, ha az értékeket nagyság szernt osztályokba soroljuk. A mérés sorozat legksebb és legnagyobb értéke között ntervallumot k számú osztályra bontjuk. Ha összesen n adatunk van, f pedg az -edk osztályba eső elemek számát jelent, akkor n knduló adat f + f +..+ f k n részsokaságok összegeként értelmezhető. Általános lépése a következők: osztálybasorolás (folytonos adatok és nagyszámú dszkrét megfgyelés esetén), a gyakorságok (f ) megállapítása. Gyakorság a sokaságban levő azonos tulajdonságú (azonos osztályba tartozó) elemek száma, a relatív gyakorságok (g ) megállapítása: g f n az összegzett (kumulált) gyakorságok (f ), lletve összegzett relatív gyakorságok (g ) megállapítása, gyakorság táblázat készítése (f, g, f, g adataból), a gyakorság (relatív gyakorság), lletve összegzett gyakorság (relatív gyakorság) hsztogramok (folytonos adatok esetén a polgon és az ogva) felvétele (tapasztalat eloszlások elkészítése). Grafkus ábrázolás Feladat: Egy folyamatos üzemben 4 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alább értékek adódtak óránként megoszlásban: Óra Leállások száma Óra Leállások száma. Táblázat A példa adata a következő gyakorság táblázatba és hsztogramba rendezhetők: Ahhoz, hogy az előbb táblázatunkat átteknthetőbb formába öntsük, célszerű az adatankat a dszkrét valószínűség változó által felvehető értékek szernt csoportosítan: 8

29 leállások száma óránként az előfordulások gyakorsága (f ) relatív gyakorság (g ) 0 3 0,5 5 0,08 5 0, , ,5 5 0, ,083 összesen 4,000. Táblázat Ha vszonylag kevés adatunk van, akkor célszerű az alapján elkészíten az osztályba sorolást, hogy e dszkrét valószínűség változó mlyen értékeket vehet fel. 8. ábra: Gyakorságok ábrázolása dszkrét adatok esetén Dszkrét adatok esetén a gyakorságok az y tengely csak egy meghatározott pontjához tartoznak, és nem egy értéksávhoz, ezért dszkrét eloszlások esetében a gyakorságot általában függőleges vonalakkal jelölk. A kumulált (összegzett) gyakorság táblázat és hsztogram: leállások száma kumulált gyakorság (f ) kumulált relatív gyakorság (g ) 0 3 0,5 8 0, , , , ,97 6 4, Táblázat A kumulatív gyakorságok grafkus ábrázolással nyert képét tapasztalat eloszlásfüggvénynek szokták nevezn. 9

30 9. ábra: Kumulált relatív gyakorságok ábrázolása dszkrét adatok esetén 30

31 Feladat: Mnt később tanulmányank (Vállalat pénzügyek) során látn fogjuk, gazdaság elemzésenknél gyakran szükség van a részvényektől elvárt hozam becslésére. (A részvények elvárt hozama dőben vszonylag stabl, így a jövőre vonatkozó becslésenket múltbel adatankra alapozhatjuk). A Budapest Értéktőzsde Részvényndexét (BUX) - az deglenes ndex ném változtatásával és 99- g vsszafelé s meghatározva január - hatállyal vezették be. Az ndex bázsa az 99. január -án számított 000 pont. Egy 5 éves dőszak hav hozamanak értéket az alább táblázatban foglaltuk össze. dátum BUX[%] dátum BUX[%] február. -7,54 november.,03 márcus. -0,7 december.,5 áprls 5. -,0 január 6. 3,3 május. -,5 február 3.,44 júnus. -8,4 márcus 3. -,9 júlus. 4,9 áprls. 0,03 augusztus. 3,0 május 5. 3,79 szeptember. -8,45 júnus.,9 október 3. 6,88 júlus. 5,99 november. -5,08 augusztus. -8, december. -4,89 szeptember. 6,34 január 5. -8,98 október. -7,6 február. 4,05 november 3. -6,75 márcus.,6 december. 0,4 áprls 3.,68 január 7. -7, május. 5,44 február.,7 júnus. -4,79 márcus. 4,84 júlus 3.,06 áprls. -, augusztus. 5,6 május 4. -7,48 szeptember.,8 júnus. 0,63 október. -6,05 júlus. 3,45 november. -0,93 augusztus ,06 december.,9 szeptember. -,97 január 4. 35,6 október. 6,9 február. 7,8 november.,53 márcus. 9,75 december. 5,5 áprls. 7,67 január 7. 3,6 május.,06 február. -3,63 júnus 3.,39 márcus. -,37 júlus. -,85 áprls. 9,0 augusztus.,6 május 3. 4,58 szeptember 3. 8,57 júnus. 4,59 október. 6,46 4. Táblázat Dolgozzuk fel a hav hozam adatokat leíró statsztka eszközökkel! 3

32 Folytonos adatokból készítendő gyakorság eloszlásoknál (és egyébként nagyszámú dszkrét adat esetén s) szükséges a rendelkezésre álló adatok osztályközökbe történő sorolása. Osztályba sorolásnak nevezzük az adathalmaz valamenny értékét magába foglaló teljes értékköz felosztását azonos nagyságú rész-értékközökre, és az adatoknak ezen belül csoportosítását. Az osztályköz középső értékét osztályköznek nevezzük, mvel az osztályba sorolás eredményeként az adatok elvesztk egyed értékeket, és az azonos osztályba sorolt adatokra az azonos osztályközép lesz a jellemző. Az osztályközt határoló két érték az alsó és a felső osztályhatár. Az osztályozás krtéruma: Teljes Átfedésmentes Homogén csoportokat eredményezzen Az Y szernt képzett osztály alsó felső határa Osztályközép abszolút relatív gyakorság Y 0 Y Y f g Y 0 Y Y f g Y 0 Y Y Y 0 + ( Y Y ) f g g f N Y k0 Y k Y k f k g k Összesen N 0. ábra: Gyakorság sor Ahol: Y (adatankat jellemző) mennység smérv, Adathalmazunkból k db osztályt képzünk, A 0-s ndex az osztály alsó határát, az -es ndex pedg az osztályköz felső határát jelent, Y az osztályközép, f az abszolút vagy tapasztalat gyakorság, g pedg a relatív gyakorság. Akár egy, akár több smérv szernt csoportosítjuk az adatankat, mndg kardnáls kérdés az osztályok számának a megválasztása. Ez alapos megfontolást gényel, és a vzsgált sokaság nagyságától nem függetleníthető. Mérlegelendő szempontok az osztályozásnál: M a célunk az osztályozással? A teljes értékközt hány rész-értékközre bontsuk fel, vagys hány osztályt alakítsunk k? Az osztályhatárok megállapításánál, kalakításánál mlyen szempontokat célszerű fgyelembe venn? A fent példánk alapján a gyakorság táblázat: osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0, ,3 0,77-0,0 x < 0, ,5 36,9 0,0 x < 0, ,38 7,30 0,0 x < 0, ,00 9,30 0,0 x < 30, ,6 96,9 30,0 x < 40, ,08 00,00 összesen 65 00,00 5. Táblázat 3

33 A gyakorság hsztogram: Az egyes értékközök felé emelt téglalapok területe arányos az egyes osztályokhoz tartozó tapasztalat gyakorságokkal. A pros vonallal jelölt függvényt sűrűségfüggvénynek nevezzük. A kumulált relatív gyakorság hsztogram: n 65 x s * 3, 9 %,05 %. ábra: Sűrűségfüggvény. ábra: Eloszlásfüggvény A kumulált gyakorságok grafkus ábrázolással nyert képét tapasztalat eloszlásfüggvénynek s szokás nevezn, ez megmutatja, hogy mlyen valószínűséggel fordul elő egy adott értéknél ksebb érték. A folytonos adatok eloszlásfüggvényét folytonos vonallal s összeköthetjük, és az így kapott görbét ogvának nevezzük. Ez azt mutatja meg, hogy megközelítően mlyen lenne a tapasztalat eloszlásfüggvény, ha az osztályközöket mnden határon túl csökkentenénk, az osztályközökbe eső adatok számát pedg mnden határon túl növelnénk. Az ogvát felhasználhatjuk egy adott értéknél ksebb értékek számának vagy relatív gyakorságának meghatározására. Fordítva s eljárhatunk, vagys megállapíthatjuk azt az értéket, amelyk alá adott relatív gyakorsággal esnek az adatok. Az lyen értékeket kvantlseknek nevezzük. 33

34 3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI A középérték-mutatókat gyakran helyzetmutatóknak s nevezk. A középérték-mutatók a gyakorság eloszlás helyzetét egyetlen, az adatokkal azonos mértékegységű számértékkel jellemzk. E középértékekkel kapcsolatos elvárásank, hogy legyenek: Közepes helyzetűek Tpkusak Egyértelműen meghatározhatóak Könnyen értelmezhetőek A középértémutatóknak két nagy csoportja smeretes: Helyzet középértékek: az adatok között elhelyezkedésüknél fogva jellemzk a vzsgált gyakorság eloszlás helyzetét. Számított középértékek: az adatokkal kapcsolatos számszerű összefüggésük révén jellemzk vzsgált gyakorság eloszlás helyzetét. Az alábbakban bemutatásra kerülő középérték mutatók a medán, a módusz, a számtan átlag, a harmonkus átlag, a mértan átlag és a négyzetes átlag. Medán (Me): Jellemző: helyzet középérték, közepes helyzetű. A medán a változó azon számértéke, amelynél az összes előforduló számérték fele ksebb, fele pedg nagyobb, tehát a rangsorba állított sokaság számértékeket két egyenlő gyakorságú osztályra bontja. Rövden: a nagyságrend szernt rendezett adatok középső értéke (páros számú adat esetén a két középső érték átlaga). Példa: 6, 8, 4, 9, 7, 3, 5, 3, 4, 5, 6, 7, 8, 9 Me6 4, 9, 7, 8,, 5, 4, 5, 7, 8, 9, Me7,5 7, 9, 3, 0, 5,, 5,, 3, 5, 5, 7, 9, 0 Me5 Ha a BUX ndex korább, 65 hav hozamadatat vesszük alapul, akkor e 65 adatot sorba állítva, a rangsor 33. tagja lesz a medán, hszen ennél 3 ksebb, és 3 nagyobb érték lesz a rangsorban, ez pedg 3,79. Felmerül a kérdés: hogyan határozható meg a medán akkor, amkor nem smerjük egyenként az adatokat, hanem csak osztályközös gyakorság sor áll rendelkezésünkre? Ilyen esetekben a medán legegyszerűben a következő formulával becsülhető: Meˆ Y me,0 + N f f me ' me h me ahol me annak a legelső osztályköznek a sorszáma, amelyre gaz, hogy ' f me N és Y me,0 az me sorszámú osztályköz alsó határa, és a h me pedg ennek az osztálynak az osztályközhosszúsága, am egyszerűen a felső és alsó osztályhatár értékének a különbsége. 34

35 Példa: Vegyük a korább BUX-ndexes példánkat, és tegyük fel, hogy csak a gyakorság táblázat áll rendelkezésünkre, és nem smerjük egyenként az összes hozamadatot. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0, ,3 0,77-0,0 x < 0, ,5 36,9 0,0 x < 0, ,38 7,30 0,0 x < 0, ,00 9,30 0,0 x < 30, ,6 96,9 30,0 x < 40, ,08 00,00 összesen 65 00,00 ' N f me N/3,5 a medánt tartalmazó osztály az ötödk osztály: 0,0 x < 0. M eˆ Y me N ' fme 3,5 4, 0 + hme 0,0+ (0,00 0,0) 3,7 f 3 me Ha összehasonlítjuk a korább eredményünkkel, láthatjuk, hogy a medán jól becsülhető osztályközös gyakorság sorból s. A medán előnye, hogy mndg egyértelműen meghatározható, és mvel valód középérték, így érzéketlen az adathalmazunkban szereplő szélsőértékekre, amely szélsőségesen nagy vagy kcs értékeket általában a véletlen szeszélye alakítják, és nem függ a több smérvértéktől sem. Ha az adathalmazunkban sok az egyforma smérvérték, akkor sem tanácsos használn. Módusz (Mo): A módusz - a medánhoz hasonlóan - helyzet középérték. A módusz nem mndg határozható meg egyértelműen, és nem s mndg létezk. Dszkrét változó esetén a változó leggyakrabban előforduló értéke. A 4 óra alatt gépleállásokhoz tartozó gyakorság táblázatot alapul véve látható, hogy a 4 órás megfgyelés alatt egyaránt 5-5 alkalommal fordult elő, hogy vagy leállás volt az adott órában. Ebben az esetben a módusz nem határozható meg egyértelműen. leállások száma óránként az előfordulások gyakorsága összesen 4 35

36 Folytonos smérv esetén a módusz a gyakorság görbe maxmum helye. Folytonos változó esetén a medánhoz hasonló módon osztályközös gyakorság sorból becsülhető. Moˆ Ymo, 0 da + d + d a f h mo Ebben a képletben mo a móduszt tartalmazó osztályköz sorszáma és da fmo f d mo f fmo fmo+ A móduszt mndg az az osztályköz tartalmazza, amelykhez a hsztogram legmagasabb oszlopa tartozk. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0, ,3 0,77-0,0 x < 0, ,5 36,9 0,0 x < 0, ,38 7,30 0,0 x < 0, ,00 9,30 0,0 x < 30, ,6 96,9 30,0 x < 40, ,08 00,00 összesen 65 00,00 Ebben a példánkban a móduszt a legnagyobb gyakorságú osztály tartalmazza, ez pontosan ugyanaz az osztály, ahol a medán s volt. M da (3 7), + h 0,0 + (0,00 0,0) 3,76 d + d (3 7) + (3 3) oˆ Ymo 0 mo a f Megjegyzés: néha a módusz becslésének egyszerűen a móduszt tartalmazó osztályköz osztályközepét tekntk (példánkban ez 5,00 lenne), ezt nyers módusznak hívják. Bárhogyan s határozzuk meg a móduszt, az arra kapott közelítő érték esetleges, mert függ az osztályközök számától és hosszától. A módusz előnye, hogy a medánhoz hasonlóan nem függ sem az összes, sem a kugró smérvértékektől. A módusz hátránya, hogy nem mndg egyértelműen meghatározható, és nem s mndg létezk. Számtan átlag ( x ): A leggyakrabban használt középértékmutató: az átlag, számított középérték. Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: x n n x r r f f x r g x 36

37 ahol: x az -k tag számértéke f az -k tag gyakorsága g az -k tag relatív gyakorsága r osztályok száma Dszkrét adatok esetén a számtan átlag kszámítható oly módon s, hogy az osztályba sorolás után mndegyk értéket szorozzuk a hozzá tartozó gyakorsággal, az eredményeket összegezzük, majd osztjuk a gyakorságok összegével. Folytonos adatok esetén a gyakorságokat az osztályközepekkel szorozzuk. Az így számított számtan átlag ks mértékben eltérhet a nem csoportosított adatokból számolt átlagtól. A gyakorság felhasználásával számolt számtan átlagot súlyozott számtan átlagnak s nevezk. Dszkrét példa: x leállások száma óránként az előfordulások gyakorsága összesen f x f Folytonos példa: Vegyük smét a korább BUX-ndexes példánkat! Ha a rendelkezésre álló 65 egyed adatunkból számítjuk k a számtan átlagot: x 65 x 65 7,54 + ( 0,7) + (,0) ,0 + 4,58 + 4,59 07, Ha az osztályközös gyakorság táblázatunkat vesszük alapul:,54 osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0, ,3 0,77-0,0 x < 0, ,5 36,9 0,0 x < 0, ,38 7,30 0,0 x < 0, ,00 9,30 0,0 x < 30, ,6 96,9 30,0 x < 40, ,08 00,00 összesen 65 00,00 3,9 %-ot kapunk. 37

38 x 8 8 ( 35,00) + 0 ( 5,00) + 6 ( 5,00) + 7 ( 5,00) , , , ,00 3,77 65 x 8 f x f g x 0,054 ( 35,00) + 0 ( 5,00) + 0,093 ( 5,00) + 0,65 ( 5,00) + 0,3538 5, ,0 5,00 + 0,046 5,00 + 0, ,00 3,77 Ebben az esetben a két eredmény (3,9 és 3,77) között eltérés összefüggésben van a sokaság számosságával, az osztályközök hosszával, és az osztályközepek megválasztásával. A számtan átlag előnye, hogy bármely alapadathalmazból egyértelműen meghatározható, mnden alapadatot felhasznál. A hátránya a módusszal és medánnal szemben-, hogy érzékeny a szélsőértékekre. Bzonyos esetekben az adatok között kugróan magas és alacsony értékek vannak, amelyek jelentősen befolyásolják az átlagot. Ezt úgy küszöbölk k, hogy az adathalmaz egy meghatározott %-át elhagyják az átlag számításánál: pl. elhagynak 5%-ot az alsó értékek és 5%-ot a felső értékek közül, így az adatok 90%-ának az átlagát számítják. Egyéb átlagfajták: Adathalmazunkból az eddg említett móduszon, medánon és számtan átlagon kívül egyéb átlagok s számíthatóak. Harmonkus átlag ( x h ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve ezek recprokanak összege változatlan marad. Számítása: x n x r h n r Alkalmazása: Leggyakrabban akkor használjuk, ha az értékek recprokanak összege értelmezhető. Ilyen esetekkel elsősorban a leíró statsztka vszonyszámok és ndexek számításánál találkozunk. Mértan átlag ( x g ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. Számítása: f f x x g n π x f πx f ahol:π (produktum) az összeszorzás jele. Egy n tagú sokaság x, x,, x n megfgyelt értékenek mértan átlagát úgy számítjuk k, hogy az értékeket összeszorozzuk, és a szorzatból annyadk gyököt vonunk, ahány értéket összeszoroztunk. Megjegyzés: ha az értékek között 0 s szerepel, akkor a mértan átlagot nem használhatjuk. 38

39 Alkalmazása: A mértan átlagot akkor használjuk, ha az értékek szorzata értelmezhető, lletve az átlagolandó értékek exponencálsan nőnek vagy csökkennek. Leggyakrabban az dőbel fejlődés átlagos ütemének vzsgálatakor használjuk. Idősorok elemzése során (pl. termelés évenként alakulása, tőzsdendex hav változása, stb.) általában az dőszakról dőszakra bekövetkezett növekedést, vagy csökkenést vzsgáljuk. Négyzetes átlag ( x q ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad. Számítása: x q n x Egy n tagú sokaság x, x,, x n értékeből a négyzetes átlagot úgy számítjuk k, hogy az átlagolandó értékek négyzetenek számtan átlagát vesszük és ebből négyzetgyököt vonunk. Természeténél fogva a négyzetes átlag a kugróan magas értékekre reagál érzékenyen. Alkalmazása: A négyzetes átlag alkalmazására legnkább akkor kerül sor, amkor az értékek között poztív és negatív értékek egyaránt előfordulnak, de az előjeleknek a vzsgálat szempontjából nncs jelentőségük, az értékek abszolút nagyságát kívánjuk a középértékekkel jellemezn. Tpkus alkalmazás területe a szórásszámítás. Választás a középértékek között Bebzonyítható, hogy ugyanazon poztív x értékekből számított különböző fajta átlagok között a következő nagyságrend relácó áll fenn: x x x x x mn h g q x max A harmonkus és a mértan átlag a nagyon alacsony, a négyzetes átlag a magas értékekre mutat fokozott érzékenységet. Az átlagolandó értékek jellege, és az átlag számításához rendelkezésre álló nformácó együttesen határozza meg, hogy mlyen esetben melyk átlagfajtát célszerű használn. A választás során érdemes mérlegeln a következőket: Egyértelműen meghatározható-e? Az összes rendelkezésre álló adattól függ-e vagy sem? Mennyre érzékeny a szélsőségesen nagy vagy kcs értékekre? Mekkora és mlyen módon értelmezhető hbával képes helyettesíten az alapadatokat? 39

40 Mo Me x 3. ábra: Középértékek összehasonlítása x Me Mo Kvantlsek Eddg egyenlő osztályköz-hosszúságú gyakorság sorokat képeztünk, az lyen osztályközök relatív gyakorsága eltértek egymástól. Lehetőség van olyan osztályhatárok keresésére, amelyek egyenlő relatív gyakorságokat fognak közre. Az lyen osztályközök általában nem egyenlő hosszúságúak. Ezen osztályhatárok megállapításához használjuk a kvantlseket. A kvantlsek azok az értékek, amelyek különböző adott arányokban bontják fel az adathalmazt. A p- edrendű kvantls az eloszlást p, -p arányban osztja ketté. Meghatározásuk úgy történk, hogy adatankat nagyság szernt növekvő sorrendbe rendezzük (rangsort készítünk), majd az értékeket k számú egyenlő gyakorságú csoportra osztjuk és az egyes csoportok felső határán lévő smérvértékeket vesszük. Ezek lesznek a kvantls értékek. A különböző számú csoportba rendezéshez a kvantlsek konkrét elnevezése tartoznak. Ha az adatokat két részre osztjuk, akkor a medánt (Me) kapjuk. Négy részre való osztásnál kvartlseket (Q,,,3) ad, öt rész esetén kvntlseket (K,,, 3, 4), tíz rész esetén declseket (D,,,,9) száz részre való osztásnál percentlseket (P,,,3,,99) nyerünk. Ha például az egyetemre jelentkezők pontszámát értékelve pont a hatodk decls érték, ez azt jelent, hogy a jelentkezők hatvan százaléka pontnál kevesebbel, 40%-a pedg többel rendelkezk. k Elnevezés Általános jelölés lehetséges értéke Lehetséges kvantlsek Medán - Me 4 Kvartls Q,,3 Q, Q, Q 3 5 Kvntls K,,3,4, K, K, K 3, K 4 0 Decls D,,,9 D, D, D 9 00 Percentls P,,,99 P, P,,P Táblázat: A leggyakrabban használt kvantlsek Számítása: Rangsorba rendezett adatank /k-k tagja. / ( N + ) k s k 40

41 Értéke: X X / k [ s ] + { s / k} ( X [ s ] + X [ s ]) / k / k / k A BUX-ndexes példánk alapján számítsuk k a következő kvantlseket! Alsó kvartls: s / 4 ( + 65) 6,5 4 Tehát az alsó kvartlsünk a rangsorba rendezett 65 db hav hozamadat 6,5-k tagja. Számítása: Q X [ s ] + { s }( [ ] [ ]) 5,08 0,5( 4,89 ( 5,08)) 4, 985 / 4 / 4 X s/ 4 + X s + / 4 Értelmezése: a rangsorba rendezett adatok /4-e ksebb, mnt -4,985, és 3/4-e pedg nagyobb. Felső kvartls: 3 s 3 / 4 ( + 65) 49,5 4 Tehát a felső kvartlsünk a rangsorba rendezett 65 db hav hozamadat 49,5-k tagja. Q 3 X [ s ] + { s }( [ ] [ ]) 0,63 0,5(,06 0,63) 0, 845 3/ 4 3 / 4 X s3/ 4 + X s + 3/ 4 Értelmezése: a rangsorba rendezett adatok 3/4-e ksebb, mnt 0,845, és /4-e pedg nagyobb. Alsó decls s /0 ( + 65) 6,6 0 D X [ s ] + { s }( [ ] [ ]),85 0,(,0 (,85)), 667 /0 /0 X s/0 + X s + /0 Értelmezése: a rangsorba rendezett adatok /0-e ksebb, mnt -,667, és 9/0-e pedg nagyobb. Felső decls: 9 s 9 /0 ( + 65) 59,4 0 D 9 X [ s ] + { s }( [ ] [ ]) 6,88 0,(8,57 6,88) 7, /0 9 /0 X s9 /0 + X s + 9 /0 Értelmezése: a rangsorba rendezett adatok 9/0-e ksebb, mnt 7,049, és /0-e pedg nagyobb. 4

42 3.6. AZ INGADOZÁS MÉRŐSZÁMAI A fentekben megsmert középérték-mutatók alkalmasak arra, hogy a megfgyelt adathalmazunkat tömören, egy számmal jellemezzék, és kfejezzék az adathalmaz közös, tpkus, általános vonásat. Azonban adathalmazunkat nemcsak a közös vonások jellemzk, hanem arra s kíváncsak vagyunk, hogy ezek az adatok mlyen mértékű változékonyságot mutatnak, hszen természetszerűleg eltérnek a középértéktől, és különböznek egymástól s. Az értékek különbözőségét, változékonyságát szóródásnak nevezzük. A most bemutatásra kerülő legfontosabb ngadozásmutatók: a terjedelem, az nterkvantls terjedelem, az átlagos abszolút különbség, az átlagos abszolút eltérés, a tapasztalat szórás, a korrgált tapasztalat szórás és a relatív szórás. A rendelkezésre álló adathalmazunkban szereplő értékek változékonysága, szóródása kétféleképpen s megragadható: az egyes értékek egymás között különbségen, vagy pedg az egyes értékeknek egy ktüntetett értéktől (középérték) való eltérésen keresztül. A másk csoportosítás lehetőség: léteznek abszolút és relatív ngadozásmutatók. Az abszolút szóródás mutatók mértékegysége ugyanaz, mnt az alapadatoké. A relatív szóródás mutatók elvonatkoztatnak az eredet mértékegységtől, és különböző smérvértékek szóródásának az összehasonlítását szolgálják. Terjedelem (R): Az adathalmazban szereplő legnagyobb és legksebb adat különbsége. Számítása: R x max x mn Előnye: könnyű számítás; Hátránya: csak a két legszélsőségesebb smérvértéktől függ. A hátránya matt gyakran használják az nterkvantls terjedelemmutatót, mvel a két szélső k-adrendű kvantls jelentősen csökkent a véletlennek a szélsőértékeket alakító szerepét. Pl. Az nterkvartls terjedelemmutató a felső és alsó kvartls különbségeként adódk: R / Q3 Q Vegyük smét a korább BUX-ndexes példánkat, és számítsuk k a terjedelmet: Az nterkvartls terjedelem: R 35,6 ( 36,06) 7,3 R / 0,845 ( 4,985) 5,83 Átlagos abszolút különbség (G): Ez a szóródás mutató a mnden lehetséges módon párba állított értékek különbségenek abszolút értékéből számított számtan átlag. Ez a G ngadozásmutató azt mutatja meg, hogy az Y smérv értéke átlagosan mennyre különböznek egymástól. Mértékegysége ugyanaz, mnt az alapadatoké. ahol N az adatok számát jelent. G N ( N ) N N j X X j 4

43 Specáls felhasználás területe a koncentrácóelemzés, hátránya, hogy számítása meglehetősen kényelmetlen. Mvel a BUX-ndexes példában meglehetősen kényelmetlen számítan, így egy egyszerűbb példán keresztül mutatjuk be: Véletlenszerűen kválasztunk 5 MBA hallgatót, és kszámítjuk a Kvanttatív módszerek tárgy vzsgáján elért eredményük átlagos abszolút különbségét. Az elért pontok: 45, 5, 76, 87, Táblázat 56 G 5,8, azaz az 5 MBA hallgató Kvanttatív módszerek tárgy vzsgán elért pontja 5(5 ) átlagosan 5,8 ponttal tér el egymástól. Átlagos abszolút eltérés ( ): Az átlagos abszolút eltérés az ngadozásmutatók azon csoportjába tartozk, amelyek a szóródást az értékeknek egy ktüntetett értéktől való eltérésere támaszkodva jellemzk. Tulajdonképpen az egyes értékek és a számtan átlag különbségenek abszolút értékeből számított számtan átlag. Számítása: n n d r r f f d ahol: d x x A képlet másodk részéből látható, hogy ez a mutató s becsülhető osztályközös gyakorság sorból a tapasztalat gyakorságok felhasználásával. Ebben az esetben a d eltérések számításánál az osztályközepeket kell alapul vennünk. A BUX-ndexes példánk átlagos abszolút eltérése: n 7,54 3,9 + 0,7 3, ,59 3,9 n d 8,93 Azaz az egyes hozamadatok átlagosan 8,93%-kal térnek el a számtan átlagtól. Hátránya: az abszolút érték matematkalag nehezen kezelhető. 43

44 Tapasztalat szórás (s), korrgált tapasztalat szórás (s * ): Ahogy a számtan átlag az átlag, úgy a tapasztalat és a korrgált tapasztalat szórás a szórás. A szórás az adathalmazunk változékonyságának legfontosabb mérőszáma. Nagyon hasonlít az előbb mutatóhoz, és jelentése s hasonló: annyban tér el, hogy a d eltérések előjelét nem abszolút érték képzésével, hanem négyzetre emeléssel oldja meg, majd a négyzetreemelést gyökvonással tesz jóvá. A szórás az átlagtól vett d eltérések négyzetes átlaga. Ennek megfelelően azt mutatja, hogy az értékek mennyre térnek el a számtan átlagtól. Számítása: ( x x) n n r d f d s n n r f s * n ( x x) n Sok esetben nem s a szórás, hanem annak a négyzete (varanca) bír jelentőséggel. Természetesen a szórás az összes eddg mutatóhoz hasonlóan- szntén becsülhető osztályközös gyakorság sorból s. BUX-ndexes példánk szórása az egyed adatokból számolva: s ( x x) n n ( 7,54 3,9) + ( 0,7 3,9) ( 4,58 3,9) + ( 4,59 3,9) 64,05 Osztályközös gyakorság sorból becsülve: osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0, ,3 0,77-0,0 x < 0, ,5 36,9 0,0 x < 0, ,38 7,30 0,0 x < 0, ,00 9,30 0,0 x < 30, ,6 96,9 30,0 x < 40, ,08 00,00 összesen 65 00,00 s 8 f d 8 f ( 35 3,9) ( 5 3,9) (5 3,9) 65 + (35 3,9),35 44

45 Relatív szórás (v): A szórás és a számtan átlag hányadosa. Elsősorban különböző sokaságok vagy smérvek szóródásának összehasonlítására használják. A relatív szórás úgy s értelmezhető, mnt az értékek átlagtól vett átlagos eltérése, ezért mnél ksebb a relatív szórás, a számtan átlag annál jobban jellemz az alapadatokat. Számítása: v s 00 % x [ ] 3.7. AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK A gyakorság eloszlások alakmutató annak tömör és számszerű jellemzésére szolgálnak, hogy azok mlyen tekntetben és mlyen mértékben térnek el az ebből a szempontból etalonnak tekntett normáls eloszlás jellegzetes gyakorság görbéjétől (a haranggörbétől). Megjegyzés: mvel a normáls eloszlás egy móduszú, így ennek az összehasonlításnak csak szntén egy móduszú gyakorság eloszlások esetén van értelme. Ha egy gyakorság görbének több módusza van, akkor az arra enged következtetn bennünket, hogy az elemzést a sokaság részekre bontásával célszerű folytatn, mert az eddg megsmert mutatószámok nem alkalmasak a vzsgált jelenség tömör, számszerű jellemzésére. Az eltérések fajtá: az etalonnak tekntett normáls eloszlás haranggörbéjéhez képest bal ll. jobb oldal aszmmetra; a gyakorság eloszlás ábrájának csúcsosabb, vagy lapultabb, mnt a normáls eloszlásé. Aszmmetra mutató 4. ábra: Eloszlások alakjának lehetséges eltérése a normál eloszlástól A bal oldal aszmmetrával rendelkező eloszlásokat sok szakkönyv jobbra hosszan elnyúló eloszlásoknak nevez. Az lyen eloszlások grafkus ábrája a módusztól jobbra hosszan elnyúlk. Ennek megfelelően a jobb oldal aszmmetrát mutató eloszlásokat pedg balra hosszan elnyúló eloszlásoknak nevezk. A társadalm-gazdaság jelenségek elemzésekor általában bal oldal aszmmetrával találkozunk. Ennek oka, hogy a 0 érték, vagy a vzsgált társadalm-gazdaság jelenség természetéből adódóan 45

46 valamlyen mnmáls érték kemény alsó korlátot képez, míg felülről nem létezk lyen korlát. Pl. a jövedelmek vagy a vagyon nagyságának eloszlása tpkusan bal oldal aszmmetrát mutat. Többféle aszmmetra mérőszám létezk, m ezek közül most egyet mutatunk be: Pearson-féle mutatószám: 3 ( Y Me) P s A Pearson-féle mutatószám mérsékelten aszmmetrkus eloszlásoknál nem szokott -nél nagyobb lenn. Ez a mutató az átlag és a medán különbségére alapozza az aszmmetra jellemzését. Nézzük a BUX-ndexes példánkat! (egyed adatokból ndulunk k, és nem osztályközös gyakorság sorból) Mérsékelt bal oldal aszmmetra. (4. ábra) 3 ( Y Me) 3 (3,79 3,9) P 0,5 s,05 Csúcsosság mutató A csúcsosság mutatók közül s egy mutatót emelünk k. Ez a bemutatásra kerülő mutató azon a megfgyelésen alapszk, hogy mnél csúcsosabb egy eloszlás, annál ksebb a felső és alsó kvartls különbségének a fele a két szélső decls különbségéhez vszonyítva. Normáls eloszlás esetén ennek értéke 0,63, am a mutató értékeléséhez támpontot ad. Mnél lapultabb a vzsgált gyakorság eloszlás, annál nagyobb K értéket kapunk. A BUX-ndexes példánk csúcsosságának kszámításához felhasználjuk a korábban kszámított kvartlseket és declseket: K Q Q 0,845 ( 4,985) 5,83 ( D D ) (7,049 (,667)) 59, ,66 Esetünkben valamvel laposabb a gyakorság eloszlás, mnt a normáls eloszlásé. Összefoglalás: A gyakorság eloszlások helyzetének, szóródásának és alakjának jellemzésére szolgáló mutatószámok közül gyakorlat szempontból az átlag és a szórás a legfontosabb. Az átlag és a szórás smeretében a valószínűségszámítás egyes eredményere támaszkodva elég jó becslés adható arra, hogy az értékek mlyen ntervallumon belül ngadoznak. Ha az átlag és a szórás mellett még smert néhány alkalmasan megválasztott kvantls, vagy az aszmmetra és a csúcsosság valamlyen mutatószáma s, egészen jól felvázolható a vzsgált gyakorság eloszlás grafkus képe még akkor s, ha sem az alapadatokat, sem a gyakorság sort nem smerjük. A mérsékelt bal vagy jobb oldal aszmmetrát mutató gyakorság sorok esetén a medán többnyre harmadolja a módusz és az átlag között távolságot úgy, hogy az átlaghoz esk közelebb. A Pearson-féle mutatószám valójában az átlag és a módusz különbségére alapozza az aszmmetra jellemzését, de a medán könnyebben becsülhető osztályközös gyakorság sorból, mnt a módusz. 46

47 3.8. ESETTANULMÁNY LEÍRÓ STATISZTIKAI ELEMZÉS Végezzük el a 8. Táblázat alapján 00 MBA hallgató bérének leíró statsztka elemzését! Ssz. BrBér/hó Pozícó Nem Életkor Ssz. BrBér/hó Pozícó Nem Életkor 300 Felső Férf Beoszt. Férf 9 80 Felső Férf 43 5 Beoszt. Férf Közép Nő Közép Nő Közép Férf Beoszt. Férf Beoszt. Nő Felső Férf Beoszt. Férf Közép Férf Beoszt. Nő Közép Férf Beoszt. Nő Közép Férf Beoszt. Nő Közép Férf Beoszt. Nő Közép Férf 40 0 Beoszt. Férf Felső Férf Közép Nő Beoszt. Férf Beoszt. Nő Közép Férf Közép Nő Beoszt. Nő Beoszt. Férf Felső Férf Közép Férf Beoszt. Nő Felső Nő Beoszt. Férf Közép Férf Beoszt. Férf Felső Férf Közép Férf Beoszt. Férf Közép Nő Felső Nő Közép Nő Beoszt. Férf Beoszt. Nő Felső Férf Közép Férf Felső Nő Beoszt. Férf Beoszt. Férf Közép Férf Beoszt. Nő Beoszt. Férf Beoszt. Nő Közép Férf Felső Férf Közép Férf Beoszt. Férf Beoszt. Férf Felső Férf Felső Férf Beoszt. Férf Felső Férf Közép Férf Közép Férf Beoszt. Nő Felső Nő Közép Férf Felső Férf Beoszt. Nő Beoszt. Nő Felső Nő Beoszt. Nő Beoszt. Nő Beoszt. Nő Közép Férf Felső Férf Beoszt. Nő Közép Férf Közép Nő Beoszt. Férf Közép Nő Beoszt. Férf Közép Férf Felső Férf Közép Nő Közép Férf Felső Férf Beoszt. Nő Beoszt. Nő Közép Nő Beoszt. Nő Felső Férf Közép Nő Közép Nő Beoszt. Nő Közép Férf Beoszt. Nő Beoszt. Férf Felső Férf Beoszt. Nő 8. Táblázat 9 47

48 A leíró statsztka elemzés menete:. Osztályok számának meghatározása. (egy lehetséges módszer) k0 Y h 0 > N max Y k 0 mn h > , Gyakorság táblázat osztályhatárok f g f g , 0, , , , 77 0, , , , , , , ,0 00,00 Összesen: 00,00 9. Táblázat Egy kcst gyakorlatasabb osztályba sorolással: Legyen h 0 0 k 0 0 osztályhatárok f g f g ,5 5 0, ,3 38 0, , 60 0, ,6 76 0, , , , , , , , , ,0 99 0, ,0 00,00 Összesen: 00,00 0. Táblázat 3. Medán s/ (00 + ) 50,5 Me ,5( ) 350 Medán becslése a gyakorság táblázat (. osztályba sorolást alkalmazva) alapján 48

49 Meˆ Y me,0 N f + f me ' me h me! N fme Meˆ Kvartlsek meghatározása s/ 4 (00 + ) 5,5 4 Q 5 + 0,5 (30 5) 6,5 3 s3 / 4 (00 + ) 75,75 4 Q ,75 ( ) Módusz mo Moˆ Y d d a f f f mo,0 mo mo + d f mo f a mo+ da + d f h mo 3 5 Moˆ (3 5) + (3 ) 6. Számtan átlag S3989 (ezt megadjuk, de meg kell becsüln gyakorság táblázat alapján) S Y N ,89 49

50 Becslés gyakorság táblázatból: Osztályhatárok Osztályközép f f Y Összesen: Táblázat 7. Grafkus ábrázolás, hsztogram 7 osztályba sorolva: Y ΣfY Σf ,8 00 Hsztogram Gyakorság Tovább 0 osztályba sorolva: 5. ábra Hsztogram 5 0 Gyakorság ábra Tovább 50

51 8. Terjedelem R Ymax Ymn Interkvartls terjedelemmutató R 0,5 Q3 Q 500 6,5 73,75 9. Átlagos abszolút eltérés: d 7964,8 δ Y Y d N N 7964,8 79, Tapasztalat szórás s s N ( Y Y ) N N ( Y ( Y ,8 Y ) N Y ) N Becslés a gyakorság táblázat segítségével: , ,8 99 9,8 30,93 Osztályhatárok Osztályközép f f Y d d f *d ,8 7449, ,8 6503, , ,8 787,84 633, , 37, , , 7955, , , 76839, , 4993, , , 4707, , , 36869, , , 54375, ,8 Összesen: Táblázat 0 sˆ f d , 5

52 . Relatív szórás V Y s 9,8 0,586 39,9 A relatív szórás önmagában nem árul el sok mndent. Ha egy másk évfolyam 00 főből álló mntájának relatív szórásával össze tudnánk hasonlítan, akkor a két relatív szórás közül a ksebbk esetén a számtan átlag jobban reprezentálja az alapadatokat.. Aszmmetra 3( Y P Me) 3(39,8 350) 0,5587 s 9,8 Mérsékelt bal oldal aszmmetra (jobbra elnyúló eloszlás). 3. Lapultság, csúcsosság s/0 (00 + ) 0, 0 D 0 + 0,(0 0) s D 9 /0 9 9 (00 + ) 90, ,9( ) 784 Q3 Q 500 6,5 K 0,034 ( D D ) (784 ) 9 Mvel 0,034<0.63, csúcsosabb, mnt a normál eloszlás. 5

53 3.9. VISZONYSZÁMOK A vszonyszámok, mnt a gazdaság elemzések gyakran használt leíró statsztka mutató, két statsztka adat hányadosaként értelmezhetők: V ahol B a vszonyítás alap (bázs), A pedg a vszonyítás tárgyának adata. V alapvető fajtá: a megoszlás-, a dnamkus- és az ntenzítás vszonyszámok. A megoszlás vszonyszám valamlyen résznek az egészhez vszonyított arányát mutatja (pl. relatív gyakorság). Ezek a vszonyszámok a sokaság, lletve az általa képvselt jelenség struktúráját jellemzk. A dnamkus vszonyszám az dőbel változás mutatója, hszen két különböző dőszak, vagy dőpont azonos fajta adatanak egymáshoz vszonyított aránya. Az alapot képező dőszak a bázsdőszak, az összehasonlítás dőszaka pedg a tárgy, vagy beszámolás dőszak. Dnamkus vszonyszámokat az dőrend szernt felsorolt adatokból (dősorokból) a bázs állandóságától, vagy változásától függően számolhatunk. Így megkülönböztetünk bázsvszonyszámokat és láncvszonyszámokat. A bázsvszonyszámok állandó bázsú dnamkus vszonyszámok. Az állandó bázs legtöbbször az dősor első adata, de más dőszakot s választhatunk bázsként. A láncvszonyszámok az dősor adatanak a közvetenül megelőző dőszakhoz való arányát mutatják. A láncvszonyszámok és a bázsvszonyszámok egymásból kszámíthatók. Ha az dősor adatat y -vel (0,,, n), a láncvszonyszámokat l -vel, a bázsvszonyszámokat b -vel jelöljük, akkor: l y b y o ha y 0 a bázs, így b 0. Nylvánvaló, hogy a láncvszonyszámok szorzataként bázsvszonyszámot kapunk: A B y y ugyans: k l... lk l bk l Π y y 0 y y y... y k k y y k 0 b k Az ntenzítás vszonyszám két különböző fajta, de egymással összefüggő adat hányadosa (pl. egy dolgozóra jutó bérhányad, népességstatsztka arányszámok, stb). 53

54 Feladat: Az alább táblázatban a BUX között éves jellemzőt, lletve változásat foglaltuk össze. Határozza meg az átlagos abszolút- és relatív változás értékét. Adjon becslést a hozam rövd (pl. év) és hosszú távú várható alakulására. év BUX (Ft) változás az előző évhez képest (Ft) változás az előző év %-ban BUX hozam %/év (Ft) nduló 000, ,3-96,7 80,3-9,7 9 88,8 +5,5 03, +3, 93 9,4 +400,6 48,3 +48, , +5,7 0,5 +0, ,9 +76,8 05, +5, 96 49,3 +733,4 75,5 +75, , ,6 94,5 +94, ,0-574,9 8, -8,9 x - 7,6 38,6 38,6 Átlagos abszolút változás: 3. Táblázat x 7,6 8 Ha mnden évben 7,6 ponttal nőtt volna, akkor s 5773 pont lett volna a növekedés 8 év alatt. Átlagos relatív változás: Az évenként relatív változások (láncvszonyszámok) sorozatszerűen függnek össze. Szorzatuk egyenlő az dősor egészében tapasztalt relatív fejlődéssel (az utolsó bázsvszonyszámmal, vagys az utolsó és első adat hányadosával). x g 8 0,8033, ,83 8 6,77,7 x g ,77,7 A BUX évente átlagosan 7 %-al változott (növekedett). Ha a növekedés mnden évben 7 % lett volna, akkor s 677 % lett volna a növekedés 8 év alatt. Mndez azt s jelent, hogy az átlagos abszolút és relatív változás független attól, hogy az első és utolsó év között az dősor hogyan alakul. Ezért az alkalmazott átlagok csak akkor lehetnek jellemzőek, ha az dősor alapvető tendencája egyenletes (növekedés vagy csökkenés). 54

55 Számításankat általánosságban (a vszonyszámoknál használt jelölésekkel) a következők szernt rhatjuk fel: n l n l n bn n Π y y n 0 Becslés a hozam várható alakulására: Az éves hozamok számtan átlaga: x 38,6% Ez az átlag csak egy rövd távú (pl. éves) várható hozam változás előrejelzéséhez adhat támpontot. Hosszabb távon a mértan átlag ad reálsabb becslést, hszen fgyelembe vesz a "kamatos kamat" jelleget (láncvszonyszámok) s: x g 7% 55

56 4. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I. Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 56

57 4.. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK A társadalm, a műszak és a gazdaság jelenségek törvényszerűséget nemcsak önmagunkban, hanem a jelenségekkel szoros kapcsolatban lévő más tényezők összefüggésében s vzsgálhatjuk. Az eddg fejezetekben a véletlen tömegjelenségek leírását mndg egy már bekövetkezett állapot valószínűségelmélet, matematka-statsztka vzsgálatával végeztük el. A korrelácó- és regresszó- számítás során arra keressük a választ, hogy egy adott állapot mlyen tényezők hatására jött létre, az egyes tényezők mlyen mértékben befolyásolják a jelenség alakulását, a tényezők mlyen szoros kapcsolatban vannak egymással. A változók között összefüggés szorosságát, a sztochasztkus kapcsolat erősségét, ntenztását korrelácószámítással, míg az összefüggés jellegét regresszó-számítással határozzuk meg. Utóbb esetben az összefüggésekben lévő sztochasztkus tendencát, a kapcsolat természetét valamlyen függvénnyel írjuk le. Ha a vzsgálatok során az dő a független változó, a számításokat trendszámításnak nevezzük. A determnsztkus ( függvényszerű ) és a sztochasztkus jelenség, kapcsolat fogalmával az. fejezetben foglalkoztunk. Ugyancsak megsmerkedtünk a sztochasztkus függetlenség fogalmával s. Emlékeztetünk arra, hogy determnsztkus kapcsolatnál X változó adott értékehez Y változó meghatározott értéke tartozk, míg sztochasztkus kapcsolatnál Y változónak több lehetséges értéke s létezhet. Ezek az értékek és a hozzá tartozó valószínűségék az Y változónak az X változóra, mnt feltételre vonatkozó feltételes valószínűségek, amelyek a feltételre vonatkozó feltételes valószínűség eloszlást alkotják. A gyakorlat számítások során azonban csak az eloszlások feltételes várható értékével és varancájával jellemezzük a sztochasztkus kapcsolatot. Így rövden azt s mondhatjuk, hogy X és Y között sztochasztkus kapcsolat (korrelácó) esetén csak az egyk tényező (X) és a másk tényező (Y) átlagos értéke között van határozott kapcsolat. Ez azt s jelent, hogy a két változó nem független, de nncs közöttük funkconáls (determnsztkus) összefüggés, vagys az egyk változó értékét az X változó nagysága mellett még bzonyos egyéb véletlen hatások s befolyásolják. Hangsúlyozn kell, hogy a korrelácós és regresszós számítás a kapcsolatot jellemz, de semmt nem mond az okság vszonyról. Tehát két, vagy több változó között sztochasztkus kapcsolat megállapításából nem következk, hogy a változók okság összefüggésben vannak, azaz, hogy egyk tényező változása oka a másk tényező változásának. Az okság kapcsolatot csak alapos szakma és statsztka vzsgálattal lehet megállapítan. 57

58 4.. A KAPCSOLAT SZEMLÉLTETÉSE A nagyobb számítás munkát génylő matematka módszerek alkalmazása előtt a kapcsolat létezésére vonatkozó szakma feltevésünket grafkus ábrázolással célszerű szemléltetn. Az x ; y értékpárok által meghatározott pontdagram, lletve emprkus regresszófüggvény szemléltet a kapcsolatot. Y -8.6E X R-Sq 6.5 % Y 5.07E X R-Sq 70.9 % Poztív korrelácó Negatív korrelácó Y -7.4E X R-Sq 3.4 % Y X X** R-Sq 88.4 % Nncs korrelácó Nem lneárs korrelácó 7. ábra: Pontdagramok Ha a pontok vonulás ránya (képzeletbel tengelye) felfelé mutat, poztív korrelácóról beszélünk (növekvő x értékekhez növekvő y értékek tartoznak), ellenkező esetben a korrelácó negatív. A görbevonal korrelácó azt jelz, hogy nem lehet mnden korrelácót egyértelműen poztívnak, vagy negatívnak teknten. 58

59 4.3. AZ ELŐJEL KORRELÁCIÓS EGYÜTTHATÓ A sztochasztkus kapcsolat szorosságát a grafkus ábrázolást követően vszonylag kevés számítás munkával ellenőrzhetjük. Az előjel korrelácós együttható, mnt szorosság mérőszám, az gényesebb elemzések előtt nyújthat hasznos nformácót. Feladat: 4 év adata alapján vzsgáljuk meg az ha szántóterületre vonatkoztatott műtrágya felhasználás (x kg/ha) és az év búza termés átlagok (y q/ha) között kapcsolatok jellegét és szorosságát. (Az alább táblázat a későbbekben felhasználásra kerülő részszámításokat s tartalmaz). x y d x x d y y x y d x d d d y x y. 9,9,5-64, -8,3 408,8 68,9 53,0. 3,9 7,0-5,0-3,8 704,0 4,4 97,6 3. 3,6 6,9-5,3-3,9 735,3 5, 04,0 4. 4,4 9, -4,5 -,7 806,,9 7, 5. 53,5 7,9-30,4 -,9 94, 8,4 88, 6. 58,7 5,6-5, -5, 635,0 7,0 3, , 8,6-6,7 -, 78,9 4,8 36, ,4,7-3,5 0,9 8, 0,8 -, 9. 76,3,7-7,6 0,9 57,8 0,8-6,8 0. 0,3 5,9 7,4 5, 30,8 6,0 88,7. 4,4 5, 40,5 4,4 640, 9,4 78,. 36, 7, 5,3 6,3 735,3 39,7 39, ,6,3 8,7 0,5 6839,3 0, 4, ,0 30,7, 9,9 343, 98,0 099,9 74,3 9, 3793, 36,5 980,4 4. Táblázat x 83, 9 y 0, 8 59

60 8. ábra A grafkus ábrázolás poztív korrelácót és feltehetően lneárs összefüggést mutat. (Szakma szempontból ez a feltételezés csak az adott műtrágya felhasználás sznten lehet gaz, hszen közsmert a növekvő műtrágya felhasználás csökkenő hatékonysága s). Az előjel-korrelácós együttható értelmezéséhez és meghatározásához vegyük fgyelembe, hogy poztív korrelácó esetén x átlagosnál alacsonyabb értékehez általában az átlagosnál alacsonyabb y értékek tartoznak és ez fordítva s gaz. Ha tehát d x és d y eltéréseket hasonlítjuk össze, akkor poztív korrelácó esetén az esetek nagy részében az eltérések előjele megegyezk. (Negatív korrelácó esetén a helyzet fordított lesz). Ebből lehet következtetn a kapcsolat rányára és szorosságára s. (Az azonos és eltérő előjelű eltérés párok egyenlő aránya a kapcsolat hányát jelz). Az előjel-korrelácós együtthatást (r e ) az alábbak szernt értelmezzünk: ahol: u az előjel egyezések száma, v az előjel eltérések száma (u + v n). u v r e u + v Nylvánvaló, hogy r e értéke (-) és (+) között helyezkedk el. Függvényszerű (determnsztkus) kapcsolat esetén r e, de ez fordítva nem feltétlenül gaz. (Megjegyezzük, ha valamelyk eltérés párban az egyk, vagy mndkét eltérés nulla, akkor az adott egységnél u 0,5 és v 0,5 értékekkel számolunk). Mntapéldánkban u, v, ezért: r e 0,7 4 amelyből a két változó közepesnél jóval erősebb, poztív rányú kapcsolatára következtethetünk. 60

61 Ha a pontdagramban behúzzuk az y y és x x egyeneseket, akkor u az I. és III. negyedbe eső pontok számának az összessége, míg v a II. és IV. negyedben található pontok összege lesz A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ A regresszó számítás feladata a változók között összefüggés jellegének meghatározása. Ennek során a pontdagramos ábrázolással érzékeltetett tendencát valamlyen analtkusan smert függvénnyel próbáljuk leírn. A Y f ( X ) regresszós függvényt a legksebb négyzetek elve és módszere alapján határozzuk meg. Ez azt a követelményt támasztja, hogy az adott függvénytípust (egyenes, parabola, exponencáls, stb.) használata során a n ( y ŷ ) összeg mnmáls legyen. Az y yˆ eltérések (rezduumok) négyzetenek összege jól jellemz a ponthalmaz és a regresszós vonal kölcsönös vszonyát. A leggyakrabban alkalmazott lneárs regresszós modellben a legksebb négyzetek módszere azt a regresszós egyenest teknt a legjobban lleszkedőnek, amely a pontdagram egyes pontjatól átlagosan a lehető legksebb merőleges távolságban halad (9. ábra). 9. ábra: Merőleges távolságok Egy lyen egyenesnek az egyenletét azonban csak bonyolult számításokkal lehet meghatározn. Másk megoldás lehetőségnek adódk, ha nem a merőleges távolságok mnmalzálására törekszünk, hanem a pontoknak a regresszós egyenestől vett függőleges, vagy vzszntes távolságanak négyzetes összegét választjuk a lehető legksebbre (0. ábra,. ábra,. ábra). 6

62 0. ábra: Függőleges távolságok. ábra: Négyzetes (függőleges) távolságok. ábra: Négyzetes (vízszntes) távolságok 6

63 A legksebb négyzetek módszerével előállított egyenest első regresszós egyenesnek nevezzük, ha a függőleges távolságokra mnmalzálunk, lletve másodk regresszós egyenesnek nevezzük, ha a vzszntes távolságokra mnmalzálunk. Ez a két egyenes általában nem esk egybe (3. ábra, 4. ábra). 3. ábra: Erős lneárs kapcsolat 4. ábra: Gyenge lneárs kapcsolat Nylvánvaló, hogy a két regresszós egyenes között annál nagyobb a különbség, mnél jobban szóródnak a ponthalmaz pontja. Kvaltatív módon belátható az s, hogy annál erősebb a lneárs kapcsolat a két változó között, mnél kevésbé tér el egymástól a két regresszós egyenes. Az egyk szélső esetben, ha az összes pont egy egyenesre esk, akkor a két regresszós egyenes meredeksége egyenlő (5. ábra). Ebben az esetben abszolút lneárs kapcsolatról beszélünk. A másk szélső esetben a regresszs egyenesek merőlegesek egymásra (6. ábra), azaz semmlyen lneárs kapcsolatról nem beszélhetünk. 5. ábra: Abszolút lneárs kapcsolat 63

64 6. ábra: Nncs lneárs kapcsolat A lneárs korrelácó analízs lényegében azt vzsgálja, hogy mennyre tér el az első regresszós egyenes meredeksége a másodktól. Ha a meredekségek aránya r ( x, y), akkor ennek négyzetgyöke a Pearson-féle tapasztalat korrelácós együttható. (Ennek valószínűségelmélet értelmezésére a. fejezetben térünk vssza.) A korrelácós együttható értéke nulla, ha X és Y függetlenek (.5 pont). Ez fordítva általában nem gaz: abból, hogy két valószínűség változó korrelácós együtthatója nulla, nem feltétlenül következk, hogy a két változó független s egymástól (kvétel, ha X és Y együttes eloszlása normáls). Ha a két változónál csak azt tudjuk, hogy r(x,y)0, akkor korrelálatlannak nevezzük őket. A korrelácós együttható abszolút értéke legfeljebb, azaz ( x, y) r + és a ± értéket akkor és csak akkor ér el, ha X és Y között lneárs kapcsolat van: y b x + a Ha b > 0, akkor r (x, y), ha b < 0, akkor r (x, y). Poztív sztochasztkus kapcsolatnál 0< r (x, y) <, míg negatív sztochasztkus kapcsolatnál < r (x, y) < 0. Természetesen, mnél szorosabb a kapcsolat, ( x y) r, annál jobban közelít az -et. A korrelácós együtthatót a mntabel, tapasztalat adatokból az alább módon becsülhetjük: r ( x, y) n n d d x x d n y d y ahol: d x x x és d y y. y 64

65 Feladat: Számítsuk k a mntapéldában szereplő változó korrelácós együtthatóját! A táblázatban (4.3 pont) közölt adatok alapján: 980,4 r ( x, y ) 0, , 36,5 A lneárs regresszós vzsgálat során általában az első regresszós egyenest alkalmazzuk. Ekkor az a és b becsült értékere a legksebb négyzetek módszerét alkalmazva a levezetések mellőzésével az alább eredményt kapjuk: b n d x n d d x a y b x A regresszós egyenes b együtthatóját regresszós együtthatónak nevezzük. Mnt az egyenes ránytangense statsztka értelemben megadja, hogy x egységny változása mekkora átlagos változást déz elő y-ban. A a együttható pedg az x0 helyhez ad regresszós becslést. Feladat: Mntapéldánkban határozzuk meg a regresszós egyenes egyenletét! y 980,4 b 0, , a 0,8 0,08 83,9 4, Így a regresszós egyenes egyenlete: y 0,08x + 4, 4.5. AUTO- ÉS KERESZTKORRELÁCIÓ IDŐSOROK ELEMZÉSÉNÉL Az dősor fogalmával korábban már megsmerkedtünk (3.9 pont). Gazdaság dősorok adatanak elemzése (Befektetések, Vállalatgazdaságtan) a korrelácószámítás szempontjából számos specáls problémát vet fel. Gyakran előfordul, hogy egy, vagy több dősor egymást követő adata egymástól nem függetlenek, hanem szoros korrelácóban állnak egymással. Ez a jelenség az autokorrelácó, amennyben egy változó egymást követő adatanak kapcsolatát vzsgáljuk, és keresztkorrelácó, ha több változó hasonló kapcsolatát nézzük. A regresszós modellben ez úgy jelentkezk, hogy az egymást követő rezduáls értékek között korrelácós kapcsolat mutatkozk. Az autokorrelácó különböző rendű lehet. Elsőrendű az autokorrelácó, ha az dősorban a hbatényező t-edk értéke a (t- )-edk, közvetlen szomszédos értékkel van korrelácós kapcsolatban. 65

66 Feladat: A következőkben az között dőszakban rögzített tőzsde adatokból a MINITAB alkalmazásával készült különböző eloszlás- és regresszós modelleket mutatunk be. Értelmezzük az eredményeket! 66

67 67

68 5. VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 68

69 5.. A VALÓSZÍNŰSÉGI VÁLTOZÓ A valószínűség változó fogalma: A valószínűség változó jellege: 69

70 5.. VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI Valószínűség-eloszlás függvény: Dszkrét esetben a ξ valószínűség változó eloszlását egyértelműen az jellemz, hogy a változó a lehetséges értéket mlyen valószínűséggel vesz fel. Ezt adja meg a p k valószínűség-eloszlás: Tulajdonsága: I. 0 p k p k p( ξ k) k II. p k III. P( a ξ < b) k b p k a Feladat: Rajzolja fel a kockadobás valószínűség-eloszlás függvényét! Eloszlásfüggvény: Az eloszlásfüggvény [jelölése: F(k) v. folytonos változó esetén F(x)] megadja, hogy a ξ valószínűség változó mekkora valószínűséggel vesz fel egy adott k-nál, vagy x-nél ksebb értéket, azaz: Tulajdonsága: F(k) P(ξ < k) ll. F(x) P(ξ < x). monoton növekvő, azaz F(a) F(b), ha a < b F(- ) 0, F( ) balról folytonos p k és F(k) kapcsolata: p k F( k + ) F( k) F ( k) k p P( a ξ < b) F( b) F( a) k b p k a Feladat: Rajzolja fel a kockadobás eloszlásfüggvényét! 70

71 Sűrűségfüggvény: Ha a ξ folytonos valószínűség változó eloszlásfüggvénye F(x), akkor az ' f ( x) F ( x) függvényt a ξ sűrűségfüggvényének nevezzük. Tulajdonsága: f ( x) f ( 0 x )dx f(x) és F(x) kapcsolata: Várható érték: F( x) x ' f ( x) dx; f ( x) F ( x) P ( a ξ < b) F( b) F( a) f ( x) dx b a A ξ dszkrét valószínűség változó lehetséges értéke legyenek k, k, k 3,., akkor ξ várható értékének az M( ξ ) p k összeget nevezzük; Ha ξ folytonos valószínűség változó és sűrűségfüggvénye f(x), akkor a ξ várható értéke Feladat: Számítsa k a kockadobás várható értékét! M( ξ ) x f ( x )dx. A várható érték egy fontos tulajdonsága: ha ξ, ξ... ξ n tetszőleges valószínűség változók, akkor összegük várható értéke egyenlő a valószínűség változók várható értékének összegével: M ( ξ + ξ ξ ) M ( ξ ) + M ( ξ ) M ( ), n ξ n Szórás, szórásnégyzet: Ha a ξ-m(ξ) valószínűség változó négyzetének létezk a várható értéke, akkor ezt ξ szórásnégyzetének nevezzük: D ( ξ ) M ( ξ M( ξ )] ). Ennek négyzetgyöke a D( ξ ) D ( ξ ) a ξ valószínűség változó szórása. [ 7

72 Feladat: Számítsa k a kockadobás szórását! A szórásnégyzet egy fontos tulajdonsága: ha ξ, ξ... ξ n független valószínűség változó és szórásak léteznek, akkor összegük és különbségük szórásnégyzete egyenlő a valószínűség változók szórásnégyzetének összegével: D ( ξ + ξ ξ ) D ( ξ ) + D ( ξ ) D ( ξ ) n Medán: Valamely ξ valószínűség változó medánja (Me) az a valós szám, amelyre P(ξ<Me) 0,5. Kvantlsek: A medánhoz hasonlóan értelmezhetjük a p-kvantlst. A p-kvantls az a valós szám, mely az eloszlást p/(-p) arányban osztja ketté. A fentek alapján a medán a 0,5-kvantls. Módusz: Ha ξ valószínűség változó lehetséges értéke között van olyan, amelyet nagyobb valószínűséggel vesz fel, mnt a többt, akkor ezt az értéket ξ móduszának nevezzük. Folytonos valószínűség változó esetén ξ módusza a sűrűségfüggvény (lokáls) maxmumhelye(). Momentumok: A ξ valószínűség változó momentumanak nevezzük a következő számértékeket: k-adk momentum M(ξ k ), k-adk abszolút momentum M( ξ k ), k-adk centráls momentum M{[ξ-M(ξ)] k }, k-adk centráls abszolút momentum M[ ξ-m(ξ) k ], ahol k,,3,. Látható, hogy ξ első momentuma M(ξ), a valószínűség változó várható értéke, s másodk centráls momentuma M{[ξ-M(ξ)] }, a szórásnégyzete. n 7

73 5.3. BINOMIÁLIS ELOSZLÁS Ha egy kísérlet során az A esemény bekövetkezését ll. be nem következését vzsgáljuk azaz alternatív, két kmenetelű eseményről beszélünk -, s az A esemény bekövetkezés valószínűsége P(A) p, és a kísérletet n-szer egymástól függetlenül megsmételjük, akkor ha a vzsgált ξ valószínűség változó az A esemény bekövetkezésének száma, a ξ valószínűség-eloszlását bnomáls eloszlásnak nevezzük, s az alább összefüggéssel határozhatjuk meg: p k P( k ) n k k n k ξ p q, ahol q p Az eloszlás várható értéke és szórásnégyzete: M (ξ ) n p D ( ξ ) n p q Mnőségmenedzsment területén elsősorban a vsszatevéses mntavétel során alkalmazzuk a bnomáls eloszlást ll. bzonyos feltételek esetén a hpergeometrkus eloszlás helyettesítésére. Ha p (n+) szorzat egész szám, akkor az eloszlásnak két módusza van, az (n+) p- és az (n+) p helyen. Ha p (n+) nem egész, akkor az eloszlás unmodáls és a módusz az (n+) p egész része. Ha n nagy, akkor az eloszlás módusza az eloszlás várható értékéhez közel szám, azaz a bnomáls eloszlás legnagyobb valószínűséggel a várható értékéhez közel értéket vesz fel. Feladat: Mekkora valószínűséggel találunk egy 5%-os selejtaránnyal jellemezhető tömeggyártásból kvett 0 elemű véletlen mntában db selejtes terméket? 73

74 Feladat: Az UEFA szgorú előírása alapján állít elő a Mnőség Bőr Kft. labdarúgó labdákat 500 darabos tételekben. Az átadás-átvétel eljárás során két előírás szernt járhatunk el: a.) két 0 darabos mntában egyetlen hbás darab sem lehet, b.) három 0 darabos mntában mntánként legfeljebb darab selejtes lehet. Melyk eljárást választaná az UEFA és melyket a Mnőség Bőr Kft. helyében, ha a selejtarány várhatóan 5 %? 74

75 5.4. POISSON-ELOSZLÁS Dszkrét eloszlások közül ez az egyk leggyakrabban előforduló eloszlás a gyakorlatban. A Posson-eloszlást ks valószínűségű, vagys rtka események eloszlástörvényének s nevezk, mvel ezzel az eloszlással írhatók le az ún. véletlen pontelhelyezkedések: Az egyenesen, síkon, térben véletlenszerűen elhelyezkedő pontok esetén egy adott tartományba eső pontok száma, vagy a véletlenszerű dőpontokban bekövetkező eseményeknél adott dőtartam alatt bekövetkező események száma gen gyakran Posson-eloszlású. (Ilyen eloszlás például ezen jegyzetben a gépelés hbák száma.) Az eloszlás valószínűség-eloszlás függvénye: p λ k! k λ k P( ξ k ) e, ahol λ>0 valós szám, az eloszlás paramétere; k,, 3,. Az eloszlás várható értéke és szórásnégyzete: M ( ξ ) λ D ( ξ ) λ A Posson-eloszlás segítségével bzonyos esetekben közelíthetjük a bnomáls eloszlást. Ha n elég nagy és p kcs, akkor aránylag ks k értékekre a bnomáls eloszlást a λ n p paraméterű Possoneloszlás megfelelő tagjaval közelíthetjük. Az eloszlás módusza, ha λ egész szám, akkor az eloszlás bmodáls Mo λ- és Mo λ. Ha λ nem egész szám, akkor a módusz λ egész részénél van, az eloszlás unmodáls. Ez azt jelent, hogy a Posson-eloszlás legnagyobb valószínűséggel a várható értékét vagy ahhoz közel (annál ksebb) értéket vesz fel. Feladat: Egy készülék meghbásodásanak átlagos száma 0000 működés óra alatt 0. Határozzuk meg annak a valószínűségét, hogy a készülék 00 működés óra alatt nem romlk el! 75

76 Feladat: Egy készülék szavatosság deje egy év. A készülék 000 darab azonos, különlegesen megbízható elemet tartalmaz, amelyek a szavatosság dő alatt egymástól függetlenül 0,0005 valószínűséggel romlanak el. A szavatosság alapján a gyártó vállalat az egy éven belül bekövetkezett meghbásodások javítására esetenként a teljes ár /4 részét fzet vssza. Ha a javítások száma az év során elér az ötöt, akkor a gyártó vállalat a már kfzetett négy javítás költségen felül a teljes árat s vsszafzet. Számítsuk k, hogy előreláthatólag az eredet vételár hány százaléka marad a gyártó vállalatnál! Feladat: 00 méter hosszú szövetanyagon átlagosan 5 hbát találtunk, s a mérések a szövethbák számát Posson-eloszlásúnak mutatták. 300 méter hosszú szövetet 4 méter hosszú terítékekre osztanak. Mnden 4 méteres darabból egy-egy öltöny készül. A hbátlan öltönyt darabonként forntért árusítják, a szövethbásat forntért. a.) Várhatóan hány hbátlan van a 300 méteres szövetvégből készült öltönyök között? b.) Menny az öltönyök eladásából származó árbevétel? 76

77 5.5. EXPONENCIÁLIS ELOSZLÁS Az exponencáls eloszlás legnkább bzonyos véletlen hosszúságú dőtartamok eloszlásaként lép fel. Általában exponencáls eloszlású, például: egy olyan berendezés, rtkább esetben alkatrész élettartama, hbamentes működés deje, amelynek tönkremenetelét, meghbásodását nem kopás vagy természetes elhasználódás okozza, hanem váratlan törés, szakadás lletve egyéb véletlen ok, egy radoaktív atom élettartama (azaz keletkezésétől az elbomláság terjedő dőszakasz hossza), bzonyos esetekben egy kéma kötés felszakadáság eltelt dő, véletlentől függő hosszúságú telefonbeszélgetések dőtartama, egyéb, a véletlentől függő hosszúságú működés-, javítás-, kszolgálás-, várakozás- és követés dő, lletve dőköz. Az exponencáls eloszlású valószínűség változó: sűrűségfüggvénye: f ( 0, x ) λe -λx ha x 0 ha x 0 eloszlásfüggvénye: 0, F( x ) e -λx ha x 0 ha x 0 várható értéke: M(ξ) szórásnégyzete és szórása: D (ξ) D(ξ) 77

78 Feladat: Egy automatzált gépsor hbamentes működésének valószínűsége 0 működés órára 0,9. Tegyük fel, hogy a működés dő exponencáls eloszlású. Számítsa k a λ meghbásodás rátát és a működés dő várható értékét, valamnt annak a valószínűségét, hogy a gépsor a 50. és a 00. óra között meghbásodk. 78

79 Feladat: Egy radoaktív anyag (sugárforrás) bomlás vszonyat vzsgáljuk. Legyen a valószínűség változó egy tetszőleges atom bomláság eltelt dő és annak valószínűsége, hogy az anyag egy tetszőleges atomja x éven belül elbomlk: P( ξ x ) e x /, ha x 0 a.) Határozza meg a valószínűség változó várható értékét, szórását, valamnt a bomlás felezés dejét! b.) Számítsa k annak a valószínűségét, hogy egy tetszőleges atom túlél a 3 évet! 79

80 Feladat: Számítsa k az F (x/λ) eloszlásfüggvény értékét! 80

81 5.6. NORMÁLIS (GAUSS-) ELOSZLÁS A leggyakorbb eloszlás a menedzsment területén előforduló elmélet eloszlások közül. Ha egy valószínűség változó értékét nagyszámú, egymástól függetlenül ható véletlen tényező határozza meg úgy, hogy az egyes tényezők külön-külön csak gen ks mértékben járulnak hozzá az összes véletlen hatásból eredő ngadozáshoz, és az egyes tényezők hatása összeadódnak, akkor általában normáls eloszlású valószínűség változót kapunk (központ határeloszlás tétel). Normáls eloszlással írható le például: arányos skálán mérhető termékjellemző (például: szélesség, hosszúság, vastagság, tömeg, összetétel) és technológa paramétere (például: hőmérséklet, nyomás, sebesség) matematka modellezése, egyéb, több tényező összegződése révén előálló mennység eloszlásának modellezése (például: testmagasság, munkabérek, eseménydő a hálótervezésben, élettartam, két meghbásodás között eltelt dő), véletlen jellegű mérés hbák matematka leírása, technológa folyamatok rányítás algortmusának kalakítása (például: számtan átlag alapján történő szabályozás). A normáls eloszlású valószínűség változó sűrűségfüggvénye: eloszlásfüggvénye: f ( x ) µ ) ( x σ e, ahol < < σ π 0 σ F( x ) e σ π várható értéke: M(ζ) µ szórása: D (ζ) σ. x x, ( x µ ) Az F(x) függvény nem elem függvény, értéket táblázat alapján határozhatjuk meg. A µ, σ paraméterű normáls eloszlást rövden N(µ;σ) val jelöljük. A µ0, σ paraméterű normáls eloszlású valószínűség változót standard normáls eloszlásúnak nevezzük. Normáls eloszlás esetén ennek eloszlásfüggvénye adott táblázattal, s tetszőleges N(µ;σ)-ra vonatkozó valószínűségeket az N(0,) táblázat segítségével határozzuk meg. A normáls eloszlással történő gyakorlat számításokat jelentősen megkönnyítjük, ha az u x µ σ transzformácóval az x változó helyett bevezetjük az u változót, s az így kapott standard normáls eloszlás valószínűség függvényevel számolunk. A standard normáls eloszlás jelentőségét az adja, hogy bármely N(µ;σ) eloszlás F(x) eloszlásfüggvénye mndg kfejezhető az N(0;) eloszlás Φ(u) eloszlásfüggvényével: F( x) Φ( u) Mvel a standard normáls eloszlás 0 körül szmmetrkus, ezért: Φ ( u) Φ( u) dx 8

82 Feladat: Határozzuk meg annak valószínűségét, hogy az N(µ;σ) eloszlású valószínűség változó a várható értékétől legfeljebb szórásnyra, két szórásnyra, három szórásnyra tér el! P( µ σ < ξ < µ + σ ) F( µ + σ ) F( µ σ ) µ + σ µ µ σ µ Φ Φ Φ() Φ( ) Φ() ( Φ()) Φ() σ σ 0,843 0,686 A fent számolás menetet alkalmazva ll. 3-szoros szórásnyra való eltérésre az alább eredmények adódnak: P( µ σ < ξ < µ + σ ) 0,977 0,9544 P( µ 3σ < ξ < µ + 3σ ) 0, ,9973 Vagys a ξ a várható értékétől legfeljebb szórásnyra kb. 0,68, legfeljebb két szórásnyra kb. 0,95 ll. legfeljebb három szórásnyra kb. 0,997 valószínűséggel tér el. A normáls eloszlás fent tulajdonságát nevezzük háromszgma szabálynak. Ezt mutatja a 7. ábra. µ-3σ µ-σ µ-σ µ µ+σ µ+σ µ+3σ 68,6 % 95,44 % 99,73 % 7. ábra: A háromszgma szabály 8

83 Feladat: 00 g névleges tömegű mosópor töltésekor előírás szernt az ATH90g, amely alá a legyártott mennység 4%-a kerülhet. A jelenleg töltés folyamatban µ04,4g, σ9,4g. a.) Megfelel-e a gyártás az előírásoknak? Ha nem, akkor mlyen optmáls töltés szntet kell elérn, hogy megfeleljen? b.) Mekkora legyen a szórás, hogy a µ04,4g lehessen a töltés várható értéke? 83

84 Feladat: A bélszínrolót négyesével csomagolják tasakokba. A rolók súlya N(50g; 5g) eloszlást követ. Mekkora a valószínűsége annak, hogy a tasak valamenny rolója 55 grammnál nehezebb? Feladat: Export konyak töltésénél az 50 ml alatt palackok aránya legfeljebb 3% lehet. Megvzsgáltak egy n0000 db-os tételt: x 53,4 ml, σ6 ml. Határozzuk meg az optmáls töltés szntet. Mekkora az adott tételnél a töltés veszteség értéke, ha á000 Ft/palack? 84

85 Feladat: Egy bankfókban a nap kfzetések összege N(3,6mFt; 0,9mFt) eloszlást követ. a.) Menny a valószínűsége annak, hogy a nap kfzetések összege a µ±σ ntervallumba esk? b.) Mekkorára kellene a kfzetések szórásának megváltozn ahhoz, hogy az 5 mft felett kfzetések valószínűsége 4% legyen? c.) Menny pénzt kell tartan a fókban, ha 95%-os valószínűséggel akarjuk bztosítan a kfzetések teljesítését? 85

86 Feladat: Egy termék mérethbája (eltérés a névleges mérettől) normáls eloszlású valószínűség változó, amelynek várható értéke 0. Megállapították, hogy a mérethba abszolút értéke 0,8 valószínűséggel nem ér el a 0 mm-es határt, amelyen belül a termék még elfogadható mnőségű. A termék I. osztályúnak mnősül, ha a mérethba abszolút értéke a 0 mm-t nem haladja meg. Mekkora a valószínűsége ennek egy találomra kvett termék esetén? Feladat: Egy elektronka gyárban tesztekkel gazolták, hogy egy TV képcső élettartama N(5,8 év;,3 év) eloszlású. A vállalat év cseregarancát vállal a képcsövekre. A képcsövek hány százalékát kell kcseréln a garanca dőtartama alatt? Mekkorára kell növeln a képcsövek élettartamát (a szórás nem változk), ha a cég legfeljebb %-os garancáls cserét szeretne elérn? Legfeljebb mekkora szórása lehet az élettartamnak - ha a várható érték nem változk (5,8 év) - ahhoz, hogy a %-os célt elérjék? 86

87 5.7. A KÖZPONTI HATÁRELOSZLÁS TÉTELE A központ határeloszlás tétele a sok véletlen komponens különféle függvényenek (például összegének, szorzatának, maxmumának) aszmptotkus eloszlásaval foglalkozó határeloszlástételek közül a legfontosabb a gyakorlat számára. A tétel magyarázatot ad arra, hogy mért találkozunk oly gyakran a természet és a társadalom jelenségenek törvényszerűséget vzsgálva a normáls eloszlással. A központ határeloszlás tétele értelmében, ha η, η,..., η n azonos eloszlású, véges M(η ) várható értékű és véges D(η ) szórású független valószínűség változók, akkor a belőlük képzett valószínűség változó n esetén N(0;) eloszlású. Amennyben az η, η,..., η n, azonos várható értékű és szórású valószínűség változók, akkor ξ kfejezhető a következő alakban: A tapasztalat azt mutatja, hogy már aránylag ks n esetén s az előbbekben felsorolt tulajdonságokkal rendelkező valószínűség változók összegéből képzett ξ* valószínűség változó közelítőleg normáls eloszlású M(ξ*) várható értékkel és D (ξ*) szórásnégyzettel. 87

88 8. ábra: A kockadobás összegének valószínűsége eloszlása 88

89 6. STATISZTIKAI DÖNTÉSEK ALAPELVEI Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 89

90 6.. ESETPÉLDA Egy kezdő vállalkozás az "A" és "B" jelű termékek gyártását végz. A vállalkozó mnden hónap végén a rendelkezésre álló nformácók alapján dönt, hogy a gyártósor kapactását a következő hónapban az "A" vagy a "B" termékkel köt-e le, mvel csak az egyk gyártható, ha a gyártósort erre állították át. A vállalkozó súlyos raktározás gondokkal küzd, ezért ha az adott hónapban gyártott terméket nem tudja elhelyezn azonnal a tervezett áron, akkor árengedménnyel értékesít azt. Rendelkezésre állnak a következő műszak és gazdaság adatok: Mlyen döntést hozna, ha "A" "B" kapactás (db/hó) k prop (Ft/db) K fx (Ft/hó) á tervezett (Ft/db) á engedmény (Ft/db) 60 0 a.) Nncs nformácónk a pac elhelyezhetőségről? b.) A korább dőszak statsztkája szernt az esetek 70 %-ában az "A", 30 %-ában a "B" terméket keresték a pacon? c.) Packutatók véleményére támaszkodunk, és smert, hogy ha a pac az "A" terméket kereste, azt a packutatók 90 %-ban skeresen jelezték előre, a "B" termék keresletét pedg 80 %-ban találták el. d.) Tökéletes nformácóval rendelkezünk? 6.. DÖNTÉSI ALAPMODELL Döntés, döntéshozó: A döntéshozatal alapvető folyamat. Valamenny ember tevékenységgel egybefonódk valamenny ember tevékenység döntés helyzetek elemzésével tanulmányozható. Néhány szlárd elvre támaszkodva feltárhatjuk azoknak a krtkus döntés elemeknek a halmazát, amelyek mnden döntés problémában újra és újra megjelennek. Döntés helyzetnek nevezzük az olyan helyzeteket, amelyekben az egyén vagy csoport, azaz a döntést hozó legalább két cselekvés változat (cselekvés mód) között választás problémájával áll szemben. A döntés: választás legalább két cselekvés változat között. A döntés helyzet elemzésének különféle közelítése egy bzonyos modell felé mutatnak, amelyet döntés alapmodellnek nevezünk. A döntés alapmodell eleme vszonylag könnyen feltárhatók. A döntés helyzet első eleme, a döntést hozó. Döntéshozónak nevezzük azt a személyt (vagy csoportot), ak a cselekvés változatok közül választ egyet. A döntéshozó választását, azaz döntését, az motválja, hogy vannak célja (de legalább egy célja), amelyeket vagy amelyet el akar érn. A cél elérésére több cselekvés változat közül választhat. Ha csak egyetlen cselekvés változatot teknt, akkor nem beszélünk döntésről, mert meghatározásunk értelmében a döntés választást jelent, márpedg választáshoz legalább két cselekvés változat kell. 90

91 Cselekvés változatok, stratégák: s Egy cselekvés változat (cselekvés mód) a döntéshozó rendelkezésére álló erőforrások bzonyos formában való felhasználását jelent. Más fogalmazásban, egy cselekvés változat a döntéshozó hatáskörébe tartozó szabályozható változók bzonyos módon való együttese. A cselekvés változatoknak különböző következmények vannak. Ha a cselekvés változatok következménye között nncs különbség, akkor döntés problémáról sem beszélhetünk, hszen mndegyk azonos (vagy azonosnak tekntett) következménnyel jár. A következményeket másképpen a cselekvés változatok eredményenek s nevezk. A cselekvés változatok azonban az esetek többségében nem határozzák meg egyértelműen következményeket. A következményekre ugyans hatással vannak a döntéshozó által nem, vagy csak részlegesen szabályozható külső körülmények. Ezeket a külső körülményeket tényállapotoknak nevezzük. Tényállapotok: t A tényállapotok olyan eseményeknek teknthetők, amelyek nem a cselekvés változat tényezőnek hatására következnek be, de a cselekvés változat következményére hatással vannak. Egy tényállapotot (eseményt) a döntés hozó által nem, (vagy csak részlegesen) szabályozható változók együttesének tekntünk. Következmények, eredmények: o j A cselekvés változatok és tényállapotok együttesen határozzák meg a cselekvés változat következményét (eredményét). Egy következmény egy cselekvés változat és egy tényállapot együttes hatásának eredménye. Tényállapotok valószínűsége: p(t ) A külső körülmények, tényállapotok (események) jelenlétének vagy később bekövetkezésének megállapítása vagy előrejelzése nem könnyű feladat. Rendszernt nem s tudjuk bztosan megmondan, hogy mlyen tényállapot (esemény) van jelen, lletve mlyen következk be később. Megállapításank csak bzonyos valószínűséggel érvényesek. A cselekvés változatok és tényállapotok együttesen határozzák meg a következményeket és ezért a tényállapotok valószínűsége egyúttal a következmények valószínűsége s, abban az esetben, ha a tényállapotok és cselekvés változatok egymástól függetlenek. Döntés krtérumok: A fentekben azonosított döntés tényezőkön kívül gen lényeges tényező még a döntés krtérum, amely alapján a lehetséges cselekvés változatok közül kválasztjuk a megfelelőt. A döntés krtérum olyan előírás, amely megmondja, hogyan használjuk fel az előbb nformácókat egyetlen cselekvés változat kválasztására. 9

92 6.3. DÖNTÉSI MÁTRIX A döntés lényeges elemenek smertetése után rendezett formában feltárhatjuk a döntés statkus szerkezetét. A szerkezetet a döntéselemzésben használt két formával jellemzk: a döntés mátrx-szal és a döntés fával. Esetünkben: 6.4. A DÖNTÉSI FOLYAMAT LOGIKÁJA A döntés szerkezetének feltárásával a döntéshozó látja a cselekvés változatokat következményekkel együtt, s ezután döntése előtt (egy cselekvés változat kválasztása a cselekvés változatok halmazából) gondolkodk, pontosabban szólva: átgondolja, vagy megfontolja, a szóban forgó, smert szerkezetű, döntés problémát. A megfontolás során fgyelembe vesz, hogy az egyes tényállapotok mekkora valószínűséggel következnek be (vagy vannak jelen). Ha a cselekvés változatok és a tényállapotok egymástól nem függetlenek, akkor a következmények valószínűségét teknt. A függetlenséget úgy értelmezzük, hogy a cselekvés változatok nem változtatják meg a tényállapotok valószínűséget. Kérdés, hogy mképpen határozzuk meg a tényállapotok bekövetkezésének (vagy a következményeknek) valószínűségét? A legegyszerűbb a döntést hozó korább tapasztalatara alapozott szubjektív becslés. A korább tapasztalatok nyomán megfogalmazott valószínűséget a pror valószínűségnek nevezk (.4 pont). A valószínűségek számszerű megfogalmazásában azonban a döntést hozó nem járhat el önkényesen. A valószínűségszámítás axómának megfelelően kell a valószínűségek számértéket hozzárendeln a tényállapotokhoz (vagy következményekhez). A tényállapotok egymást kzárják, továbbá un. teljes eseményrendszert alkotnak, azaz valamelyk bztosan bekövetkezk közülük. A tényállapotok valószínűsége összegének tehát egyet kell adnuk (mvel a bztos esemény valószínűsége egy). A valószínűség számérték megállapításának másk módja az új nformácók szerzése. Az nformácók mennysége lehet teljes vagy részleges. Az esetek túlnyomó hányadában csak részleges nformácómennységet szerezhetünk. A részleges nformácómennység érdekes következménye, hogy a döntést erre alapozva fennáll a tévedés lehetősége. A tévedés azaz hba kétféle típusú lehet. Igaz hpotézst utasítunk el, úgynevezett elsőfajú hbát vétünk, vagy hams hpotézst fogadunk el gazként másodfajú hbát követünk el. Részleges nformácót mndg mntavételes eljárással szerzünk. Ebben az esetben mndg fennáll a kétfajta hba elkövetésének kockázata. 9

93 A valószínűség számérték megállapításának harmadk lehetősége az a pror és az új nformácók ötvözése. Erre lehetőséget nyújt az un. Bayes-féle logka. A gondolat nagyjelentőségű: a tapasztalatokon nyugvó megállapítások módosítása az új nformácók tükrében. Belátható ugyans, hogy a tapasztalat (korább tapasztalatokról van szó) nformácókat nem szabad (lletve nem célszerű) elvetn akkor, ha az új nformácók szerzésében korlátozottak vagyunk elv vagy gyakorlat okok matt. Előnyösebb tehát a rég és az új ötvözése. A Bayes-féle logka matematka alapja a valószínűségszámításban szereplő Bayes-tétel. A Bayes-féle következtetés jelentősége a modern döntéselméletben rohamosan nő (.4 pont) DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK Egységes döntés krtérum nncs. Tudjuk, hogy vannak kfejezetten szubjektív (a rossz értelemben vett szubjektív) döntés krtérumok s. Ilyen például a tekntély elv krtéruma, amkor valak a tekntélyt teknt döntő krtérumnak (saját vagy mások tekntélyét), vagy lyen az önkényesség (autark krtérum). A rossz értelemben vett szubjektív kfejezéssel arra utalunk, hogy ezek a krtérumok nem tartoznak a raconáls krtérumok közé, de nem jelent azt, hogy az lyen döntés krtérumok mndg helytelenek. A döntés krtérumok döntés osztályonként változnak. Döntés osztályokat a tényállapotokra (vagy következményekre) vonatkozó valószínűségek alapján állítunk fel. Három döntés osztályt szokás megkülönböztetn: a bzonytalan, a kockázatos és a bztos döntések osztályát. Bzonytalan döntések osztálya: A bzonytalan döntések osztályába soroljuk azokat a döntés problémákat, amelyekben nem smerjük a tényállapotok (lletve következmények) valószínűséget. A bzonytalan döntések osztályában nncs egységes döntés krtérum. A döntést hozó pszchológa beállítottságától függően defnálhatunk döntés krtérumokat. A legsmertebbek a Wald-féle, a Savage-féle, a Hurvcz-féle és a Laplace-féle krtérumok. A Wald-krtérumot másképpen mnmax (lletve maxmn) krtérumnak s nevezk. A pesszmsta és óvatos döntést hozó krtéruma. A pesszmsta döntést hozó a legrosszabb következményt teknt, de mvel óvatos s, gyekszk magát a lehető legrosszabbtól megvéden. Eljárásának lényege: mnden egyes cselekvés változat esetében a legrosszabb következményt tekntve ezek közül a legjobbat, azaz a relatíve legksebb rosszat választja. Esetünkben: A Savage krtérum az un. mnmáls regret krtéruma. (A regret angol szó, megbánást jelent.) Pszchológa alapja az elmulasztott lehetőségen érzett megbánás. (A lottózók, lletve totózók gyakran vannak lyen pszchológa állapotban.) A regret mértéke az adott körülmények között optmáls (tehát a legjobb) és a tényleges döntés között különbség a következmények értékében mérve. A regretmatrxra ezután a Wald krtérumot alkalmazzuk: a legnagyobb regretek közül választjuk a legksebbet (mnmáljuk a maxmumokat, nnét a mnmax elnevezése a Wald-krtérumnak). 93

94 Esetünkben: A Hurvcz-féle krtérum az un. optmzmus együtthatóval súlyozva számítja k a legmegfelelőbb cselekvés változatot. Az optmzmus együttható az elnevezéssel asszocálódó komolytalan felhanggal ellentétben, egzakt matematka gondolatmenet alapján határozható meg. Pszchológa alapja a két végletes álláspont a teljes pesszmzmus és a teljes optmzmus között arany középút keresése. A Laplace-krtérum alapja az elégtelen megokolás elvében gyökeredzk. Eszernt, ha nncs elégséges ndokunk a különböző események bekövetkezés valószínűségének megállapítására, akkor a Laplace-féle álláspont szernt legcélszerűbb, ha mnden egyes eseményt azonos valószínűséggel tekntünk. Példánkban: Kockázatos döntések osztálya: A legtöbb valóságos döntés probléma a kockázatos döntések osztályába esk. A kockázatos döntések osztályába tartoznak mndazok a döntések, amelyek esetében a tényállapotok (vagy következmények) valószínűsége smertek, azaz smeretes a valószínűségeloszlásuk. A kockázatos döntések osztályában alkalmazott döntés krtérum az un. Bayes-féle krtérum, másnéven az optmáls várható érték krtéruma. A várható érték a valószínűségszámítás gen pontosan kdolgozott fogalma. Bayes smerte fel először és fogalmazta meg egzakt módon,hogy abban az esetben, ha a döntés problémában az esélyeknek, azaz valószínűségeknek szerepe van, akkor a döntést hozók az optmáls várható érték alapján döntenek. Másszóval, azt a cselekvés változatot választják, amelyknek a várható klátása a legjobb. 94

95 Kockázatos döntés az elsődleges nformácók alapján: Kockázatos döntés a pótlólagos nformácók alapján: 95

96 Kockázatos döntés az etka neutraltás elve alapján: A kockázatos döntések esetében gen fgyelemreméltóak az un. etka neutraltás elvéből levezethető következmények. (Az etka neutraltás gondolatának kdolgozása Ramsey nevéhez fűződk.) Ha egy kockázatos döntés probléma esetében a döntést hozó közömbös (etkalag neutráls) a cselekvés változatok között, akkor a cselekvés változatok várható értéke számára azonosak. Ebből a magatartásból a megfelelő számítás eljárással kszámíthatók az eseményekhez rendelt latens valószínűségek. Ekkor a közömbösség azt jelent, hogy a döntést hozó számára a két cselekvés változat várható értéke azonos, tehát: M s M s Nézzük meg, hogy ebben az esetben mekkora valószínűségértéket rendelt az egyes tényállapotokhoz ntutíve és mplcten a döntést hozó. 96

97 Bztos döntések osztálya: A bztos döntések osztályába tartoznak mndazok a döntés problémák, amelyek esetében bztosan tudjuk, hogy egy cselekvés változat esetében melyk következmény lesz az eredmény. Ez kétféleképpen állhat elő: bztosan (tehát egyes valószínűséggel) tudjuk, hogy melyk tényállapot következk be, vagy pedg a cselekvés változathoz tartozó egyetlen eredmény (következmény) bekövetkezését tekntjük bztosnak. Gyakorlatlag a két eset azonos, mert ha csak egyetlen tényállapotot tekntünk bztosnak, akkor egy cselekvés változat és egy bztos tényállapot bztos körülményt határoz meg. A bztos döntések osztályában használt döntés krtérum maxmum vagy mnmum krtérum. Az lyen problémák megoldására dolgozták k a matematka programozás néven smert eljárásokat, amelyekkel véges számú lépésben közvetlenül megtalálható, (lletve kszámítható) a maxmáls (vagy mnmáls) eredményt nyújtó cselekvés változat. A matematka programozás eljárása közül a legsmertebb a lneárs programozás. Esetünkben: Az nformácó értéke: 97

98 6.6. A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI Mntavétel alapelvek Sokaság Következtetés F n (x), Me,, s*... F(x), M(ξ), D(ξ). Mntavétel Mnta 9. ábra: Mntavétel alapelvek Következtetés hbá Sokaság jó rossz A mnta mnősítése a sokaságról jó rossz Nncs hba ε Elsőfajú hba, α Másodfajú hba, β Nncs hba e 30. ábra: Következtetés hbá 98

99 Az elkövethető hba kétféle lehet: elsőfajú hba és másodfajú hba. Az elsőfajú hbát csak gaz hpotézsek vzsgálata során követhetünk el. Akkor fordul elő, ha gaz hpotézst a mnta adata alapján nem fogadunk el. Az elsőfajú hba elkövetésének valószínűségét α-val jelöljük, s értéke egy adott próba során tetszőleges kcsnyre csökkenthető. A másodfajú hbát csak hams hpotézsek vzsgálata során követhetünk el. Másodfajú hba akkor jelentkezk, ha a hams hpotézst a mnta adata alapján nem utasítjuk el. A másodfajú hba valószínűségét β-val jelöljük, s értéke egy adott próba során bármely konkrét a feltett hpotetkustól eltérő alapsokaság paraméterre vonatkozóan kszámítható. A másodfajú hba veszélye csökken a hpotetkus és a tényleges várható érték eltérésének növekedésével, vszont nő, ha adott próba esetén az elsőfajú hbát csökkentjük. Az első- és másodfajú hba egydejűleg csak a mntaelemek számának növelésével csökkenthető. A próbák tervezésénél és az eredmények értelmezése során ezekre tekntettel kell lennünk. 99

100 Feladat: Egy szabályozott gyártás folyamatban a krtkus mnőség jellemző µ 0 3, cm 3, σ 0 0,08 cm 3 normáls eloszlást követ. a.) Számolja k a µ 0 ± σ 0 beavatkozás határok esetén n elemű mntavétel mellett az elsőfajú hba valószínűségét! b.) Mekkora a másodfajú hba valószínűsége, ha a várható érték µ 3,3 cm3 -re változott? c.) Mekkora az első és másodfajú hba valószínűsége, µ 0 ± 3σ 0 beavatkozás határok valamnt n és n4 elemű mntavétel mellett? Első-, másodfajú hba számolása Első-, másodfajú hba számolása n α/ µ 0 3, α/ P(ξ 0,94 3, <ABH) Φ 0,08 Φ(-),8% α,8 4,56% ABH,94 cm 3 FBH3,6 cm 3 n α/ β µ 0 3, µ 3,3 ABH,94 cm 3 FBH3,6 cm 3 α/ 3,6 3,3,94 3,3 βp(abh<ξ <FBH) Φ Φ 0,08 0,08 ( 0,5 ) Φ ( 4,5 ) 0, 30,85% Φ 695 µ 0 ±σ 0 Készítette: Erde János Készítette: Erde János Első-, másodfajú hba számolása Első-, másodfajú hba számolása α/ α/ α,86 3, Φ 0,08 Φ(-3) 0,3% α 0,6% Készítette: Erde János n µ 0 3, µ 3,3 ABH,86 cm 3 FBH3,34 cm 3 3,34 3,3,86 3,3 β Φ Φ 0,08 0,08 ( 0,5 ) Φ ( 5, ) 69,5% Φ 5 µ 0 ±3σ 0 α/ α/ Készítette: Erde János n 4 3, 3,3,98 3,3 β Φ Φ 0,04 0,04 ( ) Φ ( ),8% Φ 8 σ x ABH,86 cm 3 ABH,98 cm 3 FBH3, cm 3 FBH3,34 cm 3 0,08 0,

101 Feladat: Egy statsztka folyamatszabályozás során a szmmetrkus beavatkozás határokat 0 %-os kockázat sznt mellett alakították k. A folyamat normáls eloszlást követ, szabályozott állapotban N(90; 5) paraméterekkel. a.) Mekkora a másodfajú hba n elemű mntavétel mellett, ha a folyamat elállítódk. Az elállítódott folyamat eloszlása N(94; 9). b.) Végezze el az előző számítást n9 elemű mnta átlagára s. Feladat: σ Igazoljuk, hogy σ! x n 0

102 7. BECSLÉS Valószínűségszámítás Valószínűségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 0

103 Az előzőekben láthattuk, hogy az elmélet eloszlásokkal történő számoláshoz elsősorban azok paraméterenek smerete szükséges. A gyakorlatban egy adott probléma elemzésénél többnyre tapasztalatból tudjuk az eloszlás jellegét, de nem smerjük az eloszlás alakját pontosan meghatározó paramétereket. Tudjuk például, hogy a labdarúgó mérkőzéseken a gólok száma jó közelítéssel Posson-eloszlású. Ugyanlyen eloszlással írható le mondjuk a Tszán egy év alatt levonuló árhullámok száma, csak éppen más λ paraméterrel. Mnden majdnem mnden elmélet eloszlásnak van(nak) paramétere(), melyeket általában nem smerünk, azokat a ξ-re vonatkozó statsztka mntából kell közelítőleg meghatároznunk, becsülnünk, mert csak ezek smeretében tudunk a vzsgált jelenséggel kapcsolatos valószínűség kérdésekre válaszoln. A mntából számított mutatókat (átlag, szórás, stb.) a sokaság jellemzőkre való következtetésre, az smeretlen paraméterek becslésére (s) használjuk. Nem arról van tehát szó, hogy a mntából kszámoljuk az smeretlen paramétert. A mntából számolt mutatók értéke függnek a véletlentől, mntáról mntára változnak, így maguk s valószínűség változónak teknthetők. A mntából számolt mutatók eloszlását mntavétel eloszlásnak nevezzük. Annak megítélése, hogy a mntából számolt mutató (amt mnta statsztkának vagy rövden statsztkának s neveznek) mkor teknthető az smeretlen elmélet paraméter jó becslésének, többféle szempontból történhet. 7.. A BECSLÉS TULAJDONSÁGAI Tudjuk, hogy a sokaság paraméteret általában több statsztkával s becsülhetjük. Így pl. a várható értéket - normáls eloszlású alapsokaság esetében - a mntaátlaggal és a medánnal s becsülhetjük, a szórást a mnta szórásával, de a terjedelem segítségével s becsülhetjük stb. Természetesen felmerül a kérdés, hogy ezek közül melyk becslést kell választanunk. Hogy lyen esetekben a legmegfelelőbb becslést választhassuk, krtérumokat kell felállítanunk arra vonatkozólag, hogy mkor fogadjunk el egy becslést jónak, lletve mkor tartsuk jobbnak az egyk becslést a másknál. A statsztka becslés Fsher-féle krtérumat az alábbakban foglaljuk össze. Torzítatlan becslés: A legfontosabb tulajdonság, amt egy jónak mnősített becsléstől megkívánunk, hogy a becslés a szóban forgó paraméterérték körül ngadozzék. Pontosabban azt kívánjuk meg, hogy a becslés (az llető statsztka) várható értéke éppen a megfelelő paraméterérték legyen. Ha egy becslésre ez a követelmény teljesül, akkor torzítatlan becslésről beszélünk. Így pl. torzítatlan a becslés, ha a mntaátlagok várható értéke megegyezk az alapsokaság várható értékével: M ( x) M( ξ ), vagy a korrgált tapasztalat szórásnégyzet várható értéke az elmélet * varancával egyenlő: M( s ) D ( ξ ). Ez azonban nem gaz a tapasztalat szórásnégyzetre. A tapasztalat szórásnégyzet várható értéke (az elmélet varancát az egyszerűség kedvéért σ -el jelölve): n M( s ) σ σ. Az emprkus (tapasztalat) szórásnégyzet tehát elmélet varanca n n torzított becslése. Látható, hogy a torzítás mértéke függ a mntaszámtól, s a mntaszám növekedésével csökken. Az lyen tulajdonságú becsléseket aszmptotkusan torzítatlan becslésnek nevezzük. A torzítatlanság nem azt jelent, hogy egy adott mntából kapott becslés egyenlő az smeretlen paraméterrel, sőt arra sem ad feleletet, hogy a mntából kapott becslés értéke közel, vagy távol esk-e a valód paramétertől. A torzítatlanság esetében csupán abban lehetünk bztosak, hogy nncs semmféle szsztematkus, egyrányú eltérés a becslés és a becsült paraméter között. A 7.. pontban található 3. ábra, 3. ábra, 33. ábra, és 34. ábra a STATISTICA for Wndows programmal készült 03

104 Feladat: Vzsgáljuk meg n3 elemű statsztka mnták alapján a kockadobás tapasztalat és korrgált tapasztalat szórását. Korábban már meghatároztuk a kockadobás elmélet szórását, s azt találtuk, hogy D(ξ),7). A kísérletet 50-szer megsmételve a számított tapasztalat ll. korrgált tapasztalat szórásokat a 3. ábra láthatjuk. 3.0 n3 elemû mnták szórása.5.0,73.5, T_SZ3 K_TSZ3 3. ábra: Tapasztalat szórások összehasonlítása Az ábrán folytonos vonal mutatja a tapasztalat ll. szaggatott vonal a korrgált tapasztalat szórásokat a mntaszám függvényében. Vízszntes folytonos vonallal jelöltük a kétfajta szórás (50-50 elem) átlagát. A korrgált tapasztalat szórások átlaga,73, a tapasztalat szórásoké,4. Jól látható, hogy a korrgált tapasztalat szórások az elmélet (,7) szórás körül ngadoznak (átlaguk közel esk az elmélet értékhez), míg a tapasztalat szórások átlaga,4, jóval nagyobb az eltérés az elmélet értéktől. Konzsztens becslés: Konzsztensnek (összetartónak) nevezzük a becslést akkor, ha ngadozása a becsült paraméter körül a mnta elemszámának növelésével egyre csökken. A korábbakban láttuk, hogy a számtan σ átlag torzítatlan becslése a várható értéknek, s szórása σ. Nylvánvaló, hogy n esetén x n σ 0, vagys a számtan átlag konzsztens becslése a várható értéknek. x Feladat: Az előző példához hasonlóan kevésbé matematka módon, tapasztalat adatokból vzsgáljuk meg a kockadobás esetén a két emprkus szórás vselkedését a mntaszám növekedésének függvényében. A 3. ábra mutatja a kapott eredményeket. Az ábrán folytonos vízszntes vonal jelz az elmélet értéket [D(ξ),7]. Az ábrából egyértelműen látszk, hogy a mntaszám növekedésével mnd a korrgált tapasztalat, mnd a tapasztalat szórás az elmélet érték körül ngadozk (torzítatlan ll. aszmptotkusan torzítatlan becslés), s az ngadozás mértéke a mntaszám növekedésével egyre ksebb (konzsztens a becslés). 04

105 Kockadobás szórása T_SZ_ K_T_SZ 3. ábra: Kockadobás szórása a mntaszám függvényében (n00) Megfgyelhetjük, hogy kb elemű mnták esetén a különbség a két szórás között, már gyakorlatlag elhanyagolható. A 33. ábra csak az első 50 adatot ábrázolva, a két szórás között különbség jobban megfgyelhető. Kockadobás szórása T_SZ_ K_T_SZ 33. ábra: Kockadobás szórása a mntaszám függvényében (n50) Hatásos becslés: Két becslés összehasonlításakor a hatásosság vagy más néven effcenca krtéruma alapján döntjük el, hogy a kettő közül melyk a jobb. A hatásosságot nagyon fontos becslés krtérumnak tekntjük. Két becslés közül a kevésbé ngadozót nevezzük hatásosabbnak. Az ngadozás mértéke a szórás, ezért a becslések ngadozását s a szórásukkal jellemezzük. Tehát két becslés közül a ksebb szórású becslést tekntjük hatásosabbnak, jobbnak. Gyakran előfordul, hogy a torzítatlan becslések között van olyan, amelyknek a szórása az összes több becslés szórásánál ksebb (adott n mellett). Ekkor ezt a mnmáls szórású, torzítatlan becslést hatásosnak nevezzük, és a több becslés hatásfokát ehhez mérjük. 05

106 Feladat: Tapasztalat adatokból hasonlítsuk össze (n5 elemű mnták alapján) a kockadobás átlagát és medánját. A kísérletet 50-szer megsmételve, a mnták átlagat és medánjat a 34. ábra mutatja. 6.5 n5 elemû mnták átlaga és medánja ATL MED 34. ábra: Kockadobás átlaga és medánja Az ábrán szaggatott vonallal összekötve a négyzetek a medánokat, s folytonos vonallal összekötve körök jelölk az egyes mnták átlagat. Vízszntesen behúzott folytonos vonal a várható értéket mutatja (M(ξ) 3,5). Megfgyelhetjük, hogy a medán s és az átlag s az elmélet érték körül ngadozk (torzítatlan becslések), ugyanakkor az átlagok eltérése, ngadozása ksebb, mnt a medánoké. Kszámolva a két adatsor korrgált tapasztalat szórásat, az eredmények az alábbak: s * átlag 0, 794 ; s * medán,30. Az átlag szórása valóban ksebb, mnt a medáné, az adatok alapján kb. 40%-kal. Az átlag tehát hatásosabb becslés, mnt a medán. Elégséges becslés: Egy becslés elégséges, ha az lényegében mnden nformácót tartalmaz a paraméterre vonatkozóan. Ez más szóval annyt jelent, nncs más olyan becslés, amelyk a paraméterről több nformácót szolgáltatna, mnt az elégségesnek mnősülő becslés. 06

107 7.. A PONTBECSLÉS MÓDSZEREI Az eddgek során s használtunk különféle becslőfüggvényeket pontbecslés céljára, de ezeket csak ösztönösen választottuk. Így természetesen adódott, hogy pl. a várható értéket a mntából számított átlaggal vagy más középértékkel becsüljük. Ez az ún. analóga elve, am azt jelent, hogy a mntából a becsülendő jellemzővel megegyező tartalmú mutatót számítunk k, és ennek segítségével becsüljük a megfelelő sokaság jellemzőt. Léteznek azonban olyan általános elvek, módszerek, amelyek segítségével olyan esetekben s tudunk jó tulajdonságú becslőfüggvényeket készíten, amkor a megérzés vagy az analóga már nem segít. A legegyszerűbb grafkus becslést kvéve nem célunk ezek részletes smertetése, csak rövden felsoroljuk, lletve smertetjük lényegüket. Maxmum-lkelhood módszer (a legnagyobb valószínűség elve): az eljárás lényege az ún. lkelhood függvény felállítása, amely nem más, mnt a mntaelemek együttes sűrűségfüggvénye, s az smeretlen paraméter becslésére azt a statsztkát használjuk, melyre ez a függvény maxmáls értéket vesz fel. Ez az egyk legjobb és leggyakrabban alkalmazott eljárás. Legksebb négyzetek módszere nem pusztán a statsztka becslésre szolgáló eljárás, hanem alkalmazható más becslés feladatok megoldására s. A módszer lényege, hogy egy elmélet modellnek (ez lehet egy eloszlás vagy sűrűségfüggvény, de lehet egy egyszerű konstans függvény s) a paraméteret határozza meg úgy, hogy a tényleges és a becsült paraméterekkel llesztett modellek négyzetes eltérése, azaz az eltérések négyzetösszege mnmáls legyen (pl.: regresszó-számítás). Momentumok módszere abban áll, hogy ha k számú paramétert akarunk becsüln, akkor az eloszlás első k számú elmélet momentumát egyenlővé tesszük a mntából számított tapasztalat momentumokkal. Így az smeretlen paraméterekre egyenletrendszert nyerünk, amely kedvező esetben megoldható. Grafkus paraméterbecslés az előző matematka eljárásokhoz képest, ez nkább a gyakorlat számára könnyebben kezelhető eljárás. Bár pontossága természetesen a grafkus ábrázolás adta lehetőségektől függ, de egyszerűsége matt sokszor jól használható. Lényege, hogy valamlyen módon (többnyre logartmzálással) lnearzáljuk az eloszlásfüggvényt, s az adatokat grafkusan ábrázolva az egyenes meredekségéből és/vagy tengelymetszetéből következtetünk az eloszlás smeretlen paraméteré(e)re. Exponencáls eloszlás paraméterének grafkus becslése: Az exponencáls eloszlást vszonylag egyszerűen kegyenesíthetjük. Az eloszlás eloszlásfüggvénye: λx F( x ) e. Mndkét oldalból -et kvonva, --el megszorozva, majd az egyenletet logartmzálva és újra megszorozva -gyel, az alább összefüggést kapjuk: -ln[-f(x)] λx Ha x függvényében ábrázoljuk a baloldalon lévő kfejezést, egy egyenest kapunk, melynek tengelymetszete 0, s ránytangense (meredeksége) éppen az smeretlen λ paraméter. (35. ábra) 07

108 -ln[-f(x)] α tgα λ x 35. ábra: Exponencáls eloszlás λ paraméterének grafkus becslése Normáls eloszlás paraméterenek grafkus becslése: Normáls eloszlás eloszlásfüggvényének kegyenesítése már nem végezhető el egyszerű logartmzálással, mvel az eloszlásfüggvénynek elem függvényét nem smerjük. Specáls beosztású ordnátatengelyű koordnátarendszert alkalmazva azonban az eloszlásfüggvény képe lnearzálható. A függőleges tengelyen az eloszlásfüggvény értéket ábrázoljuk úgy, hogy az eloszlásfüggvény középértékéből (0,5) kndulva az egységny távolság szórásny legyen. Az egyszerűség kedvéért ábrázoljuk most a standard normáls eloszlás eloszlásfüggvényét. Tudjuk, hogy a függvény ( 3), (-), (-), 0,,, 3 helyen felvett értéke a következők 0,0035; 0,08; 0,587; 0,5; 0,843; 0,977 és 0, Ábrázoljuk ezeket a pontokat úgy, hogy a Φ() egy távolságegységgel feljebb, a Φ(-) egy távolságegységgel lejjebb, a Φ() távolságegységgel feljebb, a Φ(-) távolságegységgel lejjebb stb. kerüljön, mnt a Φ(0) 0,5. Az ordnáta tengely skálázása ezáltal egyenlőtlen lett, vszont így a Φ(u) függvény képe egyenes, ahol nylván a több érték s ezen az egyenesen fekvő pontot határoz meg (36. ábra) 0,998 0,97 0,84 0,5 0,08 0,5 0, ábra: Gauss-papíros ábrázolás 08

109 Ha az x tengelyt most átskálázzuk (-3 helyébe -3σ, - helyébe -σ stb. kerül), akkor az előző pontok egy 0 várható értékű, σ szórású normáls eloszlású változó eloszlásfüggvényének a pontja. Végül toljuk el az ordnátatengelyt eredet helyzetével párhuzamosan az x tengely mentén -µ egységgel. Az így kapott koordnátarendszerben a µ várható értékű σ szórású normáls eloszlású változó F(x) eloszlásfüggvényének képe egyenes. Ha a mnta adata alapján kapott tapasztalat eloszlásfüggvényt az előbb koordnátarendszerben (un. Gauss-papíron) ábrázoljuk, normáls eloszlás esetén a pontok közelítőleg egy egyenesre esnek. Behúzva az egyenest, a normáls eloszlás tulajdonságat smerve becsülhetjük az smeretlen paramétereket. Az egyenes és a függőleges tengely (ll. gyakrabban az y 0,5 ordnáta érték) metszéspontjánál leolvasva az x tengely értékét kapjuk az eloszlás µ paraméterét. A 0,587 ll. a 0,843 y érték és az egyenes metszéspontjánál pedg a µ-σ ll. a µ+σ értékeket olvashatjuk le az x tengelyen, amből a µ smeretében σ könnyen meghatározható INTERVALLUMBECSLÉS A becslésről szóló eddg fejtegetésenk során az eloszlás valamely smeretlen paraméterét egyetlen mennységgel, a mntaelemekből számított statsztka numerkus értékével, tehát egyetlen számadattal becsültük, azaz pontbecslést alkalmaztunk. Mvel a mntából számolt statsztka s valószínűség változó, aktuáls értéke általában eltér a becsült paramétertől. Ha sokszor (sok n-es mntából) végezzük a becslést, akkor a mntastatsztka értéke torzítatlan becslés esetén az elmélet érték körül szóródnak. A szóródás mértéke természetesen függ a mnta nagyságától. Bár egyetlen mntából nem tudjuk megmondan a becsült paraméter pontos értékét, a mntastatsztka eloszlásának smeretében (ezeket neveztük mntavétel eloszlásoknak) sokszor meg tudunk adn egy olyan ntervallumot, amely az smeretlen paramétert nagy mondjuk 95 %-os valószínűséggel tartalmazza. Az lyen ntervallumot az adott paraméterre vonatkozó 95 %-os konfdenca-ntervallumnak (megbízhatóság ntervallumnak) nevezzük. A továbbakban a különböző paraméterekre vonatkozó ntervallumbecsléssel foglalkozunk. Konfdenca-ntervallum a normáls eloszlás várható értékére smert alapsokaság szórás esetén: Tegyük fel, hogy a ξ valószínűség változó N(µ;σ) eloszlású, ahol σ szórás smert. A µ paramétert statsztka mntából a számtan átlaggal becsüljük. Tudjuk, hogy az átlag eloszlása (mntavétel σ eloszlás) szntén normáls eloszlású M ( x ) µ várható értékkel, és σ szórással. A normáls x n eloszlás smert tulajdonsága, az ún σ-szabály alapján az átlag értéke 95,44% valószínűséggel a σ σ várható érték ± szórás tartományba, vagys a µ, µ + ntervallumba esk: n n σ σ P µ < x < µ + 0,9544. n n Ha smernénk tehát a µ várható értéket, és a számegyenesen megrajzolnánk a fent ntervallumot, akkor az n elemű mnták számtan közepét kszámolva 00 esetből kb. 95 mntaközép ebbe az ntervallumba esk. Sajnos azonban µ értékét nem smerjük (éppen ezt szeretnénk becsüln), a fent ntervallumot nem tudjuk megrajzoln. Rendezzük át az összefüggést a következő formára: σ σ P x < µ < x + 0,9544. n n 09

110 Ezen összefüggés valószínűségelmélet értelme a következő. Az smeretlen µ paraméter nem valószínűség változó, hanem egy állandó, a számegyenes egy adott pontja. Valószínűség változó σ σ vszont az x,x + ntervallum két végpontja. Azaz annak a valószínűsége, hogy ez a n n véletlen helyzetű ntervallum tartalmazza (lefed) a µ pontot, közelítőleg 95 %. (37. ábra) µ 37. ábra: Konfdenca-ntervallumok a µ várható értékre σ σ Az x,x + ntervallumot a normáls eloszlás várható értékére vonatkozó 95 %-os n n (pontosabban 95,44 %-os) konfdenca ntervallumnak nevezzük. Természetesen nemcsak 95 %-os ntervallumot lehet szerkeszten. Ha a sokaság elmélet szórása smert (σ), akkor az átlag mntavétel eloszlása alapján tetszőleges kcsny α > 0 számhoz meghatározható olyan u α/ mennység, hogy a ( x < µ < + ) α. σ σ P x uα / < µ < x + uα / P x n n σ σ Normáls eloszlás esetén tehát az x uα /,x + uα / ntervallum (-α) szntű konfdenca n n ntervallum a µ várható értékre. Adott eloszlás esetén mnél nagyobb a megbízhatóság sznt (-α), annál szélesebb ntervallumot kapunk. Nagy bztonsággal csak vszonylag hosszabb ntervallumról állíthatjuk, hogy valóban tartalmazza az smeretlen paramétert. Mnt látható az ntervallum hossza függ még a mnta nagyságától és az alapsokaság (σ) szórástól. 0

111 Az eddgekben csak kétoldal ntervallumról beszéltünk, mvel a gyakorlatban ez az elterjedtebb. Ha csak alsó vagy csak felső határokat kívánunk becsüln, akkor a követendő eljárás az eddgekhez hasonló lesz. A részletek mellőzésével belátható, hogy felső korlát esetén σ P µ < x + uα α kapható, ahol u α a standard normáls eloszlás táblázatból kereshető k. n σ Azaz annak a valószínűsége, hogy az smeretlen sokaság paraméter az x + uα érték alá esk, -α. n σ Hasonló módon az alsó korlátra a P µ > x uα α összefüggést kapunk. n Feladat: ROM chpek előállításánál az égetőkemence maxmum hőmérsékletét vzsgálták. Korább vzsgálatok alapján tudják, hogy a folyamatban a maxmum hőmérsékletek elmélet szórása C. A vzsgálat céljára 8 elemű véletlen mntát vettek és az átlag hőmérséklet 49 C-ra adódott. Adjunk 95%-os sznten ntervallumbecslést a kemence hőmérsékletének várható értékére! n 8 x 49 C σ C ε 0,95 α 0,05 kétoldal becslés: α/ 0,05 u α/,96 behelyettesítve a fent összefüggésbe: 49,96 < µ < 49 +,96, ,68 < µ < 500,3 A ROM chpek érzékenysége matt a chpeket nem szabad tartósan túl magas hőhatásnak ktenn, ezért a technológát úgy kell beállítan, hogy a hőmérséklet hosszabb távon ne haladja meg az 500 C-ot. A mnta alapján 95%-os megbízhatósággal teljesít-e ezt a feltételt az égetőkemence? n 8 x 49 C σ C ε 0,95 α 0,05 egyoldal becslés u α,645 σ µ < x + uα 49 +, C n 8

112 Feladat: Az Egs részvény n59 hav adatából az USD-ben megadott hozam átlaga: x 3,57%, szórása: σ6,7%. Adjunk 95ó %-os sznten ntervallumbecslést a hozam várható értékére! Konfdenca-ntervallum a normáls eloszlás várható értékére smeretlen alapsokaság szórás esetén: Ebben az esetben továbbra s feltételezzük, hogy a sokaság N(µ;σ) eloszlású, de sem µ-t sem σ-t nem smerjük. A problémát ezúttal az okozza, hogy bár az átlag továbbra s normáls eloszlású, de az elmélet szórás nem smert, így kénytelenek vagyunk a szórást a mntából becsüln (s*). Ennélfogva az x µ x µ helyett kénytelenek vagyunk a változót használn. Ez vszont már nem normáls * σ n s n eloszlású, hanem t- (Student-) eloszlású valószínűség változó, DF n- szabadságfokkal. A Student-eloszlás a normáls eloszláshoz hasonlóan szmmetrkus eloszlás, az eloszlás egy paramétere az ún. szabadságfok (DF) jellemz. A t-eloszlás smeretében nézzük tehát az ntervallumbecslés határanak meghatározását. Az előző esethez képest csak anny a különbség, hogy normáls eloszlás helyett a t-eloszlást kell alkalmaznunk. * * s s P x tα / ( DF ) < µ < x + tα / ( DF ) α n n A t α/ (DF) értéket a DF n- szabadságfokú t-eloszlás táblázatából kereshetjük k. Az s* az eddgeknek megfelelően a korrgált tapasztalat szórást jelöl.

113 Feladat: Tegyük fel, hogy az előző - ROM égetőkemencés példánál nem smerjük az elmélet szórást, de továbbra s tudjuk, hogy a maxmum hőmérsékletek normáls eloszlással írhatók le. A nyolc elemű mnta korrgált tapasztalat szórása s* 4,5 C, az átlag továbbra s 49 C. Adjunk becslést 95%-os megbízhatóság sznten a kemence hőmérsékletének várható értékére! n 8 x 49 C s* 4,5 C DF n 8 7 ε 0,95 α 0,05 kétoldal becslés: α/ 0,05 t α/,365 4,5,5 49,365 < µ < 49 +,365, ,4 < µ < 495,76 Feladat: Az Egs részvény várható értékére vonatkozó becslést végezzük el smeretlen alapsokaság szórás esetén s! 3

114 Számításankat a MINITAB szoftver eredményevel s összevethetjük (38. ábra). 38. ábra: Konfdenca-ntervallum az Egs hozam várható értékére Sokaság arány becslése: A vzsgált egyedek (pl. a férfak aránya a népességen belül, a selejtes termékek aránya stb.) sokaság arányát jelöljük nagy P-vel. Ennek torzítatlan (pont)becslése a p k/n relatív gyakorság, ahol n a mntaszám, k a mntában talált kedvező esetek száma. Mvel n rögzített (nem valószínűség változó), k bnomáls eloszlást követ, így p s bnomáls eloszlású lesz, M(p) P várható értékkel és D (p) P(-P)/n varancával. Mvel az elmélet varanca eleve smeretlen az s p p(-p)/n értékkel becsüljük. A mntából számított p smeretében a bnomáls eloszlás táblázatából könnyen megkaphatjuk a keresett ntervallumot. Ezt az eljárást azonban a gyakorlatban rtkán alkalmazzuk, mert dszkrét jellege meglehetősen pontatlanná tesz. Bzonyos feltételek mellett a bnomáls eloszlás jól közelíthető normáls eloszlással. Ha például p közel van 0,5-hez, akkor már n 0 elemű mnta s elegendő a normáls közelítéshez. Ekkor a kétoldal konfdencantervallum: p( p ) p( p ) p uα / < P < p + uα / α n n P 4

115 Feladat: A Felvllanyozzuk Kft. nap termeléséből vett n00 elemű mntában a hbás égők száma 4 db. 95%-os megbízhatóság sznt mellett adjunk ntervallumbecslést a sokaság arányra. n 00 p 4/00 0, ε 0,95 α 0,05 kétoldal becslés: α/ 0,05 u α/,96 0,,96 Sokaság varanca becslése: 0, 0,88 < P < 0, +, ,075 < P < 0,65 0, 0,88 00 Ebben a részben a normáls eloszlású sokaság szórásnégyzetének ntervallumbecslését mutatjuk be. Ha a sokaság eloszlása nem normáls, akkor még nagy mnták esetén sem érvényes az tt következő ntervallumbecslés. A σ (pont)becslésére használt tapasztalat és korrgált tapasztalat szórásnégyzetek közelítőleg az ún. χ -eloszlással írhatók le. A χ -eloszlás jellemzőt, alakját egy paramétere a t-eloszláshoz hasonlóan a szabadságfok határozza meg. Különböző χ -eloszlásokat mutat a 39. ábra. Sajnálatos módon az eddg megszokott, kényelmes mntavétel eloszlásoktól eltérően, a χ -eloszlás csak poztív értékekre van értelmezve, nem szmmetrkus, de ettől eltekntve ugyanúgy használhatjuk ntervallumbecslésre, mnt a standard normál ll. a t-eloszlásokat. A szabadságfok növekedésével az eloszlás közelít a normáls eloszláshoz, amt a későbbekben a konfdenca ntervallumok meghatározásánál s khasználunk. f(x) 0.5 Ch-négyzet eloszlás sûrûségfüggvénye 0.4 DF DF 4 DF x ábra: χ -eloszlás sűrűségfüggvénye 3 Mvel az eloszlás nem szmmetrkus, kétoldal becslés esetén az eloszlás alsó és felső oldalán kjelölt α/ valószínűség nem egyforma hosszúságú ntervallumokat jelent, ennélfogva az előzőekben vzsgált esetekkel ellentétben a konfdenca-ntervallum nem lesz szmmetrkus a pontbecslésre. Normáls eloszlású valószínűség változó smeretlen varancájának megbízhatóság ntervallumát az alább összefüggéssel határozhatjuk meg: * * ( n ) s ( n ) s P < σ < α χ. α / χα / 3 Készült a STATISTICA for Wndows program segítségével 5

116 A χ α / és a χ α / értékeket a DF n- szabadságfokú χ táblázatból lehet meghatározn. Ha a konfdenca-határokat az eloszlás elmélet szórására szeretnénk vonatkoztatn, akkor mndkét határ poztív előjelű négyzetgyökét kell képeznünk. Ha σ becslését a tapasztalat szórással végezzük, akkor a számlálóban (n-) helyett n-nel szorozzuk a szórást. Feladat: A Felvllanyozzuk Kft. karácsonyfa égőnek élettartamát n 6 elemű mntából vzsgálva azt találták, hogy az élettartamok korrgált tapasztalat szórása 0 óra. Határozzuk meg az égők varancájára ll. szórására vonatkozó 95%-os konfdenca-határokat! n 6 s* 0 óra DF n 6 5 ε 0,95 α 0,05 kétoldal becslés: α/ 0,05 -α/ 0,975 ( 6 ) 0 ( 6 ) 7,5 < σ < 54,5 < σ < 39,6 7,38 < σ < 5,5 0 6,6 Nagy szabadság fok (nagy mntaszám) esetén a χ -eloszlás közelíthető normáls eloszlással. Ha a mntaszám n>30, akkor felhasználva azt az eredményt, hogy a ( χ DF ) mennység közelítőleg standard normáls eloszlású változó, adott α valószínűséghez tartozó χ α értéke kfejezhető a standard normáls eloszlás u α értékéből: χ ( u + DF ) α α. Feladat: Tegyük fel, hogy az előző példában említett vzsgálatot n50 elemű mntából végezték. 95 %-os megbízhatóság sznten mlyen ntervallumban található az elmélet szórás? n 50 s* 0 óra DF n ε 0,95 α 0,05 kétoldal becslés: α/ 0,05 -α/ 0,975 ( 50 ) 0 ( 50 ) 7,4 < σ < 0 3,4 68,6 < σ < 5, 8,8 < σ <,3 Mvel n elég nagy, ezért a χ értékeket normáls eloszlással közelítve azt kapjuk, hogy (, ) 70, 9 χ 0,975 ll. (, ) 3, 9 χ 0,05. Ezeket behelyettesítve a konfdenca-határok képletébe a szórásnégyzetre ll. szórásra az alább ntervallumok adódnak. 69, < σ < 53,6 és 8,3 < σ <,4. 6

117 8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 7

118 8.. A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE Statsztka hpotézsen a vzsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere()re vonatkozó valamlyen feltevést értünk. Ha ennek ellenőrzésére (ll. bzonyítására) mntát használunk, akkor statsztka hpotézsvzsgálatról (statsztka próbáról) beszélünk. Ebben az esetben mvel a mnta csak része a sokaságnak, de nem azonos vele az első- és másodfajú hba elkövetésének lehetősége mndg fennáll. Attól függően, hogy a feltételezésünk (hpotézsünk) mre vonatkozk, a statsztka próbák két csoportját különböztethetjük meg. Ha a vzsgált valószínűség változó eloszlása smert, de smeretlen paraméter(eke)t tartalmaz, akkor a hpotézsvzsgálat az smeretlen paraméter(ek)re rányul. (Például a Gauss eloszlás µ paraméterére, azaz az eloszlás várható értékére.) Ekkor paraméteres próbáról beszélünk. Ha az eloszlás típusa nem smert, akkor a feltevés magára az eloszlásra vonatkozk. (Például két vagy több valószínűség változó eloszlása megegyezk-e; vagy feltehető-e, hogy a valószínűség változó adott eloszlással írható le.) A hpotézsvzsgálatoknak ezt a csoportját nemparaméteres próbáknak nevezzük. A hpotézsvzsgálatok általános menetét rövden az alábbakban vázolhatjuk: Szakma megfontolások alapján felállítjuk az gazolandó hpotézst. Kválasztjuk a legmegfelelőbb statsztka próbát. Felállítjuk az un. nullhpotézst - jelölése: H 0 - (ez gyakran, főleg a paraméteres próbáknál, a szakma feltételezés ellentéte) és az un. alternatív vagy ellenhpotézst jelölése: H. A hpotézseket úgy kell megfogalmazn, hogy egyszerre ne lehessenek gazak, így a nullhpotézsről hozott döntésünk közvetetten a H -re vonatkozó döntést s jelent. Mnd a null-, mnd az ellenhpotézs lehet egyszerű és összetett hpotézs. Egy hpotézst egyszerűnek mondunk, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá tesz. Egyszerű hpotézsre példa: M(ξ) µ 500 C, mert normáls eloszlásról lévén szó, a szórást smerjük, így µ értéke az eloszlást egyértelműen meghatározza. A 450 C < M(ξ) µ < 500 C állítás ellenben összetett hpotézs, mert a hpotézst mndazon σ szórású normáls eloszlások kelégítk, amelyek várható értéke 450 és 500 között van; A továbbakban azt tételezzük fel, hogy a nullhpotézs egyszerű, az ellenhpotézs pedg mndg összetett. Meghatározzuk az elsőfajú hbát (szgnfkanca szntet), a mntanagyságot, és végrehajtjuk a mntavételt. Meghatározzuk az előző pontban választott feltételek mellett elfogadás, ll. elutasítás (krtkus) tartományokat. Elfogadás tartománynak nevezzük azt a tartományt, amelybe a nullhpotézs fennállása esetén α szgnfkanca sznt mellett a statsztka jellemző számított értéke legalább ε -α valószínűséggel kerül. Az elutasítás tartomány vszont az, amelybe a nullhpotézs fennállása esetén, α szgnfkanca sznt mellett a jellemző számított értéke legfeljebb α valószínűséggel kerülhet. A krtkus tartomány lehet egyoldal vagy kétoldal (40. ábra). Kétoldal krtkus tartomány felvételére akkor kerül sor, ha a nullhpotézsben feltételezett helyzettől való eltérés ténye érdekel bennünket, s az eltérés ránya nem. Egyoldalú tartományt pedg akkor alkalmazunk, ha a H 0 -ban rögzített állapottól való meghatározott rányú eltérésre számítunk. 8

119 elfogadás elutasítás 40. ábra: Krtkus tartományok egy- és kétoldal esetben Meghatározzuk a próbához szükséges jellemző számított értékét; A becsléselmélethez hasonlóan a mnta adataból egy meghatározott összefüggés (próbafüggvény) felhasználásával meghatározunk egy számértéket, amely H 0 és bzonyos kndulás feltételek fennállása esetén adott elmélet eloszlást követ, így értéke csak ks valószínűséggel (α) esk a krtkus tartományba. Megvzsgáljuk, hogy a jellemző számított értéke az elfogadás, lletve az elutasítás tartományba esk-e, és ez alapján döntünk a nullhpotézs elfogadásáról vagy elutasításáról (4. ábra). Statsztka próbák elve f(χ ) P(χ szám< χ krt(α) H 0 gaz) - α ε DF (szabadság fok) ε - α α χ szám χ krt χ szám χ Készítette: Erde János 4. ábra: Döntés a nullhptézsről Értelmezzük az előző pont eredményét a szakma hpotézsre, és megtesszük a konkrét ntézkedéseket a gyakorlatban. A hpotézsvzsgálat logkája szernt tehát azt vzsgáljuk meg egy adott próbával, hogy a mntából kapott eredmény eltérése a hpotézstől a véletlennek tulajdonítható-e, vagy az eltérést a ténylegesen fennálló különbség okozza. Ha a mntából számított érték az elfogadás tartományba esk, akkor az adott szgnfkanca sznten, az adott mnta (mnták) alapján az eltérést a véletlennek tulajdonítjuk, azaz statsztkalag nem tartjuk szgnfkánsnak. Meg kell azonban jegyeznünk, hogy a statsztkalag szgnfkáns eltérés nem azonos a gyakorlatlag jelentős eltéréssel. Lehet, hogy egy adott vzsgált eltérésre mndkettő fennáll, de lehet, hogy csak az egyk. Előfordulhat például, hogy egy statsztkalag szgnfkáns eltérés gyakorlatlag nem mnősül jelentősnek, ll. fordítva. 9

120 8.. ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL Az olyan statsztka próbát, amelynek alapján arról döntünk, hogy valamely ξ valószínűség változó eloszlása lehet-e adott F(x) eloszlásfüggvénnyel jellemzett eloszlás, lleszkedésvzsgálatnak nevezzük. Ilyenkor a H 0 nullhpotézs: H : F( ) 0 x Ha a nullhpotézs az eloszlás paraméterenek smeretét s feltételez, akkor tszta lleszkedésvzsgálatról beszélünk. Ha vszont hpotézsünk csak az eloszlás jellegét (normaltás, exponencaltás stb.) tételez fel, és a paramétereket a mntából kell becsülnünk, akkor becsléses lleszkedésvzsgálatot végzünk. Az lleszkedésvzsgálatra szolgáló próbák alkotják a nemparaméteres próbák egyk nagy csoportját. E próbák közül legelterjedtebb a χ -próba és a Kolmogorov-próba. A χ -próba mnd dszkrét, mnd folytonos eloszlások esetében alkalmazható, de nagy mntaelemszámot gényel. A próba segítségével azt tudjuk eldönten, hogy adott szgnfkanca sznten a tapasztalat gyakorságok szgnfkánsan eltérnek-e a feltételezett elmélet gyakorságoktól, avagy az eltérés csupán a véletlen következménye. χ -próbával történő lleszkedésvzsgálatnál az un. próbastatsztkát (a számított értéket) az alább képlet szolgáltatja: r ( f F ) χ sz F DF r l ahol: DF: a szabadságfok, az eloszlás paramétere f : a tapasztalat gyakorság F : az elmélet gyakorság l : a becsült paraméterek száma Feladat: A Tszán egy adott dőszakban levonuló árhullámok számát vzsgálva az elmúlt 68 év során az alább eredményeket kapták: 30 év volt amkor nem volt árhullám, 5 olyan év volt, amkor árhullám vonult le az adott dőszakban, 9 év volt amkor és 4 olyan év volt, amkor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Possoneloszlással? árhullámok száma 0 3 v. több gyakorság [db] λ? nem smerjük a mntából kell becsülnünk Posson-eloszlás esetén M ( ξ ) λ x 55 Mvel az elmúlt 68 év során a kérdéses dőszakban összesen 55 árhullám volt: λ 0,

121 Nullhpotézs felállítása: H 0 : az árhullámok száma λ0,8 paraméterű Posson-eloszlású H : az árhullámok száma nem λ0,8 paraméterű Posson-eloszlású Mntavétel, adatok feldolgozása, krtkus érték meghatározása: Ha az árhullámok száma valóban λ 0,8 paraméterű Posson-eloszlással írható le, akkor annak valószínűsége, hogy az adott dőszakban nem lesz árhullám (Posson-eloszlás táblázatából) 0,4493, árhullám levonulásának valószínűsége: 0,3595, -nek: 0,438, és annak, hogy 3 vagy több árhullám vonul le (-az eddg valószínűségek összege): 0,0474. Az elmélet gyakorságok ebből már automatkusan adódnak, hszen ha 0,4493 valószínűséggel nncs árhullám az adott dőszakban, akkor ez elméletleg 68 év során összesen 68 0, ,55 alkalommal következk be. Hasonló módon a több elmélet gyakorságot kszámolva az eredményeket az alább táblázat tartalmazza: DF r l 4 α 5% táblázatból: χ 5, 99 K f k p k F k , ,55 5 0,3595 4,45 9 0,438 9,78 3 v. több 4 0,0474 3, Σ elm Számított érték meghatározása: χ sz ( 30 30,55) 30,55 0, ,45 0, 78 9, 78 0, , 0,7 A számított és a krtkus érték összehasonlítása: χ elm Döntés a nullhpotézsről: 5,99 >> χszám 0,7 Mvel a számított érték jóval ksebb, mnt a krtkus érték- vagys a számított érték az elfogadás tartományba esk, ezért 95%-os megbízhatóság sznten nncs okunk a H 0 -t elutasítan. A folyón levonuló árhullámok száma modellezhető λ0,8 paraméterű Posson-eloszlással.

122 Feladat: A 3. fejezetben megsmerkedtünk a BUX 5 éves dőszak alatt hav hozamértékenek (%) tapasztalat eloszlásával. Leírható-e az eloszláskép N(3,9;,05) elmélet eloszlással? Ennek a vzsgálatnak a későbbek során (lásd. Korrelácó- és regresszó-számítás) meghatározó jelentősége lehet. A számításokat a Qualty and Mathematcs szoftver segítségével végeztük el, amelyet a ma Menedzsment és Vállalatgazdaságtan Tanszék elődjén, az Ipar Menedzsment és Vállalkozásgazdaságtan Tanszéken fejlesztettek k. 4. ábra: A χ -próba számítása Ugyancsak bemutatjuk a Statstca for Wndows szoftver eredménylapját s, amely a Kolmogorov- Szmrnov próba eredményét s közl. Varable BUX% eloszlás: Normal (buxndex.sta) Kolmogorov-Smrnov d.09095, p n.s. Ch-Square:.68698, df, p.7688 (df módosított) observed freq-cy cumulatv observed percent observed cumul. % observed expected freq-cy cumulatv expected percent expected cumul. % expected observdexpected < Infnty Táblázat

123 Feladat: Egy krtkus termékjellemző vzsgálatára vett n60 elemű mntában x 3,36cm 3, Származhat-e a mnta normáls eloszlásból? * s 0,083cm 3. Osztályok f P ( x A ξ xf ) F k k ( f F ) 3,00 3,0 0,003 0,9 3,34 3,0 3,0 4 0,063 3,68 0,03 3,0 3,30 5 3,30 3,40 7 0,4366 6,0 0,0 3,40 3,50 0 0,683 0,0 0,00 3,50 3,60 3 0,080,08 3,40 Σ 60, ,55 k F k k 3

124 9. HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 4

125 9.. AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA A normáls eloszlású sokaság varancájára (szórására) vonatkozó H 0 : σ σ 0 hpotézst a χ ( n ) s * sz σ 0 próbastatsztkával vzsgálhatjuk, ahol n a mntaszám, s* pedg a mntából számolt korrgált tapasztalat szórás. A próba alkalmazása során különösen fontos a sokaság normaltására vonatkozó feltétel betartása. Ekkor, H 0 fennállása esetén a fent próbafüggvény n- szabadságfokú χ -eloszlást követ. A nullhpotézst egy- és kétoldal módon s vzsgálhatjuk. Fgyelembe véve a χ -eloszlás már smert sajátosságat, a próba krtkus tartománya az alábbak: H H H : σ > σ 0 χszám > χ α : σ < σ 0 χszám < χα : σ σ 0 χszám < χα / vagyχszám > χ α / Feladat: A sör töltés folyamatában a töltés szntre vonatkozó szabványelőírások betartása matt a betöltött mennység mellett, fontos paraméter a töltés sznt ngadozása s. Ezért a mnőségbztosítás osztály előírása szernt a töltés sznt szórásának ml alatt kell lenne. Ennek ellenőrzésére a töltőüzem mnőségellenőre n 0 elemű mntát vett a folyamatból és kszámolta a mnta szórását: s*,5 ml. Feltehető-e 5%-os szgnfkanca sznten, hogy a töltés folyamat szórása nem ér el ml-t? n 0 s,5ml s 6,5ml H H 0 : σ 4ml : σ > 4ml (valójában a nullhpotézsünk σ 4 ml ) α 5%, DF n 0 9 χ elfogadás tartomány: α 6,9 > χszám 6,9 9 6,5 a próbastatsztka értéke: χ sz 4, 06 4 χ sz az elfogadás tartományba esk, H 0 -t 5%-os szgnfkanca sznten elfogadjuk 5

126 9.. KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA Szórásokra vonatkozó próbákat szórásnégyzetek segítségével végezhetünk. A szórásnégyzetekre vonatkozó próbák a normáls alapeloszlástól való eltérésre sokkal érzékenyebbek, mnt az átlagpróbák. Általános esetben mvel a varancák azonossága a várható értékek összehasonlítására leggyakrabban alkalmazott kétmntás t-próba feltétele a szórásokra vonatkozó próbákat az átlagpróbák előtt célszerű elvégezn. Két független, smeretlen várható értékű és szórású, normáls eloszlást követő valószínűség változó varancának azonosságára vonatkozó hpotézsünket az un. F próbával ellenőrzhetjük. A két alaposzlásból vett n és n elemű mnták * * s lletve s korrgált varancá torzítatlan becslése az alapeloszlás σ lletve σ varancának. A fent feltételek mellett a H 0 : σ σ nullhpotézst az * s F * s próbastatsztkával vzsgálhatjuk, ahol s > s. Ha H 0 és a kndulás feltételek teljesülnek, akkor az így képzett F érték az un. Fsher-Snedecor féle F- eloszlást követ, amely a számláló (DF ) és a nevező (DF ) szabadságfokától (DF, n, - ) függ. A számítást mndg úgy kell végeznünk, hogy a számlálóban a nagyobb varanca szerepeljen. Az F próbát ly módon mndg egyoldal próbaként végezzük, hszen azt vzsgáljuk, hogy s * szgnfkánsan nagyobb-e s * értéknél, vagys ellenhpotézsünk H : σ > σ. (Megjegyezzük, hogy az F-próbát baloldal és kétoldal alternatíva esetén s elvégezhetjük, de ez most nem témája jegyzetünknek.) Táblázatank s egyoldal próbára vonatkoznak (mégpedg F α, DF, DF, krtkus értéket adják meg). Feladat: Vzsgáljuk meg, hogy az alább mnták esetén valóban feltételezhető-e a szórások egyezése? A B Mntaszám 0 Átlag 6,4 mg 5,6 mg Korrgált tapasztalat szórás, mg, mg H 0 : σ σ H : σ > σ mvel az első ( A jelű) mnta szórása a nagyobb, ez kerül majd a számlálóba α 5% DF 0 DF 0 9 Fα 3,4 elfogadás tartomány: F sz < 3, 4, próbastatsztka értéke: F sz, 9, F sz az elfogadás tartományba esk, H 0 -t 5 %-os szgnfkanca sznten elfogadjuk, azaz az alapsokaság szórások nem különböznek egymástól. 6

127 9.3. TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK Az F-próbát csak abban az esetben alkalmazzuk, ha két mnta szórását hasonlítjuk össze. Ha több normáls eloszlásból származó mntát kell összehasonlítanunk, akkor az un. Bartlettpróbát, vagy Cohran-próbát alkalmazzuk. Bartlett-próba: Legyen r darab mntánk és a megfelelő mntadarabszámok n, n,..., n r, a j-edk mnta k-adk eleme * x jk, a j-edk mnta átlaga x j, korrgált tapasztalat szórásnégyzete s j. Számítsuk k a következő mennységet: χ sz r,306 f log s A j ( n j )log s * j, ahol f r r n j r, s j f j ( n j ) s * j r A + 3( r ) n j j. f A fent képletből nyert χ értéket a χ -táblázatban az r- szabadságfokhoz tartozó krtkus (a megállapodás szernt α sznthez tartozó) elmélet χ értékekkel kell összehasonlítan. Ha a táblázatban talált χ érték nem ksebb, mnt a képlettel számított, akkor megmaradhatunk a nullhpotézsünk mellett (amely természetesen a szórások egyezését állítja), ellenkező esetben a próba szgnfkáns eltérésre mutat (azaz legalább egy szórás szgnfkánsan eltér a többtől), s így a nullhpotézst elvetjük, vagys kjelentjük, hogy a mnták nem teknthetők egyforma szórású normáls eloszlású sokaságból származóknak. Feladat: Egy laboratórumban próbatesteken keménységvzsgálatokat végeznek. 5 szérát vzsgálnak, és ezek szórásnégyzetét kívánják összehasonlítan. A keménységet Rockwellben mérk. Az alább táblázat feltüntet az összehasonlítandó szórásnégyzeteket, a mntadarabszámokat (mndjárt eggyel csökkentve, mert a számításban így szerepelnek) és a számításhoz szükséges részeredményeket. j * s j * log s j n j - * (n j -)s j * (n j -) log s j /(n j -) 4, ,00 50,5764 0,09,59 0, ,87 38,4369 0,008 3,89 0, ,7 7,975 0, ,86 0, ,48 3,8 0,0556 5, ,5 3,035 0, , 3,94 0,706 nnen: f49 r5 s 3,8 szabadságfok 4 A,04 χ 0,34 A számított χ érték a 95%-os szntnél található 9,49-nél nagyobb, tehát ekkora χ előfordulásának kevesebb a valószínűsége, mnt 5 % azonos szórású alapsokaságok esetén. Ezért az összehasonlítás eredményeképpen megállapíthatjuk, hogy a szórások között eltérések szgnfkánsak. 7

128 Cochran-próba: E módszer segítségével azt dönthetjük el, hogy a szórások között talált legnagyobb érték teknthető-e a többvel azonos eloszlásból származónak. A Cochran-próbát akkor alkalmazhatjuk, ha az alapeloszlás normáls és a mnták mnd azonos darabszámúak. A közös mntadarabszámot most n-el jelöljük (a szabadságfok DF n-), az r darab különböző mnta korrgált szórásnégyzetét pedg smét s *, s *, s * r - tel, utóbbak közül a legnagyobb legyen s max *. Kszámítjuk a * smax g sz próbastatsztkát. * * * s + s sr A kértékeléshez szükséges dagram, vagy táblázat segítségével a már smert módon eldönthetjük, hogy a legnagyobb szórás jelentős mértékben különbözk-e a többtől. Ha a legnagyobb érték túllép a számára megengedett határt, akkor nem teknthetjük az összes alapsokaságot egyenlő szórásúnak. Ilyenkor vagy teljesen elejtjük a homogentásra vonatkozó feltevésünket, vagy pedg csak ezt a kugró szórással rendelkező mntát (vagy, ha több mnta szórása lépte át a szgnfkanca-határt, mndegyk lyent) kzárjuk a sokaságból és megvzsgáljuk, hogy a megmaradó sokaságra eredet feltevésünk fenntartható-e. Ezt tehát semm esetre sem teknthetjük természetesnek, hanem a megmaradó sokaságra meg kell smételnünk a Cochran-próbát, azaz g értékét a megmaradó adatokból újra k kell számítan és r új értékének fgyelembevételével összevetn az ábrával. A megmaradó sokaságot a szórás szempontjából homogénnek csak akkor teknthetjük, ha az utoljára végzett Cohran-próba nem szgnfkáns eredményt mutat. Feladat: Műselyem szakítóerő vzsgálatánál (n 0) kapott r 0 vzsgálat adataból számolt korrgált tapasztalat szórások között, található-e kugró érték? Az adatokat az alább táblázat mutaja: * s 4,9 8,4, 8,0 8,4 6,0 6,3 6,7 6,8, * s,5,4 4,8,,6 6, 0,9 9,6 60,5 0,9 H 0 : a szórások nem különböznek H : a legnagyobb szórás (9. mnta) különbözk a többtől α 5 % DF n 0 9 r 0 g 0,36 s kr * max g sz 60,5 60,5 4,93 + 8, ,9 60,5 330,7 0,83 A számított g érték nagyobb, mnt a krtkus érték, így 5%-os szgnfkanca sznten elutasítjuk H 0 -t, azaz a szórások egyezését. 8

129 0. HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 9

130 0.. VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK A feltételek függvényében több próbát s alkalmazhatunk. Nullhpotézsünk természetesen mnden esetben: H 0 : µ m0, vagys a várható érték egy adott m 0 értékkel egyenlő. Abban az esetben, ha smerjük az alapsokaság szórást (σ), vagy ha nem smerjük, de nagy mntával dolgozunk (n>30 és a σ-t a korrgált tapasztalat szórással becsüljük), egymntás u-próbával, ha nem smerjük az alapsokaság szórást, és ks mntánk van, akkor egymntás t-próbával vzsgálhatjuk a fent nullhpotézst. Szakma feltevésünktől függően, mndkét próba esetén alkalmazhatunk egy- vagy kétoldal ellenhpotézst. A két statsztka próbával kapcsolatos alapsmereteket az alább táblázat foglalja össze. u-próba t-próba egyoldal kétoldal egyoldal kétoldal H 0 µ m 0 H µ > m 0 µ > m 0 (µ < m 0 ) µ m 0 (µ < m 0 ) µ m 0 x µ x µ x µ próbastatsztka σ n s n s usz t * sz (DF n-) * n elutasítás tartomány u sz > u α (u sz < -u α ) u sz < -u α/ vagy u sz > u α/ feltételek σ smert v. n > Táblázat Feladat: t sz > t α (t sz < -t α ) t sz < -t α/ vagy t sz > t α/ A már bemutatott példában a ROM chpek gyártása során a kemence hőmérsékletére vonatkozó n8 elemű mnta alapján, átlag hőmérséklet 49 C-ra adódott. Korább vzsgálatok alapján tudjuk, hogy a folyamatban a maxmum hőmérsékletek elmélet szórása C. Feltehető-e, hogy a maxmum hőmérséklet 500 C? n 8 x 49 C σ C H H 0 : µ 500 C : µ 500 C smert az elmélet szórás u-próbát használhatunk α % u,96 5 α / elfogadás tartomány:,96 < u <, 96 sz a próbastatsztka értéke: u sz, 89 8 u sz az elfogadás tartományba esk, H 0 -t 5 %-os szgnfkanca sznten elfogadjuk 30

131 Szakma tapasztalatunk alapján úgy gondoljuk, hogy a kemence maxmum hőmérséklete ksebb, mnt 500 C. Vzsgáljuk meg ezt a feltevésünket, az előző mnta adata alapján. H H 0 : µ 500 C : µ < 500 C A próbastatsztka értéke természetesen nem változott: u, 89 α 0,05 u α,645 elfogadás tartomány:, 645 < u sz A próbastatsztka értéke a krtkus tartományba esk, ezért 5%-os szgnfkanca sznten H 0 -t elutasítjuk. Feladat: A Szovjetunó hagyományos fegyverzet terén szerzett előnyének csökkentésére az USA Védelm Mnsztéruma kválasztott egy a Chrysler Corporaton-nél tervezett új harckocs típust. Kterjedt vzsgálatok azt mutatták, hogy az új harckocs átlagosan 45 mérföld/órás sebességet képes elérn. A szovjetek leggyorsabb tankjával (T-7) való összehasonlítás érdekében a Védelm Mnsztérum adatokat szerzett n 6 T-7-es tank maxmum sebességéről, s az alább statsztka eredményeket kapták: az átlag sebesség 43,5 mérföld/óra, s* 3,0 mérföld/óra szórással. Feltehető-e α5 %-os szgnfkanca sznten, hogy a T-7-esek maxmáls sebessége ksebb az új amerka harckocsk sebességénél, azaz 45 mérföld/óránál? n 6 x 43,5m / h s H H 3,0m / h 0 : µ 45m / h : µ < 45m / h Nem smert az elmélet szórás, n < 30 (s feltételezve természetesen, hogy a maxmáls sebesség normáls eloszlású) t-próbát használhatunk: α 0,05, DF n 6 5 tα,753 elfogadás tartomány:, 753 < t 43,5 45 a próbastatsztka értéke: t sz, 00 3,0 6 sz Mvel t sz az elutasítás tartományba esk, H 0 -t 5%-os szgnfkanca sznten nem fogadjuk el sz 3

132 0.. KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA A mnta függetlensége azt jelent, hogy az egyk sokaságban egy elem mntába kerülése ll. be nem kerülése semmlyen módon nem befolyásolja a másk sokaságban az elemek mntába kerülésének valószínűségét. Az egymntás esethez hasonlóan ebben az esetben s több próba közül választhatunk. Nullhpotézsünk természetesen mnden esetben: H 0 : µ µ, vagys a két várható érték egyenlő. Abban az esetben, ha smerjük az alapsokaság szórásokat (σ és σ ), vagy ha nem smerjük, de nagy mntával dolgozunk (n >30 és n >30, s az elmélet szórásokat a korrgált tapasztalat szórással becsüljük), kétmntás u-próbával, ha nem smerjük az alapsokaság szórást, de feltehető a szórások egyezése, akkor kétmntás t-próbával vzsgálhatjuk a fent nullhpotézst. Ha mndkét sokaság normáls eloszlású, az elmélet szórásokat nem smerjük, de a szórások különböznek egymástól, akkor a kétmntás t-próba nem alkalmazható, helyette a Welch-próbát használhatjuk. Szakma feltevésünktől függően, mndhárom próba esetén alkalmazhatunk egy- vagy kétoldal ellenhpotézst. Az első két statsztka próbával kapcsolatos alapsmereteket az alább táblázat foglalja össze. H 0 H próbastatsztka elutasítás tartomány u-próba t-próba egyoldal kétoldal egyoldal kétoldal µ µ > µ ( µ < µ ) u sz u sz > u α σ ( u < uα ) sz x n x µ µ σ + u u sz vagy sz n < u > u α / α / µ µ > µ ( µ < µ ) t sz x x t sz * * s s + n > t α ( t < tα ) feltételek σ és σ smert v. n és n > 30 σ σ sz t t µ µ sz n vagy sz < t > t α / α / Feladat: 7. Táblázat DF n n + A Fogyasztóvédelm Felügyelőség két fajta cgaretta ( A és B ) szén-monoxd (CO) emsszóját hasonlította össze. A mnták statsztka adatat az alább táblázat tartalmazza. Hasonlítsuk össze, hogy a két fajta cgaretta CO kbocsátása eltér-e egymástól? H H 0 : µ µ : µ µ A B Mntaszám 0 Átlag 6,4 mg 5,6 mg Korrgált tapasztalat szórás, mg, mg 3

133 Mvel az elmélet szórásokat nem smerjük kétmntás t-próbát használhatunk. A próba elvégzése előtt meg kell győződnünk arról, hogy a két sokaságban a szórások megegyeznek. Ezt F-próbával (lásd. 9. pont) már ellenőrztük. α 0,0, DF tα elfogadás tartomány:,54 < t sz <, 54 a próbastatsztka értéke: t, 59 sz /,539 Mvel t sz az elfogadás tartományba esk, H 0 -t %-os szgnfkanca sznten elfogadjuk. Feladat: Két gyártó egy-egy kávéfajtájának kskereskedelm egységárát (lb-ra vonatkoztatva) szeretnénk összehasonlítan. Véletlenszerű mntát véve országszerte ezen kávéfajtákat áruló boltok közül, s feldolgozva az adatokat a kapott statsztka jellemzőket a következő táblázat mutatja: A B Mntaszám Átlag $,98 $,93 Korrgált tapasztalat szórás $0, $0,07 %-os szgnfkanca sznten feltehető-e, hogy az A típusú kávé drágább, mnt a B? H0 : µ µ H : µ > µ Az elmélet szórásokat nem smerjük, de a mntaszám elég nagy mndkét mntában kétmntás u-próbát használhatunk α 0,0 u α,33 elfogadás tartomány:,33 > usz,98,93 a próbastatsztka értéke: u 3, 0 sz 0, + 0, Mvel u sz az elutasítás tartományba esk, H 0 -t %-os szgnfkanca sznten nem fogadjuk el 33

134 Feladat: A BUX százalékos hozama 65 hónap adata alapján x 3,8%, jellemezhető (lásd. 3. fejezet). Az utolsó hónapban x 0,39%, különbözk-e a két várható érték egymástól? * s,05% paraméterekkel * s 5,7%. Szgnfkánsan F-próba: 43. ábra: A BUX 65 hav hozamadatának ábrázolása t-próba: 34

135 Feladat: Szeretnénk eldönten, hogy a megkötött bztosítások számát tekntve két ügyfélszolgálat roda között van-e különbség. A két roda adata az alábbak: Mntaszám Átlag Korrgált tapasztalat szórás I. roda 9,5,45 II. roda 3,49 5,36 35

136 Mnt korábban s utaltunk rá, ha a két alapsokaság szórás smeretlen, s ráadásul nem tételezhető fel a két szórás egyezése (ll. az ezt vzsgáló statsztka próba elutasítja a szórások egyezését), akkor nem alkalmazhatjuk a kétmntás t-próbát. Ilyen esetekben a két sokaság várható értékének összehasonlítására a Welch-próbát használhatjuk, melynek próbastatsztkája: t f x x. * * s s + n n Az DF paraméter értékét a következő módon számíthatjuk k. Legyen ( n ) ( n ) ( n ) c + ( n ) ( c) * s n c, ekkor * * s + s n n DF. Ha a H 0 hpotézs gaz, akkor a t f statsztka közelítőleg DF szabadságfokú Student-(t-) eloszlású, vagys adott ε (-α) megbízhatóság sznthez a t-táblázatból az DF szabadságfoknak megfelelő krtkus érték könnyen meghatározható. Ha mndkét mnta elemszáma elég nagy (> 40), akkor a t f statsztka közelítőleg normáls eloszlású, azaz a krtkus értékek a normáls eloszlás táblázatából kereshető k. Feladat: Tegyük fel, hogy a cgaretták CO emsszójának vzsgálatakor a szórások nem azonosak. Végezzük el így az összehasonlítást! H H 0 : µ µ : µ µ az elmélet szórásokat nem smerjük, nem azonosak Welch-próba α %, DF? (, /0) c 0,48 (, /+, /0) DF t α / [( )0,48 + (0 )( 0,48 )] ±,54 ( )(0 ) elfogadás tartomány:,54 < t <, 54 sz 8,99 9 t f 6,4 5,6 0,3+ 0,,59 A próbastatsztka (t f ) értéke t sz elfogadás tartományba esk, H 0 -t %-os szgnfkanca sznten elfogadjuk. Fgyeljünk fel rá, hogy mnd a krtkus, mnd a számított értékre ugyanazt az eredményt kaptuk, mnt az első példában. Valószínűleg a szórások különbözőségére vonatkozó feltételezésünk nem helytálló, így a kétmntás t-próba s alkalmas volt a vzsgálat elvégzésére. 36

137 0.3. PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA Az eddg tárgyalt kétmntás statsztka próbák alkalmazásánál fontos feltétel volt a mnták függetlensége. Ez a feltétel a gyakorlatban legtöbbször teljesül, de vannak bzonyos specáls esetek, amkor a két mnta eleme között van valamlyen kapcsolat. Az un. páros mnták esetén a mntaelemek nem függetlenek egymástól, van bennük valamlyen közös tényező (pl.: ugyanaz a mérőeszköz, ugyanaz az alkatrész, ember stb. vzsgáljuk). Páros mntáknál az egyk mnta elemenek kválasztása maga után vonja a másk mnta elemenek kválasztását, s így a két mnta eleme nem teknthetők egymástól függetleneknek. Az lyen páros (összefüggő) sokaságokban a két sokaság (s ebből következően természetesen a mnta) eleme egymással kölcsönös és egyértelmű megfeleltetésbe hozhatók. A páros elnevezés onnan származk, hogy a két sokaság egymáshoz rendelt egységenek összessége egy elempárokból álló, egyetlen sokaságnak s teknthető. Ha például két skola tanulónak testsúlyát szeretnénk összehasonlítan, akkor csak nehezen és mesterkélten képzelhető el a tanulók párokba rendezése, már csak a két skola létszámának különbsége matt s. Ugyanakkor, ha egy új fogyókúra eljárás hatékonyságát szeretnénk értékeln, akkor célszerű ugyanazon személyek testsúlyát megmérn két dőpontban, a fogyókúra előtt és után. Ebben az esetben annak megítélésére, hogy valóban csökkent-e a fogyókúra után a testsúly, már nem véletlenszerűen választunk a fogyókúrázók közül, az első mnta eleme meghatározzák a másodk mntát s. Természetesen az összefüggő sokaságokból s vehetünk független mntákat, de ez általában nem célszerű, mert így elveszítjük az elempárok egyenként összehasonlításával nyerhető nformácót. Mvel a páros mnták eleme egymásnak megfeleltethetők, így természetesen a két mnta nagysága azonos. Az lyen mntákat rendszernt oly módon kezeljük, hogy az egymásnak megfeleltethető elemek különbségét (vagy hányadosát) képezzük, majd a továbbakban e különbségeket (vagy hányadosokat) már egyetlen mnta elemenek tekntjük. Páros mnták várható értékenek összehasonlítására s ezt az eljárást követjük. Képezzük a két mnta különbségét, s ha a kapott eltérések eloszlása normáls, akkor kszámolva a különbségek átlagát és tapasztalat szórását, az így kapott mnta alapján végezhetünk egy egymntás t-póbát annak megállapítására, hogy a különbségek szgnfkánsan eltérnek-e nullától. (Természetesen nem csak a nullától való eltérést, azaz a két sokaság várható értékének egyezését, hanem egy adott különbség meglétét s vzsgálhatjuk.) Képezve tehát páronként a különbségeket (d ), majd a különbségek átlagát ( d ) és korrgált tapasztalat szórását(s d ), a nullhpotézsünket, vagys a két várható érték egyezését (H 0 : µ µ ), az alább d próbastatsztkával vzsgálhatjuk: tsz. Ha H 0 gaz, t sz értéke DF n- szabadságfokú sd n t-eloszlást követ. A H 0 hpotézs vzsgálatát egy- és kétoldal alternatívával szemben s vzsgálhatjuk. Feladat: Egy sportcpőket gyártó cég szeretné meghatározn, hogy egy új típusú cpő ( A ) élettartama nagyobb-e az előzőtől ( B )? Felkértek tíz kocogót, hogy teszteljék a termékeket. Az eredményeket [az élettartamokat hetekben mérve] a következő táblázat mutatja (az élettartamok normáls eloszlást követnek). Kocogó Mnta A cpő B cpő

138 95%-os megbízhatóság sznten vzsgálva feltehető-e az élettartamok különbözősége? H0 : µ µ H : µ > µ n 0 képezzük az eltéréseket : d az eltérések átlaga: d, 6 a különbségek korrgált tapasztalat szórása (4,6) + (7,6) (,6) s 3,66 d 0 α 5 % DF n 0 9 tα,83 elfogadás tartomány:,83 > tsz,6 a próbastatsztka értéke: t sz, 5 (3,66/ 0) Mvel t sz az elutasítás tartományba esk, H 0 -t 5%-os szgnfkanca sznten nem fogadjuk el, azaz az új cpők élettartama valóban nagyobb, mnt a régeké VARIANCIAANALÍZIS A varancaanalízs a matematka statsztka eljárások között kemelkedő jelentőséggel bír. Nem csak egy egyszerű hpotézsvzsgálat, hanem bonyolult gyakorlat problémák (elsősorban kísérlettervek) elemzésére, értékelésére használható módszer. Ennek ellenére most a hpotézsvzsgálatok között tárgyaljuk, mvel a legegyszerűbb esetben, az un. egyszeres osztályozású varancaanalízs, lényegében több normáls eloszlású sokaság várható értékének összehasonlítására alkalmazható, azaz a H 0 : µ µ µ r nullhpotézs helyességének a sokaságokból egymástól függetlenül vett mnták alapján történő ellenőrzésére szolgál. Ellenhpotézsünk mnden esetben az lesz, hogy nem mnden várható érték egyforma. A próba elvégzéséhez előfeltétel még a normaltáson kívül, hogy az smeretlen alapsokaság szórások megegyezzenek (Cohran- v. Bartlett-próba). A próba elvégzéséhez mndenekelőtt (természetesen a csoportok átlagának és szórásának meghatározása után, amk már a szórások egyezésének vzsgálatához s szükségesek) képezzük az összes megfgyelés számtan átlagát ( x ), am megegyezk a mntaátlagoknak ( x ) a mnta r n r elemszámával súlyozott számtan közepével: x xj n x, ahol n az -edk mnta n j n elemszáma, n az összes mnta elemszáma n n +n + n r. 38

139 Ezek után képezzük az összes mért értéknek (x j ) az összes adat átlagától ( x ) való eltérésének a r n négyzetösszegét az un teljes négyzetösszeget: ( x x) j r bontható. Az egyk az un. csoportok között ( x x) j, am két négyzetösszeg összegére n négyzetösszeg, am a csoportok közt r n eltéréseket magyarázza, mér, a másk a csoportokon belül ( x ) csoportokon belül eltéréseket, a véletlen hatásokat mutatja. j j x négyzetösszeg, am a Ha H 0 gaz, s a kndulás feltételek s teljesülnek, akkor bzonyítható, hogy a csoporton belül négyzetösszeg χ -eloszlású n - r szabadságfokkal, s a csoportok között négyzetösszeg független a csoporton belül négyzetösszegtől, és szntén χ -eloszlású r- szabadságfokkal. Ha ez gaz, akkor a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett un külső (s k ), ll. belső (s b ) szórásnégyzetek egymástól függetlenek, s a közös várható értékük az smeretlen, de egyenlő alapsokaság szórás: M(s k ) M(s b ) σ. A két szórás egyezésének vzsgálatával így ellenőrzhetjük eredet hpotézsünket, a várható értékek azonosságát. Két szórás összehasonlítására a korábban megsmert F-próba használható, képezve az F s k /s b statsztkát, amely - H 0 fennállása esetén - (r -, n - r) paraméterű F-eloszlású. A varancaanalízs eredményenek összefoglalására gyakran alkalmazzák az un. szórásfelbontó táblázatot, amt a varancaanalízs angol nevének rövdítéséből ANOVA táblának s szokás nevezn. Az egyszeres osztályozású varancaanalízs ANOVA táblájának felépítését mutatja a következő táblázat: négyzetösszeg neve csoportok között * csoporton belül ** teljes négyzetösszegek r ( x x) szabadságfok szórás becslése r- s n k r n ( xj x ) j r n ( x j x) j n-r s b F érték s k /s b p-érték p - - n Táblázat *: a kísérlettervezésből vett szóhasználattal szokták faktornak v. kezelésnek s nevezn ll. **: a csoporton belül ngadozást hbának Feladat: Egy áruházláncnál megvzsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fzetett összeg. Mnden boltban kválasztottak 6 véletlen mntát. A vásárláskor fzetett összegeket az alább táblázat mutatja [dollárban]:. bolt. bolt 3. bolt,05 5,7 9,48 3,94 8,5 6,9 4,63 9,57 0,47 5,78,4 7,63 7,5 3,59,90 8,45 0,57 5,9 39

140 Feltételezve, hogy a kfzetések normáls eloszlásúak, s szórásuk egyenlő, van-e különbség a 3 üzlet között? H 0 : µ µ µ 3 H: legalább az egyk várható érték eltér a többtől n n n 3 6 r 3 Az átlagok boltonként: $8,73, $8,4, $8,7, az összes adat átlaga: $5,. A számításokat elvégezve, az ANOVA tábla: négyzetösszegek szabadságfok szórás F p érték becslése érték csoportok között 378,4 89, 3,6 0,0005 csoporton belül 4, 5 4,3 - - teljes 59, Az F sz számított értéke tehát 3,6. α 0,05 a számláló szabadságfoka: a nevező szabadságfoka: 5 A krtkus érték: F kr 3,68 A F sz >>F kr a H 0 nullhpotézst 5 %-os szgnfkanca sznten elutasítjuk, azaz az átlagok ll. legalább egy átlag szgnfkánsan különbözk a többtől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kfzetett összeg nagysága átlagosan kevesebb, mnt a fele a másk két bolt átlagánál. 40

141 . KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II. Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 4

142 .. A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ A.5 pontban megsmertük az események függetlenségének alapvető jellemzőt. Ezekből többek között az s következk (a bzonyítást mellőzzük), hogy két független valószínűség változó (X és Y) szorzatának várható értéke egyenlő várható értékenek szorzatával: M ( XY ) M ( X ) M ( Y ) Mvel azonban egy valószínűség változónak a saját várható értékétől vett eltérésének a várható értéke mndg nulla, az előbb szorzat várható értéke s zérus. Defnícó: A C( XY ) M {[ X M ( X )] [ Y M ( Y )]} várható értéket az X és Y valószínűség változók kovarancájának nevezzük. Ha a C(XY) kfejezésében elvégezzük a szorzást és tagonként vesszük a várható értéket, akkor: C XY M XY M X M Y ( ) ( ) ( ) ( ) Ugyancsak gazolható, hogy C ( XY ) D( X ) D(Y ) azaz, két valószínűség változó kovarancájának abszolút értéke nem lehet nagyobb a két szórás szorzatánál. Az elmélet korrelácós együttható R (X,Y) fogalmához úgy juthatunk el, ha a kovarancát elosztjuk a két szórás szorzatával, hszen ekkor olyan kfejezést kapunk, amely a valószínűség változók értéketől nem függő abszolút határok között mozog: R ( X,Y ) D C( XY ) ( X ) D( Y ) A korrelácós együttható értéke nulla, ha X és Y függetlenek. Ez fordítva általában nem gaz: abból, hogy két valószínűség változó korrelácós együtthatója nulla, nem feltétlenül következk, hogy a két változó független s egymástól (kvétel, ha X és Y együttes eloszlása normáls). Ha a két változónál csak azt tudjuk, hogy R(X,Y)0, akkor korrelálatlannak nevezzük őket (4. fejezet). A korrelácós együttható abszolút értéke legfeljebb, azaz ( X,Y ) R + és a ± értéket akkor és csak akkor ér el, ha X és Y között lneárs kapcsolat van: y bx + Ha b > 0, akkor R (X, Y), ha b < 0, akkor R (X, Y). Poztív sztochasztkus kapcsolatnál 0< R (X, Y) <, míg negatív sztochasztkus kapcsolatnál < R (X, Y) < 0. a 4

143 Természetesen, mnél szorosabb a kapcsolat, R ( X,Y ) annál jobban közelít az egységet. Az elmélet korrelácós együtthatót a mntabel, tapasztalat korrelácós együtthatóból becsülhetjük: r ( x, y) n n d d x x d n y d y ahol: d x x x és d y y. y Természetesen azt s meg kell vzsgálnunk, hogy a r(x,y) tapasztalat korrelácós együttható szgnfkánsnak teknthető-e. Ekkor a H o : R (X, Y) 0 nullhpotézsből ndulunk k, vagys az lesz az alapfeltételezésünk, hogy a két változó egymástól független normáls eloszlású. Igazolható, hogy normáls alapeloszlás mellett az R (X, Y) 0 nullhpotézs esetén r (x, y)-nek az alább függvénye DFn- szabadság fokkal t- eloszlást követ: n tsz r r A függelékben található t krt krtkus értékek alapján, adott α szgnfkanca sznten a t sz > t krt esetben elvetjük az R (X, Y) 0 nullhpotézst és ezzel a kapcsolat fennállásának hpotézsét fogadjuk el. A szgnfkáns korrelácós együttható csak azt jelent, hogy R (X, Y) értéke nagy valószínűséggel nem zérus, de az összefüggés szoros, vagy laza voltára nem ad felvlágosítást! Feladat: Számítsuk k a mntapéldában (4. fejezet) szereplő változók korrelácós együtthatóját és végezzük el a szgnfkanca vzsgálatot! A táblázatban közölt adatok alapján: 980,4 r ( x, y ) 0, , 36,5 A lneárs korrelácós együttható szgnfkanca vzsgálata: H o : R (X, Y) 0 DF n- 4- α 0,05 0,85 0,85 t krt,7 tsz 5,56 Mvel t sz > t krt, ezért a nullhpotézst elvetjük és nagy bztonsággal állíthatjuk, hogy a két változó között korrelácós (sztochasztkus) kapcsolat van. (Emlékeztetőül: az előjel korrelácós együttható értéke 0,7 volt). 43

144 .. AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE A 4. fejezetben az Y változót felírtuk úgy, mnt az Ŷ regresszós függvény és az "e" rezduum összege: Y Ŷ + e ahol: "e" a véletlenszerű eltérést képvsel. Bzonyítható, hogy az összefüggés a változók szórásnégyzetere s érvényes: Tapasztalat adatokból számolva: ( Y ) σ ( Ŷ ) σ ( e) σ + s y n n ( y y) és s ŷ n n ( ŷ y) ahol: ŷ az x értékekből a regresszós függvénnyel számolt becsült érték. Végül a rezduumokból számolt szórásnégyzet: s e n n e Látható, hogy s y ˆ képvsel s y azon részét, amelyet x változásával magyarázhatunk és s e a magyarázatlan (x-hatás kkapcsolása után) részt jelent. Bzonyíthatóak még az alább összefüggések s: r s ŷ e ( x, y) s Az r (x, y) amelyet determnácós együtthatónak s neveznek azt fejez k, hogy a sztochasztkus kapcsolatban a teljes változás hányad része tulajdonítható x-nek. Értékét %-os formában s megadhatjuk. Feladat: A mntapélda adata alapján határozzuk meg a determnácós ndex értékét! r y ( x, y) 0,85 0, 7 Az eredményt úgy értelmezhetjük, hogy a termésátlagok változásában a műtrágya felhasználás 7 %- ban játszott szerepet. s s y 44

145 45.3. A REGRESSZIÓS BECSLÉS PONTOSSÁGA Nylvánvaló, hogy a sztochasztkus kapcsolat mérőszámaból csak akkor vonhatunk le helyes következtetéseket, ha megfelelően nagy mntánk van. Így, az eredmények értékeléséhez hozzátartozk a mérőszámok hbájának vzsgálata s. A pontosság jellemzése céljából tehát most az a, b, ŷ paraméterek becslésének szórását (standard hbáját) kell meghatároznunk. A regresszós együttható standard hbá: Levezetés nélkül, de a. pontban smertetett összefüggések felhasználásával, a regresszós együtthatók standard hbaképlete: ( ) y n e r s n e s A rezduáls szórás becslésére az alább torzítatlan becslést s használják: ( ) n ŷ y n e s n y n e A regresszós együtthatók hbá: n x n e a d n x s s e x e b d s s A standard hbák azt mutatják meg, hogy végtelen sok n elemű mntát véve az alapsokaságból az egyes mntákból becsült a paraméterek átlagosan s a egységgel, a b paraméterek pedg s b egységgel szóródnak az alapsokaság regresszófüggvény körül. Konfdenca ntervallum a becsült paraméterekre: A becsült paraméterekre konfdenca ntervallumokat s konstruálhatunk. Nagy mnták esetén normáls eloszlás táblázatot-, ks mnták esetén a Studen-eloszlás t- táblázatát használjuk (DF n- ): b α o a α o s t b b s t a a ± ±

146 A konfdenca ntervallum úgy értelmezhető [(pl: ( α ) 95 %)], hogy sok smételt mntavétel végrehajtása során (pl.: 00 mntavétel) átlag 95 esetben a becsült regresszó együtthatóhoz rendelt konfdenca tartomány lefed a valóságos értékeket. A lneárs kapcsolat szgnfkanca vzsgálata: A t- próba segítségével azt s ellenőrzhetjük, hogy az Y és X változók között szgnfkáns lneárs kapcsolat van-e. Nullhpotézsünk és ellenhpotézsünk: A próbastatsztka: H H o sz : b : b t 0 0 b s b A t krt értéket α szgnfkanca sznten DF n szabadság foknál találjuk meg. Ha t sz > t krt, elvetjük H o -t, és valós lneárs összefüggést tételezünk fel X és Y között. Az átlagos, vagy az egyed y értékek becslése: Az eddgekben mndg feltételezzük, hogy az adott x értékek rögzített értékek, azaz nem valószínűség változók. (Mntapéldánkban ez úgy értelmezhető, hogy a műtrágya mennységét tudatosan m állítjuk be, azaz X változk, de nem a véletlen hatására). Ebben az esetben mnden egyes x értékhez az y értékeknek egy eloszlása tartozk. Előfordulhat azonban olyan eset s, amkor x értékek s a véletlen hatására ngadoznak egy általunk smeretlen M(x ) várható érték körül. Ilyenkor mnd az x, mnd az y értékek mntáról mntára változhatnak. (Mntapéldánkban ez úgy állhat elő, ha X értéket a gazdálkodók sokaságára értelmezzük, így ezek az értékek a m számunkra valószínűség változóként vselkednek.) A regresszó becslés pontosságának vzsgálatakor a modellben szereplő paraméterek standard hbá alapján következtethetünk a számított ŷ függvényértékek pontosságára s. Az X változó értelmezés tartományában mnden egyes x értékhez tartozk egy regresszó-érték, amelyet az yˆ a + b x becslés alapján állíthatunk elő. Ez a becslés az előzőek alapján két különböző célra használható fel. 46

147 Becsülhetjük vele Y átlagos volumenét, vagys egy adott x értékhez tartozó feltételes várható értéket (átlagos y értéket). Mntapéldánkban ekkor azt vzsgáljuk, hogy egy adott x műtrágya felhasználáshoz átlagosan mekkora terméshozam várható. Az a és b paraméterek mntavétel hbából fakadóan ennek a becslésnek s van standard hbája, mégpedg: s ŷ ( x x ) se + n ( x x ) A feltételes várható érték (-α) szntű konfdenca ntervalluma: M yˆ x yˆ ± t ( / ) α s y Becsülhetünk azonban egy egyed y értéket s. Ekkor a standard hba: s y s e + n ( x ( x x) x) + A konfdenca ntervallum pedg: y yˆ ± t α s y Mndkét esetben x értéket véggfuttatva egy konfdenca sávot kapunk, amelynek szélessége ( α )-tól függ. 44. ábra: A várható értékek és egyed értékek konfdenca ntervalluma 47

148 A regresszós vonalhoz közelebb eső sáv a várható érték-, a távolabb eső pedg az egyed értékek konfdenca ntervallumát mutatja. Így, ha a lneárs regresszóra megfogalmazott feltételenk teljesülnek, akkor (-α) valószínűséggel állíthatjuk, hogy egy megfgyelt pont a szélesebb sávba esk, azaz a pontoknak csak α %-a eshet-e sávon kívül. Feladat: Korábban már többször foglalkoztunk a BUX hav hozamanak statsztka elemzésével (leíró statsztka, hpotézsvzsgálatok). Az alább táblázat alapján vzsgáljuk meg, hogy az 998. VII.-999.VI. között dőszakban a hav hozam (%) alapján kmutatható-e sztochasztkus kapcsolat a BUX és a Zwack hozama között? Adjunk előzetes szakma magyarázatot az eredményekre! 45. ábra 48

149 x (BUX y dx dy dx dy dx dy x ŷ ( y ŷ ) ( y yˆ ) %) (Zwack) 98.VII. 3,45 4,58 3,06,93 9,36 8,58 8,97,9 3,078 0,4 0,4 VIII. 36-5,3-36,45-6,97 38,6 87,98 68,56 300,3-5,6-0,058 0 IX. -,97-7,9-3,36-8,84 78,49 78,5 8, 68, -4,55 -,64 6,97 X. 6,9 5 6,5 3,35 703,3, 88,84 74,5 3,96-8,96 80,5 XI.,53 8,45,4 6,8 47,38 78,4 35, ,8,7 448, XII. 5,5,87 5,, 6,,49 6,5 30,36 4,03 -,6,34 99.I. 3,6 -,7,77-4,35 7,67 8,9 -,05 9,99,94 0,4 0,06 II. -3,63-3,8-4,0-5,45 96,56 9,7 76,4 85,78-4,85,05, III. -,37,79 -,76,4 7,6,3-3,5 5,6 0,37,4 5,86 IV. 9,0 8,43 8,63 6,78 74,48 45,97 58,5 8,36 5,66,77 7,69 V. 4,58-6,05 4,9-7,7 7,56 59,9-3,6 0,98 3,6 -,45 6 VI. 4,59,76 4,, 7,64,3 4,66,07 3,6-0,84 0,7 4,7 9,8 74,88 6,07 58,9 77,5 558,3 A dagram és/vagy a táblázat alapján határozzuk meg az előjel korrelácós együtthatót! r e Határozzuk meg a tapasztalat korrelácós együtthatót és α 5 % mellett végezzük el a szgnfkanca vzsgálatot! r (x, y) H o : DF α t sz t krt Következtetés: Becsüljük meg a lneárs regresszófüggvény együtthatót! b a 49

150 Határozzuk meg a determnácós együtthatót és értelmezzük az eredményt! Következtetés: r (x, y) Határozzuk meg a regresszós becslés pontosságát! s e s a s b Készítsünk 95 %-os konfdenca ntervallumot a becsült paraméterekre! α t α a o b o Ellenőrzzük α 5 % mellett, hogy a lneárs kapcsolat szgnfkáns-e? DF t sz Következtetés: t krt 50

151 . FELHASZNÁLT ÉS AJÁNLOTT IRODALOM 5

152 . Kröpfl B. Peschek W. Schneder E. Schönleb A.: Alkalmazott statsztka. Műszak Könyvkadó, Budapest, Prékopa A.: Valószínűségelmélet műszak alkalmazásokkal. Műszak Könyvkadó, Budapest, Vncze I.: Matematka statsztka par alkalmazásokkal. Műszak Könyvkadó, Budapest, Solt Gy.: Valószínűségszámítás. Példatár. Műszak Könyvkadó, Budapest, Meszéna Gy. - Zermann M.: Valószínűségelmélet és matematka statsztka. Közgazdaság és Jog Könyvkadó, Budapest, Kndler J.: Matematka statsztka I. Tankönyvkadó, Budapest, 98. (J4-7) 7. Köves P. - Párnczky G.: Általános statsztka Közgazdaság és Jog Könyvkadó, Budapest, Hunyad L. - Vta L.: Statsztka közgazdászoknak KSH, Budapest, Hunyad - Mundruczó - Vta: Statsztka. Aula Kadó, Budapest, Kerékgyártó Gy-né - Mundruczó Gy.: Statsztka módszerek a gazdaság elemzésben. Aula Kadó, Budapest, Szabó G.Cs. (szerk.): Alkalmazott statsztka I. Műegyetem Kadó, Budapest, Remann J. - Tóth J.: Valószínűségszámítás és matematka statsztka. Tankönyvkadó, Budapest, Lukács O.: Matematka statsztka. Példatár. Műszak Könyvkadó, Budapest, Spegel, Murray R.: Statsztka: Elmélet és gyakorlat. Panem - McGraw - Hll, Budapest, Banks J.: Prncples of Qualty Control. Wley, New York, Sncch T.: Statstcs by Example. Dellen Publshng Company, San Francsco, Flemng M.C. - Nells J.G.: The Essence of Statstcs for Busness. Prentce Hall, New York, Curwn J. - Slater R.: Quanttatve Methods for Busness Decsons. Thrd Edton, Chapman & Hall, London, 99. 5

153 3. FÜGGELÉK: TÁBLÁZATOK I. táblázat: Bnomáls eloszlás II. táblázat: Posson-eloszlás III. táblázat: Standard normáls eloszlás IV. táblázat: χ -eloszlás V. táblázat: Student-eloszlás (t-eloszlás) VI. táblázat: F-eloszlás (α0,05) VII. táblázat: F-eloszlás (α0,0) VIII. táblázat: Cochran-próba (α0,05) IX. táblázat: Cochran-próba (α0,0) 53

154 I. táblázat: Bnomáls eloszlás p n k 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0,50 0 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000 0,0500 0,000 0,500 0,000 0,500 0,3000 0,3500 0,4000 0,4500 0, ,905 0,800 0,75 0,6400 0,565 0,4900 0,45 0,3600 0,305 0,500 0,0950 0,800 0,550 0,300 0,3750 0,400 0,4550 0,4800 0,4950 0,5000 0,005 0,000 0,05 0,0400 0,065 0,0900 0,5 0,600 0,05 0, ,8574 0,790 0,64 0,50 0,49 0,3430 0,746 0,60 0,664 0,50 0,354 0,430 0,35 0,3840 0,49 0,440 0,4436 0,430 0,4084 0,3750 0,007 0,070 0,0574 0,0960 0,406 0,890 0,389 0,880 0,334 0, ,000 0,000 0,0034 0,0080 0,056 0,070 0,049 0,0640 0,09 0, ,845 0,656 0,50 0,4096 0,364 0,40 0,785 0,96 0,095 0,065 0,75 0,96 0,3685 0,4096 0,49 0,46 0,3845 0,3456 0,995 0,500 0,035 0,0486 0,0975 0,536 0,09 0,646 0,305 0,3456 0,3675 0, ,0005 0,0036 0,05 0,056 0,0469 0,0756 0,5 0,536 0,005 0, ,0000 0,000 0,0005 0,006 0,0039 0,008 0,050 0,056 0,040 0, ,7738 0,5905 0,4437 0,377 0,373 0,68 0,60 0,0778 0,0503 0,033 0,036 0,38 0,395 0,4096 0,3955 0,360 0,34 0,59 0,059 0,563 0,04 0,079 0,38 0,048 0,637 0,3087 0,3364 0,3456 0,3369 0,35 3 0,00 0,008 0,044 0,05 0,0879 0,33 0,8 0,304 0,757 0,35 4 0,0000 0,0005 0,00 0,0064 0,046 0,084 0,0488 0,0768 0,8 0, ,0000 0,0000 0,000 0,0003 0,000 0,004 0,0053 0,00 0,085 0, ,735 0,534 0,377 0,6 0,780 0,76 0,0754 0,0467 0,077 0,056 0,3 0,3543 0,3993 0,393 0,3560 0,305 0,437 0,866 0,359 0,0938 0,0305 0,0984 0,76 0,458 0,966 0,34 0,380 0,30 0,780 0, ,00 0,046 0,045 0,089 0,38 0,85 0,355 0,765 0,303 0,35 4 0,000 0,00 0,0055 0,054 0,0330 0,0595 0,095 0,38 0,86 0, ,0000 0,000 0,0004 0,005 0,0044 0,00 0,005 0,0369 0,0609 0, ,0000 0,0000 0,0000 0,000 0,000 0,0007 0,008 0,004 0,0083 0, ,6983 0,4783 0,306 0,097 0,335 0,084 0,0490 0,080 0,05 0,0078 0,573 0,370 0,3960 0,3670 0,35 0,47 0,848 0,306 0,087 0,0547 0,0406 0,40 0,097 0,753 0,35 0,377 0,985 0,63 0,40 0,64 3 0,0036 0,030 0,067 0,47 0,730 0,69 0,679 0,903 0,98 0, ,000 0,006 0,009 0,087 0,0577 0,097 0,44 0,935 0,388 0, ,0000 0,000 0,00 0,0043 0,05 0,050 0,0466 0,0774 0,7 0,64 6 0,0000 0,0000 0,000 0,0004 0,003 0,0036 0,0084 0,07 0,030 0, ,0000 0,0000 0,0000 0,0000 0,000 0,000 0,0006 0,006 0,0037 0, ,6634 0,4305 0,75 0,678 0,00 0,0576 0,039 0,068 0,0084 0,0039 0,793 0,386 0,3847 0,3355 0,670 0,977 0,373 0,0896 0,0548 0,033 0,055 0,488 0,376 0,936 0,35 0,965 0,587 0,090 0,569 0, ,0054 0,033 0,0839 0,468 0,076 0,54 0,786 0,787 0,568 0,88 4 0,0004 0,0046 0,085 0,0459 0,0865 0,36 0,875 0,3 0,67 0, ,0000 0,0004 0,006 0,009 0,03 0,0467 0,0808 0,39 0,79 0,88 6 0,0000 0,0000 0,000 0,00 0,0038 0,000 0,07 0,043 0,0703 0, ,0000 0,0000 0,0000 0,000 0,0004 0,00 0,0033 0,0079 0,064 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,000 0,0007 0,007 0,

155 p n k 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0, ,630 0,3874 0,36 0,34 0,075 0,0404 0,007 0,00 0,0046 0,000 0,985 0,3874 0,3679 0,300 0,53 0,556 0,004 0,0605 0,0339 0,076 0,069 0,7 0,597 0,300 0,3003 0,668 0,6 0,6 0,0 0, ,0077 0,0446 0,069 0,76 0,336 0,668 0,76 0,508 0,9 0,64 4 0,0006 0,0074 0,083 0,066 0,68 0,75 0,94 0,508 0,600 0,46 5 0,0000 0,0008 0,0050 0,065 0,0389 0,0735 0,8 0,67 0,8 0,46 6 0,0000 0,000 0,0006 0,008 0,0087 0,00 0,044 0,0743 0,60 0,64 7 0,0000 0,0000 0,0000 0,0003 0,00 0,0039 0,0098 0,0 0,0407 0, ,0000 0,0000 0,0000 0,0000 0,000 0,0004 0,003 0,0035 0,0083 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0,0008 0, ,5987 0,3487 0,969 0,074 0,0563 0,08 0,035 0,0060 0,005 0,000 0,35 0,3874 0,3474 0,684 0,877 0, 0,075 0,0403 0,007 0,0098 0,0746 0,937 0,759 0,300 0,86 0,335 0,757 0,09 0,0763 0, ,005 0,0574 0,98 0,03 0,503 0,668 0,5 0,50 0,665 0,7 4 0,000 0,0 0,040 0,088 0,460 0,00 0,377 0,508 0,384 0,05 5 0,000 0,005 0,0085 0,064 0,0584 0,09 0,536 0,007 0,340 0,46 6 0,0000 0,000 0,00 0,0055 0,06 0,0368 0,0689 0,5 0,596 0,05 7 0,0000 0,0000 0,000 0,0008 0,003 0,0090 0,0 0,045 0,0746 0,7 8 0,0000 0,0000 0,0000 0,000 0,0004 0,004 0,0043 0,006 0,09 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,006 0,004 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0, ,5688 0,338 0,673 0,0859 0,04 0,098 0,0088 0,0036 0,004 0,0005 0,393 0,3835 0,348 0,36 0,549 0,093 0,058 0,066 0,05 0,0054 0,0867 0,3 0,866 0,953 0,58 0,998 0,395 0,0887 0,053 0, ,037 0,070 0,57 0,5 0,58 0,568 0,54 0,774 0,59 0, ,004 0,058 0,0536 0,07 0,7 0,0 0,48 0,365 0,060 0,6 5 0,000 0,005 0,03 0,0388 0,0803 0,3 0,830 0,07 0,360 0,56 6 0,0000 0,0003 0,003 0,0097 0,068 0,0566 0,0985 0,47 0,93 0,56 7 0,0000 0,0000 0,0003 0,007 0,0064 0,073 0,0379 0,070 0,8 0,6 8 0,0000 0,0000 0,0000 0,000 0,00 0,0037 0,00 0,034 0,046 0, ,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,008 0,005 0,06 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0007 0,00 0,0054 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0, ,5404 0,84 0,4 0,0687 0,037 0,038 0,0057 0,00 0,0008 0,000 0,343 0,3766 0,30 0,06 0,67 0,07 0,0368 0,074 0,0075 0,009 0,0988 0,30 0,94 0,835 0,33 0,678 0,088 0,0639 0,0339 0,06 3 0,073 0,085 0,70 0,36 0,58 0,397 0,954 0,49 0,093 0, ,00 0,03 0,0683 0,39 0,936 0,3 0,367 0,8 0,700 0,08 5 0,000 0,0038 0,093 0,053 0,03 0,585 0,039 0,70 0,5 0, ,0000 0,0005 0,0040 0,055 0,040 0,079 0,8 0,766 0,4 0,56 7 0,0000 0,0000 0,0006 0,0033 0,05 0,09 0,059 0,009 0,489 0, ,0000 0,0000 0,000 0,0005 0,004 0,0078 0,099 0,040 0,076 0,08 9 0,0000 0,0000 0,0000 0,000 0,0004 0,005 0,0048 0,05 0,077 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0008 0,005 0,0068 0,06 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0,000 0,009 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,000 55

156 p n k 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0,50 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0, ,533 0,54 0,09 0,0550 0,038 0,0097 0,0037 0,003 0,0004 0,000 0,35 0,367 0,774 0,787 0,09 0,0540 0,059 0,03 0,0045 0,006 0,09 0,448 0,937 0,680 0,059 0,388 0,0836 0,0453 0,00 0, ,04 0,0997 0,900 0,457 0,57 0,8 0,65 0,07 0,0660 0, ,008 0,077 0,0838 0,535 0,097 0,337 0, 0,845 0,350 0, ,0003 0,0055 0,066 0,069 0,58 0,803 0,54 0,4 0,989 0,57 6 0,0000 0,0008 0,0063 0,030 0,0559 0,030 0,546 0,968 0,69 0, ,0000 0,000 0,00 0,0058 0,086 0,044 0,0833 0,3 0,775 0, ,0000 0,0000 0,000 0,00 0,0047 0,04 0,0336 0,0656 0,089 0,57 9 0,0000 0,0000 0,0000 0,000 0,0009 0,0034 0,00 0,043 0,0495 0, ,0000 0,0000 0,0000 0,0000 0,000 0,0006 0,00 0,0065 0,06 0,0349 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0,00 0,0036 0,0095 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,4877 0,88 0,08 0,0440 0,078 0,0068 0,004 0,0008 0,000 0,000 0,3593 0,3559 0,539 0,539 0,083 0,0407 0,08 0,0073 0,007 0,0009 0,9 0,570 0,9 0,50 0,80 0,34 0,0634 0,037 0,04 0, ,059 0,4 0,056 0,50 0,40 0,943 0,366 0,0845 0,046 0,0 4 0,0037 0,0349 0,0998 0,70 0,0 0,90 0,0 0,549 0,040 0,06 5 0,0004 0,0078 0,035 0,0860 0,468 0,963 0,78 0,066 0,70 0, 6 0,0000 0,003 0,0093 0,03 0,0734 0,6 0,759 0,066 0,088 0, ,0000 0,000 0,009 0,009 0,080 0,068 0,08 0,574 0,95 0, ,0000 0,0000 0,0003 0,000 0,008 0,03 0,050 0,098 0,398 0, ,0000 0,0000 0,0000 0,0003 0,008 0,0066 0,083 0,0408 0,076 0, 0 0,0000 0,0000 0,0000 0,0000 0,0003 0,004 0,0049 0,036 0,03 0,06 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,000 0,0033 0,0093 0,0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,009 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,4633 0,059 0,0874 0,035 0,034 0,0047 0,006 0,0005 0,000 0,0000 0,3658 0,343 0,3 0,39 0,0668 0,0305 0,06 0,0047 0,006 0,0005 0,348 0,669 0,856 0,309 0,559 0,096 0,0476 0,09 0,0090 0, ,0307 0,85 0,84 0,50 0,5 0,700 0,0 0,0634 0,038 0, ,0049 0,048 0,56 0,876 0,5 0,86 0,79 0,68 0,0780 0, ,0006 0,005 0,0449 0,03 0,65 0,06 0,3 0,859 0,404 0, ,0000 0,009 0,03 0,0430 0,097 0,47 0,906 0,066 0,94 0,57 7 0,0000 0,0003 0,0030 0,038 0,0393 0,08 0,39 0,77 0,03 0, ,0000 0,0000 0,0005 0,0035 0,03 0,0348 0,070 0,8 0,647 0, ,0000 0,0000 0,000 0,0007 0,0034 0,06 0,098 0,06 0,048 0,57 0 0,0000 0,0000 0,0000 0,000 0,0007 0,0030 0,0096 0,045 0,055 0,096 0,0000 0,0000 0,0000 0,0000 0,000 0,0006 0,004 0,0074 0,09 0,047 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0004 0,006 0,005 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,

157 p n k 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0, ,440 0,853 0,0743 0,08 0,000 0,0033 0,000 0,0003 0,000 0,0000 0,3706 0,394 0,097 0,6 0,0535 0,08 0,0087 0,0030 0,0009 0,000 0,463 0,745 0,775 0, 0,336 0,073 0,0353 0,050 0,0056 0, ,0359 0,43 0,85 0,463 0,079 0,465 0,0888 0,0468 0,05 0, ,006 0,054 0,3 0,00 0,5 0,040 0,553 0,04 0,057 0, ,0008 0,037 0,0555 0,0 0,80 0,099 0,008 0,63 0,3 0, ,000 0,008 0,080 0,0550 0,0 0,649 0,98 0,983 0,684 0, 7 0,0000 0,0004 0,0045 0,097 0,054 0,00 0,54 0,889 0,969 0, ,0000 0,000 0,0009 0,0055 0,097 0,0487 0,093 0,47 0,8 0, ,0000 0,0000 0,000 0,00 0,0058 0,085 0,044 0,0840 0,38 0, ,0000 0,0000 0,0000 0,000 0,004 0,0056 0,067 0,039 0,0755 0, 0,0000 0,0000 0,0000 0,0000 0,000 0,003 0,0049 0,04 0,0337 0,0667 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,00 0,0040 0,05 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0008 0,009 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,48 0,668 0,063 0,05 0,0075 0,003 0,0007 0,000 0,0000 0,0000 0,374 0,350 0,893 0,0957 0,046 0,069 0,0060 0,009 0,0005 0,000 0,575 0,800 0,673 0,94 0,36 0,058 0,060 0,00 0,0035 0, ,045 0,556 0,359 0,393 0,893 0,45 0,070 0,034 0,044 0, ,0076 0,0605 0,457 0,093 0,09 0,868 0,30 0,0796 0,04 0,08 5 0,000 0,075 0,0668 0,36 0,94 0,08 0,849 0,379 0,0875 0, ,000 0,0039 0,036 0,0680 0,76 0,784 0,99 0,839 0,43 0, ,0000 0,0007 0,0065 0,067 0,0668 0,0 0,685 0,97 0,84 0, ,0000 0,000 0,004 0,0084 0,079 0,0644 0,34 0,606 0,883 0, ,0000 0,0000 0,0003 0,00 0,0093 0,076 0,06 0,070 0,540 0, ,0000 0,0000 0,0000 0,0004 0,005 0,0095 0,063 0,057 0,008 0,484 0,0000 0,0000 0,0000 0,000 0,0005 0,006 0,0090 0,04 0,055 0,0944 0,0000 0,0000 0,0000 0,0000 0,000 0,0006 0,004 0,008 0,05 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,00 0,0068 0,08 4 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0004 0,006 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0003 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,397 0,50 0,0536 0,080 0,0056 0,006 0,0004 0,000 0,0000 0,0000 0,3763 0,300 0,704 0,08 0,0338 0,06 0,004 0,00 0,0003 0,000 0,683 0,835 0,556 0,73 0,0958 0,0458 0,090 0,0069 0,00 0, ,0473 0,680 0,406 0,97 0,704 0,046 0,0547 0,046 0,0095 0, ,0093 0,0700 0,59 0,53 0,30 0,68 0,04 0,064 0,09 0,07 5 0,004 0,08 0,0787 0,507 0,988 0,07 0,664 0,46 0,0666 0, ,000 0,005 0,030 0,086 0,436 0,873 0,94 0,655 0,8 0, ,0000 0,000 0,009 0,0350 0,080 0,376 0,79 0,89 0,657 0,4 8 0,0000 0,000 0,00 0,00 0,0376 0,08 0,37 0,734 0,864 0, ,0000 0,0000 0,0004 0,0033 0,039 0,0386 0,0794 0,84 0,694 0, ,0000 0,0000 0,000 0,0008 0,004 0,049 0,0385 0,077 0,48 0,669 0,0000 0,0000 0,0000 0,000 0,000 0,0046 0,05 0,0374 0,074 0,4 0,0000 0,0000 0,0000 0,0000 0,000 0,00 0,0047 0,045 0,0354 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,00 0,0045 0,034 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,00 0,0039 0,07 5 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0009 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 p 57

158 n k 0,05 0,0 0,5 0,0 0,5 0,30 0,35 0,40 0,45 0, ,3774 0,35 0,0456 0,044 0,004 0,00 0,0003 0,000 0,0000 0,0000 0,3774 0,85 0,59 0,0685 0,068 0,0093 0,009 0,0008 0,000 0,0000 0,787 0,85 0,48 0,540 0,0803 0,0358 0,038 0,0046 0,003 0, ,0533 0,796 0,48 0,8 0,57 0,0869 0,04 0,075 0,006 0, ,0 0,0798 0,74 0,8 0,03 0,49 0,0909 0,0467 0,003 0, ,008 0,066 0,0907 0,636 0,03 0,96 0,468 0,0933 0,0497 0,0 6 0,000 0,0069 0,0374 0,0955 0,574 0,96 0,844 0,45 0,0949 0, ,0000 0,004 0,0 0,0443 0,0974 0,55 0,844 0,797 0,443 0, ,0000 0,000 0,003 0,066 0,0487 0,098 0,489 0,797 0,77 0,44 9 0,0000 0,0000 0,0007 0,005 0,098 0,054 0,0980 0,464 0,77 0,76 0 0,0000 0,0000 0,000 0,003 0,0066 0,00 0,058 0,0976 0,449 0,76 0,0000 0,0000 0,0000 0,0003 0,008 0,0077 0,033 0,053 0,0970 0,44 0,0000 0,0000 0,0000 0,0000 0,0004 0,00 0,0083 0,037 0,059 0, ,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,004 0,0085 0,033 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0006 0,004 0,008 0,0 5 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0,00 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,0005 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,3585 0,6 0,0388 0,05 0,003 0,0008 0,000 0,0000 0,0000 0,0000 0,3774 0,70 0,368 0,0576 0,0 0,0068 0,000 0,0005 0,000 0,0000 0,887 0,85 0,93 0,369 0,0669 0,078 0,000 0,003 0,0008 0, ,0596 0,90 0,48 0,054 0,339 0,076 0,033 0,03 0,0040 0,00 4 0,033 0,0898 0,8 0,8 0,897 0,304 0,0738 0,0350 0,039 0, ,00 0,039 0,08 0,746 0,03 0,789 0,7 0,0746 0,0365 0, ,0003 0,0089 0,0454 0,09 0,686 0,96 0,7 0,44 0,0746 0, ,0000 0,000 0,060 0,0545 0,4 0,643 0,844 0,659 0, 0, ,0000 0,0004 0,0046 0,0 0,0609 0,44 0,64 0,797 0,63 0,0 9 0,0000 0,000 0,00 0,0074 0,07 0,0654 0,58 0,597 0,77 0,60 0 0,0000 0,0000 0,000 0,000 0,0099 0,0308 0,0686 0,7 0,593 0,76 0,0000 0,0000 0,0000 0,0005 0,0030 0,00 0,0336 0,070 0,85 0,60 0,0000 0,0000 0,0000 0,000 0,0008 0,0039 0,036 0,0355 0,077 0,0 3 0,0000 0,0000 0,0000 0,0000 0,000 0,000 0,0045 0,046 0,0366 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,00 0,0049 0,050 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,003 0,0049 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,003 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 0,00 8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0, ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,

159 II. táblázat. Posson-eloszlás λ k 0, 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9,0 0 0,904 0,88 0,740 0,670 0,606 0,548 0,496 0,449 0,406 0,367 0,090 0,63 0, 0,68 0,303 0,39 0,347 0,359 0,365 0,367 0,004 0,06 0,033 0,053 0,075 0,098 0, 0,43 0,64 0,83 3 0,000 0,00 0,003 0,007 0,0 0,09 0,08 0,038 0,049 0,06 4 0,000 0,000 0,000 0,000 0,00 0,003 0,005 0,007 0,0 0,05 5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k,,,3,4,5,6,7,8,9,0 0 0,33 0,30 0,7 0,46 0,3 0,0 0,8 0,65 0,49 0,35 0,366 0,36 0,354 0,345 0,334 0,33 0,30 0,97 0,84 0,70 0,0 0,6 0,30 0,4 0,5 0,58 0,64 0,67 0,70 0,70 3 0,073 0,086 0,099 0, 0,5 0,37 0,49 0,60 0,7 0,80 4 0,00 0,06 0,03 0,039 0,047 0,055 0,063 0,07 0,08 0, ,004 0,006 0,008 0,0 0,04 0,07 0,0 0,06 0,030 0, ,000 0,00 0,00 0,00 0,003 0,004 0,006 0,007 0,009 0,0 7 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k,,,3,4,5,6,7,8,9 3,0 0 0, 0,0 0,00 0,090 0,08 0,074 0,067 0,060 0,055 0,049 0,57 0,43 0,30 0,7 0,05 0,93 0,8 0,70 0,59 0,49 0,70 0,68 0,65 0,6 0,56 0,5 0,45 0,38 0,3 0,4 3 0,89 0,96 0,03 0,09 0,3 0,7 0,0 0, 0,3 0,4 4 0,099 0,08 0,6 0,5 0,33 0,4 0,48 0,55 0,6 0,68 5 0,04 0,047 0,053 0,060 0,066 0,073 0,080 0,087 0,094 0,00 6 0,04 0,07 0,00 0,04 0,07 0,03 0,036 0,040 0,045 0, ,004 0,005 0,006 0,008 0,009 0,0 0,03 0,06 0,08 0,0 8 0,00 0,00 0,00 0,00 0,003 0,003 0,004 0,005 0,006 0, ,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 3, 3, 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0 0,045 0,040 0,036 0,033 0,030 0,07 0,04 0,0 0,00 0,08 0,39 0,30 0, 0,3 0,05 0,098 0,09 0,085 0,078 0,073 0,6 0,08 0,00 0,9 0,85 0,77 0,69 0,6 0,53 0,46 3 0,3 0, 0,0 0,8 0,5 0, 0,08 0,04 0,00 0,95 4 0,73 0,78 0,8 0,85 0,88 0,9 0,93 0,94 0,95 0,95 5 0,07 0,4 0,0 0,6 0,3 0,37 0,4 0,47 0,5 0,56 6 0,055 0,060 0,066 0,07 0,077 0,08 0,088 0,093 0,098 0,04 7 0,04 0,07 0,03 0,034 0,038 0,04 0,046 0,050 0,055 0, ,009 0,0 0,0 0,04 0,06 0,09 0,0 0,04 0,06 0,09 59

160 9 0,003 0,004 0,004 0,005 0,006 0,007 0,008 0,00 0,0 0,03 0 0,00 0,00 0,00 0,00 0,00 0,00 0,003 0,003 0,004 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 4, 4, 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 0 0,06 0,05 0,03 0,0 0,0 0,00 0,009 0,008 0,007 0,006 0,067 0,063 0,058 0,054 0,050 0,046 0,04 0,039 0,036 0,033 0,39 0,3 0,5 0,8 0, 0,06 0,00 0,094 0,089 0, ,90 0,85 0,79 0,74 0,68 0,63 0,57 0,5 0,46 0,40 4 0,95 0,94 0,93 0,9 0,89 0,87 0,84 0,8 0,78 0,75 5 0,60 0,63 0,66 0,68 0,70 0,7 0,73 0,74 0,75 0,75 6 0,09 0,4 0,9 0,3 0,8 0,3 0,36 0,39 0,43 0,46 7 0,064 0,068 0,073 0,077 0,08 0,086 0,09 0,095 0,00 0,04 8 0,03 0,036 0,039 0,04 0,046 0,050 0,053 0,057 0,06 0, ,05 0,06 0,08 0,00 0,03 0,05 0,08 0,030 0,033 0, ,006 0,007 0,008 0,009 0,00 0,0 0,03 0,04 0,06 0,08 0,00 0,00 0,003 0,003 0,004 0,004 0,005 0,006 0,007 0,008 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0,00 0,003 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 4 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 5, 5, 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0 0 0,006 0,005 0,005 0,004 0,004 0,003 0,003 0,003 0,00 0,00 0,03 0,08 0,06 0,04 0,0 0,00 0,09 0,07 0,06 0,04 0,079 0,074 0,070 0,065 0,06 0,058 0,054 0,050 0,047 0, ,34 0,9 0,3 0,8 0,3 0,08 0,03 0,098 0,093 0, ,7 0,68 0,64 0,60 0,55 0,5 0,47 0,4 0,38 0,33 5 0,75 0,74 0,74 0,7 0,7 0,69 0,67 0,65 0,63 0,60 6 0,49 0,5 0,53 0,55 0,57 0,58 0,59 0,60 0,60 0,60 7 0,08 0, 0,6 0,0 0,3 0,6 0,9 0,3 0,35 0,37 8 0,069 0,073 0,077 0,08 0,084 0,088 0,09 0,096 0,099 0,03 9 0,039 0,04 0,045 0,048 0,05 0,055 0,058 0,06 0,065 0, ,00 0,0 0,04 0,06 0,08 0,030 0,033 0,035 0,038 0,04 0,009 0,00 0,0 0,0 0,04 0,05 0,07 0,09 0,00 0,0 0,003 0,004 0,005 0,005 0,006 0,007 0,008 0,009 0,00 0,0 3 0,00 0,00 0,00 0,00 0,00 0,003 0,003 0,004 0,004 0, ,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0,00 5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 6, 6, 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 0 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,000 0,03 0,0 0,0 0,00 0,009 0,009 0,008 0,007 0,007 0,006 0,04 0,039 0,036 0,034 0,03 0,09 0,07 0,05 0,04 0,0 3 0,084 0,080 0,076 0,07 0,068 0,065 0,06 0,058 0,055 0,05 60

161 4 0,9 0,4 0,0 0,6 0, 0,07 0,03 0,099 0,095 0,09 5 0,57 0,54 0,5 0,48 0,45 0,4 0,38 0,34 0,3 0,7 6 0,60 0,60 0,59 0,58 0,57 0,56 0,54 0,5 0,5 0,49 7 0,39 0,4 0,43 0,45 0,46 0,47 0,48 0,48 0,48 0,49 8 0,06 0,09 0,3 0,6 0,8 0, 0,4 0,6 0,8 0,30 9 0,07 0,075 0,079 0,08 0,085 0,089 0,09 0,095 0,098 0,0 0 0,044 0,046 0,049 0,05 0,055 0,058 0,06 0,064 0,067 0,07 0,04 0,06 0,08 0,030 0,033 0,035 0,037 0,040 0,04 0,045 0,0 0,03 0,05 0,06 0,07 0,09 0,0 0,0 0,04 0,06 3 0,005 0,006 0,007 0,008 0,008 0,009 0,00 0,0 0,03 0,04 4 0,00 0,00 0,003 0,003 0,004 0,004 0,005 0,005 0,006 0, ,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0, ,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 7 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 7, 7, 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,005 0,005 0,004 0,004 0,004 0,003 0,003 0,003 0,00 0,00 0,00 0,09 0,08 0,06 0,05 0,04 0,03 0,0 0,0 0,00 3 0,049 0,046 0,043 0,04 0,038 0,036 0,034 0,03 0,030 0,08 4 0,087 0,083 0,079 0,076 0,07 0,069 0,066 0,063 0,060 0, ,4 0,0 0,6 0,3 0,09 0,05 0,0 0,098 0,095 0,09 6 0,46 0,44 0,4 0,39 0,36 0,33 0,3 0,8 0,5 0, 7 0,48 0,48 0,48 0,47 0,46 0,45 0,44 0,4 0,4 0,39 8 0,3 0,33 0,35 0,36 0,37 0,38 0,38 0,39 0,39 0,39 9 0,04 0,07 0,09 0, 0,4 0,6 0,8 0,0 0, 0,4 0 0,074 0,077 0,080 0,08 0,085 0,088 0,09 0,094 0,096 0,099 0,047 0,050 0,053 0,055 0,058 0,06 0,064 0,066 0,069 0,07 0,08 0,030 0,03 0,034 0,036 0,038 0,04 0,043 0,045 0, ,05 0,06 0,08 0,09 0,0 0,0 0,04 0,06 0,07 0,09 4 0,007 0,008 0,009 0,00 0,0 0,0 0,03 0,04 0,05 0,06 5 0,003 0,004 0,004 0,005 0,005 0,006 0,006 0,007 0,008 0, ,00 0,00 0,00 0,00 0,00 0,003 0,003 0,003 0,004 0, ,000 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0,00 0,00 8 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 8, 8, 8,3 8,4 8,5 8,6 8,7 8,8 8,9 9,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,009 0,008 0,007 0,007 0,006 0,006 0,005 0,005 0, ,06 0,05 0,03 0,0 0,00 0,09 0,08 0,07 0,06 0,05 4 0,054 0,05 0,049 0,046 0,044 0,04 0,039 0,037 0,035 0, ,088 0,084 0,08 0,078 0,075 0,07 0,069 0,066 0,063 0, ,9 0,6 0, 0,09 0,06 0,03 0,00 0,097 0,094 0,09 6

162 7 0,37 0,35 0,33 0,3 0,9 0,7 0,4 0, 0,9 0,7 8 0,39 0,39 0,38 0,38 0,37 0,36 0,35 0,34 0,33 0,3 9 0,5 0,6 0,8 0,9 0,9 0,30 0,3 0,3 0,3 0,3 0 0,0 0,04 0,06 0,08 0,0 0, 0,4 0,5 0,7 0,8 0,074 0,077 0,080 0,08 0,085 0,087 0,090 0,09 0,094 0,097 0,050 0,053 0,055 0,057 0,060 0,06 0,065 0,067 0,070 0,07 3 0,03 0,033 0,035 0,037 0,039 0,04 0,043 0,045 0,048 0, ,08 0,09 0,0 0,0 0,04 0,05 0,07 0,08 0,030 0,03 5 0,009 0,00 0,0 0,0 0,03 0,04 0,05 0,06 0,08 0,09 6 0,005 0,005 0,006 0,006 0,007 0,007 0,008 0,009 0,00 0,00 7 0,00 0,00 0,00 0,003 0,003 0,004 0,004 0,004 0,005 0, ,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 9 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,00 0,00 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 λ k 9, 9, 9,3 9,4 9,5 9,6 9,7 9,8 9,9 0,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,004 0,004 0,004 0,003 0,003 0,003 0,00 0,00 0,00 0,00 3 0,04 0,03 0,0 0,0 0,00 0,00 0,009 0,008 0,008 0, ,03 0,030 0,08 0,06 0,05 0,04 0,0 0,0 0,00 0,08 5 0,058 0,055 0,053 0,050 0,048 0,046 0,043 0,04 0,039 0, ,088 0,085 0,08 0,079 0,076 0,073 0,070 0,068 0,065 0, ,4 0, 0,09 0,06 0,03 0,0 0,098 0,095 0,09 0, ,30 0,8 0,6 0,5 0,3 0, 0,9 0,7 0,4 0, 9 0,3 0,3 0,3 0,30 0,30 0,9 0,8 0,7 0,6 0,5 0 0,9 0, 0, 0, 0,3 0,4 0,4 0,4 0,5 0,5 0,099 0,0 0,03 0,04 0,06 0,08 0,09 0, 0, 0,3 0,075 0,077 0,079 0,08 0,084 0,086 0,088 0,090 0,09 0, ,05 0,054 0,057 0,059 0,06 0,064 0,066 0,068 0,070 0,07 4 0,034 0,036 0,038 0,039 0,04 0,043 0,045 0,047 0,050 0,05 5 0,00 0,0 0,03 0,05 0,06 0,08 0,09 0,03 0,033 0, ,0 0,0 0,03 0,04 0,05 0,06 0,08 0,09 0,00 0,0 7 0,006 0,006 0,007 0,008 0,008 0,009 0,00 0,0 0,0 0,0 8 0,003 0,003 0,003 0,004 0,004 0,005 0,005 0,006 0,006 0, ,00 0,00 0,00 0,00 0,00 0,00 0,00 0,003 0,003 0, ,000 0,000 0,000 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 6

163 λ k,0,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 0,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,003 0,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,00 0,005 0,00 0,00 0,000 0,000 0,000 0,000 0,000 0, ,0 0,0 0,007 0,003 0,00 0,00 0,000 0,000 0,000 0, ,04 0,05 0,05 0,008 0,004 0,00 0,00 0,000 0,000 0, ,064 0,043 0,08 0,07 0,00 0,006 0,003 0,00 0,00 0, ,088 0,065 0,045 0,030 0,09 0,0 0,007 0,004 0,00 0,00 9 0,08 0,087 0,066 0,047 0,03 0,0 0,03 0,008 0,005 0,00 0 0,9 0,04 0,085 0,066 0,048 0,034 0,03 0,05 0,009 0,005 0,9 0,4 0,0 0,084 0,066 0,049 0,035 0,04 0,06 0,00 0,09 0,4 0,09 0,098 0,08 0,066 0,050 0,036 0,05 0,07 3 0,09 0,05 0,09 0,06 0,095 0,08 0,065 0,050 0,037 0,07 4 0,07 0,090 0,0 0,06 0,0 0,093 0,080 0,065 0,05 0, ,053 0,07 0,088 0,098 0,0 0,099 0,090 0,078 0,065 0,05 6 0,036 0,054 0,07 0,086 0,096 0,099 0,096 0,088 0,077 0, ,03 0,038 0,055 0,07 0,084 0,093 0,096 0,093 0,086 0, ,04 0,05 0,039 0,055 0,070 0,083 0,090 0,093 0,09 0, ,008 0,06 0,07 0,040 0,055 0,069 0,08 0,088 0,09 0, ,004 0,009 0,07 0,08 0,04 0,055 0,069 0,079 0,086 0,088 0,00 0,005 0,00 0,09 0,09 0,04 0,056 0,068 0,078 0,084 0,00 0,003 0,006 0,0 0,00 0,03 0,043 0,056 0,067 0, ,000 0,00 0,003 0,007 0,03 0,0 0,03 0,043 0,055 0, ,000 0,000 0,00 0,004 0,008 0,04 0,0 0,03 0,044 0, ,000 0,000 0,00 0,00 0,005 0,009 0,05 0,03 0,033 0, ,000 0,000 0,000 0,00 0,00 0,005 0,00 0,06 0,04 0, ,000 0,000 0,000 0,000 0,00 0,003 0,006 0,00 0,07 0,05 8 0,000 0,000 0,000 0,000 0,000 0,00 0,003 0,007 0,0 0,08 9 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,004 0,007 0,0 30 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,00 0,004 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0,003 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0, ,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 63

164 0 III. táblázat Standard normáls eloszlású valószínűség változó eloszlásfüggvényének táblázata ( u) Φ( u) Φ u Φ(u) u Φ(u) u Φ(u) u Φ(u) u Φ(u)

165 IV. táblázat α χ -eloszlás α DF

166 V. táblázat Student- (t-) eloszlás t α DF t t 0.99 t t 0.95 t 0.90 t 0.80 t 0.75 t 0.70 t

167 VI. táblázat α0,05 α00 F-eloszlás α 0,05 DF F DF

168 VII. táblázat α0,0 α00 F-eloszlás α 0,0 DF F DF

A sokaság/minta eloszlásának jellemzése

A sokaság/minta eloszlásának jellemzése 3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,

Részletesebben

Általános Statisztika

Általános Statisztika Budapest Mőszak és Gazdaságtudomány Egyetem Gazdaság- és Társadalomtudomány Kar Nyugat-Magyarország Egyetem Savara Egyetem Központ Dr. Köves János Dr. Tóth Zsuzsanna Eszter Általános Statsztka oktatás

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer? 01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó

Részletesebben

4 2 lapultsági együttható =

4 2 lapultsági együttható = Leíró statsztka Egy kísérlet végeztével általában tetemes mennységű adat szokott összegyűln. Állandó probléma, hogy mt s kezdjünk - lletve mt tudunk kezden az adatokkal. A statsztka ebben segít mnket.

Részletesebben

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i . konzult. LEV. 013. ápr. 5. MENNYISÉGI ISMÉRV szernt ELEMZÉS Tk. 3-8., 88-90. oldal, kmarad: 70., 74. oldal A mennység smérv (X) lehet: dszkrét és folytonos. A rangsor a mennység smérv értékenek monoton

Részletesebben

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége,

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Élettan Anatóma Kéma Lehet kérdés?? Statsztka! Az orvos döntéseket hoz! Mkor jó egy döntés? Mennyre helyes egy döntés? Mekkora a tévedés lehetősége? Példa: test

Részletesebben

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás. Statsztka próbák Paraméteres. A populácó paraméteret becsüljük, ezekkel számolunk.. Az alapsokaság eloszlására van kkötés. Nem paraméteres Nncs lyen becslés Nncs kkötés Ugyanazon problémára sokszor megvan

Részletesebben

Regresszió. Fő cél: jóslás Történhet:

Regresszió. Fő cél: jóslás Történhet: Fő cél: jóslás Történhet: Regresszó 1 változó több változó segítségével Lépések: Létezk-e valamlyen kapcsolat a 2 változó között? Kapcsolat természetének leírása (mat. egy.) A regresszós egyenlet alapján

Részletesebben

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 3. előadás Előadó: Dr. Ertsey Imre Vszonyszámok Statsztka munka: adatgyűjtés, rendszerezés, összegzés, értékelés. Vszonyszámok: Két statsztka adat arányát kfejező számok, Az un. leszármaztatott

Részletesebben

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Korrelációs kapcsolatok elemzése

Korrelációs kapcsolatok elemzése Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Adatsorok jellegadó értékei

Adatsorok jellegadó értékei Adatsorok jellegadó értéke Varga Ágnes egyetem tanársegéd [email protected] Terület és térnformatka kvanttatív elemzés módszerek BCE Geo Intézet Terület elemzés forgatókönyve vacsora hasonlat Terület

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Lineáris regresszió. Statisztika I., 4. alkalom

Lineáris regresszió. Statisztika I., 4. alkalom Lneárs regresszó Statsztka I., 4. alkalom Lneárs regresszó Ha két folytonos változó lneárs kapcsolatban van egymással, akkor az egyk segítségével elıre jelezhetjük a másk értékét. Szükségünk van a függı

Részletesebben

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege A multkrtérumos elemzés célja, alkalmazás területe, adat-transzformácós eljárások, az osztályozás eljárások lényege Cél: tervváltozatok, objektumok értékelése (helyzetértékelés), döntéshozatal segítése

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! SPEC 2009-2010. II. félév Statsztka II HÁZI dolgozat Név:... Neptun kód: 20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! 1. példa Egy üzemben tejport csomagolnak zacskókba,

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c [email protected] Last Revision

Részletesebben

Az entrópia statisztikus értelmezése

Az entrópia statisztikus értelmezése Az entrópa statsztkus értelmezése A tapasztalat azt mutatja hogy annak ellenére hogy egy gáz molekulá egyed mozgást végeznek vselkedésükben mégs szabályszerűségek vannak. Statsztka jellegű vselkedés szabályok

Részletesebben

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

VARIANCIAANALÍZIS (szóráselemzés, ANOVA) VARIANCIAANAÍZIS (szóráselemzés, ANOVA) Varancaanalízs. Varancaanalízs (szóráselemzés, ANOVA) Adott: egy vagy több tetszőleges skálájú független változó és egy legalább ntervallum skálájú függő változó.

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László [email protected] Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak. 8. GYAKORLAT STATISZTIKAI PRÓBÁK ISMÉTLÉS: Tanult nem paraméteres próbák, és hogy mlyen probléma megoldására szolgálnak. Név Illeszkedésvzsgálat Χ próbával Illeszkedésvzsgálat grafkus úton Gauss papírral

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI, Bevezetés a bometrába Dr. Dnya Elek egyetem tanár PhD kurzus. KOKI, 205.0.08. ADATREDUKCIÓ I. Középértékek Adatredukcó. M a középérték: azonos fajta számszerű adatok közös jellemzője. 2. Követelmények:

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr. Korrelácó-számítás 1. előadás Döntéselőkészítés módszertana Dr. Varga Beatr Két változó között kapcsolat Függetlenség: Az X smérv szernt hovatartozás smerete nem ad semmlen többletnformácót az Y szernt

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás. Centrális mutatók STATISZTIKA I. 4. Előadás Centrális mutatók 1/51 2/51 Középértékek Helyzeti középértékek A meghatározása gyakoriság vagy sorszám alapján Számítás nélkül Az elemek nagyság szerint rendezett

Részletesebben

Az elektromos kölcsönhatás

Az elektromos kölcsönhatás TÓTH.: lektrosztatka/ (kbővített óravázlat) z elektromos kölcsönhatás Rég tapasztalat, hogy megdörzsölt testek különös erőket tudnak kfejten. Így pl. megdörzsölt műanyagok (fésű), megdörzsölt üveg- vagy

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: [email protected] Korrelációszámítás

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 4. előadás Előadó: Dr. Ertsey Imre KÖZÉPÉRTÉKEK A statsztka sor általáos jellemzésére szolgálak, a statsztka sokaságot egy számmal jellemzk. Számított középértékek: matematka számítás eredméyekét

Részletesebben

METROLÓGIA ÉS HIBASZÁMíTÁS

METROLÓGIA ÉS HIBASZÁMíTÁS METROLÓGIA ÉS HIBASZÁMíTÁS Metrológa alapfogalmak A metrológa a mérések tudománya, a mérésekkel kapcsolatos smereteket fogja össze. Méréssel egy objektum valamlyen tulajdonságáról számszerű értéket kapunk.

Részletesebben

Bevezető Mi a statisztika? Mérés Csoportosítás

Bevezető Mi a statisztika? Mérés Csoportosítás Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László ([email protected]) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető

Részletesebben

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai. 2010.11.08. Magyar Tudomány Napja. Gábor Dénes Főiskola

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai. 2010.11.08. Magyar Tudomány Napja. Gábor Dénes Főiskola Dr. Ratkó István Matematka módszerek orvos alkalmazása 200..08. Magyar Tudomány Napja Gábor Dénes Főskola A valószínűségszámítás és matematka statsztka főskola oktatásakor a hallgatók néha megkérdezk egy-egy

Részletesebben

matematikai statisztika

matematikai statisztika Az újságokban, plakátokon, reklámkiadványokban sokszor találkozunk ilyen grafikonokkal, ezért szükséges, hogy megértsük, és jól tudjuk értelmezni őket. A második grafikon ismerős lehet, hiszen a függvények

Részletesebben

Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot

Részletesebben

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő Figyelem! A példasor nem tartalmazza valamennyi típuspéldát. A dolgozatban az órán leadott feladatok közül bármely típusú előfordulhat. A példasor már a második dolgozat anyagát gyakorló feladatokat is

Részletesebben

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula KOMBINATORIKA ELŐADÁS osztatlan matematka tanár hallgatók számára Szta formula Előadó: Hajnal Péter 2015. 1. Bevezető példák 1. Feladat. Hány olyan sorbaállítása van a a, b, c, d, e} halmaznak, amelyben

Részletesebben

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus) Valószínűségszámítás Valószínűség (probablty) 0 és 1 között valós szám, amely egy esemény bekövetkezésének esélyét fejez k: 0 - (sznte) lehetetlen, 0.5 - azonos eséllyel gen vagy nem, 1 - (sznte) bztos

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció Közlekedés létesítmények élettartamra vonatkozó hatékonyság vzsgálat módszerenek fejlesztése PhD Dsszertácó Budapest, 2006 Alulírott kjelentem, hogy ezt a doktor értekezést magam készítettem, és abban

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

Statisztikai alapfogalmak

Statisztikai alapfogalmak i alapfogalmak statisztikai sokaság: a megfigyelés tárgyát képező egyedek összessége 2 csoportja van: álló sokaság: mindig vmiféle állapotot, állományt fejez ki, adatai egy adott időpontban értelmezhetők

Részletesebben

Indexszámítás során megválaszolandó kérdések. Hogyan változott a termelés értéke, az értékesítés árbevétele, az értékesítési forgalom?

Indexszámítás során megválaszolandó kérdések. Hogyan változott a termelés értéke, az értékesítés árbevétele, az értékesítési forgalom? Index-számítás Indexszámítás során megálaszolandó kérdések Hogyan áltozott a termelés értéke, az értékesítés árbeétele, az értékesítés forgalom? Hogyan áltozott a termelés, értékesítés mennysége? Hogyan

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját 376 Statisztika, valószínûség-számítás 1500. Az elsô kérdésre egyszerû válaszolni, elég egy ellenpélda, és biztosan nem lehet akkor így kiszámolni. Pl. legyen a három szám a 3; 5;. A két kisebb szám átlaga

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása A változók mérési szintjei STATISZTIKA I. 3. Előadás Az adatok mérési szintjei, Viszonyszámok A változók az alábbi típusba tartozhatnak: Nominális (kategorikus és diszkrét) Ordinális Intervallum skála

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika Fuzzy rendszerek A fuzzy halmaz és a fuzzy logka A hagyományos kétértékű logka, melyet évezredek óta alkalmazunk a tudományban, és amelyet George Boole (1815-1864) fogalmazott meg matematkalag, azon a

Részletesebben

[GVMGS11MNC] Gazdaságstatisztika

[GVMGS11MNC] Gazdaságstatisztika [GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László [email protected] Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László ([email protected])

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék [email protected] Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

Számelmélet Megoldások

Számelmélet Megoldások Számelmélet Megoldások 1) Egy számtani sorozat második tagja 17, harmadik tagja 1. a) Mekkora az első 150 tag összege? (5 pont) Kiszámoltuk ebben a sorozatban az első 111 tag összegét: 5 863. b) Igaz-e,

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

2. előadás. Viszonyszámok típusai

2. előadás. Viszonyszámok típusai 2. előadás Viszonyszámok típusai Mérési skálák Nominális /névleges skála: kötetlen hozzárendelése a számoknak Sorrendi / Ordinális skála: sokaság egyedeinek egy közös tulajdonság szerinti sorbarendezése

Részletesebben

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László Gyakorló feladatok Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László I/. A vizsgaidőszak második napján a hallgatók %-ának az E épületben, %-ának a D épületben,

Részletesebben