Általános Statisztika

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Általános Statisztika"

Átírás

1 Budapest Mőszak és Gazdaságtudomány Egyetem Gazdaság- és Társadalomtudomány Kar Nyugat-Magyarország Egyetem Savara Egyetem Központ Dr. Köves János Dr. Tóth Zsuzsanna Eszter Általános Statsztka oktatás segédanyag Budapest 008

2 Tartalomjegyzék. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPOK A VALÓSZÍNŐSÉGSZÁMÍTÁS TÁRGYA A VALÓSZÍNŐSÉG FOGALMA A VALÓSZÍNŐSÉGSZÁMÍTÁS AXIÓMARENDSZERE A VALÓSZÍNŐSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI A VALÓSZÍNŐSÉGSZÁMÍTÁS JELENTİSÉGE A MŐSZAKI-GAZDASÁGI ELEMZÉSEKBEN VALÓSZÍNŐSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŐSÉG, ESEMÉNYEK FÜGGETLENSÉGE VALÓSZÍNŐSÉGSZÁMÍTÁSI TÉTELEK A FELTÉTELES VALÓSZÍNŐSÉG FOGALMA A TELJES VALÓSZÍNŐSÉG TÉTELE BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŐSÉGÉNEK TÉTELE") ESEMÉNYEK FÜGGETLENSÉGE LEÍRÓ STATISZTIKA A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI AZ ADATOK ÁBRÁZOLÁSA TAPASZTALATI ELOSZLÁSOK A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI AZ INGADOZÁS MÉRİSZÁMAI AZ ELOSZLÁS ALAKJÁT JELLEMZİ EGYÉB MUTATÓSZÁMOK ESETTANULMÁNY LEÍRÓ STATISZTIKAI ELEMZÉS VISZONYSZÁMOK KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK A KAPCSOLAT SZEMLÉLTETÉSE AZ ELİJEL KORRELÁCIÓS EGYÜTTHATÓ A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ AUTO- ÉS KERESZTKORRELÁCIÓ IDİSOROK ELEMZÉSÉNÉL VALÓSZÍNŐSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK A VALÓSZÍNŐSÉGI VÁLTOZÓ VALÓSZÍNŐSÉGI VÁLTOZÓ JELLEMZİI BINOMIÁLIS ELOSZLÁS POISSON-ELOSZLÁS EXPONENCIÁLIS ELOSZLÁS NORMÁLIS (GAUSS-) ELOSZLÁS A KÖZPONTI HATÁRELOSZLÁS TÉTELE STATISZTIKAI DÖNTÉSEK ALAPELVEI ESETPÉLDA DÖNTÉSI ALAPMODELL DÖNTÉSI MÁTRIX A DÖNTÉSI FOLYAMAT LOGIKÁJA DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI BECSLÉS A BECSLÉS TULAJDONSÁGAI A PONTBECSLÉS MÓDSZEREI INTERVALLUMBECSLÉS... 08

3 8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA VARIANCIAANALÍZIS KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE A REGRESSZIÓS BECSLÉS PONTOSSÁGA FELHASZNÁLT ÉS AJÁNLOTT IRODALOM FÜGGELÉK: TÁBLÁZATOK

4 . VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPOK Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 4

5 .. A VALÓSZÍNŐSÉGSZÁMÍTÁS TÁRGYA A véletlen jelenség fogalma: A tömegjelenség fogalma: 5

6 .. A VALÓSZÍNŐSÉG FOGALMA A valószínőség fogalma A n f(a) g( A) f ( A) n lm n g( A) P( A) Készítette: Erde János. ábra: A valószínőség fogalma.3. A VALÓSZÍNŐSÉGSZÁMÍTÁS AXIÓMARENDSZERE (Kolmogorov 93/3) I. Egy tetszıleges A esemény bekövetkezés valószínősége 0 P(A). II. A bztos esemény valószínősége, azaz P(Ω). III. Ha A és B egymást kzáró események, azaz A B 0, akkor P(A+B) P(A) + P(B). 6

7 .4. A VALÓSZÍNŐSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI Klasszkus valószínőség-meghatározás: Geometra úton: Valószínőségszámítás tételek segítségével: Emprkus adatokból: Elmélet eloszlások segítségével: Szubjektív becsléssel: 7

8 .5. A VALÓSZÍNŐSÉGSZÁMÍTÁS JELENTİSÉGE A MŐSZAKI-GAZDASÁGI ELEMZÉSEKBEN 8

9 . VALÓSZÍNŐSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŐSÉG, ESEMÉNYEK FÜGGETLENSÉGE Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 9

10 .. VALÓSZÍNŐSÉGSZÁMÍTÁSI TÉTELEK Tétel: Ha A és B egy eseményalgebra két tetszıleges eseménye, akkor annak valószínősége, hogy közülük legalább egy bekövetkezk: P( A+ B) P( A) + P( B) P( A B) Bzonyítás: Tétel: Ha A esemény bekövetkezése maga után vonja a B esemény bekövetkezését, azaz A B, akkor: P( B A) P( B) P( A) és P( A) P( B) Bzonyítás: Feladat: Mutassuk k, hogy P(A) 0,7 és P(B) 0,9 esetén P(A B) 0,6. 0

11 Feladat: Próbagyártás után két szempontból vzsgáljuk a késztermékeket. Az A esemény azt jelent, hogy a vzsgált gyártmány anyaghbás, a B esemény pedg azt, hogy mérethbás. Az A esemény P(A)0,5, a B esemény P(B)0,3 és az A B esemény P(A B)0,08 valószínőséggel következk be. M a valószínősége annak, hogy valamely késztermék hbátlan? Feladat: Egy skola tanulónál a jeles matematka és a jeles fzka osztályzatokat fgyeljük. A következı eseményeket vezetjük be tetszılegesen kválasztott tanulókra: A: jeles osztályzata van matematkából, B: jeles osztályzata van fzkából. Ismeretesek a következık: annak valószínősége, hogy egy véletlen kválasztott tanulónak jelese van fzkából: P(B)0,; hogy jelese van matematkából és fzkából: P(A B)0,09; hogy a matematka és fzka tárgyak közül legalább egykbıl jeles az osztályzata: P(A+B)0,6. M a valószínősége annak, hogy egy tetszılegesen kválasztott tanulónak jeles osztályzata van matematkából?

12 .. A FELTÉTELES VALÓSZÍNŐSÉG FOGALMA Defnícó: Ha A és B egy eseményalgebra két eseménye és P(B)>0, akkor a P( A B) P( A B) P( B) hányadost az A eseménynek a B eseményre vonatkoztatott feltételes valószínőségének nevezzük.

13 Feladat: Egy szállítmány 96 %-a megfelel a mnıség elıírásoknak, s ezek 75 %-a elsı osztályú. Mekkora a valószínősége annak, hogy egy találomra kválasztott darab elsı osztályú? Feladat: Egy telefonfülke elıtt állunk és várjuk, hogy az elıttünk beszélı befejezze a beszélgetést. Az lletı beszélgetés dıtartama (τ) véletlen esemény, melyre érvényes a következı: P 3 ( τ t) e a.) Határozzuk meg annak a valószínőségét, hogy a beszélgetés 3 percnél tovább tart! b.) Menny annak a valószínősége, hogy a beszélgetés tovább 3 percnél tovább tart, feltéve, hogy eddg 3 percnél tovább tartott? c.) Menny annak a valószínősége, hogy a beszélgetés t+3 percnél tovább tart, feltéve, hogy t percnél tovább tartott? t 3

14 Feladat: Egy börtönben három elítéltet tartanak fogva: A-t, B-t és C-t. A következı napon egyküket felakasztják. A börtönır tudja kt akasztanak fel, de nem szabad elárulna. Az A fogoly a következıt kérdez a börtönırtıl: "Áruld el a másk két fogoly közül egy olyannak a nevét, akt holnap nem akasztanak fel. Ha mndketten szabadok lesznek, akkor döntsd el magadban, hogy knek a nevét mondod. Ezzel nem árulsz el ttkot, mert azt már tudom, hogy egykük szabad lesz." A börtönır ném gondolkodás után így válaszolt: "Nem, ez nem volna emberséges veled szemben. Most úgy gondolod, hogy /3 valószínőséggel akasztanak fel. Ha elárulom a többek közül egy olyannak a nevét, akt nem akasztanak fel, akkor az esélyed megnövekednek, úgy fogod gondoln, hogy / valószínőséggel akasztanak fel. Nem tudnál nyugodtan aludn". Helyesen érvelt-e a börtönır? 4

15 .3. A TELJES VALÓSZÍNŐSÉG TÉTELE Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy tetszıleges esemény, akkor: n P( A) P( AB k ) P( Bk ) k Bzonyítás: 5

16 Feladat: Az MBA programban a "Kvanttatív módszerek" vzsgán a férfak 60 %-a, a hölgyek 80 %-a szerepel skeresen. A férfak az évfolyam 45 %-át teszk k. Mekkora a valószínősége, hogy egy találomra kválasztott hallgató skeresen szerepel a vzsgán? Feladat: Három mőszak azonos terméket gyárt. Egy adott napon az összes termékbıl az I. mőszakban 40%, a II. és III. mőszakban 30-30% készül. Az átlagos selejtarányok: I. mőszak 5%, II. mőszak 7%, III. mőszak 0%. Az összes termékbıl a MEO egy darabot kválaszt, mekkora a valószínősége, hogy az hbátlan? 6

17 Feladat: Egy gyártóberendezés munkadejének /3 részében az A terméket, /6 részében a B terméket, a többben pedg a C terméket gyártja. Az A termék gyártásakor az erre fordított dı 0%-ában áll a berendezés, a B termék gyártása közben végg dolgozk, míg a C termék gyártásakor a munkadı 5%-ában áll. Mekkora a valószínősége annak, hogy egy találomra kválasztott dıpontban áll a berendezés? Feladat: Egy üzem 8 berendezése egyforma terméket gyárt. Az elsı három gép együttvéve 4% selejtet termel, a következı négy gépnél együttvéve 3% a selejt, míg az utolsó gép selejtaránya,5%. Az elkészült termékeket egy helyen győjtk. Mekkora a valószínősége, hogy egy véletlenszerően kválasztott darab selejtes lesz? 7

18 .4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŐSÉGÉNEK TÉTELE") Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy olyan esemény, amelyre P(A)>0, akkor: ahol: P( B A) k P( A B ) P( B ) n k P( A B ) P( B ) k P(B k A) P(B k ) posteror" valószínőségek, pror" valószínőségek. Bzonyítás: 8

19 Feladat: Alkatrész-ellátásnál a pótalkatrészt 40%-ban a I. szállító szállítja 0% selejttel, 60%-ban pedg a II. szállító szállítja 0% selejttel. Az alkatrészraktárból kvettünk egy pótalkatrészt és azt találtuk, hogy hbás. Mekkora a valószínősége, hogy a kválasztott alkatrész a II. szállítótól jött? Feladat: Egy üzembıl kkerülı áru 75% valószínőséggel I. osztályú. A készterméket megvzsgálják. Annak a valószínősége, hogy a vzsgálat során az I. osztályú terméket nem I. osztályúnak mnısítk %. Annak a valószínősége, hogy egy nem I. osztályú terméket I. osztályúnak mnısítenek 5%. Mekkora a valószínősége annak, hogy egy olyan termék, amelyk egy vzsgálat során I. osztályú mnısítést kapott, valóban I. osztályú? 9

20 Feladat: Egy folyóban bekövetkezı halpusztulásért 3 par üzem lehet felelıs. Tapasztalatok szernt a mérgezı anyag kbocsátásának valószínősége az egyes üzemeknél: 0%, 50% és 30%. A mérések szernt az egyes üzemek szennyvízkbocsátása esetén a halpusztulás valószínősége: 60%, 5% és 5%. Menny a halpusztulás teljes valószínősége? Mekkora bírságot szabjon k a Ft-os halkárért a bíróság, ha nem smeretes, hogy k a szennyezés kbocsátója a három üzem közül? (A bírságok összege a teljes halkár.) Feladat: Bertrand problémája: tekntsünk három szekrényt, amelyek mndegykében két fók van. Az elsı szekrény mndkét fókjában egy-egy aranygolyó, a másodk szekrény egyk fókjában arany-, a másodkban ezüstgolyó, a harmadk szekrény mndkét fókjában ezüstgolyó van. Találomra választunk egy szekrényt (azaz bármelyket egyenlı valószínőséggel választhatjuk), khúzunk egy fókot és abban aranygolyót találunk. Mekkora a valószínősége annak, hogy az elsı szekrényt választottuk? 0

21 Feladat: Egy rodában 3 munkatárs dolgozk párhuzamosan azonos típusú ügyratok ntézésén. Az elsı naponta 0 aktával végez, a másodk nap 5, a harmadk nap 5 aktával. Az egyes munkatársaknál naponta átlagosan 0,3; 0,9; 0,5 db hbásan kezelt ügyrat található. Az összesített nap mennységbıl találomra kveszünk egy aktát és azt rossznak találjuk. Mekkora a valószínősége, hogy azt az elsı munkatárs készítette?

22 .5. ESEMÉNYEK FÜGGETLENSÉGE Defnícó: A és B események (sztochasztkusan) függetlenek, ha P(A B)P(A) P(B). Az A esemény független B eseménytıl, ha a P(A B) feltételes valószínőség nem függ a feltételtıl: P( AB ) P( A B) P( A) P( B) Tétel: Ha A és B függetlenek, akkor A és B, A és B, valamnt A és B s függetlenek. Bzonyítás: Tétel: Ha három esemény páronként független, még nem bztos, hogy "teljesen függetlenek", azaz még teljesül az s, hogy: P(A B C)P(A) P(B) P(C) Feladat: Két kockával dobunk. Jelentse A azt az eseményt, hogy az elsı kockával párost dobunk, B azt az eseményt, hogy a másodk kockával páratlant dobunk és C azt az eseményt, hogy mndkettıvel párost, vagy mndkettıvel páratlant dobunk. A, B és C események teljesen függetlenek-e? Defnícó: Az A, A,... A n események teljesen függetlenek, ha közülük kválasztott tetszıleges számú eseményre teljesül, hogy az együttes bekövetkezésük valószínősége egyenlı az egyes valószínőségek szorzatával.

23 3. LEÍRÓ STATISZTIKA Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 3

24 3.. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A számszerő nformácó, annak mérése és elemzése alapvetı szerepet játszk a társadalm és gazdaság jelenségek elemzésében. E számszerő adatok a legtöbb esetben azzal a sajátossággal rendelkeznek, hogy a megfgyelésük, a feldolgozásuk, elemzésük és az elemzés eredményenek felhasználása tudományos módszereket gényel. A statsztka a tömegesen elıforduló jelenségekre, folyamatokra vonatkozó nformácók összegyőjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A nemzetköz rodalomban elterjedt csoportosítás szernt megkülönböztetünk: a leíró statsztkát, amelynek célja a vzsgálat tárgyát képezı jelenség tömör, számszerő jellemzése az adatok elemzése és rendezése alapján (pl. 0 évente tartott népszámlálások adatanak feldolgozása); míg a következtetı statsztka célja a mntából történı következtetés és általánosítás a teljes sokaságra vonatkozóan (pl. néhány ezer háztartás jövedelm adataból megfelelı pontossággal megbecsülhetı, hogy a magyar lakosság körében mlyen jövedelm különbségek vannak), vagys a jelenségekre, folyamatokra vonatkozóan olyan megállapításokat tehetünk, amelyek nem csak a közvetlen megfgyelésen alapulnak. A statsztka döntéselmélet a véletlen környezet által bekövetkezı események fgyelembevétele mellett, több lehetséges cselekvés lehetıség közül az optmálsnak vélt kválasztásához ad számszerő nformácókat (pl. beruházás döntések, új termékek bevezetésére vonatkozó döntések stb.). A leíró statsztka a megfgyelt adatok bemutatását, összefoglaló jellemzését tőz k célul, és ehhez az elemzéshez sokoldalú eszköztárt kínál, ebben a fejezetben célunk ennek az eszköztárnak a bemutatása. 3.. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI A leíró statsztka a numerkus nformácók összegyőjtését, az nformácók összegzését, tömör jellemzését szolgáló módszereket foglal magában, legfontosabb területe: adatgyőjtés adatok ábrázolása adatok csoportosítása, osztályozása adatokkal végzett egyszerőbb artmetka mőveletek eredmények megjelenítése A statsztka jellemzıket általában három fı csoportba soroljuk, éppen az alapján, hogy az adatok mlyen jellegzetességét ragadják meg: középértékek ngadozásmutatók az eloszlás alakjára jellemzı egyéb mérıszámok Az egyed mérésekbıl származó adatok lehetnek dszkrétek és folytonosak. A dszkrét adatok szükségképpen ugrásszerően változnak. Például a számlálás alapján nyert adatok dszkrét típusúak (pl. téves telefonhívások száma, balesetek száma, adott dıszak alatt bekövetkezı gépmeghbásodások száma stb.). 4

25 A folytonos adatok általában mérésbıl származnak. Jellemzıjük, hogy egy adott ntervallumon belül elvleg bármlyen értéket felvehetnek. A mérés korláta matt ezek az adatok s ugrásszerően változnak, de az ugrások nagysága a mérıeszköztıl függ, maguk az adatok lényegüket tekntve folytonosak (pl. átmérı, nyúlás, gépkocs abroncsok futásteljesítménye, nedvességtartalom) AZ ADATOK ÁBRÁZOLÁSA Néhány példa: A hba típusa Szabvány jelölése Gyakorság Kumulált gyakorság Relatív gyakorság Kumulált relatív gyakorság gömb alakú gázzárvány ,06% 53,06% gázzárvány-halmaz ,69% 70,75% átolvadás hány ,5% 80,7% összeolvadás hány ,6% 88,44% gyökátfolyás ,7% 9,6% hernyó alakú gázzárvány ,04% 93,0% gyökoldal szélkolvadás ,04% 95,4% egy oldalról hegesztett kötésben átolvadás hány 40 4,36% 96,60% hely szélkolvadás éles bemetszés nélkül 55 44,36% 97,96% alapanyag-varrat között összeolvadás hány ,68% 98,64% wolfrám zárvány ,68% 99,3% egyenetlen varratfelület ,68% 00,00% összesen: 47 00,00%. ábra: Az adatok táblázatba rendezése 3. ábra: Oszlopdagram 5

26 4. ábra: Kördagram 5. ábra: Sávdagram 6. ábra: Vonaldagram 6

27 Az összes szılıtermelés felhasználása 7. ábra: Az adatok ábrázolása pktogram segítségével 7

28 3.4. TAPASZTALATI ELOSZLÁSOK Az adatok ábrázolásának általános lépése a következık: Osztálybasorolás (folytonos adatok és nagyszámú dszkrét megfgyelés esetén), A gyakorságok (f ) megállapítása. Gyakorság a sokaságban levı azonos tulajdonságú (azonos osztályba tartozó) elemek száma, A relatív gyakorságok (g ) megállapítása: g f n Az összegzett (kumulált) gyakorságok (f ), lletve összegzett relatív gyakorságok (g ) megállapítása, Gyakorság táblázat készítése (f, g, f, g adataból), A gyakorság (relatív gyakorság), lletve összegzett gyakorság (relatív gyakorság) hsztogramok (folytonos adatok esetén a polgon és az ogva) felvétele (tapasztalat eloszlások elkészítése), Grafkus ábrázolás. Feladat: Egy folyamatos üzemben 4 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alább értékek adódtak óránként megoszlásban: Óra Leállások száma Óra Leállások száma. Táblázat: 4 óra alatt gépleállások alakulása A példa adata a következı gyakorság táblázatba és hsztogramba rendezhetık: leállások száma óránként az elıfordulások gyakorsága (f ) relatív gyakorság (g ) 0 3 0,5 5 0,08 5 0, , ,5 5 0, ,083 összesen 4,000. Táblázat 8

29 8. ábra: Gyakorságok ábrázolása dszkrét adatok esetén A kumulált (összegzett) gyakorság táblázat és hsztogram: leállások száma kumulált gyakorság (f ) kumulált relatív gyakorság (g ) 0 3 0,5 8 0, , , , ,97 6 4, Táblázat 9. ábra: Kumulált relatív gyakorságok ábrázolása dszkrét adatok esetén 9

30 Feladat: Mnt késıbb tanulmányank (Vállalat pénzügyek) során látn fogjuk, gazdaság elemzésenknél gyakran szükség van a részvényektıl elvárt hozam becslésére. (A részvények elvárt hozama dıben vszonylag stabl, így a jövıre vonatkozó becslésenket múltbel adatankra alapozhatjuk). A Budapest Értéktızsde Részvényndexét (BUX) - az deglenes ndex ném változtatásával és 99- g vsszafelé s meghatározva január - hatállyal vezették be. Az ndex bázsa az 99. január -án számított 000 pont. Egy 5 éves dıszak hav hozamanak értéket az alább táblázatban foglaltuk össze. dátum BUX[%] dátum BUX[%] február. -7,54 november.,03 márcus. -0,7 december.,5 áprls 5. -,0 január 6. 3,3 május. -,5 február 3.,44 júnus. -8,4 márcus 3. -,9 júlus. 4,9 áprls. 0,03 augusztus. 3,0 május 5. 3,79 szeptember. -8,45 júnus.,9 október 3. 6,88 júlus. 5,99 november. -5,08 augusztus. -8, december. -4,89 szeptember. 6,34 január 5. -8,98 október. -7,6 február. 4,05 november 3. -6,75 márcus.,6 december. 0,4 áprls 3.,68 január 7. -7, május. 5,44 február.,7 júnus. -4,79 márcus. 4,84 júlus 3.,06 áprls. -, augusztus. 5,6 május 4. -7,48 szeptember.,8 júnus. 0,63 október. -6,05 júlus. 3,45 november. -0,93 augusztus ,06 december.,9 szeptember. -,97 január 4. 35,6 október. 6,9 február. 7,8 november.,53 márcus. 9,75 december. 5,5 áprls. 7,67 január 7. 3,6 május.,06 február. -3,63 júnus 3.,39 márcus. -,37 júlus. -,85 áprls. 9,0 augusztus.,6 május 3. 4,58 szeptember 3. 8,57 júnus. 4,59 október. 6,46 4. Táblázat Dolgozzuk fel a hav hozam adatokat leíró statsztka eszközökkel! 30

31 Az Y szernt képzett osztály alsó felsı határa X 0 X Osztályközép X * abszolút relatív gyakorság f g X 0 X X * f g X 0 X X + ( X * 0 X ) f g g f N X k0 Összesen X k 0. ábra: Gyakorság sor Ahol: X (adatankat jellemzı) mennység smérv, Adathalmazunkból k db osztályt képzünk, A 0-s ndex az osztály alsó határát, az -es ndex pedg az osztályköz felsı határát jelent, X * az osztályközép, f az abszolút vagy tapasztalat gyakorság, g pedg a relatív gyakorság. X * k Mérlegelendı szempontok az osztályozásnál: M a célunk az osztályozással? A teljes értékközt hány rész-értékközre bontsuk fel, vagys hány osztályt alakítsunk k? Az osztályhatárok megállapításánál, kalakításánál mlyen szempontokat célszerő fgyelembe venn? A fent példánk alapján a gyakorság táblázat: osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,00 x <-0,00 0 0,00,54-0,00 x <-0, ,3 0,77-0,00 x < 0, ,5 36,9 0,00 x < 0, ,38 7,30 0,00 x < 0, ,00 9,30 0,00 x < 30, ,6 96,9 30,00 x < 40, ,08 00,00 összesen 65 00,00 5. Táblázat f k N g k A szakrodalomban szereplı javaslatok az osztályok számára (k) vonatkozóan: k > n, lletve k + 3,3 lg n 3

32 A gyakorság hsztogram: Az egyes értékközök felé emelt téglalapok területe arányos az egyes osztályokhoz tartozó tapasztalat gyakorságokkal. A pros vonallal jelölt függvényt sőrőségfüggvénynek nevezzük. A kumulált relatív gyakorság hsztogram: n 65 x s * 3, 9%,05 %. ábra: Sőrőségfüggvény. ábra: Eloszlásfüggvény A kumulált gyakorságok grafkus ábrázolással nyert képét tapasztalat eloszlásfüggvénynek s szokás nevezn. A folytonos adatok eloszlásfüggvényét folytonos vonallal s összeköthetjük, és az így kapott görbét ogvának nevezzük. Ez azt mutatja meg, hogy megközelítıen mlyen lenne a tapasztalat eloszlásfüggvény, ha az osztályközöket mnden határon túl csökkentenénk, az osztályközökbe esı adatok számát pedg mnden határon túl növelnénk. Az ogvát felhasználhatjuk egy adott értéknél ksebb értékek számának vagy relatív gyakorságának meghatározására. Fordítva s eljárhatunk, vagys megállapíthatjuk azt az értéket, amelyk alá adott relatív gyakorsággal esnek az adatok. Az lyen értékeket kvantlseknek nevezzük. 3

33 3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK MUTATÓI A középérték mutatók a gyakorság eloszlás helyzetét egyetlen, az adatokkal azonos mértékegységő számértékkel jellemzk. E középértékekkel kapcsolatos elvárásank, hogy legyenek: Közepes helyzetőek Tpkusak Egyértelmően meghatározhatóak Könnyen értelmezhetıek A középérték-mutatóknak két nagy csoportja smeretes: Helyzet középértékek: az adatok között elhelyezkedésüknél fogva jellemzk a vzsgált gyakorság eloszlás helyzetét. Számított középértékek: az adatokkal kapcsolatos számszerő összefüggésük révén jellemzk vzsgált gyakorság eloszlás helyzetét. Az alábbakban bemutatásra kerülı középérték mutatók a medán, a módusz, a számtan átlag, a harmonkus átlag, a mértan átlag és a négyzetes átlag. Medán (Me): Jellemzı: helyzet középérték, közepes helyzető. A medán a változó azon számértéke, amelynél az összes elıforduló számérték fele ksebb, fele pedg nagyobb, tehát a rangsorba állított sokaság számértékeket két egyenlı gyakorságú osztályra bontja. Rövden: a nagyságrend szernt rendezett adatok középsı értéke (páros számú adat esetén a két középsı érték átlaga). Példa: 6, 8, 4, 9, 7, 3, 5, 3, 4, 5, 6, 7, 8, 9 Me6 4, 9, 7, 8,, 5, 4, 5, 7, 8, 9, Me7,5 7, 9, 3, 0, 5,, 5,, 3, 5, 5, 7, 9, 0 Me5 Ha a BUX ndex korább, 65 hav hozamadatat vesszük alapul, akkor e 65 adatot sorba állítva, a rangsor 33. tagja lesz a medán, hszen ennél 3 ksebb, és 3 nagyobb érték lesz a rangsorban, ez pedg 3, ,06-7,54 -,37 3 3,6 4 5,5 5,7 6 0,4-8,98-7,6 -, 3 3,45 4 6,34 5,68 6,6 3-7,48 3-7, 3-0, , ,46 53, ,9 4-3,63 4-6,75 4-0,7 34 4, ,67 54,5 64 3,3 5 -,97 5-6,05 5,6 35 4, ,8 55, ,6 6 -,85 6-5,08 6,8 36 4, ,0 56,9 7 -,0 7-4,89 7, , , ,0 8-8,45 8-4,79 8, ,9 48 0, ,99 9-8,4 9 -,9 9, ,6 49 0, ,88 0-8, 0 -,5 30,9 40 5,44 50, ,57 Osztályközös gyakorság sor esetén a medán az alább formulával becsülhetı: Meˆ X me,0 + N f f me ' me h me 33

34 ahol me annak a legelsı osztályköznek a sorszáma, amelyre gaz, hogy ' f me N és X me,0 az me sorszámú osztályköz alsó határa, és a h me pedg ennek az osztálynak az osztályközhosszúsága, am egyszerően a felsı és alsó osztályhatár értékének a különbsége. Példa: Vegyük a korább BUX-ndexes példánkat, és tegyük fel, hogy csak a gyakorság táblázat áll rendelkezésünkre, és nem smerjük egyenként az összes hozamadatot. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,00 x <-0,00 0 0,00,54-0,00 x <-0, ,3 0,77-0,00 x < 0, ,5 36,9 0,00 x < 0, ,38 7,30 0,00 x < 0, ,00 9,30 0,00 x < 30, ,6 96,9 30,00 x < 40, ,08 00,00 összesen 65 00,00 ' N f me N/3,5 a medánt tartalmazó osztály az ötödk osztály: 0,0 x < 0. M eˆ X me N ' f me 3,5 4, 0 + hme 0,00+ (0,00 0,00) 3,69 f 3 me A medán elınye, hogy mndg egyértelmően meghatározható, és mvel valód középérték, így érzéketlen az adathalmazunkban szereplı szélsıértékekre, amely szélsıségesen nagy vagy kcs értékeket általában a véletlen szeszélye alakítják, és nem függ a több smérvértéktıl sem. Ha az adathalmazunkban sok az egyforma smérvérték, akkor sem tanácsos használn. Módusz (Mo): A módusz - a medánhoz hasonlóan - helyzet középérték. A módusz nem mndg határozható meg egyértelmően, és nem s mndg létezk. Dszkrét változó esetén a változó leggyakrabban elıforduló értéke. leállások száma óránként az elıfordulások gyakorsága összesen 4 34

35 Folytonos smérv esetén a módusz a gyakorság görbe maxmum helye. Folytonos változó esetén a medánhoz hasonló módon osztályközös gyakorság sorból becsülhetı. Moˆ X mo, 0 + d a d a + d f h mo Ebben a képletben mo a móduszt tartalmazó osztályköz sorszáma, d a és d f da fmo f d mo f fmo fmo+ A móduszt mndg az az osztályköz tartalmazza, amelykhez a hsztogram legmagasabb oszlopa tartozk. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,00 x <-0,00 0 0,00,54-0,00 x <-0, ,3 0,77-0,00 x < 0, ,5 36,9 0,00 x < 0, ,38 7,30 0,00 x < 0, ,00 9,30 0,00 x < 30, ,6 96,9 30,00 x < 40, ,08 00,00 összesen 65 00,00 Folytonos smérv esetén a móduszt a legnagyobb gyakorságú osztály tartalmazza: M d a (3 7), + h 0,00+ (0,00 0,00) 3,75 d + d (3 7) + (3 3) oˆ X mo 0 mo a f A módusz elınye, hogy a medánhoz hasonlóan nem függ sem az összes, sem a kugró smérvértékektıl. A módusz hátránya, hogy nem mndg egyértelmően meghatározható, és nem s mndg létezk. Megjegyzés: néha a módusz becslésének egyszerően a móduszt tartalmazó osztályköz osztályközepét tekntk (példánkban ez 5,00 lenne), ezt nyers módusznak hívják. Bárhogyan s határozzuk meg a móduszt, az arra kapott közelítı érték esetleges, mert függ az osztályközök számától és hosszától. 35

36 Számtan átlag ( x ): A leggyakrabban használt középértékmutató: az átlag, számított középérték. Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: x n r x f x r n f r g x ahol: x az -k tag számértéke x * az -k osztály osztályközepe f az -k osztály gyakorsága g az -k osztály relatív gyakorsága r osztályok száma Dszkrét példa: x 6 leállások száma óránként az elıfordulások gyakorsága összesen f x f,54 Folytonos példa: Vegyük smét a korább BUX-ndexes példánkat! Ha a rendelkezésre álló 65 egyed adatunkból számítjuk k a számtan átlagot: x 65 x 65 7,54+ ( 0,7) + (,0) ,0+ 4,58+ 4,59 07, ,9 %-ot kapunk. 36

37 Az osztályközös gyakorság táblázatunkat alapul véve s becsülhetjük a számtan átlagot: x 8 8 osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,00 x <-0,00 0 0,00,54-0,00 x <-0, ,3 0,77-0,00 x < 0, ,5 36,9 0,00 x < 0, ,38 7,30 0,00 x < 0, ,00 9,30 0,00 x < 30, ,6 96,9 30,00 x < 40, ,08 00,00 összesen 65 00,00 ( 35,00) + 0 ( 5,00) + 6 ( 5,00) + 7 ( 5,00) , , ,00+ 35,00 3,77 65 x 8 f x f g x 0,054 ( 35,00) + 0 ( 5,00) + 0,093 ( 5,00) + 0,65 ( 5,00) + 0,3538 5, ,0 5,00+ 0,046 5,00+ 0, ,00 3,77 Ebben az esetben a két eredmény (3,9 és 3,77) között eltérés összefüggésben van a sokaság számosságával, az osztályközök hosszával, és az osztályközepek megválasztásával. A számtan átlag elınye, hogy bármely alapadathalmazból egyértelmően meghatározható, mnden alapadatot felhasznál. A hátránya a módusszal és medánnal szemben, hogy érzékeny a szélsıértékekre. Egyéb átlagfajták: Harmonkus átlag ( x h ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok recprokanak összege változatlan marad. Számítása: x n x r h n r Alkalmazása: Leggyakrabban akkor használjuk, ha az értékek recprokanak összege értelmezhetı. Ilyen esetekkel elsısorban a leíró statsztka vszonyszámok és ndexek számításánál találkozunk. Mértan átlag ( x g ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. Számítása: f f x 37

38 ahol:π (produktum) az összeszorzás jele. x g n π x f πx f Egy n tagú sokaság x, x,, x n megfgyelt értékenek mértan átlagát úgy számítjuk k, hogy az értékeket összeszorozzuk, és a szorzatból annyadk gyököt vonunk, ahány értéket összeszoroztunk 3. Alkalmazása: A mértan átlagot akkor használjuk, ha az értékek szorzata értelmezhetı, lletve az átlagolandó értékek exponencálsan nınek vagy csökkennek. Leggyakrabban az dıbel fejlıdés átlagos ütemének vzsgálatakor használjuk. Idısorok elemzése során (pl. termelés évenként alakulása, tızsdendex hav változása, stb.) általában az dıszakról dıszakra bekövetkezett növekedést, vagy csökkenést vzsgáljuk. Négyzetes átlag ( x q ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad. Számítása: x q n r x f r n x f Egy n tagú sokaság x, x,, x n értékebıl a négyzetes átlagot úgy számítjuk k, hogy az átlagolandó értékek négyzetenek számtan átlagát vesszük és ebbıl négyzetgyököt vonunk. Természeténél fogva a négyzetes átlag a kugróan magas értékekre reagál érzékenyen. Alkalmazása: A négyzetes átlag alkalmazására legnkább akkor kerül sor, amkor az értékek között poztív és negatív értékek egyaránt elıfordulnak, de az elıjeleknek a vzsgálat szempontjából nncs jelentıségük, az értékek abszolút nagyságát kívánjuk a középértékekkel jellemezn. Tpkus alkalmazás területe a szórásszámítás. Választás a középértékek között Bebzonyítható, hogy ugyanazon poztív x értékekbıl számított különbözı fajta átlagok között a következı nagyságrend relácó áll fenn: x x x x x mn h g q x max A harmonkus és a mértan átlag a nagyon alacsony, a négyzetes átlag a magas értékekre mutat fokozott érzékenységet. Az átlagolandó értékek jellege, és az átlag számításához rendelkezésre álló nformácó együttesen határozza meg, hogy mlyen esetben melyk átlagfajtát célszerő használn. A választás során érdemes mérlegeln a következıket: Egyértelmően meghatározható-e? Az összes rendelkezésre álló adattól függ-e vagy sem? 3 Megjegyzés: ha az értékek között 0 s szerepel, akkor a mértan átlagot nem használhatjuk. 38

39 Mennyre érzékeny a szélsıségesen nagy vagy kcs értékekre? Mekkora és mlyen módon értelmezhetı hbával képes helyettesíten az alapadatokat? Mo Me x 3. ábra: Középértékek összehasonlítása x Me Mo Kvantlsek Eddg egyenlı osztályköz-hosszúságú gyakorság sorokat képeztünk, az lyen osztályközök relatív gyakorsága eltértek egymástól. Lehetıség van olyan osztályhatárok keresésére, amelyek egyenlı relatív gyakorságokat fognak közre. Az lyen osztályközök általában nem egyenlı hosszúságúak. Ezen osztályhatárok megállapításához használjuk a kvantlseket. A kvantlsek azok az értékek, amelyek különbözı adott arányokban bontják fel az adathalmazt. A p- edrendő kvantls az eloszlást p, -p arányban osztja ketté. Meghatározásuk úgy történk, hogy adatankat nagyság szernt növekvı sorrendbe rendezzük (rangsort készítünk), majd az értékeket k számú egyenlı gyakorságú csoportra osztjuk és az egyes csoportok felsı határán lévı smérvértékeket vesszük. Ezek lesznek a kvantls értékek. A különbözı számú csoportba rendezéshez a kvantlsek konkrét elnevezése tartoznak. Ha az adatokat két részre osztjuk, akkor a medánt (Me) kapjuk. Négy részre való osztásnál kvartlseket (Q,,,3) ad, öt rész esetén kvntlseket (K,,, 3, 4), tíz rész esetén declseket (D,,,,9) száz részre való osztásnál percentlseket (P,,,3,,99) nyerünk. Ha például az egyetemre jelentkezık pontszámát értékelve pont a hatodk decls érték, ez azt jelent, hogy a jelentkezık hatvan százaléka pontnál kevesebbel, 40%-a pedg többel rendelkezk. k Elnevezés Általános jelölés lehetséges értéke Lehetséges kvantlsek Medán - Me 4 Kvartls Q,,3 Q, Q, Q 3 5 Kvntls K,,3,4, K, K, K 3, K 4 0 Decls D,,,9 D, D, D 9 00 Percentls P,,,99 P, P,,P Táblázat: A leggyakrabban használt kvantlsek 39

40 -36,06-7,54 -,37 3 3,6 4 5,5 5,7 6 0,4-8,98-7,6 -, 3 3,45 4 6,34 5,68 6,6 3-7,48 3-7, 3-0, , ,46 53, ,9 4-3,63 4-6,75 4-0,7 34 4, ,67 54,5 64 3,3 5 -,97 5-6,05 5,6 35 4, ,8 55, ,6 6 -,85 6-5,08 6,8 36 4, ,0 56,9 7 -,0 7-4,89 7, , , ,0 8-8,45 8-4,79 8, ,9 48 0, ,99 9-8,4 9 -,9 9, ,6 49 0, ,88 0-8, 0 -,5 30,9 40 5,44 50, ,57 Számítása: Rangsorba rendezett adatank /k-k tagja. / ( N + ) Értéke: [ ] { } [ ] [ ]) k ( X / k X s + s / / / + k k X s X k s / k s k A BUX-ndexes példánk alapján számítsuk k a következı kvantlseket! Alsó kvartls: s / 4 (+ 65) 6,5 4 Tehát az alsó kvartlsünk a rangsorba rendezett 65 db hav hozamadat 6,5-k tagja. Számítása: Q X + s X X ) 5,08+ 0,5 ( 4,89 ( 5,08)) 4, ( / 4 / 4 / 4 [ s ] { / 4} [ s ] + [ s ] 985 (egyszerőbb számítás: egyszerően a rangsor 6. és 7. értékének számtan átlaga) Értelmezése: a rangsorba rendezett adatok /4-e ksebb, mnt -4,985, és 3/4-e pedg nagyobb. Felsı kvartls: 3 s 3 / 4 (+ 65) 49,5 4 Tehát a felsı kvartlsünk a rangsorba rendezett 65 db hav hozamadat 49,5-k tagja. Q X + s X X ) 0,63+ 0,5 (,06 0,63) 0, ( 3/ 4 3/ 4 3/ 4 [ s ] { 3 / 4} [ s ] + [ s ] Értelmezése: a rangsorba rendezett adatok 3/4-e ksebb, mnt 0,845, és /4-e pedg nagyobb. Alsó decls s /0 (+ 65) 0 D X + s 6,6 [ s ] { /0} X[ s ] + X[ s ]),85+ 0,6 (,0 (,85)), 75 ( /0 /0 / 0 Értelmezése: a rangsorba rendezett adatok /0-e ksebb, mnt -,75, és 9/0-e pedg nagyobb. Felsı decls: 9 s /0 (+ 65) 0 D X + s 9 59,4 [ s ] { 9 /0} X[ s ] + X[ s ]) 6,88+ 0,4 (8,57 6,88) 7, 556 ( 9 /0 9 /0 9 / 0 9 Értelmezése: a rangsorba rendezett adatok 9/0-e ksebb, mnt 7,556, és /0-e pedg nagyobb. 40

41 3.6. AZ INGADOZÁS MÉRİSZÁMAI A rendelkezésre álló adathalmazunkban szereplı értékek változékonysága, szóródása kétféleképpen s megragadható: az egyes értékek egymás között különbségen, vagy pedg az egyes értékeknek egy ktüntetett értéktıl (középérték) való eltérésen keresztül. A másk csoportosítás lehetıség: léteznek abszolút és relatív ngadozásmutatók. Az abszolút szóródás mutatók mértékegysége ugyanaz, mnt az alapadatoké. A relatív szóródás mutatók elvonatkoztatnak az eredet mértékegységtıl, és különbözı smérvértékek szóródásának az összehasonlítását szolgálják. A most bemutatásra kerülı legfontosabb ngadozásmutatók: a terjedelem, az nterkvantls terjedelem, az átlagos abszolút különbség, az átlagos abszolút eltérés, a tapasztalat szórás, a korrgált tapasztalat szórás és a relatív szórás. Terjedelem (R): Az adathalmazban szereplı legnagyobb és legksebb adat különbsége. Számítása: R X max X mn Elınye a könnyő számítás, hátránya, hogy csak a két legszélsıségesebb smérvértéktıl függ. A hátránya matt gyakran használják az nterkvantls terjedelemmutatót, mvel a két szélsı k-adrendő kvantls jelentısen csökkent a véletlennek a szélsıértékeket alakító szerepét. Pl. Az nterkvartls terjedelemmutató a felsı és alsó kvartls különbségeként adódk: R / Q3 Q Vegyük smét a korább BUX-ndexes példánkat, és számítsuk k a terjedelmet: Az nterkvartls terjedelem: R R 35,6 ( 36,06) 7,3 0,845 ( 4,985) / 5,83 Átlagos abszolút különbség (G): Ez a szóródás mutató a mnden lehetséges módon párba állított értékek különbségenek abszolút értékébıl számított számtan átlag. Ez a G ngadozásmutató azt mutatja meg, hogy az X smérv értéke átlagosan mennyre különböznek egymástól. Mértékegysége ugyanaz, mnt az alapadatoké. G N ( N ) N N j X X j ahol N az adatok számát jelent. Specáls felhasználás területe a koncentrácóelemzés, hátránya, hogy számítása meglehetısen kényelmetlen. Mvel a BUX-ndexes példában meglehetısen kényelmetlen számítan, így egy egyszerőbb példán keresztül mutatjuk be: Véletlenszerően kválasztunk 5 MBA hallgatót, és kszámítjuk a Kvanttatív módszerek tárgy vzsgáján elért eredményük átlagos abszolút különbségét. Az elért pontok: 45, 5, 76, 87, 9 4

42 Táblázat 56 G 5,8, azaz az 5 MBA hallgató Kvanttatív módszerek tárgy vzsgán elért pontja 5(5 ) átlagosan 5,8 ponttal tér el egymástól. Átlagos abszolút eltérés ( ): Az átlagos abszolút eltérés az ngadozásmutatók azon csoportjába tartozk, amelyek a szóródást az értékeknek egy ktüntetett értéktıl való eltérésere támaszkodva jellemzk. Tulajdonképpen az egyes értékek és a számtan átlag különbségenek abszolút értékebıl számított számtan átlag. Számítása: n n d r r f f d ahol: d x x ( ) A képlet másodk részébıl látható, hogy ez a mutató s becsülhetı osztályközös gyakorság sorból a tapasztalat gyakorságok felhasználásával. Ebben az esetben a d eltérések számításánál az osztályközepeket kell alapul vennünk. A BUX-ndexes példánk átlagos abszolút eltérése: (Az egyed adatokból számított számtan átlagot felhasználva) n 7,54 3,9 + 0,7 3, ,59 3,9 n d Azaz az egyes hozamadatok átlagosan 8,93%-kal térnek el a számtan átlagtól. 8,93 4

43 Tapasztalat szórás (s), korrgált tapasztalat szórás (s * ): Ahogy a számtan átlag az átlag, úgy a tapasztalat és a korrgált tapasztalat szórás a szórás. A szórás az adathalmazunk változékonyságának legfontosabb mérıszáma. Nagyon hasonlít az elıbb mutatóhoz, és jelentése s hasonló: annyban tér el, hogy a d eltérések elıjelét nem abszolút érték képzésével, hanem négyzetre emeléssel oldja meg, majd a négyzetreemelést gyökvonással tesz jóvá. A szórás az átlagtól vett d eltérések négyzetes átlaga. Ennek megfelelıen azt mutatja, hogy az értékek mennyre térnek el a számtan átlagtól. Számítása: s n ( x x) n r f ( x x) r f n d n s n * ( x x) n BUX-ndexes példánk szórása az egyed adatokból számolva (az egyenként adatokból számított számtan átlagtól való átlagos eltérést mérve): n ( x x) ( 7,54 3,9) + ( 0,7 3,9) ( 4,58 3,9) + ( 4,59 3,9) s,95 n 64 Osztályközös gyakorság sorból becsülve: osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,00 x <-0,00 0 0,00,54-0,00 x <-0, ,3 0,77-0,00 x < 0, ,5 36,9 0,00 x < 0, ,38 7,30 0,00 x < 0, ,00 9,30 0,00 x < 30, ,6 96,9 30,00 x < 40, ,08 00,00 összesen 65 00,00 (Gyakorság sorból becsült számtan átlaggal) s 8 8 f d f ( 35 3,77) ( 5 3,77) (5 3,77) 65 + (35 3,77),34 Relatív szórás (v): A szórás és a számtan átlag hányadosa. Elsısorban különbözı sokaságok vagy smérvek szóródásának összehasonlítására használják. A relatív szórás úgy s értelmezhetı, mnt az értékek 43

44 átlagtól vett átlagos eltérése, ezért mnél ksebb a relatív szórás, a számtan átlag annál jobban jellemz az alapadatokat. Számítása: s v X 00 [%] 3.7. AZ ELOSZLÁS ALAKJÁT JELLEMZİ EGYÉB MUTATÓSZÁMOK A gyakorság eloszlások alakmutató annak tömör és számszerő jellemzésére szolgálnak, hogy azok mlyen tekntetben és mlyen mértékben térnek el az ebbıl a szempontból etalonnak tekntett normáls eloszlás jellegzetes gyakorság görbéjétıl (a haranggörbétıl) 4. Az eltérések fajtá: az etalonnak tekntett normáls eloszlás haranggörbéjéhez képest bal ll. jobb oldal aszmmetra; a gyakorság eloszlás ábrája csúcsosabb, vagy lapultabb, mnt a normáls eloszlásé. Aszmmetra mutató 4. ábra: Eloszlások alakjának lehetséges eltérése a normál eloszlástól A bal oldal aszmmetrával rendelkezı eloszlások grafkus ábrája a módusztól jobbra hosszan elnyúlk. Ennek megfelelıen a jobb oldal aszmmetrát mutató eloszlásokat pedg balra hosszan elnyúló eloszlásoknak nevezk 5. Többféle aszmmetra mérıszám létezk, m ezek közül most egyet mutatunk be: 4 Megjegyzés: mvel a normáls eloszlás egy móduszú, így ennek az összehasonlításnak csak szntén egy móduszú gyakorság eloszlások esetén van értelme. Ha egy gyakorság görbének több módusza van, akkor az arra enged következtetn bennünket, hogy az elemzést a sokaság részekre bontásával célszerő folytatn, mert az eddg megsmert mutatószámok nem alkalmasak a vzsgált jelenség tömör, számszerő jellemzésére. 5 A társadalm-gazdaság jelenségek elemzésekor általában bal oldal aszmmetrával találkozunk. Ennek oka, hogy a 0 érték, vagy a vzsgált társadalm-gazdaság jelenség természetébıl adódóan valamlyen mnmáls érték kemény alsó korlátot képez, míg felülrıl nem létezk lyen korlát. Pl. a jövedelmek vagy a vagyon nagyságának eloszlása tpkusan bal oldal aszmmetrát mutat. 44

45 Pearson-féle mutatószám: 3 ( x Me) P s A Pearson-féle mutatószám mérsékelten aszmmetrkus eloszlásoknál nem szokott -nél nagyobb lenn. Ez a mutató az átlag és a medán különbségére alapozza az aszmmetra jellemzését 6. Nézzük a BUX-ndexes példánkat! (egyed adatokból ndulunk k, és nem osztályközös gyakorság sorból) 3 ( x Me) P s 3 (3,9 3,79),05 0,5 Enyhe jobb oldal aszmmetra 7 (4. ábra). Csúcsosság mutató A csúcsosság mutatók közül s egy mutatót emelünk k. Ez a mutató azon a megfgyelésen alapszk, hogy mnél csúcsosabb egy eloszlás, annál ksebb a felsı és alsó kvartls különbségének a fele a két szélsı decls különbségéhez vszonyítva. Normáls eloszlás esetén ennek értéke 0,63, am a mutató értékeléséhez ad támpontot. Mnél lapultabb a vzsgált gyakorság eloszlás, annál nagyobb K értéket kapunk. A BUX-ndexes példánk csúcsosságának kszámításához felhasználjuk a korábban kszámított kvartlseket és declseket: K Q Q 0,845 ( 4,985) 5,83 ( D D ) (7,556 (,75)) 58, ,7 Esetünkben valamvel laposabb a gyakorság eloszlás, mnt a normáls eloszlásé. Összefoglalás: A gyakorság eloszlások helyzetének, szóródásának és alakjának jellemzésére szolgáló mutatószámok közül gyakorlat szempontból az átlag és a szórás a legfontosabb. Az átlag és a szórás smeretében a valószínőségszámítás egyes eredményere támaszkodva elég jó becslés adható arra, hogy az értékek mlyen ntervallumon belül ngadoznak. Ha az átlag és a szórás mellett még smert néhány alkalmasan megválasztott kvantls, vagy az aszmmetra és a csúcsosság valamlyen mutatószáma s, egészen jól felvázolható a vzsgált gyakorság eloszlás grafkus képe még akkor s, ha sem az alapadatokat, sem a gyakorság sort nem smerjük. 6 A mérsékelt bal vagy jobb oldal aszmmetrát mutató gyakorság sorok esetén a medán többnyre harmadolja a módusz és az átlag között távolságot úgy, hogy az átlaghoz esk közelebb. A Pearson-féle mutatószám valójában az átlag és a módusz különbségére alapozza az aszmmetra jellemzését, de a medán könnyebben becsülhetı osztályközös gyakorság sorból, mnt a módusz. 7 A mutató poztív értéke bal oldal, negatív értéke pedg jobb oldal aszmmetrára utal. 45

46 3.8. ESETTANULMÁNY LEÍRÓ STATISZTIKAI ELEMZÉS Végezzük el a 8. Táblázat alapján 00 MBA hallgató bérének leíró statsztka elemzését! Ssz. BrBér/hó Pozícó Nem Életkor Ssz. BrBér/hó Pozícó Nem Életkor 300 Felsı Férf Beoszt. Férf 9 80 Felsı Férf 43 5 Beoszt. Férf Közép Nı Közép Nı Közép Férf Beoszt. Férf Beoszt. Nı Felsı Férf Beoszt. Férf Közép Férf Beoszt. Nı Közép Férf Beoszt. Nı Közép Férf Beoszt. Nı Közép Férf Beoszt. Nı Közép Férf 40 0 Beoszt. Férf Felsı Férf Közép Nı Beoszt. Férf Beoszt. Nı Közép Férf Közép Nı Beoszt. Nı Beoszt. Férf Felsı Férf Közép Férf Beoszt. Nı Felsı Nı Beoszt. Férf Közép Férf Beoszt. Férf Felsı Férf Közép Férf Beoszt. Férf Közép Nı Felsı Nı Közép Nı Beoszt. Férf Beoszt. Nı Felsı Férf Közép Férf Felsı Nı Beoszt. Férf Beoszt. Férf Közép Férf Beoszt. Nı Beoszt. Férf Beoszt. Nı Közép Férf Felsı Férf Közép Férf Beoszt. Férf Beoszt. Férf Felsı Férf Felsı Férf Beoszt. Férf Felsı Férf Közép Férf Közép Férf Beoszt. Nı Felsı Nı Közép Férf Felsı Férf Beoszt. Nı Beoszt. Nı Felsı Nı Beoszt. Nı Beoszt. Nı Beoszt. Nı Közép Férf Felsı Férf Beoszt. Nı Közép Férf Közép Nı Beoszt. Férf Közép Nı Beoszt. Férf Közép Férf Felsı Férf Közép Nı Közép Férf Felsı Férf Beoszt. Nı Beoszt. Nı Közép Nı Beoszt. Nı Felsı Férf Közép Nı Közép Nı Beoszt. Nı Közép Férf Beoszt. Nı Beoszt. Férf Felsı Férf Beoszt. Nı 8. Táblázat 9 46

47 A leíró statsztka elemzés menete:. Osztályok számának meghatározása. (egy lehetséges módszer) k 0 0 > N Y h max Y k 0 mn h 7 0 8> , Gyakorság táblázat osztályhatárok f g f g , 0, , , , 77 0, , , , , , , ,0 00,00 Összesen: 00,00 9. Táblázat Egy kcst gyakorlatasabb osztályba sorolással: Legyen h 0 0 k 0 0 osztályhatárok f g f g ,5 5 0, ,3 38 0, , 60 0, ,6 76 0, , , , , , , , , ,0 99 0, ,0 00,00 Összesen: 00,00 0. Táblázat 3. Medán s/ (00+ ) 50,5 Me ,5( ) 350 Medán becslése a gyakorság táblázat (. osztályba sorolást alkalmazva) alapján 47

48 ˆ ˆ! ',0 + + Me N f h f f N x Me me me me me me 4. Kvartlsek meghatározása ) (500 0, ,75 ) ( ,5 5) (30 0,5 5 5,5 ) ( / 4 / Q s Q s 5. Módusz mo 73 0 ) (3 5) ( ˆ ˆ, Mo f f d f f d h d d d x Mo mo mo f mo mo a mo f a a mo 6. Számtan átlag 39, Σ Σ f x f Y

49 Becslés gyakorság táblázatból: Osztályhatárok Osztályközép f f Y Összesen: Táblázat 7. Grafkus ábrázolás, hsztogram 7 osztályba sorolva: Hsztogram Gyakorság Tovább 0 osztályba sorolva: 5. ábra Hsztogram 5 0 Gyakorság ábra Tovább 49

50 8. Terjedelem R x x max mn 035 Interkvartls terjedelemmutató R 0,5 Q3 Q 500 6,5 73,75 9. Átlagos abszolút eltérés: d 7964,8 δ x x d N N 7964, ,65 0. Tapasztalat szórás s s N ( x x) N N ( x n ( x ,8 x) x) n , ,8 99 9,8 30,93 Becslés a gyakorság táblázat segítségével: Osztályhatárok Osztályközép f f Y d d f d ,8 7449, ,8 6503, , ,8 787,84 633, , 37, , , 7955, , , 76839, , 4993, , , 4707, , , 36869, , , 54375, ,8 Összesen: Táblázat 50

51 0 sˆ f d Relatív szórás 6, V Y s 9,8 39,9 0,586 A relatív szórás önmagában nem árul el sok mndent. Ha egy másk évfolyam 00 fıbıl álló mntájának relatív szórásával össze tudnánk hasonlítan, akkor a két relatív szórás közül a ksebbk esetén a számtan átlag jobban reprezentálja az alapadatokat.. Aszmmetra 3( x Me) 3(39,8 350) P 0,5587 s 9,8 Mérsékelt bal oldal aszmmetra (jobbra elnyúló eloszlás). 3. Lapultság, csúcsosság s/0 (00+ ) 0, 0 D 0+ 0,(0 0) s D 9 /0 9 9 (00+ ) 90, ,9( ) 784 Q3 Q 500 6,5 K 0,034 ( D D ) (784 ) 9 Mvel 0,034<0,63, csúcsosabb, mnt a normál eloszlás. 5

52 3.9. VISZONYSZÁMOK A vszonyszámok, mnt a gazdaság elemzések gyakran használt leíró statsztka mutató, két statsztka adat hányadosaként értelmezhetık: V ahol B a vszonyítás alap (bázs), A pedg a vszonyítás tárgyának adata. V alapvetı fajtá: a megoszlás-, a dnamkus- és az ntenzítás vszonyszámok. A megoszlás vszonyszám valamlyen résznek az egészhez vszonyított arányát mutatja (pl. relatív gyakorság). Ezek a vszonyszámok a sokaság, lletve az általa képvselt jelenség struktúráját jellemzk. A dnamkus vszonyszám az dıbel változás mutatója, hszen két különbözı dıszak, vagy dıpont azonos fajta adatanak egymáshoz vszonyított aránya. Az alapot képezı dıszak a bázsdıszak, az összehasonlítás dıszaka pedg a tárgy, vagy beszámolás dıszak. Dnamkus vszonyszámokat az dırend szernt felsorolt adatokból (dısorokból) a bázs állandóságától, vagy változásától függıen számolhatunk. Így megkülönböztetünk bázsvszonyszámokat és láncvszonyszámokat. A bázsvszonyszámok állandó bázsú dnamkus vszonyszámok. Az állandó bázs legtöbbször az dısor elsı adata, de más dıszakot s választhatunk bázsként. A láncvszonyszámok az dısor adatanak a közvetenül megelızı dıszakhoz való arányát mutatják. A láncvszonyszámok és a bázsvszonyszámok egymásból kszámíthatók. Ha az dısor adatat y -vel (0,,, n), a láncvszonyszámokat l -vel, a bázsvszonyszámokat b -vel jelöljük, akkor: l y b y o ha y 0 a bázs, így b 0. Nylvánvaló, hogy a láncvszonyszámok szorzataként bázsvszonyszámot kapunk: A B y y ugyans: k l... lk l bk l Π y y 0 y y y... y k k y y k 0 b k Az ntenzítás vszonyszám két különbözı fajta, de egymással összefüggı adat hányadosa (pl. egy dolgozóra jutó bérhányad, népességstatsztka arányszámok, stb). 5

53 Feladat: Az alább táblázatban a BUX között éves jellemzıt, lletve változásat foglaltuk össze. Határozza meg az átlagos abszolút- és relatív változás értékét. Adjon becslést a hozam rövd (pl. év) és hosszú távú várható alakulására. év BUX (Ft) változás az elızı évhez képest (Ft) változás az elızı év %-ban BUX hozam %/év (Ft) nduló 000, ,3-96,7 80,3-9,7 9 88,8 +5,5 03, +3, 93 9,4 +400,6 48,3 +48, , +5,7 0,5 +0, ,9 +76,8 05, +5, 96 49,3 +733,4 75,5 +75, , ,6 94,5 +94, ,0-574,9 8, -8,9 x - 7,6 38,6 38,6 Átlagos abszolút változás: 3. Táblázat x 7,6 8 Ha mnden évben 7,6 ponttal nıtt volna, akkor s 5773 pont lett volna a növekedés 8 év alatt. Átlagos relatív változás: Az évenként relatív változások (láncvszonyszámok) sorozatszerően függnek össze. Szorzatuk egyenlı az dısor egészében tapasztalt relatív fejlıdéssel (az utolsó bázsvszonyszámmal, vagys az utolsó és elsı adat hányadosával). x g 8 0,8033, ,83 8 6,77,7 x g ,77,7 A BUX évente átlagosan 7 %-al változott (növekedett). Ha a növekedés mnden évben 7 % lett volna, akkor s 677 % lett volna a növekedés 8 év alatt. Mndez azt s jelent, hogy az átlagos abszolút és relatív változás független attól, hogy az elsı és utolsó év között az dısor hogyan alakul. Ezért az alkalmazott átlagok csak akkor lehetnek jellemzıek, ha az dısor alapvetı tendencája egyenletes (növekedés vagy csökkenés). 53

54 Számításankat általánosságban (a vszonyszámoknál használt jelölésekkel) a következık szernt rhatjuk fel: n l n l n bn n Π y y n 0 Becslés a hozam várható alakulására: Az éves hozamok számtan átlaga: x 38,6% Ez az átlag csak egy rövd távú (pl. éves) várható hozam változás elırejelzéséhez adhat támpontot. Hosszabb távon a mértan átlag ad reálsabb becslést, hszen fgyelembe vesz a "kamatos kamat" jelleget (láncvszonyszámok) s: x g 7% 54

55 4. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I. Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 55

56 4.. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK A társadalm, a mőszak és a gazdaság jelenségek törvényszerőséget nemcsak önmagunkban, hanem a jelenségekkel szoros kapcsolatban lévı más tényezık összefüggésében s vzsgálhatjuk. Az eddg fejezetekben a véletlen tömegjelenségek leírását mndg egy már bekövetkezett állapot valószínőségelmélet, matematka-statsztka vzsgálatával végeztük el. A korrelácó- és regresszó- számítás során arra keressük a választ, hogy egy adott állapot mlyen tényezık hatására jött létre, az egyes tényezık mlyen mértékben befolyásolják a jelenség alakulását, a tényezık mlyen szoros kapcsolatban vannak egymással. A változók között összefüggés szorosságát, a sztochasztkus kapcsolat erısségét, ntenztását korrelácószámítással, míg az összefüggés jellegét regresszó-számítással határozzuk meg. Utóbb esetben az összefüggésekben lévı sztochasztkus tendencát, a kapcsolat természetét valamlyen függvénnyel írjuk le. Ha a vzsgálatok során az dı a független változó, a számításokat trendszámításnak nevezzük. A determnsztkus ( függvényszerő ) és a sztochasztkus jelenség, kapcsolat fogalmával az. fejezetben foglalkoztunk. Ugyancsak megsmerkedtünk a sztochasztkus függetlenség fogalmával s. Emlékeztetünk arra, hogy determnsztkus kapcsolatnál X változó adott értékehez Y változó meghatározott értéke tartozk, míg sztochasztkus kapcsolatnál Y változónak több lehetséges értéke s létezhet. Ezek az értékek és a hozzá tartozó valószínőségék az Y változónak az X változóra, mnt feltételre vonatkozó feltételes valószínőségek, amelyek a feltételre vonatkozó feltételes valószínőség eloszlást alkotják. A gyakorlat számítások során azonban csak az eloszlások feltételes várható értékével és varancájával jellemezzük a sztochasztkus kapcsolatot. Így rövden azt s mondhatjuk, hogy X és Y között sztochasztkus kapcsolat (korrelácó) esetén csak az egyk tényezı (X) és a másk tényezı (Y) átlagos értéke között van határozott kapcsolat. Ez azt s jelent, hogy a két változó nem független, de nncs közöttük funkconáls (determnsztkus) összefüggés, vagys az egyk változó értékét az X változó nagysága mellett még bzonyos egyéb véletlen hatások s befolyásolják. Hangsúlyozn kell, hogy a korrelácós és regresszós számítás a kapcsolatot jellemz, de semmt nem mond az okság vszonyról. Tehát két, vagy több változó között sztochasztkus kapcsolat megállapításából nem következk, hogy a változók okság összefüggésben vannak, azaz, hogy egyk tényezı változása oka a másk tényezı változásának. Az okság kapcsolatot csak alapos szakma és statsztka vzsgálattal lehet megállapítan. 56

57 4.. A KAPCSOLAT SZEMLÉLTETÉSE A nagyobb számítás munkát génylı matematka módszerek alkalmazása elıtt a kapcsolat létezésére vonatkozó szakma feltevésünket grafkus ábrázolással célszerő szemléltetn. Az x ; y értékpárok által meghatározott pontdagram, lletve emprkus regresszófüggvény szemléltet a kapcsolatot. Y -8.6E X R-Sq 6.5 % Y 5.07E X R-Sq 70.9 % Poztív korrelácó Negatív korrelácó Y -7.4E X R-Sq 3.4 % Y X X** R-Sq 88.4 % Nncs korrelácó Nem lneárs korrelácó 7. ábra: Pontdagramok Ha a pontok vonulás ránya (képzeletbel tengelye) felfelé mutat, poztív korrelácóról beszélünk (növekvı x értékekhez növekvı y értékek tartoznak), ellenkezı esetben a korrelácó negatív. A görbevonal korrelácó azt jelz, hogy nem lehet mnden korrelácót egyértelmően poztívnak, vagy negatívnak teknten. 57

58 4.3. AZ ELİJEL KORRELÁCIÓS EGYÜTTHATÓ A sztochasztkus kapcsolat szorosságát a grafkus ábrázolást követıen vszonylag kevés számítás munkával ellenırzhetjük. Az elıjel korrelácós együttható, mnt szorosság mérıszám, az gényesebb elemzések elıtt nyújthat hasznos nformácót. Feladat: 4 év adata alapján vzsgáljuk meg az ha szántóterületre vonatkoztatott mőtrágya felhasználás (x kg/ha) és az év búza termés átlagok (y q/ha) között kapcsolatok jellegét és szorosságát. (Az alább táblázat a késıbbekben felhasználásra kerülı részszámításokat s tartalmaz). x y d x x d y y x y d x d x y. 9,9,5-64, -8,3 408,8 68,9 53,0. 3,9 7,0-5,0-3,8 704,0 4,4 97,6 3. 3,6 6,9-5,3-3,9 735,3 5, 04,0 4. 4,4 9, -4,5 -,7 806,,9 7, 5. 53,5 7,9-30,4 -,9 94, 8,4 88, 6. 58,7 5,6-5, -5, 635,0 7,0 3, , 8,6-6,7 -, 78,9 4,8 36, ,4,7-3,5 0,9 8, 0,8 -, 9. 76,3,7-7,6 0,9 57,8 0,8-6,8 0. 0,3 5,9 7,4 5, 30,8 6,0 88,7. 4,4 5, 40,5 4,4 640, 9,4 78,. 36, 7, 5,3 6,3 735,3 39,7 39, ,6,3 8,7 0,5 6839,3 0, 4, ,0 30,7, 9,9 343, 98,0 099,9 74,3 9, 3793, 36,5 980,4 4. Táblázat x 83, 9 y 0, 8 y d d 58

59 8. ábra A grafkus ábrázolás poztív korrelácót és feltehetıen lneárs összefüggést mutat. (Szakma szempontból ez a feltételezés csak az adott mőtrágya felhasználás sznten lehet gaz, hszen közsmert a növekvı mőtrágya felhasználás csökkenı hatékonysága s). Az elıjel-korrelácós együttható értelmezéséhez és meghatározásához vegyük fgyelembe, hogy poztív korrelácó esetén x átlagosnál alacsonyabb értékehez általában az átlagosnál alacsonyabb y értékek tartoznak és ez fordítva s gaz. Ha tehát d és d eltéréseket hasonlítjuk össze, akkor poztív korrelácó esetén az esetek nagy részében az eltérések elıjele megegyezk. (Negatív korrelácó esetén a helyzet fordított lesz). Ebbıl lehet következtetn a kapcsolat rányára és szorosságára s. (Az azonos és eltérı elıjelő eltérés párok egyenlı aránya a kapcsolat hányát jelz). Az elıjel-korrelácós együtthatást (r e ) az alábbak szernt értelmezzünk: ahol: u az elıjel egyezések száma, v az elıjel eltérések száma (u + v n). u v r e u+ v Nylvánvaló, hogy r e értéke (-) és (+) között helyezkedk el. Függvényszerő (determnsztkus) kapcsolat esetén r e, de ez fordítva nem feltétlenül gaz. (Megjegyezzük, ha valamelyk eltérés párban az egyk, vagy mndkét eltérés nulla, akkor az adott egységnél u0,5 és v0,5 értékekkel számolunk). Mntapéldánkban u, v, ezért: x y r e 4 0,7 amelybıl a két változó közepesnél jóval erısebb, poztív rányú kapcsolatára következtethetünk. 59

60 Ha a pontdagramban behúzzuk az y y és x x egyeneseket, akkor u az I. és III. negyedbe esı pontok számának az összessége, míg v a II. és IV. negyedben található pontok összege lesz A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ A regresszó számítás feladata a változók között összefüggés jellegének meghatározása. Ennek során a pontdagramos ábrázolással érzékeltetett tendencát valamlyen analtkusan smert függvénnyel próbáljuk leírn. A Y f( X) regresszós függvényt a legksebb négyzetek elve és módszere alapján határozzuk meg. Ez azt a követelményt támasztja, hogy az adott függvénytípust (egyenes, parabola, exponencáls, stb.) használata során a n ( y ŷ ) összeg mnmáls legyen. Az y yˆ eltérések (rezduumok) négyzetenek összege jól jellemz a ponthalmaz és a regresszós vonal kölcsönös vszonyát. A leggyakrabban alkalmazott lneárs regresszós modellben a legksebb négyzetek módszere azt a regresszós egyenest teknt a legjobban lleszkedınek, amely a pontdagram egyes pontjatól átlagosan a lehetı legksebb merıleges távolságban halad (9. ábra). 9. ábra: Merıleges távolságok Egy lyen egyenesnek az egyenletét azonban csak bonyolult számításokkal lehet meghatározn. Másk megoldás lehetıségnek adódk, ha nem a merıleges távolságok mnmalzálására törekszünk, hanem a pontoknak a regresszós egyenestıl vett függıleges, vagy vzszntes távolságanak négyzetes összegét választjuk a lehetı legksebbre (0. ábra,. ábra,. ábra). 60

61 0. ábra: Függıleges távolságok Y 0 X b + b X. ábra: Négyzetes (függıleges) távolságok Y 0 X b + b X. ábra: Négyzetes (vízszntes) távolságok 6

62 A legksebb négyzetek módszerével elıállított egyenest elsı regresszós egyenesnek nevezzük, ha a függıleges távolságokra mnmalzálunk, lletve másodk regresszós egyenesnek nevezzük, ha a vzszntes távolságokra mnmalzálunk. Ez a két egyenes általában nem esk egybe (3. ábra, 4. ábra). 3. ábra: Erıs lneárs kapcsolat 4. ábra: Gyenge lneárs kapcsolat Nylvánvaló, hogy a két regresszós egyenes között annál nagyobb a különbség, mnél jobban szóródnak a ponthalmaz pontja. Kvaltatív módon belátható az s, hogy annál erısebb a lneárs kapcsolat a két változó között, mnél kevésbé tér el egymástól a két regresszós egyenes. Az egyk szélsı esetben, ha az összes pont egy egyenesre esk, akkor a két regresszós egyenes meredeksége egyenlı (5. ábra). Ebben az esetben abszolút lneárs kapcsolatról beszélünk. A másk szélsı esetben a regresszs egyenesek merılegesek egymásra (6. ábra), azaz semmlyen lneárs kapcsolatról nem beszélhetünk. 5. ábra: Abszolút lneárs kapcsolat 6

63 6. ábra: Nncs lneárs kapcsolat A lneárs korrelácó analízs lényegében azt vzsgálja, hogy mennyre tér el az elsı regresszós egyenes meredeksége a másodktól. Ha a meredekségek aránya r ( x, y), akkor ennek négyzetgyöke a Pearson-féle tapasztalat korrelácós együttható. (Ennek valószínőségelmélet értelmezésére a. fejezetben térünk vssza.) A korrelácós együttható értéke nulla, ha X és Y függetlenek (.5 pont). Ez fordítva általában nem gaz: abból, hogy két valószínőség változó korrelácós együtthatója nulla, nem feltétlenül következk, hogy a két változó független s egymástól (kvétel, ha X és Y együttes eloszlása normáls). Ha a két változónál csak azt tudjuk, hogy r(x,y)0, akkor korrelálatlannak nevezzük ıket. A korrelácós együttható abszolút értéke legfeljebb, azaz ( x, y) r + és a ± értéket akkor és csak akkor ér el, ha X és Y között lneárs kapcsolat van: y b x+ b 0 Ha b >0, akkor r(x,y), ha b <0, akkor r(x,y). Poztív sztochasztkus kapcsolatnál 0<r(x, y)<, míg negatív sztochasztkus kapcsolatnál <r x, y)<0. Természetesen, mnél szorosabb a kapcsolat, ( x y) r, annál jobban közelít az -et. A korrelácós együtthatót a mntabel, tapasztalat adatokból az alább módon becsülhetjük: r ( x, y) n n d d x x d n y d y ahol: d x x x és d y y. y 63

64 Feladat: Számítsuk k a mntapéldában szereplı változó korrelácós együtthatóját! A táblázatban ( 4.3 pont) közölt adatok alapján: 980,4 r ( x, y ) 0, , 36,5 A lneárs regresszós vzsgálat során általában az elsı regresszós egyenest alkalmazzuk. Ekkor az b 0 és b becsült értékere a legksebb négyzetek módszerét alkalmazva a levezetések mellızésével az alább eredményt kapjuk: b b 0 n d x n d d x y b x A regresszós egyenes b együtthatóját regresszós együtthatónak nevezzük. Mnt az egyenes ránytangense statsztka értelemben megadja, hogy x egységny változása mekkora átlagos változást déz elı y-ban. A b 0 együttható pedg az x0 helyhez ad regresszós becslést. Feladat: Mntapéldánkban határozzuk meg a regresszós egyenes egyenletét! 0 y 980,4 b 0, , b 0,8 0,08 83,9 4, Így a regresszós egyenes egyenlete: y 0,08x+ 4, 4.5. AUTO- ÉS KERESZTKORRELÁCIÓ IDİSOROK ELEMZÉSÉNÉL Az dısor fogalmával korábban már megsmerkedtünk ( 3.9 pont). Gazdaság dısorok adatanak elemzése (Befektetések, Vállalatgazdaságtan) a korrelácószámítás szempontjából számos specáls problémát vet fel. Gyakran elıfordul, hogy egy vagy több dısor egymást követı adata egymástól nem függetlenek, hanem szoros korrelácóban állnak egymással. Ez a jelenség az autokorrelácó, amennyben egy változó egymást követı adatanak kapcsolatát vzsgáljuk, és keresztkorrelácó, ha több változó hasonló kapcsolatát nézzük. A regresszós modellben ez úgy jelentkezk, hogy az egymást követı rezduáls értékek között korrelácós kapcsolat mutatkozk. Az autokorrelácó különbözı rendő lehet. Elsırendő az autokorrelácó, ha az dısorban a hbatényezı t-edk értéke a (t-)-edk, közvetlen szomszédos értékkel van korrelácós kapcsolatban. 64

65 Feladat: A következıkben az között dıszakban rögzített tızsde adatokból a MINITAB alkalmazásával készült különbözı eloszlás- és regresszós modelleket mutatunk be. Értelmezzük az eredményeket! 7. ábra 65

66 8. ábra 66

67 5. VALÓSZÍNŐSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 67

68 5.. A VALÓSZÍNŐSÉGI VÁLTOZÓ A valószínőség változó fogalma: A valószínőség változó jellege: 68

69 5.. VALÓSZÍNŐSÉGI VÁLTOZÓ JELLEMZİI Valószínőség-eloszlás függvény: Dszkrét esetben a ξ valószínőség változó eloszlását egyértelmően az jellemz, hogy a változó a lehetséges értéket mlyen valószínőséggel vesz fel. Ezt adja meg a p k valószínőség-eloszlás: Tulajdonsága: I. 0 p k p k p( ξ k) k II. p k III. P( a ξ < b) k b p k a Feladat: Rajzolja fel a kockadobás valószínőség-eloszlás függvényét! Eloszlásfüggvény: Az eloszlásfüggvény [jelölése: F(k) v. folytonos változó esetén F(x)] megadja, hogy a ξ valószínőség változó mekkora valószínőséggel vesz fel egy adott k-nál, vagy x-nél ksebb értéket, azaz: Tulajdonsága: F(k)P(ξ<k) ll. F(x)P(ξ<x). monoton növekvı, azaz F(a) F(b), ha a<b F(- )0, F( ) balról folytonos p k és F(k) kapcsolata: p k F( k+ ) F( k) F ( k) k p P( a ξ < b) F( b) F( a) b p k k a 69

70 Feladat: Rajzolja fel a kockadobás eloszlásfüggvényét! Sőrőségfüggvény: Ha a ξ folytonos valószínőség változó eloszlásfüggvénye F(x), akkor az ' f ( x) F ( x) függvényt a ξ sőrőségfüggvényének nevezzük. Tulajdonsága: f ( x) f ( 0 x )dx f(x) és F(x) kapcsolata: Várható érték: F( x) x ' f ( x) dx; f ( x) F ( x) P ( a ξ < b) F( b) F( a) f ( x) dx b a A ξ dszkrét valószínőség változó lehetséges értéke legyenek k, k, k 3,., akkor ξ várható értékének az M( ξ ) p k összeget nevezzük; Ha ξ folytonos valószínőség változó és sőrőségfüggvénye f(x), akkor a ξ várható értéke M( ξ ) x f ( x )dx. Feladat: Számítsa k a kockadobás várható értékét! 70

71 A várható érték egy fontos tulajdonsága: ha ξ, ξ... ξ n tetszıleges valószínőség változók, akkor összegük várható értéke egyenlı a valószínőség változók várható értékének összegével: M ( ξ + ξ ξ ) M( ξ ) + M( ξ ) M( ), n ξ n Szórás, szórásnégyzet: Ha a ξ-m(ξ) valószínőség változó négyzetének létezk a várható értéke, akkor ezt ξ szórásnégyzetének nevezzük: D ( ξ ) M( ξ M( ξ )] ). Ennek négyzetgyöke a D( ξ ) D ( ξ ) a ξ valószínőség változó szórása. Feladat: Számítsa k a kockadobás szórását! [ A szórásnégyzet egy fontos tulajdonsága: ha ξ, ξ független valószínőség változó és szórásak ξ... léteznek, akkor összegük és különbségük szórásnégyzete egyenlı a valószínőség változók szórásnégyzetének összegével: D ( ξ + ξ ξ ) D ( ξ ) + D ( ξ ) D ( ξ ) n Medán: Valamely ξ valószínőség változó medánja (Me) az a valós szám, amelyre P(ξ<Me) 0,5. Kvantlsek: A medánhoz hasonlóan értelmezhetjük a p-kvantlst. A p-kvantls az a valós szám, mely az eloszlást p/(-p) arányban osztja ketté. A fentek alapján a medán a 0,5-kvantls. Módusz: Ha ξ valószínőség változó lehetséges értéke között van olyan, amelyet nagyobb valószínőséggel vesz fel, mnt a többt, akkor ezt az értéket ξ móduszának nevezzük. Folytonos valószínőség változó esetén ξ módusza a sőrőségfüggvény (lokáls) maxmumhelye(). Momentumok: A ξ valószínőség változó momentumanak nevezzük a következı számértékeket: k-adk momentum M(ξ k ), k-adk abszolút momentum M( ξ k ), k-adk centráls momentum M{[ξ-M(ξ)] k }, k-adk centráls abszolút momentum M[ ξ-m(ξ) k ], ahol k,,3,. Látható, hogy ξ elsı momentuma M(ξ), a valószínőség változó várható értéke, s másodk centráls momentuma M{[ξ-M(ξ)] }, a szórásnégyzete. n n 7

72 5.3. BINOMIÁLIS ELOSZLÁS Ha egy kísérlet során az A esemény bekövetkezését ll. be nem következését vzsgáljuk azaz alternatív, két kmenetelő eseményrıl beszélünk -, s az A esemény bekövetkezés valószínősége P(A)p, és a kísérletet n-szer egymástól függetlenül megsmételjük, akkor ha a vzsgált ξ valószínőség változó az A esemény bekövetkezésének száma, a ξ valószínőség-eloszlását bnomáls eloszlásnak nevezzük, s az alább összefüggéssel határozhatjuk meg: p k n k k n k ξ p q, ahol q p P( k ) Az eloszlás várható értéke és szórásnégyzete: D M (ξ ) n p ( ξ ) n p q Mnıségmenedzsment területén elsısorban a vsszatevéses mntavétel során alkalmazzuk a bnomáls eloszlást ll. bzonyos feltételek esetén a hpergeometrkus eloszlás helyettesítésére. Ha p (n+) szorzat egész szám, akkor az eloszlásnak két módusza van, az (n+) p- és az (n+) p helyen. Ha p (n+) nem egész, akkor az eloszlás unmodáls és a módusz az (n+) p egész része. Ha n nagy, akkor az eloszlás módusza az eloszlás várható értékéhez közel szám, azaz a bnomáls eloszlás legnagyobb valószínőséggel a várható értékéhez közel értéket vesz fel. Feladat: Mekkora valószínőséggel találunk egy 5%-os selejtaránnyal jellemezhetı tömeggyártásból kvett 0 elemő véletlen mntában db selejtes terméket? 7

73 Feladat: Az UEFA szgorú elıírása alapján állít elı a Mnıség Bır Kft. labdarúgó labdákat 500 darabos tételekben. Az átadás-átvétel eljárás során két elıírás szernt járhatunk el: a.) két 0 darabos mntában egyetlen hbás darab sem lehet, b.) három 0 darabos mntában mntánként legfeljebb darab selejtes lehet. Melyk eljárást választaná az UEFA és melyket a Mnıség Bır Kft. helyében, ha a selejtarány várhatóan 5 %? 73

74 5.4. POISSON-ELOSZLÁS Dszkrét eloszlások közül ez az egyk leggyakrabban elıforduló eloszlás a gyakorlatban. A Posson-eloszlást ks valószínőségő, vagys rtka események eloszlástörvényének s nevezk, mvel ezzel az eloszlással írhatók le az ún. véletlen pontelhelyezkedések: Az egyenesen, síkon, térben véletlenszerően elhelyezkedı pontok esetén egy adott tartományba esı pontok száma, vagy a véletlenszerő dıpontokban bekövetkezı eseményeknél adott dıtartam alatt bekövetkezı események száma gen gyakran Posson-eloszlású. (Ilyen eloszlás például ezen jegyzetben a gépelés hbák száma.) Az eloszlás valószínőség-eloszlás függvénye: p λ k! k λ k P( ξ k ) e, ahol λ>0 valós szám, az eloszlás paramétere; k,,3,. Az eloszlás várható értéke és szórásnégyzete: M ( ξ ) λ D ( ξ ) λ A Posson-eloszlás segítségével bzonyos esetekben közelíthetjük a bnomáls eloszlást. Ha n elég nagy és p kcs, akkor aránylag ks k értékekre a bnomáls eloszlást a λn p paraméterő Possoneloszlás megfelelı tagjaval közelíthetjük. Az eloszlás módusza, ha λ egész szám, akkor az eloszlás bmodáls Mo λ- és Mo λ. Ha λ nem egész szám, akkor a módusz λ egész részénél van, az eloszlás unmodáls. Ez azt jelent, hogy a Posson-eloszlás legnagyobb valószínőséggel a várható értékét vagy ahhoz közel (annál ksebb) értéket vesz fel. Feladat: Egy készülék meghbásodásanak átlagos száma 0000 mőködés óra alatt 0. Határozzuk meg annak a valószínőségét, hogy a készülék 00 mőködés óra alatt nem romlk el! 74

75 Feladat: Egy készülék szavatosság deje egy év. A készülék 000 darab azonos, különlegesen megbízható elemet tartalmaz, amelyek a szavatosság dı alatt egymástól függetlenül 0,0005 valószínőséggel romlanak el. A szavatosság alapján a gyártó vállalat az egy éven belül bekövetkezett meghbásodások javítására esetenként a teljes ár /4 részét fzet vssza. Ha a javítások száma az év során elér az ötöt, akkor a gyártó vállalat a már kfzetett négy javítás költségen felül a teljes árat s vsszafzet. Számítsuk k, hogy elıreláthatólag az eredet vételár hány százaléka marad a gyártó vállalatnál! Feladat: 00 méter hosszú szövetanyagon átlagosan 5 hbát találtunk, s a mérések a szövethbák számát Posson-eloszlásúnak mutatták. 300 méter hosszú szövetet 4 méter hosszú terítékekre osztanak. Mnden 4 méteres darabból egy-egy öltöny készül. A hbátlan öltönyt darabonként forntért árusítják, a szövethbásat forntért. a.) Várhatóan hány hbátlan van a 300 méteres szövetvégbıl készült öltönyök között? b.) Menny az öltönyök eladásából származó árbevétel? 75

76 5.5. EXPONENCIÁLIS ELOSZLÁS Az exponencáls eloszlás legnkább bzonyos véletlen hosszúságú dıtartamok eloszlásaként lép fel. Általában exponencáls eloszlású, például: egy olyan berendezés, rtkább esetben alkatrész élettartama, hbamentes mőködés deje, amelynek tönkremenetelét, meghbásodását nem kopás vagy természetes elhasználódás okozza, hanem váratlan törés, szakadás lletve egyéb véletlen ok, egy radoaktív atom élettartama (azaz keletkezésétıl az elbomláság terjedı dıszakasz hossza), bzonyos esetekben egy kéma kötés felszakadáság eltelt dı, véletlentıl függı hosszúságú telefonbeszélgetések dıtartama, egyéb, a véletlentıl függı hosszúságú mőködés-, javítás-, kszolgálás-, várakozás- és követés dı, lletve dıköz. Az exponencáls eloszlású valószínőség változó: sőrőségfüggvénye: f ( x ) 0, λe -λx ha x 0 ha x 0 eloszlásfüggvénye: 0, F( x ) e -λx ha x 0 ha x 0 várható értéke: M(ξ) szórásnégyzete és szórása: D (ξ) D(ξ) 76

77 Feladat: Egy automatzált gépsor hbamentes mőködésének valószínősége 0 mőködés órára 0,9. Tegyük fel, hogy a mőködés dı exponencáls eloszlású. Számítsa k a λ meghbásodás rátát és a mőködés dı várható értékét, valamnt annak a valószínőségét, hogy a gépsor a 50. és a 00. óra között meghbásodk. 77

78 Feladat: Egy radoaktív anyag (sugárforrás) bomlás vszonyat vzsgáljuk. Legyen a valószínőség változó egy tetszıleges atom bomláság eltelt dı és annak valószínősége, hogy az anyag egy tetszıleges atomja x éven belül elbomlk: P( ξ x ) e x /, ha x 0 a.) Határozza meg a valószínőség változó várható értékét, szórását, valamnt a bomlás felezés dejét! b.) Számítsa k annak a valószínőségét, hogy egy tetszıleges atom túlél a 3 évet! 78

79 Feladat: Számítsa k az F(x/λ) eloszlásfüggvény értékét! 79

80 5.6. NORMÁLIS (GAUSS-) ELOSZLÁS A leggyakorbb eloszlás a menedzsment területén elıforduló elmélet eloszlások közül. Ha egy valószínőség változó értékét nagyszámú, egymástól függetlenül ható véletlen tényezı határozza meg úgy, hogy az egyes tényezık külön-külön csak gen ks mértékben járulnak hozzá az összes véletlen hatásból eredı ngadozáshoz, és az egyes tényezık hatása összeadódnak, akkor általában normáls eloszlású valószínőség változót kapunk (központ határeloszlás tétel). Normáls eloszlással írható le például: arányos skálán mérhetı termékjellemzı (például: szélesség, hosszúság, vastagság, tömeg, összetétel) és technológa paramétere (például: hımérséklet, nyomás, sebesség) matematka modellezése, egyéb, több tényezı összegzıdése révén elıálló mennység eloszlásának modellezése (például: testmagasság, munkabérek, eseménydı a hálótervezésben, élettartam, két meghbásodás között eltelt dı), véletlen jellegő mérés hbák matematka leírása, technológa folyamatok rányítás algortmusának kalakítása (például: számtan átlag alapján történı szabályozás). A normáls eloszlású valószínőség változó sőrőségfüggvénye: eloszlásfüggvénye: f ( x ) ( x µ ) σ e, ahol < x <, σ π 0 σ F( x ) e σ π várható értéke: M(ζ) µ szórása: D (ζ) σ. x ( x µ ) Az F(x) függvény nem elem függvény, értéket táblázat alapján határozhatjuk meg. A µ, σ paraméterő normáls eloszlást rövden N(µ;σ) val jelöljük. A µ0, σ paraméterő normáls eloszlású valószínőség változót standard normáls eloszlásúnak nevezzük. Normáls eloszlás esetén ennek eloszlásfüggvénye adott táblázattal, s tetszıleges N(µ;σ)-ra vonatkozó valószínőségeket az N(0,) táblázat segítségével határozzuk meg. A normáls eloszlással történı gyakorlat számításokat jelentısen megkönnyítjük, ha az u x µ σ transzformácóval az x változó helyett bevezetjük az u változót, s az így kapott standard normáls eloszlás valószínőség függvényevel számolunk. A standard normáls eloszlás jelentıségét az adja, hogy bármely N(µ;σ) eloszlás F(x) eloszlásfüggvénye mndg kfejezhetı az N(0;) eloszlás Φ(u) eloszlásfüggvényével: F( x) Φ( u) Mvel a standard normáls eloszlás 0 körül szmmetrkus, ezért: Φ ( u) Φ( u) dx 80

81 Feladat: Határozzuk meg annak valószínőségét, hogy az N(µ;σ) eloszlású valószínőség változó a várható értékétıl legfeljebb szórásnyra, két szórásnyra, három szórásnyra tér el! P( µ σ < ξ < µ + σ ) F( µ + σ ) F( µ σ ) µ + σ µ µ σ µ Φ Φ Φ() Φ( ) Φ() ( Φ()) Φ() σ σ 0,843 0,686 A fent számolás menetet alkalmazva ll. 3-szoros szórásnyra való eltérésre az alább eredmények adódnak: P( µ σ < ξ < µ + σ ) 0,977 0,9544 P( µ 3σ < ξ < µ + 3σ ) 0, ,9973 Vagys a ξ a várható értékétıl legfeljebb szórásnyra kb. 0,68, legfeljebb két szórásnyra kb. 0,95 ll. legfeljebb három szórásnyra kb. 0,997 valószínőséggel tér el. A normáls eloszlás fent tulajdonságát nevezzük háromszgma szabálynak. Ezt mutatja a 9. ábra. µ-3σ µ-σ µ-σ µ µ+σ µ+σ µ+3σ 68,6 % 95,44 % 99,73 % 9. ábra: A háromszgma szabály 8

82 Feladat: 00 g névleges tömegő mosópor töltésekor elıírás szernt az ATH90g, amely alá a legyártott mennység 4%-a kerülhet. A jelenleg töltés folyamatban µ04,4g, σ9,4g. a.) Megfelel-e a gyártás az elıírásoknak? Ha nem, akkor mlyen optmáls töltés szntet kell elérn, hogy megfeleljen? b.) Mekkora legyen a szórás, hogy a µ04,4g lehessen a töltés várható értéke? 8

83 Feladat: A bélszínrolót négyesével csomagolják tasakokba. A rolók súlya N(50g; 5g) eloszlást követ. Mekkora a valószínősége annak, hogy a tasak valamenny rolója 55 grammnál nehezebb? Feladat: Export konyak töltésénél az 50ml alatt palackok aránya legfeljebb 3% lehet. Megvzsgáltak egy n0000db-os tételt: x 53,4ml, σ6ml. Határozzuk meg az optmáls töltés szntet. Mekkora az adott tételnél a töltés veszteség értéke, ha á000ft/palack? 83

84 Feladat: Egy bankfókban a nap kfzetések összege N(3,6mFt; 0,9mFt) eloszlást követ. a.) Menny a valószínősége annak, hogy a nap kfzetések összege a µ±σ ntervallumba esk? b.) Mekkorára kellene a kfzetések szórásának megváltozn ahhoz, hogy az 5mFt felett kfzetések valószínősége 4% legyen? c.) Menny pénzt kell tartan a fókban, ha 95%-os valószínőséggel akarjuk bztosítan a kfzetések teljesítését? 84

85 Feladat: Egy termék mérethbája (eltérés a névleges mérettıl) normáls eloszlású valószínőség változó, amelynek várható értéke 0. Megállapították, hogy a mérethba abszolút értéke 0,8 valószínőséggel nem ér el a 0mm-es határt, amelyen belül a termék még elfogadható mnıségő. A termék I. osztályúnak mnısül, ha a mérethba abszolút értéke a 0mm-t nem haladja meg. Mekkora a valószínősége ennek egy találomra kvett termék esetén? Feladat: Egy elektronka gyárban tesztekkel gazolták, hogy egy TV képcsı élettartama N(5,8 év;,3 év) eloszlású. A vállalat év cseregarancát vállal a képcsövekre. A képcsövek hány százalékát kell kcseréln a garanca dıtartama alatt? Mekkorára kell növeln a képcsövek élettartamát (a szórás nem változk), ha a cég legfeljebb %-os garancáls cserét szeretne elérn? Legfeljebb mekkora szórása lehet az élettartamnak ha a várható érték nem változk (5,8 év) ahhoz, hogy a %-os célt elérjék? 85

86 5.7. A KÖZPONTI HATÁRELOSZLÁS TÉTELE A központ határeloszlás tétele a sok véletlen komponens különféle függvényenek (például összegének, szorzatának, maxmumának) aszmptotkus eloszlásaval foglalkozó határeloszlástételek közül a legfontosabb a gyakorlat számára. A tétel magyarázatot ad arra, hogy mért találkozunk oly gyakran a természet és a társadalom jelenségenek törvényszerőséget vzsgálva a normáls eloszlással. A központ határeloszlás tétele értelmében, ha η, η,..., η n azonos eloszlású, véges M(η ) várható értékő és véges D(η ) szórású független valószínőség változók, akkor a belılük képzett valószínőség változó n esetén N(0;) eloszlású. Amennyben az η, η,..., η n, azonos várható értékő és szórású valószínőség változók, akkor ξ kfejezhetı a következı alakban: A tapasztalat azt mutatja, hogy már aránylag ks n esetén s az elıbbekben felsorolt tulajdonságokkal rendelkezı valószínőség változók összegébıl képzett ξ* valószínőség változó közelítıleg normáls eloszlású M(ξ*) várható értékkel és D (ξ*) szórásnégyzettel. 86

87 kocka esetén kocka esetén 3 kocka esetén 4 kocka esetén 5 kocka esetén 6 kocka esetén 30. ábra: A kockadobás összegének valószínősége eloszlása 87

88 6. STATISZTIKAI DÖNTÉSEK ALAPELVEI Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 88

89 6.. ESETPÉLDA Egy kezdı vállalkozás az "A" és "B" jelő termékek gyártását végz. A vállalkozó mnden hónap végén a rendelkezésre álló nformácók alapján dönt, hogy a gyártósor kapactását a következı hónapban az "A" vagy a "B" termékkel köt-e le, mvel csak az egyk gyártható, ha a gyártósort erre állították át. A vállalkozó súlyos raktározás gondokkal küzd, ezért ha az adott hónapban gyártott terméket nem tudja elhelyezn azonnal a tervezett áron, akkor árengedménnyel értékesít azt. Rendelkezésre állnak a következı mőszak és gazdaság adatok: Mlyen döntést hozna, ha "A" "B" kapactás (db/hó) k prop (Ft/db) K fx (Ft/hó) á tervezett (Ft/db) á engedmény (Ft/db) 60 0 a.) nncs nformácónk a pac elhelyezhetıségrıl? b.) a korább dıszak statsztkája szernt az esetek 70 %-ában az "A", 30 %-ában a "B" terméket keresték a pacon? c.) packutatók véleményére támaszkodunk, és smert, hogy ha a pac az "A" terméket kereste, azt a packutatók 90 %-ban skeresen jelezték elıre, a "B" termék keresletét pedg 80 %-ban találták el. d.) tökéletes nformácóval rendelkezünk? 6.. DÖNTÉSI ALAPMODELL Döntés, döntéshozó: A döntéshozatal alapvetı folyamat. Valamenny ember tevékenységgel egybefonódk valamenny ember tevékenység döntés helyzetek elemzésével tanulmányozható. Néhány szlárd elvre támaszkodva feltárhatjuk azoknak a krtkus döntés elemeknek a halmazát, amelyek mnden döntés problémában újra és újra megjelennek. Döntés helyzetnek nevezzük az olyan helyzeteket, amelyekben az egyén vagy csoport, azaz a döntést hozó legalább két cselekvés változat (cselekvés mód) között választás problémájával áll szemben. A döntés: választás legalább két cselekvés változat között. A döntés helyzet elemzésének különféle közelítése egy bzonyos modell felé mutatnak, amelyet döntés alapmodellnek nevezünk. A döntés alapmodell eleme vszonylag könnyen feltárhatók. A döntés helyzet elsı eleme, a döntést hozó. Döntéshozónak nevezzük azt a személyt (vagy csoportot), ak a cselekvés változatok közül választ egyet. A döntéshozó választását, azaz döntését, az motválja, hogy vannak célja (de legalább egy célja), amelyeket vagy amelyet el akar érn. A cél elérésére több cselekvés változat közül választhat. Ha csak egyetlen cselekvés változatot teknt, akkor nem beszélünk döntésrıl, mert meghatározásunk értelmében a döntés választást jelent, márpedg választáshoz legalább két cselekvés változat kell. 89

90 Cselekvés változatok, stratégák: s Egy cselekvés változat (cselekvés mód) a döntéshozó rendelkezésére álló erıforrások bzonyos formában való felhasználását jelent. Más fogalmazásban, egy cselekvés változat a döntéshozó hatáskörébe tartozó szabályozható változók bzonyos módon való együttese. A cselekvés változatoknak különbözı következmények vannak. Ha a cselekvés változatok következménye között nncs különbség, akkor döntés problémáról sem beszélhetünk, hszen mndegyk azonos (vagy azonosnak tekntett) következménnyel jár. A következményeket másképpen a cselekvés változatok eredményenek s nevezk. A cselekvés változatok azonban az esetek többségében nem határozzák meg egyértelmően következményeket. A következményekre ugyans hatással vannak a döntéshozó által nem, vagy csak részlegesen szabályozható külsı körülmények. Ezeket a külsı körülményeket tényállapotoknak nevezzük. Tényállapotok: t A tényállapotok olyan eseményeknek teknthetık, amelyek nem a cselekvés változat tényezınek hatására következnek be, de a cselekvés változat következményére hatással vannak. Egy tényállapotot (eseményt) a döntés hozó által nem, (vagy csak részlegesen) szabályozható változók együttesének tekntünk. Következmények, eredmények: o j A cselekvés változatok és tényállapotok együttesen határozzák meg a cselekvés változat következményét (eredményét). Egy következmény egy cselekvés változat és egy tényállapot együttes hatásának eredménye. Tényállapotok valószínősége: p(t ) A külsı körülmények, tényállapotok (események) jelenlétének vagy késıbb bekövetkezésének megállapítása vagy elırejelzése nem könnyő feladat. Rendszernt nem s tudjuk bztosan megmondan, hogy mlyen tényállapot (esemény) van jelen, lletve mlyen következk be késıbb. Megállapításank csak bzonyos valószínőséggel érvényesek. A cselekvés változatok és tényállapotok együttesen határozzák meg a következményeket és ezért a tényállapotok valószínősége egyúttal a következmények valószínősége s, abban az esetben, ha a tényállapotok és cselekvés változatok egymástól függetlenek. Döntés krtérumok: A fentekben azonosított döntés tényezıkön kívül gen lényeges tényezı még a döntés krtérum, amely alapján a lehetséges cselekvés változatok közül kválasztjuk a megfelelıt. A döntés krtérum olyan elıírás, amely megmondja, hogyan használjuk fel az elıbb nformácókat egyetlen cselekvés változat kválasztására. 90

91 6.3. DÖNTÉSI MÁTRIX A döntés lényeges elemenek smertetése után rendezett formában feltárhatjuk a döntés statkus szerkezetét. A szerkezetet a döntéselemzésben használt két formával jellemzk: a döntés mátrx-szal és a döntés fával. Esetünkben: 6.4. A DÖNTÉSI FOLYAMAT LOGIKÁJA A döntés szerkezetének feltárásával a döntéshozó látja a cselekvés változatokat következményekkel együtt, s ezután döntése elıtt (egy cselekvés változat kválasztása a cselekvés változatok halmazából) gondolkodk, pontosabban szólva: átgondolja, vagy megfontolja, a szóban forgó, smert szerkezető, döntés problémát. A megfontolás során fgyelembe vesz, hogy az egyes tényállapotok mekkora valószínőséggel következnek be (vagy vannak jelen). Ha a cselekvés változatok és a tényállapotok egymástól nem függetlenek, akkor a következmények valószínőségét teknt. A függetlenséget úgy értelmezzük, hogy a cselekvés változatok nem változtatják meg a tényállapotok valószínőséget. Kérdés, hogy mképpen határozzuk meg a tényállapotok bekövetkezésének (vagy a következményeknek) valószínőségét? A legegyszerőbb a döntést hozó korább tapasztalatara alapozott szubjektív becslés. A korább tapasztalatok nyomán megfogalmazott valószínőséget a pror valószínőségnek nevezk (.4 pont). A valószínőségek számszerő megfogalmazásában azonban a döntést hozó nem járhat el önkényesen. A valószínőségszámítás axómának megfelelıen kell a valószínőségek számértéket hozzárendeln a tényállapotokhoz (vagy következményekhez). A tényállapotok egymást kzárják, továbbá un. teljes eseményrendszert alkotnak, azaz valamelyk bztosan bekövetkezk közülük. A tényállapotok valószínősége összegének tehát egyet kell adnuk (mvel a bztos esemény valószínősége egy). A valószínőség számérték megállapításának másk módja az új nformácók szerzése. Az nformácók mennysége lehet teljes vagy részleges. Az esetek túlnyomó hányadában csak részleges nformácómennységet szerezhetünk. A részleges nformácómennység érdekes következménye, hogy a döntést erre alapozva fennáll a tévedés lehetısége. A tévedés azaz hba kétféle típusú lehet. Igaz hpotézst utasítunk el, úgynevezett elsıfajú hbát vétünk, vagy hams hpotézst fogadunk el gazként másodfajú hbát követünk el. Részleges nformácót mndg mntavételes eljárással szerzünk. Ebben az esetben mndg fennáll a kétfajta hba elkövetésének kockázata. 9

92 A valószínőség számérték megállapításának harmadk lehetısége az a pror és az új nformácók ötvözése. Erre lehetıséget nyújt az un. Bayes-féle logka. A gondolat nagyjelentıségő: a tapasztalatokon nyugvó megállapítások módosítása az új nformácók tükrében. Belátható ugyans, hogy a tapasztalat (korább tapasztalatokról van szó) nformácókat nem szabad (lletve nem célszerő) elvetn akkor, ha az új nformácók szerzésében korlátozottak vagyunk elv vagy gyakorlat okok matt. Elınyösebb tehát a rég és az új ötvözése. A Bayes-féle logka matematka alapja a valószínőségszámításban szereplı Bayes-tétel. A Bayes-féle következtetés jelentısége a modern döntéselméletben rohamosan nı (.4 pont) DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK Egységes döntés krtérum nncs. Tudjuk, hogy vannak kfejezetten szubjektív (a rossz értelemben vett szubjektív) döntés krtérumok s. Ilyen például a tekntély elv krtéruma, amkor valak a tekntélyt teknt döntı krtérumnak (saját vagy mások tekntélyét), vagy lyen az önkényesség (autark krtérum). A rossz értelemben vett szubjektív kfejezéssel arra utalunk, hogy ezek a krtérumok nem tartoznak a raconáls krtérumok közé, de nem jelent azt, hogy az lyen döntés krtérumok mndg helytelenek. A döntés krtérumok döntés osztályonként változnak. Döntés osztályokat a tényállapotokra (vagy következményekre) vonatkozó valószínőségek alapján állítunk fel. Három döntés osztályt szokás megkülönböztetn: a bzonytalan, a kockázatos és a bztos döntések osztályát. Bzonytalan döntések osztálya: A bzonytalan döntések osztályába soroljuk azokat a döntés problémákat, amelyekben nem smerjük a tényállapotok (lletve következmények) valószínőséget. A bzonytalan döntések osztályában nncs egységes döntés krtérum. A döntést hozó pszchológa beállítottságától függıen defnálhatunk döntés krtérumokat. A legsmertebbek a Wald-féle, a Savage-féle, a Hurvcz-féle és a Laplace-féle krtérumok. A Wald-krtérumot másképpen mnmax (lletve maxmn) krtérumnak s nevezk. A pesszmsta és óvatos döntést hozó krtéruma. A pesszmsta döntést hozó a legrosszabb következményt teknt, de mvel óvatos s, gyekszk magát a lehetı legrosszabbtól megvéden. Eljárásának lényege: mnden egyes cselekvés változat esetében a legrosszabb következményt tekntve ezek közül a legjobbat, azaz a relatíve legksebb rosszat választja. Esetünkben: A Savage krtérum az un. mnmáls regret krtéruma. (A regret angol szó, megbánást jelent.) Pszchológa alapja az elmulasztott lehetıségen érzett megbánás. (A lottózók, lletve totózók gyakran vannak lyen pszchológa állapotban.) A regret mértéke az adott körülmények között optmáls (tehát a legjobb) és a tényleges döntés között különbség a következmények értékében mérve. A regretmatrxra ezután a Wald krtérumot alkalmazzuk: a legnagyobb regretek közül választjuk a legksebbet (mnmáljuk a maxmumokat, nnét a mnmax elnevezése a Wald-krtérumnak). 9

93 Esetünkben: A Hurvcz-féle krtérum az un. optmzmus együtthatóval súlyozva számítja k a legmegfelelıbb cselekvés változatot. Az optmzmus együttható az elnevezéssel asszocálódó komolytalan felhanggal ellentétben, egzakt matematka gondolatmenet alapján határozható meg. Pszchológa alapja a két végletes álláspont a teljes pesszmzmus és a teljes optmzmus között arany középút keresése. A Laplace-krtérum alapja az elégtelen megokolás elvében gyökeredzk. Eszernt, ha nncs elégséges ndokunk a különbözı események bekövetkezés valószínőségének megállapítására, akkor a Laplace-féle álláspont szernt legcélszerőbb, ha mnden egyes eseményt azonos valószínőséggel tekntünk. Példánkban: Kockázatos döntések osztálya: A legtöbb valóságos döntés probléma a kockázatos döntések osztályába esk. A kockázatos döntések osztályába tartoznak mndazok a döntések, amelyek esetében a tényállapotok (vagy következmények) valószínősége smertek, azaz smeretes a valószínőségeloszlásuk. A kockázatos döntések osztályában alkalmazott döntés krtérum az un. Bayes-féle krtérum, másnéven az optmáls várható érték krtéruma. A várható érték a valószínőségszámítás gen pontosan kdolgozott fogalma. Bayes smerte fel elıször és fogalmazta meg egzakt módon,hogy abban az esetben, ha a döntés problémában az esélyeknek, azaz valószínőségeknek szerepe van, akkor a döntést hozók az optmáls várható érték alapján döntenek. Másszóval, azt a cselekvés változatot választják, amelyknek a várható klátása a legjobb. 93

94 Kockázatos döntés az elsıdleges nformácók alapján: Kockázatos döntés a pótlólagos nformácók alapján: 94

95 Kockázatos döntés az etka neutraltás elve alapján: A kockázatos döntések esetében gen fgyelemreméltóak az un. etka neutraltás elvébıl levezethetı következmények. (Az etka neutraltás gondolatának kdolgozása Ramsey nevéhez főzıdk.) Ha egy kockázatos döntés probléma esetében a döntést hozó közömbös (etkalag neutráls) a cselekvés változatok között, akkor a cselekvés változatok várható értéke számára azonosak. Ebbıl a magatartásból a megfelelı számítás eljárással kszámíthatók az eseményekhez rendelt latens valószínőségek. Ekkor a közömbösség azt jelent, hogy a döntést hozó számára a két cselekvés változat várható értéke azonos, tehát: M s M s Nézzük meg, hogy ebben az esetben mekkora valószínőségértéket rendelt az egyes tényállapotokhoz ntutíve és mplcten a döntést hozó. 95

96 Bztos döntések osztálya: A bztos döntések osztályába tartoznak mndazok a döntés problémák, amelyek esetében bztosan tudjuk, hogy egy cselekvés változat esetében melyk következmény lesz az eredmény. Ez kétféleképpen állhat elı: bztosan (tehát egyes valószínőséggel) tudjuk, hogy melyk tényállapot következk be, vagy pedg a cselekvés változathoz tartozó egyetlen eredmény (következmény) bekövetkezését tekntjük bztosnak. Gyakorlatlag a két eset azonos, mert ha csak egyetlen tényállapotot tekntünk bztosnak, akkor egy cselekvés változat és egy bztos tényállapot bztos körülményt határoz meg. A bztos döntések osztályában használt döntés krtérum maxmum vagy mnmum krtérum. Az lyen problémák megoldására dolgozták k a matematka programozás néven smert eljárásokat, amelyekkel véges számú lépésben közvetlenül megtalálható, (lletve kszámítható) a maxmáls (vagy mnmáls) eredményt nyújtó cselekvés változat. A matematka programozás eljárása közül a legsmertebb a lneárs programozás. Esetünkben: Az nformácó értéke: 96

97 6.6. A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI Mntavétel alapelvek Sokaság Következtetés F n (x), Me,, s*... F(x), M(ξ), D(ξ). Mntavétel Mnta 3. ábra: Mntavétel alapelvek Következtetés hbá Sokaság jó rossz A mnta mnısítése a sokaságról jó rossz Nncs hba ε Elsıfajú hba, α Másodfajú hba, β Nncs hba e 3. ábra: A következtetés hbá 97

98 Az elkövethetı hba kétféle lehet: elsıfajú hba és másodfajú hba. Az elsıfajú hbát csak gaz hpotézsek vzsgálata során követhetünk el. Akkor fordul elı, ha gaz hpotézst a mnta adata alapján nem fogadunk el. Az elsıfajú hba elkövetésének valószínőségét α-val jelöljük, s értéke egy adott próba során tetszıleges kcsnyre csökkenthetı. A másodfajú hbát csak hams hpotézsek vzsgálata során követhetünk el. Másodfajú hba akkor jelentkezk, ha a hams hpotézst a mnta adata alapján nem utasítjuk el. A másodfajú hba valószínőségét β-val jelöljük, s értéke egy adott próba során bármely konkrét a feltett hpotetkustól eltérı alapsokaság paraméterre vonatkozóan kszámítható. A másodfajú hba veszélye csökken a hpotetkus és a tényleges várható érték eltérésének növekedésével, vszont nı, ha adott próba esetén az elsıfajú hbát csökkentjük. Az elsı- és másodfajú hba egydejőleg csak a mntaelemek számának növelésével csökkenthetı. A próbák tervezésénél és az eredmények értelmezése során ezekre tekntettel kell lennünk. 98

99 Feladat: Egy szabályozott gyártás folyamatban a krtkus mnıség jellemzı µ 0 3, cm 3, σ 0 0,08 cm 3 normáls eloszlást követ. a.) Számolja k a µ 0 ± σ 0 beavatkozás határok esetén n elemő mntavétel mellett az elsıfajú hba valószínőségét! b.) Mekkora a másodfajú hba valószínősége, ha a várható érték µ 3,3 cm3 -re változott? c.) Mekkora az elsı és másodfajú hba valószínősége, µ 0 ± 3σ 0 beavatkozás határok valamnt n és n4 elemő mntavétel mellett? Elsı-, másodfajú hba számolása Elsı-, másodfajú hba számolása n α/ µ 0 3, α/ P(ξ 0,94 3, <ABH) Φ 0,08 Φ(-),8% α,8 4,56% ABH,94 cm 3 FBH3,6 cm 3 n α/ β µ 0 3, µ 3,3 ABH,94 cm 3 FBH3,6 cm 3 α/ 3,6 3,3,94 3,3 βp(abh<ξ <FBH) Φ Φ 0,08 0,08 ( 0,5 ) Φ ( 4,5 ) 0, 30,85% Φ 695 µ 0 ±σ 0 Készítette: Erde János Készítette: Erde János Elsı-, másodfajú hba számolása Elsı-, másodfajú hba számolása n α/ ABH,86 cm 3 µ 0 3, µ 3,3 α/ α,86 3, Φ 0,08 Φ(-3) 0,3% α 0,6% Készítette: Erde János µ 0 ±3σ 0 FBH3,34 cm 3 3,34 3,3,86 3,3 β Φ Φ 0,08 0,08 ( 0,5 ) Φ ( 5, ) 69,5% Φ 5 α/ α/ Készítette: Erde János n 4 3, 3,3,98 3,3 β Φ Φ 0,04 0,04 ( ) Φ ( ),8% Φ 8 σ x ABH,86 cm 3 ABH,98 cm 3 FBH3, cm 3 FBH3,34 cm 3 0,08 0,

100 Feladat: Egy statsztka folyamatszabályozás során a szmmetrkus beavatkozás határokat 0 %-os kockázat sznt mellett alakították k. A folyamat normáls eloszlást követ, szabályozott állapotban N(90; 5) paraméterekkel. a.) Mekkora a másodfajú hba n elemő mntavétel mellett, ha a folyamat elállítódk. Az elállítódott folyamat eloszlása N(94; 9). b.) Végezze el az elızı számítást n9 elemő mnta átlagára s. Feladat: σ Igazoljuk, hogy σ! x n 00

101 7. BECSLÉS Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 0

102 Az elızıekben láthattuk, hogy az elmélet eloszlásokkal történı számoláshoz elsısorban azok paraméterenek smerete szükséges. A gyakorlatban egy adott probléma elemzésénél többnyre tapasztalatból tudjuk az eloszlás jellegét, de nem smerjük az eloszlás alakját pontosan meghatározó paramétereket. Tudjuk például, hogy a labdarúgó mérkızéseken a gólok száma jó közelítéssel Posson-eloszlású. Ugyanlyen eloszlással írható le mondjuk a Tszán egy év alatt levonuló árhullámok száma, csak éppen más λ paraméterrel. Mnden majdnem mnden elmélet eloszlásnak van(nak) paramétere(), melyeket általában nem smerünk, azokat a ξ-re vonatkozó statsztka mntából kell közelítıleg meghatároznunk, becsülnünk, mert csak ezek smeretében tudunk a vzsgált jelenséggel kapcsolatos valószínőség kérdésekre válaszoln. A mntából számított mutatókat (átlag, szórás, stb.) a sokaság jellemzıkre való következtetésre, az smeretlen paraméterek becslésére (s) használjuk. Nem arról van tehát szó, hogy a mntából kszámoljuk az smeretlen paramétert. A mntából számolt mutatók értéke függnek a véletlentıl, mntáról mntára változnak, így maguk s valószínőség változónak teknthetık. A mntából számolt mutatók eloszlását mntavétel eloszlásnak nevezzük. Annak megítélése, hogy a mntából számolt mutató (amt mnta statsztkának vagy rövden statsztkának s neveznek) mkor teknthetı az smeretlen elmélet paraméter jó becslésének, többféle szempontból történhet. 7.. A BECSLÉS TULAJDONSÁGAI 8 Tudjuk, hogy a sokaság paraméteret általában több statsztkával s becsülhetjük. Így pl. a várható értéket normáls eloszlású alapsokaság esetében a mntaátlaggal és a medánnal s becsülhetjük, a szórást a mnta szórásával, de a terjedelem segítségével s becsülhetjük stb. Természetesen felmerül a kérdés, hogy ezek közül melyk becslést kell választanunk. Hogy lyen esetekben a legmegfelelıbb becslést választhassuk, krtérumokat kell felállítanunk arra vonatkozólag, hogy mkor fogadjunk el egy becslést jónak, lletve mkor tartsuk jobbnak az egyk becslést a másknál. A statsztka becslés Fsher-féle krtérumat az alábbakban foglaljuk össze. Torzítatlan becslés: A legfontosabb tulajdonság, amt egy jónak mnısített becsléstıl megkívánunk, hogy a becslés a szóban forgó paraméterérték körül ngadozzék. Pontosabban azt kívánjuk meg, hogy a becslés (az lletı statsztka) várható értéke éppen a megfelelı paraméterérték legyen. Ha egy becslésre ez a követelmény teljesül, akkor torzítatlan becslésrıl beszélünk. Így pl. torzítatlan a becslés, ha a mntaátlagok várható értéke megegyezk az alapsokaság várható értékével: M( x) M ( ξ ), vagy a korrgált tapasztalat szórásnégyzet várható értéke az elmélet * varancával egyenlı: M( s ) D ( ξ ). Ez azonban nem gaz a tapasztalat szórásnégyzetre. A tapasztalat szórásnégyzet várható értéke (az elmélet varancát az egyszerőség kedvéért σ -el jelölve): n M( s ) σ σ. Az emprkus (tapasztalat) szórásnégyzet tehát elmélet varanca n n torzított becslése. Látható, hogy a torzítás mértéke függ a mntaszámtól, s a mntaszám növekedésével csökken. Az lyen tulajdonságú becsléseket aszmptotkusan torzítatlan becslésnek nevezzük. A torzítatlanság nem azt jelent, hogy egy adott mntából kapott becslés egyenlı az smeretlen paraméterrel, sıt arra sem ad feleletet, hogy a mntából kapott becslés értéke közel, vagy távol esk-e a valód paramétertıl. A torzítatlanság esetében csupán abban lehetünk bztosak, hogy nncs semmféle szsztematkus, egyrányú eltérés a becslés és a becsült paraméter között. 8 A 7.. pontban található ábrák a STATISTICA for Wndows programmal készültek. 0

103 Feladat: Vzsgáljuk meg n3 elemő statsztka mnták alapján a kockadobás tapasztalat és korrgált tapasztalat szórását. Korábban már meghatároztuk a kockadobás elmélet szórását, s azt találtuk, hogy D(ξ),7). A kísérletet 50-szer megsmételve a számított tapasztalat ll. korrgált tapasztalat szórásokat a 33. ábra láthatjuk. 3.0 n3 elemû mnták szórása.5.0,73.5, T_SZ3 K_TSZ3 33. ábra: Tapasztalat szórások összehasonlítása Az ábrán folytonos vonal mutatja a tapasztalat, ll. szaggatott vonal a korrgált tapasztalat szórásokat a mntaszám függvényében. Vízszntes folytonos vonallal jelöltük a kétfajta szórás (50-50 elem) átlagát. A korrgált tapasztalat szórások átlaga,73, a tapasztalat szórásoké,4. Jól látható, hogy a korrgált tapasztalat szórások az elmélet (,7) szórás körül ngadoznak (átlaguk közel esk az elmélet értékhez), míg a tapasztalat szórások átlaga,4, jóval nagyobb az eltérés az elmélet értéktıl. Konzsztens becslés: Konzsztensnek (összetartónak) nevezzük a becslést akkor, ha ngadozása a becsült paraméter körül a mnta elemszámának növelésével egyre csökken. A korábbakban láttuk, hogy a számtan σ átlag torzítatlan becslése a várható értéknek, s szórása σ. Nylvánvaló, hogy n esetén x n σ 0, vagys a számtan átlag konzsztens becslése a várható értéknek. x Feladat: Az elızı példához hasonlóan kevésbé matematka módon, tapasztalat adatokból vzsgáljuk meg a kockadobás esetén a két emprkus szórás vselkedését a mntaszám növekedésének függvényében. A 34. ábra mutatja a kapott eredményeket. Az ábrán folytonos vízszntes vonal jelz az elmélet értéket [D(ξ),7]. Az ábrából egyértelmően látszk, hogy a mntaszám növekedésével mnd a korrgált tapasztalat, mnd a tapasztalat szórás az elmélet érték körül ngadozk (torzítatlan ll. aszmptotkusan torzítatlan becslés), s az ngadozás mértéke a mntaszám növekedésével egyre ksebb (konzsztens a becslés). 03

104 Kockadobás szórása T_SZ_ K_T_SZ 34. ábra: Kockadobás szórása a mntaszám függvényében (n00) Megfgyelhetjük, hogy kb elemő mnták esetén a különbség a két szórás között, már gyakorlatlag elhanyagolható. A 35. ábra csak az elsı 50 adatot ábrázolva, a két szórás között különbség jobban megfgyelhetı. Kockadobás szórása T_SZ_ K_T_SZ 35. ábra: Kockadobás szórása a mntaszám függvényében (n50) Hatásos becslés: Két becslés összehasonlításakor a hatásosság vagy más néven effcenca krtéruma alapján döntjük el, hogy a kettı közül melyk a jobb. A hatásosságot nagyon fontos becslés krtérumnak tekntjük. Két becslés közül a kevésbé ngadozót nevezzük hatásosabbnak. Az ngadozás mértéke a szórás, ezért a becslések ngadozását s a szórásukkal jellemezzük. Tehát két becslés közül a ksebb szórású becslést tekntjük hatásosabbnak, jobbnak. Gyakran elıfordul, hogy a torzítatlan becslések között van olyan, amelyknek a szórása az összes több becslés szórásánál ksebb (adott n mellett). Ekkor ezt a mnmáls szórású, torzítatlan becslést hatásosnak nevezzük, és a több becslés hatásfokát ehhez mérjük. 04

105 Feladat: Tapasztalat adatokból hasonlítsuk össze (n5 elemő mnták alapján) a kockadobás átlagát és medánját. A kísérletet 50-szer megsmételve, a mnták átlagat és medánjat a 36. ábra mutatja. 6.5 n5 elemû mnták átlaga és medánja ATL MED 36. ábra: A kockadobás átlaga és medánja Az ábrán szaggatott vonallal összekötve a négyzetek a medánokat, s folytonos vonallal összekötve körök jelölk az egyes mnták átlagat. Vízszntesen behúzott folytonos vonal a várható értéket mutatja (M(ξ)3,5). Megfgyelhetjük, hogy a medán s és az átlag s az elmélet érték körül ngadozk (torzítatlan becslések), ugyanakkor az átlagok eltérése, ngadozása ksebb, mnt a medánoké. Kszámolva a két adatsor korrgált tapasztalat szórásat, az eredmények az alábbak: s * átlag 0, 794 ; s * medán,30. Az átlag szórása valóban ksebb, mnt a medáné, az adatok alapján kb. 40%-kal. Az átlag tehát hatásosabb becslés, mnt a medán. Elégséges becslés: Egy becslés elégséges, ha az lényegében mnden nformácót tartalmaz a paraméterre vonatkozóan. Ez más szóval annyt jelent, nncs más olyan becslés, amelyk a paraméterrıl több nformácót szolgáltatna, mnt az elégségesnek mnısülı becslés. 05

106 7.. A PONTBECSLÉS MÓDSZEREI Az eddgek során s használtunk különféle becslıfüggvényeket pontbecslés céljára, de ezeket csak ösztönösen választottuk. Így természetesen adódott, hogy pl. a várható értéket a mntából számított átlaggal vagy más középértékkel becsüljük. Ez az ún. analóga elve, am azt jelent, hogy a mntából a becsülendı jellemzıvel megegyezı tartalmú mutatót számítunk k, és ennek segítségével becsüljük a megfelelı sokaság jellemzıt. Léteznek azonban olyan általános elvek, módszerek, amelyek segítségével olyan esetekben s tudunk jó tulajdonságú becslıfüggvényeket készíten, amkor a megérzés vagy az analóga már nem segít. A legegyszerőbb grafkus becslést kvéve nem célunk ezek részletes smertetése, csak rövden felsoroljuk, lletve smertetjük lényegüket. Maxmum-lkelhood módszer (a legnagyobb valószínőség elve): az eljárás lényege az ún. lkelhood függvény felállítása, amely nem más, mnt a mntaelemek együttes sőrőségfüggvénye, s az smeretlen paraméter becslésére azt a statsztkát használjuk, melyre ez a függvény maxmáls értéket vesz fel. Ez az egyk legjobb és leggyakrabban alkalmazott eljárás. Legksebb négyzetek módszere nem pusztán a statsztka becslésre szolgáló eljárás, hanem alkalmazható más becslés feladatok megoldására s. A módszer lényege, hogy egy elmélet modellnek (ez lehet egy eloszlás vagy sőrőségfüggvény, de lehet egy egyszerő konstans függvény s) a paraméteret határozza meg úgy, hogy a tényleges és a becsült paraméterekkel llesztett modellek négyzetes eltérése, azaz az eltérések négyzetösszege mnmáls legyen (pl.: regresszószámítás). Momentumok módszere abban áll, hogy ha k számú paramétert akarunk becsüln, akkor az eloszlás elsı k számú elmélet momentumát egyenlıvé tesszük a mntából számított tapasztalat momentumokkal. Így az smeretlen paraméterekre egyenletrendszert nyerünk, amely kedvezı esetben megoldható. Grafkus paraméterbecslés az elızı matematka eljárásokhoz képest, ez nkább a gyakorlat számára könnyebben kezelhetı eljárás. Bár pontossága természetesen a grafkus ábrázolás adta lehetıségektıl függ, de egyszerősége matt sokszor jól használható. Lényege, hogy valamlyen módon (többnyre logartmzálással) lnearzáljuk az eloszlásfüggvényt, s az adatokat grafkusan ábrázolva az egyenes meredekségébıl és/vagy tengelymetszetébıl következtetünk az eloszlás smeretlen paraméteré(e)re. Exponencáls eloszlás paraméterének grafkus becslése: Az exponencáls eloszlást vszonylag egyszerően kegyenesíthetjük. Az eloszlás eloszlásfüggvénye: λx F( x ) e. Mndkét oldalból -et kvonva, (-)-gyel megszorozva, majd az egyenletet logartmzálva és újra megszorozva ( )-gyel, az alább összefüggést kapjuk: ln[ F(x)]λx Ha x függvényében ábrázoljuk a baloldalon lévı kfejezést, egy egyenest kapunk, melynek tengelymetszete 0, s ránytangense (meredeksége) éppen az smeretlen λ paraméter (37. ábra). 06

107 -ln[-f(x)] α tgα λ x 37. ábra: Exponencáls eloszlás λ paraméterének grafkus becslése Normáls eloszlás paraméterenek grafkus becslése: Normáls eloszlás eloszlásfüggvényének kegyenesítése már nem végezhetı el egyszerő logartmzálással, mvel az eloszlásfüggvénynek elem függvényét nem smerjük. Specáls beosztású ordnátatengelyő koordnátarendszert alkalmazva azonban az eloszlásfüggvény képe lnearzálható. A függıleges tengelyen az eloszlásfüggvény értéket ábrázoljuk úgy, hogy az eloszlásfüggvény középértékébıl (0,5) kndulva az egységny távolság szórásny legyen. Az egyszerőség kedvéért ábrázoljuk most a standard normáls eloszlás eloszlásfüggvényét. Tudjuk, hogy a függvény ( 3), ( ), ( ), 0,,, 3 helyen felvett értéke a következık 0,0035; 0,08; 0,587; 0,5; 0,843; 0,977 és 0, Ábrázoljuk ezeket a pontokat úgy, hogy a Φ() egy távolságegységgel feljebb, a Φ( ) egy távolságegységgel lejjebb, a Φ() távolságegységgel feljebb, a Φ( ) távolságegységgel lejjebb stb. kerüljön, mnt a Φ(0)0,5. Az ordnáta tengely skálázása ezáltal egyenlıtlen lett, vszont így a Φ(u) függvény képe egyenes, ahol nylván a több érték s ezen az egyenesen fekvı pontot határoz meg (38. ábra) 0,998 0,97 0,84 0,5 0,08 0,5 0, ábra: Gauss-papíros ábrázolás 07

108 Ha az x tengelyt most átskálázzuk ( 3 helyébe -3σ, helyébe σ stb. kerül), akkor az elızı pontok egy 0 várható értékő, σ szórású normáls eloszlású változó eloszlásfüggvényének a pontja. Végül toljuk el az ordnátatengelyt eredet helyzetével párhuzamosan az x tengely mentén µ egységgel. Az így kapott koordnátarendszerben a µ várható értékő σ szórású normáls eloszlású változó F(x) eloszlásfüggvényének képe egyenes. Ha a mnta adata alapján kapott tapasztalat eloszlásfüggvényt az elıbb koordnátarendszerben (un. Gauss-papíron) ábrázoljuk, normáls eloszlás esetén a pontok közelítıleg egy egyenesre esnek. Behúzva az egyenest, a normáls eloszlás tulajdonságat smerve becsülhetjük az smeretlen paramétereket. Az egyenes és a függıleges tengely (ll. gyakrabban az y0,5 ordnáta érték) metszéspontjánál leolvasva az x tengely értékét kapjuk az eloszlás µ paraméterét. A 0,587 ll. a 0,843 y érték és az egyenes metszéspontjánál pedg a µ σ ll. a µ+σ értékeket olvashatjuk le az x tengelyen, ambıl a µ smeretében σ könnyen meghatározható INTERVALLUMBECSLÉS A becslésrıl szóló eddg fejtegetésenk során az eloszlás valamely smeretlen paraméterét egyetlen mennységgel, a mntaelemekbıl számított statsztka numerkus értékével, tehát egyetlen számadattal becsültük, azaz pontbecslést alkalmaztunk. Mvel a mntából számolt statsztka s valószínőség változó, aktuáls értéke általában eltér a becsült paramétertıl. Ha sokszor (sok n-es mntából) végezzük a becslést, akkor a mntastatsztka értéke torzítatlan becslés esetén az elmélet érték körül szóródnak. A szóródás mértéke természetesen függ a mnta nagyságától. Bár egyetlen mntából nem tudjuk megmondan a becsült paraméter pontos értékét, a mntastatsztka eloszlásának smeretében (ezeket neveztük mntavétel eloszlásoknak) sokszor meg tudunk adn egy olyan ntervallumot, amely az smeretlen paramétert nagy mondjuk 95%-os valószínőséggel tartalmazza. Az lyen ntervallumot az adott paraméterre vonatkozó 95%-os konfdenca-ntervallumnak (megbízhatóság ntervallumnak) nevezzük. A továbbakban a különbözı paraméterekre vonatkozó ntervallumbecsléssel foglalkozunk. Konfdenca-ntervallum a normáls eloszlás várható értékére smert alapsokaság szórás esetén: Tegyük fel, hogy a ξ valószínőség változó N(µ;σ) eloszlású, ahol σ szórás smert. A µ paramétert statsztka mntából a számtan átlaggal becsüljük. Tudjuk, hogy az átlag eloszlása (mntavétel σ eloszlás) szntén normáls eloszlású M ( x ) µ várható értékkel, és σ szórással. A normáls x n eloszlás smert tulajdonsága, az ún σ szabály alapján az átlag értéke 95,44% valószínőséggel a σ σ várható érték ± szórás tartományba, vagys a µ, µ + ntervallumba esk: n n σ σ P µ < x< µ + 0,9544. n n Ha smernénk tehát a µ várható értéket, és a számegyenesen megrajzolnánk a fent ntervallumot, akkor az n elemő mnták számtan közepét kszámolva 00 esetbıl kb. 95 mntaközép ebbe az ntervallumba esk. Sajnos azonban µ értékét nem smerjük (éppen ezt szeretnénk becsüln), a fent ntervallumot nem tudjuk megrajzoln. Rendezzük át az összefüggést a következı formára: σ σ P x < µ < x+ 0,9544. n n 08

109 Ezen összefüggés valószínőségelmélet értelme a következı. Az smeretlen µ paraméter nem valószínőség változó, hanem egy állandó, a számegyenes egy adott pontja. Valószínőség változó σ σ vszont az x,x+ ntervallum két végpontja. Azaz annak a valószínősége, hogy ez a n n véletlen helyzető ntervallum tartalmazza (lefed) a µ pontot, közelítıleg 95 %. (39. ábra) µ 39. ábra: Konfdenca-ntervallumok a µ várható értékre σ σ Az x,x+ ntervallumot a normáls eloszlás várható értékére vonatkozó 95%-os n n (pontosabban 95,44%-os) konfdenca-ntervallumnak nevezzük. Természetesen nemcsak 95%-os ntervallumot lehet szerkeszten. Ha a sokaság elmélet szórása smert (σ), akkor az átlag mntavétel eloszlása alapján tetszıleges kcsny α>0 számhoz meghatározható olyan u α/ mennység, hogy a ( x < µ < + ) α. σ σ P x uα / < µ < x+ uα / P x n n σ σ Normáls eloszlás esetén tehát az x uα /,x+ uα / ntervallum ( α) szntő konfdenca n n ntervallum a µ várható értékre. Adott eloszlás esetén mnél nagyobb a megbízhatóság sznt ( α), annál szélesebb ntervallumot kapunk. Nagy bztonsággal csak vszonylag hosszabb ntervallumról állíthatjuk, hogy valóban tartalmazza az smeretlen paramétert. Mnt látható az ntervallum hossza függ még a mnta nagyságától és az alapsokaság (σ) szórástól. 09

110 Az eddgekben csak kétoldal ntervallumról beszéltünk, mvel a gyakorlatban ez az elterjedtebb. Ha csak alsó vagy csak felsı határokat kívánunk becsüln, akkor a követendı eljárás az eddgekhez hasonló lesz. A részletek mellızésével belátható, hogy felsı korlát esetén σ P µ < x+ uα α kapható, ahol u α a standard normáls eloszlás táblázatból kereshetı k. n σ Azaz annak a valószínősége, hogy az smeretlen sokaság paraméter az x+ uα érték alá esk, n σ α. Hasonló módon az alsó korlátra a P µ > x uα α összefüggést kapunk. n Feladat: ROM chpek elıállításánál az égetıkemence maxmum hımérsékletét vzsgálták. Korább vzsgálatok alapján tudják, hogy a folyamatban a maxmum hımérsékletek elmélet szórása C. A vzsgálat céljára 8 elemő véletlen mntát vettek és az átlag hımérséklet 49 C-ra adódott. Adjunk 95%-os sznten ntervallumbecslést a kemence hımérsékletének várható értékére! n8 x 49 C σ C ε0,95 α0,05 kétoldal becslés: α/0,05 u α/,96 behelyettesítve a fent összefüggésbe: 49,96 < µ < 49+,96, ,68<µ < 500,3 A ROM chpek érzékenysége matt a chpeket nem szabad tartósan túl magas hıhatásnak ktenn, ezért a technológát úgy kell beállítan, hogy a hımérséklet hosszabb távon ne haladja meg az 500 C-ot. A mnta alapján 95%-os megbízhatósággal teljesít-e ezt a feltételt az égetıkemence? n8 x 49 C σ C ε0,95 α0,05 egyoldal becslés u α,645 σ µ < x+ uα 49+, C n 8 0

111 Feladat: Az Egs részvény n59 hav adatából az USD-ben megadott hozam átlaga: x 3,57%, szórása: σ6,7%. Adjunk 95%-os sznten ntervallumbecslést a hozam várható értékére! Konfdenca-ntervallum a normáls eloszlás várható értékére smeretlen alapsokaság szórás esetén: Ebben az esetben továbbra s feltételezzük, hogy a sokaság N(µ;σ) eloszlású, de sem µ-t sem σ-t nem smerjük. A problémát ezúttal az okozza, hogy bár az átlag továbbra s normáls eloszlású, de az elmélet szórás nem smert, így kénytelenek vagyunk a szórást a mntából becsüln (s*). Ennélfogva az x µ x µ helyett kénytelenek vagyunk a változót használn. Ez vszont már nem normáls * σ n s n eloszlású, hanem t-(student-) eloszlású valószínőség változó, DFn- szabadságfokkal. A Student-eloszlás a normáls eloszláshoz hasonlóan szmmetrkus eloszlás, az eloszlás egy paramétere, az ún. szabadságfok (DF) jellemz. A t-eloszlás smeretében nézzük tehát az ntervallumbecslés határanak meghatározását. Az elızı esethez képest csak anny a különbség, hogy normáls eloszlás helyett a t-eloszlást kell alkalmaznunk. * * s s P x tα < µ < + α / ( DF ) x t / ( DF ) α n n A t α/ (DF) értéket a DFn- szabadságfokú t-eloszlás táblázatából kereshetjük k. Az s* az eddgeknek megfelelıen a korrgált tapasztalat szórást jelöl.

112 Feladat: Tegyük fel, hogy az elızı ROM égetıkemencés példánál nem smerjük az elmélet szórást, de továbbra s tudjuk, hogy a maxmum hımérsékletek normáls eloszlással írhatók le. A nyolc elemő mnta korrgált tapasztalat szórása s*4,5 C, az átlag továbbra s 49 C. Adjunk becslést 95%-os megbízhatóság sznten a kemence hımérsékletének várható értékére! n8 x 49 C s*4,5 C DFn 8 7 ε0,95 α0,05 kétoldal becslés: α/0,05 t α/,365 4,5,5 49,365 < µ < 49+,365, ,4 < µ < 495,76 Feladat: Az Egs részvény várható értékére vonatkozó becslést végezzük el smeretlen alapsokaság szórás esetén s!

113 Számításankat a MINITAB szoftver eredményevel s összevethetjük (40. ábra). 40. ábra: Konfdenca-ntervallum az Egs hozam várható értékére Sokaság arány becslése: A vzsgált egyedek (pl. a férfak aránya a népességen belül, a selejtes termékek aránya stb.) sokaság arányát jelöljük nagy P-vel. Ennek torzítatlan (pont)becslése a pk/n relatív gyakorság, ahol n a mntaszám, k a mntában talált kedvezı esetek száma. Mvel n rögzített (nem valószínőség változó), k bnomáls eloszlást követ, így p s bnomáls eloszlású lesz, M(p)P várható értékkel és D (p)p( P)/n varancával. Mvel az elmélet varanca eleve smeretlen az s p p( p)/n értékkel becsüljük. A mntából számított p smeretében a bnomáls eloszlás táblázatából könnyen megkaphatjuk a keresett ntervallumot. Ezt az eljárást azonban a gyakorlatban rtkán alkalmazzuk, mert dszkrét jellege meglehetısen pontatlanná tesz. Bzonyos feltételek mellett a bnomáls eloszlás jól közelíthetı normáls eloszlással. Ha például p közel van 0,5-höz, akkor már n0 elemő mnta s elegendı a normáls közelítéshez. Ekkor a kétoldal konfdencantervallum: p( p ) p( p ) p uα / < P< p+ uα / α n n P 3

114 Feladat: A Felvllanyozzuk Kft. nap termelésébıl vett n00 elemő mntában a hbás égık száma 4 db. 95%- os megbízhatóság sznt mellett adjunk ntervallumbecslést a sokaság arányra! n00 p4/000, ε0,95 α0,05 kétoldal becslés: α/0,05 u α/,96 0,,96 Sokaság varanca becslése: 0, 0,88 < P< 0,+, ,075 < P < 0,65 0, 0,88 00 Ebben a részben a normáls eloszlású sokaság szórásnégyzetének ntervallumbecslését mutatjuk be. Ha a sokaság eloszlása nem normáls, akkor még nagy mnták esetén sem érvényes az tt következı ntervallumbecslés. A σ (pont)becslésére használt tapasztalat és korrgált tapasztalat szórásnégyzetek közelítıleg az ún. χ -eloszlással írhatók le. A χ -eloszlás jellemzıt, alakját egy paramétere a t-eloszláshoz hasonlóan a szabadságfok határozza meg. Különbözı χ -eloszlásokat mutat a 4. ábra. Sajnálatos módon az eddg megszokott, kényelmes mntavétel eloszlásoktól eltérıen, a χ -eloszlás csak poztív értékekre van értelmezve, nem szmmetrkus, de ettıl eltekntve ugyanúgy használhatjuk ntervallumbecslésre, mnt a standard normál ll. a t-eloszlásokat. A szabadságfok növekedésével az eloszlás közelít a normáls eloszláshoz, amt a késıbbekben a konfdenca ntervallumok meghatározásánál s khasználunk. f(x) 0.5 Ch-négyzet eloszlás sûrûségfüggvénye 0.4 DF DF 4 DF x 6 4. ábra: χ -eloszlás sőrőségfüggvénye 9 Mvel az eloszlás nem szmmetrkus, kétoldal becslés esetén az eloszlás alsó és felsı oldalán kjelölt α/ valószínőség nem egyforma hosszúságú ntervallumokat jelent, ennélfogva az elızıekben vzsgált esetekkel ellentétben a konfdenca-ntervallum nem lesz szmmetrkus a pontbecslésre. Normáls eloszlású valószínőség változó smeretlen varancájának megbízhatóság ntervallumát az alább összefüggéssel határozhatjuk meg: * * ( ) ( ) n s n s P < σ < α. χ α χ / α / 9 Készült a STATISTICA for Wndows program segítségével. 4

115 A χ és a α / χ értékeket a DFn- szabadságfokú χ táblázatból lehet meghatározn. Ha a α / konfdenca-határokat az eloszlás elmélet szórására szeretnénk vonatkoztatn, akkor mndkét határ poztív elıjelő négyzetgyökét kell képeznünk. Ha σ becslését a tapasztalat szórással végezzük, akkor a számlálóban (n ) helyett n-nel szorozzuk a szórást. Feladat: A Felvllanyozzuk Kft. karácsonyfa égınek élettartamát n6 elemő mntából vzsgálva azt találták, hogy az élettartamok korrgált tapasztalat szórása 0 óra. Határozzuk meg az égık varancájára ll. szórására vonatkozó 95%-os konfdenca-határokat! n6 s*0 óra DFn 6 5 ε0,95 α0,05 kétoldal becslés: α/0,05 -α/0,975 ( 6 ) 0 ( 6 ) 7,5 < σ < 54,5 < σ < 39,6 7,38 < σ < 5,5 0 6,6 Nagy szabadság fok (nagy mntaszám) esetén a χ -eloszlás közelíthetı normáls eloszlással. Ha a mntaszám n>30, akkor felhasználva azt az eredményt, hogy a ( DF ) χ mennység közelítıleg standard normáls eloszlású változó, adott α valószínőséghez tartozó χ α értéke kfejezhetı a standard normáls eloszlás u α értékébıl: χ ( u + DF ) α α. Feladat: Tegyük fel, hogy az elızı példában említett vzsgálatot n50 elemő mntából végezték. 95%-os megbízhatóság sznten mlyen ntervallumban található az elmélet szórás? n50 s*0 óra DFn ε0,95 α0,05 kétoldal becslés: α/0,05 -α/0,975 ( 50 ) 0 ( 50 ) 7,4 < σ < 0 3,4 68,6 < σ < 5, 8,8 < σ <,3 Mvel n elég nagy, ezért a χ értékeket normáls eloszlással közelítve azt kapjuk, hogy (, ) 70, 9 χ 0,975 ll. (, ) 3, 9 χ 0,05. Ezeket behelyettesítve a konfdenca-határok képletébe a szórásnégyzetre ll. szórásra az alább ntervallumok adódnak. 69, < σ < 53,6 és 8,3 < σ <,4. 5

116 8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 6

117 8.. A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE Statsztka hpotézsen a vzsgált sokaság(ok)ra (valószínőség-eloszlásra) vagy ennek paramétere()re vonatkozó valamlyen feltevést értünk. Ha ennek ellenırzésére (ll. bzonyítására) mntát használunk, akkor statsztka hpotézsvzsgálatról (statsztka próbáról) beszélünk. Ebben az esetben mvel a mnta csak része a sokaságnak, de nem azonos vele az elsı- és másodfajú hba elkövetésének lehetısége mndg fennáll. Attól függıen, hogy a feltételezésünk (hpotézsünk) mre vonatkozk, a statsztka próbák két csoportját különböztethetjük meg. Ha a vzsgált valószínőség változó eloszlása smert, de smeretlen paraméter(eke)t tartalmaz, akkor a hpotézsvzsgálat az smeretlen paraméter(ek)re rányul. (Például a Gauss eloszlás µ paraméterére, azaz az eloszlás várható értékére.) Ekkor paraméteres próbáról beszélünk. Ha az eloszlás típusa nem smert, akkor a feltevés magára az eloszlásra vonatkozk. (Például két vagy több valószínőség változó eloszlása megegyezk-e; vagy feltehetı-e, hogy a valószínőség változó adott eloszlással írható le.) A hpotézsvzsgálatoknak ezt a csoportját nemparaméteres próbáknak nevezzük. A hpotézsvzsgálatok általános menetét rövden az alábbakban vázolhatjuk:. Szakma megfontolások alapján felállítjuk az gazolandó hpotézst.. Kválasztjuk a legmegfelelıbb statsztka próbát. 3. Felállítjuk az un. nullhpotézst jelölése: H 0 (ez gyakran, fıleg a paraméteres próbáknál, a szakma feltételezés ellentéte) és az un. alternatív vagy ellenhpotézst jelölése: H. A hpotézseket úgy kell megfogalmazn, hogy egyszerre ne lehessenek gazak, így a nullhpotézsrıl hozott döntésünk közvetetten a H -re vonatkozó döntést s jelent. Mnd a null-, mnd az ellenhpotézs lehet egyszerő és összetett hpotézs. Egy hpotézst egyszerőnek mondunk, ha fennállásának feltételezése a sokaság eloszlását egyértelmően meghatározottá tesz. Egyszerő hpotézsre példa: M(ξ)µ500 C, mert normáls eloszlásról lévén szó, a szórást smerjük, így értéke az eloszlást egyértelmően meghatározza. A 450 C<M(ξ)µ<500 C állítás ellenben összetett hpotézs, mert a hpotézst mndazon σ szórású normáls eloszlások kelégítk, amelyek várható értéke 450 és 500 C között van; A továbbakban azt tételezzük fel, hogy a nullhpotézs egyszerő, az ellenhpotézs pedg mndg összetett. 4. Meghatározzuk az elsıfajú hbát (szgnfkanca szntet), a mntanagyságot, és végrehajtjuk a mntavételt. 5. Meghatározzuk az elızı pontban választott feltételek mellett elfogadás, ll. elutasítás (krtkus) tartományokat. Elfogadás tartománynak nevezzük azt a tartományt, amelybe a nullhpotézs fennállása esetén α szgnfkanca sznt mellett a statsztka jellemzı számított értéke legalább ε-α valószínőséggel kerül. Az elutasítás tartomány vszont az, amelybe a nullhpotézs fennállása esetén, α szgnfkanca sznt mellett a jellemzı számított értéke legfeljebb α valószínőséggel kerülhet. A krtkus tartomány lehet egyoldal vagy kétoldal (4. ábra). Kétoldal krtkus tartomány felvételére akkor kerül sor, ha a nullhpotézsben feltételezett helyzettıl való eltérés ténye érdekel bennünket, s az eltérés ránya nem. Egyoldalú tartományt pedg akkor alkalmazunk, ha a H 0 -ban rögzített állapottól való meghatározott rányú eltérésre számítunk. 7

118 elfogadás elutasítás 4. ábra: Krtkus tartományok egy- és kétoldal esetben 6. Meghatározzuk a próbához szükséges jellemzı számított értékét; A becsléselmélethez hasonlóan a mnta adataból egy meghatározott összefüggés (próbafüggvény) felhasználásával meghatározunk egy számértéket, amely H 0 és bzonyos kndulás feltételek fennállása esetén adott elmélet eloszlást követ, így értéke csak ks valószínőséggel (α) esk a krtkus tartományba. 7. Megvzsgáljuk, hogy a jellemzı számított értéke az elfogadás, lletve az elutasítás tartományba esk-e, és ez alapján döntünk a nullhpotézs elfogadásáról vagy elutasításáról (43. ábra). Statsztka próbák elve f(χ ) P(χ szám < χ χ krt (α) H krt 0 gaz) - α ε DF (szabadság fok) ε - α α χ szám χ krt χ szám χ Készítette: Erde János 43. ábra: Döntés a nullhptézsrıl 8. Értelmezzük az elızı pont eredményét a szakma hpotézsre, és megtesszük a konkrét ntézkedéseket a gyakorlatban. A hpotézsvzsgálat logkája szernt tehát azt vzsgáljuk meg egy adott próbával, hogy a mntából kapott eredmény eltérése a hpotézstıl a véletlennek tulajdonítható-e, vagy az eltérést a ténylegesen fennálló különbség okozza. Ha a mntából számított érték az elfogadás tartományba esk, akkor az adott szgnfkanca sznten, az adott mnta (mnták) alapján az eltérést a véletlennek tulajdonítjuk, azaz statsztkalag nem tartjuk szgnfkánsnak. Meg kell azonban jegyeznünk, hogy a statsztkalag szgnfkáns eltérés nem azonos a gyakorlatlag jelentıs eltéréssel. Lehet, hogy egy adott vzsgált eltérésre mndkettı fennáll, de lehet, hogy csak az egyk. Elıfordulhat például, hogy egy statsztkalag szgnfkáns eltérés gyakorlatlag nem mnısül jelentısnek, ll. fordítva. 8

119 8.. ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL Az olyan statsztka próbát, amelynek alapján arról döntünk, hogy valamely ξ valószínőség változó eloszlása lehet-e adott F(x) eloszlásfüggvénnyel jellemzett eloszlás, lleszkedésvzsgálatnak nevezzük. Ilyenkor a H 0 nullhpotézs: H F x) F ( ) 0 ( 0 x Ha a nullhpotézs az eloszlás paraméterenek smeretét s feltételez, akkor tszta lleszkedésvzsgálatról beszélünk. Ha vszont hpotézsünk csak az eloszlás jellegét (normaltás, exponencaltás stb.) tételez fel, és a paramétereket a mntából kell becsülnünk, akkor becsléses lleszkedésvzsgálatot végzünk. Az lleszkedésvzsgálatra szolgáló próbák alkotják a nemparaméteres próbák egyk nagy csoportját. E próbák közül legelterjedtebb a χ -próba és a Kolmogorov-próba. A χ -próba mnd dszkrét, mnd folytonos eloszlások esetében alkalmazható, de nagy mntaelemszámot gényel. A próba segítségével azt tudjuk eldönten, hogy adott szgnfkanca sznten a tapasztalat gyakorságok szgnfkánsan eltérnek-e a feltételezett elmélet gyakorságoktól, avagy az eltérés csupán a véletlen következménye. χ -próbával történı lleszkedésvzsgálatnál az un. próbastatsztkát (a számított értéket) az alább képlet szolgáltatja: r ( f F) χ sz F DF r l ahol: DF: a szabadságfok, az eloszlás paramétere f : a tapasztalat gyakorság F : az elmélet gyakorság l: a becsült paraméterek száma Feladat: A Tszán egy adott dıszakban levonuló árhullámok számát vzsgálva az elmúlt 68 év során az alább eredményeket kapták: 30 év volt amkor nem volt árhullám, 5 olyan év volt, amkor árhullám vonult le az adott dıszakban, 9 év volt amkor és 4 olyan év volt, amkor 3 vagy több árhullám következett be. Feltehetı-e, hogy a folyón levonuló árhullámok száma modellezhetı Possoneloszlással? λ? nem smerjük a mntából kell becsülnünk árhullámok száma 0 3 v. több gyakorság [db] Posson-eloszlás esetén M ( ξ ) λ x 55 Mvel az elmúlt 68 év során a kérdéses dıszakban összesen 55 árhullám volt: λ 0,

120 Nullhpotézs felállítása: H 0 : az árhullámok száma λ0,8 paraméterő Posson-eloszlású H : az árhullámok száma nem λ0,8 paraméterő Posson-eloszlású Mntavétel, adatok feldolgozása, krtkus érték meghatározása: Ha az árhullámok száma valóban λ 0,8 paraméterő Posson-eloszlással írható le, akkor annak valószínősége, hogy az adott dıszakban nem lesz árhullám (Posson-eloszlás táblázatából) 0,4493, árhullám levonulásának valószínősége: 0,3595, -nek: 0,438, és annak, hogy 3 vagy több árhullám vonul le ( az eddg valószínőségek összege): 0,0474. Az elmélet gyakorságok ebbıl már automatkusan adódnak, hszen ha 0,4493 valószínőséggel nncs árhullám az adott dıszakban, akkor ez elméletleg 68 év során összesen 68 0, ,55 alkalommal következk be. Hasonló módon a több elmélet gyakorságot kszámolva az eredményeket az alább táblázat tartalmazza: DF r l 4 α 5% táblázatból: χ 5, 99 K f k p k F k , ,55 5 0,3595 4,45 9 0,438 9,78 3 v. több 4 0,0474 3, Σ elm Számított érték meghatározása: χ sz ( 30 30,55) 30,55 0, ,45 0, 78 9, 78 0, , 0,7 A számított és a krtkus érték összehasonlítása: χ elm Döntés a nullhpotézsrıl: 5,99>> χszám 0,7 Mvel a számított érték jóval ksebb, mnt a krtkus érték vagys a számított érték az elfogadás tartományba esk, ezért 95%-os megbízhatóság sznten nncs okunk a H 0 -t elutasítan. A folyón levonuló árhullámok száma modellezhetı λ0,8 paraméterő Posson-eloszlással. 0

121 Feladat: A 3. fejezetben megsmerkedtünk a BUX 5 éves dıszak alatt hav hozamértékenek (%) tapasztalat eloszlásával. Leírható-e az eloszláskép N(3,9;,05) elmélet eloszlással? Ennek a vzsgálatnak a késıbbek során (lásd. Korrelácó- és regresszószámítás) meghatározó jelentısége lehet. A számításokat a Qualty and Mathematcs szoftver segítségével végeztük el, amelyet a ma Menedzsment és Vállalatgazdaságtan Tanszék elıdjén, az Ipar Menedzsment és Vállalkozásgazdaságtan Tanszéken fejlesztettek k. 44. ábra: A χ -próba számítása Ugyancsak bemutatjuk a Statstca for Wndows szoftver eredménylapját s, amely a Kolmogorov- Szmrnov próba eredményét s közl. Varable BUX% eloszlás: Normal (buxndex.sta) Kolmogorov-Smrnov d.09095, p n.s. Ch-Square:.68698, df, p.7688 (df módosított) observed freq-cy cumulatv observed percent observed cumul. % observed expected freq-cy cumulatv expected percent expected cumul. % expected observdexpected < Infnty Táblázat

122 Feladat: Egy krtkus termékjellemzı vzsgálatára vett n60 elemő mntában x 3,36cm 3, Származhat-e a mnta normáls eloszlásból? * s 0,083cm 3. Osztályok f k P ( x A ξ xf ) F k ( f F ) 3,00 3,0 0,003 0,9 3,34 3,0 3,0 4 0,063 3,68 0,03 3,0 3,30 5 3,30 3,40 7 0,4366 6,0 0,0 3,40 3,50 0 0,683 0,0 0,00 3,50 3,60 3 0,080,08 3,40 Σ 60, ,55 k F k k

123 9. HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 3

124 9.. AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA A normáls eloszlású sokaság varancájára (szórására) vonatkozó H 0 : σ σ 0 hpotézst a χ ( n ) s * sz σ 0 próbastatsztkával vzsgálhatjuk, ahol n a mntaszám, s* pedg a mntából számolt korrgált tapasztalat szórás. A próba alkalmazása során különösen fontos a sokaság normaltására vonatkozó feltétel betartása. Ekkor, H 0 fennállása esetén a fent próbafüggvény szabadságfokú χ -eloszlást követ. A nullhpotézst egy- és kétoldal módon s vzsgálhatjuk. Fgyelembe véve a χ -eloszlás már smert sajátosságat, a próba krtkus tartománya az alábbak: H H σ σ χ > χ : > 0 szám α : σ < σ 0 χ szám < χ α H σ σ χ < χ vagy : 0 szám α / χ szám > χ α / Feladat: A sör töltés folyamatában a töltés szntre vonatkozó szabványelıírások betartása matt a betöltött mennység mellett fontos paraméter a töltés sznt ngadozása s. Ezért a mnıségbztosítás osztály elıírása szernt a töltés sznt szórásának ml alatt kell lenne. Ennek ellenırzésére a töltıüzem mnıségellenıre n0 elemő mntát vett a folyamatból és kszámolta a mnta szórását: s*,5ml. Feltehetı-e 5%-os szgnfkanca sznten, hogy a töltés folyamat szórása nem ér el ml-t? n 0 s,5ml s 6,5ml H 0 : σ 4ml H : σ > 4ml (valójában a nullhpotézsünk σ 4 ml ) α 5%, DF n 0 9 elfogadás tartomány: χ α 6,9> χszám 6,9 9 6,5 a próbastatsztka értéke: χ sz 4, 06 4 χ sz az elfogadás tartományba esk, H 0 -t 5%-os szgnfkanca sznten elfogadjuk 4

125 9.. KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA Szórásokra vonatkozó próbákat szórásnégyzetek segítségével végezhetünk. A szórásnégyzetekre vonatkozó próbák a normáls alapeloszlástól való eltérésre sokkal érzékenyebbek, mnt az átlagpróbák. Általános esetben mvel a varancák azonossága a várható értékek összehasonlítására leggyakrabban alkalmazott kétmntás t-próba feltétele a szórásokra vonatkozó próbákat az átlagpróbák elıtt célszerő elvégezn. Két független, smeretlen várható értékő és szórású, normáls eloszlást követı valószínőség változó varancának azonosságára vonatkozó hpotézsünket az un. F próbával ellenırzhetjük. A két alaposzlásból vett n és n elemő mnták az alapeloszlás σ, lletve A fent feltételek mellett a σ varancának. : σ σ 0 próbastatsztkával vzsgálhatjuk, ahol s lletve * H nullhpotézst az s F s s > s. * * s * korrgált varancá torzítatlan becslése Ha H 0 és a kndulás feltételek teljesülnek, akkor az így képzett F érték az un. Fsher-Snedecor féle F- eloszlást követ, amely a számláló (DF ) és a nevezı (DF ) szabadságfokától (DF, n, ) függ. A számítást mndg úgy kell végeznünk, hogy a számlálóban a nagyobb varanca szerepeljen. Az * F-próbát ly módon mndg egyoldal próbaként végezzük, hszen azt vzsgáljuk, hogy s szgnfkánsan nagyobb-e s * értéknél, vagys ellenhpotézsünk H : σ > σ. (Megjegyezzük, hogy az F-próbát baloldal és kétoldal alternatíva esetén s elvégezhetjük, de ez most nem témája jegyzetünknek.) Táblázatank s egyoldal próbára vonatkoznak (mégpedg F α, DF, DF, krtkus értéket adják meg). Feladat: Vzsgáljuk meg, hogy az alább mnták esetén valóban feltételezhetı-e a szórások egyezése? H : σ σ 0 A B Mntaszám 0 Átlag 6,4 mg 5,6 mg Korrgált tapasztalat szórás, mg, mg H : σ > σ mvel az elsı ( A jelő) mnta szórása a nagyobb, ez kerül majd a számlálóba α 5% DF 0 DF 0 9 Fα 3,4 elfogadás tartomány: F < 3, 4 sz, próbastatsztka értéke: F sz, 9, F sz az elfogadás tartományba esk, H 0 -t 5 %-os szgnfkanca sznten elfogadjuk, azaz az alapsokaság szórások nem különböznek egymástól. 5

126 9.3. TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK Az F-próbát csak abban az esetben alkalmazzuk, ha két mnta szórását hasonlítjuk össze. Ha több normáls eloszlásból származó mntát kell összehasonlítanunk, akkor az un. Bartlettpróbát, vagy Cohran-próbát alkalmazzuk. Bartlett-próba: Legyen r darab mntánk és a megfelelı mntadarabszámok n, n,..., n r, a j-edk mnta k-adk eleme x jk, a j-edk mnta átlaga x j, korrgált tapasztalat szórásnégyzete s. Számítsuk k a következı mennységet: * j χ sz r,306 f log s A j ( n j )log s * j, ahol f r r n j r, s j f j ( n j ) s * j r A + 3( r ) n j j. f A fent képletbıl nyert χ értéket a χ -táblázatban az r szabadságfokhoz tartozó krtkus (a megállapodás szernt α sznthez tartozó) elmélet χ értékekkel kell összehasonlítan. Ha a táblázatban talált χ érték nem ksebb, mnt a képlettel számított, akkor megmaradhatunk a nullhpotézsünk mellett (amely természetesen a szórások egyezését állítja), ellenkezı esetben a próba szgnfkáns eltérésre mutat (azaz legalább egy szórás szgnfkánsan eltér a többtıl), s így a nullhpotézst elvetjük, vagys kjelentjük, hogy a mnták nem teknthetık egyforma szórású normáls eloszlású sokaságból származóknak. Feladat: Egy laboratórumban próbatesteken keménységvzsgálatokat végeznek. 5 szérát vzsgálnak, és ezek szórásnégyzetét kívánják összehasonlítan. A keménységet Rockwellben mérk. Az alább táblázat feltüntet az összehasonlítandó szórásnégyzeteket, a mntadarabszámokat (mndjárt eggyel csökkentve, mert a számításban így szerepelnek) és a számításhoz szükséges részeredményeket. j * s j * log s j n j - * (n j -)s j * (n j -) log s j /(n j -) 4, ,00 50,5764 0,09,59 0, ,87 38,4369 0,008 3,89 0, ,7 7,975 0, ,86 0, ,48 3,8 0,0556 5, ,5 3,035 0, , 3,94 0,706 nnen: f49 r5 s 3,8 szabadságfok4 A,04 χ 0,34 A számított χ érték a 95%-os szntnél található 9,49-nél nagyobb, tehát ekkora χ elıfordulásának kevesebb a valószínősége, mnt 5% azonos szórású alapsokaságok esetén. Ezért az összehasonlítás eredményeképpen megállapíthatjuk, hogy a szórások között eltérések szgnfkánsak. 6

127 Cochran-próba: E módszer segítségével azt dönthetjük el, hogy a szórások között talált legnagyobb érték teknthetı-e a többvel azonos eloszlásból származónak. A Cochran-próbát akkor alkalmazhatjuk, ha az alapeloszlás normáls és a mnták mnd azonos darabszámúak. A közös mntadarabszámot most n-el jelöljük (a szabadságfok DFn-), az r darab különbözı mnta korrgált szórásnégyzetét pedg smét s *, s *, s r * -tel, utóbbak közül a legnagyobb legyen s max *. Kszámítjuk a g sz * smax * + próbastatsztkát. * * s + s... + sr A kértékeléshez szükséges dagram, vagy táblázat segítségével a már smert módon eldönthetjük, hogy a legnagyobb szórás jelentıs mértékben különbözk-e a többtıl. Ha a legnagyobb érték túllép a számára megengedett határt, akkor nem teknthetjük az összes alapsokaságot egyenlı szórásúnak. Ilyenkor vagy teljesen elejtjük a homogentásra vonatkozó feltevésünket, vagy pedg csak ezt a kugró szórással rendelkezı mntát (vagy, ha több mnta szórása lépte át a szgnfkanca-határt, mndegyk lyent) kzárjuk a sokaságból és megvzsgáljuk, hogy a megmaradó sokaságra eredet feltevésünk fenntartható-e. Ezt tehát semm esetre sem teknthetjük természetesnek, hanem a megmaradó sokaságra meg kell smételnünk a Cochran-próbát, azaz g értékét a megmaradó adatokból újra k kell számítan és r új értékének fgyelembevételével összevetn az ábrával. A megmaradó sokaságot a szórás szempontjából homogénnek csak akkor teknthetjük, ha az utoljára végzett Cohran-próba nem szgnfkáns eredményt mutat. Feladat: Mőselyem szakítóerı vzsgálatánál (n0) kapott r0 vzsgálat adataból számolt korrgált tapasztalat szórások között, található-e kugró érték? Az adatokat az alább táblázat mutaja: * s 4,9 8,4, 8,0 8,4 6,0 6,3 6,7 6,8, * s,5,4 4,8,,6 6, 0,9 9,6 60,5 0,9 H 0 : a szórások nem különböznek H : a legnagyobb szórás (9. mnta) különbözk a többtıl α 5 % DF n 0 9 r 0 g 0,35 kr s * max g sz 60,5 60,5 4,93+ 8, ,9 60,5 330,7 0,83 A számított g érték nagyobb, mnt a krtkus érték, így 5%-os szgnfkanca sznten elutasítjuk H 0 -t, azaz a szórások egyezését. 7

128 8

129 0. HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK Valószínőségszámítás Valószínőségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 9

130 0.. VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK A feltételek függvényében több próbát s alkalmazhatunk. Nullhpotézsünk természetesen mnden esetben: H : µ m, vagys a várható érték egy adott m értékkel egyenlı. Abban az esetben, ha smerjük az alapsokaság szórást (σ), vagy ha nem smerjük, de nagy mntával dolgozunk (n>30 és a σ-t a korrgált tapasztalat szórással becsüljük), egymntás u-próbával, ha nem smerjük az alapsokaság szórást, és ks mntánk van, akkor egymntás t-próbával vzsgálhatjuk a fent nullhpotézst. Szakma feltevésünktıl függıen, mndkét próba esetén alkalmazhatunk egy- vagy kétoldal ellenhpotézst. A két statsztka próbával kapcsolatos alapsmereteket az alább táblázat foglalja össze. u-próba t-próba egyoldal kétoldal egyoldal kétoldal H 0 µ m 0 H µ > m 0 (µ < m 0 ) µ m 0 x µ x µ próba- usz * σ n s n statsztka elutasítás u sz > u α u sz < -u α/ vagy tartomány (u sz < -u α ) u sz > u α/ feltételek σ smert v. n > Táblázat Feladat: µ > m 0 (µ < m 0 ) µ m 0 t sz t sz > t α (t sz < -t α ) x µ (DF n-) * s n t sz < -t α/ vagy t sz > t α/ A már bemutatott példában a ROM chpek gyártása során a kemence hımérsékletére vonatkozó n8 elemő mnta alapján, átlag hımérséklet 49 C-ra adódott. Korább vzsgálatok alapján tudjuk, hogy a folyamatban a maxmum hımérsékletek elmélet szórása C. Feltehetı-e, hogy a maxmum hımérséklet 500 C? n 8 x 49 C o σ C H 0 o : µ 500 C o H : µ 500 C smert az elmélet szórás u-próbát használhatunk α % u,96 5 α / elfogadás tartomány:,96< u <, 96 sz a próbastatsztka értéke: u sz, 89 8 u sz az elfogadás tartományba esk, H 0 -t 5%-os szgnfkanca sznten elfogadjuk. 30

131 Szakma tapasztalatunk alapján úgy gondoljuk, hogy a kemence maxmum hımérséklete ksebb, mnt 500 C. Vzsgáljuk meg ezt a feltevésünket, az elızı mnta adata alapján. H 0 o : µ 500 C o H : µ < 500 C A próbastatsztka értéke természetesen nem változott: u, 89 α 0,05 u,645 α elfogadás tartomány:, 645< u sz A próbastatsztka értéke a krtkus tartományba esk, ezért 5%-os szgnfkanca sznten H 0 -t elutasítjuk. Feladat: A Szovjetunó hagyományos fegyverzet terén szerzett elınyének csökkentésére az USA Védelm Mnsztéruma kválasztott egy a Chrysler Corporaton-nél tervezett új harckocs típust. Kterjedt vzsgálatok azt mutatták, hogy az új harckocs átlagosan 45 mérföld/órás sebességet képes elérn. A szovjetek leggyorsabb tankjával (T-7) való összehasonlítás érdekében a Védelm Mnsztérum adatokat szerzett n6 T-7-es tank maxmum sebességérıl, s az alább statsztka eredményeket kapták: az átlag sebesség 43,5 mérföld/óra, s*3,0 mérföld/óra szórással. Feltehetı-e α5%-os szgnfkanca sznten, hogy a T-7-esek maxmáls sebessége ksebb az új amerka harckocsk sebességénél, azaz 45 mérföld/óránál? n 6 x 43,5m / h s H 3,0m / h 0 : µ 45m / h H : µ < 45m / h Nem smert az elmélet szórás, n<30 (feltételezve természetesen, hogy a maxmáls sebesség normáls eloszlású) t-próbát használhatunk: α α 0,05, DF n 6 5 t,753 elfogadás tartomány:, 753< t 43,5 45 a próbastatsztka értéke: t sz, 00 3,0 6 sz Mvel t sz az elutasítás tartományba esk, H 0 -t 5%-os szgnfkanca sznten nem fogadjuk el. sz 3

132 0.. KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA A mnta függetlensége azt jelent, hogy az egyk sokaságban egy elem mntába kerülése ll. be nem kerülése semmlyen módon nem befolyásolja a másk sokaságban az elemek mntába kerülésének valószínőségét. Az egymntás esethez hasonlóan ebben az esetben s több próba közül választhatunk. Nullhpotézsünk természetesen mnden esetben: H : µ µ 0, vagys a két várható érték egyenlı. Abban az esetben, ha smerjük az alapsokaság szórásokat (σ és σ ), vagy ha nem smerjük, de nagy mntával dolgozunk (n >30 és n >30, s az elmélet szórásokat a korrgált tapasztalat szórással becsüljük), kétmntás u-próbával, ha nem smerjük az alapsokaság szórást, de feltehetı a szórások egyezése, akkor kétmntás t-próbával vzsgálhatjuk a fent nullhpotézst. Ha mndkét sokaság normáls eloszlású, az elmélet szórásokat nem smerjük, de a szórások különböznek egymástól, akkor a kétmntás t-próba nem alkalmazható, helyette a Welch-próbát használhatjuk. Szakma feltevésünktıl függıen, mndhárom próba esetén alkalmazhatunk egy- vagy kétoldal ellenhpotézst. Az elsı két statsztka próbával kapcsolatos alapsmereteket az alább táblázat foglalja össze. H 0 H próbastatsztka elutasítás tartomány u-próba t-próba egyoldal kétoldal egyoldal kétoldal µ µ > µ ( µ < µ ) u sz u sz > u α σ ( u < u ) α sz x n x µ µ σ + u u sz vagy sz n < u > u α / α / µ µ > µ ( µ < µ ) t sz x x t sz * * s + s n > t α ( t < t ) α feltételek σ és σ smert v. n és n > 30 σ σ sz t t µ µ sz n vagy sz < t > t α / α / Feladat: 7. Táblázat DF n n + A Fogyasztóvédelm Felügyelıség két fajta cgaretta ( A és B ) szén-monoxd (CO) emsszóját hasonlította össze. A mnták statsztka adatat az alább táblázat tartalmazza. Hasonlítsuk össze, hogy a két fajta cgaretta CO kbocsátása eltér-e egymástól? H : µ µ 0 A B Mntaszám 0 Átlag 6,4 mg 5,6 mg Korrgált tapasztalat szórás, mg, mg H : µ µ 3

133 Mvel az elmélet szórásokat nem smerjük kétmntás t-próbát használhatunk. A próba elvégzése elıtt meg kell gyızıdnünk arról, hogy a két sokaságban a szórások megegyeznek. Ezt F-próbával (lásd. 9. pont) már ellenırztük. α 0,0, DF tα /,539 elfogadás tartomány:,539< t <, 539 a próbastatsztka értéke: t, 59 sz sz Mvel t sz az elfogadás tartományba esk, H 0 -t %-os szgnfkanca sznten elfogadjuk. Feladat: Két gyártó egy-egy kávéfajtájának kskereskedelm egységárát (lb-ra vonatkoztatva) szeretnénk összehasonlítan. Véletlenszerő mntát véve országszerte ezen kávéfajtákat áruló boltok közül, s feldolgozva az adatokat a kapott statsztka jellemzıket a következı táblázat mutatja: A B Mntaszám Átlag $,98 $,93 Korrgált tapasztalat szórás $0, $0,07 %-os szgnfkanca sznten feltehetı-e, hogy az A típusú kávé drágább, mnt a B? H : µ µ 0 H : µ > µ Az elmélet szórásokat nem smerjük, de a mntaszám elég nagy mndkét mntában kétmntás u-próbát használhatunk α 0,0 u,33 α elfogadás tartomány:,33> usz,98,93 a próbastatsztka értéke: u 3, 0 sz 0, + 0, Mvel u sz az elutasítás tartományba esk, H 0 -t %-os szgnfkanca sznten nem fogadjuk el. 33

134 Feladat: A BUX százalékos hozama 65 hónap adata alapján x 3,8%, jellemezhetı (lásd. 3. fejezet). Az utolsó hónapban x 0,39%, különbözk-e a két várható érték egymástól? * s,05% paraméterekkel * s 5,7%. Szgnfkánsan F-próba: 45. ábra: A BUX 65 hav hozamadatának ábrázolása t-próba: 34

A sokaság/minta eloszlásának jellemzése

A sokaság/minta eloszlásának jellemzése 3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,

Részletesebben

ÁLTALÁNOS STATISZTIKA

ÁLTALÁNOS STATISZTIKA Berzseny Dánel Főskola ÁLTALÁNOS STATISZTIKA műszak menedzser alapszak Írta: Dr. Köves János Tóth Zsuzsanna Eszter Budapest 006 Tartalomjegyzék. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK... 4.. A VALÓSZÍNŰSÉGSZÁMÍTÁS

Részletesebben

4 2 lapultsági együttható =

4 2 lapultsági együttható = Leíró statsztka Egy kísérlet végeztével általában tetemes mennységű adat szokott összegyűln. Állandó probléma, hogy mt s kezdjünk - lletve mt tudunk kezden az adatokkal. A statsztka ebben segít mnket.

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Élettan Anatóma Kéma Lehet kérdés?? Statsztka! Az orvos döntéseket hoz! Mkor jó egy döntés? Mennyre helyes egy döntés? Mekkora a tévedés lehetősége? Példa: test

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Adatsorok jellegadó értékei

Adatsorok jellegadó értékei Adatsorok jellegadó értéke Varga Ágnes egyetem tanársegéd varga.ag14@gmal.com Terület és térnformatka kvanttatív elemzés módszerek BCE Geo Intézet Terület elemzés forgatókönyve vacsora hasonlat Terület

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer? 01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó

Részletesebben

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 3. előadás Előadó: Dr. Ertsey Imre Vszonyszámok Statsztka munka: adatgyűjtés, rendszerezés, összegzés, értékelés. Vszonyszámok: Két statsztka adat arányát kfejező számok, Az un. leszármaztatott

Részletesebben

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás. Statsztka próbák Paraméteres. A populácó paraméteret becsüljük, ezekkel számolunk.. Az alapsokaság eloszlására van kkötés. Nem paraméteres Nncs lyen becslés Nncs kkötés Ugyanazon problémára sokszor megvan

Részletesebben

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani

Részletesebben

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i . konzult. LEV. 013. ápr. 5. MENNYISÉGI ISMÉRV szernt ELEMZÉS Tk. 3-8., 88-90. oldal, kmarad: 70., 74. oldal A mennység smérv (X) lehet: dszkrét és folytonos. A rangsor a mennység smérv értékenek monoton

Részletesebben

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele Teljes eseményrendszer Valószínőségszámítás 3. elıadás 2009.09.22. Defnícó. Események A 1, A 2,..., sorozata teljes eseményrendszer, ha egymást páronként kzárják és egyesítésük Ω. Tulajdonság: P A ) +

Részletesebben

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap Közlekedésmérnök Kar Jármőtervezés és vzsgálat alapja I. Feladatlap NÉV:..tk.:. Feladat sorsz.:.. Feladat: Egy jármő futómő alkatrész terhelésvzsgálatakor felvett, az alkatrészre ható terhelı erı csúcsértékek

Részletesebben

ADATREDUKCIÓ I. Középértékek

ADATREDUKCIÓ I. Középértékek ADATREDUKCIÓ I. Középértékek Adatredukcó 1. M a középérték: azonos fajta számszerű adatok közös jellemzője. 2. Követelmények: a) Számított középérték: közbenső helyet foglaljanak el, azaz mn középérték

Részletesebben

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége,

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI, Bevezetés a bometrába Dr. Dnya Elek egyetem tanár PhD kurzus. KOKI, 205.0.08. ADATREDUKCIÓ I. Középértékek Adatredukcó. M a középérték: azonos fajta számszerű adatok közös jellemzője. 2. Követelmények:

Részletesebben

Biometria gyakorló feladatok BsC hallgatók számára

Biometria gyakorló feladatok BsC hallgatók számára Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90

Részletesebben

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! SPEC 2009-2010. II. félév Statsztka II HÁZI dolgozat Név:... Neptun kód: 20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! 1. példa Egy üzemben tejport csomagolnak zacskókba,

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak. 8. GYAKORLAT STATISZTIKAI PRÓBÁK ISMÉTLÉS: Tanult nem paraméteres próbák, és hogy mlyen probléma megoldására szolgálnak. Név Illeszkedésvzsgálat Χ próbával Illeszkedésvzsgálat grafkus úton Gauss papírral

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

II. Rákóczi Ferenc Kárpátaljai Magyar Fıiskola. Pataki Gábor. STATISZTIKA I. Jegyzet

II. Rákóczi Ferenc Kárpátaljai Magyar Fıiskola. Pataki Gábor. STATISZTIKA I. Jegyzet II. Rákócz Ferenc Kárátalja Magyar Fıskola Patak Gábor STATISZTIKA I. Jegyzet 23 Tartalomjegyzék evezetés... 3 I. Statsztka alafogalmak... 4. Statsztka kalakulása, tudománytörténet összefüggése... 4.2

Részletesebben

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János

Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János BUDAPESTI MŐSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM KÖZLEKEDÉSMÉRNÖKI KAR JÁRMŐELEMEK ÉS HAJTÁSOK TANSZÉK Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János Budapest 2008

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

ADATREDUKCIÓ I. Középértékek

ADATREDUKCIÓ I. Középértékek ADATREDUKCIÓ I. Középértékek Adatredukcó 1. M a középérték: azonos fajta számszerű adatok közös jellemzője. 2. Követelmények: a) Számított középérték: közbenső helyet foglaljanak el, azaz mn középérték

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Lineáris regresszió. Statisztika I., 4. alkalom

Lineáris regresszió. Statisztika I., 4. alkalom Lneárs regresszó Statsztka I., 4. alkalom Lneárs regresszó Ha két folytonos változó lneárs kapcsolatban van egymással, akkor az egyk segítségével elıre jelezhetjük a másk értékét. Szükségünk van a függı

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

d(f(x), f(y)) q d(x, y), ahol 0 q < 1. Fxponttétel Már a hétköznap életben s gyakran tapasztaltuk, hogy két pont között a távolságot nem feltétlenül a " kettő között egyenes szakasz hossza" adja Pl két település között a távolságot közlekedés

Részletesebben

ADATREDUKCIÓ I. Középértékek

ADATREDUKCIÓ I. Középértékek ADATREDUKCIÓ I. Középértékek Adatredukcó 1. M a középérték: azonos fajta számszerű adatok közös jellemzője. 2. Követelmények: a) Számított középérték: közbenső helyet foglaljanak el, azaz x mn középérték

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist. 1. Az X valószínőség változó 1 várható értékő és 9 szórásnégyzető. Y tıle független várható értékkel és 1 szórásnégyzettel. a) Menny X + Y várható értéke? 13 1 b) Menny X -Y szórásnégyzete? 13 1 összesen

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

III. Képességvizsgálatok

III. Képességvizsgálatok Képességvizsgálatok 7 A folyamatképesség vizsgálata A 3 fejezetben láttuk, hogy ahhoz, hogy egy folyamat jellemzıjét a múltbeli viselkedése alapján egy jövıbeni idıpontra kiszámíthassuk (pontosabban, hogy

Részletesebben

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus) Valószínűségszámítás Valószínűség (probablty) 0 és 1 között valós szám, amely egy esemény bekövetkezésének esélyét fejez k: 0 - (sznte) lehetetlen, 0.5 - azonos eséllyel gen vagy nem, 1 - (sznte) bztos

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 4. előadás Előadó: Dr. Ertsey Imre KÖZÉPÉRTÉKEK A statsztka sor általáos jellemzésére szolgálak, a statsztka sokaságot egy számmal jellemzk. Számított középértékek: matematka számítás eredméyekét

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık

Részletesebben

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás. Centrális mutatók STATISZTIKA I. 4. Előadás Centrális mutatók 1/51 2/51 Középértékek Helyzeti középértékek A meghatározása gyakoriság vagy sorszám alapján Számítás nélkül Az elemek nagyság szerint rendezett

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Közúti közlekedésüzemvitel-ellátó. Tájékoztató

Közúti közlekedésüzemvitel-ellátó. Tájékoztató 12/2013. (III. 29.) NFM rendelet szakma és vzsgakövetelménye alapján. Szakképesítés, azonosító száma és megnevezése 54 841 02 Közút közlekedésüzemvtel-ellátó Tájékoztató A vzsgázó az első lapra írja fel

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Az entrópia statisztikus értelmezése

Az entrópia statisztikus értelmezése Az entrópa statsztkus értelmezése A tapasztalat azt mutatja hogy annak ellenére hogy egy gáz molekulá egyed mozgást végeznek vselkedésükben mégs szabályszerűségek vannak. Statsztka jellegű vselkedés szabályok

Részletesebben

Regresszió. Fő cél: jóslás Történhet:

Regresszió. Fő cél: jóslás Történhet: Fő cél: jóslás Történhet: Regresszó 1 változó több változó segítségével Lépések: Létezk-e valamlyen kapcsolat a 2 változó között? Kapcsolat természetének leírása (mat. egy.) A regresszós egyenlet alapján

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Korrelációs kapcsolatok elemzése

Korrelációs kapcsolatok elemzése Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

4. A méréses ellenırzı kártyák szerkesztése

4. A méréses ellenırzı kártyák szerkesztése 4. A méréses ellenırzı kártyák szerkesztése A kártyákat háromféle módon alkalmazhatjuk. Az elızetes adatfelvétel során a fı feladat az eloszlás paramétereinek (µ és σ ) becslése a további ellenırzésekhez.

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Bevezető Mi a statisztika? Mérés Csoportosítás

Bevezető Mi a statisztika? Mérés Csoportosítás Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő Figyelem! A példasor nem tartalmazza valamennyi típuspéldát. A dolgozatban az órán leadott feladatok közül bármely típusú előfordulhat. A példasor már a második dolgozat anyagát gyakorló feladatokat is

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk? Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula KOMBINATORIKA ELŐADÁS osztatlan matematka tanár hallgatók számára Szta formula Előadó: Hajnal Péter 2015. 1. Bevezető példák 1. Feladat. Hány olyan sorbaállítása van a a, b, c, d, e} halmaznak, amelyben

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege A multkrtérumos elemzés célja, alkalmazás területe, adat-transzformácós eljárások, az osztályozás eljárások lényege Cél: tervváltozatok, objektumok értékelése (helyzetértékelés), döntéshozatal segítése

Részletesebben

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László Gyakorló feladatok Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László I/. A vizsgaidőszak második napján a hallgatók %-ának az E épületben, %-ának a D épületben,

Részletesebben

Statisztika Elıadások letölthetık a címrıl

Statisztika Elıadások letölthetık a címrıl Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel

Részletesebben

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

VARIANCIAANALÍZIS (szóráselemzés, ANOVA) VARIANCIAANAÍZIS (szóráselemzés, ANOVA) Varancaanalízs. Varancaanalízs (szóráselemzés, ANOVA) Adott: egy vagy több tetszőleges skálájú független változó és egy legalább ntervallum skálájú függő változó.

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán):

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán): F NIK INÁRIS RLÁIÓK INÁRIS RLÁIÓK (és hasonló mátrxok s tt!) Defnícó: z R bnárs relácó, ha R {( a, b) a, b } nárs relácók lehetséges tuladonsága:. Reflexív ha ( x,.(a). Szmmetrkus ha ( x, y) ( y,.(b).

Részletesebben

Minősítéses mérőrendszerek képességvizsgálata

Minősítéses mérőrendszerek képességvizsgálata Mnősítéses mérőrendszerek képességvzsgálata Vágó Emese, Dr. Kemény Sándor Budapest Műszak és Gazdaságtudomány Egyetem Kéma és Környezet Folyamatmérnök Tanszék Az előadás vázlata 1. Mnősítéses mérőrendszerek

Részletesebben

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc Komplex regonáls elemzés és fejlesztés 2016-2017. tanév DE Népegészségügy Iskola Egészségpoltka tervezés és fnanszírozás MSc 2. előadás Terület elemzés módszerek az egészségföldrajzban Terület ellátás

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

10. Mintavételi tervek minısítéses ellenırzéshez

10. Mintavételi tervek minısítéses ellenırzéshez 10. Mintavételi tervek minısítéses ellenırzéshez Az átvételi ellenırzés akkor minısítéses, ha a mintában a selejtes elemek számát ill. a hibák számát vizsgáljuk, és ebbıl vonunk le következtetést a tételbeli

Részletesebben

Az elektromos kölcsönhatás

Az elektromos kölcsönhatás TÓTH.: lektrosztatka/ (kbővített óravázlat) z elektromos kölcsönhatás Rég tapasztalat, hogy megdörzsölt testek különös erőket tudnak kfejten. Így pl. megdörzsölt műanyagok (fésű), megdörzsölt üveg- vagy

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Gazdasági matematika II. vizsgadolgozat megoldása A csoport Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB B Elem

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben