ÁLTALÁNOS STATISZTIKA



Hasonló dokumentumok
A sokaság/minta eloszlásának jellemzése

Általános Statisztika

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

4 2 lapultsági együttható =

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Regresszió. Fő cél: jóslás Történhet:

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika. Eloszlásjellemzők

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Korrelációs kapcsolatok elemzése

Biomatematika 2 Orvosi biometria

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Adatsorok jellegadó értékei

A valószínűségszámítás elemei

Lineáris regresszió. Statisztika I., 4. alkalom

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

[Biomatematika 2] Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Az entrópia statisztikus értelmezése

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

A leíró statisztikák

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Valószínűségszámítás összefoglaló

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Biomatematika 2 Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

ADATREDUKCIÓ I. Középértékek

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Kutatásmódszertan és prezentációkészítés

Készítette: Fegyverneki Sándor

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Az elektromos kölcsönhatás

[Biomatematika 2] Orvosi biometria

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai geodéziai számítások 6.

[Biomatematika 2] Orvosi biometria

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai geodéziai számítások 6.

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

A Statisztika alapjai

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

METROLÓGIA ÉS HIBASZÁMíTÁS

Bevezető Mi a statisztika? Mérés Csoportosítás

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

matematikai statisztika


1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

y ij = µ + α i + e ij

Segítség az outputok értelmezéséhez

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Statisztikai alapfogalmak

Indexszámítás során megválaszolandó kérdések. Hogyan változott a termelés értéke, az értékesítés árbevétele, az értékesítési forgalom?

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

(Independence, dependence, random variables)

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Függetlenségvizsgálat, Illeszkedésvizsgálat

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

[GVMGS11MNC] Gazdaságstatisztika

Elemi statisztika fizikusoknak

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Korreláció és lineáris regresszió

Matematikai statisztika

Regressziós vizsgálatok

Számelmélet Megoldások

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kettőnél több csoport vizsgálata. Makara B. Gábor

2. előadás. Viszonyszámok típusai

Valószínűségi változók. Várható érték és szórás

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Átírás:

Berzseny Dánel Főskola ÁLTALÁNOS STATISZTIKA műszak menedzser alapszak Írta: Dr. Köves János Tóth Zsuzsanna Eszter Budapest 006

Tartalomjegyzék. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK... 4.. A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA... 5.. A VALÓSZÍNŰSÉG FOGALMA... 6.3. A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE... 6.4. A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI... 7.5. A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN... 8. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE... 9.. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK... 0.. A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA....3. A TELJES VALÓSZÍNŰSÉG TÉTELE... 5.4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE")... 8.5. ESEMÉNYEK FÜGGETLENSÉGE... 3. LEÍRÓ STATISZTIKA... 3 3.. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN... 4 3.. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI... 4 3.3. AZ ADATOK ÁBRÁZOLÁSA... 5 3.4. TAPASZTALATI ELOSZLÁSOK... 8 3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI... 34 3.6. AZ INGADOZÁS MÉRŐSZÁMAI... 4 3.7. AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK... 45 3.8. ESETTANULMÁNY LEÍRÓ STATISZTIKAI ELEMZÉS... 47 3.9. VISZONYSZÁMOK... 53 4. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I.... 56 4.. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK... 57 4.. A KAPCSOLAT SZEMLÉLTETÉSE... 58 4.3. AZ ELŐJEL KORRELÁCIÓS EGYÜTTHATÓ... 59 4.4. A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ... 6 4.5. AUTO- ÉS KERESZTKORRELÁCIÓ IDŐSOROK ELEMZÉSÉNÉL... 65 5. VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK... 68 5.. A VALÓSZÍNŰSÉGI VÁLTOZÓ... 69 5.. VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI... 70 5.3. BINOMIÁLIS ELOSZLÁS...73 5.4. POISSON-ELOSZLÁS... 75 5.5. EXPONENCIÁLIS ELOSZLÁS... 77 5.6. NORMÁLIS (GAUSS-) ELOSZLÁS... 8 5.7. A KÖZPONTI HATÁRELOSZLÁS TÉTELE... 87 6. STATISZTIKAI DÖNTÉSEK ALAPELVEI... 89 6.. ESETPÉLDA... 90 6.. DÖNTÉSI ALAPMODELL... 90 6.3. DÖNTÉSI MÁTRIX... 9 6.4. A DÖNTÉSI FOLYAMAT LOGIKÁJA... 9 6.5. DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK... 93 6.6. A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI... 98 7. BECSLÉS... 0 7.. A BECSLÉS TULAJDONSÁGAI... 03 7.. A PONTBECSLÉS MÓDSZEREI... 07 7.3. INTERVALLUMBECSLÉS... 09

8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK... 7 8.. A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE... 8 8.. ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL... 0 9. HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA... 4 9.. AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA... 5 9.. KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA... 6 9.3. TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK... 7 0. HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK... 9 0.. VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK... 30 0.. KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA... 3 0.3. PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA... 37 0.4. VARIANCIAANALÍZIS... 38. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II... 4.. A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ... 4.. AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE... 44.3. A REGRESSZIÓS BECSLÉS PONTOSSÁGA... 45. FELHASZNÁLT ÉS AJÁNLOTT IRODALOM... 5 3. FÜGGELÉK: TÁBLÁZATOK... 53 3

. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK Valószínűségszámítás Valószínűségelmélet Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Matematka statsztka Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 4

.. A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA A véletlen jelenség fogalma: A tömegjelenség fogalma: 5

.. A VALÓSZÍNŰSÉG FOGALMA A valószínűség fogalma A n f(a) f ( A) g( A) n lm n g( A) P( A) Készítette: Erde János. ábra: A valószínűség fogalma.3. A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE (Kolmogorov 93/3) I. Egy tetszőleges A esemény bekövetkezés valószínűsége 0 P(A). II. A bztos esemény valószínűsége, azaz P(Ω). III. Ha A és B egymást kzáró események, azaz A B 0, akkor P(A+B) P(A) + P(B). 6

.4. A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI Klasszkus valószínűség-meghatározás: Geometra úton: Valószínűségszámítás tételek segítségével: Emprkus adatokból: Elmélet eloszlások segítségével: Szubjektív becsléssel: 7

.5. A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN 8

. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE Valószínűségszámítás Valószínűségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 9

.. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK Tétel: Ha A és B egy eseményalgebra két tetszőleges eseménye, akkor annak valószínűsége, hogy közülük legalább egy bekövetkezk: P( A + B) P( A) + P( B) P( A B) Bzonyítás: Tétel: Ha A esemény bekövetkezése maga után vonja a B esemény bekövetkezését, azaz A B, akkor: P( B A) P( B) P( A) és P( A) P( B) Bzonyítás: Feladat: Mutassuk k, hogy P(A) 0,7 és P(B) 0,9 esetén P(A B) 0,6. 0

Feladat: Próbagyártás után két szempontból vzsgáljuk a késztermékeket. Az A esemény azt jelent, hogy a vzsgált gyártmány anyaghbás, a B esemény pedg azt, hogy mérethbás. Az A esemény P(A)0,5, a B esemény P(B)0,3 és az A B esemény P(A B)0,08 valószínűséggel következk be. M a valószínűsége annak, hogy valamely késztermék hbátlan? Feladat: Egy skola tanulónál a jeles matematka és a jeles fzka osztályzatokat fgyeljük. A következő eseményeket vezetjük be tetszőlegesen kválasztott tanulókra: A: jeles osztályzata van matematkából, B: jeles osztályzata van fzkából. Ismeretesek a következők: annak valószínűsége, hogy egy véletlen kválasztott tanulónak jelese van fzkából: P(B)0,; hogy jelese van matematkából és fzkából: P(A B)0,09; hogy a matematka és fzka tárgyak közül legalább egykből jeles az osztályzata: P(A+B)0,6. M a valószínűsége annak, hogy egy tetszőlegesen kválasztott tanulónak jeles osztályzata van matematkából?

.. A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA Defnícó: Ha A és B egy eseményalgebra két eseménye és P(B)>0, akkor a P( A B) P( A B) PB ( ) hányadost az A eseménynek a B eseményre vonatkoztatott feltételes valószínűségének nevezzük.

Feladat: Egy szállítmány 96 %-a megfelel a mnőség előírásoknak, s ezek 75 %-a első osztályú. Mekkora a valószínűsége annak, hogy egy találomra kválasztott darab első osztályú? Feladat: Egy telefonfülke előtt állunk és várjuk, hogy az előttünk beszélő befejezze a beszélgetést. Az llető beszélgetés dőtartama (τ) véletlen esemény, melyre érvényes a következő: P 3 ( τ t) e a.) Határozzuk meg annak a valószínűségét, hogy a beszélgetés 3 percnél tovább tart! b.) Menny annak a valószínűsége, hogy a beszélgetés tovább 3 percnél tovább tart, feltéve, hogy eddg 3 percnél tovább tartott? c.) Menny annak a valószínűsége, hogy a beszélgetés t+3 percnél tovább tart, feltéve, hogy t percnél tovább tartott? t 3

Feladat: Egy börtönben három elítéltet tartanak fogva: A-t, B-t és C-t. A következő napon egyküket felakasztják. A börtönőr tudja kt akasztanak fel, de nem szabad elárulna. Az A fogoly a következőt kérdez a börtönőrtől: "Áruld el a másk két fogoly közül egy olyannak a nevét, akt holnap nem akasztanak fel. Ha mndketten szabadok lesznek, akkor döntsd el magadban, hogy knek a nevét mondod. Ezzel nem árulsz el ttkot, mert azt már tudom, hogy egykük szabad lesz." A börtönőr ném gondolkodás után így válaszolt: "Nem, ez nem volna emberséges veled szemben. Most úgy gondolod, hogy /3 valószínűséggel akasztanak fel. Ha elárulom a többek közül egy olyannak a nevét, akt nem akasztanak fel, akkor az esélyed megnövekednek, úgy fogod gondoln, hogy / valószínűséggel akasztanak fel. Nem tudnál nyugodtan aludn". Helyesen érvelt-e a börtönőr? 4

.3. A TELJES VALÓSZÍNŰSÉG TÉTELE Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy tetszőleges esemény, akkor: n P( A) P( AB k) P( Bk) k Bzonyítás: 5

Feladat: Az MBA programban a "Kvanttatív módszerek" vzsgán a férfak 60 %-a, a hölgyek 80 %-a szerepel skeresen. A férfak az évfolyam 45 %-át teszk k. Mekkora a valószínűsége, hogy egy találomra kválasztott hallgató skeresen szerepel a vzsgán? Feladat: Három műszak azonos terméket gyárt. Egy adott napon az összes termékből az I. műszakban 40%, a II. és III. műszakban 30-30% készül. Az átlagos selejtarányok: I. műszak 5%, II. műszak 7%, III. műszak 0%. Az összes termékből a MEO egy darabot kválaszt, mekkora a valószínűsége, hogy az hbátlan? 6

Feladat: Egy gyártóberendezés munkadejének /3 részében az A terméket, /6 részében a B terméket, a többben pedg a C terméket gyártja. Az A termék gyártásakor az erre fordított dő 0%-ában áll a berendezés, a B termék gyártása közben végg dolgozk, míg a C termék gyártásakor a munkadő 5%-ában áll. Mekkora a valószínűsége annak, hogy egy találomra kválasztott dőpontban áll a berendezés? Feladat: Egy üzem 8 berendezése egyforma terméket gyárt. Az első három gép együttvéve 4% selejtet termel, a következő négy gépnél együttvéve 3% a selejt, míg az utolsó gép selejtaránya,5%. Az elkészült termékeket egy helyen gyűjtk. Mekkora a valószínűsége, hogy egy véletlenszerűen kválasztott darab selejtes lesz? 7

.4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE") Tétel: Ha B, B,...B n teljes eseményrendszer és P(B k )>0 (k,,...n), A pedg egy olyan esemény, amelyre P(A)>0, akkor: ahol: PB ( A) k P( A B ) P( B ) n k P( A B ) P( B ) k P(B k A) P(B k ) posteror" valószínűségek, pror" valószínűségek. Bzonyítás: 8

Feladat: Alkatrész-ellátásnál a pótalkatrészt 40%-ban a I. szállító szállítja 0% selejttel, 60%-ban pedg a II. szállító szállítja 0% selejttel. Az alkatrészraktárból kvettünk egy pótalkatrészt és azt találtuk, hogy hbás. Mekkora a valószínűsége, hogy a kválasztott alkatrész a II. szállítótól jött? Feladat: Egy üzemből kkerülő áru 75% valószínűséggel I. osztályú. A készterméket megvzsgálják. Annak a valószínűsége, hogy a vzsgálat során az I. osztályú terméket nem I. osztályúnak mnősítk %. Annak a valószínűsége, hogy egy nem I. osztályú terméket I. osztályúnak mnősítenek 5%. Mekkora a valószínűsége annak, hogy egy olyan termék, amelyk egy vzsgálat során I. osztályú mnősítést kapott, valóban I. osztályú? 9

Feladat: Egy folyóban bekövetkező halpusztulásért 3 par üzem lehet felelős. Tapasztalatok szernt a mérgező anyag kbocsátásának valószínűsége az egyes üzemeknél: 0%, 50% és 30%. A mérések szernt az egyes üzemek szennyvízkbocsátása esetén a halpusztulás valószínűsége: 60%, 5% és 5%. Menny a halpusztulás teljes valószínűsége? Mekkora bírságot szabjon k a.500.000 Ft-os halkárért a bíróság, ha nem smeretes, k a szennyezés kbocsátója a három üzem közül? (A bírságok összege a teljes halkár.) Feladat: Bertrand problémája: tekntsünk három szekrényt, amelyek mndegykében két fók van. Az első szekrény mndkét fókjában egy-egy aranygolyó, a másodk szekrény egyk fókjában arany-, a másodkban ezüstgolyó, a harmadk szekrény mndkét fókjában ezüstgolyó van. Találomra választunk egy szekrényt (azaz bármelyket egyenlő valószínűséggel választhatjuk), khúzunk egy fókot és abban aranygolyót találunk. Mekkora a valószínűsége annak, hogy az első szekrényt választottuk? 0

Feladat: Egy rodában 3 munkatárs dolgozk párhuzamosan azonos típusú ügyratok ntézésén. Az első naponta 0 aktával végez, a másodk nap 5, a harmadk nap 5 aktával. Az egyes munkatársaknál naponta átlagosan 0,3; 0,9; 0,5 db hbásan kezelt ügyrat található. Az összesített nap mennységből találomra kveszünk egy aktát és azt rossznak találjuk. Mekkora a valószínűsége, hogy azt az első munkatárs készítette?

.5. ESEMÉNYEK FÜGGETLENSÉGE Defnícó: A és B események (sztochasztkusan) függetlenek, ha P(A B)P(A) P(B). Az A esemény független B eseménytől, ha a P(A B) feltételes valószínűség nem függ a feltételtől: P( AB ) P( A B) P( A) PB ( ) Tétel: Ha A és B függetlenek, akkor A és B, A és B, valamnt A és B s függetlenek. Bzonyítás: Tétel: Ha három esemény páronként független, még nem bztos, hogy "teljesen függetlenek", azaz még teljesül az s, hogy: P(A B C)P(A) P(B) P(C) Feladat: Két kockával dobunk. Jelentse A azt az eseményt, hogy az első kockával párost dobunk, B azt az eseményt, hogy a másodk kockával páratlant dobunk és C azt az eseményt, hogy mndkettővel párost, vagy mndkettővel páratlant dobunk. A, B és C események teljesen függetlenek-e? Defnícó: Az A, A,... A n események teljesen függetlenek, ha közülük kválasztott tetszőleges számú eseményre teljesül, hogy az együttes bekövetkezésük valószínűsége egyenlő az egyes valószínűségek szorzatával.

3. LEÍRÓ STATISZTIKA Valószínűségszámítás Valószínűségelmélet Matematka statsztka Axómák, alaptételek Kombnatorka Geometra val.sz. Val.szám tételek Elmélet eloszlások Mnta vétel Leíró statsztka Becslés Hpotézsvzsgálat Összefüggésvzsgálat 3

3.. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A számszerű nformácó, annak mérése és elemzése alapvető szerepet játszk a társadalm és gazdaság jelenségek elemzésében. E számszerű adatok a legtöbb esetben azzal a sajátossággal rendelkeznek, hogy a megfgyelésük, a feldolgozásuk, elemzésük és az elemzés eredményenek felhasználása tudományos módszereket gényel. A statsztka módszerek között említhetünk meglehetősen egyszerű eljárásokat, és természetesen vannak ennél bonyolultabb, összetettebb matematka-statsztka módszerek. Magának a statsztka módszertannak -a konkrét vzsgálat tárgya alapján- szokás többféle ágát megkülönböztetn, a sokféle csoportosítás lehetőség közül a m szempontunkból célszerű különválasztan a leíró és a következtető statsztka vlágát. A kettő között lényeg különbség a következőkben ragadható meg: a leíró statsztka célja a vzsgálat tárgyát képező jelenség tömör, számszerű jellemzése az adatok elemzése és rendezése alapján (pl. 0 évente tartott népszámlálások adatanak feldolgozása); míg a következtető statsztka célja mnt azt a később fejezetekben látn fogjuk a mntából történő következtetés és általánosítás a teljes sokaságra vonatkozóan (pl. néhány ezer háztartás jövedelm adataból megfelelő pontossággal megbecsülhető, hogy a magyar lakosság körében mlyen jövedelm különbségek vannak). A leíró statsztka a megfgyelt adatok bemutatását, összefoglaló jellemzését tűz k célul, és ehhez az elemzéshez sokoldalú eszköztárt kínál, ebben a fejezetben célunk ennek az eszköztárnak a bemutatása. 3.. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI Ha a célnak megfelelően összegyűjtött adathalmaz áll rendelkezésünkre, akkor a következtetések felé tett első lépésünk a mnta feldolgozása, ennek kérdéskörével foglalkozk a leíró statsztka. A statsztka leírás célja a mnta adatanak átteknthető formába történő rendezése, tömörítése, az adatok grafkus megjelenítése, ábrázolása és egyes jellemző értékenek meghatározása. Így az adatok feldolgozásának kettős célja van: egy grafkus kép, pontosabban egy tapasztalat eloszláskép produkálása; a másk pedg statsztka mutatók meghatározása. A leíró statsztka e területe közül egyedül a rendezés, tömörítés pusztán technkanak tűnő, az adatok ábrázolása és a statsztka jellemzők meghatározása lényeges szemlélet, a sztochasztkus gondolkodást, látást megalapozó területek. A statsztka jellemzők segítségével a nagyszámú adat jellegzetességet néhány adatba sűrítve próbáljuk megragadn. A statsztka jellemzőket általában három fő csoportba soroljuk, éppen az alapján, hogy az adatok mlyen jellegzetességét ragadják meg: a középértékek: az adathalmaz közös, tpkus, jellegzetes, általános vonásat kísérlk megragadn egy-egy szám segítségével. az ngadozásmutatók: az egyed, különös, specáls, sajátos, eltérő jellegzetességek mértékét mutatják meg. az eloszlás alakjára jellemző egyéb mérőszámok: aszmmetra mértékét, az adatok eloszlásának lapultságát, csúcsosságát jellemző mutatók. Bármlyen adathalmaz esetén a feladatunk az, hogy alkalmas módon jelenítsük meg az adatokat, számítsunk jellemző középérték-mutatót és ngadozásmutatót s, mvel a középértékek átlagoló, összemosó hatását éppen az ngadozásmutatók tudják ellensúlyozn, míg az ngadozásmutatók pont ezt 4

a jellemző értéket nem tudják megragadn. Ezért a korrekt statsztka leíráshoz legalább egy-egy jellemző szükséges mndkét mutatócsoportból. Az egyed mérésekből származó adatok lehetnek dszkrétek és folytonosak. A dszkrét adatok szükségképpen ugrásszerűen változnak. Például a számlálás alapján nyert adatok dszkrét típusúak (pl. téves telefonhívások száma, balesetek száma, adott dőszak alatt bekövetkező gépmeghbásodások száma stb.). A folytonos adatok általában mérésből származnak. Jellemzőjük, hogy egy adott ntervallumon belül elvleg bármlyen értéket felvehetnek. A mérés korláta matt ezek az adatok s ugrásszerűen változnak, de az ugrások nagysága a mérőeszköztől függ, maguk az adatok lényegüket tekntve folytonosak (pl. átmérő, nyúlás, gépkocs abroncsok futásteljesítménye, nedvességtartalom). 3.3. AZ ADATOK ÁBRÁZOLÁSA A leíró statsztka jelentős részben az adatok átteknthető ábrázolásával foglalkozk, így fontos eszköze a táblázatok és dagramok. Ezeknél a dagramoknál, táblázatoknál az egyes értékek összehasonlítása áll előtérben, a grafkus ábrázolásoknál azonban nem mndg fontosak az értékek, sok esetben a vzsgált jelenséggel kapcsolatban azok megoszlása, egymáshoz való vszonya, aránya árulkodóbb. A táblázatok, dagramok lehetővé teszk nagyobb adathalmazok áttekntő ábrázolását, és vszonylag egyszerű őket elkészíten. A grafkonok a pontos értékek megadása nélkül s gyors áttekntést adnak, nagy terjedelmű mnták egészen egyszerű grafka elemekre támaszkodva válnak átteknthetővé. Néhány példa: A hba típusa Szabvány Kum. Relatív Kum. rel. Gyakorság jelölése gyakorság gyakorság gyak. Gömb alakú gázzárvány 0 78 78 53,% 53,% Gázzárvány-halmaz 03 6 04 7,7% 70,7% Átolvadás hány 40 4 8 9,5% 80,3% Összeolvadás hány 40 30 8,% 88,4% Gyökátfolyás 504 4 34,7% 9,% Hernyó alakú gázzárvány 06 3 37,0% 93,% Gyökoldal szélkolvadás 503 3 40,0% 95,% Egy oldalról hegesztett kötésben átolvadás hány 40 4,4% 96,6% Hely szélkolvadás, éles bemetszés nélkül 55 44,4% 98,0% Alapanyag-varrat között összeolvadás hány 40 45 0,7% 98,6% Wolfrám zárvány 304 46 0,7% 99,3% Egyenetlen varratfelület 54 47 0,7% 00,0%. ábra: Az adatok táblázatba rendezése 5

3. ábra: Oszlopdagram 4. ábra: Kördagram 5. ábra: Sávdagram 6

Adatok ábrázolása pktogram segítségével: 6. ábra: Vonaldagram Az összes szőlőtermelés felhasználása 7. ábra 7

3.4. TAPASZTALATI ELOSZLÁSOK A nagy számú statsztka adat átteknthetőségét lehetővé tesz, feldolgozását egyszerűsít, ha az értékeket nagyság szernt osztályokba soroljuk. A mérés sorozat legksebb és legnagyobb értéke között ntervallumot k számú osztályra bontjuk. Ha összesen n adatunk van, f pedg az -edk osztályba eső elemek számát jelent, akkor n knduló adat f + f +..+ f k n részsokaságok összegeként értelmezhető. Általános lépése a következők: osztálybasorolás (folytonos adatok és nagyszámú dszkrét megfgyelés esetén), a gyakorságok (f ) megállapítása. Gyakorság a sokaságban levő azonos tulajdonságú (azonos osztályba tartozó) elemek száma, a relatív gyakorságok (g ) megállapítása: g f n az összegzett (kumulált) gyakorságok (f ), lletve összegzett relatív gyakorságok (g ) megállapítása, gyakorság táblázat készítése (f, g, f, g adataból), a gyakorság (relatív gyakorság), lletve összegzett gyakorság (relatív gyakorság) hsztogramok (folytonos adatok esetén a polgon és az ogva) felvétele (tapasztalat eloszlások elkészítése). Grafkus ábrázolás Feladat: Egy folyamatos üzemben 4 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alább értékek adódtak óránként megoszlásban: Óra 3 4 5 6 7 8 9 0 Leállások 5 3 0 3 4 5 6 száma Óra 3 4 5 6 7 8 9 0 3 4 Leállások 4 0 3 0 3 4 6 száma. Táblázat A példa adata a következő gyakorság táblázatba és hsztogramba rendezhetők: Ahhoz, hogy az előbb táblázatunkat átteknthetőbb formába öntsük, célszerű az adatankat a dszkrét valószínűség változó által felvehető értékek szernt csoportosítan: 8

leállások száma óránként az előfordulások gyakorsága (f ) relatív gyakorság (g ) 0 3 0,5 5 0,08 5 0,08 3 4 0,68 4 3 0,5 5 0,083 6 0,083 összesen 4,000. Táblázat Ha vszonylag kevés adatunk van, akkor célszerű az alapján elkészíten az osztályba sorolást, hogy e dszkrét valószínűség változó mlyen értékeket vehet fel. 8. ábra: Gyakorságok ábrázolása dszkrét adatok esetén Dszkrét adatok esetén a gyakorságok az y tengely csak egy meghatározott pontjához tartoznak, és nem egy értéksávhoz, ezért dszkrét eloszlások esetében a gyakorságot általában függőleges vonalakkal jelölk. A kumulált (összegzett) gyakorság táblázat és hsztogram: leállások száma kumulált gyakorság (f ) kumulált relatív gyakorság (g ) 0 3 0,5 8 0,333 3 0,54 3 7 0,709 4 0 0,834 5 0,97 6 4,000 3. Táblázat A kumulatív gyakorságok grafkus ábrázolással nyert képét tapasztalat eloszlásfüggvénynek szokták nevezn. 9

9. ábra: Kumulált relatív gyakorságok ábrázolása dszkrét adatok esetén 30

Feladat: Mnt később tanulmányank (Vállalat pénzügyek) során látn fogjuk, gazdaság elemzésenknél gyakran szükség van a részvényektől elvárt hozam becslésére. (A részvények elvárt hozama dőben vszonylag stabl, így a jövőre vonatkozó becslésenket múltbel adatankra alapozhatjuk). A Budapest Értéktőzsde Részvényndexét (BUX) - az deglenes ndex ném változtatásával és 99- g vsszafelé s meghatározva - 995 január - hatállyal vezették be. Az ndex bázsa az 99. január -án számított 000 pont. Egy 5 éves dőszak hav hozamanak értéket az alább táblázatban foglaltuk össze. dátum BUX[%] dátum BUX[%] február. -7,54 november.,03 márcus. -0,7 december.,5 áprls 5. -,0 január 6. 3,3 május. -,5 február 3.,44 júnus. -8,4 márcus 3. -,9 júlus. 4,9 áprls. 0,03 augusztus. 3,0 május 5. 3,79 szeptember. -8,45 júnus.,9 október 3. 6,88 júlus. 5,99 november. -5,08 augusztus. -8, december. -4,89 szeptember. 6,34 január 5. -8,98 október. -7,6 február. 4,05 november 3. -6,75 márcus.,6 december. 0,4 áprls 3.,68 január 7. -7, május. 5,44 február.,7 júnus. -4,79 márcus. 4,84 júlus 3.,06 áprls. -, augusztus. 5,6 május 4. -7,48 szeptember.,8 júnus. 0,63 október. -6,05 júlus. 3,45 november. -0,93 augusztus 3. -36,06 december.,9 szeptember. -,97 január 4. 35,6 október. 6,9 február. 7,8 november.,53 márcus. 9,75 december. 5,5 áprls. 7,67 január 7. 3,6 május.,06 február. -3,63 júnus 3.,39 márcus. -,37 júlus. -,85 áprls. 9,0 augusztus.,6 május 3. 4,58 szeptember 3. 8,57 júnus. 4,59 október. 6,46 4. Táblázat Dolgozzuk fel a hav hozam adatokat leíró statsztka eszközökkel! 3

Folytonos adatokból készítendő gyakorság eloszlásoknál (és egyébként nagyszámú dszkrét adat esetén s) szükséges a rendelkezésre álló adatok osztályközökbe történő sorolása. Osztályba sorolásnak nevezzük az adathalmaz valamenny értékét magába foglaló teljes értékköz felosztását azonos nagyságú rész-értékközökre, és az adatoknak ezen belül csoportosítását. Az osztályköz középső értékét osztályköznek nevezzük, mvel az osztályba sorolás eredményeként az adatok elvesztk egyed értékeket, és az azonos osztályba sorolt adatokra az azonos osztályközép lesz a jellemző. Az osztályközt határoló két érték az alsó és a felső osztályhatár. Az osztályozás krtéruma: Teljes Átfedésmentes Homogén csoportokat eredményezzen Az Y szernt képzett osztály alsó felső határa Osztályközép abszolút relatív gyakorság Y 0 Y Y f g Y 0 Y Y f g Y 0 Y Y Y 0 + ( Y Y ) f g g f N Y k0 Y k Y k f k g k Összesen N 0. ábra: Gyakorság sor Ahol: Y (adatankat jellemző) mennység smérv, Adathalmazunkból k db osztályt képzünk, A 0-s ndex az osztály alsó határát, az -es ndex pedg az osztályköz felső határát jelent, Y az osztályközép, f az abszolút vagy tapasztalat gyakorság, g pedg a relatív gyakorság. Akár egy, akár több smérv szernt csoportosítjuk az adatankat, mndg kardnáls kérdés az osztályok számának a megválasztása. Ez alapos megfontolást gényel, és a vzsgált sokaság nagyságától nem függetleníthető. Mérlegelendő szempontok az osztályozásnál: M a célunk az osztályozással? A teljes értékközt hány rész-értékközre bontsuk fel, vagys hány osztályt alakítsunk k? Az osztályhatárok megállapításánál, kalakításánál mlyen szempontokat célszerű fgyelembe venn? A fent példánk alapján a gyakorság táblázat: osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0,00 6 7 9,3 0,77-0,0 x < 0,00 7 4 6,5 36,9 0,0 x < 0,00 3 47 35,38 7,30 0,0 x < 0,00 3 60 0,00 9,30 0,0 x < 30,00 3 63 4,6 96,9 30,0 x < 40,00 65 3,08 00,00 összesen 65 00,00 5. Táblázat 3

A gyakorság hsztogram: Az egyes értékközök felé emelt téglalapok területe arányos az egyes osztályokhoz tartozó tapasztalat gyakorságokkal. A pros vonallal jelölt függvényt sűrűségfüggvénynek nevezzük. A kumulált relatív gyakorság hsztogram: n 65 x s * 3, 9 %,05 %. ábra: Sűrűségfüggvény. ábra: Eloszlásfüggvény A kumulált gyakorságok grafkus ábrázolással nyert képét tapasztalat eloszlásfüggvénynek s szokás nevezn, ez megmutatja, hogy mlyen valószínűséggel fordul elő egy adott értéknél ksebb érték. A folytonos adatok eloszlásfüggvényét folytonos vonallal s összeköthetjük, és az így kapott görbét ogvának nevezzük. Ez azt mutatja meg, hogy megközelítően mlyen lenne a tapasztalat eloszlásfüggvény, ha az osztályközöket mnden határon túl csökkentenénk, az osztályközökbe eső adatok számát pedg mnden határon túl növelnénk. Az ogvát felhasználhatjuk egy adott értéknél ksebb értékek számának vagy relatív gyakorságának meghatározására. Fordítva s eljárhatunk, vagys megállapíthatjuk azt az értéket, amelyk alá adott relatív gyakorsággal esnek az adatok. Az lyen értékeket kvantlseknek nevezzük. 33

3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI A középérték-mutatókat gyakran helyzetmutatóknak s nevezk. A középérték-mutatók a gyakorság eloszlás helyzetét egyetlen, az adatokkal azonos mértékegységű számértékkel jellemzk. E középértékekkel kapcsolatos elvárásank, hogy legyenek: Közepes helyzetűek Tpkusak Egyértelműen meghatározhatóak Könnyen értelmezhetőek A középértémutatóknak két nagy csoportja smeretes: Helyzet középértékek: az adatok között elhelyezkedésüknél fogva jellemzk a vzsgált gyakorság eloszlás helyzetét. Számított középértékek: az adatokkal kapcsolatos számszerű összefüggésük révén jellemzk vzsgált gyakorság eloszlás helyzetét. Az alábbakban bemutatásra kerülő középérték mutatók a medán, a módusz, a számtan átlag, a harmonkus átlag, a mértan átlag és a négyzetes átlag. Medán (Me): Jellemző: helyzet középérték, közepes helyzetű. A medán a változó azon számértéke, amelynél az összes előforduló számérték fele ksebb, fele pedg nagyobb, tehát a rangsorba állított sokaság számértékeket két egyenlő gyakorságú osztályra bontja. Rövden: a nagyságrend szernt rendezett adatok középső értéke (páros számú adat esetén a két középső érték átlaga). Példa: 6, 8, 4, 9, 7, 3, 5, 3, 4, 5, 6, 7, 8, 9 Me6 4, 9, 7, 8,, 5, 4, 5, 7, 8, 9, Me7,5 7, 9, 3, 0, 5,, 5,, 3, 5, 5, 7, 9, 0 Me5 Ha a BUX ndex korább, 65 hav hozamadatat vesszük alapul, akkor e 65 adatot sorba állítva, a rangsor 33. tagja lesz a medán, hszen ennél 3 ksebb, és 3 nagyobb érték lesz a rangsorban, ez pedg 3,79. Felmerül a kérdés: hogyan határozható meg a medán akkor, amkor nem smerjük egyenként az adatokat, hanem csak osztályközös gyakorság sor áll rendelkezésünkre? Ilyen esetekben a medán legegyszerűben a következő formulával becsülhető: Meˆ Y me,0 + N f f me ' me h me ahol me annak a legelső osztályköznek a sorszáma, amelyre gaz, hogy ' f me N és Y me,0 az me sorszámú osztályköz alsó határa, és a h me pedg ennek az osztálynak az osztályközhosszúsága, am egyszerűen a felső és alsó osztályhatár értékének a különbsége. 34

Példa: Vegyük a korább BUX-ndexes példánkat, és tegyük fel, hogy csak a gyakorság táblázat áll rendelkezésünkre, és nem smerjük egyenként az összes hozamadatot. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0,00 6 7 9,3 0,77-0,0 x < 0,00 7 4 6,5 36,9 0,0 x < 0,00 3 47 35,38 7,30 0,0 x < 0,00 3 60 0,00 9,30 0,0 x < 30,00 3 63 4,6 96,9 30,0 x < 40,00 65 3,08 00,00 összesen 65 00,00 ' N f me N/3,5 a medánt tartalmazó osztály az ötödk osztály: 0,0 x < 0. M eˆ Y me N ' fme 3,5 4, 0 + hme 0,0+ (0,00 0,0) 3,7 f 3 me Ha összehasonlítjuk a korább eredményünkkel, láthatjuk, hogy a medán jól becsülhető osztályközös gyakorság sorból s. A medán előnye, hogy mndg egyértelműen meghatározható, és mvel valód középérték, így érzéketlen az adathalmazunkban szereplő szélsőértékekre, amely szélsőségesen nagy vagy kcs értékeket általában a véletlen szeszélye alakítják, és nem függ a több smérvértéktől sem. Ha az adathalmazunkban sok az egyforma smérvérték, akkor sem tanácsos használn. Módusz (Mo): A módusz - a medánhoz hasonlóan - helyzet középérték. A módusz nem mndg határozható meg egyértelműen, és nem s mndg létezk. Dszkrét változó esetén a változó leggyakrabban előforduló értéke. A 4 óra alatt gépleállásokhoz tartozó gyakorság táblázatot alapul véve látható, hogy a 4 órás megfgyelés alatt egyaránt 5-5 alkalommal fordult elő, hogy vagy leállás volt az adott órában. Ebben az esetben a módusz nem határozható meg egyértelműen. leállások száma óránként az előfordulások gyakorsága 0 3 5 5 3 4 4 3 5 6 összesen 4 35

Folytonos smérv esetén a módusz a gyakorság görbe maxmum helye. Folytonos változó esetén a medánhoz hasonló módon osztályközös gyakorság sorból becsülhető. Moˆ Ymo, 0 da + d + d a f h mo Ebben a képletben mo a móduszt tartalmazó osztályköz sorszáma és da fmo f d mo f fmo fmo+ A móduszt mndg az az osztályköz tartalmazza, amelykhez a hsztogram legmagasabb oszlopa tartozk. osztályhatárok f f g [%] g [%] -40,00 x <-30,00,54,54-30,0 x <-0,00 0 0,00,54-0,0 x <-0,00 6 7 9,3 0,77-0,0 x < 0,00 7 4 6,5 36,9 0,0 x < 0,00 3 47 35,38 7,30 0,0 x < 0,00 3 60 0,00 9,30 0,0 x < 30,00 3 63 4,6 96,9 30,0 x < 40,00 65 3,08 00,00 összesen 65 00,00 Ebben a példánkban a móduszt a legnagyobb gyakorságú osztály tartalmazza, ez pontosan ugyanaz az osztály, ahol a medán s volt. M da (3 7), + h 0,0 + (0,00 0,0) 3,76 d + d (3 7) + (3 3) oˆ Ymo 0 mo a f Megjegyzés: néha a módusz becslésének egyszerűen a móduszt tartalmazó osztályköz osztályközepét tekntk (példánkban ez 5,00 lenne), ezt nyers módusznak hívják. Bárhogyan s határozzuk meg a móduszt, az arra kapott közelítő érték esetleges, mert függ az osztályközök számától és hosszától. A módusz előnye, hogy a medánhoz hasonlóan nem függ sem az összes, sem a kugró smérvértékektől. A módusz hátránya, hogy nem mndg egyértelműen meghatározható, és nem s mndg létezk. Számtan átlag ( x ): A leggyakrabban használt középértékmutató: az átlag, számított középérték. Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: x n n x r r f f x r g x 36