I. Adatok, adatgyűjtés

Hasonló dokumentumok

MATEMATIKA C 12. évfolyam 5. modul Ismétlés a tudás anyja

1. Az ajánlatkérő neve, címe, telefon- és telefaxszáma; elektronikus levelezési címe

ZÁRÓ VEZETŐI JELENTÉS TEVÉKENYSÉGELEMZÉS ÉS MUNKAKÖRI LEÍRÁSOK KÉSZÍTÉSE SZÁMÍTÓGÉPES ADAT- BÁZIS TÁMOGATÁSÁVAL

JELENTÉS. az önkormányzatok évi normatív állami hozzájárulás igénybevételének és elszámolásának ellenőrzési tapasztalatairól július 212.

Verzió CompLex Officium Felhasználói kézikönyv

INFORMATIKAI STRATÉGIA

A fogyasztói tudatosság növelése. az elektronikus hírközlési piacon

Kristályszerkezetek és vizsgálatuk

LUDA SZILVIA. sikerül egységnyi anyagból nagyobb értéket létrehozni, gyorsabban nő a GDP, mint az anyagfelhasználás.

Hidrosztatikai problémák

A PUBLIC RELATIONS TEVÉKENYSÉG ESZKÖZEI

Prototípus, termék-, technológia- és szolgáltatásfejlesztés

MINŐSÉGIRÁNYÍTÁSI KÉZIKÖNYV

FOGYATÉKOS ÉS EGÉSZSÉGKÁROSODOTT FIATALOK PÁLYAORIENTÁCIÓJÁNAK HELYZETE. Elemző tanulmány

MATEMATIKA C 12. évfolyam 3. modul A mi terünk

A felülvizsgálatok során feltárt hibákat a döntések tartalmához igazodó sorrendben csoportosítottuk.

VÍZGYŰRŰS VÁKUUMSZIVATTYÚ MÉRÉSE

Kerékpárosokra vonatkozó legfontosabb ismeretek 3. rész Oldal 1

MINŐSÉGIRÁNYÍTÁSI KÉZIKÖNYV

Nők szolgálata. Tehát úgy teremtette Isten a férfit és a nőt, hogy személyükben egyenlőek, de sorrendiségükben és szerepükben eltérőek legyenek.

10XONE Szoftver és szolgáltatási szerződés Általános Szerződési Feltételek (ÁSzF) XONE V3.3 SZERZŐDÉS

Testépítés. Kovács Zoltán (Nyíregyházi Főiskola Debreceni Egyetem) zeus.nyf.hu/ kovacsz július 7.

Felhívás. Csoportos tehetségsegítő tevékenységek megvalósítására. a TÁMOP azonosítószámú Tehetséghidak Program

SARKÍTOTT FÉNNYEL A VIKINGEK NYOMÁBAN AZ ÉSZAKI-SARKVIDÉKEN A polarimetrikus viking navigáció légköroptikai feltételeinek kísérleti vizsgálata

A KÓS KÁROLY ÁLTALÁNOS ISKOLA PEDAGÓGIAI PROGRAMJA

GAZDASÁGI STATISZTIKA

A felmenők és az oldalrokonok törvényes öröklése: a parentéláris öröklés

Az Alsózsolcai 2. sz. Óvoda önértékelése

Tájékoztató a évi pedagógiai-szakmai ellenőrzés (tanfelügyelet) és pedagógusminősítések szakértői feladataival kapcsolatban

5CG. számú előterjesztés

IV. rész. Az élettársi kapcsolat

HALÁSZTELKI TÜNDÉRKERT ÓVODA

Önköltség-számítási számítási szabályzat

Adatbenyújtási kézikönyv

Normatív Határozat. Felelős: dr. Kelemen Márk polgármester Határidő: azonnal

A SZŐKE TISZA pusztulása és a jogi felelősség kérdése

Általános előírások. Az előírások hatálya 1..

Közlemény. Módosított pont. dokumentum neve Pályázati útmutató és Pályázati felhívás. B1 Jogi forma (a szöveg kiegészítése)

A végsebesség az egyes sebességfokozatokban elért gyorsulás és időtartam szorzatainak összege: 5

Mélyhúzás lemezanyagai és minősítési módszereik. Oktatási segédlet.

3. prioritás: A minıségi oktatás és hozzáférés biztosítása mindenkinek

Bevezetés. 1.) Bemutatkozás

KÖZBESZERZÉSI SZABÁLYZAT

11. Matematikai statisztika

Turisztikai attrakciók és szolgáltatások fejlesztése c. konstrukciójához. Kódszám: DDOP-2.1.1/D-12, KDOP-2.1.1/D-12, NYDOP-2.1.1/F-12 DAOP-2.1.

Elektromágneses terek (VIHVA204, BSc kurzus) Szóbeli vizsgakérdések

Dáka Község Helyi Építési Szabályzata

FELHÍVÁS. A felhívás címe: Felzárkóztató egészségügyi ápolói szakképzési programok. A felhívás kódszáma: EFOP

ÚTMUTATÓ A PROJEKTMENEDZSMENT TÁMOGATÓ RENDSZER

3. A MAGÁNSZEMÉLYEK ÉS GAZDÁLKODÓ SZERVEZETEK TŰZVÉDELMI FELADATAI

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

E-közigazgatási költség-hatékonysági módszertanok és benchmarking/monitoring rendszer kidolgozása

A nyilvános tér, művészet és társadalom viszonyrendszere

Vezetéstechnikai tréningprogram

PEDAGÓGIAI PROGRAM Némann Valéria Általános Iskola 5932 Gádoros, Iskola u

BILIÁRD TIPPEK Sorozat I. RÉSZ: Játszd a biliárd 8-as játékot a VERSENYSZABÁLYOK szerint!

Kitöltési útmutató. A. Általános rész. KITÖLTÉSI ÚTMUTATÓ az számú adatlaphoz

A 2016-os tervekről is röviden egypár szót ejtenék

A Makói Oktatási Központ, Szakképző Iskola és Kollégium Szervezeti és Működési Szabályzata

Példák. Ismert a római számok halmaza, amely intuitív szintaxissal rendelkezik, hiszen pl.

EGÉSZSÉGÜGYI DÖNTÉS ELŐKÉSZÍTŐ

KELEBIA KÖZSÉGI ÖNKORMÁNYZAT KÖZFOGLALKOZTATÁSI TERVE 2010.

MEGVALÓSÍTHATÓSÁGI TANULMÁNY

Az állattenyésztési ágazat fejlesztése - trágyatárolók építése

Dr. Fóriánné Horváth Margit A bankári biztosítékok

VENDÉGLŐS PINCÉR SZAKÁCS CUKRÁSZ SZAKMAI PROGRAMJA 2012.

Komputer statisztika gyakorlatok

Panini A V3/0211

Elektrokémiai fémleválasztás. Alapok: elektródok és csoportosításuk

A Közép-Nyírségi Agroipari Park megvalósíthatósági tanulmányterve

P E D A G Ó G I A I P R O G R A M

Windows felhasználói felület

Etikai kódex Erkölcsi szabály és normagyűjtemény

Foglalkoztatás és a foglalkoztatási formák kérdőiv 2014

JANUS PANNONIUS TUDOMÁNYEGYETEM. Schipp Ferenc ANALÍZIS I. Sorozatok és sorok

PÁLYÁZATI FELHÍVÁS a Környezet és Energia Operatív Program KEOP-1.2.0/ Szennyvízelvezetés és tisztítás megvalósítása. című konstrukcióhoz

Valószínűségszámítás

30. A hidegháború. Előzmény:

MUNKAANYAG. Szabó László. Szilárdságtan. A követelménymodul megnevezése:

Analízisfeladat-gyűjtemény IV.

ALAPSZABÁLY. Általános Rendelkezések

NYELVI ATTITŰD ÉS NYELVHASZNÁLAT A MATYÓ MEZŐKÖVESDEN

L E V E G Ő M U N K A C S O P O R T

SZABÁLYZAT ÉRTÉKESÍTÉS ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK

2. Hatványozás, gyökvonás

Csapata erősítésére keres gyakornokot a Kultúra.hu. Jelentkezni fényképes önéletrajzzal a takacs.erzsbet@kortarsmedia.hu címre várjuk.

VESZPRÉM MEGYEI ÖNKORMÁNYZAT KÖZGYŰLÉSE HATÁROZAT

MODERN, BIZTONSÁGOS BUDAPESTET!

Esztergom Város integrált településfejlesztési stratégiája

cato II. rész: Protokollok és Terápiatervek

10. Valószínűségszámítás

Átírás:

I. Adatk, adatgyűjtés Adatgyűjtés adatk minőségének értékelése. Gazdasági adatkról lesz szó! Adat: rögzített ismeret. Számszerű adatkkal fgunk fglalkzni. Általában az adatk nem teljes körűek (kmplettek). Az adatgyűjtés fő kérdései:. Mi(k) a releváns ppuláció(k)?. Mik az adatfrrásk? 3. Hány embert kérdeztünk meg és hgyan válgattuk ki őket? 4. Hgyan gyűjtöttük össze az infrmációkat? 5. Kik nem válaszltak? 6. Milyen típusú adatkat gyűjtöttünk? ad.. Skaság (ppuláció) Fnts a kiválasztás precizitása. A megkérdezetteknek tudni kell, miről van szó! Ez tehát alapvető marketing prbléma! (lásd tt!) ad.. Adatfrrásk Szegmentálás, célcsprt kiválasztás Ismérvek! GIGO (szemét be, szemét ki) Eredetük szerint: Elsődleges (eredeti) adatk Másdlags (származéks) adatk ad.3. A megkérdezettek kiválasztása a.) A CENSUS (népszámlálás, összeírás) Ez nem kíván semmilyen szelekciót, hiszen mindenkire vnatkzik! b.) Véletlen kiválasztás A vizsgált skaság minden elemének azns esélye van a mintába kerülésre! Pl. véletlen szám generálás útján való kiválasztás c.) Nem véletlen kiválasztás Előzetes szűréssel a skaság egy részét kizárjuk a mintából. Kvóta minta: a skaságt többféle jellemző aznsítja. Minden jellemző alapján egy-egy részt választunk ki. (pl. nem, életkr, munka) A mintában az egyes jellemzők aránya hasnló lesz az alapskaságéhz! (Pl. férfi-nő aránya a valóságban 46 % - 54 %., akkr a mintában is ilyennek kell lennie.)

d.) Számsság Minél hetergénabb az alapskaság, annál nagybb minta kell! (Egy hmgén skaságból elég elemet vizsgálni!) A minta elemszámától függ a vizsgálat pntssága. e.) Kmplexebb véletlen minták Ha az alapsság rétegezhető, akkr a mintában is jelen lesznek a rétegek. Tehát minden rétegből - súlyának megfelelően - választani kell eleme(ke)t. Ha vannak rétegek, de nem tudjuk őket aznsítani, akkr először a rétegekre kell rákérdeznünk, s csak azután fghatunk a mintavételhez. (Utólags rétegezés!) Clusterezés (csprtsítás) Ha vannak (eredendően) lyan csprtk, amelyek eleve tükrözik az alapskaságt, azkból kell választani. Több lépcsős tervezés Ez a fkzats szűkítés technikája. ad.4. Kérdezés A kérdezés mikéntje igen fnts! a.) Kérdőív-tervezés Legyen világs a vizsgálat tárgya, témája! Világs és tömör kérdések! A kérdés ne tartalmazza a választ (ne is utaljn rá!) A kérdések lgikus srrendet kövessenek! A nyelvezet egyszerű, könnyen érthető legyen! A kérdés ne krlátzza a válaszadót! A kérdőív rövid és tömör legyen! A kérdés lehet: nyittt, zárt, segítő, szűkítő, szűrő, többszörös válaszadó (zártkérdés alternatív kimenetekkel) A válasz lehet: szabad, rögzített, (választással!), igen-nem, skálán elhelyezhető. b.) Interjúk A személyes varázs hatása érvényesülhet. Bizalmi viszny jöhet létre. Felszínre jöhetnek meg nem értési prblémák. Segítségadás a kérdezettnek, stb.

c.) Pstai kérdőívek Válaszbrítékkal küldjük ki. A válaszadás önkéntes! Személytelenség! A visszaérkezési arány (!) 0-40 %! ad.5. Kik nem válaszlnak? kk: a.) személyes érdektelenségűek b.) lakcímváltzás miatt nem találhatók c.) kifutás a határidőből d.) az együttműködést elvből megtagadók e.) a lusták ad.6. Az adatk típusa Méréselméleti prblémák! Skálák: nminális, srrendi, intervallum, arány Milyen az adat? Minőségi: csak nminális skálán mérhető. Mennyiségi: minden skálán mérhető lehet! Milyenek az értékek? Diszkrétek vagy flytnsak Az adatk megjelenítése. Az adatk táblázatba fglalása Lehetséges módjai: a.) minden érték felsrlása b.) minden különböző érték felsrlása előfrdulásuk gyakriságával együtt c.) intervallumkba srlás (gyakriságkkal együtt!). Megjelenítés - ábrák - diagramk Diszkrét adatk megjelenítése: - kördiagramk, sávdiagramk - piktgramk Flytns adatk megjelenítése: - hisztgramk 3. Grafiknk használata grafiknk készítése idősrk ábrázlása lgaritmikus grafiknk 3

II. Adatk elemzésének statisztikai módszerei. Statisztikai srk A statisztikai sr: statisztikai adatk valamilyen szempnt szerinti felsrlása Statisztikai srk: (a.) a keletkezés módja szerint: - csprtsító sr - összehasnlító sr b.) az ismérv fajtája szerint: - idősr - területi sr - minőségi sr - mennyiségi sr Mennyiségi srk: - gyakrisági sr: a skaság hgyan szlik meg a mennyiségi ismérv szerint /f/; - értékösszeg sr: a mennyiségi ismérvnek a gyakriságával szrztt adata /f*x/. példa: a) Minden lehetséges értéket felsrló gyakrisági és értékösszeg sr legyen a következő: Ismérvérték (x) csprtlétszám (fő) Gyakriság (f) csprtk száma (db) 3 5 5 4 7 8 7 4 8 9 3 7 8 96 3 6 5 8 0 8 98 6 336 3 3 69 4 7 68 6 3 9 0 90 3 6 86 34 9 306 38 9 34 39 7 73 Értékösszeg (f*x) létszám (fő) Összesen: 37 90 gyakrisági sr értékösszeg sr 4

Listánkat leegyszerűsíthetjük, ha nem srlunk fel minden értéket, hanem az ismertérték adatkból ún. sztáyközöket képezünk. Ebben az esetben az értékösszeg sr pnts reprdukálása nem lehetséges, de megfelelő becslést kaphatunk, ha az sztályközöket az ún. sztályközepekkel helyettesítjük, és ezen értékeket szrzzuk a gyakrisággal. b. Osztályközös gyakrisági és értékösszeg sr: csprtlétszám csprtk száma becsült sztály köz sztályközép (gyakriság) értékösszeg 0-0 5 9 45 0-0 5 9 435 0-30 5 48 00 30-40 35 3 085 Összesen: - 37 866 - az sztályközép a két határ számtani átlaga - a két értékösszeg eltérése: 90-866 44 fő Ezen különbséget hívjuk abszlút becslési hibának. 44 Százaléksan kifejezve a relatív becslési hibát kapjuk: 00,5% 90. Visznyszámk (egyszerű visznyszámk) A visznyszám két, egymással valamilyen kapcslatban álló statisztikai adat hányadsa. Visznyszámk fajtái: megszlási, krdinációs, dinamikus, tervteljesítési és intenzitási Dinamikus visznyszám: az időbeli váltzásk jellemzői. Két különböző időszak - vagy időpnt - azns fajta adatainak egymáshz való arányát mutatja. Két fajtája van: a lánc- és bázisvisznyszám. Láncvisznyszám: az idősr adataiból egymáshz láncszerűen kapcslódó visznyszámk, ahl mindig két szmszéds adatt hasnlítunk össze, tehát ún. váltzó bázissal számlunk. l i x x i i- 5

. példa: Bázisvisznyszám: az idősr minden adatát ugyanazn időszak adatával sztjuk el, tehát az ún. állandó bázissal számlunk. xi b i x (Nagyn lényeges a helyes bázis kiválasztása!) Egy vállalat teljes termelési érték adatai a következők: év termelési érték előző évi termelés 994. évi termelés (mft) %-ában %-ában 994. 30-00,0 995. 40 3,6 3,6 996. 690, 6,3 997. 3050 3,4 43, 998. 370 07, 53,5 999. 3490 06,7 63,8 Milyen összefüggések vannak a bázis- és láncvisznyszámk között?. az első tárgyidőszak lánc- és bázisvisznyszáma egyenlő: l b. az első k láncvisznyszám szrzata a k -ik bázisvisznyszámt adja: l i bk 3. bázisvisznyszámból ugyanúgy számíthatunk láncvisznyszámt, mint az eredeti abszlút számkból). 3. Középértékek Középérték: az azns jellegű számadatk közös jellemzője. A középértékkel szemben támaszttt követelmények: - közepes helyet fglaljn el: x min < K < x max - tipikus legyen, tehát álljn közel az előfrduló értékek zöméhez - egyértelműen legyen definiálva (pl. képlet frmájában). Két fő csprtja ismert a középértékeknek: - helyzeti és - számíttt k i 6

3.. A helyzeti középértékek Jellemzője: - nagyságát az előfrduló értékek egy része nem beflyáslja, - számításuk egyszerű; gyakran rátekintéssel megállapítható a helyzeti középérték). A helyzeti középérték fajtái: módusz és medián Módusz: a leggyakrabban előfrduló ismérvérték Meghatárzásáhz nincs szükség számítására, értéke a gyakrisági srra történő rátekintéssel megállapítható. 3. példa: A Statisztikai alapismeretek tárgyból a hallgatók az alábbi érdemjegyeket érték el: Feladatk: érdemjegy vizsga db x f f*x 5 5 7 54 3 38 4 4 88 5 60 Összesen: 4 33. Állapítsuk meg az érdemjegyek móduszát! A módusz 3, mert ezen sztályzathz tartzik a legnagybb gyakriság (38). Határzzuk meg ugyanezen gyakrisági sr számtani átlagát. x 33:4,904. Hgyan értelmezhető a fenti módusz? A hallgatók leggyakrabban közepes sztályzatt kapnak. Ezzel szemben a,904-es számtani átlagnak nincs ilyen értelmű tárgyi jelentése, hiszen,9-re nem lehet felelni. 7

Nézzük meg, hgy az ismételt vizsgák után hgyan alakulnak az eredmények: érdemjegy vizsga ( db ) x f f*x - - 33 66 3 45 35 4 4 96 5 60 Összesen: 4 357 Feladatk:. Határzzuk meg mst a számtani átlagt: x 357 :4 3,3 Tehát az átlag váltztt azáltal, hgy az érdemjegynek nem számítható elégtelen sztályzatkat kijavíttták. Ezzel szemben a módusz értéke nem váltztt! Megállapítás: a módusz értékét a szélső értékek nem beflyáslják. (Ugyanígy 3 lenne a módusz értéke, ha az eredeti adatk közül - mint nem értékelhetőt - az elégteleneket teljesen figyelmen kívül hagynánk.) Medián: az ismérvhalmaz azn értéke, amelynél ugyanannyi kisebb, mint nagybb érték frdul elő. 4. példa: Hgyan határzható meg a medián? Az ismérvértékeket mntn növekvő srrendbe rendezzük, s az n + srszámú tagja a medián (ha n páratlan), vagy ha "n" párs, úgy a két középső tag számtani átlaga. Határzzuk meg az. példa adatainak mediánját. 37 + n 37 ; medián a - ik tag, tehát a 69. tag Tehát 68 csprtben ennél kevesebb vagy egyenlő, 68-ban pedig több vagy egyenlő a létszám. 8

3.. Számíttt középértékek A számíttt középértékek jellemzője, meghatárzásuk számítás útján történik, értéküket minden átlaglt érték beflyáslja. Számíttt középérték fajták: - számtani átlag, - harmnikus átlag, - mértani átlag, - négyzetes átlag. Számtani átlag: az átlaglandó ismérvértékek összegét sztjuk az ismérvek db számával. Képlete: Σ x x n 5. példa: Egy karbantartó brigád 00. február havi dlgzónkénti bruttó keresete:. Kiss Gábr 3.000,- Ft. Kvács Jenő 36.000,- Ft 3. Balgh Antal 4.000,- Ft 4. Nagy Imre 36.000,- Ft 5. Huzián Mihály 3.000,- Ft 6. Gyergyói Pál 3.000,- Ft 7. Tóth Kárly 36.000,- Ft Összesen: 945.000,- Ft A brigád átlagkeresete: Számtani átlagt alkalmazunk, ha az átlaglandó értékek összegének van tárgyi értelme. (pl. a dlgzók bruttó összkeresete) Az egyes átlaglandó értékek többször is előfrdulhatnak az értéksrban. Ezek összeadását szrzással helyettesítjük: 945000 35.000,- Ft/fő 7 3 x 3000 + 3 x 36000 + x 4000 35000,- Ft 7 Ezzel eljutttunk a súlyztt számtani átlag fgalmáhz. 9

A súlyztt számtani átlag képlete: Σ f ix x Σ f i i Értékét a következő két tényező beflyáslja: az átlaglandó értékek nagysága a súlyk nagysága, a súlyarányk. Harmnikus átlag: a tagk db számát elsztjuk az átlaglandó értékek reciprkainak összegével. 6. példa: Képlete: x h n i n xi Hárm kubiks brigád - az eltérő talajszerkezet miatt - 0 fm alapárk ásási munkáit az alábbi idők alatt végzi el: A brigád: B brigád: C brigád: óra 4 óra 8 óra Feladat: Határzzuk meg, mennyi ideig tart átlagsan 0 fm-nyi alapárk kiásása? (az összeadásnak nincs értelme!) _ t x _ h + 3 4 + 8 4 8 + 3 8 + 8 3 7 8 4 7 3,43 óra Természetesen a harmnikus átlagnak is van súlyztt frmája: x h Σ f f Σ x 0

7. példa: Egy iparvállalat munkaügyi adatai az alábbiak: Egység Havi béralap (Ft) Átlagbér (Ft/fő). üzemrész 800.000,- 40.000,-. üzemrész 900.000,- 30.000,- 3. üzemrész 480.000,- 48.000,- Vállalat:.80.000,-? Feladat: Számítsuk ki a vállalati átlagbért! átlagbér Σ létszám átlagbér Σ béralap Σ létszám Σ béralap Σ átlagbér Σ Σ béralap béralap átlagbér ; a béralap ismert, a létszám nem. ; ezek után Melyek az átlaglandó értékek? Az átlagbérek! Mik a súlyk? A béralapk! Így: 800.000 + 900.000 + 480.000.80.000 vállalati átlagbér 36.333,- Ft 800.000 900.000 480.000 + + 60 40.000 30.000 48.000 8. példa: Egy vállalat két üzemegységének termelési adatai: egység beszámlási időszak termelése (Ft) tervteljesítés (%). üzemegység 43.000,- 08. üzemegység 960.000,- 96 Vállalat:.39.000,-? Feladat: Határzzuk meg a vállalat tervteljesítési %-át! Magyarázzuk meg az eredményt! - az átlaglandó értékek a tervteljesítési %-k. - a súlyk a beszámlási időszaki termelési értékek.

Vállalati tervteljesítés % 43.000 43.000,08 + 960.000 960.000 + 0,96.39.000 400.000 +.000.000.39.000.400.000 0,9943 99,43 % Az átlag a nagybb súlyú üzemegység felé tlódik el. A harmnikus átlagt akkr alkalmazzuk, ha az átlaglandó értékek reciprk értékei összegének tárgyi értelme van, általában visznyszámk - sebesség, teljesítmény, stb. átlagaként számítjuk. Mértani átlag: az a szám, melyet ha az átlaglandó értékek helyébe teszünk, azk szrzata váltzatlan marad. Képlete: x g n x xx3...xn ; azaz: az átlaglandó érték szrzatból n-edik gyököt vnunk. Mikr van értelme? Ha az átlaglandó értékek szrzatának tárgyi jelentése van. Ismerünk-e ilyen esetet? Igen! Láncvisznyszámk szrzata bázisvisznyszám. m f A mértani átlag súlyztt frmája: x g n x j j j Ahl: f j a j-edik adatcsprt gyakrisága n az összes elem száma x j a j-edik adatcsprt ismérvértéke Négyzetes átlag: az átlaglandó ismérvértékek négyzeteinek szummájából képzett számtani átlag négyzetgyöke. Képlete: x q Σ x, ill. súlyztt frmában: n x q Σ fx n Akkr használjuk, ha az átlaglandó értékek különböző előjelét négyzetre emeléssel kívánjuk eltüntetni. (Ugyanis: lyan esetet nem ismerünk, amikr az átlaglandó értékek négyzetösszegének tárgyi jelentése van.) Ezt a módszert a szórás mutató számításánál alkalmazzuk (lásd később!)

3.3. Idősrk elemzése 9. példa: Egy vállalat raktáraiban A anyag leltár szerinti készletértékei a következők szerint alakultak: Leltári időpnt készletérték 996. 0. 0. 460 ezer Ft 0. 0. 480 ezer Ft 03. 0. 50 ezer Ft 04. 0. 440 ezer Ft Határzzuk meg az 996. I. negyedévi készletet. Milyen módszerrel tehetjük ezt, ha azt akarjuk, hgy az időbeli váltzásk jól kifizetésre jussanak? (Kérjünk hallgatói véleményeket). Számljunk először minden hónapra átlagkészletet: 460 + 480 0. havi átl.: 470 ezer Ft 480 + 50 0. havi átl.: 500 ezer Ft 50 + 440 03. havi átl.: 480 ezer Ft Miután ezek az átlagk nagyjából egyenlő időszakkra vnatkznak, ezért - másdik lépésként - számíthatjuk a negyedéves átlagt ezek átlagából: 470 + 500 + 480 3 483,33 ezer Ft - vnjuk össze a két lépést: 483,33 460 + 480 480 + 50 50 + 440 + + 3 460 + 480 + 50 + 3 440 Ezzel az un. krnlógikus átlaghz jutttunk el! - hgyan számítjuk tehát a krnlógikus átlagt? Összeadjuk az első és az utlsó tag felét a többi taggal, az összeget pedig sztjuk az adatk száma, mínusz eggyel. 3

Képlete: Yk Y + Y +...Yn- + n Yn (Miért van a nevezőben n, és nem n-? Mert Y -val, és nem Y -gyel kezdtünk a számlálóban.) 3.4. A fejlődés intenzitásának vizsgálata Példa: adtt építőipari vállalat éves termelési értékének alakulása: termelési érték időszak ezer Ft-ban váltzás előző évben 993. 640.000-994. 660.000 0.000 995. 70.000 60.000 996. 780.000 60.000 997. 870.000 90.000 Feladat: Határzzuk meg a fejlődés (váltzás) mértékét. 0.000 + 60.000 + 60.000 + 90.000 30.000 ezer Ft. Az eltérések összege egyenlő az első és utlsó tag közötti különbséggel: D 870.000-640.000 30.000 ezer Ft. A váltzás mértéke tehát igen egyszerűen számlható. 4. Szóródás számítás A középértékek egyetlen számba sűrítve jellemzik a vizsgált skaságt. Mi ennek a hátránya? Eltüntetik, kiegyenlítik a különbözőségeket, ugyanis az egyes értékeknek az átlagtól való eltérései nagyn különbözők lehetnek. Hgyan határzhatjuk meg az ismérvértékek átlagtól való eltérését? Az értékek átlag körüli szóródásának megállapításával, az ún. szóródásszámítással. A szóródás: az azns értékek különbözősége, az átlaglt értékeknek az átlagtól való eltérése. 4

Szóródási mutatók - szóródás terjedelme /R/ - átlags eltérés /δ/ - szórás /б/ - relatív szórás /V/ A szóródás terjedelme: a legnagybb és legkisebb érték különbözősége. Képlete: R x max x min 0. példa: Határzzuk meg az. példa adatainak terjedelme mutatóját a létszám adatkra. x 34 ; x 5 max R 34-5 37 - mit világít meg az R mutató? Hgy mekkra értékközben mzgnak - ingadznak - az ismérvértékek. - mi a hiányssága az R mutatónak? Csupán értékre támaszkdik, ezért szeszélyes, nem jellemző érték is éreztetheti hatását esetenként. Átlags (v. abszlut) eltérés: az egyes értékek és azk számtani átlaga közötti eltérések abszlút értékeinek számtani átlagát. Σ /d/ Képlete: δ, ahl d az átlagtól való eltérés értéke n. példa: Hat vállalat kllektív szerződése az esztergálys szakmunkásk személyi órabérét rendre az alábbiak szerint rögzíti: min A vállalat: 50,- Ft B vállalat: 80,- Ft C vállalat: 00,- Ft D vállalat: 30,- Ft E vállalat: 40,- Ft F vállalat: 60,- Ft Feladat: határzzuk meg a δ (delta) mutatót! 5

- először kiszámítjuk a számtani átlagt: δ 50 + 80 + 00 + 30 + 40 + 60 x 6 60 + 30 + 0 + 0 + 30 + 50 6 00 6 33,33 0, Ft Ft - a kiszámíttt adat jelentése: az egyes órabérek átlagsan 33,33 Ft-tal térnek el az órabérek átlagától. Szórás: az átlagtól való eltérések négyzetes átlaga. Képlete: б Σ d n A szórás a szóródás jelenségének egyik mutatója, mérőszáma!. példa: Számítsuk ki az iménti 6 órabér szórását. б 60 + 30 + 0 + 0 + 30 + 50 6 8400 400 37,4 Ft 6 Látható, hgy б > δ. Miért? Mert x q x. A 37,4 értékű szigma mutató jelentése ugyanaz, mint a 33,3 értékű deltáé! A két, azns jelentésű mutató számszerű eredményének eltérése nem kz prblémát, ha mindig ugyanazn mutatókat hasnlítjuk. Kérdés: váltzik-e a dlgzók fizetésének szórása, ha egységesen 50,- Ft-al emelik minden dlgzó órabérét? Nem! Váltzik-e a szórás, ha a fizetéseket 5 %-al emelik? Igen, 5 %-al nő. 6

Relatív szórás: a szórás és a számtani átlag hányadsa. Képlete: V σ x A relatív szórás mutatót különböző nagyságrendű skaságk szóródásának öszszehasnlításánál alkalmazzuk. 3. példa: Feladat: számítsuk ki a. Példában szereplő 6 személyi órabér relatív szórását! V 37,4 0 0,78 A relatív szórás 0,78 értéke azt jelenti, hgy az egyes órabérek átlagsan 7,8 %-al térnek el az átlags órabértől. 5. Összetett visznyszámk Eddig lyan visznyszámkat ismertünk meg, melyek a statisztikai vizsgálat (pl. adatgyűjtés) srán nyert két adatt hasnlítanak egymáshz valamilyen lgika szerint, és az összehasnlítás (sztás) eredményeképp egy újabb statisztikai adathz jutttunk, amely megmutatja a két adat egymáshz képest bekövetkezett váltzását. (Pl. két időszak azns jellegű adatának összevetése, vagy tény- és tervadatk visznyítása, stb.). A gyakrlatban sűrűn előfrduló igény, hgy ne csupán két-két adatt visznyítsunk, hanem több adat együttes-átlags váltzását állapítsuk meg, pl. egyik időszakról a másikra. Ilyen jellegű vizsgálatra a megismert egyszerű visznyszámk nem alkalmasak, hanem az ún. összetett visznyszámkat kell alkalmaznunk. Ezeket az összetett visznyszámkat statisztikai indexeknek nevezzük, és ezeknek is léteznek egyszerűbb fajtái, az ún. alapindexek, melyek eredeti (nem származéks, számíttt) adatkkal számlnak, és összetett fajtái az ún. standardizálásn alapuló indexek, melyek intenzitási visznyszámk, átlagk - együttes - átlags váltzásait számszerűsítik. Statisztikai index: két, vagy több, egymással közvetlenül nem összegezhető adat együttes-átlags váltzását kifejező mutatót. Az index a dinamikus visznyszám sajáts fajtája, sajátssága abban áll, hgy a benne fglalt adatk nem összegezhetők. Miért nem összegezhetők az index-számítás módszerével vizsgált adatk? az elnevezés meglehetősen elterjedt, de nem túl találó 7

Eltérő mennyiségi egységük miatt, pl. egy-egy termelő szervezet több különféle terméket állít elő, melyek természetes mértékegységben történő számbavétele srán a legkülönfélébb mértékegységekkel találkzunk. (Lásd később az indexszámítás módszerének bemutatására szlgáló példát.) Az indexszámítás úgy hidalja át ezt a prblémát, hgy nem az eredeti adatkkal, pl. a termelt mennyiségekkel, hanem mindig az ún. érték adatkkal, pl. az egyes termékekre vnatkzó termelési értékekkel száml. 5.. Alapindexek Az alapindexek a termelési mennyiségek, az árak és a termelési érték között teremtenek kapcslatt. A termelt mennyiségek - q - és az egyes termékek egységárai - p- összeszrzva az értéket - v - adják. Tehát termékenként kiszámljuk a q x p v adatkat, majd ezeket összegezzük. Két különböző időszak n i q i x p i adata már összehasnlítható, elsztható egymással. (A tvábbiakban az egyszerűség kedvéért a futóindexet nem jelöljük!) Az alapindexek: - árindex - vlumenindex - értékindex Árindex: A termelt termékek árai megváltzásának hatását a termelési értékre, vagyis az egyes árváltzásk együttes - átlags hatását. Úgy tekintjük tehát, mintha a vállalat két egymást követő évben valamennyi termékből azns mennyiségeket állíttt vlna elő, csupán az árak váltztak vlna meg. Az árindex számításáhz meg kell határznunk az előző évi - ún. bázisidőszaki - termelési értéket: Σ q x p Ezután kiszámítunk egy következő évi - ún. tárgyidőszaki -, feltételezett termelési értéket, ahl a mennyiségek aznsak a bázisidőszaki adatkkal, az árak visznt megváltztak: Σ q x p 8

Az árindex képlete ( I p ): I p Σ q Σ q x p x p Mi állapítható meg a képletből? Itt a bázisidőszaki mennyiségekkel számltunk a tárgyidőszakban is, de az a feltételezés, hgy a termelt mennyiségek nem váltztak frdítva is elképzelhető, tehát úgy, hgy mindkét időszakban a tárgyidőszaki mennyiségekkel számlunk. Ezek szerint kétféle árindex képlet létezik! - az iménti, amit az első alkalmazójáról Laspeyres, (ejtsd: laszper) frmulának nevezünk, - tvábbá a következő képlet: Σ q x p Ip, Σ q x p amelyet Paasche, (ejtsd: páse) frmulának hívunk. Hangsúlyzzuk a kétféleképp számlt, de azns jellegű index számszerű különbözőségét és némiképp eltérő jelentését! Vlumenindex: Megmutatja, hgy hgyan váltztt vlna a termelés összértéke, ha az érték két tényezője, a mennyiségek és egységárak közül csak a termelt mennyiségek váltztak vlna, és az árak az összehasnlíttt két időszakban aznsak lettek vlna. Választhatjuk váltzatlan árnak a bázisidőszak árait is, és a tárgyidőszaki árukat is, tehát itt is két képlet, frmula létezik. A vlumenindex képlete ( I q ): illetve I I q q L P Σ q Σ q Σ q Σ q x p x p x p x p Értékindex: Együtt vizsgálja a mennyiségek és árak együttes - átlags váltzásának hatását az értékre. Itt tehát mindkét tényező megváltzik. 9

0 Az értékindex képlete ( v I ) v x p q x p q I Σ Σ Itt értelemszerűen csak egyféle képlet létezik! Az egyes termékekre tehát fennáll a i i i p x q v összefüggés. A hárm indexre is fennáll a szrzatszerű összefüggés, de csak ha a két különböző frmulával számlt ár- és vlumenindexet szrzzuk össze.) Azaz:. v q p I I I P L, azaz Σ Σ p q p q Σ Σ p q p q p q p q Σ Σ, illetve. v q p I I I L P, azaz Σ Σ p q p q Σ Σ p q p q p q p q Σ Σ Kialakult hazai gyakrlat, hgy az árindexet tárgyidőszaki mennyiségekkel, tehát Paasche frmulával, a vlumenindexet bázisidőszaki árakkal, tehát Laspeyres frmulával számljuk.

4. példa: Egy vállalat egyik üzeme által előállíttt 5 termék jellemző adatai az alábbiak: termék neve mennyiség egység termelt mennyiség 000. 00. q q egységár 000. 00. p p A db 00 50 50 60 B fm 000 900 5 0 C m 3 50 60 80 00 D q 300 350 70 60 E m 0 30 50 80 Feladatk: a.) Számítsuk ki az összes lehetséges indexet! q p q p q p q p A 0.000.500.000 5.000 B 5.000 3.500 0.000 9.000 C 9.000 0.800 0.000.000 D.000 4.500 8.000.000 E 5.000 7.500 5.600 8.400 Összesen: 60.000 68.800 55.600 65.400 I P Σ q Σ q p p 55.600 0,97 (Laspeyres) 60.000 I P Σ q Σ q p p 65.400 0,95 (Paasche) 68.800 I q Σ q Σ q p p 68.800,47 (Laspeyres) 60.000 I q Σ q Σ q p p 65.400,76 (Paasche) 55.600 I v Σ q Σ q p p 65.400 60.000,090

b.) Győződjünk meg arról, hgy a krábban megállapíttt indexösszefüggés valóban fennáll-e! I v Iq Ip illetve I v Iq Ip,76 0,97,090 P L,47 0,95,090 L P c.) Mit fejez ki pl. a Laspeyres frmulával számlt vlumenindex,47-es adata? A megtermelt 5 termék termelési mennyiségének váltzása termelési érték 4,7 %-s növekedését eredményezte vlna, ha mindenütt az 980-as év árait vennénk figyelembe. 5.. Standardizálásn alapuló indexek Az alapindexek eredeti adatkkal számlnak, aznban gyakran előfrduló eset, hgy lyan adatk együttes-átlags váltzásait kell vizsgálnunk, melyek az ún. származéks adatk, pl. visznyszámk. A prbléma jbb megértéséhez tekintsük ismét a visznyszám általáns képletét! A A visznyszám általáns képlete: V B Kérdés: Hgyan vizsgálható több A/B jellegű adat együttes-átlags váltzása? Σ A I : Σ B Σ Σ A B (Nyilvánvaló, hgy itt is egyfajta indexről van szó, ezért alkalmaztuk az I jelölést.) Ez a képlet még mindig A és B jellegű, tehát eredeti adatkkal száml. Mi a helyzet aznban akkr, ha V jellegű és B jellegű adataink, tehát viszny-számaink és azk előfrdulási gyakriságai állnak rendelkezésre?

A V, ebből A B V, B ezt behelyettesítve: Σ B x V Σ B x I : Σ B Σ B V Ez az ún. főátlag index, más néven váltzó állmányú index, jele: I _ v A főátlag index: kifejezi az egyes visznyszám, vagy átlag jellegű adatk - pl. a vállalat egyes állmánycsprtjainak átlagbérei és az egyes csprtk létszámai - megváltzásának együttes hatását, pl. a vállalati átlagbérre, az ún. főátlagra. Lgikáját tekintve ez az index a krábban megismert értékindexnek felel meg, ti. mindkét tényező együtt váltzik. Megvizsgálhatjuk itt is a két tényező külön-külön történő váltzásának hatását a főátlagra. Ekkr a másik tényezőt mindig váltzatlannak, standardnak tekintjük, ezért nevezzük a módszert standardizálásnak. Vizsgáljuk meg először azt az esetet, mintha csak az egyes visznyszámk, v. átlagk váltztak vlna és súlyuk (előfrdulásuk száma) nem, tehát pl. megváltznának az egyes állmánycsprtk átlagbérei, de az állmánycsprtk létszámai váltzatlank maradnának. Ez az ún. részátlag, v. váltzatlan állmányú index. A részátlag index képlete: I v Σ B x V, : Σ B Σ B x V Σ B Ez esetben is létezhet kétféle képlet, de kialakult gyakrlat, hgy a tárgyidőszak súlyaival, tehát " B "-ekkel számlunk. A részátlag index kifejezi a részátlagk megváltzásának a főátlag váltzására gyakrlt hatását, vagyis megmutatja, hgy hgyan váltztt vlna a főátlag, ha ez a váltzás kizárólag a részátlagk megváltztatásából adódna. 3

A képlet ΣB "-el egyszerűsíthető, így " I v Σ B x V, Σ B x V Ha az egyes részátlagk (" V i "-k) nem váltznának, hanem csupán súlyuk, tehát egymáshz visznyíttt részarányaik (" B i "-k) váltznának meg, akkr az ún. összetétel index, más néven arányeltlódási index mutatja meg ezen váltzás együttes-átlags számszerű hatását a főátlagra. Az összetétel index képlete: I v,, Σ B x Σ B V Σ B x : Σ B V Az index-technika eddig megismert lgikájából egyértelműen következik, hgy miért " V "-val számlunk, és így itt sem használunk két különféle képletet! Az összetétel index kifejezi az ún. főskaság összetételében bekövetkezett váltzásnak a főátlag váltzására gyakrlt hatását, vagyis megmutatja, hgy hgyan váltztt vlna a főátlag, ha a váltzás kizárólag az összetétel megváltzásából adódna. A megismert hárm index között számszerű összefüggés: főátlag index részátlag index összetétel index azaz: I I, I,, v v v I v Σ B Σ B V Σ B Σ B V Σ B Σ B V Σ B Σ B V Σ B V Σ B Σ BV Σ B 5. példa: Tekintsük az alábbi, első ránézésre egyszerűen áttekinthető adatkat, melyek egy vállalat átlags havi béralakulását mutatják meg bázis- és tárgyidőszakra munkás-csprtnként és együttesen: 4

Munkás Összes munkabér (.000,- Ft) Létszám (fő) Átlags havi bér (Ft/fő) csprtk bázis tárgy bázis tárgy bázis tárgy A A B B V V Szakmunkás 300 586 300 350 44000 4530 Segédmunkás 4800 4896 50 50 3000 3640 Együtt 8000 0758 450 500 40000 450 Az adatk látszólag semmi furcsaságt sem mutatnak, aznban ha megvizsgáljuk az egyes munkáscsprtk havi átlagbérének és az együttes átlagbérének a váltzását, a következő adatkat kapjuk: a szakmunkásk átlags havi bérének váltzása: V V 4530 44000,03 03,0 %, a segédmunkásk átlags havi bérének váltzása: V V 3640 3000,0 0,0 %, az átlags havi bérek együttes váltzásai: V V 450 40000,038 03,8 %! Hgyan lehetséges az, hgy 3 %-s szakmunkás és %-s segédmunkás havi átlagbér emelkedés mellett a vállalati átlagbér mindkét munkáscsprténál jbban, 3,8 %-al növekedett? A kérdésre a standardizálásn alapuló indexek adnak választ, ui. a látszólags furcsaság nyilvánvaló ka az, hgy nem csak az egyes átlags havi bérek, hanem a munkásk létszáma, tehát a létszám összetétel aránya is megváltztt. 5

Számítsuk ki rendre a megismert indexeket! Főátlag index: I v Σ B V Σ B V : Σ B Σ B 350 4530 + 50 3640 350 + 50 : 300 44000 + 50 3000 300 + 50 03,8 % Részátlag index: Σ B V 350 4530 + 50 3640 I,076 0,8 % v Σ B V 350 44000 + 50 3000 Eszerint a vállalatnál az egyes munkáscsprtk havi átlags bére átlagsan,8 %-al növekedett. Összetétel index: I v Σ B V Σ B V,, : Σ B Σ B 350 44000 + 50 3000 350 + 50 : 300 44000 + 50 3000 300 + 50 0,0 % A létszámarányknak a magasabb havi átlagbérű szakmunkás csprt javára történő eltlódása önmagában,0 %-al növelte a munkásk együttes átlagbérét. A hárm index összefüggése: I I, I v,,, azaz,038,08,0 v v 6

III. Valószínűség, biznytalanság, elszlásk A gazdasági életben vizsgált jelenségek lehetnek: - determinisztikusak (azaz egy meghatárztt módn végbemenők), - sztchasztikusak (azaz több lehetséges kimenettel rendelkezők).. A valószínűség fgalma Néhány alapfgalm: Elemi esemény: egy végrehajttt kísérlet lehetséges eredménye! (Nem maga a kísérlet, hanem az eredmény!!) Eseménytér: ( Ω ) : a lehetséges eredmények halmaza. Műveletek eseményekkel: Legyen A és B két tetszőleges elemi esemény. Mivel A és B egy-egy halmaz, így igazak rájuk a halmazműveletek szabályai! Azaz A + B : azt jelenti, hgy a két esemény közül az egyik bekövetkezik. 6. példa: AB A : mind az A, mind a B esemény bekövetkezik. : azt jelenti, hgy A esemény nem következik be. (Kmplementer képzés). Ezért: A - B A B : azt jelenti, hgy A bekövetkezik, de B nem. A B : azt jelenti, hgy az A bekövetkezése maga után vnja a B bekövetkezését. AB O : azt jelenti, hgy A és B kizárja egymást. 300 kereső embert véletlenszerűen kiválasztunk, s feljegyezzük a következő táblázatt. Éves jövedelem 650 eft alatt 650-900 eft 900 eft felett között férfi 30 50 80 60 nő 50 50 40 40 80 00 0 300 7

Mi lvasható ki ebből a táblázatból? P (férfiak) 60 0, 533 40 P (nők) 0, 467 300 300 gyakriság/összes előfrdulás relatív gyakriság Ha a skaság elég nagy, vagy a próbát elég skszr ismételjük, a relatív gyakriság egy határértékhez tart, aminek a neve valószínűség. (Nagy számk törvénye!!!) Levnható következtetések: P (férfiak) + P (nők) P (férfiak) + P (nem férfiak) másként P (f) - P (nem férfi) Általában: "n" lehetséges kimenetet feltételezve, amiből az egyik biztsan bekövetkezik a P(), P(), P(3),... + P(n) eseményhalmazzal állunk szemben. Ez az ún. teljes eseményrendszer! (csak ezzel fglalkzunk!) A valószínűség a várt eredmény bekövetkezési gyakrisága elég sk próba esetén! Tehát: Várt érték valószínűség próbák száma Ennek alapján a definíciót tetszőleges E esemény valószínűségére kiterjesztve: P (E) E előfrdulásának gyakrisága az összes mért kimenet száma Néhány fnts megállapítás:.) O P (E)!.) P (Bizts esemény) 3.) Egymástól független, egymást kölcsönösen kizáró eseményeknél P () + P () +... + P (n) Pl. kckadbás! P () + P () +... + P (6) Valamelyik biztsan bejön! 8

4.) Egymást kölcsönösen ki nem záró eseményeknél! Egynél több tulajdnság együttes (vagy külön-külön) előfrdulása esetén találkzunk ezzel. Nézzük ezt a következő (7.) példán! 7. példa: Megkérdeztek 00 felnőttet, hgy érdekli-e őket a plitika. A válaszkat az alábbi táblázatba fglaltuk: 0 férfit érdekel 30 férfit nem érdekel 0 nőt érdekel 40 nőt nem érdekel Feladat: Határzzuk meg annak valószínűségét, hgy a 00-as mintából találmra választva lyan személyt kérdezünk meg aki vagy férfi, vagy nem érdekli a plitika! Ez a valószínűség: P (férfi vagy nem érdekli) P (férfi) + P (nem érdekli) - P (férfi és nem érdekli) 50 Mivel: P (férfi) 0, 5 00 70 P (nem érdekli) 0, 7 00 30 P (férfi és nem érdekli) 0, 3 00 így P (f + né) 0,5 + 0,7-0,3 0,9 5.) Függetlenül események: Ha két (vagy több) esemény hat egy jelenségre, de egymástól függetlenül, akkr együttes bekövetkezésük valószínűsége P (A és B) P(A) P(B) P(AB) Például: textilipar leállás! Okk: A: géptörlés! B: anyaghiány! 6.) Feltételes valószínűség 9

8. példa: 5 férfiból és 5 nőből álló csprtból kell egymás után személyt kiválasztanunk! Feladat: Mi a valószínűsége annak, hgy másdszrra nőt választunk, feltéve, hgy először férfit választttunk? Legyen A : férfit választttunk B : nőt választttunk A fenti kérdés frmális megfgalmazása: P (B/A)? Megldás: Ha a két esemény független lenne, akkr a P(AB) együttes bekövetkezési valószínűséget a P(AB) P(A) P(B) összefüggés adná meg. Írjuk mst P (B) helyére a P (B/A)-t, hiszen B esemény függ A eseménytől! Így mst P (AB) P (A) P (B/A), ahnnan P (B/A) P (AB) P (A) Nézzük mst a knkrét példát! Az első választáskr P (B) 0,5. Mivel ezután már csak 9 személy marad, így a másdik választás esetén, ha először A jött ki: 4 P (A) 9 5 és P (B) 9 5 5 P (AB) 0 9 5 90 Így: 5 P (B/A) 90 5 0 5 9! 30

. Valószínűség-fák A valószínűség-fák illusztrálják az eseménysrkat! 9. példa: Legyen két dlg együttes előfrdulását reprezentáló adatsrunk az alábbi.) Kimenetek: A, B vagy C; valószínűségük: 0,3; 0,; 0,5.) Kimenetek: X, Y ; : 0,6 és 0,4 Feladat: Rajzljuk fel a valószínűség-fát! Ha az események kölcsönösen kizáróak, akkr: P (A+B+C) és P (X+Y) A 0,3 B 0, C 0,5 X 0,6 Y 0,4 X 0,6 Y 0,4 X 0,6 Y 0,4 P(AX)0,3x0,60,8 P(AY)0,3x0,40, P(BX)0,x0,60, P(BY)0,x0,40,08 P(CX)0,5x0,60,30 P(CY)0,5x0,40,0,00 Alkalmazhatjuk ezt nyitó példánkra is! (Házi feladat!) 80 00 0 60 ( P (A), P (B), PCC), P (x), PLY) 300 300 300 300 40 300 ) 3

3. Várható érték és döntési fák 0. példa: Pénzérmét dbunk fel 00-szr! Ha fej, nyerünk 00 Ft-t, ha írás, vesztünk 00-at! Az elemi események legyenek: A: nyerünk, B: veszítünk. Mit várhatunk a játéktól!? Átlagsan az várható, hgy 50-szer nyerünk és 50-szer veszítünk, hiszen P(A) P(B) 0,5 Azaz a várható eredmény: 50 00-50 00-5.000 Ft Ez lesz ennek a srzatnak a várható értéke (VÉ) vagy várható pénzértéke (VPÉ). Ha ábrázljuk a játékt: 00 A (Bnylultabb esetekben így keletkezik a döntési fa!) B - 00. példa (órai bemutatással!): Új terméket fejlesztettünk ki. A tervezése.000 eft-ba került. A termék piacra dbásának költsége várhatóan.500 eft lesz, míg az esetleges piackutatás 500 eft-ba fg kerülni. A termék lehet nagyn sikeres, sikeres és sikertelen, aminek az eredménye 0.000, 4.000 és - 6.000 eft lehet. Az egyes variációkhz az alábbi táblázat szlgáltat tvábbi infrmációkat a (kckázatk) esélyek tekintetében! 3

Kimenet Nincs Piackutatás Sikeres piackutatás van Sikertelen piackutatás van Nagy siker 0, 0,6 0, (Közepes) siker 0,5 0, 0,3 Bukás 0,3 0, 0,6 Az előző termékeken szerzett tapasztalatk alapján 40 % esély van a sikeres piackutatásra! Feladat: Oldjuk meg a prblémát döntési fa segítségével! 4. Bayes tétele Amint azt krábban láttuk az egymástól nem független események bekövetkezési valószínűsége erősen függ a megelőző eseményektől. A tétel azt mndja ki, hgy egy skszr ismétlődő döntési flyamatban a már bekövetkezett események visszahatnak az a'priri valószínűségekre! Képletben megfgalmazva: P (A j /X) n P (X/A i j ) P (A P (X/A ) P (A ) Szemléltessük mindezt egy példán keresztül! i j ) i. példa: Egy vállalat alapanyag beszerzéséről az alábbi infrmációk állnak rendelkezésünkre. A szállítók 70 %-a pntsan betartja a szállítási szerződést, míg 30 %-uk nem. A két legfntsabb nyersanyag aránya az első csprtnál 50-50 %, míg a másdiknál 60-40 %. Szemléltesse mindezt egy valószínűségi-fa, melyben A: pnts, B: a hibás szállítást, X és Y pedig a két alapvető nyersanyagt reprezentálja. 33

A X 0,6 P(AX)0,8 0,3 Y 0,4 P(AY)0, B X 0,5 P(BX)0,35 0,7 Y 0,5 P(BY)0,35 Ha mst tudjuk (!), hgy a X következett be (azaz egy beérkező szállítmányban X jelű anyagt kaptunk), akkr ez vagy A vagy B eseményen keresztül történt. Próbáljuk meg megtalálni ezek valószínűségeit! Mivel mst a két lehetséges kmbináció (A és X, B és X) egymást kizáró lesz, ez a két valószínűség együttesen fgja kiadni X bekövetkezési valószínűségét, azaz P(X/A vagy B) P(A és X) + P(B és X) 0,8 + 0,35 0,53. Ha A következett be először, akkr P (X/A) 0,6 és P (A) 0,3, amiből P (AX) P (A) P (X/A) 0,8 vagyis megadható a frdíttt eset is, azaz: P (A/X) X valószínűségea - n keresztül X valószínűségebármely eseményen keresztül P (AX) P (AX) + P (BX) Nagyn fnts a srrend!! 34

P (X/A) P(A) P (A) P (X/A) + P (X/B) P (B) 0,8 0,53 0,3396 Ezt felhasználva: 0.35 P (B/X) 0,6604 0,53 Így megkülönböztethetővé válnak az előzetes (a priri) és az utólags (a' psteriri) valószínűségek. A esetében ezek: Pe 0,3 Pp 0,3396 (a kimenet visszahatásának köszönhetően). 5. Markv lánck (fakultatív rész!) A Markv lánc kmbinálja a valószínűségi elemeket a mátrixs megjelenítéssel. Feltételezi, hgy a valószínűségek hsszabb távn fixek maradnak, míg az a rendszer, amelyet mdelleznek úgy képes átalakulni egyik állaptból a másikba, hgy közben a rögzített értékeket tranziens valószínűségekként használja. Tekintsünk például az alábbi tranziens mátrixt: P E E 0,8 0,3 0, 0,7 E E Ez azt jelenti, hgy ha a rendszer az E -el jelölt állaptban van, akkr annak valószínűsége, hgy E -be megy át 0,. Ugyanúgy: ha a rendszer E állaptban van, akkr az E -be való átmenet valószínűsége 0,3, míg annak esélye, hgy E - ben marad 0,7. Ez a mátrix egy irányíttt gráffal is szemléltethető. Az időről-időre történő átalakuláskat szemlélteti az alábbi ábra: E 0,8 E 0,8 E 0, 0,3 0, 0,3 E 0,7 E 0,7 E Első periódus Másdik periódus 35

Annak a valószínűsége, hgy két perióduss befejeződése után az: E -ből induló rendszer E -ben lesz: P (E E E P (E E -ből kiindulva E -ben lesz: P (E E ) + E E ) 0,8 0,8 + 0, 0,3 0, 7 E P (E E -ből kiindulva E -ben lesz: P (E E ) + E E ) 0, 0,7 + 0,8 0, 0, 3 E P (E E -ből kiindulva E -ben lesz: P (E E ) + E E ) 0,7 0,3 + 0,3 0,8 0, 45 E P (E ) + E E ) 0,7 0,7 + 0,3 0, 0, 55 Így két periódus után a tranziens mátrix a következő lesz: P' E E E 0,7 0,45 E 0,3 0,55 Ez a mátrix pedig nem más, mint P mátrix négyzete, P. ' 4 Ugyanígy: négy periódus után P P. A rendszerállaptk a gyakrlatban skfélék lehetnek. Pl. - a vállalkzás prfitt termel ( E ) vagy veszteséges ( - a piackutatás sikeres ( E ) vagy sikertelen ( E ) stb. Eddig a valószínűség alapfgalmait tárgyaltuk. (Egy esemény valószínűségét, vagy események egyidejű előfrdulását, vagy egymásutánságát.) Az üzleti életben ezt bővíteni kell. A használats mdellek egy része a valószínűségi váltzókhz és elszláskhz kötődik. E ) 36

6. Valószínűségi váltzók, elszlásk Valószínűségi váltzóknak egy az elemi események Ω halmazán értelmezett függvényt nevezünk. A valószínűségi váltzó létének feltétele, hgy ugyanazt a kísérletet skszr hajtsuk végre! A valószínűségi váltzó a kísérlet (vizsgálat) jellegétől függően felvehet - diszkrét (egész szám, pl. kckadbás eredménye) és - flytns értékeket (csak a mérés pntssága szab határt, pl. tömegmérés, hsszmérés, stb.) A skszr ismételt kísérlet eredményei valamilyen elszlási képet mutatnak, s kijelölnek valamilyen halmazt. Jelöljük ezt a halmazt E-vel. Tekintsük ezután annak valószínűségét, hgy kísérletünk eredménye, azaz a valószínűségi váltzó e halmazba esik. P(v E). Ezen valószínűségek megadása aznban nehézkes, ezért célszerű egy lyan egyszerűbb, új fgalmat bevezetni, amelyből ezek a keresett valószínűségek mind származtathatók. Legyen x a számegyenes egy rögzített pntja és tekintsük az F (x) P (v x) valószínűségét. Ha mst x-et - -től + -ig futtatjuk (azaz elképzelünk bármilyen lehetséges eredményt!), akkr egy függvényt kapunk. Ezt az F (x) függvényt fgjuk a v valószínűségi váltzó elszlásfüggvényének nevezni: Az elszlásfüggvény tulajdnságai: a.) F (x) F (x ), ha x x b.) lim F (x) 0 és lim F (x) x - x c.) F (x) minden x pntban balról flytns. lim F (x n ) F(x) ha x x és lim x n x n - n Lássuk mst, hgy hgyan származtathatók a P (v E) valószínűségek ebből a függvényből. Mivel P(v < a) + P(a v < b) P(v < b), ha a < b 37

F(x) definíciójából következik, hgy P(a v < b) F(b) - F(a) Ezt ábrán bemutatva: F(b) F(x) P(a v < b) P(b) - P(a) F(a) a b x 7. Az elszlásk sztályzása. Diszkrét eset, ha v lehetséges értékei egy véges vagy végtelen x 3, x, x... x... srzatt alktnak. Ekkr az F (x) elszlás függvény helyett szívesebben használjuk az egyedi valószínűségeket, azaz p P(v x ), ahl k k k,, 3... ugyanis, ha v x k és x k E -nek, akkr bármely x k értékét veszi is fel v, az benne lesz az E halmazban, s így teljesül a P(v E) Σ P(v xk) egyenlőség! k. Flytns esetről van szó akkr, ha van lyan f (x) 0 függvény, hgy a számegyenes minden (a,b) intervalluma esetén F (b) - F(a) P (a v b) a Az f (x) függvényt a v valószínűségi váltzó sűrűségfüggvényének nevezzük. b f (x) dx 38

3. Kevert eset: ez ritkán frdul elő, tehát nem tárgyalják. 8. A valószínűségi váltzók jellemzői. A várható érték Az a szám, amelyhez a kísérletek egymás után végtelen skszr való végrehajtása srán nyert számértékek számtani átlaga knvergál. Jelölése: M (v) Diszkrét esetben: M (v) Flytns esetben: M (v) μ x i p i i x f (x) dx. Szórás A v - M (v) valószínűségi váltzó négyzetének várható értékéből vnt pzitív négyzetgyök. Jele: D (v) σ Definíció szerint tehát: D (v) M [(v - M(v)) ] 9. Fntsabb elszlásk 9.. Egyenletes elszlás Ilyen elszlást mutat a teljesen véletlenszerűen választtt természetes egész számk halmaza. Itt minden elemnek egyfrma az előfrdulási gyakrisága. Ha pl. 0-0 között választunk véletlenszerűen, akkr minden egyes számnak /0 esélye lesz a kiválasztásra. Itt nem állapítható meg egy pregnáns várható érték, hiszen minden elem egyfrmán valószínűen frdulhat elő. 9.. A binmiális elszlás Diszkrét elszlás. A váltzónak két alternatív ismérve létezik. Jelöljük az egyik lehetséges eredményt S-sel (pl. selejtes termék) és legyen ennek a valószínűsége: P (S) p. Ekkr az alternatív esemény valószínűsége (pl. jó termék): P (J) - p q. 39

Ha egy kísérlet eredménye, x valószínűségi váltzó binmiális elszlást követ, akkr annak valószínűsége, hgy 'n' kísérlet esetén (pl. az n elemű mintában) az x valószínűségi váltzó pntsan k értékét vegye fel (k 0,,..., n; pl. az n elemű mintában k selejtes legyen): P (x k) Elszlásfüggvénye: F (k) n! k n-k pk p q, ahl k 0,,...n (n - k)!k! k P (x k) i A binmiális elszlás jellemzői: n! (n - i)! i p q i! n-i Várható értéke: μ n p Szórása: σ n p q A binmiális elszlás jól közelíthető Pissn-elszlással (p 0, alatt, vagy p 0,9 felett, illetve, ha n >> k és n p állandó), vagy nrmális elszlással (ha p közel esik 0,5-höz, vagy n eléggé nagy, illetve np 5), amelyek számítástechnikailag skkal könnyebben kezelhetők. 3. példa Egy flyamats munkarendben dlgzó üzem alkatrészellátása egy adtt napn 80 %-s valószínűséggel zavartalan. Egy hetet vizsgálva mi annak a valószínűsége, hgy a) pntsan négy napn lesz zavartalan a termelés? b) Legalább öt napn lesz zavartalan a termelés? Megldás: A prbléma megldására a binmiális elszlást használjuk. Ennek megfelelően: q 0,8 és p 0, (a zavar valószínűsége), n 7 a) k 7-4 3, aminek felhasználásával 7! 3 4 p3 0, 0,8 0,753 4!3! 40

b) A legalább öt nap zavartalan termelés egyenértékű a legfeljebb két nap prblémás időszakkal, így k 0,,, amit felhasználva: 9.3. A Pissn-elszlás P(x ) p 0 + p + p 0,097 + 0,3670 + 0,753 0,850 Diszkrét elszlás. Ha egy x valószínűségi váltzó Pissn-elszlást követ, akkr annak valószínűsége, hgy x értéke pntsan k legyen (k 0,,,..., n): λ -λ P (x k) pk e, k 0,,, k! k..., n ahl λ : az elszlás paramétere, egy pzitív állandó, ami nem más, mint maga μ. A Pissn-elszlás elszlásfüggvénye: k- i λ -λ A Pissn-elszlás jellemzői: F(k) P(x k) i i! e Várható értéke: μ n p λ Szórása: σ λ A Pissn-elszlás λ > 5 esetén jól közelíthető a vele egyenlő várhatóértékű és szórású nrmális elszlással. 4. példa Egy frgalmas pstahivatalban egy év alatt 090 címzés nélküli levelet adtak fel. Mi annak a valószínűsége, hgy egy nap kettőnél több címzés nélküli levelet adnak fel? Megldás: A prbléma Pissn-elszlást mutat. Így: λ 090/365 3 címzetlen levél/nap, aminek felhasználásával: P ( x > ) ( p0 + p + p ) (0,0498 + 0,494 + 0,40) 0,5768 4

9.4. A nrmális elszlás A gyakrlat számára legfntsabb elszlástípus. Flytns elszlás! Az elszlás függvénye: σ Π F(x) σ Π x e Egy x valószínűségi váltzó nrmális elszlást követ, ha sűrűségfüggvénye: (x-μ) - σ f(x) e (x- μ) σ dx ahl μ az elszlás várható értéke, σ az elszlás szórása. A gyakrlati számításk egyszerűsítésére az ún. standard nrmális elszlással dlgzunk. Ennek paraméterei: μ 0 és σ, így sűrűségfüggvénye: φ (z) elszlásfüggvénye: Π e z - Φ (z) Π z e z - dz x - μ Látható, hgy a standardizálást a z való segítségével végeztük. σ A nrmális elszlás igen nagy gyakrlati jelentőségű. Az elméleti és gyakrlati munka srán igen skszr találkzunk nrmális vagy jó közelítéssel nrmális elszlással, amit a már említett közpnti határelszlás tétele indkl. Skszr használható a binmiális és Pissn-elszlásk közelítésére. 5. példa Autmata palacktöltő exprt knyakt tölt. A megrendelő kikötése szerint az 50 ml űrtartalm alatti palackk aránya legfeljebb 3 % lehet. 4

Egy N 0.000 db-s tétel paramétereit minta alapján meghatárzták: _ x 53,4 ml. A töltőgép σ 6 ml szórással tölti a kérdéses knyakfajtát. Egy palack knyak ára 800,- Ft Határzzuk meg: - az ptimális töltési szintet, - a jelenlegi tétel esetén az esetleges túltöltés frint értékét! Megldás: Tudjuk, hgy a töltési űrtartalm valószínűségi váltzóként fgható fel, és elszlása nrmális elszlás. A nrmális elszlású valószínűségi váltzóra érvényes, hgy P(v < x) Φ( z ), ahl x - μ z σ Az az infrmáció, hgy az 50 ml űrtartalm alatti palackk aránya legfeljebb 3 % lehet, azt jelenti, hgy adtt szórás mellett az 50 ml űrtartalm alatti palackk valószínűsége 0,03! Az 50-es érték pedig az adtt x érték! Írjuk ezt fel képlettel: P ( v < 50 ) 0,03 vagyis Φ(z) 0,03 Ebből kiszámítható az ptimális töltési érték, mert a x - μ z - ból kapjuk : μ x z σ σ Ha μ > x, akkr értéke negatív, így a Φ ( - z ) - Φ ( + z) egyenletet alkalmazva táblázatból (.sz. táblázat) kaphatjuk meg z értékét. Példánkban Φ(- z ) - 0,03 0,97, amihez a táblázatból kilvasva és helyes előjellel értelmezve a z -,88 tartzik. Ezt az értéket helyettesítsük a μ x - z б egyenletbe; így megkapjuk az ptimális töltési szintet, vagyis μ 50 +,88 6 5,3 ml. A jelenlegi tétel átlaga x 53,4 ml, a túltöltés tehát 53,4 5,3, ml palacknként. 43

Ez 0.000 palack esetén 0.000,.000 ml. Ez a mennyiség ptimális töltés esetén.000 : 5,3 45 db palacknak felel meg. A veszteség tehát á. 800,- Ft-tal számlva: A váltzók kmbinálása 45 800 340.000,- Ft Ha x és y két független, nrmális elszlású véletlen váltzó μ és μ értékkel és σ és σ varianciával, akkr várható X + Y - ra : és μ μ + μ és σ σ + σ X Y - ra : μ μ μ és σ σ + σ 9.5. A közpnti határelszlás tétele Ha egy statisztikai skaságból k-szr veszünk n elemű mintát, akkr a mintaátlagból képzett statisztikai skaság nrmális elszlást követ, és n növelésével határértékként közelíti az alapskaság μ várható értékét!! Minél nagybb a minta elemszáma, annál kisebb lesz a szórás. Ez azt jelenti, hgy a mintaátlagk a következő elsztást mutatják: σ x N( μ, ) n ahl n a minta elemszáma. ( σ a standard hiba!) n 50 elemû minta 0 elemû minta alapskaság μ 44

0. Knfidencia intervallumk A statisztikai vizsgálatk kényes pntja a mintavétel. Vizsgálatainkban fel fgjuk tételezni, hgy mintáink egyszerű véletlen mintavétellel keletkeztek. A mintavételezés mindig infrmációvesztéssel jár, azaz a mintából levnt következtetések biznytalansága nagybb, mintha ugyanazt a teljes alapskaságból vnnánk le. Ezért egy új fgalmat kell bevezetnünk, a statisztikai következtetés fgalmát. Hárm bázisfaktr fg hatni eredményeinkre. Ezek:. A minta nagysága. A váltzéknyság a releváns ppulációban 3. Az eredményben elérni kívánt megbízhatósági szint A minta elemszámainak növelésével csökken a biznytalanság, de nem egyenes arányban! Milyen biztnság az elfgadható? (90, 95, 99 %?) 0.. Következtetések az alapskaság átlagára, knfidencia intervallumk Jelölésünkben a következő elveket fgjuk követni: Alapskaság Minta átlag μ x variancia σ s elemszám N n Mivel az alapskaságból vett minták átlaga nem egyezik meg μ-vel, úgy ezeket valószínűségi váltzóként fgjuk fel, s a belőlük képzett skaság átlagával közelítjük μ-t. Ez aznban nem pnts; a közelítésnek van biznys hibája. Ez azt jelenti, hgy a μ egy lyan intervallumba esik, amelynek nagysága x ± mintavétel hibája. Ezzel gyakrlatilag egy intervallum becslést készítettünk n-re! Ha mintánk elég nagy ( n 30), akkr a mintaátlagk elszlása nrmális elsztást követ μ átlaggal és szórással. σ n 45

A nrmális elszlás táblázatából megállapítható, hgy a váltzók 95 %-a az átlag körüli ±,96σ intervallumba esik! Alkalmazva ezt esetünkre a következő frmulát kapjuk σ σ P ( x -,96 μ x +,96 ) 0, 95 n n Amint az látható, a minta elemszámának növelése szűkíti a becslési intervallumt! Újrarendezve fenti képletünket megkapjuk az alapskaság átlagára (μ) vnatkzó 95 %-s knfidencia intervallumt. μ x ±,96 σ n 6. példa: Egy bankfiókban találmra kiválasztttak 00 számlát és azt találták, hgy azk átlagban 5.300 frintról szóltak. Ha tudjuk, hgy a befizetések szórása 7.000 Ft, határzzuk meg az átlag 95 %-s knfidencia intervallumát. Megldás: n 00 x 5.300 Ft σ 7.000 Ft Ebből: 7000 μ 5.300 m,96 5.300 ± 0 vagy másként 3.98 < μ < 6.67.37 Mindössze 5 % a valószínűsége annak, hgy napi befizetési átlag ezen határkn kívül lesz! Ha σ nem ismert, közelítsük azt a minta szórásával (s)!!. Knfidencia intervallum (nagyszámú statisztikai adat feldlgzása révén) Az adatgyűjtés srán adataink rendezetlen frmában kerülnek birtkunkba. Az adatk nagyság szerinti srba rendezésével sem tudunk aznban lényegesen javítani a halmaz áttekinthetőségén. Az áttekinthetőséget az adatk sztályzásával tehetjük megfelelőbbé. Az adathalmaz valamennyi értékét magába fglaló teljes értékköz felsztását azns 46

nagyságú rész-értékközökre, és az adatknak ezen belüli csprtsítását sztályba srlásnak nevezzük. A rész értékközt sztályköznek nevezzük. Az sztályköz középső értékét (rendszerint számtani átlagát) sztályközépnek nevezzük. Az sztályközt határló két érték az alsó, illetve felső sztályhatár. Osztályba srlás esetén az sztályközön belüli közönség értékű adatkat egyetlen érték, az sztályközép jellemzi. Az sztályközök számának és az sztályhatárk megfelelő megállapításával adataink egyértelműen sztályba srlhatók és ezután megszámlálhatjuk, hgy egyegy sztályközbe hány adat esik. Gyakriságnak ( f i ) nevezzük az sztályközben lévő adatk számát. Az egyes sztályközökbe eső adatk gyakriságainak megállapításával tulajdnképpen azt is megkapjuk, hgy az egyes sztályközök között adathalmazunk hgyan szlik meg, vagyis ismerjük adathalmazunk gyakrisági elszlását. Lehetséges, hgy az egyes sztályközök gyakriságának aránya érdekel bennünket. Ekkr a relatív gyakriságkat ( g i ) kell megállapítanunk. A gyakriságt az adathalmaz elemszámával (n) sztva kapjuk a relatív gyakriságt. Gyakran kíváncsiak vagyunk arra, hgy egy adtt értéknél kisebb érték milyen gyakrisággal frdul elő. A kumulált gyakriságk előállításával kapunk erre választ. A kumulálást úgy végezzük, hgy az eredeti gyakriságkat rendre halmzva összeadjuk. Megemlítjük, hgy kevés adatt nem érdemes sztályba srlni. Általában 5-0 adatnál kevesebbet nem srlunk sztályba. Célszerűen 0-5 sztályközt érdemes kialakítani. A statisztikai jellemzőket flytns elszlás esetén az alábbi módn számítjuk: A számtani átlag ( x ): ahl x A + f i n x, i h (vagy x Σ fixi ) n A a legnagybb gyakriságú sztály sztályközepe,, xi A xi, h x az egyes sztályk sztályközepe, i 47

h az sztályköz szélessége, f i az sztályköz gyakrisága, n a feldlgztt adatk száma. A terjedelem (R): R x max x min A szórás (s):, Σf x Σ, f x i i i i s h vagy n n A relatív szórás (v): s v x s Σfi xi n [ Σ(f xi) ] i n (n -) A várható érték ( a számtani átlag) és a szórás ismeretében a nrmális elszlás táblázatainak alkalmazásával határzhatjuk meg a kérdéses jellemzőket. Diszkrét adatk esetén hasnló elvek alapján dlgzzuk fel az adatkat, és a megfelelő diszkrét elszlás táblázats adataiból meghatárzzuk a kérdéses jellemzőket. 7. példa Nézzük mindezt egy példán! A családk heti jövedelmét 50 elemű mintán vizsgálva az alábbi adatkat kaptuk: Heti jövedelem (eft) Gyakriság (fi) x i f i xi f i x i 0 és 0 között 0 5 50.50 0 és 30 között 8 5 700 7.500 30 és 40 között 4 35 470 5.450 40 és 60 között 50 50.500 5.000 60 és 00 között 0 80.600 8.000 6.40 34.00 x Σf x n 640 50 i i 4,8 eft 48

Σ fixi ( Σ fixi ) 34.00 640 s 8,3 eft n - n (n -) 49 50 49 azaz 8,3 μ 4,8 ±,96 4,8 ±,9 eft 50. A minta nagysága A minta nagysága (ahgy az az előzőekből látszik) jelentősen hat a knfidencia intervallum szélességére. A túl széles intervallum nem közöl semmi érdemlegeset. A felhasználók pnts(abb) infrmációkat igényelnek. Induljunk ki az összefüggésből. μ x ± z s n A pntsságt meghatárzó rész (jelöljük e-vel): s e z n n-re átrendezve a frmulát kapjuk:_ (e errr) z s n e Így a hiba ismeretében (adtt knfidencia szint mellett (z)) meghatárzható a minta elemszáma. 8. példa Egy nagy csmag számlából hányat kell kiemelnünk ahhz, hgy ± 500 Ft határk között 95 %-s knfidencia intervallumt kapjunk, ha a számlák értékének szórása 6.000,- Ft? Megldás: z,96, e 500 Ft, s 6.000,- Ft, így,96 6000 n 500 553,9 554 db Tehát véletlen választással 554 számlát kell ellenőrizni! 49

0.. Következtetések a skaság százaléks megszlására. Knfidencia intervallumk Úgy, ahgy x -t használunk μ becslésére, ugyanúgy használhatjuk a minta p százalékarányát az alapskaság Π százalékarányának a becslésére. A minták százalékarányai mintáról mintára váltzunk, de elég nagy minták esetén ugyanúgy követik a Közpnti Határelszlás Tételét, mint a mintaátlagk. A kaptt nrmális elszlás átlaga Π lesz, standard hibája pedig Π ( 00 Π) n A százalékarányra vnatkzó 95 %-s knfidencia intervallum: Π p ±,96 Π (00 - Π) n () A valószínűség függvény mst a következő lesz: P ( p,96 Π (00 Π) n Π (00 - Π) Π p +,96 0,95) () n Mivel az () egyenlet jbb ldalán szereplő Π nem ismert, úgy azt a mintákból nyerhető p-vel kell helyettesíteni! Így: 9. példa: Π p ±,96 p (00 - p) n Társaságunk havi számláiból véletlenszerűen kiválasztunk 00-at és -ről megállapítjuk, hgy pntatlan. Feladat: Határzzuk meg a pntatlan számlák arányának 95 %-s knfidencia intervallumát! Megldás: A helytelen számlák aránya: p 0, % 00 Így: ( 00 ) Π ±,96 ± 6,4 % 00 50

Másként: 5,6 % < Π < 8,4 %. A minta méretét itt is az átlagknál megismert módszerhez hasnlóan határzzuk meg. A hiba (errr, e): e p ( 00 p) z, ahnnan n n z e p ( 00 - p) 30. példa: Előző példánknál maradva arra keressük a választ, hgy n milyen értékénél esik rssz számlák átlaga a p körüli ± 3 % s intervallumba 95 %-s valószínűséggel.,96 n 3 88 450,75 45db Ha p-re nincs semmiféle előzetes infrmációnk, akkr mint legrsszabb még elfgadható arányt, 50 %-t adjunk meg! 0.3. Véges alapskaságk prblémája Ha az alapskaság maga is kicsi (elemszáma 0-30), akkr a belőle vett minta becslésre történő felhasználásakr alkalmazni kell egy krrekciós faktrt, melynek értéke: n, ahl n: minta elemszáma, N: alapskaság elemszáma N Ilyenkr a 95 %-s knfidencia intervallum: μ x +,96 n N s N 5

0.4. Knfidencia intervallum a mediánra A számíttt középérték sk esetben nem megfelelő az átlag kifejezésére. Ilyen esetben célszerűbb a mediánt használni. Mivel aznban a mediánt az adatk rangsrlásával, majd a középen álló elem kiválasztásával kapjuk, a valószínűség elszlás diszkrét lesz (a medián knfidencia intervallumát közvetlenül meghatárzhatnánk a binmiális elszlással!. Mivel aznban nagy ( n > 30 ) elemszám esetén a nrmális elszlás is jó közelítést ad, így ezt fgjuk használni!) 3. példa Tekintsük az alábbi értékeket: x, x, x3... x n, ahl x i+ xi A medián (n+)/-dik helyen áll a srban. A knfidencia intervallum határai mst a következők lesznek: n n FH +,96 helyen álló elem! n n AH,96 +, ahl n a minta elemszáma. Egy egyetemi évflyamn 36 hallgató vizsgajegyét gyűjtöttük ki Statisztikából és az alábbi adatsrt kaptuk: x f 7 3 3 4 9 5 7 Feladat: Határzzuk meg a 95 %-s knfidencia intervallumt! Megldás: 36 36 FH +,96 8 + 3 4. 4 36 36 AH,96 + 8 3 + 3. 3 Azaz 3 medián 4 95 % valószínűséggel! 5

A mintából meghatárzható medián a 8-9. elem átlaga 3. Ez pntbecslés a mediánra. Ha az intervallumt adjuk meg, akkr intervallumbecslésről van szó! 0.5. Egyldalú knfidencia intervallumk: Sk lyan vizsgálat lehet, ahl csak az a kérdés, hgy az alapskaság adtt paramétere egy előre megadtt határérték alá vagy fölé esik-e! A standard nrmális elszlás elszlásfüggvényén bemutatva ezt Φ(z) 0,5 Φ(z) - Φ(-z) - z z 0 z Φ ( z ) megmutatja, hgy mi a valószínűsége annak, hgy z Ezt kivnva -ből annak valószínűségét kapjuk, hgy z z. Ha a 95 %-s knfidencia intervallumt keressük, akkr z..) átlagérték,645 standard hiba lesz a becslés, ha felette és.) átlagérték +,645 standard hiba lesz a becslés, ha alatt lévő intervallumt határzunk meg.. Egyldalú becslés az átlagra Használva az előzőekben már megismert jelöléseket: μ > x és μ < x s,645 95 %-s knfidencia intervallum esetén (alsó határ) n s +,645 95 %-s knfidencia intervallum esetén (felső határ) n 53

3. példa 5 l-es mtrlaj kannák töltésénél véletlenszerűen kiválasztttak 0 kannát és megmérték térfgatukat. Az átlag 5, lnek adódtt, míg a szórás 0,5 l vlt. Feladat: Knstruáljunk egy alkalmas 95 %-s knfidencia intervallumt! Megldás: Az alsó határ, felhasználva a 95 %-s egyldalú knfidencia intervallum képletét: 0,5 μ > 5,,645 5, 0 liter! 0 Kétldalú becslésnél: 0,5 μ 5, ±,96 5, 0 ± 0, l 4,99 μ < 5,l Ebben az esetben az egyldalú becslés precízebben határzta meg az aktuális állaptt!. Egyldalú becslés a százaléks megszlásra Az előzőekhez mindenben hasnló gndlatmenet szerint kell eljárni. Így az alsó határ: Π> p -,645 p (00 - p) n 95 %-ban biztsak lehetünk, hgy a ppuláció valóságs százaléks megszlása a számíttt érték fölött lesz. Ez különösen a marketingben fnts, ahl így megadható pl. a 95 %-s valószínűséggel elérhető minimális piaci részesedés %-s értéke! Hasnlóképpen egy felső határ alá esés mértékét a Π< frmulával lehet megadni! p +,645 p (00 - p) n 54

33. példa Egy szállítmányból 40 db-t véletlenszerűen kiválasztanak és 5-öt selejtesnek találnak. Feladat: Készítsünk egy 95 %-s knfidencia intervallumt. Megldás: 5 n 40, k 5 p,5 % 40 Elkészíthetjük a felső határra vnatkzó knfidencia intervallumt, amely így,5 87,5 Π<,5 % +,645 x, % 40 (A kétldalú becslés esetén,5 ± 0,5. Itt is az egyldalú becslés adja a kedvezőbb eredményt.) 0.6. Független minták különbsége A 95 %-s knfidencia intervallumk: Δμ μ μ x x s ±,96 + n s n Ez az eljárás ugyanazn alapskaság különböző mintái közötti különbözőséget határzza meg. Hasnlóképpen: p ( 00 p) p (00 p) ΔΠ Π Π p p ±,96 + n n Ez a vizsgálat a jelenségek (időbeli) váltzásának nymnkövetésére alkalmas. 34. példa Egy termék értékesítésének vizsgálata srán kiválasztttak 0 lyan családt, aki biztsan lvassa a hirdetést és úgy találták, hgy közülük 8 vette meg a terméket. A hirdetést nem lvasó 50 családból 6 vásárlt a termékből. Feladat: Alkssuk meg a vásárlói viselkedések különbözőségét bemutató 95 %- s knfidencia intervallumt! 55

Megldás: n 0 n 50 8 6 00 5 % p 00 4 % 0 50 p Innen: Π Π 5 4 ±,96 5 85 4 96 + 0 50 ± 7, % azaz: 3,9 % < Π 8, % Mivel a tartmány sem negatív értéket sem zérót nem tartalmaz, így a hirdetés szignifikánsan beflyáslta a vásárlói magatartást. 0.7. A t-elszlás Az eddigiekben vizsgálatainkban feltételeztük, hgy vagy az alapskaság szórása (σ) ismert, vagy pedig a minta elég nagy elemszámú ahhz, hgy szórása (s) helyettesítse az alapskaság szórását. Ha ezek a feltételek nem teljesülnek, nem jgs feltételeznünk, hgy a minta (szórása) nrmális elszlást követ. Ez esetben is ki tudjuk ugyan számítani a szórást, de az magasabb lesz, mint nrmál esetben lett vlna! Mivel kis elemszámú mintáknál nem mdellezhető jól az alapskaság variabilitása, azaz egy-egy váltzás hatása nagybb, mint az alapskaságban, úgy a minta szórása nem közelíti jól az alapskaság szórását. A knfidencia intervallum meghatárzása a μ x σ ± z n összefüggésével csak akkr lehetséges, ha σ ismert! Ha csak a minta szórása (s) ismert, akkr a s μ x ± t n összefüggést kell alkalmazni, ahl t a t-elszlásból kilvasható kritikus érték! A t-elszlás ugyanlyan szimmetrikus elszlás, mint a nrmális elszlás, de annál szélesebb! 56

Az elszlás szélessége és magassága a szabadsági fktól függ! A szabadsági fk (ν nű) a minta elemszámától függ és definíciószerűen ν n - (ahl n minta elemszáma). Ha ν alacsny, a t-elszlás széles és laps. Ha ν növekszik, az elszlás keskenyebbé és magasabbá válik, s közelít a nrmális elszláshz. A t-elszlás használata táblázats frmában történik. 57

IV. Statisztikai próbák. Szignifikancia tesztek A szignifikancia tesztek a skaság paraméterére vnatkzó állításk igazlására szlgálnak - a minta alapján. Ez igaz a knfidencia intervallumkra is, de más hangsúllyal. A hangsúly itt annak megállapításán van, hgy vajn támgatja-e, vagy knzisztens-e a minta az alapskasággal. Így a szignifikancia teszt eredménye általában két szó lesz: igen vagy nem. (Aszerint, hgy a minta alátámasztja vagy sem a feltételezést!) Mivel mi a mintát vizsgáljuk, s nem az alapskaságt, így kaptt eredményeinket egy adtt szinten értelmezzük (pl. 5 % vagy %). Ezek a rssz knklúzió levnásának esélyét rögzítik... Knfidencia intervallumra épülő szignifikancia tesztek A szignifikancia teszt a feltevés elutasítására vagy elfgadására vnatkzik. A feltevéseket hiptézisnek fgjuk nevezni. Ha ezek közül van egy lyan, amelyet különösen fnts tesztelnünk, akkr ezt fgjuk null-hiptézisnek nevezni. A null-jelző a váltzatlanságt, a különbségmentességet sugallja. A flyamat: felállítjuk a null-hiptézist, majd elfgadjuk vagy elvetjük azt a statisztikai nyilvánvalóság alapján. Ha a null-hiptézis a knfidencia intervallumba esik, elfgadjuk, egyébként elvetjük. 35. példa: Véletlenszerűen kiválaszttt 80 háztartásban átlagsan 40 Ft-t költöttek havnta szappan vásárlására. A szórás 5 Ft vlt. Tételezzük fel, hgy a minta elég nagy, ezért nrmális elszlásúnak tekinthető. A vizsgálatt egy áruház rendelte meg azzal a céllal, hgy ellenőrizze azn feltevését, hgy a családk havnta 50 Ft-t költenek szappanra Feladat: vizsgáljuk meg, hgy feltételezésünk igaz-e 95 %-s knfidencia intervallum esetén. Megldás: A null-hiptézis: H : μ 50 Ft. A knfidencia intervallum: 5 μ 40 ±,96 40 ± 3,3 Ft 80 vagy másként 36,70 μ 43,30 Ft 58

Mivel a megállapíttt knfidencia intervallum (amely a lehetséges hiptéziseket tartalmazza!) a 50 Ft-t nem tartalmazza, így a hiptézist el kell utasítanunk! elfgadható H el nem fgadható H μ 36,70 43,30 el nem fgadható H.. Hiptézis-vizsgálat egyszeri mintavétel alapján A hiptézis-vizsgálat egy alternatív megnevezése a szignifikancia vizsgálatnak. Ez a megnevezés kihangsúlyzza, hgy az alapskaságra vnatkzóan, hiptézisként megfgalmaztt feltételezést vizsgálunk. Ilyenkr mindig két feltételezéssel van dlgunk:. az egyik a feltételezett állaptra, (null-hiptézis, stb.). a másik az alternatív állaptra vnatkzik. Leírva ezt:. H : μ μ vagy H : Π Π. Az alternatív hiptézis H tagadása, azaz H A : μ μ vagy H A : Π Π A teszt srán H igaz vltából indulunk ki, azt akarjuk igazlni. A legtöbb tesztet 5 %-s szignifikancia szint mellett végezzük, ahl z ±,96. (Azaz 5 % a valószínűsége, hgy rssz állítást fgadunk el!) Eszerint: nem utasítjuk el H-t elutasítjuk H-t μ -,96,96 elutasítjuk H-t 59

Az eljárás lépései:. Felállítjuk a kiinduló hiptézist. Pl. μ μ vagy Π Π. Rögzítjük a szignifikancia szintet. Pl. 5 % 3. Rögzítjük a kritikus értékeket. Pl. z ±, 96 4. Kiszámítjuk a tényleges z-t. Pl. z,5 5. Összehasnlítjuk z-t a kritikus értékekkel. Pl.,5 >.96 6. Levnjuk a következtetést. Pl. elvetjük a null-hiptézist 7. Megfgalmazzuk a tényleges helyzetet. Pl. a minta nem támasztja alá azt az eredeti feltételezést, hgy az átlag egy megállapíttt érték vlt.. Teszt statisztika az alapskaság átlagára Az előző fejezet 4. pntjában a z érték meghatárzása szerepel. Adtt minta esetén ez a _ x μ z összefüggéssel történik σ n Ha σ nem ismert, de a minta szórása igen, akkr z x μ s n Mst előző példánkn kövessük végig az eljárást:.) A null-hiptézis az a feltételezés, miszerint H : μ 50 Ft H A : μ.) A szignifikancia szint 5 %. 50 Ft 3.) A kritikus z értékek: +,96 és -,96. 60

4.) A valóságs z érték: z 40-50 5 80 5.) z < z k (-5,96 < -,96 <,96) 5,96 6.) 5 %-s szignifikancia szinten elvetjük a null-hiptézist. 7.) A minta nem támasztja alá a menedzser azn vélekedését, hgy a háztartásk havi 50 Ft-t költenek szappanra. A tényleges költség szignifikánsan különbözik a 50 Ft-s feltételezésből. (Vigyázat! A hiptézis-vizsgálatkbeli eltérésnek nem az értéke, hanem a ténye szignifikáns. Ez tehát statisztikai és nem üzleti minősítés!). Teszt az alapskaság százalékarányára z Π p - Π (00 Π n ) 36. példa A revizr a cég számlái átvizsgálása srán úgy találta, hgy azk 0 %-a hibás. Ellenőriztük ezt egy 00 elemű mintán, amelyben hibásat találtunk. Feladat: Vizsgáljuk meg, hgy 5 %-s szignifikancia szinten igaz-e a revizr állítása. Megldás:.) H : Π 0 % : Π H 0 %.) Szignifikancia szint 5 %. 3.) A kritikus értékek: ±, 96 00 4.) A minta százalékaránya: p 00 %, így -0 z 0,67 0 (00-0) 00 6

5.) -,96 < z <,96, hiszen z 0,67 6.) Nem utasíthatjuk el a revizr feltételezését. 7.) A mintából nyilvánvaló, hgy a revizr állítása a mintával knzisztens. Figyeljünk fel a 6. pnt megfgalmazására! Nem utasítjuk el a revizr megfigyelését, de nem is fgadjuk el azt! Az elfgadás krlátja a biznysság hiánya, hiszen nem dlgztuk fel az egész alapskaságt!.3. Egyldalú szignifikancia tesztek Előző tesztjeinkben azt vizsgáltuk, hgy az alapskaság paramétere egyenlő-e egy adtt értékkel, avagy sem. Skszr frdul elő aznban az a helyzet is, amikr arra a kérdésre kell válaszlnunk, hgy az alapskaság paramétere meghalad-e (vagy alatta marad-e) egy adtt értéket (értéknek). Az egyldalú szignifikancia tesztek pntsan erre valók! A null-hiptézis ez esetben az lesz, hgy a két érték egyenlő, azaz pl. : H : Π Π, míg az alternatív hiptézis szétválik H : Π < Π vagy Π > Π frmára! A Ilyenkr az 5 %-s szignifikancia szinthez tartzó z érték ±,645. Azaz a.) b.) z -,645, ha H : Π Π és H A : Π < Π z,645, ha H : Π Π és H A : Π > Π A kalkulált z érték értelmezése mst csupán azn döntés kérdése, hgy az a nrmális elszlás két szegmense közül melyikbe esik!. Egyldalú teszt a skaság átlagára Itt a hiptézist a skaság átlaga vagy egy kívánt érték jelenti. Nézzük a következő példát. 6

37. példa Elemek gyártása srán feltételezzük, hgy a becsült élettartam 99 óra. Új töltési eljárásra áttérve a gyártó vizsgálni akarja az élettartam váltzást. 00 elemű mintán veszünk, s az átlags élettartamra 300 óra adódik, míg a szórás 8 óra lesz. Feladat: Végezzük el a tesztet 5 %-s szignifikancia szint mellett. Megldás:.) H : μ 99 H : μ 99.) A szignifikancia szint 5 %. 3.) A kritikus érték +,645. 4.) 300-99 z,77 8 00 5.) A számíttt érték nagybb, mint a kritikus! (,77 >,645) 6.) Ezért el kell vetnünk a null-hiptézist! (Megjegyezzük, hgy kétldalú vizsgálatnál ez éppen frdítva lett vlna!) 7.) A mintából kaptt eredmény alátámasztja azt a feltételezést, hgy a telepek élettartama szignifikánsan növekedett! Természetesen hiba lenne túlértékelni ezt az eredményt, s erre alapzva indítani egy reklámkampányt. A szignifikáns viselkedés ugyanis csak a mintára igaz biztsan - az alapskaságra nem! Ezért fnts különbséget tenni a statisztikai szignifikancia és a fntsság között! 38. példa. Egyldalú teszt a százaléks megszlásra A módszer ugyanaz, mint ami az előbb vlt. Egy társaság azt állítja, hgy a Rögös út Kft. által szállíttt alkatrészek 4 %-a selejtes. Az állítás ellenőrzésére 500 elemű mintát vettek, amelyben elem vlt selejtes. Feladat: 5 %-s szignifikancia szint mellett vizsgáljuk meg társaságunk állításának helyes vagy helytelen vltát! 63

Megldás:.) H : Π 4 % H A : Π < 4 %.) Szignifikancia szint 5 %. 3.) Kritikus z érték: -,645 4.) Minta százalékaránya 00,4 % 500 z,4-4 4 (00-4) 500,86 5.) -,86 < -,645 6.) Elutasítjuk H -t. 7.) A minta elemzése azt mutatja, hgy hibás az az állításunk, miszerint a Rögös út Kft. alkatrészeinek 4 %-a selejtes. 3. Az eladó és a vevő kckázata Az egyldali tesztek kitűnően alkalmazhatók ennek vizsgálatára. Világítsuk meg ezt egy példán. Legyen a vizsgált bjektum egy csmag írógéppapír! Tegyük fel, hgy a névleges tartalma 500 lap! Az eladó azt szeretné, ha a csmagba nem kerülne több 500 lapnál, míg a vevő azt szeretné, ha a csmagban nem lenne kevesebb 500 lapnál. Az egyldali tesztben tehát a két fél hiptézise a következő módn alakul: Gyártó: Vevő: H : μ μ, H A : μ > μ H : μ μ, H A : μ < μ 4. A hibák fajtái Mivel a tesztjeink minta alapján adnak infrmációt az alapskaságról, így az eredmények megbízhatósága shasem 00 %-s. Ez azt jelenti, hgy döntésünkben kétféle hibát is elkövethetünk: I. fajú hiba: igaz hiptézist elutasítunk II. fajú hiba: hamis hiptézist elfgadunk 95 %-s megbízhatósági szint esetén az elsőfajú hiba elkövetésére van 5 % esélyünk! 64

A hiptézis tesztek lehetséges eredményei: Elfgadjuk H -t Elutasítjuk H -t Ha Ha H igaz Krrekt döntés I. fajú hiba H hamis II. fajú hiba Krrekt döntés A másdfajú hiba nagysága a teszt elvégzése előtt nem állapítható meg. Ezen hiba annál valószínűbb, minél közelebb esik a számíttt z érték a megállapíttt határhz! Ha a minta elemszáma nem éri el a 30-at, úgy a nrmális elszlás helyett ajánlats a t-elszlással számlni!. Nem paraméteres próbák Az előző fejezetben lyan teszteket tekintettünk át, ahl egy egyedi paramétert kiemeltünk a mintából, majd összehasnlítttuk azt az alapskaság egy ismert (vagy feltételezett) értékével! Itt tehát ismert paraméterekkel dlgztunk, ún. paraméteres próbákat hajtttunk végre. Sk lyan eset van aznban, amikr a paraméterek nem számíthatók ki, ezért szükség van másféle megldáskra is. Ebben a fejezetben ezekből válgattunk néhányat. A paraméteres teszteknél teljesülni kell az alábbi feltételeknek:.) Fel kell állítani a paraméternek megfelelő null-hiptézist..) Olyan mérési szintet kell választani, hgy azn a különbségek érvényesek legyenek. 3.) A statisztikának valamely ismert elszlást kell követnie. Nem mindig tudunk aznban értelmes paramétert definiálni! (Például mi az, hgy átlags szemszín?) Hasnlóan, nem mindig lehet értelmet adni az értékekben megjelenő különbségeknek. Pl. ha az üdítőitalkat az áruk vagy az ízük alapján rangsrljuk. Ha a fent felsrlt feltételek nem állnak fenn, akkr ún. nem paraméteres teszteket kell alkalmaznunk! Jegyezzük meg aznban, hgy vannak esetek, amikr egyszerűen nincs alkalmas vizsgálati módszer. (Az is lehet, hgy a statisztikailag szignifikáns jelenségnek nincs gyakrlati fntssága!) A nem paraméteres teszt is hiptézis próba. Általában a mintaadatk nem egy valamely paraméterét tekinti, hanem általában tekint az elszlásra, s azt igyekszik valamilyen ismert vagy várt értékkel összehasnlítani. 65

.. A khi-négyzet ( χ ) próba Ez a nem paraméteres próba hasnlít leginkább az eddig tárgyalt tesztjeinkhez. Akárcsak előzőleg, mst is felállítunk egy null-hiptézist, kiszámítjuk a statisztikát és összehasnlítjuk ezt egy táblázatból vett értékkel, s eldöntjük, hgy elutasítjuk-e a null-hiptézist vagy sem! Két alkalmazást fgunk vizsgálni..) Kérdőíves felmérési adatkat vizsgálunk, és kapcslatt keresünk egy kérdéspárra adtt válaszk között..) A másdik esetben azt vizsgáljuk, hgy egy adatsrunk követ-e valamilyen ismert elszlást.. Összefüggés vizsgálatk A prbléma megvilágítására lássunk egy példát! Tételezzük fel, hgy egy kérdőíves vizsgálatban két kérdést tettünk fel, s az alábbi válaszkat kaptuk!.) Milyen lakásban lakik Ön? Válaszk: Családi házban: 50 Tömblakásban: 00 Albérletben: 45 Egyéb: 5 300.) Milyen gyakran jár Ön sprtlni? Válaszk: Havnta egyszer: 40 Hetente egyszer: 00 Hetente kétszer: 50 Még sűrűbben: 0 66 300 A két szimpla statisztika azt mutatja meg, hgy a megkérdezettek 50 %-a családi házban lakik, míg közel /3-uk hetente egyszer sprtl! Ha aznban a két kérdést össze akarjuk kapcslni, s például azt keressük, hgy a családi házban lakók közül mennyien sprtlnak hetente kétszer, akkr egy ún. KERESZT-TÁBLÁT kell készítenünk.

Példánkban ez legyen a következő: M-táblázat Sprtlás Lakás típusa Összesen gyakrisága Családi ház Tömblakás Albérlet Egyéb Havnta egyszer 30 5 4 40 Hetente egyszer 0 80 8 00 Hetente kétszer 5 0 33 50 Többször 5 5 0 0 0 Összesen: 50 00 45 5 300 Az esetek nagy részében ezen táblázat elkészítése igen munkaigényes, jbb ezt számítógépre bízni. Mst már könnyebbnek tűnik összefüggést keresni a két kérdésre adtt válaszk között, de mivel különböző számú ember lakik a különféle lakástípuskban, így nem nyilvánvaló, hgy sprtlási szkásaik függhetnek a lakástípusuktól. A khi-négyzet próba lehetővé teszi a két kérdésre adtt válaszk közötti statisztikai kapcslat megtalálását! A teszt mst is ugyanabból a hét lépésből áll, mint amit krábban már megismertünk.. lépés: Felállítjuk a hiptéziseket. H : H : Nincs összefüggés a két kérdésre adtt válaszk között. Van összefüggés a két kérdésre adtt válaszk között.. lépés: Állapítsuk meg a szignifikancia szintet. Akárcsak a paraméteres próbáknál, legyez ez 5 %. 3. lépés: Állapítsuk meg a kritikus értéket. Ehhez először határzzuk meg a szabadsági fkt (ν) az alábbi képlet alapján: ν (s-) (v-), ahl s srk száma v szlpk száma Ezután keressük ki a táblázatból a kritikus értéket. Ez itt: χ 6,9! krit 4. lépés: A teszt-statisztika kiszámítása. 67

A χ statisztika az alábbi frmulával számítható: χ (M - V) V ahl: M a megfigyelt cella gyakriság (aktuális válaszk) V a várt cella gyakriság (ha a null-hiptézis igaz!) Tekintsük a táblázat első celláját, s végezzünk el néhány egyszerű számítást (lásd krábbiak!)! 50 a családi házban élők aránya 0,5 300 40 A havnta egyszer sprtlók aránya 0,33 300 Így annak valószínűsége, hgy valaki családi házban él és havnta egyszer sprtl: 0,5 0,33 0,0665 Mivel a mintában 300 ember van, így azk számíttt értéke, akik mindkét feltevésnek megfelelnek: 0,0665 300 0 fő. (Megjegyezzük, hgy a megfigyelt érték 30 fő vlt!) Ebből levezethető a számítási eljárás, azaz számíttt gyakriság sr összeg szlp összeg / főösszeg Ezt az eljárást kell ezután minden cellára leflytatni. Esetünkben ez az alábbi táblázatt eredményezi V-táblázat Családi ház Tömblakás Albérlet Egyéb Összesen Havi egyszer 0 3,3 6 0,7 40 Heti egyszer 00 66,7 30 3,3 00 Heti kétszer 5 6,7 7,5 0,8 50 Többször 5 3,3,5 0, 0 Összesen: 50 00 45 5 300 Ezután az M és V táblázatk minden adat-párjával kiszámítjuk az ér- tékeket, majd ezeket szummázva kapjuk a χ - számíttt értékét. Példánkban χ sz. 40,875! (M - V) V 68

5. lépés: Összehasnlítás Hasnlítsuk össze a számíttt χ értékét a táblázatból vett kritikus értékkel! 40,875 > 6,9 6. lépés: Következtetések levnása Mivel négyzetről van szó, így tudjuk, hgy 0-nál kisebb érték nem jöhet ki. Ha minden elvárt érték megegyezik a megfigyelt értékkel, akkr a χ 0. Ha az értékek között különbség van, annak az az ka, hgy vagy hibás a minta, vagy kapcslat van a válaszk között. Minél nagybb a különbség, annál valószínűbb a kapcslat. Ezért, ha a számíttt χ értéke nagybb, mint a kritikus érték, akkr elutasítjuk a null-hiptézist, míg ha kisebb, akkr nem vetjük el azt! Példánkban elvetjük a null-hiptézist! 7. lépés: Megfgalmazzuk a knklúziókat. Úgy tűnik, hgy kapcslat van az emberek lakáskörülményei és sprtlási szkásai között! Kiegészítés Jóllehet a teszt alapmódszere krrekt, mégis van egy prbléma. Az egyik alapfeltétel ugyanis az, hgy a várt gyakriságk mindegyikének 5 felett kell lennie! Ez pedig példánkban nem igaz! A megldás a kategóriák összevnása! Knkrét példánkban ez azt jelenti, hgy össze kell vnnunk egyrészt az albérlet és egyéb, másrészt a hetente kétszer vagy gyakrabban kategóriákat. Az új táblázatunk mst az alábbi lesz: Megfigyelt gyakriságk: Családi ház Tömblakás Egyéb Havnta egyszer 30 5 5 Hetente egyszer 0 80 0 Gyakrabban 0 5 35 69

Számíttt gyakriságk: Havnta 0 3,3 6,7 Hetente 00 66,7 33,3 Gyakrabban 30 0 0 A szabadsági fk mst: (3-) (3-) 4, így 5 %-s szignifikancia szint mellett χ 9,49. krit. Az előző eljárást leflytatva a számíttt χ értéke 07,6-re adódik. Mivel 07,6 lényegesen nagybb, mint 9,49, így a null-hiptézist mst is el kell vetnünk! A prbléma láthatóan az, hgy mely kategóriákat kell összevnnunk, és milyen értelmet kell azknak tulajdnítanunk! A fentiekből látható, hgy ez az eljárás kézi módszerrel meglehetősen sk időt igényel. A gyakrlatban használható számítógépes eljárásk aznban segítenek ezen.. Illeszkedés vizsgálatk Ha a begyűjtött adataink biznys rendszert mutatnak, akkr haszns lehet annak aznsítása, s az esetleges statisztikai elszláshz való tartzás kimutatása. A χ próba erre is alkalmas. Pl. Feltesszük a kérdést, hgy vajn Pissn elszlást követ-e a ZWACK unikum eladása? Ha a válaszunk igen, akkr ezáltal könnyebbé válik az eladásk alakulásának előrejelzése. A χ kiszámítása itt is az előző pntban megismert (M - V) módn, a χ frmula segítségével történik. V /a.) Teszt az egyenletes elszlásra Az egyenletes elszlás esetén minden érték előfrdulásának valószínűsége egyfrma. 70

40. példa Egy esztergálys műhelyben öt munkás dlgzik. Napi teljesítményüket a következő táblázat mutatja: Munkás Elkészült munkadarab (db) Józsi 7 Laci 3 Feri 9 M Pista 7 Jani 6 Összesen: 40 Kérdés: Egyenletes elszlású-e a dlgzók teljesítménye? Megldás:. lépés: Állítsuk fel a hiptéziseket H : Minden dlgzó teljesítménye egyfrma (azaz az elszlás egyenletes!) H : A dlgzók teljesítménye váltzó. lépés: A szignifikancia szint legyen 5 %. 3. lépés: Határzzuk meg a szabadsági fkt, majd a χ krit értéket ν cellák száma - a várt gyakriságk számításáhz szükséges paraméterek száma - 5-0 - 4, így χ 9,49 Krit 4. lépés: Mivel egyenletes elszlással van dlgunk, így a várt értékeket (V) a 40 8 számítás adja mind az öt munkára. 8 Így χ 0, 574 5. lépés: Összehasnlítás 0,574 < 9,49 6. lépés: Nem vetjük el a null-hiptézist. 7. lépés: Nincs egyértelmű biznyíték arra, hgy a munkásk teljesítménye különböző lenne. 7

/b.) Teszt a binmiális vagy a Pissn elszlásra Az eljárás mst is hasnló, de a várt értékek számításáhz mindkét elszlás esetén ismernünk kell egy-egy paramétert. A binmiális elszlásnál ez p (a siker valószínűsége), míg a Pissn elszlásnál a λ (átlagérték) paraméter. 4. példa Egy elektrnikus alkatrészeket gyártó flyamatt 96 napig vizsgáltak abból a célból, hgy kiszűrjék a hibás adatkat. A vizsgálat eredménye az alábbi vlt: Hibás darabk száma/nap: 0 3 4 5 M Napk száma: 5 0 0 8 3 0 Feladat: Állapítsuk meg %-s szignifikancia szint mellett, hgy a hibás darabk binmiális elszlásúak-e, avagy sem! Megldás:.) H : Az elszlás binmiális H : Az elszlás nem binmiális.) A szignifikancia szint %. 3.) A szabadságfk: ν 6 4 Ebből a kritikus érték: χ krit 3, 3 4.) A várható gyakriságk megállapításáhz ismerni kell a hibás darabk előfrdulásának valószínűségét. Ehhez először a mintaeredmények átlagára van szükség. 6 x [ 0 5 + 0 + 0 + 3 8 + 4 3 + 5 0] /96,5 db 96 Mivel binmiális elszlásnál x n p, ahl n a selejtes darabk maximális mennyisége, így Ezt használjuk fel azután a x,5 p 0,45 n 5 p(k) n k p n ( p) n-k frmula segítségével a várható gyakriságk kiszámítására. (Lásd következő ldal!) 7

Mivel két esetben is összevnást kell elvégeznünk, így módsítani kell a szabadsági fkt és a χ értékét is. krit krit ν 4 χ 9, Ezután használva a már jól ismert (M - V) χ Σ frmulát V kapjuk: χ sz 0, 43 k P (k) Várt gyakriság 96 x P (k) 0, 0,0503 + 0,059 4,83 + 9,77 4,60 0,3369 3,34 3 0,757 6,47 V 4, 5 0,7 + 0,085 0,8 +,77,59,0000 96,00 5.) 0,43 > 9, 6.) Elvetjük a null-hiptézist. 7.) Nincs lyan nyilvánvaló eredmény, ami azt biznyítaná, hgy a selejtes darabk termelése binmiális elszlást követ %-s szignifikancia szint mellett! 4. példa: Egy alkatrészraktárban 00 napn keresztül kísérték figyelemmel a napi alkatrészkivételezések alakulását. Az eredmény az alábbi vlt: Kivételezések száma Napk száma (db/nap) 0 7 7 6 3 4 7 5 vagy több 73

Ha az a feladatunk, hgy egy ezt leíró mdellt készítsünk, feltételezhetjük-e, hgy a raktári kivételezések Pissn-elszlást követnek! (Használjunk 5 %-sszignifikancia szintet!) Megldás:.) H : Az elszlás Pissn elszlás H : Az elszlás nem Pissn.) A szignifikancia szint 5 %. 3.) A szabadságfk: ν 6 4 χ krit 9,49 4.) A Pissn elszlás átlaga (λ) a táblázat adataiból. λ 0 7 + 7 + 6 + 3 + 4 7 + 5 9 + 6 x,6 00 Behelyettesítve a k -λ λ e P (k) frmulába: k! k P (k) Várt (számíttt) gyakriság P (k) x 00 0 0,0743 7,43 0,93 9,3 0,50 5,0 3 0,76,76 V 4 0,44 4,4 5 (vagy több) 0,36,6 Σ,0000 00,00 A szkáss módn elvégezve a számítást : χ, 044 5.),044 < 9,49 6.) Nem vetjük el a null-hiptézist. 7.) A megfigyelések eredménye azt sugallja, hgy a raktári kivételezések alakulása Pissn elszlást követ! 74

/c.) Teszt a nrmális elszlásra Ez a teszt több adatmanipulálást fglalhat magába, mivel táblázats (csprtsíttt) adatkat igényel, s két paramétert (átlag és szórás) is meg kell határzni, mielőtt a várható gyakriságkat kiszámítanánk. 43. példa 50 személy jövedelmi visznyainak vizsgálata srán jutttunk az alábbi összesített adatkhz: Heti jövedelem (Ft) Emberek száma 0.000 Ft alatt 30 0.000-30.000 40 30.000-40.000 45 40.000-60.000 0 60.000-00.000 0 00.000 felett 5 Összesen: 50 Feladat: Vizsgáljuk meg, hgy nrmális elszlást követnek-e az adatk! Megldás:.) H : Az elszlás nrmális H : Az elszlás nem nrmális.) A szignifikancia szint 5 %. 3.) A szabadságfk: ν 6 3 χ krit 7,8 4.) A nagyszámú adatkra krábban felírt empirikus frmulákkal meghatárzzuk az átlagt és a szórást x 36.600 Ft σ s 3.90 Ft A vár értékek megtalálása kából: a.) alakítsuk át az eredeti csprt határkat z értékké z x - x σ 75

b.) adjuk meg az ehhez tartzó valószínűségeket a nrmális elszlás táblázatából c.) határzzuk meg a várt gyakriságkat A következő táblázathz fgunk jutni: Havi jövedelem (eft) z valószínűség várt gyakriság val. 50 0 alatt - 0,7 0,40 36,3 0-30 - 0,8 0,47,065 30-40 0,4 0,666 4,99 V 40-60 0,98 0,708 40,6 60-00,65 0,595 3,9* 00 fölött 0,0040 0,603*,0000 * összevnandók Mivel a két utlsó csprtt összevntuk, így váltzik a szabadsági fk. ν 5 χ 5, 99! krit (M - V) Ezután kiszámítjuk a V χ sz 45,86 5.) 45,8605 > 5,99 6.) Elvetjük a null-hiptézist. χ összeget. Ebből 7.) Nincs kunk feltételezni, hgy a jövedelmek nrmális elszlásúak. Összefglaló megjegyzések a.) b.) c.) d.) e.) χ χ A egy szimbólum. -nek nincs jelentése! A χ shasem lehet kisebb nullánál! (négyzetre emelés!) A χ a mért és a várt gyakriságk összehasnlításáhz kötődik. Ha a mért és várt gyakriságk között nagy a megegyezés, akkr a számíttt χ nulláhz tart, ami a null-hiptézis igaz vltát sugallja. Ha a mért és a várt értékek erősen különbözőnek, akkr a χ értéke magasra szökik, s ez azt sugallja, hgy a null-hiptézist el kell vetni! 76

V. Krreláció-, regresszió- és trendszámítás. Trendszámítás A trend fgalmán alapirányzatt, jellemző fejlődési irányt, a váltzás tartósan érvényesülő fő irányzatát értjük. Trendet időszak adataiból számítunk. (A trend fgalmi meghatárzásából is kitűnik az időbeliség érvényesülése.) A trendszámítás feladata tehát az idősrk ingadzásának kiegyenlítése, kisimítása, hgy a trendvnalat tisztán láthassuk. Az ingadzásk lehetnek: - ciklikus, - szeznális és - véletlen. A trendvnal meghatárzásának két fő módszere ismert: - mzgó átlaglás - analítikus kiegyenlítés.. A mzgó átlaglás módszere Az idősr előre meghatárztt darabszámú elemének számtani átlagát számítjuk, majd az első tagt elhagyjuk, a következőt pedig bevnjuk az átlagszámításba mindaddig, amíg az idősr végére nem érünk. Ezen módszer előnye, hgy egyszerű és gyrs. A módszer hátránya, hgy az így kiegyenlített sr rövidebb az eredetinél, tvábbá nem kapunk analitikusan is kezelhető görbét. 44. példa: Egy vállalatnál 9 egymást követő munkanapn az alábbiak szerint alakult a munkából kiesett órák száma: munkanap kiesett óra. 0. 0 3. 00 4. 90 5. 0 6. 70 7. 60 8. 80 9. 70 77

Feladat: Egyenlítsük ki ezen idősr ingadzásait 3 tagú mzgó átlagk képzésével. Megldás: munkanap kiesett óra mzgó összeg mzgó átlag. 0 - -. 0 330 0 3. 00 300 00 4. 90 300 00 5. 0 70 90 6. 70 40 80 7. 60 0 70 8. 80 0 70 9. 70 - - Az eredeti idősr helyenként erős ingadzásai ellenére (pl. 4., 5., 6. napn 90, 0, 70 óra) a mzgó átlagkra tekintve világsan kitűnik a kiesett órák csökkenő irányzata, alapvnala. Látható tvábbá a kaptt trendérték-sr rövidülése (két taggal rövidebb az eredeti idősrnál). A trendérték-sr rövidülésének mértéke attól függ, hgy hány tagú mzgó átlagt számítttunk. Ha mzgó átlagunk k tagú, a rövidülés mértéke k-. A mzgó átlag tagszámával kapcslats két lényeges megállapítást kell tegyünk: - nyilvánvaló, hgy a véletlen ingadzásk hatásának kikapcslása annál tökéletesebb, minél nagybb tagszámú mzgó átlagkat számítunk, - szeznális ingadzás esetén az átlagk egy teljes idényciklust kell, hgy átfgjanak. 45. példa: Növeljük mzgó átlagunk tagszámát és számítsunk előző példánk alapján 4 tagú mzgó átlagkat. Feladat: vizsgáljuk meg és értelmezzük a kaptt eredményeket! Megldás: 78

munkanap kiesett óra mzgó összeg mzgó átlag. 0 - -. 0 40 05,0 3. 00 40 0,5 4. 90 370 9,5 5. 0 330 8,5 6. 70 30 80,0 7. 60 80 70,0 8. 80 - - 9. 70 Az így kiszámíttt trendértékek két-két nap közé esnek, így értelmezésük nehéz. Hgyan segíthetünk a fenti prblémán? A megldás az ún. középre igazítás, azaz centrírzás, vagyis a kiszámíttt mzgó átlagkból újabb, kéttagú mzgó átlagk számítása. A centrírzás nem érdemi lépés, csak az adatk kezelését könnyíti meg.. Analitikus trend Az analitikus trend gndlata abból a megfntlásból ered, hgy gyakran adódik lyan idősr, mely valamilyen matematikai függvénnyel leírható, kézenfekvő tehát, hgy éljünk is ezzel a lehetőséggel. Egyszerű esetben a trend lineáris. Ekkr a trendvnal egyenlete: y a + bx, ahl x jelöli az egyes időszakkat, Y a hzzátartzó (mért) adatkat, y a trendértékeket. Ahhz, hgy a trendet kifejező egyenest meghatárzzuk, a és b értékeit kell megállapítanunk. A knstansk megállapítására a "legkisebb négyzetek" módszerét fgjuk használni. A trendet kifejező egyenes a következőképp szemléltethető. (Tekintsük a következő ldali ábránkat!) 79

Mért értékek (Y) illetve függőváltzó (y) x x Y x y x x x x x idő A trendnek - nyilvánvalóan - mindkét irányban azns nagyságú területet kell levágnia, ami képlet frmájában képlet frmájában az alábbi módn szemléltethető: n i (yi Y i ) 0 kell legyen. Az egyes különbségek előjele váltakzva pzitív, vagy negatív. Miután az előjel számunkra érdektelen, ezért eltüntetjük azkat a különbségek négyzetre emelésével, vagyis az ( yi Yi ) értékek összegét képezzük. Az az egyenes tekinthető trendvnalnak, amelyre nézve ezen négyzetösszeg, azaz a Σ ( y Y ) a legkisebb. i i i 80

Mivel a fenti szumma értéke "a" és "b" értékétől függ, ezért felírható az alábbi függvény: f(a,b) i i i Σ ( y Y ). Mst helyettesítsük be az egyenes egyenletét a függőváltzó (y) helyére, s az "a" és "b" váltzókra nézve az alábbi függvényt kapjuk. f(a,b) Σ ( b x + a Y ) i i Tudjuk, hgy ezen függvénynek tt van a maximuma, ahl az "a", illetve "b" szerinti parciális differenciálhányadsk értéke nulla. A differenciálhányadskat azk zérus értékénél két egyenletnek tekintve az így kaptt egyenletrendszert "a"-ra és "b"-re megldjuk. A módszer tvábbi részletezésétől eltekintünk. Hangsúlyzzuk, hgy nemcsak lineáris, hanem például parablikus, expnenciális, stb. trend is van. 46. példa: Határzzuk meg a 45. feladat esetében az analitikus trendet! Megldás: Első lépésként készítsük el az alábbi táblázatt: nap ( x i ) kiesett óra ( Yi ) t i t Y i i t i. 0-4 6-480. 0-3 9-330 3. 00-4 -00 4. 90 - -90 5. 0 0 0 0 6. 70 70 7. 60 4 0 8. 80 3 9 40 9. 70 4 6 80 80 60-390 A t i értékek meghatárzása úgy történik, hgy - ha x i páratlan számú adatt tartalmaz, akkr a középső érték nulla, s ettől felfelé +, +, stb. lefelé -, -, stb. értéket adunk az aktuális időadatnak, míg - ha x i párs számú adatt tartalmaz, akkr a két középső érték - és +, a szmszéds értékek pedig -3, -5 stb. illetve +3, +5 stb. lesznek. i 8

Ezzel elérhető az, hgy Σ t i 0 legyen, miáltal a trend egyenlet knstansai: Σ Yi 80 a 90 óra n 9 Σ Yi ti 390 b 6,5 óra/nap, Σ t 60 s így a trendvnal egyenlete i y 90-6,5 t, vagy y,5 6,5 x Ezt felhasználva kiszámítható, hgy pl. a. napn mennyi lesz a várható időkiesés: y,5-6,5 5 óra. Krrelációszámítás A gazdasági élet egyes területeit, flyamatait általában két, vagy még több jelenség jellemzi, beflyáslja. E jelenségek kölcsönösen hatnak egymásra, hatásuk, kapcslatuk vizsgálata a statisztika fnts feladata. Az egyes jelenségek kapcslata lehet: - függvényszerű: az egyik ismérv váltzása a másik meghatárztt váltzását hzza magával; - független: nincs az ismérvek között kimutatható kapcslata; - sztchasztikus (v. valószínűség) kapcslat: az egyik ismérv váltzása a másik biznys váltzását hzza.) A krrelációszámítás feladata a valószínűségi (v. sztchasztikus) kapcslat szrsságának meghatárzása. A krreláció szrsságát azért vizsgáljuk, hgy mielőtt tvábbi vizsgálódáskat végeznénk, meg tudjuk állapítani, hgy a kapcslat jelentős-e, ugyanis laza kapcslat vizsgálatának nem vlna értelme. A krreláció szrsságának meghatárzására az ún. előjel krrelációs együttható, valamint a lineáris krrelációs együttható meghatárzásának módszerét ismerjük. Két ismérv sztchasztikus összefüggése a kapcslat irányát illetően lehet pzitív vagy negatív, azaz az egyik ismérv alacsny értékei a másik ugyancsak alacsny értékeivel járnak együtt, illetve frdítva. 8

. Előjel krrelációs együttható Az előjel krrelációs együttható úgy határzható meg, hgy képezzük mindkét vizsgált ismérvérték sr számtani átlagát, majd - külön-külön - meghatárzzuk az átlagtól való eltéréseket. Ezután megvizsgáljuk az együvé tartzó két eltérés előjelét: ha a krreláció szrs, úgy az eltérések többsége azns előjelű - pzitív krreláció esetén -, vagy különböző előjelű - negatív krreláció esetén - lesz. Az előjelek egyezése (vagy különbözősége) jellemzi tehát a krreláció szrsságát. Ezen tulajdnságt felhasználva képezhető az előjel krrelációs együttható. Képlete: u - v u - v c, ahl: u + v n u előjel egyezések száma, v előjel eltérések száma. Ezen mutató maximális értéke +, ha minden esetben előjel egyezés van, illetve -, ha az előjelek minden esetben eltérnek. E két érték a pzitív, illetve a negatív előjel krreláció ideális esete. 47. példa: Egy vállalat 6. szúrópróbaszerűen kiválaszttt szerelő szakmunkásának munkában töltött ideje és átlags havi keresete közötti összefüggést kívánjuk vizsgálni az alábbi adatk alapján: x y srszám munkában töltött idő (év) havi átlagkereset (Ft/hó). 37.000. 3 37.000 3. 5 4.000 4. 7 4.000 5. 8 43.000 6. 45.000 Feladat: Határzzuk meg az előjel krrelációs együtthatót! Megldás: Az első lépés a két számtani átlag kiszámítása: + 3 + 5 + 7 + 8 + 36 x 6 év 6 6 83

37.000 + 37.000 + 4.000 + 4.000 + 43.000 + 45.000 y 4.000, Ft 6 Ezután következik mindkét ismérvérték sr átlagtól való eltérésének meghatárzása. dx (év) dy (Ft/hó). - 4-4000 (egyezés). - 3-4000 (egyezés) 3. - + 000 (eltérés) 4. + + 000 (egyezés) 5. + + 000 (egyezés) 6. + 5 + 4000 (egyezés) Ezek után számítható a C mutató: 5-4 C 0,66 6 6 Tehát a közepesnél erősebb, pzitív krrelációval a kereset és a munkában el töltött idő között.. Lineáris krrelációs együttható A C mutató hiányssága, hgy nem veszi figyelembe az eltérések nagyságát, számszerű értékét, hltt ez nyilvánvalóan nem lehet közömbös számunkra. Ezen hiánysság úgy küszöbölhető ki, ha az eltérések szrzatát összegezzük; így előjelük helyes marad, emellett ez a számszerű érték az eltérések nagyságát is tükrözi. Ez a szám tehát a krreláció fnts mérőeszköze, képletben: dx dy. Ezen szám önmagában nem alkalmas arra, hgy összehasnlíthatóan mérje a krreláció szrsságát, ugyanis a nagysága függ egyrészt attól, hgy hány adatt vizsgálunk, másrészt attól, hgy mekkra az egyes adatk nagyságrendje (pl. mértékegység megválasztásából adódóan). Ez a nehézség úgy hidalható át, hgy - sztunk n -nel (az adatk számából eredő nagyságrendi eltérés miatt) és - sztunk x és y értékek szórásával (a mértékegység választás és a váltzó nagyságrendek hatásának kiküszöbölése miatt). Ezek után a lineáris krrelációs együttható: Σ dxdy r n σ σ x y 84

48. példa: A lineáris krrelációs együttható értéke + és - közé eső szám lesz. Számítsuk ki a 47. példa adatai alapján az r mutatót! srszám dx dy d x d y. + 6.000 6 6.000.000. +.000 9 6.000.000 3. -.000.000.000 4. +.000.000.000 5. + 4.000 4 4.000.000 6. + 0.000 5 6.000.000 Összesen: 5.000 56 54.000.000 σ x Σ d x n 56 9, 33 3, 055 év 6 σ y Σ d y n 54.000.000 9.000. 000 3.000 Ft/hó 6 5.000 5.000 r 0,946 6 3,055 3000 54.490 Nagyn erős sztchasztikus kapcslat - szrs krreláció - van a munkában töltött idő és a kereset között. Mivel magyarázható, hgy az r mutató értéke nagybb a C mutatónál? Azzal, hgy a dx dy szrzatösszeg képzésében az azns előjelű adatk súlya skkal nagybb. A különbség tehát éppen a C mutató hiánysságának megszüntetéséből fakad. A krrelációszámítás segítségével tehát a sztchasztikus kapcslatk szrsságát és irányát határztuk meg. Lehetőség van aznban ezen kapcslat törvényszerűségeinek feltárására is, ha a megfelelő trendvnal kereséséhez hasnló módn ún. regresszióvnalat állapítunk meg, melynek leírását az ún. regressziós függvény adja. 85

3. Regresszió számítás A regressziós függvény használatának szemléltetésére a két váltzós lineáris regressziót fgjuk bemutatni. Válasszuk a 48. példát a szemléltetéshez! Ez esetben két váltzó között kapcslatt az y a + b x regressziós egyenessel írjuk le, melynek knstansai: Σ dx dy 5.000 b 98,6 Ft/év Σ d x 56 a y b x 35.430 Ft A regressziós egyenes egyenlete tehát az alábbi lesz: y 98,6 x + 35.430 Az egyenlet felhasználásával számítsuk ki, hgy mennyit keres egy dlgzó 4 év munkaviszny után! Megldás: y 98,6 4 + 35.430 38.750 Ft/hó. 86

Standardizált nrmális elszlás elszlásfüggvény értékei. táblázat A 0,00 0,0 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0039 0,0079 0,00 0,058 0,098 0,037 0,077 0,037 0,0356 0, 0,0396 0,0436 0,0475 0,055 0,0555 0,0594 0,0634 0,0673 0,073 0,075 0, 0,079 0,083 0,0870 0,0909 0,0948 0,0987 0,064 0,064 0,03 0,4 0,3 0,80 0,8 0,56 0,94 0,33 0,370 0,407 0,445 0,48 0,59 0,4 0,556 0,593 0,630 0,666 0,703 0,739 0,775 0,8 0,846 0,88 0,5 0,97 0,95 0,987 0,0 0,056 0,09 0,5 0,59 0,9 0,6 0,6 0,59 0,9 0,35 0,358 0,39 0,43 0,455 0,487 0,58 0,550 0,7 0,58 0,643 0,673 0,673 0,704 0,734 0,764 0,793 0,83 0,85 0,8 0,88 0,938 0,966 0,966 0,994 0,30 0,3050 0,3077 0,33 0,9 0,358 0,30 0,336 0,336 0,36 0,387 0,333 0,3338 0,336 0,3387,0 0,34 0,3435 0,3459 0,3483 0,3506 0,359 0,355 0,3575 0,3597 0,369, 0,364 0,3663 0,3684 0,3705 0,376 0,3747 0,3768 0,3788 0,3808 0,388, 0,3847 0,3886 0,3886 0,3905 0,393 0,394 0,3960 0,3978 0,3996 0,404,3 0,403 0,4065 0,4065 0,408 0,4098 0,44 0,430 0,446 0,46 0,477,4 0,49 0,4 0,4 0,437 0,45 0,465 0,479 0,493 0,4306 0,430,5 0,4333 0,4346 0,4358 0,437 0,4383 0,4397 0,4407 0,449 0,443 0,444,6 0,4454 0,4465 0,4476 0,4486 0,4497 0,4507 0,457 0,457 0,4537 0,4547,7 0,4556 0,4566 0,4575 0,4584 0,4593 0,460 0,460 0,469 0,467 0,4635,8 0,4643 0,465 0,4659 0,4666 0,4673 0,488 0,4688 0,4605 0,470 0,4708,9 0,475 0,47 0,478 0,4734 0,4740 0,4746 0,475 0,4758 0,4763 0,4769,0 0,4774 0,4780 0,4785 0,4790 0,4795 0,4800 0,4805 0,4809 0,484 0,488, 0,483 0,487 0,483 0,4835 0,4839 0,4843 0,4847 0,485 0,4854 0,4858, 0,486 0,4865 0,4868 0,487 0,4875 0,4878 0,488 0,4884 0,4487 0,4890,3 0,4893 0,4895 0,4898 0,490 0,4903 0,4906 0,4908 0,49 0,493 0,495,4 0,497 0,499 0,49 0,494 0,496 0,498 0,499 0,493 0,4933 0,4935,5 0,4937 0,4938 0,4940 0,494 0,4943 0,4945 0,4946 0,4948 0,4949 0,4950,6 0,495 0,4953 0,4954 0,4955 0,4957 0,4958 0,4959 0,4960 0,496 0,496,7 0,4963 0,4965 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,497 0,497,8 0,497 0,4974 0,4974 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4978,9 0,4979 0,4980 0,4980 0,498 0,498 0,498 0,498 0,4983 0,4983 0,4984 3,0 0,4984 0,4985 0,4985 0,4986 0,4986 0,4986 0,4987 0,4987 0,4987 0,4988 3, 0,4988 0,4989 0,4989 0,4989 0,4989 0,4990 0,4990 0,4990 0,499 0,499 3, 0,499 0,499 0,499 0,499 0,499 0,499 0,4993 0,4993 0,4993 0,4993 3,3 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,4 0,4995 0,4495 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 3,5 0,4996 87

A standardizált nrmális elszlás görbe alatti területének értékei az. táblázatban találhatók. A táblázat megadja a standardizált nrmális elszlás görbe alatti területét 0...z tetszőleges - tegyük fel x - értékéig. A táblázat használatáhz x értéke az z x - x σ képlet alapján számítható. Ha z pzitív szám, akkr z vagy az ennél kisebb érték valószínűsége meghatárzható, ha a táblázatból kikeresett értékhez 0,5000-t adunk. Ha z negatív szám, akkr z vagy az ennél kisebb értéknek a valószínűségét úgy kapjuk meg, hgy kikeressük a táblázatból a pzitív z-nek megfelelő értéket és kivnjuk 0,5000-ből. Ha z vagy ennél nagybb érték valószínűségének meghatárzása a feladat, akkr a számítás megegyezik z és ennél kisebb érték valószínűségének a meghatárzásával, de az eredményt egyből ki kell vnni.. példa: Ha z,645, a táblázat alapján a +,645-hez tartzó érték 0,4500. Így,645 vagy ennél kisebb érték valószínűsége 0,4500+0,5000,9500.. példa: Ha z -,96, a táblázat alapján a +,96-hz tartzó érték 0,475. Ennek megfelelően a z -,96 vagy ennél kisebb érték valószínűsége 0,5000-0,4750,048. 88