MATEMATIKAI STATISZTIKA elemei

Hasonló dokumentumok
STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

NAGY TARTÓSSÁGÚ BETON TERVEZÉSÉNEK NÉHÁNY KÖVETELMÉNYE

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

A leíró statisztikák

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

A valószínűségszámítás elemei

A Statisztika alapjai

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Beton-nyomószilárdság nyomószilárdság értékelésének alulmaradási tényezője

Biomatematika 2 Orvosi biometria

A mérési eredmény megadása

Biostatisztika VIII. Mátyus László. 19 October

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Kutatásmódszertan és prezentációkészítés

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria

Segítség az outputok értelmezéséhez

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai geodéziai számítások 10.

Matematikai geodéziai számítások 6.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Valószínűségszámítás összefoglaló

Többváltozós lineáris regressziós modell feltételeinek

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

[Biomatematika 2] Orvosi biometria

Matematikai geodéziai számítások 6.

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Elemi statisztika fizikusoknak

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Bevezetés a hipotézisvizsgálatokba

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Beton nyomószilárdságának MEGFELELŐSÉGE ÉS elfogadása (nem csak) szerint

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

4 2 lapultsági együttható =

Mérési hibák

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

KOVÁCS BÉLA, MATEMATIKA I.

Számítógépes döntéstámogatás. Statisztikai elemzés

Mérési adatok illesztése, korreláció, regresszió

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

A valószínűségszámítás elemei

Térfogati fajlagos felület és (tömegi) fajlagos felület

NEVEZETES FOLYTONOS ELOSZLÁSOK

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

1. tétel. 1. Egy derékszögű háromszög egyik szöge 50, a szög melletti befogója 7 cm. Mekkora a háromszög átfogója? (4 pont)

egyetemi jegyzet Meskó Balázs

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kísérlettervezés alapfogalmak

Vizsgálati jegyzőkönyvek általános felépítése

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis vizsgálatok

1/8. Iskolai jelentés. 10.évfolyam matematika

- 1 - A BETON NYOMÓSZILÁRDSÁG MEGFELELŐSÉGÉNEK FELTÉTELEI AZ ÚJ BETONSZABVÁNYOK SZERINT. Dr. Kausay Tibor

OC-GÖRBE, MŰKÖDÉSI JELLEGGÖRBE, ELFOGADÁSI JELLEGGÖRBE

Statisztika Elıadások letölthetık a címrıl

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Függvények Megoldások

Kísérlettervezés alapfogalmak

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

9. Tétel Els - és másodfokú egyenl tlenségek. Pozitív számok nevezetes közepei, ezek felhasználása széls érték-feladatok megoldásában

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Minőség-képességi index (Process capability)

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

KERESZTMETSZETI JELLEMZŐK

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Átírás:

MATEMATIKAI STATISZTIKA elemei Dr. Kausay Tibor Budapest, 01. február 1

[tömeg%] PÉLDA A gyakoriságfüggvény szerkesztésére

Ez nem egy jól sikerült gyakorisági hisztogram, mert az abszcissza tengely xi+1 xi osztásközeit túl kicsire vettem fel. xi+1 xi xi +1= = x 3 xi k

Az x abszcissza tengely felosztására nincs pontos szabály, de az osztáspontok megválasztása általában akkor szerencsés, ha minden x i+1 x i intervallumba körülbelül 3 n mintaelem jut, ahol n a mintaelemek száma. Példánk esetén az elemek száma n = 10, és ideális esetben 3 3 n = 10 = 154, elem jut egy intervallumba. A 19,0 15,5 = 3,5 terjedelmet tehát n/,154 = 10/,154 = = 4,6 ~ 5 intervallumra a legcélszerűbb osztani. Ehhez igazodva az új ábrán 7 darab x i+1 x i = 0,5 terjedelmű intervallumot alkalmaztunk. 4

k Várhatóérték = átlag = 17,17 Szimmetrikus görbe Szórás = 0,936958 Gyakorisági hisztogram Gyakorisági polinom Gyakorisági görbe x Ez a gyakorisági hisztogram már jobban néz ki, mert az abszcissza 5 tengely xi+1 xi osztásközei nagyobbak, mint az előző ábrán voltak.

Ez az ábra a gyakorisági ábra felülnézeteként értelmezhető. Az ábra nagyon jól szemlélteti, hogy a mérési eredmények elhelyezkedése az abszcissza tengelyen nem szimmetrikus. 6

Ez az ábra is a gyakorisági ábra felülnézeteként értelmezhető Max. Medián Terjedelem Gyakoriság, k Felső, 75 %-os kvantilis Ide esik a mérési eredmények 50 %-a Alsó, 5 %-os kvantilis Min. Medián = Az 50 %-os kvantilis neve, illetve értéke. A páratlan számú rendezett minta 7 esetén a középső elem értéke, a páros számú esetén a két középső elem átlagértéke.

Ha a k tapasztalati gyakorisági értékeket elosztjuk a mintaelemek n számával (ez példánk esetén n = 10 volt), akkor a p = k/n tapasztalati relatív gyakoriságokat kapjuk. Az ordináta tengelyre a p = k/n tapasztalati relatív gyakoriságokat felrakva a tapasztalati eloszlásfüggvényre, más néven tapasztalati sűrűségfüggvényre (p ) jutunk. A sűrűségfüggvény alatti terület értéke 1,0, vagy százalékban kifejezve 100 %. A p sűrűségfüggvény egyes x i abszcissza értékeitől balra vett görbe alatti területek értékét koordinátarendszerbe felhordva a (tapasztalati) p eloszlásfüggvényt kapjuk. 8

Eloszlásfüggvény és jellemzői (az MSZ 1888-5:1981 szabvány szerint) kőanyag szemhalmazok esetén általában adalékanyagok esetén 9

Valahol olvastam: A brüsszeli városvezetés a Brüsszelben élő Carl Friedrich Gauss német matematikust felkérte arra, hogy végezzen matematikai módszerrel lakossággal kapcsolatos felmérést. Könnyen lehetséges az, hogy a világ első ilyen felmérése született Gauss módszerével, és talán Brüsszel városa volt az első, aki megbízást adott a tudományos megalapozottságot igénylő munkára. Gauss Brüsszel lakosait kirendeltette a templom előtti térre, és ott a toronyból irányítva nagyságrend alapján rendezte őket, mégpedig úgy, hogy középen a legmagasabbak és két oldalra csökkenő magasságúakat állította. Így alakult ki a Gauss görbe, mely harang alakú. Ebből a görbéből számításokkal meghatározta, hogy a lakosságnak hány %-a nagyon alacsony, alacsony középméretű, magasabb és igen magas. 10

Carl Friedrich Gauss német matematikus portréja (Gottlieb Biermann festménye, 1887) Született: Német-római Birodalom, Braunschweig-Lüneburgi hercegség, Braunschweig, 1777. április 30. Meghalt: Hannoveri Királyság, Göttingen, 1855. február 3. Forrás: Wikipédia 11

A német márkát 001. december 31-én kivonták a forgalomból, mert 00. január 1-én az euro lett a fizetőeszköz Németországban. Tessék megfigyelni a pénzen a Gauss-görbét és egyenletét. Ezt a példányt 001. június 19-én vásároltam az OTP-ben: 1

A σ szórás 1,645-szeresét levonva az m várhatóértékből megkapjuk az 5 %-os alsó küszöbértéket 90 % ( jellemző értéket, 1,645 σ karakterisztikus értéket ), amelynél kisebb értékek előfordulásának valószínűsége 5 %. Görbe alatti terület: 0,05 1,0 A Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete. 13

14

Ha az építőanyagok tulajdonságait valószínűségi változóként fogjuk fel, akkor megfelelőségüket általában az 5 %-os alsó küszöbértékük alapján ítéljük meg. Kérdés, hogy az építőmérnök a valószínűségi eloszlás felső küszöbértékét használja-e a méretezés során? A válasz: Igen. A hatásokat (például szélteher, hóteher, födémek terhe, vízépítésben a legmagasabb vízszint stb.) általában felső küszöbértékükkel szokás figyelembe venni. 15

Említettük, hogy a Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete. Az elméleti várhatóérték (m) a Gauss görbe helyét, az elméleti szórás (σ) a Gauss görbe terjedelmét (terpesztését) határozza meg. Sűrűségfüggvény Eloszlásfüggvény 16

Néhány fogalom (1) Alulmaradási hányad: Az előzőekben említett görbe alatti terület (0,05, illetve 5 %) neve. Meghatározás: A teljes tételben a megfelelőségi feltételt ki nem elégítő rész részaránya. Alulmaradási tényező: Az előzőekben szerepelt 1,645 vagy más értékű szorzó. Meghatározás: Szorzó, amellyel a szórást megszorozva, és a szorzatot a várhatóértékből (az átlagból) kivonva, a küszöbértékre jutunk. Jele általában: λ n. Ilyen a későbbiekben tárgyalásra kerülő t n Student tényező is. Alulmaradási tágasság: Az alulmaradási tényező és a szórás szorzata. Meghatározás: Az alulmaradási tágasságot a várhatóértékből (az átlagból) kivonva a küszöbértéket (jellemző értéket, karakterisztikus értéket) kapjuk. Más szóval a várhatóérték (az átlag) és a küszöbérték különbsége. Jele a tapasztalati szórás esetén általában: λ 17 n s

Néhány fogalom () Valószínűségi változó: A független változó elnevezése a matematikai statisztikában. Jele: ξ (kszi) vagy x Várhatóérték: A tapasztalati átlagnak (számtani középértéknek) megfelelő elméleti fogalom a matematikai statisztikában, tehát a valószínűségi változó várhatóértéke, amely a p gyakoriságfüggvény alatti területnek az ordinátatengelyre vett elsőrendű nyomatéka: Jele: M(ξ) vagy m Átlag (számtani átlag): A várhatóérték elnevezése, ha nem elméleti, hanem tapasztalati érték. A mindennapok gyakorlatából ismert fogalom. Jele például: Szórás: A valószínűségi változó felvett értéke (ξ) és várhatóértéke (M(ξ) vagy m) közötti eltérés négyzetének várhatóértékéből vont négyzetgyök: D( ξ) M ( ξ) = ò ξ p' dξ (( M( ξ) - ξ) i =1 = M ) = Jele: D(ξ) vagy σ A szórás lehet elméleti szórás, vagy tapasztalati szórás. A fenti képlet és 18 jel az elméleti szórás képlete, illetve jele. A tapasztalati szórást s-sel szokták jelölni. n å( m - ξ n i ) x

Szórás meghatározása Az elméleti szórást úgy határozzuk meg, hogy 1. minden mérési eredményre (x i ) képezzük a várhatóérték (m) az egyes mérési eredmények (x i ) különbségét: (m x i ), és ezt eltérésnek* nevezzük,. ezeket a különbségeket négyzetre emeljük: (m x ) i, ezek neve eltérésnégyzet*, 3. a négyzet értékeket összegezzük: Σ(m x i ), ezt eltérésnégyzetösszegnek* hívjuk, 4. és az elméleti szórás esetén az eltérésnégyzetösszeget* elosztjuk az n mintaelemszámmal: (Σ(m x i ) )/n, 5. majd a hányadosból négyzetgyököt vonunk: σ n i=1 = å( m - Az elméleti szórás számításának feltétele, hogy n. Megjegyzés: Amit itt eltérés -nek hívunk, azt a regresszió számításnál hiba -nak nevezzük! n x i ) 19

A gyakorlatban az n feltétel nem teljesül, az n a gyakorlatban általában egy nagyon kis szám, és ezt a tapasztalati szórás számítása során figyelembe kell venni. Ez úgy történik, hogy az eltérésnégyzetösszeget nem n-nel, hanem (n-1)-gyel kell elosztani, tehát a tapasztalati (empirikus, korrigált) szórás (s) értéke: n å ( x - x ) i s = Mennél kisebb az n értéke, i= 1 annál jobban eltér az n -1 (n-1)/n hányados az 1-től, azaz adott eltérésnégyzetösszeg esetén minél kisebb az n mintaelemszám, a [(n-1)/n] aránynak megfelelően annál nagyobb a tapasztalati szórás (s), és ennek folytán kisebb küszöbérték adódik. Ez már csak azért is így van, mert ha az n értéke csökken, akkor nem csak a szórás (s), hanem az alulmaradási tényező (λ n ) is megnő, és ezáltal az alulmaradási tágasság (λ n s) növekedésének már oka 0 is van.

A Gauss-féle sűrűségfüggvény ábrán (emlékeztetésül itt balra látszik lekicsinyítve) bemutatott elméleti törvényszerűségek akkor igazak, ha n, illetve gyakorlatilag több mint 40, azaz n > 40 (n = mintaelem szám). Ha n (azaz n tart a végtelenhez), akkor a gyakorisági hisztogram és a gyakorisági polinom a gyakorisági görbéhez (azaz a gyakorisági hisztogram és a gyakorisági polinom tart a gyakorisági görbéhez); a tapasztalati átlag ( x ) tart az elméleti átlaghoz, amit várhatóértéknek hívunk (m); a tapasztalati szórás (s) tart az elméleti szóráshoz (σ). A laboratóriumi mérési (vizsgálati) eredményekből a tapasztalati átlagot és a tapasztalati szórást tudjuk kiszámítani, ezekből az elméleti átlagra (várhatóértékre) és az elméleti szórásra csak következtetni tudunk, és a mérési eredményekből a küszöbértéket (jellemző értéket, karakterisztikus értéket) a vonatkozó termékszabvány előírása alapján 1 határozzuk meg.

Tételezzük fel például, hogy egy hatalmas doboz (mondjuk akkora, mint a Műegyetem aulája) tele van egyforma, de különböző, fekete, fehér színű golyóval (például pingpong labdával), amelyek a hatalmas dobozban véletlenszerűen helyezkednek el, és amelyek arányát nem ismerjük. Vegyünk mintát képzeletben a hatalmas dobozból például egy kis szakajtóval (kenyértészta kelesztésére való fületlen kosárkával), számoljuk meg a mintában lévő fekete és fehér golyókat, és tegyük fel a kérdést: Mi a valószínűsége annak, hogy a mintában lévő fekete és fehér golyók aránya ugyanaz, mint a hatalmas doboz halmazában? Könnyű elképzelni, hogy vizsgálódásunk megbízhatósága annál nagyobb lesz, minél nagyobb a szakajtónk, azaz minél nagyobb a mintában lévő golyók n mintaelem száma. Teljes bizonysággal azonban csak akkor tudnánk a kérdésre válaszolni, ha a hatalmas dobozban lévő valamennyi golyót megvizsgálnánk. A gyakorlatban erre persze nincs lehetőségünk, de az n mintaelemszám növelésére törekednünk kell.

A vizsgálati minta n elemszáma a vizsgálatnak nagyon fontos jellemzője, mert jelentősen befolyásolja a vizsgálati eredmények értékelésével végzett termék-minősítés megbízhatóságát. Az n mintaelemszámot a vizsgálati (mérési) eredmények értékelése során a Student-féle eloszlás (nevezik t-eloszlásnak is) alkalmazásával lehet figyelembe venni. A Student eloszlás jellegzetessége, hogy az n mintaelemszámnak is függvénye, és ha n, akkor a Student görbe egyre jobban megközelíti a Gauss görbét, azaz Student görbe Gauss görbe 3

A Student-eloszlást William Sealy Gosset (Canterbury, Kent, 1876. június 13. Beaconsfield, Buckinghamshire, 1937. október 16.) angol statisztikus írta fel, és 1908-ban Student álnéven publikálta. W. S. Gosset 1908-ban W. S. Gosset a híres, 138-ben alapított Winchester College magángimnázium oxfordi kollégiumában kémiát és matematikát tanult, majd 1899-ben az ír Arthur Guinness (175. szeptember 4. 1803. január 3.) és fia világhírű dublini sörfőzdéjében helyezkedett el. Itt dolgozta ki matematikai statisztikai módszerét az árpa minőség vizsgálati eredmények megbízhatóságának megítélésére. Minthogy korábban egy másik munkatárs publikációjával kárt okozott a sörfőzdének, megtiltották az alkalmazottaknak, hogy tanulmányokat tegyenek közzé. Ez az oka annak, hogy W. S. Gosset álnéven írt. 4

A történethez tartozik, hogy Gosset nagyon jó munkakapcsolatba került az élettani laboratórium vezetőjével, Karl Pearson angol matematikussal (1857. március 7. 1936. április 7.), a χ -eloszlás és a korrelációs együttható kidolgozójával, akitől sokat tanult. A Student-féle eloszlás jelentőségét mégsem K. Pearson, hanem Ronald Aylmer Fisher (1890. február 17. 196. július 9.) angol genetikus és statisztikus, az F-eloszlás vagy Fisher-eloszlás kidolgozója ismerte fel. W. S. Gosset 1908-ban a Student-féle eloszlást a t betűvel jelölte, ezért azt t-eloszlásnak is nevezzük. A Student-féle vagy t-eloszlás sűrűségfüggvényének alakja: f ( n æ n ö Gç t 1 t è ø æ - 1 n 1 n 1 ö )( ) = æ ç + ö π n 1 è - Gç - ( ) ( - ) ø è ø n - ahol Γ a gamma-eloszlást jelöli: G t ( ( n ) ) = n-1 -t ò t e dt 0 ahol t = - logx és G (n+1) = n G (n) G (1) = 1 G (n) = (n 1)! 5

Az egyoldali 5 %-os alulmaradási hányadhoz tartozó Student tényező (t n ), 50 %-os elfogadási valószínűség mellett (Stange, K. Henning, H.-J., 1966) Mintaelem szám n 3 4 5 6 7 8 9 10 11 Szabadságfok n -1 1 3 4 5 6 7 8 9 10 Studenttényező t n 6,314,90,353,13,015 1,943 1,895 1,860 1,833 1,81 Mintaelem szám n 1 13 14 15 0 30 35 100 500 Szabadságfok n -1 11 1 13 14 19 9 34 99 499 Studenttényező t n 1,796 1,78 1,771 1,761 1,79 1,699 1,691 1,660 1,648 1,645 Esetünkben a Student-tényező az N(0,1) eloszlású t-eloszlás egyoldali 5 %-os alulmaradási hányadához tartozó t n valószínűségi változója (p = 0,05 értékhez 6 tartozó kvantilise, küszöbértéke).

Standardizált valószínűségi változó: Fogalommeghatározás (3) A ξ valószínűségi változó standardizáltja: ξ sta = M( ξ) - ξ D( ξ) azaz képezni kell az M(ξ) várhatóérték és a ξ valószínűségi változó különbségét, amelyet eltérésnek neveztünk (ezáltal a függvényt az origóba toljuk), és el kell osztani a D(ξ) szórással. Ez tulajdonképpen függvénytranszformáció. A standardizált valószínűségi függvény várhatóértéke: 0, szórása: 1. 7

8

Standardizált eloszlásfüggvény 100 %ból kivont ordinátája. Például 95 %, ha a standardizált eloszlásfüggvény ordinátája p% = 5 %, vagy 97,5 %, ha p% =,5 % stb. Ez a sor az f = 4 szabadság fokú (n = 5) standardizált Student-féle eloszlásfüggvény abszcisszáit (t) adja. Például tn=5 =,13 esetén p% = 5 %, vagy tn=,5 =,776 esetén p% =,5 % stb. Ez a sor (f = ) a standardizált Gaussféle eloszlásfüggvény abszcisszáit adja. Például t = 1,645 esetén p% = 5 %, vagy t = 1,960 esetén p% =,5 % stb. 9 p% = 10 5,5 1 0,5 0,1 0,05 %

Ha n, akkor Student görbe Gauss görbe (sűrűségfüggvények bal oldala) 0,40 y = Relatív gyakoriság 0,35 0,30 0,5 0,0 0,15 0,10 Student(x;) n=3 Student(x;5) n=6 Student(x;8) n=9 Student(x;11) n=1 Student(x;14) n=15 Student(x;34) n=35 Student(x;99) n=100 Student(x;499) n=500 Gauss(x;0;1) 0,05 0,00 x = Valószínűségi változó 30

Gauss- és Student-eloszlások standardizált sűrűségfüggvénye p Gauss St n=500 St n=100 St n=35 St n=15 St n=1 St n=9 St n=6 St n=3 x 1 x 3 x 5 x 7 x 9 x 11 x 13 x 15 x 17 31

Gauss- és Student-eloszlások standardizált sűrűségfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p ordináták) 3

Ha n, akkor Student görbe Gauss görbe (eloszlásfüggvények bal széle) és a 0,05 értékű (5 %-os) küszöbérték jobbra tolódik (nagyobb lesz) p = Alulm aradási hányadu 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,05 0 Gauss- és Student-elszlások standardizált eloszlásfüggvénye Küszöbérték x = Valószínűségi változó Student(x;) n=3 Student(x;5) n=6 Student(x;8) n=9 Student(x;11) n=1 Student(x;14) n=15 Student(x;34) n=35 Student(x;99) n=100 Student(x;499) n=100 Gauss(x;0;1) p=0,05 33

Gauss- és Student-eloszlások standardizált eloszlásfüggvénye p Gauss St n=500 St n=100 St n=35 St n=15 St n=1 St n=9 St n=6 St n=3 x 1 x 3 x 5 x 7 x 9 x 11 x 13 x 15 x 17 34

Gauss- és Student-eloszlások standardizált eloszlásfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p ordináták) 35

EGY KIS JÁTÉK Ezt a horgászt 1998-ban nagy szerencse érte, mert óriási, m hosszú harcsát fogott. Az év őszén arra kértem 55 főiskolai hallgatót, hogy becsülje meg a hal súlyát. Idézzük emlékezetünkbe, amit a mértékegységek tárgyalása során megbeszéltünk: az SI mértékegységrendszerben a súly mértékegysége N, a kg 36 pedig a tömeg mértékegysége.

Az óriás harcsa becsült súlya, 1. oldal Minta Rendezett minta Sorszám 1998. szeptember 14-16-án 55 főiskolai hallgató 500 180 1. a bemutatott fényképről megbecsülte a m hosszú harcsa súlyát 750 00. 1500 00 3. 5 %-os alsó küszöb, 00 00 4. 0,05*55=,75 N Hisztogram 700 00 5. 650 50 6. 800 300 7. Hétfő 14 óra, Menedzser 6. csoport 800 300 8. Hétfő 16 óra, Menedzser. csoport 800 350 9. Szerda 1 óra, Magasépítő 6. csoport 540 400 10. Szerda 14 óra, Magasépítő 3. csoport 500 400 11. Szerda 16 óra, Magasépítő 7. csoport 540 450 1. 850 500 13. 700 500 14. 750 500 15. 5 %-os alsó kvantilis, 0,5*55=13,75 N Hisztogram 100 500 16. A hallgatók közül huszonnégyen a súly helyett 400 500 17. a tömeget adták meg, 780 500 18. ugyanis [kg]-ban fejezték ki a kérdezett mennyiséget. 870 540 19. Ez a megkérdezett hallgatók 43,6 %-a. 600 540 0. A feltett kérdésre a helyes válasz: 00 540 1. A hal súlya körülbelül 450 N, mert a hal tömege 46 kg volt. 1000 570. Súly = Tömeg * Nehézségi gyorsulás = 500 600 3. = 46 kg * 9,81 m/sec = 500 600 4. = 451,6 kg*m/sec = 451,6 N 800 600 5. 800 630 6. 300 650 7. Hisztogram 800 650 8. Medián = 650 A rendezett minta középső elemének értéke. 37

Az óriás harcsa becsült súlya,. oldal Minta Rendezett minta Sorszám 600 650 9. 400 660 30. Matematikai statisztikai jellemzők 540 700 31. A becsült értékek átlaga: 637,090909 N 700 700 3. A becsült értékek szórása: 63,74553 N 500 700 33. A becsült értékek ferdesége: 0,49453691 1100 700 34. A becsült értékek csúcsossága: 1,153008 300 700 35. 950 70 36. Tehát a hallgatók a harcsa súlyát jelentős szórással túlbecsülték, 350 750 37. a ferdeség a nagy értékek irányába nyúló aszimmetrikus eloszlást jelez, 70 750 38. az eloszlás a normális eloszláshoz viszonyítva csúcsos eloszlás. 700 780 39. 180 800 40. 50 800 41. 75 %-os felső kvan- 810 800 4. tilis, 0,75*55=41,5 Hisztogram 650 800 43. 1000 800 44. 800 800 45. 450 800 46. 600 810 47. 700 850 48. 630 870 49. 500 950 50. 570 1000 51. 650 1000 5. 660 1100 53. 00 100 54. 38 00 1500 55.

Az óriás harcsa becsült súlya, 3. oldal Valószínűségi Valószínűség Relatív változó, N valószínűség 180 1 0,018 00 0,0364 00 3 0,0545 0,05*55=,75 00 4 0,077 Az 5 %-os alsó küszöb valószínűségi változója: 00 5 0,0909 Átlag - 1,645*szórás: 06, N 50 6 0,1091 Ekkor a szórások tartományában a valószínűségek 90 %-a található. 300 7 0,173 300 8 0,1455 350 9 0,1636 400 10 0,1818 400 11 0,000 450 1 0,18 500 13 0,364 500 14 0,545 500 15 0,77 500 16 0,909 500 17 0,3091 500 18 0,373 540 19 0,3455 540 0 0,3636 540 1 0,3818 570 0,4000 600 3 0,418 600 4 0,4364 600 5 0,4545 630 6 0,477 650 7 0,4909 Várhatóérték- 1,96* szórás: 13,1 N 5 %-os alsó küszöb valószínűsége: Várhatóérték - egyszeres szórás: 376,3 N 5 %-os alsó kvantilis: 500 N és valószínűsége: 0,5*55=13,75 Medián, lognormális eloszlás esetén: 556 N A becsült értékek várhatóértéke: 640 N Hisztogram Hisztogram Módusz, a lognormális eloszlás legnagyobb gyakoriságához tartozó valószínűségi változó: 455 N Ez valamivel több, mint az óriás harcsa tényleges, mért súlya (451,6 N). A becsült értékek szórása: 39 63,7 N

Valószínűségi Valószínűség Relatív változó, N Az óriás harcsa becsült súlya, 4. oldal valószínűség 650 8 0,5091 650 9 0,573 További matematikai statisztikai jellemzők 660 30 0,5455 A becsült értékek ferdesége: 0,495 700 31 0,5636 A becsült értékek csúcsossága: 1,153 700 3 0,5818 700 33 0,6000 55 főiskolai hallgató 700 34 0,618 fénykép után megbecsülte az óriás harcsa súlyát. 700 35 0,6364 Ezen az oldalon a becslés 70 36 0,6545 matematikai statisztikai feldolgozása található. 750 37 0,677 750 38 0,6909 780 39 0,7091 800 40 0,773 800 41 0,7455 75 %-os alsó kvantilis: 800 N 800 4 0,7636 és valószínűsége. 0,75*55=41,5 800 43 0,7818 800 44 0,8000 Normális eloszlás esetén Hisztogram A hisztogramot és a közelítő normális, illetve lognormális eloszlások gyakoriságfüggvényeit négy ábrán mutatjuk be. Hisztogram 800 45 0,818 az egyszeres szórások tartományában a valószínűségek 68,7 %-a, 800 46 0,8364 az 1,96-szoros szórások tartományában a valószínűségek 95 %-a található. 810 47 0,8545 850 48 0,877 870 49 0,8909 950 50 0,9091 Várhatóérték + egyszeres szórás: 903,7 N 1000 51 0,973 1000 5 0,9455 1100 53 0,9636 Várhatóérték + 1,96* szórás: 1156,9 N 100 54 0,9818 1500 55 1,0000 40

4 0 18 16 Variable VAR1 ; distribution: Normal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.104740, p = n.s. (szimmetrikus) normális eloszlás feltételezésével Chi-Square: 4.07308, df = 1, p =.0447777 Mó = Me = Várhatóérték Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,9 N No of obs 14 1 10 8 Szimmetrikus görbe 6 4 0 0 00 400 600 800 1000 100 1400 1600 1800 Y Expected Osztásköz: 00 N Category (upper limits) Valószínűségi változó, N 41

No of obs 13 1 11 10 9 8 7 6 5 4 3 1 0 0 100 00 300 400 Variable VAR1 ; distribution: Normal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.104740, p = n.s. (szimmetrikus) normális eloszlás feltételezésével Chi-Square: 5.596978, df = 4, p =.31364 Mó = Me = Várhatóérték 500 600 700 800 900 Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,8 N Szimmetrikus görbe 1000 100 1400 1600 1800 1100 1300 1500 1700 Y Expected Osztásköz: 100 N Category (upper limits) Valószínűségi változó, N 4

No of obs 4 0 18 16 14 1 10 8 Variable VAR1 ; distribution: Lognormal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.0849594, p = n.s. (jobbra ferde) lognormális eloszlás feltételezésével Mó Chi-Square: 9.705349, df =, p =.007813 Me Várhatóérték Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,6 N Várhatóérték = 636,8 N Jobbra ferde görbe 6 4 0 0 00 400 600 800 1000 100 1400 1600 1800 Y Expected Osztásköz: 00 N Category (upper limits) Valószínűségi változó, N 43

No of obs 13 1 11 10 9 8 7 6 5 4 3 1 0 0 100 00 300 400 Variable VAR1 ; distribution: Lognormal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.0849596, p = n.s. (jobbra ferde) lognormális eloszlás feltételezésével Mó Chi-Square: 10.87659, df = 4, p =.080043 500 Me Várhatóérték 600 700 800 900 Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,8 N Várhatóérték = 633,6 N Jobbra ferde görbe 1000 100 1400 1600 1800 1100 1300 1500 1700 Y Expected Osztásköz: 100 N Category (upper limits) Valószínűségi változó, N 44

Néhány fogalom (4) Módusz: A környezetében a legnagyobb (relatív) gyakorisághoz tartozó valószínűségi változó, magyarán a (relatív) gyakorisági görbe csúcsához tartozó abszcissza érték, amelyből akár több is lehet. Medián (latin = középső): A p = 0,5 értékhez tartozó kvantilis. Mindig a módusz és az átlag (várhatóérték) közé esik. A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem normális eloszlásokat, mint az átlag vagy a várhatóérték. Kvantilis: Az a valószínűségi változó, amely adott arányban osztja fel a (relatív) gyakorisági görbe alatti területet, vagy a rendezett mintát stb. Lapultsági együttható (vagy nevezik csúcsossági együtthatónak is): Szimmetrikus gyakorisági görbe esetén a normál eloszlás alakjától való eltérést fejezi ki. γ kurtosis n ( n-1) n æx- x = å ç ( n-1) ( n-) ( n-3) i è s ø ö 4 ( n-1) - 3 ( n- ) ( = 1 n- A normális eloszlásénál laposabb gyakorisági görbe lapultsági együtthatója negatív szám: γ kurtosis < 0. A normális eloszlás lapultsági együtthatója zérus: γ kurtosis = 0. A normális eloszlásénál csúcsosabb gyakorisági görbe lapultsági együtthatója pozitív szám: γ kurtosis > 0. i 3) 45

Néhány fogalom (5) Szimmetrikus eloszlás: Eloszlás, amelynek a ferdeségi együtthatója zérus: γ skewness = 0. Ferdeség (skewness ejtsd: szkjunesz): Jobbra vagy balra ferde eloszlás tulajdonsága. Ferdeségi együttható: γ skewness = ( n n -1) ( n n æx - x å ç -) i= 1è s Jobbra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan jobbra elnyúlik, akkor azt mondjuk, hogy jobbra dől, ekkor ferdeségi együtthatója pozitív szám: γ skewness > 0. (Általában ilyen a kisebb szilárdságú anyagok szilárdsági eloszlása.) Balra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan balra elnyúlik, akkor azt mondjuk, hogy balra dől, ekkor ferdeségi együtthatója negatív szám: γ skewness < 0. (Általában ilyen a nagyobb szilárdságú anyagok szilárdsági eloszlása.) i ø ö 3 46

Néhány fogalom (6) Módusz medián átlag (várhatóérték) viszonya ferde eloszlás esetén: Ferde eloszlás esetén a medián (középső valószínűségi változó) a gyakorisági görbe csúcsától a módusztól a ferdeség irányába esik. A medián mindig a módusz és a számtani átlag (várhatóérték) közé esik. Jobbra ferde eloszlás esetén a számtani átlag (várhatóérték) nagyobb, mint a medián (Me): m > Me Balra ferde eloszlás esetén a számtani átlag (várhatóérték) kisebb, mint a medián (Me): m < Me 47

Magyarországon 1980-00 között, az MSZ 470-:1980 szabvány szerint a beton nyomószilárdságának jellemző értékét (küszöbértékét, Rk) a beton nyomószilárdsági eloszlása ferdeségének feltételezésével (k tényező) számítottuk ki. Szórás Student tényező Jobbra ferde Szimmetrikus Balra ferde 48

Beton próbatestek vizsgálati eredménye Nyomószilárdság N/mm s = 3,8 35,1 31,9 34, 8,7 31,7 R m = 3,4 átlag,4 szórás Számpélda a vizsgálati eredmények eloszlása ferdeségének figyelembevételére a k tényezővel Értékelés a régi, ma már érvénytelen MSZ 4719:198 és MSZ 470/:1980 szabvány alapján Eloszlás tényező: k = 1,15 Student tényező: t =,015 k t s szorzat = 5,1 Jellemző érték: R k = = R m - k t s = 7,3 N/mm Megfelel, ha a megkövetelt minősítési érték: R k,nom = 5 N/mm A példa beli vizsgálati eredmények eloszlása balra (a kisebb szilárdságok tartománya felé) ferde. 49

5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*gamma(x/0,1494; 46,111)/0,1494 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde gamma eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 50 0 0

5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*lognorm(x; 1,91; 0,1456) 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde lognormális eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% Var1: N = 699 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 51 0 0

5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*extreme(x; 6,46; 0,795) 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde extrém (Gumbel) eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 5 0 0

Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) 40% Fp 0, = Distanz-gewichtete kleinste Quadrate 80 37% 37,% 60 34% 31% Példa a balra ferde legkisebb négyzetek eloszlásra 40 0 9% 8,0% 00 6% 180 % der Beob. 3% 0% 17% 18,5% 160 140 10 14% 13,4% 100 11% 9% 6% 80 Var: N = 699; Mw. = 181,554; Stdabw. = 5,11340099; Max. = 195,6; Min. = 163,6; D = 0,0965184816; p < 0,0100; Lilliefors-p < 0,00999999978 60 40 3% 0% 1,4% 1,0% 0,3% 0,1% 160 165 170 175 180 185 190 195 00 53 0 0 Fp 0,

Regressziós közelítés a legkisebb hibanégyzet összegek módszerével Egyenes együtthatóinak kétismeretlenes egyenletrendszere Elnevezések: = a * x b Ez a függvény alak (y i y) = hiba (y i y) = hibanégyzet Σ(y i y) = hibanégyzet összeg y + F F a F b ( y - y) = ( y - a * x - b) å å i i i Þ = min ( y - a * x - b ) = - * å i i * x i = 0 ( y - a * x - ) = - * å i i b = 0 åx * * å - * å i yi a xi b xi = - 0 Módszer neve ezért: Legkisebb hibanégyzet összegek módszere Az F hibanégyzet összeg függvénynek ott van szélső értéke, esetünkben minimuma, ahol a deriváltjainak ( F/ a és F/ b) az értéke zérus (érintője vízszintes): å y å i a * xi - b * n = - 0 54

D = å å x x å n x Regressziós közelítés egyenessel Összefüggés az ultrahang sebessége és a beton nyomószilárdsága között D a = å x å * y y å x å x å x å å n * D b = y x y Nyomószilárdság, N/mm 30 5 0 15 10 yi - y y = 0,013*x - 33,759 R = 0,6317 R = 0,7948 y i y a D a = b D = D D b 5 0 3000 3500 4000 4500 Ultrahang sebessége, m/s Meghatározandó részmennyiségek: x Sx i i x Sx i i y Sy i i x Sx i *y i *y i i 55

Másodfokú parabola együtthatóinak háromismeretlenes egyenletrendszere y = a* x + b* x+ c Ez a közelítő függvény alakja ( ) ( å ) i å i i i F = y - y = y -a* x -b* x -c Þmin F a F b F c ( ) =- å * yi -a * xi -b* xi - c * xi = 0 ( ) =-* å yi -a * xi -b* xi - c * xi = 0 ( y a x b x c) =- * å i - * i - * i - = 0 56

å å å å å 4 3 x * y -a* x -b* x - c* x = 0 i i i i i å å å 3 x * y -a* x -b* x - c* x = 0 i i i i i å yi - a * å xi - b * å xi - c * n = 0 Regressziós közelítés másodfokú parabolával D D = b = å å å å å å å å x x x 4 3 3 i i i xi * yi xi xi D x y x x i i i a = å i * i å i å i y x n i i å i å i 3 x x x x x n å å å å å å å i å i x x * y x 4 i i i i 3 x x * y x D i i i i x y n c = å å å å å å å å å å å å 4 3 x x x * y i i i i 3 x x x * y i i i i x x y i i i a Da = b D D b = c D = D D c Meghatározandó részmennyiségek: øsx x i i øsx x ii Sx i 3 ø x i 3 Sx i 4 ø x i 4 57 øsy y i ø x i i ø x i Sx i *y i Sx ii *y ii

A közelítés pontosságáról a korrelációs együttható (egyenes esetén), illetve a korrelációs index (görbe esetén) ad felvilágosítást. Mennél pontosabb a közelítés, az R korrelációs együttható, illetve index annál nagyobb és értéke mind inkább tart az 1,0- hez: R 1,0 R å( yi - y) 1- æ å yi å ç yi - è n = A korrelációs együtthatót, illetve indexet az irodalomban I-vel is jelölik. ø ö Nyomószilárdság, N/mm 30 5 0 15 10 Összefüggés az ultrahang sebessége és a beton nyomószilárdsága között 5 0 y = 0,013*x - 33,759 R = 0,6317 R = 0,7948 y = (4E-06)*x - 0,0171*x + + 19,984 R = 0,6399 R = 0,7999 3000 3500 4000 4500 58 Ultrahang sebessége, m/s

KÖSZÖNÖM A FIGYELMÜKET 59