MATEMATIKAI STATISZTIKA elemei Dr. Kausay Tibor Budapest, 01. február 1
[tömeg%] PÉLDA A gyakoriságfüggvény szerkesztésére
Ez nem egy jól sikerült gyakorisági hisztogram, mert az abszcissza tengely xi+1 xi osztásközeit túl kicsire vettem fel. xi+1 xi xi +1= = x 3 xi k
Az x abszcissza tengely felosztására nincs pontos szabály, de az osztáspontok megválasztása általában akkor szerencsés, ha minden x i+1 x i intervallumba körülbelül 3 n mintaelem jut, ahol n a mintaelemek száma. Példánk esetén az elemek száma n = 10, és ideális esetben 3 3 n = 10 = 154, elem jut egy intervallumba. A 19,0 15,5 = 3,5 terjedelmet tehát n/,154 = 10/,154 = = 4,6 ~ 5 intervallumra a legcélszerűbb osztani. Ehhez igazodva az új ábrán 7 darab x i+1 x i = 0,5 terjedelmű intervallumot alkalmaztunk. 4
k Várhatóérték = átlag = 17,17 Szimmetrikus görbe Szórás = 0,936958 Gyakorisági hisztogram Gyakorisági polinom Gyakorisági görbe x Ez a gyakorisági hisztogram már jobban néz ki, mert az abszcissza 5 tengely xi+1 xi osztásközei nagyobbak, mint az előző ábrán voltak.
Ez az ábra a gyakorisági ábra felülnézeteként értelmezhető. Az ábra nagyon jól szemlélteti, hogy a mérési eredmények elhelyezkedése az abszcissza tengelyen nem szimmetrikus. 6
Ez az ábra is a gyakorisági ábra felülnézeteként értelmezhető Max. Medián Terjedelem Gyakoriság, k Felső, 75 %-os kvantilis Ide esik a mérési eredmények 50 %-a Alsó, 5 %-os kvantilis Min. Medián = Az 50 %-os kvantilis neve, illetve értéke. A páratlan számú rendezett minta 7 esetén a középső elem értéke, a páros számú esetén a két középső elem átlagértéke.
Ha a k tapasztalati gyakorisági értékeket elosztjuk a mintaelemek n számával (ez példánk esetén n = 10 volt), akkor a p = k/n tapasztalati relatív gyakoriságokat kapjuk. Az ordináta tengelyre a p = k/n tapasztalati relatív gyakoriságokat felrakva a tapasztalati eloszlásfüggvényre, más néven tapasztalati sűrűségfüggvényre (p ) jutunk. A sűrűségfüggvény alatti terület értéke 1,0, vagy százalékban kifejezve 100 %. A p sűrűségfüggvény egyes x i abszcissza értékeitől balra vett görbe alatti területek értékét koordinátarendszerbe felhordva a (tapasztalati) p eloszlásfüggvényt kapjuk. 8
Eloszlásfüggvény és jellemzői (az MSZ 1888-5:1981 szabvány szerint) kőanyag szemhalmazok esetén általában adalékanyagok esetén 9
Valahol olvastam: A brüsszeli városvezetés a Brüsszelben élő Carl Friedrich Gauss német matematikust felkérte arra, hogy végezzen matematikai módszerrel lakossággal kapcsolatos felmérést. Könnyen lehetséges az, hogy a világ első ilyen felmérése született Gauss módszerével, és talán Brüsszel városa volt az első, aki megbízást adott a tudományos megalapozottságot igénylő munkára. Gauss Brüsszel lakosait kirendeltette a templom előtti térre, és ott a toronyból irányítva nagyságrend alapján rendezte őket, mégpedig úgy, hogy középen a legmagasabbak és két oldalra csökkenő magasságúakat állította. Így alakult ki a Gauss görbe, mely harang alakú. Ebből a görbéből számításokkal meghatározta, hogy a lakosságnak hány %-a nagyon alacsony, alacsony középméretű, magasabb és igen magas. 10
Carl Friedrich Gauss német matematikus portréja (Gottlieb Biermann festménye, 1887) Született: Német-római Birodalom, Braunschweig-Lüneburgi hercegség, Braunschweig, 1777. április 30. Meghalt: Hannoveri Királyság, Göttingen, 1855. február 3. Forrás: Wikipédia 11
A német márkát 001. december 31-én kivonták a forgalomból, mert 00. január 1-én az euro lett a fizetőeszköz Németországban. Tessék megfigyelni a pénzen a Gauss-görbét és egyenletét. Ezt a példányt 001. június 19-én vásároltam az OTP-ben: 1
A σ szórás 1,645-szeresét levonva az m várhatóértékből megkapjuk az 5 %-os alsó küszöbértéket 90 % ( jellemző értéket, 1,645 σ karakterisztikus értéket ), amelynél kisebb értékek előfordulásának valószínűsége 5 %. Görbe alatti terület: 0,05 1,0 A Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete. 13
14
Ha az építőanyagok tulajdonságait valószínűségi változóként fogjuk fel, akkor megfelelőségüket általában az 5 %-os alsó küszöbértékük alapján ítéljük meg. Kérdés, hogy az építőmérnök a valószínűségi eloszlás felső küszöbértékét használja-e a méretezés során? A válasz: Igen. A hatásokat (például szélteher, hóteher, födémek terhe, vízépítésben a legmagasabb vízszint stb.) általában felső küszöbértékükkel szokás figyelembe venni. 15
Említettük, hogy a Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete. Az elméleti várhatóérték (m) a Gauss görbe helyét, az elméleti szórás (σ) a Gauss görbe terjedelmét (terpesztését) határozza meg. Sűrűségfüggvény Eloszlásfüggvény 16
Néhány fogalom (1) Alulmaradási hányad: Az előzőekben említett görbe alatti terület (0,05, illetve 5 %) neve. Meghatározás: A teljes tételben a megfelelőségi feltételt ki nem elégítő rész részaránya. Alulmaradási tényező: Az előzőekben szerepelt 1,645 vagy más értékű szorzó. Meghatározás: Szorzó, amellyel a szórást megszorozva, és a szorzatot a várhatóértékből (az átlagból) kivonva, a küszöbértékre jutunk. Jele általában: λ n. Ilyen a későbbiekben tárgyalásra kerülő t n Student tényező is. Alulmaradási tágasság: Az alulmaradási tényező és a szórás szorzata. Meghatározás: Az alulmaradási tágasságot a várhatóértékből (az átlagból) kivonva a küszöbértéket (jellemző értéket, karakterisztikus értéket) kapjuk. Más szóval a várhatóérték (az átlag) és a küszöbérték különbsége. Jele a tapasztalati szórás esetén általában: λ 17 n s
Néhány fogalom () Valószínűségi változó: A független változó elnevezése a matematikai statisztikában. Jele: ξ (kszi) vagy x Várhatóérték: A tapasztalati átlagnak (számtani középértéknek) megfelelő elméleti fogalom a matematikai statisztikában, tehát a valószínűségi változó várhatóértéke, amely a p gyakoriságfüggvény alatti területnek az ordinátatengelyre vett elsőrendű nyomatéka: Jele: M(ξ) vagy m Átlag (számtani átlag): A várhatóérték elnevezése, ha nem elméleti, hanem tapasztalati érték. A mindennapok gyakorlatából ismert fogalom. Jele például: Szórás: A valószínűségi változó felvett értéke (ξ) és várhatóértéke (M(ξ) vagy m) közötti eltérés négyzetének várhatóértékéből vont négyzetgyök: D( ξ) M ( ξ) = ò ξ p' dξ (( M( ξ) - ξ) i =1 = M ) = Jele: D(ξ) vagy σ A szórás lehet elméleti szórás, vagy tapasztalati szórás. A fenti képlet és 18 jel az elméleti szórás képlete, illetve jele. A tapasztalati szórást s-sel szokták jelölni. n å( m - ξ n i ) x
Szórás meghatározása Az elméleti szórást úgy határozzuk meg, hogy 1. minden mérési eredményre (x i ) képezzük a várhatóérték (m) az egyes mérési eredmények (x i ) különbségét: (m x i ), és ezt eltérésnek* nevezzük,. ezeket a különbségeket négyzetre emeljük: (m x ) i, ezek neve eltérésnégyzet*, 3. a négyzet értékeket összegezzük: Σ(m x i ), ezt eltérésnégyzetösszegnek* hívjuk, 4. és az elméleti szórás esetén az eltérésnégyzetösszeget* elosztjuk az n mintaelemszámmal: (Σ(m x i ) )/n, 5. majd a hányadosból négyzetgyököt vonunk: σ n i=1 = å( m - Az elméleti szórás számításának feltétele, hogy n. Megjegyzés: Amit itt eltérés -nek hívunk, azt a regresszió számításnál hiba -nak nevezzük! n x i ) 19
A gyakorlatban az n feltétel nem teljesül, az n a gyakorlatban általában egy nagyon kis szám, és ezt a tapasztalati szórás számítása során figyelembe kell venni. Ez úgy történik, hogy az eltérésnégyzetösszeget nem n-nel, hanem (n-1)-gyel kell elosztani, tehát a tapasztalati (empirikus, korrigált) szórás (s) értéke: n å ( x - x ) i s = Mennél kisebb az n értéke, i= 1 annál jobban eltér az n -1 (n-1)/n hányados az 1-től, azaz adott eltérésnégyzetösszeg esetén minél kisebb az n mintaelemszám, a [(n-1)/n] aránynak megfelelően annál nagyobb a tapasztalati szórás (s), és ennek folytán kisebb küszöbérték adódik. Ez már csak azért is így van, mert ha az n értéke csökken, akkor nem csak a szórás (s), hanem az alulmaradási tényező (λ n ) is megnő, és ezáltal az alulmaradási tágasság (λ n s) növekedésének már oka 0 is van.
A Gauss-féle sűrűségfüggvény ábrán (emlékeztetésül itt balra látszik lekicsinyítve) bemutatott elméleti törvényszerűségek akkor igazak, ha n, illetve gyakorlatilag több mint 40, azaz n > 40 (n = mintaelem szám). Ha n (azaz n tart a végtelenhez), akkor a gyakorisági hisztogram és a gyakorisági polinom a gyakorisági görbéhez (azaz a gyakorisági hisztogram és a gyakorisági polinom tart a gyakorisági görbéhez); a tapasztalati átlag ( x ) tart az elméleti átlaghoz, amit várhatóértéknek hívunk (m); a tapasztalati szórás (s) tart az elméleti szóráshoz (σ). A laboratóriumi mérési (vizsgálati) eredményekből a tapasztalati átlagot és a tapasztalati szórást tudjuk kiszámítani, ezekből az elméleti átlagra (várhatóértékre) és az elméleti szórásra csak következtetni tudunk, és a mérési eredményekből a küszöbértéket (jellemző értéket, karakterisztikus értéket) a vonatkozó termékszabvány előírása alapján 1 határozzuk meg.
Tételezzük fel például, hogy egy hatalmas doboz (mondjuk akkora, mint a Műegyetem aulája) tele van egyforma, de különböző, fekete, fehér színű golyóval (például pingpong labdával), amelyek a hatalmas dobozban véletlenszerűen helyezkednek el, és amelyek arányát nem ismerjük. Vegyünk mintát képzeletben a hatalmas dobozból például egy kis szakajtóval (kenyértészta kelesztésére való fületlen kosárkával), számoljuk meg a mintában lévő fekete és fehér golyókat, és tegyük fel a kérdést: Mi a valószínűsége annak, hogy a mintában lévő fekete és fehér golyók aránya ugyanaz, mint a hatalmas doboz halmazában? Könnyű elképzelni, hogy vizsgálódásunk megbízhatósága annál nagyobb lesz, minél nagyobb a szakajtónk, azaz minél nagyobb a mintában lévő golyók n mintaelem száma. Teljes bizonysággal azonban csak akkor tudnánk a kérdésre válaszolni, ha a hatalmas dobozban lévő valamennyi golyót megvizsgálnánk. A gyakorlatban erre persze nincs lehetőségünk, de az n mintaelemszám növelésére törekednünk kell.
A vizsgálati minta n elemszáma a vizsgálatnak nagyon fontos jellemzője, mert jelentősen befolyásolja a vizsgálati eredmények értékelésével végzett termék-minősítés megbízhatóságát. Az n mintaelemszámot a vizsgálati (mérési) eredmények értékelése során a Student-féle eloszlás (nevezik t-eloszlásnak is) alkalmazásával lehet figyelembe venni. A Student eloszlás jellegzetessége, hogy az n mintaelemszámnak is függvénye, és ha n, akkor a Student görbe egyre jobban megközelíti a Gauss görbét, azaz Student görbe Gauss görbe 3
A Student-eloszlást William Sealy Gosset (Canterbury, Kent, 1876. június 13. Beaconsfield, Buckinghamshire, 1937. október 16.) angol statisztikus írta fel, és 1908-ban Student álnéven publikálta. W. S. Gosset 1908-ban W. S. Gosset a híres, 138-ben alapított Winchester College magángimnázium oxfordi kollégiumában kémiát és matematikát tanult, majd 1899-ben az ír Arthur Guinness (175. szeptember 4. 1803. január 3.) és fia világhírű dublini sörfőzdéjében helyezkedett el. Itt dolgozta ki matematikai statisztikai módszerét az árpa minőség vizsgálati eredmények megbízhatóságának megítélésére. Minthogy korábban egy másik munkatárs publikációjával kárt okozott a sörfőzdének, megtiltották az alkalmazottaknak, hogy tanulmányokat tegyenek közzé. Ez az oka annak, hogy W. S. Gosset álnéven írt. 4
A történethez tartozik, hogy Gosset nagyon jó munkakapcsolatba került az élettani laboratórium vezetőjével, Karl Pearson angol matematikussal (1857. március 7. 1936. április 7.), a χ -eloszlás és a korrelációs együttható kidolgozójával, akitől sokat tanult. A Student-féle eloszlás jelentőségét mégsem K. Pearson, hanem Ronald Aylmer Fisher (1890. február 17. 196. július 9.) angol genetikus és statisztikus, az F-eloszlás vagy Fisher-eloszlás kidolgozója ismerte fel. W. S. Gosset 1908-ban a Student-féle eloszlást a t betűvel jelölte, ezért azt t-eloszlásnak is nevezzük. A Student-féle vagy t-eloszlás sűrűségfüggvényének alakja: f ( n æ n ö Gç t 1 t è ø æ - 1 n 1 n 1 ö )( ) = æ ç + ö π n 1 è - Gç - ( ) ( - ) ø è ø n - ahol Γ a gamma-eloszlást jelöli: G t ( ( n ) ) = n-1 -t ò t e dt 0 ahol t = - logx és G (n+1) = n G (n) G (1) = 1 G (n) = (n 1)! 5
Az egyoldali 5 %-os alulmaradási hányadhoz tartozó Student tényező (t n ), 50 %-os elfogadási valószínűség mellett (Stange, K. Henning, H.-J., 1966) Mintaelem szám n 3 4 5 6 7 8 9 10 11 Szabadságfok n -1 1 3 4 5 6 7 8 9 10 Studenttényező t n 6,314,90,353,13,015 1,943 1,895 1,860 1,833 1,81 Mintaelem szám n 1 13 14 15 0 30 35 100 500 Szabadságfok n -1 11 1 13 14 19 9 34 99 499 Studenttényező t n 1,796 1,78 1,771 1,761 1,79 1,699 1,691 1,660 1,648 1,645 Esetünkben a Student-tényező az N(0,1) eloszlású t-eloszlás egyoldali 5 %-os alulmaradási hányadához tartozó t n valószínűségi változója (p = 0,05 értékhez 6 tartozó kvantilise, küszöbértéke).
Standardizált valószínűségi változó: Fogalommeghatározás (3) A ξ valószínűségi változó standardizáltja: ξ sta = M( ξ) - ξ D( ξ) azaz képezni kell az M(ξ) várhatóérték és a ξ valószínűségi változó különbségét, amelyet eltérésnek neveztünk (ezáltal a függvényt az origóba toljuk), és el kell osztani a D(ξ) szórással. Ez tulajdonképpen függvénytranszformáció. A standardizált valószínűségi függvény várhatóértéke: 0, szórása: 1. 7
8
Standardizált eloszlásfüggvény 100 %ból kivont ordinátája. Például 95 %, ha a standardizált eloszlásfüggvény ordinátája p% = 5 %, vagy 97,5 %, ha p% =,5 % stb. Ez a sor az f = 4 szabadság fokú (n = 5) standardizált Student-féle eloszlásfüggvény abszcisszáit (t) adja. Például tn=5 =,13 esetén p% = 5 %, vagy tn=,5 =,776 esetén p% =,5 % stb. Ez a sor (f = ) a standardizált Gaussféle eloszlásfüggvény abszcisszáit adja. Például t = 1,645 esetén p% = 5 %, vagy t = 1,960 esetén p% =,5 % stb. 9 p% = 10 5,5 1 0,5 0,1 0,05 %
Ha n, akkor Student görbe Gauss görbe (sűrűségfüggvények bal oldala) 0,40 y = Relatív gyakoriság 0,35 0,30 0,5 0,0 0,15 0,10 Student(x;) n=3 Student(x;5) n=6 Student(x;8) n=9 Student(x;11) n=1 Student(x;14) n=15 Student(x;34) n=35 Student(x;99) n=100 Student(x;499) n=500 Gauss(x;0;1) 0,05 0,00 x = Valószínűségi változó 30
Gauss- és Student-eloszlások standardizált sűrűségfüggvénye p Gauss St n=500 St n=100 St n=35 St n=15 St n=1 St n=9 St n=6 St n=3 x 1 x 3 x 5 x 7 x 9 x 11 x 13 x 15 x 17 31
Gauss- és Student-eloszlások standardizált sűrűségfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p ordináták) 3
Ha n, akkor Student görbe Gauss görbe (eloszlásfüggvények bal széle) és a 0,05 értékű (5 %-os) küszöbérték jobbra tolódik (nagyobb lesz) p = Alulm aradási hányadu 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,05 0 Gauss- és Student-elszlások standardizált eloszlásfüggvénye Küszöbérték x = Valószínűségi változó Student(x;) n=3 Student(x;5) n=6 Student(x;8) n=9 Student(x;11) n=1 Student(x;14) n=15 Student(x;34) n=35 Student(x;99) n=100 Student(x;499) n=100 Gauss(x;0;1) p=0,05 33
Gauss- és Student-eloszlások standardizált eloszlásfüggvénye p Gauss St n=500 St n=100 St n=35 St n=15 St n=1 St n=9 St n=6 St n=3 x 1 x 3 x 5 x 7 x 9 x 11 x 13 x 15 x 17 34
Gauss- és Student-eloszlások standardizált eloszlásfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p ordináták) 35
EGY KIS JÁTÉK Ezt a horgászt 1998-ban nagy szerencse érte, mert óriási, m hosszú harcsát fogott. Az év őszén arra kértem 55 főiskolai hallgatót, hogy becsülje meg a hal súlyát. Idézzük emlékezetünkbe, amit a mértékegységek tárgyalása során megbeszéltünk: az SI mértékegységrendszerben a súly mértékegysége N, a kg 36 pedig a tömeg mértékegysége.
Az óriás harcsa becsült súlya, 1. oldal Minta Rendezett minta Sorszám 1998. szeptember 14-16-án 55 főiskolai hallgató 500 180 1. a bemutatott fényképről megbecsülte a m hosszú harcsa súlyát 750 00. 1500 00 3. 5 %-os alsó küszöb, 00 00 4. 0,05*55=,75 N Hisztogram 700 00 5. 650 50 6. 800 300 7. Hétfő 14 óra, Menedzser 6. csoport 800 300 8. Hétfő 16 óra, Menedzser. csoport 800 350 9. Szerda 1 óra, Magasépítő 6. csoport 540 400 10. Szerda 14 óra, Magasépítő 3. csoport 500 400 11. Szerda 16 óra, Magasépítő 7. csoport 540 450 1. 850 500 13. 700 500 14. 750 500 15. 5 %-os alsó kvantilis, 0,5*55=13,75 N Hisztogram 100 500 16. A hallgatók közül huszonnégyen a súly helyett 400 500 17. a tömeget adták meg, 780 500 18. ugyanis [kg]-ban fejezték ki a kérdezett mennyiséget. 870 540 19. Ez a megkérdezett hallgatók 43,6 %-a. 600 540 0. A feltett kérdésre a helyes válasz: 00 540 1. A hal súlya körülbelül 450 N, mert a hal tömege 46 kg volt. 1000 570. Súly = Tömeg * Nehézségi gyorsulás = 500 600 3. = 46 kg * 9,81 m/sec = 500 600 4. = 451,6 kg*m/sec = 451,6 N 800 600 5. 800 630 6. 300 650 7. Hisztogram 800 650 8. Medián = 650 A rendezett minta középső elemének értéke. 37
Az óriás harcsa becsült súlya,. oldal Minta Rendezett minta Sorszám 600 650 9. 400 660 30. Matematikai statisztikai jellemzők 540 700 31. A becsült értékek átlaga: 637,090909 N 700 700 3. A becsült értékek szórása: 63,74553 N 500 700 33. A becsült értékek ferdesége: 0,49453691 1100 700 34. A becsült értékek csúcsossága: 1,153008 300 700 35. 950 70 36. Tehát a hallgatók a harcsa súlyát jelentős szórással túlbecsülték, 350 750 37. a ferdeség a nagy értékek irányába nyúló aszimmetrikus eloszlást jelez, 70 750 38. az eloszlás a normális eloszláshoz viszonyítva csúcsos eloszlás. 700 780 39. 180 800 40. 50 800 41. 75 %-os felső kvan- 810 800 4. tilis, 0,75*55=41,5 Hisztogram 650 800 43. 1000 800 44. 800 800 45. 450 800 46. 600 810 47. 700 850 48. 630 870 49. 500 950 50. 570 1000 51. 650 1000 5. 660 1100 53. 00 100 54. 38 00 1500 55.
Az óriás harcsa becsült súlya, 3. oldal Valószínűségi Valószínűség Relatív változó, N valószínűség 180 1 0,018 00 0,0364 00 3 0,0545 0,05*55=,75 00 4 0,077 Az 5 %-os alsó küszöb valószínűségi változója: 00 5 0,0909 Átlag - 1,645*szórás: 06, N 50 6 0,1091 Ekkor a szórások tartományában a valószínűségek 90 %-a található. 300 7 0,173 300 8 0,1455 350 9 0,1636 400 10 0,1818 400 11 0,000 450 1 0,18 500 13 0,364 500 14 0,545 500 15 0,77 500 16 0,909 500 17 0,3091 500 18 0,373 540 19 0,3455 540 0 0,3636 540 1 0,3818 570 0,4000 600 3 0,418 600 4 0,4364 600 5 0,4545 630 6 0,477 650 7 0,4909 Várhatóérték- 1,96* szórás: 13,1 N 5 %-os alsó küszöb valószínűsége: Várhatóérték - egyszeres szórás: 376,3 N 5 %-os alsó kvantilis: 500 N és valószínűsége: 0,5*55=13,75 Medián, lognormális eloszlás esetén: 556 N A becsült értékek várhatóértéke: 640 N Hisztogram Hisztogram Módusz, a lognormális eloszlás legnagyobb gyakoriságához tartozó valószínűségi változó: 455 N Ez valamivel több, mint az óriás harcsa tényleges, mért súlya (451,6 N). A becsült értékek szórása: 39 63,7 N
Valószínűségi Valószínűség Relatív változó, N Az óriás harcsa becsült súlya, 4. oldal valószínűség 650 8 0,5091 650 9 0,573 További matematikai statisztikai jellemzők 660 30 0,5455 A becsült értékek ferdesége: 0,495 700 31 0,5636 A becsült értékek csúcsossága: 1,153 700 3 0,5818 700 33 0,6000 55 főiskolai hallgató 700 34 0,618 fénykép után megbecsülte az óriás harcsa súlyát. 700 35 0,6364 Ezen az oldalon a becslés 70 36 0,6545 matematikai statisztikai feldolgozása található. 750 37 0,677 750 38 0,6909 780 39 0,7091 800 40 0,773 800 41 0,7455 75 %-os alsó kvantilis: 800 N 800 4 0,7636 és valószínűsége. 0,75*55=41,5 800 43 0,7818 800 44 0,8000 Normális eloszlás esetén Hisztogram A hisztogramot és a közelítő normális, illetve lognormális eloszlások gyakoriságfüggvényeit négy ábrán mutatjuk be. Hisztogram 800 45 0,818 az egyszeres szórások tartományában a valószínűségek 68,7 %-a, 800 46 0,8364 az 1,96-szoros szórások tartományában a valószínűségek 95 %-a található. 810 47 0,8545 850 48 0,877 870 49 0,8909 950 50 0,9091 Várhatóérték + egyszeres szórás: 903,7 N 1000 51 0,973 1000 5 0,9455 1100 53 0,9636 Várhatóérték + 1,96* szórás: 1156,9 N 100 54 0,9818 1500 55 1,0000 40
4 0 18 16 Variable VAR1 ; distribution: Normal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.104740, p = n.s. (szimmetrikus) normális eloszlás feltételezésével Chi-Square: 4.07308, df = 1, p =.0447777 Mó = Me = Várhatóérték Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,9 N No of obs 14 1 10 8 Szimmetrikus görbe 6 4 0 0 00 400 600 800 1000 100 1400 1600 1800 Y Expected Osztásköz: 00 N Category (upper limits) Valószínűségi változó, N 41
No of obs 13 1 11 10 9 8 7 6 5 4 3 1 0 0 100 00 300 400 Variable VAR1 ; distribution: Normal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.104740, p = n.s. (szimmetrikus) normális eloszlás feltételezésével Chi-Square: 5.596978, df = 4, p =.31364 Mó = Me = Várhatóérték 500 600 700 800 900 Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,8 N Szimmetrikus görbe 1000 100 1400 1600 1800 1100 1300 1500 1700 Y Expected Osztásköz: 100 N Category (upper limits) Valószínűségi változó, N 4
No of obs 4 0 18 16 14 1 10 8 Variable VAR1 ; distribution: Lognormal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.0849594, p = n.s. (jobbra ferde) lognormális eloszlás feltételezésével Mó Chi-Square: 9.705349, df =, p =.007813 Me Várhatóérték Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,6 N Várhatóérték = 636,8 N Jobbra ferde görbe 6 4 0 0 00 400 600 800 1000 100 1400 1600 1800 Y Expected Osztásköz: 00 N Category (upper limits) Valószínűségi változó, N 43
No of obs 13 1 11 10 9 8 7 6 5 4 3 1 0 0 100 00 300 400 Variable VAR1 ; distribution: Lognormal Az óriás harcsa súlya valószínűségének gyakorisági görbéje Kolmogorov-Sm irnov d =.0849596, p = n.s. (jobbra ferde) lognormális eloszlás feltételezésével Mó Chi-Square: 10.87659, df = 4, p =.080043 500 Me Várhatóérték 600 700 800 900 Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,8 N Várhatóérték = 633,6 N Jobbra ferde görbe 1000 100 1400 1600 1800 1100 1300 1500 1700 Y Expected Osztásköz: 100 N Category (upper limits) Valószínűségi változó, N 44
Néhány fogalom (4) Módusz: A környezetében a legnagyobb (relatív) gyakorisághoz tartozó valószínűségi változó, magyarán a (relatív) gyakorisági görbe csúcsához tartozó abszcissza érték, amelyből akár több is lehet. Medián (latin = középső): A p = 0,5 értékhez tartozó kvantilis. Mindig a módusz és az átlag (várhatóérték) közé esik. A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem normális eloszlásokat, mint az átlag vagy a várhatóérték. Kvantilis: Az a valószínűségi változó, amely adott arányban osztja fel a (relatív) gyakorisági görbe alatti területet, vagy a rendezett mintát stb. Lapultsági együttható (vagy nevezik csúcsossági együtthatónak is): Szimmetrikus gyakorisági görbe esetén a normál eloszlás alakjától való eltérést fejezi ki. γ kurtosis n ( n-1) n æx- x = å ç ( n-1) ( n-) ( n-3) i è s ø ö 4 ( n-1) - 3 ( n- ) ( = 1 n- A normális eloszlásénál laposabb gyakorisági görbe lapultsági együtthatója negatív szám: γ kurtosis < 0. A normális eloszlás lapultsági együtthatója zérus: γ kurtosis = 0. A normális eloszlásénál csúcsosabb gyakorisági görbe lapultsági együtthatója pozitív szám: γ kurtosis > 0. i 3) 45
Néhány fogalom (5) Szimmetrikus eloszlás: Eloszlás, amelynek a ferdeségi együtthatója zérus: γ skewness = 0. Ferdeség (skewness ejtsd: szkjunesz): Jobbra vagy balra ferde eloszlás tulajdonsága. Ferdeségi együttható: γ skewness = ( n n -1) ( n n æx - x å ç -) i= 1è s Jobbra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan jobbra elnyúlik, akkor azt mondjuk, hogy jobbra dől, ekkor ferdeségi együtthatója pozitív szám: γ skewness > 0. (Általában ilyen a kisebb szilárdságú anyagok szilárdsági eloszlása.) Balra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan balra elnyúlik, akkor azt mondjuk, hogy balra dől, ekkor ferdeségi együtthatója negatív szám: γ skewness < 0. (Általában ilyen a nagyobb szilárdságú anyagok szilárdsági eloszlása.) i ø ö 3 46
Néhány fogalom (6) Módusz medián átlag (várhatóérték) viszonya ferde eloszlás esetén: Ferde eloszlás esetén a medián (középső valószínűségi változó) a gyakorisági görbe csúcsától a módusztól a ferdeség irányába esik. A medián mindig a módusz és a számtani átlag (várhatóérték) közé esik. Jobbra ferde eloszlás esetén a számtani átlag (várhatóérték) nagyobb, mint a medián (Me): m > Me Balra ferde eloszlás esetén a számtani átlag (várhatóérték) kisebb, mint a medián (Me): m < Me 47
Magyarországon 1980-00 között, az MSZ 470-:1980 szabvány szerint a beton nyomószilárdságának jellemző értékét (küszöbértékét, Rk) a beton nyomószilárdsági eloszlása ferdeségének feltételezésével (k tényező) számítottuk ki. Szórás Student tényező Jobbra ferde Szimmetrikus Balra ferde 48
Beton próbatestek vizsgálati eredménye Nyomószilárdság N/mm s = 3,8 35,1 31,9 34, 8,7 31,7 R m = 3,4 átlag,4 szórás Számpélda a vizsgálati eredmények eloszlása ferdeségének figyelembevételére a k tényezővel Értékelés a régi, ma már érvénytelen MSZ 4719:198 és MSZ 470/:1980 szabvány alapján Eloszlás tényező: k = 1,15 Student tényező: t =,015 k t s szorzat = 5,1 Jellemző érték: R k = = R m - k t s = 7,3 N/mm Megfelel, ha a megkövetelt minősítési érték: R k,nom = 5 N/mm A példa beli vizsgálati eredmények eloszlása balra (a kisebb szilárdságok tartománya felé) ferde. 49
5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*gamma(x/0,1494; 46,111)/0,1494 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde gamma eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 50 0 0
5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*lognorm(x; 1,91; 0,1456) 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde lognormális eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% Var1: N = 699 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 51 0 0
5,8% Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*extreme(x; 6,46; 0,795) 4,7% 180,9% 0,0% 18,3% 19,% Példa a jobbra ferde extrém (Gumbel) eloszlásra 160 140 17,% 10 % der Beob. 14,3% 11,4% 10,7% 100 80 8,6% 7,3% 6,7% 60 5,7% 5,6% 40,9% 0,0% 3,3% 3,0% 1,1% 0,0% 0,0% 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 A gt 5 0 0
Histogramm (Tabelle in Arbeitsmappe1.stw 699v*699c) 40% Fp 0, = Distanz-gewichtete kleinste Quadrate 80 37% 37,% 60 34% 31% Példa a balra ferde legkisebb négyzetek eloszlásra 40 0 9% 8,0% 00 6% 180 % der Beob. 3% 0% 17% 18,5% 160 140 10 14% 13,4% 100 11% 9% 6% 80 Var: N = 699; Mw. = 181,554; Stdabw. = 5,11340099; Max. = 195,6; Min. = 163,6; D = 0,0965184816; p < 0,0100; Lilliefors-p < 0,00999999978 60 40 3% 0% 1,4% 1,0% 0,3% 0,1% 160 165 170 175 180 185 190 195 00 53 0 0 Fp 0,
Regressziós közelítés a legkisebb hibanégyzet összegek módszerével Egyenes együtthatóinak kétismeretlenes egyenletrendszere Elnevezések: = a * x b Ez a függvény alak (y i y) = hiba (y i y) = hibanégyzet Σ(y i y) = hibanégyzet összeg y + F F a F b ( y - y) = ( y - a * x - b) å å i i i Þ = min ( y - a * x - b ) = - * å i i * x i = 0 ( y - a * x - ) = - * å i i b = 0 åx * * å - * å i yi a xi b xi = - 0 Módszer neve ezért: Legkisebb hibanégyzet összegek módszere Az F hibanégyzet összeg függvénynek ott van szélső értéke, esetünkben minimuma, ahol a deriváltjainak ( F/ a és F/ b) az értéke zérus (érintője vízszintes): å y å i a * xi - b * n = - 0 54
D = å å x x å n x Regressziós közelítés egyenessel Összefüggés az ultrahang sebessége és a beton nyomószilárdsága között D a = å x å * y y å x å x å x å å n * D b = y x y Nyomószilárdság, N/mm 30 5 0 15 10 yi - y y = 0,013*x - 33,759 R = 0,6317 R = 0,7948 y i y a D a = b D = D D b 5 0 3000 3500 4000 4500 Ultrahang sebessége, m/s Meghatározandó részmennyiségek: x Sx i i x Sx i i y Sy i i x Sx i *y i *y i i 55
Másodfokú parabola együtthatóinak háromismeretlenes egyenletrendszere y = a* x + b* x+ c Ez a közelítő függvény alakja ( ) ( å ) i å i i i F = y - y = y -a* x -b* x -c Þmin F a F b F c ( ) =- å * yi -a * xi -b* xi - c * xi = 0 ( ) =-* å yi -a * xi -b* xi - c * xi = 0 ( y a x b x c) =- * å i - * i - * i - = 0 56
å å å å å 4 3 x * y -a* x -b* x - c* x = 0 i i i i i å å å 3 x * y -a* x -b* x - c* x = 0 i i i i i å yi - a * å xi - b * å xi - c * n = 0 Regressziós közelítés másodfokú parabolával D D = b = å å å å å å å å x x x 4 3 3 i i i xi * yi xi xi D x y x x i i i a = å i * i å i å i y x n i i å i å i 3 x x x x x n å å å å å å å i å i x x * y x 4 i i i i 3 x x * y x D i i i i x y n c = å å å å å å å å å å å å 4 3 x x x * y i i i i 3 x x x * y i i i i x x y i i i a Da = b D D b = c D = D D c Meghatározandó részmennyiségek: øsx x i i øsx x ii Sx i 3 ø x i 3 Sx i 4 ø x i 4 57 øsy y i ø x i i ø x i Sx i *y i Sx ii *y ii
A közelítés pontosságáról a korrelációs együttható (egyenes esetén), illetve a korrelációs index (görbe esetén) ad felvilágosítást. Mennél pontosabb a közelítés, az R korrelációs együttható, illetve index annál nagyobb és értéke mind inkább tart az 1,0- hez: R 1,0 R å( yi - y) 1- æ å yi å ç yi - è n = A korrelációs együtthatót, illetve indexet az irodalomban I-vel is jelölik. ø ö Nyomószilárdság, N/mm 30 5 0 15 10 Összefüggés az ultrahang sebessége és a beton nyomószilárdsága között 5 0 y = 0,013*x - 33,759 R = 0,6317 R = 0,7948 y = (4E-06)*x - 0,0171*x + + 19,984 R = 0,6399 R = 0,7999 3000 3500 4000 4500 58 Ultrahang sebessége, m/s
KÖSZÖNÖM A FIGYELMÜKET 59