Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 5. Megjegyzések. A tétel feltételei gyegíthetőek: elég, ha a függetle, azoos eloszlású változók várható értéke véges. Az állítás is erősíthető: valószíűségű kovergecia is bizoyítható. Ez azt jeleti, hogy P{: (X +X + +X )/ m} =. Ha =[0,] és P(A) az A hossza, akkor az valószíűségű kovergecia léyegébe a szokásos potokéti kovergecia. Ez em következik a sztochasztikus kovergeciából. A törvéy em jeleti azt, hogy az eddig em szerepelt értékek a jövőbe a vártál gyakoribbak leszek, haem csupá az eloszlás szerit kapott agyszámú érték állítja helyre a várt gyakoriságokat. További tételek A agy számok törvéyéek legelső verzióját még Beroulli bizoyította, idikátorváltozókra: eszerit azoos körülméyek között elvégzett függetle kísérletekél tetszőleges eseméy relatív gyakorisága tart az eseméy valószíűségéhez. (Az előző speciális esete: X idikátorváltozó.) Szimuláció Gyegé összefüggő valószíűségi változókra is átvihető a tétel Valódi határeloszlások Kérdés: lehet-e emelfajult valószíűségi változó a határérték? Tétel: ha X, X,... függetle valószíűségi változók, b számsorozat, melyre b és (X +X +...+ X )/b X valószíűséggel, akkor X valószíűséggel álladó. Gyege (eloszlásbeli) kovergecia Defiíció. X X gyegé, ha az eloszlásfüggvéyeikre teljesül: F (z) F(z) az F mide folytoossági potjába. Megjegyzés. Ez a kovergecia em mod semmit a valószíűségi változók közelségéről. =[0,], P= hosszúság, X =I [0,0.5] X=I [0.5,] eseté F (z)=f(z), azaz teljesül a gyege kovergecia. A gyege kovergecia következik a sztochasztikusból. A fetiekből az is látszik, hogy a határértékek csak az eloszlása érdekes. Tulajdoságok Azt em célszerű megköveteli, hogy F mide potjába teljesüljö a kovergecia: X = -/ (az / értéket felvevő elfajult eloszlású v.v.) eseté X X= 0 valószíűséggel. F (0)=, de F(0)=0 (F balról folytoos). A többi potba teljesül a kovergecia: F (z) 0, ha z<0, F (z) =, ha z>0. Ha X X sztochasztikusa, akkor X X gyegé is.
Cetrális határeloszlás tétel Legyeek X, X,, X,... függetle, azoos eloszlású valószíűségi változók. Tegyük fel, hogy =D (X) véges (m:=e(x i )). Tekitsük a stadardizált összegüket: X... X m Z : Ekkor Z gyegé kovergál a stadard ormális eloszláshoz, azaz X... X m P z ( z ) ahol a stadard ormális eloszlás eloszlásfüggvéye. Általáosítások Ha em azoos eloszlásúak a tagok, további feltételekre (pl. magasabb mometumok létezése, hasoló agyságredű összeadadók) va szükség. Gyege összefüggőség esetére is általáosítható a tétel. Stabilis eloszlások A ormális eloszlás kitütetett szerepe azo alapult, hogy teljesítette az ú. stabilitást: ha X,Y függetle, F eloszlásfüggvéyűek, akkor tetszőleges a,b eseté megadhatók számok, hogy ax+by eloszlásfüggvéye F(z+). (Azaz ax+by ugyaabba az eloszláscsaládba tartozik, mit az összeadadók.) Belátható, hogy függetle, azoos eloszlású változók összegéek ormálás utái határeloszlása csak stabilis lehet. Ugyaakkor mide ilye stabilis eloszlás elő is áll határeloszláskét. A cetrális határeloszlás tétel következméye, hogy ics más véges szórású stabilis eloszlás. Ugyaakkor em véges szórású va: pl. a Cauchy eloszlás, melyek sűrűségfüggvéye f(x)=/(+x ) A cetrális határeloszlás tétel lokális változata Legyeek X, X,, X,... függetle, azoos eloszlású valószíűségi változók. Tegyük fel, hogy =D (X) véges (m:=e(x i )) valamit, hogy abszolút folytoosak, szakaszokét folytoos sűrűségfüggvéyel. Tekitsük a stadardizált összegüket (Z ) és tegyük fel, hogy legalább egy -re Z sűrűségfüggvéye korlátos. Ekkor a Z változó f sűrűségfüggvéye (mely a tagok abszolút folytoossága miatt létezik) kovergál a stadard ormális eloszlás sűrűségfüggvéyéhez, azaz f ( t) e t Az idikátorváltozók esete Tétel (Moivre-Laplace) Legyeek X, X,, X,... függetle, azoos p paraméterű idikátorváltozók. Ekkor Y=X +X + +X biomiális eloszlású (,p) paraméterrel. k P( Y k) p ( p) k k e p( p) ( kp) p( p) A közelítés egyeletese jó olya k értékekre, melyek legfeljebb (p(-p)) vel térek el p-től (azaz a biomiális eloszlás cetrális tagjai jól közelíthetőek a megfelelő ormális eloszlás sűrűségfüggvéyével). biomiális eloszlás A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia (közvéleméykutatások) Természettudomáyok Meteorológia (pl. klímaváltozás) Geetika (chiptechológia) Pézügyi adatok stb.
Törtéet Táblázatokat a biztosítók már többszáz éve haszálak Maga a tudomáy fiatal tudomáy, alig 00 éves a múltja Agliai mezőgazdasági alkalmazások voltak az elsők Fejlődése felgyorsult az utóbbi évtizedekbe (számítógépek jóvoltából) Populáció Az a sokaság, amiek a jellemzőire kivácsiak vagyuk. Példák: Gyártmáyok Magyarország szavazópolgárai A Ft/Euro árfolyam api változásai Legtöbbször ics mód teljes körű (00%-os) adatfelvételre. Mita A populációból kiválasztott részhalmaz, amelyre voatkozóa az adatok redelkezésre állak. Mivel a mitavétel véletle, ezért a mitaelemek valószíűségi változók. Fotos szempot a reprezetativitás. Gyakorlatba legtöbbször feltesszük, hogy a mitaelemek függetleek. Adatok Mitavétel a populációból: eredméye a (statisztikai) mita A mitavétel módja is léyeges (legegyszerűbb eset: bármelyik elem ugyaakkora valószíűséggel kerül a mitába) Példa: Nem jó, ha a büfébe kérdezzük meg a diákokat az előadásról (em lesz reprezetatív) A mitavétel eredméye: (statisztikai) mita: x,x,,x számsorozat, az X,X,,X valószíűségi változó-sorozat realizációja. Matematikai statisztika helye a tudomáyok között Matematikai tudomáy, mert a valószíűségszámítás eredméyeire épül. Ugyaakkor a statisztika mideapi alkalmazása em midig kellőe precíz (teljesülek-e a feltételek?) Ezért léyeges, hogy a valószíűségszámítási eredméyeket alkalmazva fogalmazzuk meg következtetéseiket. (Párhuzamosa fogjuk tauli a valószíűségszámítást.) Példák. Egy hóapba 0 hurrikát figyeltük meg. Mit godoluk, meyi hurriká lesz jövőre ugyaebbe a hóapba?. Egy közvéleméykutatás sorá azt kaptuk, hogy 000 emberből 400 választaá az adott pártot. Mások szerit a párt 50%-ot fog kapi. Előfordulhat-e ez? Mekkora eséllyel? 3
Statisztikai elemzés lépései Tervezés (mit vizsgáluk, hogya gyűjtjük az adatokat) Adatgyűjtés Kódolás (ha szükséges) Elleőrzés: leíró statisztikákkal Elemzés: matematikai statisztika módszereivel Leíró statisztika Nem a véletle hatását vizsgálja, haem a kokrét mita megjeleítése, jellemzőiek kiszámítása a feladata. Adatok elredezhetők táblázatba (fotos: forrás feltütetése), illetve ábrázolhatók grafikusa. Adatok típusai (skálák) Nomiális: csak gyakoriságot tuduk számoli (pl. em, emzetiség) Ordiális (redezett): pl. értékelés szavakkal (rossz-közepes-jó), sorred egyértelmű, kvatilisek számolhatók Itervallum (pl. hőmérséklet: külöbség egyértelmű, de háyados em) Aráy (itt mide matematikai művelet értelmes), ez szerecsére a leggyakoribb Grafikus megjeleítés Ne legye túl Heti forgalom, MFt, XXZZ áruház boyolult! 35 30 Példák: 5 0 oszlopdiagram 5 0 X tegely: csoportok, 5 0 típusok S/R S/N T/R T/N Y tegely: Forgalom (Mio.Ft) gyakoriságok, értékek S/N S/R T/N kördiagram T/R Potszámok grafikus ábrázolása Hisztogram Adataikat osztályokba soroljuk (midegyiket potosa egybe, pl. az i-edik osztály: a i x<a i+ ), a csoportok relatív gyakoriságai megegyezek az osztály fölé rajzolt téglalap területével. Összterület: Példák Nics általáos érvéyű képlet az osztályok számára, általába /3 al lehet aráyos 0 50 00 50 00 0 30 40 50 60 70 80 potszám 4
0 0 0 0 30 50 0 0 0 30 40 0 5 Hallgatói adatok 60 70 Magasság 80 90 00 cm Cipőméret 36 4 48 38 40 44 46 Utazás apota 5 5 0 0 40 60 80 0 0 40 60 0 5 35 Testsúly 40 50 60 70 80 90 00 0 kg Taulás hetete 0 5 0 5 0 5 óra Sörök hetete Figyeljük meg az eloszlások alakját! Középértékek Mitaátlag: x... x x : ha az egyes értékek (l ) i gyakoriságai (f ) i adottak: fl... fklk x : Mediá: a sorbaredezett mita középső eleme (ha páros sok eleme va: a két középső átlaga). Kvartilisek: egyedelőpotok (/4-3/4, illetve 3/4-/4 aráyba osztják fel a redezett mitát) Az átlag érzékey a kiugró értékekre, a mediá viszot em. 0 00 00 300 400 perc 0 5 0 5 0 5 30 35 üveg boxplot Hallgatói adatok V V V3 V4 V5 Mi. :60.0 Mi. : 45.00 Mi. :36.00 F:95 Mi. :.000 st Qu.:7.0 st Qu.: 64.00 st Qu.:4.00 N:7 st Qu.:.000 Media :78.0 Media : 7.00 Media :43.00 Media : 5.000 Mea :77. Mea : 7.8 Mea :4.8 Mea : 6.036 3rd Qu.:8.0 3rd Qu.: 80.5 3rd Qu.:44.00 3rd Qu.: 8.000 Max. :98.0 Max. :0.00 Max. :48.00 Max. :4.000 V6 V7 Mi. : 0.0 Mi. : 0.000 st Qu.: 60.0 st Qu.: 0.000 Media : 9.5 Media :.000 Mea :04. Mea : 3.57 3rd Qu.:0.0 3rd Qu.: 5.000 Max. :360.0 Max. :34.000 Az egyes dobozok az alsó kvartilistól a felső kvartilisig tartaak. Középvoal a mediá. Gam A voalak a teljes terjedelmet felölelik, ha ez T5 Norm Ui05 az egyes iráyokba em agyobb a kvartilisek közötti külöbség.5- szereséél. Ha eze kívül is vaak potok, azokat külö-külö jeleíti meg. -4-0 4 6 Példa adatbázis: Napi középhőmérséklet 95-988 között Jauár -i középhõmérsékletek A hallgatói adatok emekéti botásba Magasság Testsúly -5 0 5 cm perc 60 70 80 90 36 40 44 48 0 00 00 300 Cipőméret Utazás apota kg óra üveg 50 70 90 0 5 0 5 0 0 5 5 5 35 Taulás hetete Sörök hetete Vajo melyik esetbe szigifikás az eltérés? Budapest Kompolt 5