I Tendenciák a szóródásban A sokaság Az adatbázis Műveletek sokaságokkal Centrális tendencia és variancia

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "I Tendenciák a szóródásban A sokaság Az adatbázis Műveletek sokaságokkal Centrális tendencia és variancia"

Átírás

1 I endenciák a szóródásban... 5 A sokaság Az adatbázis Műveletek sokaságokkal Centrális tendencia és variancia A sokaság eloszlása Normális eloszlás Gamma-eloszlás Chi-négyzet eloszlás Exponenciális eloszlás Weibull eloszlás Béta-eloszlás Student-eloszlás F-eloszlás Binomiális eloszlás Poisson-eloszlás Probability plot... 6 Sokaság és minta Statisztikai becslések Becslési kritériumok és módszerek Intervallumbecslés Statisztikai hipotézisek tesztelése A szóródás többváltozós jellemzése A variancia többváltozós általánosításai A kovariancia fogalma és tulajdonságai A kovariancia lineáris dekompozíciója A várható érték konfidencia tartománya Lineáris korreláció Az általánosított variancia A spektrális felbontás A szóródási mátrix öbbváltozós normalitás A variancia tömörítése: főkomponens változók elemzése Adatredukció és veszteség Az egyszerű struktúra igénye Függelék: A kanonikus variancia Függelék: A szinguláris érték felbontás Gyakorló feladatok A kanonikus korreláció A kanonikus súly (loading) A kanonikus korrelációk tesztelése Gyakorló feladatok Szóródás csoportosított sokaságban A kovariancia csoportközi struktúrája Diszkriminancia változók A Mahalanobis távolság... 60

2 4.. Diszkrimináló dimenziók feltárása Gyakorló feladatok Klaszteranalízis A megfigyelési egységek klaszterezése Agglomeratív klaszterformálás: láncmódszer Divizív jellegű módszerek A változók klaszterezése Blokk-klaszterezés Gyakorló feladatok Kategóriák korrespondencia analízise Egyszerű korrespondencia analízis Gyakorisági tábla a többváltozós térben Korrespondencia tengelyek és koordináták Ábrázolás a redukált térben A korrespondencia mátrix reprodukálása Előrejelzés: kiegészítő pontok ábrázolása Ábrázolás egyetlen dimenzióban öbbszörös korrespondencia analízis Korrespondenciák feltárása Előrejelzés prediktív térképpel Minta-likelihood-sokaság Likelihoodelméleti fogalmak A maximum likelihood becslés A score függvény tulajdonságai A Cramer-Rao egyenlőtlenség A maximum likelihood normálegyenletek Maximált likelihood normalitás esetén Hipotézisek likelihood alapú tesztelése A likelihood-arány teszt A Lagrange-multiplikátor elv A Wald elv Gyakorló feladatok... 3 II AZ ÁLALÁNOS LINEÁRIS MODELL Nevezetes eloszlások regressziós modelljei Normális eloszlás, lineáris regresszió Binomiális eloszlás, logit regresszió Poisson eloszlás, Poisson regresszió Lineáris regressziószámítás Reziduális jellemzők véges sokaságban Speciális magyarázó változók kezelése Paraméterbecslés A variancia-minimum kritérium Legkisebb négyzetek kritérium A magyarázó változók körének bővítése Standardizált regressziós paraméterek A modell magyarázó ereje A háromváltozós modell kétváltozós blokkjai... 30

3 8.6. A parciális kovariancia Útelemzés A parciális determináció Kanonikus korrelációk, reziduális kovariancia és Wilks-lambda A HA mátrix Valószínűségi következtetések Pontbecslések Intervallumbecslés Egymásba ágyazott modellek szelektálása Releváns magyarázó változó elhagyása Modelldiagnosztika Az outlierek vizsgálata Reziduális statisztikák Leverage mértékek Influence mértékek A multikollinearitás A változók körének kialakítása Stepwise algoritmusok Részmodellek szelektálása Főkomponensek a regressziós modellben Az általánosított legkisebb négyzetek módszere Rangsorolás preferált párosok alapján Legkisebb négyzetek megoldás Maximum likelihood megközelítés Gyakorló feladatok Az általános lineáris modell jellemzése A paraméterek maximum likelihood becslése Illeszkedés és deviancia Nemlineáris legkisebb négyzetek módszere III KLASSZIFIKÁCIÓS MÓDSZEREK Logisztikus regresszió Dichotom logisztikus regresszió Paraméterbecslés Nominális magyarázó változók és interakciók Konfidencia intervallumok Hipotézisek tesztelése Reziduális jellemzők Kontrollált párosítások logit modellezése Polichotom logisztikus regresszió Nominális kategóriák logitjai Ordinális kategóriák kumulatív logitjai Ordinális kategóriák párosított logitjai Egzakt, kismintás dichotom logit regresszió A feltételes likelihood Egzakt, feltételes következtetés a paraméterekre Gyakorló feladatok Bayes - klasszifikáció

4 . Normalitás alapú kvadratikus és lineáris klasszifikáció Mintavételi vonatkozások Homogenitásvizsgálat A diszkriminátor változók szelektálása A külső szóródás tesztelése Diszkrimináló dimenziók Jackknife klasszifikáció K-középpontú klaszterezés IV Faktoranalízis A faktormodell A faktorstruktúra A faktorok meghatározatlansága A faktormodell identifikálhatósága Image-analízis A becsült faktor-score Parciális korrelálatlanság Exploratív faktoranalízis A kanonikus faktormodell Ortogonális forgatás az egyszerű struktúráért Oblique rotáció, korrelált faktorokért A direct quartimin eljárás A promax módszer Orthoblique rotáció Skálaértékelés Faktormegoldások Főkomponensanalízis A főfaktorok módszere Maximum likelihood faktoranalízis Image-faktoranalízis: Second generation Little Jiffy Image- és anti-image korreláció Harris-faktorok Alfa-faktoranalízis Gyakorló feladatok Függelék Konfirmatív faktoranalízis A paraméterek becslése A faktormodell illeszkedése Önálló indexek Növekmény jellegű indexek A nemcentralitás szerepe az illeszkedésvizsgálatban Parszimónia-érzékeny illeszkedésvizsgálat A reziduális mátrix Dichotom (boolean) faktoranalízis

5 I endenciák a szóródásban 5

6 A SOKASÁG A sokaság A statisztika feladata a valóság jelenségeinek tömör, számértékekkel való jellemzése. Ennek során minél kevesebb adathordozóba sűrítjük a rendelkezésre álló információ minél nagyobb hányadát, hogy a vizsgált jelenség áttekinthetővé, kezelhetőbbé váljon. Ha az információ tömörítése csekély veszteséggel jár, akkor a jelenségben rejlő tendenciákra megbízhatóan tudunk következtetni. A tömörség, az egyértelműség és az összehasonlíthatóság alapját a számértékek teremtik meg. A statisztikai elemzés első mozzanata tehát a valóság számokra való leképezése, amit operacionalizálásnak nevezünk. A számszerű jellemzés kiindulópontja az információ megszerzése. Ezt megfigyelés és mérés útján érjük el, melyek két kérdést vetnek fel. Egyrészt, hogy kikre vonatkozik a vizsgálat, másrészt, hogy mely tulajdonságaik érdekesek számunkra. Azon egyedeket akikre megfigyelésünk irányul, megfigyelési egységeknek, azokat a vizsgálati szempontokat pedig, amelyek tekintetében a megfigyelési egységek más-más sajátossággal, változattal bírnak, változóknak, másképpen ismérveknek nevezzük. A megfigyelési egységek összessége statisztikai sokaságot alkot. A megfigyelés eredményeképpen derül ki, hogy egy kérdéses egyed az adott szempont szerint milyen konkrét sajátosságot mutat. Ezt a megfigyelés kimenetelének nevezzük. Az ismérv tehát azon lehetséges kimenetelek együttese, amelyek valamelyike (és csak egyike) a kérdéses szempont tekintetében adott egyedhez egyértelműen hozzárendelhető. Az ismérv lehetséges változatainak rendezett felsorolását az ismérv skálájának nevezzük. Ha az ismérvváltozatok egymásutániságának tárgyi tartalma van (pl. időbeli, vagy ordinális), akkor az ennek megfelelő elrendezésük kézenfekvő. A skála lehet adottság, de magunk is definiálhatunk skálákat. Statisztikai értelemben a mérés nem jelent mást, mint egy megfigyelési egységhez hozzárendelni a kérdéses ismérv skálájának a megfelelő elemét. Jelölje a továbbiakban x az érdeklődésünk homlokterében álló változót. Ekkor x tekintetében az i egyedre vonatkozó mérés eredményét x i azonosítja. Mennyiségi jellegű ismérv skáláját ismérvértékek, nem mennyiségi jellegű változó skáláját pedig kategóriák alkotják. Mennyiségi változók között megkülönböztetünk folytonos, és diszkrét változókat. A folytonos változók a számegyenes egy meghatározott intervallumán bármely értéket fölvehetnek, míg a diszkrét változók lehetséges kimenetelei fölsorolhatók. ermészetesen folytonos mennyiségi változók kimenetelei szegmentálhatók, és diszkrét mennyiségi ismérvek változatai is definiálhatnak kategóriákat. A statisztikai ismérvek egy speciális esetét az ún. alternatív, binomiális ismérvek képezik, amelyeknek két, és csak két kimenetele lehetséges. Ilyen pl. a nem szerinti hovatartozás, mely szerint valaki vagy férfi, vagy nő. Az alternatív ismérv fogalmához nevezetes, a csak 0 és értékekből álló mérési skála kötődik: ha ugyanis az alternatív ismérv egyik kimenetelét 0 azonosítja, akkor a másik kimenetelt az egyértelműen meghatározza. A (0,) értékű bináris változókat dummy, másképpen indikátor változóknak nevezzük. Attól függően, hogy egy mérési skála a sokaság milyen mélységű elemzését teszi lehetővé, a mérési skálák az alábbiak szerint osztályozhatók, hierarchizálhatók. Nominális skála: nem mennyiségi kategóriákból álló skála, ahol a kategóriák egymáshoz való helyzetének a megváltoztatása nincs hatással a sokaság jellemzőire. A megyéket pl. bármilyen sorrendben felsorolhatjuk, ezért kézenfekvő a semleges, de a keresést meggyorsító betűrendi sorrend alkalmazása. Ordinális skála: olyan mérési skála, amelynek lehetséges változatai a skálán fölsorolt sokaságot nem csupán tagolják, hanem az egyes részekhez való tartozástól függően rangsorolják is. Az ordinális skála változatainak a sorrendisége kötött. Egy futballmérkőzés lehetséges kimenetelei vereség, döntetlen, győzelem - ordinális skálát alkotnak. Intervallum skála: mennyiségi skála, amelynek a zéruspontja nem rögzített, és így csak az egyes ismérvértékek egymástól való távolsága informatív. Ilyenek pl. a hőmérséklet mérésére szolgáló skálák. Arány skála: a legmagasabb szintű mennyiségi skála, amelynek már a zéruspontja rögzített, tehát az egyes ismérvértékek egymáshoz való arányának is információtartalma van. Arányskálán mérjük pl. a gazdasági vállalkozások értékesítésből származó nettó árbevételét, tárgyi eszközeik értékét, adófizetési kötelezettségüket, vagy a kifizetett osztalék mértékét. Annál magasabb szintű egy mérési skála a hierarchiában, minél több elemzési lehetőséget rejt magában. A magasabb szintű skálák tartalmazzák az alacsonyabb szintűek által nyújtott elemzési lehetőségeket. Így az intervallum és arányskála eleve ordinalitást hordoz magában, s így a sokaságot nem csupán tagolja, hanem egyben rangsorolja is. A mérési skála a sokaságot egymást át nem fedő, diszjunkt részekre bontja. E részsokaságok valamely számszerű jellemzőinek a skála mentén történő fölsorolása statisztikai sort alkot. A statisztikai sorok típusai a skála jellegéhez kötődnek. Beszélhetünk területi, időbeli, mennyiségi és egyéb nominális sorokól. A nominális sorok valamilyen kategóriához való tartozást fejeznek ki. 6

7 . AZ ADABÁZIS. Az adatbázis a vizsgált jelenségről rendelkezésre álló információk, mérési eredmények összessége, adott formátumú felsorolása, azok elengedhetetlen azonosító, és megkülönböztető jegyeivel egyetemben. Az adatbázis alapvetően keresztmetszeti, vagy idősoros lehet. Valamely sokaság valamennyi megfigyelési egységét ugyanazon változók tekintetében jellemző, ugyanarra az időszakra (eszmei időpontra) vonatkozó mérési eredmények keresztmetszeti adatbázist alkotnak. Ezzel szemben az idősoros adatbázis egy kiragadott megfigyelési egység jellemzésére szolgáló változóknak, a vizsgált egyedet különböző időpontokban jellemző értékeinek az időrendi felsorolása. Az olyan adatállományt, mely mind keresztmetszeti, mind időrendi felsorolást tartalmaz, panel típusú, vagy longitudinális adatállománynak nevezzük. A többváltozós statisztikai módszerek tipikus adatállománya keresztmetszeti jellegű, melyre egy példát az alábbi tábla közöl.. tábla APEH vizsgálathoz kiválasztott 995 vállalkozás néhány, 000. évi mérleg- és eredményadatai Cég árgyi eszközök Nettó árbevétel Adózott eredmény Fizetett osztalék Fizetett adó Kiszabott bírság Alk. létszám ezer forint fő C C C C C C C C C C Nem mennyiségi jellegű változók is kifejezhetők számértékekkel, ún. dummy változók megfelelő rendszerének a segítségével, a következők szerint. A kategóriák egyikét ún. referencia csoportként rögzítjük, az összes többi kategóriát pedig olyan dummy változókként kezeljük, melyek megfigyelési egységenként attól függően veszik fel az vagy 0 értéket, hogy az adott megfigyelési egység esetében az illető kategória bekövetkezett-e a mérés során, vagy nem. Például, ha gazdasági társaságok a működési formájuk szerint a betéti társaság (Bt), korlátolt felelősségű társaság (Kft) és részvénytársaság (Rt) formák valamelyikéhez tartoznak, miközben a Bt a referencia csoport, akkor két nevezetesen a Kft és az Rt dummy változók 0 vagy értékei egyértelműen meghatározzák a társasági formához való tartozást:. tábla ársasági formák kategóriái ársasági forma Kft Rt Betéti társaság 0 0 Korlátolt felelősségű társaság 0 Részvénytársaság 0 Az egyes kategóriák együttes bekövetkezésének gyakoriságát közlő adatbázist jelent a dummy változók egy speciális rendszere, az indikátor mátrix. Az indikátor mátrix sorait az egyes megfigyelési egységek, oszlopait pedig valamennyi változó valamennyi lehetséges kimenetelei alkotják. A mátrixban jelzi, hogy az adott sor megfigyelési egysége adott változó melyik (és csak egy) változatához tartozik, egyébként a mátrix 0 elemeket tartalmaz. A mátrix sorösszegei tehát egyenlők egymással és a változók számával, oszlopösszegei pedig az egyes kategóriák előfordulási gyakoriságaival. A társasági forma mellett bevezetve a nyereséges () vagy veszteséges (0) megkülönböztetést is, az indikátor mátrix struktúrája az alábbi:.3 tábla Gazdasági társaságok indikátor mátrixa Cég Bt Kft Rt Nyereséges Veszteséges C C C

8 C C C C C C C Információ tömörítésre nyílik lehetőségünk, ha lemondunk a kategóriák cégekhez kötéséről, és csak a kategóriák együttes bekövetkezésének a gyakoriságát vizsgáljuk. Ezt az információt a gyakorisági, vagy másképpen kontingencia tábla tartalmazza. A gazdasági társaságok kontingencia táblája az következő:.4 tábla Gazdasági társaságok kontingencia táblája Eredméy ársasági forma Összesen Bt Kft Rt Nyereséges Veszteséges Összesen Ha a kontingencia táblát valódi kategóriák alapján képezzük, akkor az információ tömörítése során föllépő veszteség forrása csupán a megfigyelési egységek anonimmá válása, hiszen ilyenkor az adott kategória minden vonatkozó egyede egyforma. Ha a kategóriák mennyiségi változók intervallumai, akkor azt az információt is elveszítjük, hogy intervallumon belül mennyire különböztek az egyedek. Nyilvánvaló, hogy az indikátor mátrix mindig tömöríthető kontingencia táblába, és a kontingencia tábla is indikátor mátrixszá formálható.. MŰVELEEK SOKASÁGOKKAL. A sokaságot mindenekelőtt mérete jellemzi. A sokaság mérete alatt érthetjük egyrészt elemeinek N számosságát, másrészt az egyedeire összessített valamely mennyiségi jellemzőt. A sokaság méretének az ismeretében - további tulajdonságai feltárásában az alábbi műveletek segítenek. A megfigyelési egységek rangsorolása Egyetlen változó esetében a rangsorolás nem ütközik nehézségbe. Városok poros voltát összehasonlítandó, a szálló por fajlagos tartalma és az ülepedő por fajlagos tartalma tekintetében külön-külön rangsorolva azonban már különböznek a rangsorok. Ha tehát a városokat általában a portartalom szerint kívánjuk rangsorolni, akkor ez a feladat már nem egyértelmű. A rangsorolás végeredménye mindig egy speciális statisztikai sor, a rangsor. A sokaság csoportosítása Ha az x változó tekintetében heterogén sokaságon belül homogén csoportok, részsokaságok vannak, illetve sejthetők, akkor érdemes a sokaságon belül e részeket egymástól elkülöníteni. A csoportosítással szemben az alábbi követelményeket támasztjuk. Átfedésmentesség: egy megfigyelési egység x tekintetében csak egyetlen csoporthoz tartozzon. eljesség, egyértelműség: a sokaságnak minden egyes eleme egyértelműen besorolható legyen az előre definiált csoportok valamelyikébe. Homogenitás: a kialakult csoportok x tekintetében legyenek minél homogénebbek, a csoportok viszont minél markánsabban különbözzenek egymástól. A csoportosítás egyszerre szolgálja a sokaság struktúrájának a kirajzolódását, és adatredukciós igényünket. Minél homogénebbek ugyanis a csoportok, annál kisebb veszteséget szenvedünk el azáltal, hogy az egyedi adatok felsorolása helyett csupán az egyes csoportok jellegzetességeit, és a megfelelő csoporthoz tartozás tényét közöljük. Kategória változatok esetén adott kategória a saját szempontjából természetszerűleg homogén csoportokat definiál. Nem ez a helyzet akkor, ha a csoportosító ismérv folytonos mennyiségi, vagy nagyon sokféle kimenetellel bíró Például a hazai benzinkutak teljes éves forgalma akár literben, akár forintban. 8

9 diszkrét mennyiségi változó. Ez esetben a csoportok definiálása ugyanis a skála megfelelő intervallumokra, osztályokra bontását jelenti, ami szubjektív. Rövid osztályok homogén, hosszú osztályok várhatóan heterogén csoportokat eredményeznek. A túl rövid intervallumok kialakítása a csoportok számát növeli, és így a sokaság áttekinthetővé tételét nem szolgálja. Osztályközök képzése esetén x kategóriáit az osztályközök jelentik. A csoportok mellett a számosságukat felsorolva gyakorisági sort hozunk létre. A sokaságot egyidejűleg kettő, vagy kettőnél több ismérv alapján csoportosítva, majd a különféle kategóriák együttes bekövetkezési gyakoriságait táblába foglalva jutunk el a gyakorisági (kontingencia) táblához, melyet a korábbiakban már tárgyaltunk. Sokaságok összehasonlítása. Sokaságok számszerű jellemzőinek az összehasonlítása abszolút és relatív módon történhet. Az A és B jellemzők abszolút jellegű összehasonlítása az A-B különbségük, relatív jellegű összevetésük pedig az A/B arányuk képzésén alapul, ha ezeknek van tárgyi értelme. A V=A/B hányadost viszonyszámnak nevezzük, amelyben A a viszonyítandó, B pedig a viszonyítás alapjának a szerepét tölti be. A viszonyszámok között - az elemzési cél tekintetében - szokás megkülönböztetni a sokaság struktúráját leíró (a résznek az egészhez való viszonyát kifejező) megoszlási viszonyszámot, a sokaságok időbeli összehasonlítását szolgáló dinamikus viszonyszámot, és az intenzitási viszonyszámot. Ez utóbbi azt mutatja meg, hogy valamely sokaság egy egyedére egy másik sokaságból hány egyed jut. Mintavétel a sokaságból. Amennyiben a sokaság egészét nem tudjuk, vagy nem akarjuk megfigyelni, de az egészére szeretnénk valamilyen következtetést levonni, úgy kénytelenek vagyunk ezt a sokaságnak egy alkalmasan kiválasztott része, az ún. minta alapján megtenni. A mintavétel végrehajtása lehet véletlenszerű és nem véletlenszerű, visszatevéses, vagy visszatevés nélküli. A mintavételt akkor tekintjük véletlen jellegűnek, ha még a mintavételt megelőzően rögzítjük az egyes sokasági egyedek mintába kerülésének a valószínűségét. Visszatevéses mintavételkor valamely sokasági érték nem csak egyszer, hanem többször is kiválasztásra kerülhet, s így súlyozottan szerepelhet a mintában. A sokaság csonkolása, nyesése Ha a sokaság valamely egyedei a vizsgált változó(k) tekintetében extrém (kiugróan alacsony vagy magas) értékkel bírnak, úgy ezek az értékek a sokaság egészéről kialakított általános képet torzítják, így elhagyásuk az elemzésből kézenfekvő. Előrejelzés A sokaság egyedeinek az értékét - előrejelzési, vagy adatredukciós céllal - helyettesíthetjük is. Ha már ismert, realizálódott értéket cserélünk ki egy másikra, akkor ex post előrejelzésről, ha pedig még nem ismert értéket rendelünk egy egyedhez, akkor ex ante előrejelzésről, másképpen prognózisról beszélünk..3 CENRÁLIS ENDENCIA ÉS VARIANCIA.3 Reprezentálja a sokaság i sorszámú (i=,,...,n) egyedét az x változóban realizálódott megfigyelés x i értéke. A sokaság egyedei a kérdéses ismérvben különböznek egymástól, másszóval szóródnak. Feladatunk a szóródásban rejlő tendenciák, és az azokat kiváltó okok feltárása. Kérdés, hogy az egyedek mint pontok milyen centrum körül, milyen mértékben, és milyen típusú valószínűségi (gyakorisági) eloszlás mentén szóródnak. A szóródás tényét az egyedeknek egymástól, vagy egy kitüntetett egyedtől mért távolságában, illetve hasonlóságában ragadhatjuk meg. A szóródás centrumát a centrális tendencia alakítja, miszerint az egyedek túlnyomó többsége egy tipikus egyed körül tömörül. A szóródás e centrumát centroidnak nevezzük, melyet valamely középérték definiál. Kétféle középértéket különböztetünk meg: helyzeti középértéket, és átlagot. Míg az előbbiek a rangsorolt sokaságon belül elfoglalt helyük alapján közepesek, addig az átlagok számított értéke az ismérv skáláján alkot középpontot. A helyzeti középértékek a medián, és a módusz. A mediánt azon egyed kimenetele reprezentálja az x ordinális változó tekintetében, amely két, közel egyenlő részarányú alsó és felső szegmensre bontja a sokaságot. Folytonos mennyiségi változó esetében ezt az értéket az x (0.5) rendű kvantilis közelíti. A módusz ezzel szemben az ismérv skáláján a leggyakrabban előforduló kimenetel. A módusz tehát nominális skálán is értelmezett, de nem mindig létezik, nem mindig egyértelmű, és inkább kategóriaként mintsem pontszerű értékként van statisztikai tartalma. Az x változó számtani átlaga az N elemű sokaságban az az x szám, amellyel a sokaság valamennyi egyedének az A különbségképzés elengedhetetlen feltétele, hogy A és B azonos mértékegységű legyen. 9

10 értékét helyettesítve, azok összege nem változik meg: x N xi N i A továbbiakban az átlagos megfigyelési egység reprezentálja a sokaság centroidját. A számtani átlagtól vett di xi x eltéréseket képezve, azok algebrai összege zérus. Az átlagtól mért eltéréseket tartalmazó, s ezáltal zérus átlagúvá transzformált d i változót centrált változónak nevezzük. Ha a és b megfigyelésről megfigyelésre nem szóródó konstansok, akkor az y i=a+bx i transzformált változó átlaga: y a bx. Az egyedi értékek r. hatványának a számtani átlaga az r-ed rendű (vagy r-edik) momentumot eredményezi: N r xi N i ahol r=,, Speciálisan, a másodrendű momentum jelölése: 3 N N xi qi qx. N i N i Az átlag körüli szóródás alapvető, egyváltozós mértéke a variancia, mely a centrált változó másodrendű momentuma: 4 M Var( x) ( x x). r N x i N i Kihasználva, hogy a számtani átlagtól vett eltérések algebrai összege zéró, a variancia a másodrendű momentumnak, és a számtani átlag négyzetének a különbsége: 5 N N Var( x) ( xi x)( xi x) ( xi x) xi N i N i N N xi x x N N. (.) i i q x. A (.) azonosság a variancia momentum felbontását eredményezi. E tételre a továbbiakban mint a VMD szabályra hivatkozunk. 6 A variancia sohasem negatív, és csak akkor zérus, ha a sokaság minden egyede ugyanakkora értéket vesz fel az x változóban. A variancia invariáns az egyedi értékek ugyanazon konstanssal való növelésére (csökkentésére), viszont érzékeny azok konstanssal való szorzására. etszőleges a tengelymetszet és b meredekség mellett az y i=a+bx i megfigyelések varianciája: Var( y) Var( a bx) b Var( x). A variancia pozitív négyzetgyöke a szórás (az angol nyelvű terminológiában standard deviation ): x Var( x). A zérus átlagúvá, és egységnyi varianciájúvá transzformált x x x (.) változót standardizált változónak nevezzük. Dummy változót illetően, ha az N elemű sokaságban K számú és (N-K) számú 0 egyed van, akkor az elemek részaránya P=K/N, és ez a dummy változó P+(-P)0=P átlaga, és a második momentum is egyben. A VMD szabály alapján tehát a dummy változó varianciája Var(0,) P P P( P). Nemzéró értékösszeg mellett a variancia akkor maximális, ha a sokaság egyetlen tagja birtokolja a teljes x 3 Megjegyezzük, hogy a másodrendű momentum pozitív gyöke az ún. négyzetes, vagy kvadratikus átlag. 4 A Var(x) és x jelöléseket ekvivalens módon használjuk, megválasztásuk a formulák könnyebb áttekintését szolgálja. N 5 Figyeljük meg, hogy x ( x ) 0 i i x. 6 A Variancia Momentum Dekompozíciója. 0

11 értékösszeget, miközben minden más egyed értéke zérus. A VMD szabály alapján a variancia általában: x x x... xn x Nx Z Z... Z N x N x ahol, 0 Z i i az i. egyed relatív részesedése a teljes értékösszegből, és. Mivel e relatív Nx részesedések négyzetösszege legfeljebb lehet, ezért a variancia feltételesen maximált értéke max Nx x (.3) hiszen ez konstans átlag mellett csökkenne, ha az egységnyi értékösszegből való relatív részesedések között mind kisebb lenne, mint. 7 Zéró átlagos érték mellett a variancia végtelen nagy lehet. Mértékegységtől független szóródási mutató a relatív szórás (coefficient of variation), mely a szórást a számtani átlag százalékában fejezi ki, ha az nem nulla. x 0 x N i Z Ha a sokaságból n elemű mintát veszünk és a mintabeli szórás értékéből következtetni akarunk a sokaság egyébként ismeretlen szórására, akkor a torzítatlan következtetés érdekében ún. korrigált szórást számolunk, az alábbi módon: s x x n n ( i ) (.4) i ahol s a korrigált szórás konvencionális jelölése. 8 A nevezőbeni (n-) korrekció csak kicsiny mintaelemszám mellett okoz jelentős számszaki eltérést..4 A SOKASÁG ELOSZLÁSA.4 A végtelen sokaság egyedei értelemszerűen nem sorolhatók fel teljeskörűen, ezért valamely x jellemzőjének kimenetelei megfigyelésről megfigyelésre bővülnek, véletlenszerűen alakulnak. Végtelen sok megfigyelést végezhetünk adott típusú izzó teljes élettartamát, vagy biztonsági övek be-, illetve be nem kapcsolt voltát vizsgálva. Az ilyen esetekben x véletlen változó, és valószínűségeloszlását aszerint definiáljuk, hogy folytonos, vagy diszkrét jellegű. 9 A folytonos véletlen változót az eloszlásfüggvényével definiáljuk, ami azon esemény valószínűségét mondja meg, hogy a változó realizálódott értéke kisebb lesz egy előre rögzített x 0 értéknél: F(x 0) = Pr(x<x 0) ahol F(.) monoton, 0F(.), F(- )=0 és F( )=. Az eloszlásfüggvényt általánosságban az. ábra szemlélteti...ábra Az eloszlásfüggvény Az eloszlásfüggvény x szerinti deriváltja az ún. sűrűségfüggvényt nyújtja, melynek jelölése: f(x)=f (x). Definíciójából adódóan: 0 x0 F( x ) f ( x) dx. Geometriai inerpretációt illetően az eloszlásfüggvény értéke a sűrűségfüggvény alatti megfelelő területet jelenti. A sűrűségfüggvény alatti teljes terület egységnyi: f ( x) dx. Legyen most az x változó diszkrét kimenetelű, vagyis x=k, ahol k=0,,,...integer. Ekkor x eloszlását a Pr(x=k) valószínűséggel definiáljuk. Követelményünk szerint Pr( xk). k 0 i 7 E megállapításnak a főkomponensek, és a faktorok forgatása, az egyszerű struktúra kialakítása során lesz jelentősége. 8 A torzítatlanság fogalmát, és általában a mintából történő következtetés elméletét lásd Hunyadi(00). 9 Jelen könyv a valószínűségelméleti fogalmakat csak olyan mélységben és terjedelemben tárgyalja, ami egyéb témakörök megértéséhez elengedhetetlen.

12 Végtelen sokaság esetén az átlagos érték megfelelője a várható érték, mely definíció szerint folytonos esetben, és E( x) x f ( x) dx E( x) k Pr( x k) k 0 diszkrét x változó esetén. A variancia ennek megfelelően a várható értéktől vett eltérések négyzeteinek a várható értéke. Folytonos esetben például: Var( x) x E( x) f ( x) dx. A diszkrét eset ennek analógiája. Végtelen sokaság esetén a momentum is várható értékként, mégpedig a változó x r hatványának E(x r ) várható értékeként értelmezendő. A gyakorisági (valószínűségi) eloszlás tendenciájának árnyalt jellemzését szolgálják az x változó kitüntetett értékei, a kvantilisek. ekintsük a diszkrét x változó x x... xr... x K ordinális skáláját, melyen az referencia kategória a skálát két -egy alsó, és egy felső - szegmensre bontja úgy, hogy megállapodás szerint a referencia kategóriát is az alsó szegmenshez soroljuk. Ekkor a skála a sokaságot magát is egy alsó és egy felső szegmensre hasítja szét aszerint, hogy ki tartozik az alsó, és ki a felső szegmens kategóriáihoz:. Jelölje az alsó szegmens részarányát a sokaságon belül p (0<p<), a felsőét pedig (-p). Ekkor a referencia kategória x r értékét p-ed rendű kvantilisnek nevezzük, mert a rendezett sokaságot p:(-p) arányban bontja ketté, és amelynek jelölése ezért: x (p). A folytonos mennyiségi ismérvek skáláján kitüntetett rendű kvantilis értékeket keresünk azért, hogy a mérési skálán sorbarendezett sokaságot nevezetes arányban bontsuk két részre. Nevezetes rendű kvantiliseket az /p =, 3, 4, 5, 0, 00 esetekben kapunk. Ezek nevei rendre: medián, tercilis, kvartilis, kvintilis, decilis, percentilis. Például x (0.95) a 95. percentilis, amelyre teljesül, hogy sokaság 95 százaléka az alsó, a további 5% pedig a felső szegmens eleme. Míg a diszkrét sokaság valamely egyedének x értékéről mindig meg tudjuk mondani, hogy milyen rendű kvantilisnek felel meg, addig egy előre rögzített p rendhez nem mindig rendelhető hozzá a sokaság valamelyik konkrét egyedének az értéke. Látható tehát, hogy ha a kérdéses kvantilis értékének a meghatározásakor egy, az elemeinek a felsorolásával megadott sokaságra kell hagyatkoznunk, akkor a kvantilis meghatározása nem egyértelmű. A kvantilisek paraméteres matematikai eloszlások fontos jellemzői, mert értékük rögzített eloszlástípus mellett numerikus integrálással egyértelműen meghatározható. A valószínűségelmélet számos nevezetes eloszlástípust ismer. Ezek közül most csak azokat definiáljuk, melyeket a későbbiekben használunk, vagy amelyek más eloszlások származtatásának az alapjául szolgálnak. Az alábbiakban tárgyalt folytonos eloszlások kiragadott kvantilis értékeit a könyv végén közölt táblázatok tartalmazzák..4. NORMÁLIS ELOSZLÁS.4. A normális eloszlás az ún. exponenciális eloszláscsalád tagja. Sűrűségfüggvénye: x f ( x) e ahol μ és σ az eloszlás paraméterei, és ahol (- <x< ), (- <μ< ) és σ>0. A sűrűségfüggvény alakját, vagyis az x sokaságot e két paraméter egyértelműen meghatározza. A későbbiekben, ha x normális eloszlású μ és σ paraméterekkel, akkor erre a tényre az x N, formában hivatkozunk. Látható, hogy adott paraméterek mellett az x pontban a sűrűségfüggvény f(x) értéke kalkulálható, de f(x) [Pr(x)=0]. Folytonos véletlen változó konkrét értékének a bekövetkezése nem lehetetlen esemény, de a valószínűsége zéró. Mivel azonban az f(x) értékek érzékeltetik, hogy különböző x értékek különböző eséllyel (relatív gyakorisággal) fordulnak elő, a sűrűségfüggvény f(x) értékét jelen könyvben az x pont egyedi likelihoodjának (esélyességének) nevezzük. x a x f x r (.5)

13 x N normális eloszlású változó várható, átlagos értéke Az, Ex ( ), varianciája pedig Var( x). Ezért a z x változó standardizált, zéró átlagú, és varianciájú változó, tehát eloszlása z~n(0,) standard normális, sűrűségfüggvénye pedig értelemszerűen: f () z e z. (.6) A standard normális eloszlás eloszlásfüggvényének föntartott jelölése Φ(.), melynek értéke a z pontban: z ( z) e dt p. Az a z (p) érték, melyre Φ(z (p))=p teljesül, a standard normális eloszlás p-rendű kvantilisét képezi. A standard normális eloszlású változó kvantiliseinek meghatározása p ismeretében már nem igényli semmilyen paraméter ismeretét, ezért tetszőleges részletességgel táblába foglalható (lásd a.táblát). A ( p) zp értéket a p valószínűség probitjának nevezzük: t ( ) p probit p p z. Számítógépes programba való beilleszthetőség érdekében közöljük a (z) valószínűség Hastings-féle közelítését, mely az alábbi: 5 ( z) p f ( z) ai i z ahol a = , a = , a 3= , a 4= , a 5= Ennek inverz függvénye közelítőleg: i i0 3 z ( p) ln p b c i i0 ln p ln p ahol 0<p0.5, b 0=.5557, b = , b =0.0038, c 0=, c =.43788, c =0.8969, c 3= Ha p>0.5, akkor a helyén (-p) szerepel, és az eredményül kapott z érték negatívját vesszük..4. GAMMA-ELOSZLÁS.4. Az x0 nemnegatív véletlen változó gamma eloszlású,θ>0 pozitív paraméterekkel, ha sűrűségfüggvénye: f ( x) x e x (.7) ( ) ahol x a x e dx a a teljes gamma-függvény. Ha a egész, akkor ( a) ( a )! és az eloszlás neve ekkor Erlang eloszlás. A gamma eloszlás nevezetes momentumai az alábbiak: r r ( r) Ex, E x, E x ( ), Var ( x ) E x E x. ( ).4.3 CHI-NÉGYZE ELOSZLÁS.4.3 A gamma eloszlás speciális esete θ=, és =ν/ paraméterezéssel a chi-négyzet (χ ) eloszlás, melynek sűrűségfüggvénye 0 i i / / i 3

14 f ( x) x e x ahol (/ ) ha ν páratlan. A ν paramétert (mely nem kötelezően integer) az eloszlás szabadsági fokának nevezzük. Lévén gamma eloszlás θ=, és =ν/ paraméterezéssel, nevezetes momentumai a szabadsági fok függvényében: Ex, Ex 4 ( ), Var( x). A chi-négyzet eloszlás szorosan kötődik a normális eloszláshoz, mert definíció szerint egymástól független, standard normális eloszlású változók négyzetösszege chi-négyzet eloszlást követ ν=n szabadsági fokkal, z N 0, ahol n az összeadandók száma: Innen egyenesen következik, hogy... n n n (.8) z z z z. (.9). (.0) n n z.4.4 EXPONENCIÁLIS ELOSZLÁS.4.4 A gamma eloszlás másik speciális eseteként = választással a (negatív) exponenciális eloszlás adódik, x f ( x) e (.) sűrűségfüggvénnyel, melynek várható értéke és varianciája.4.5 WEIBULL ELOSZLÁS.4.5 E x E x Var x,, ( ). Az x0 nemnegatív véletlen változó Weibull eloszlású,θ>0 pozitív paraméterekkel, ha sűrűségfüggvénye: x f ( x) x e. (.) Látható, hogy a negatív exponenciális eloszlás a Weibull eloszlásnak is speciális esete, = helyettesítéssel. Egy másik speciális esetként a Rayleigh eloszlát nyerjük, az =, és paraméterezéssel:.4.6 BÉA-ELOSZLÁS.4.6 x f ( x) xe. Az 0x véletlen változó béta eloszlást követ a,b>0 pozitív paraméterekkel, ha sűrűségfüggvénye a b f ( x) x ( x) (.3) B( a, b) ahol B(a,b) a teljes béta-függvényt jelöli: ab B( a, b). a b.4.7 SUDEN-ELOSZLÁS.4.7 A Sudent féle t-eloszlást az alábbi sűrűségfüggvény definiálja: 4

15 x f( x) (.4) B, ahol a ν>0 paraméterre, mint szabadsági fokra hivatkozunk, és az x változó tetszőleges értéket felvehet. A t-eloszlás zéró várható értékű, és szimmetrikus a várható értékre. Egy standard normális, és egy korrigált (szabadsági fokkal osztott) chi-négyzet eloszlás hányadosa Sudent t-eloszlást követ, ha a változók egymástól függetlenek, az alábbi transzformáció szerint: z n n t n. (.5).4.8 F-ELOSZLÁS.4.8 Az F-eloszlás sűrűségfüggvénye kétparaméteres, és csak nemnegatív x értékekre van értelmezve: f ( x) B x, ahol a ν,ν >0 paramétereket szabadsági fokoknak nevezzük. Az F-eloszlás eredete szintén a normális eloszlás, mert két független, korrigált chi-négyzet eloszlású változó hányadosa F-eloszlást követ az alábbi paraméterekkel: ahol n a számláló, m pedig a nevező szabadsági foka. n m A fenti eloszlások között a χ, a t- és az F-eloszlás elsősorban a véletlen módon kiválasztott mintából történő következtetéseket szolgálja..4.9 BINOMIÁLIS ELOSZLÁS.4.9 n m F nm, (.6) (.7) Legyen megfigyelésünk eredménye csak kétféle kimenetel ( vagy 0 tulajdonság) valamelyike, rendre P és (-P) valószínűséggel, ahol 0<P<. ekintsünk n számú, független megfigyelést, melyek között az kimenetelek k száma binomiális eloszlású véletlen változó, és valószínűségi eloszlása (a k pont egyedi likelihoodja P és n paraméterekkel) n k nk Pr( x k) P P (.8) k P n exp kln nln ln (.9) P P k ahol k=0,,,...,n egész. Ha n= elemű mintát veszünk, akkor k={0,}. A P/(-P) arányt odds aránynak nevezzük, melynek logaritmusa az ún. logit: P logitp ln P E kanonikus paraméterrel: logit odds e P. logit odds e 5

16 A várható érték E(x)=P, és a variancia Var(x)=P(-P). A egyedek k száma a mintában binomiális eloszlású, p=k/n részaránya pedig egyben a mintaátlag is, mely nagy minták esetén a centrális határeloszlás tétele értelmébenaszimptotikusan normális: n k d P( P) xi p N P, n i n n..4.0 POISSON-ELOSZLÁS.4.0 Adott eseménynek egységnyi időszak alatti x gyakorisága (árvizek száma évente) Poisson eloszlású λ pozitív paraméterrel, és a valószínűségeloszlás (likelihood) függvénye: k e Pr( x k) expk ln ln( k!) (.0) k! ahol k=0,,,...a Poisson eloszlásnak mind a várható értéke, mind a varianciája a paraméterrel egyezik meg..4. PROBABILIY PLO.4. Azon kérdés eldöntését segítendő, hogy a sokaság az x változó tekintetében kielégítően leírható-e valamely formalizált valószínűségi eloszlással az alábbiakban egy grafikus eljárást, a probability plot módszerét ismertetjük.legyen a vizsgált x változó eloszlásfüggvénye feltevésünk szerint F(x), standardizált z változatának eloszlásfüggvénye pedig G(z), melyekre teljesül az F(x)=G(z) azonosság. Ekkor a standardizált z változó értéke egyrészt egy egyenes szerint alakul x függvényében, másrészt a G(.) függvény inverzének az értéke F(.) függvényében, az alábbiak szerint: x x z G F( x) Ha x nem egzaktan az F(.) eloszlásból származik, akkor közös koordináta rendszerben ábrázolva z e kétféle értéke nem esik egybe. Minél közelebb fekszenek a G - (x) pontok a referencia egyeneshez, annál jobban leírható a sokaság x tekintetében az F(.) eloszlással. A normalitás vizsgálata normal probability plot szerkesztését igényli, ahol G - szerepét speciálisan a standard normális eloszlás eloszlásfüggvénye tölti be, amely inverzének egyféle empirikus közelítése a i /3 N /3 módon történik, ahol i=,...,n a nemcsökkenő módon rendezett sokaság egyedeinek a sorszámát jelenti. Lényegében - a referencia egyenes z i pontjai által reprezentált tényleges sokaságot a G i pontdiagram által reprezentált normális eloszlású sokasággal vetjük össze. ekintsük () cigaretta márka átlagos (fajlagos, mg/szál) kátrány tartalmát. A kátrány tartalom eloszlásának jellemzésére szolgáló normal probability plot az. ábrán látható.. ábra A kátránytartalom eloszlásának normál probability ábrája Az ábráról leolvasható, hogy a vizsgált márkák tekintetében a kátránytartalom eloszlása közel áll a normális eloszláshoz. 6

17 SOKASÁG ÉS MINA Sokaság és minta ekintsünk egy véges x,...,x N, vagy egy végtelen, az f(x θ,...,θ q)=f(x θ) sűrűségfüggvénnyel definiált sokaságot, melyben az x változó valamely θ jellemzője (paramétere) ismeretlen, de döntésünk ennek vélt ismeretén alapszik. Ekkor a végtelen sokaság teljes megfigyelése lehetetlen, a véges sokaság teljeskörű megfigyelése pedig esetenként ésszerűtlen: például költséges, vagy egy termék megsemmisülésével jár. Ilyenkor a sokaságból mintát veszünk, és a minta alapján következtetünk a sokaság egészére. A mintából történő következtetés exploratív formája a becslés, konfirmatív formája pedig a hipotézisek tesztelése. A becslést akkor alkalmazzuk, mikor semmilyen ismeretünk nincs a sokaság jellemzőjéről, ezért a minta ismeretében közelítjük annak értékét. A hipotézisben viszont valamilyen előzetes elképzelésünk fogalmazódik meg a sokaság adott jellemzőjével kapcsolatban, és ilyenkor a mintát szembesítjük az elképzelésünkkel. A minta alapján csupán döntést hozunk, de meg nem bizonyosodhatunk. Mintának nevezzük a sokaság azon kitüntetett egységeit, melyekre a megfigyelésünk kiterjed. A minta mindig véges, elemszáma n, és elemei rendre: x,x,...,x n. A mintavétel részlegessége (nem teljes körű volta) miatt a következtetések mintevételi hibát hordoznak. Ha a hibázás valószínűségét kontrollálni akarjuk, akkor a mintát véletlen módon kell kiválasztanunk. Véletlen jellegű a mintavétel, ha a sokaság bármely egyede ismert valószínűséggel kerülhet be a mintába. Ekkor az x i mintaelem (i=,,...,n) mintavételi ingadozásnak van kitéve, vagyis mintavételi véletlen változó. Ha a mintaelemeket egymástól függetlenül választjuk ki, akkor a mintaelemek független véletlen változók, és valószínűségi eloszlásuk megegyezik a sokaság eloszlásával. Az ilyen típusú mintát független, azonos eloszlású (FAE) mintának nevezzük. Ha például a sokaság normális eloszlású μ várható értékkel, és σ varianciával, vagyis x~n(μ,σ ), és x,x,...,x n. FAE minta, akkor valamennyi mintaelem ugyanilyen normális eloszlású: x i~n(μ,σ ), ahol i=,...,n. A θ paraméterre vonatkozó mintából történő következtetés eszköze mindenkor a mintaelemek valamely ˆ ( x ˆ ˆ, x,.., x n ) n transzformációja, amely leképezést statisztikának nevezzük. Ilyen statisztikák például a mintabeli átlag, variancia, részarány, vagy egyéb más, komplikáltabb formulák. A mintavételi hiba nagyságának behatárolása érdekében a statisztikák mintavételi eloszlásának jellemzőit (típusát, várható értékét, és varianciáját) ismernünk kell. Mintavételi eloszlás alatt a kérdéses ˆ statisztikának minden létező mintán szóródó eloszlását értjük. A mintavételi várható érték jelölése Var ˆ. A mintavételi variancia pozitív gyökét, a, a mintavételi varianciájé pedig E ˆ mintavételi szórást standard hibának (Standard Error) nevezzük, melynek jelölése. SAISZIKAI BECSLÉSEK. SE ˆ. Valamely ismeretlen θ sokasági paraméter értékének közelítő meghatározását becslésnek nevezzük. Ennek eszköze a ˆ becslőfüggvény, mely egy alkalmasan megválasztott statisztika. A becslőfüggvény mintavételi változó, mely pontbecslést nyújt az ismeretlen paraméterre. A becslés megbízhatósága azon múlik, hogy mintavételről mintavételre haladva a becslőfüggvény milyen centrum körül, és milyen mértékben szóródik. Intuitíve is látható, hogy ez nagymértékben függ a minta elemszámától, továbbá attól is, hogy a sokaság maga milyen centrum körül, és mennyire szóródik... BECSLÉSI KRIÉRIUMOK ÉS MÓDSZEREK.. Alapvető követelmény, hogy a becslőfüggvény mintavételi varianciája a lehető legkisebb legyen. Nézzük, hogy milyen tényezők befolyásolják ezt a varianciát. Jelölje ˆ a pontbecslés eltérését a paraméter valódi értékétől (tehát a hibát), Q=ε pedig a hiba négyzetét. Ekkor a pontbecslés mintavételi varianciája megegyezik a hiba varianciájával, mely a variancia momentum felbontása alapján az alábbi formában is írható: 0 0 A variancia invariáns változójának konstanssal való eltolására. 7

18 ˆ ˆ ˆ ˆ Var( ) Var( ) Var( ) q MSE( ) Bias ( ) ahol MSE (mean square error) az átlagos négyzetes hiba, Bias pedig az átlagos hiba, melynek előjeles értéke a becslés torzításának a mértékét és irányát mutatja. A fentiek fényében a becslőfüggvény (ceteris paribus):. orzítatlan, ha a torzítás mértéke zéró: ekkor az átlagos hiba zéró, a becslőfüggvény várható értéke pedig megegyezik a paraméterrel, és a mintavételi variancia megegyezik az átlagos négyzetes hibával,. Aszimptotikusan torzítatlan, ha a mintaelemszám növelésével a torzítás mértéke zérushoz tart, 3. Konzisztens, ha a mintaelemszám növelésével a MSE zérushoz tart, 4. Leghatásosabb, ha torzítatlan becslőfüggvények körében legkisebb a varianciája. orzított becslőfüggvények között nem mindig készíthető egyértelmű hatásossági rangsor a MSE alapján, mivel az átlagos négyzetes hiba függvénye lehet az ismeretlen, becsülendő paraméternek is. Adott θ paraméter pontbecslésére több, különféle tulajdonságú becslőfüggvény is szóba jöhet. A variancia pontbecslésére használhatjuk például a klasszikus (nem korrigált) mintabeli varianciát is. Közülük azt preferáljuk, amelyik leginkább eleget tesz a pontbecsléssel szemben támasztható ésszerű követelményeknek, becslési kritériumoknak. A becslőfüggvény formulája némely esetben intuitív módon kínálkozik. Ha a becsülendő paraméter tárgyi (statisztikai) tartalommal bír, akkor kézenfekvő a mintabeli analógiáját használni pontbecslésként. Az analógia módszerére példa a mintaátlag, vagy a mintabeli variancia. A becslőfüggvény formulájának a meghatározása azonban nem mindig kézenfekvő, ilyenkor valamilyen algoritmus szolgáltat becslőfüggvényt. Előre rögzítjük a becslőfüggvénnyel szembeni elvárásunkat, majd meghatározzuk azt a formulát mely eleget tesz ezen követelménynek. A becslőfüggvény meghatározására irányuló módszereket becslési módszereknek nevezzük. A sokaság θ,θ,...,θ p paramétereinek a pontbecslésére szolgáló nevezetes becslési módszerek az alábbiak. Legkisebb négyzetek (LKN) módszere: a becslésből eredő, mintán belül tapasztalt hibák négyzetösszege minimális legyen: n x ˆ ˆ ˆ i xi p Errori n ˆ (,,..., ) min. i i Itt az ˆx függvény olyan előrejelzési szabály, mely nem föltétlenül igényli nevezetes eloszlás ismeretét. Momentumok módszere: Adott típusú eloszlás becsült paramétereivel kalkulálva, valamely momentum egyezzen meg a mintán belüli megfelelő rendű empirikus momentum értékével: n r ˆ ˆ ˆ xi mr (,,..., p ) ( r,,..., p) n i ahol E(x r )=m r(θ,θ,...,θ p). Ez a módszer tehát ismert eloszlás paramétereinek a becslésére szolgál, és az m r függvény fejezi ki az r. rendű momentum, és a sokasági paraméterek kapcsolatát. A becslés praktikusan egy egyenletrendszer megoldását jelenti, melynek annyi egyenlete van, ahány becsülendő paraméter. Maximum likelihood (ML) módszer: Ha a minta együttes bekövetkezésének az esélyét (likelihoodját) a becslésünk értéke befolyásolja, akkor válasszuk azt a becslést, amely mellett a mintaelemek együttes realizációjának a likelihoodja maximális: L ˆ, ˆ,..., ˆ max. (.) minta Ha az x i mintaelemek egymástól független véletlen változók, akkor az együttes minta likelihoodja a mintaelemek egyedi likelihoodjainak a szorzataként áll elő: L n ˆ ˆ ˆ ˆ ˆ ˆ p L xi p minta i p,,...,,,,..., max. (.) A maximum likelihood módszer eloszlásfüggő eljárás, hiszen a likelihood értékének a kalkulálása konkrét valószínűségi eloszlást igényel. A következő alfejezetek a likelihooddal kapcsolatos kategóriákat tovább tárgyalják.. Példa Határozzuk meg az x változó sokasági átlagának becslőfüggvényét az LKN módszerrel úgy, hogy a becslés négyzetes távolsága a mintaelemektől összességében (SS: sum of squares) minimális legyen: Deriválással: n i x ˆ i SS min. 8

19 n SS x ˆ i 0 ˆ i amiből a számtani átlag definíciója szerint becslésként a mintaátlag adódik:. Példa ekintsük az x~n(μ, rögzített) normális eloszlás μ paraméterének becslését a ML módszerrel, és n= elemű minta, vagyis az x mintaelem alapján. Ekkor a mintaelem egyedi likelihoodja: x L( x ) e max. Ez nyilvánvalóan akkor maximális, ha az exponenciálisban szereplő kifejezés zéró, tehát ˆ x n. ˆ x. Ha a mintavételt kiterjesztjük n eleműre, akkor a minta együttes likelihoodja (a maximálás szempontjából érdektelen konstans tag elhagyásával): n i i L( x) L( x)... L( xn ) e max. Ez pedig akkor maximális, ha az exponenciálisban szereplő négyzetösszeg minimális. Vagyis ebben az esetben a ML módszer a LKN módszerre vezethető. A négyzetösszeg pedig akkor minimális, mikor a μ paraméter becslése a mintaátlag: ˆ x. n.. INERVALLUMBECSLÉS.. x A becslés megbízhatóságának a javítása érdekében érdemes a pontszerű becslést egy minél szűkebb, de magas megbízhatóságú ún konfidencia intervalummá bővíteni, mely adott - megbízhatósággal lefedi az ismeretlen θ paramétert: Pr ˆ ˆ ahol ˆ a és ˆ f a a konfidencia intervallum alsó és felső határa, (alacsony) értéke pedig az alulbecslés, illetve a fölülbecslés kockázatának az (előzetesen rögzített) összege. Ez utóbbi két kockázatot (ha egyéb szempont mást nem indokol) egyenlő arányban osztjuk meg. A kockázatok rögzített értékének birtokában ismernünk kell a becslőfüggvény eloszlását, hogy kalkulálhassuk a megfelelő kvantiliseit: Pr ˆ ˆ. A ˆ ( / ) ( / ) ( / ) és ˆ ( / ) kvantilisek numerikus integrálással határozandók meg. Az esetek többségében nem közvetlen a becslőfüggvény, hanem valamely ( ˆ ) ˆ monoton transzformációjának az eloszlását ismerjük, melynek kvantilis értékei esetleg táblázatos formában is rendelkezésre állnak. Ezért a numerikus integrálást megkönnyítendő, a Pr ˆ ˆ ˆ. ( / ) ( / ) konfidencia tartomány határait keressük meg. Legyen ugyanakkor általában ( ˆ ), és így az eredeti konfidencia tartomány alsó határát a ( ˆ ˆ f ) és ( ˆ ˆ a ) értékek közül a kisebbik, felső határát pedig a nagyobbik érték adja. A konfidencia intervallum képzésének két nevezetes esete, mikor becslőfüggvényre képezzük úgy, hogy vagy ismert annak standard hibát is a mintából, f ˆ Eˆ torzítatlan, normális eloszlású SE ˆ standard hibája, vagy kénytelenek vagyunk e se ˆ segítségével becsülni. Az ismert standard hibával standard normális eloszlásúvá transzformálva a becslőfüggvényt, az alábbi valószínűségi azonosságot tudjuk definiálni: melyből a ˆ Pr z / z / SE ˆ 9

20 / ˆ ˆ z SE (.3) szimmetrikus konfidencia tartomány adódik. Ha a standard hibát mintából kell becsülnünk, akkor a se(.) becsült standard hiba is mintavételi változó, melynek mintavételi eloszlása szükséges a konfidencia intervallum képzéséhez. együk fel, hogy a becsült, és a valódi standard hiba között a k-szabadsági fokú CHI-négyzet eloszlás egyértelmű kapcsolatot teremt, a következők szerint: se SE Ez esetben a t-eloszlás (.5) definíciója alapján ˆ / se ˆ ˆ ˆ k. k k szabadsági fokú t k-eloszlású, és az alábbi valószínűségi azonosságát felírását teszi lehetővé: ˆ ˆ ˆ SE Prt / t / k k. seˆ k k Innen a konfidencia intervallum: ˆ t se ˆ. (.4). SAISZIKAI HIPOÉZISEK ESZELÉSE. / A statisztikai következtetések konfirmatív jellegű alkalmazása hipotézisek vizsgálatán alapul. Hipotéziseket fogalmazunk meg, mikor a sokaság jellemzői ismeretlenek, további döntéseink viszont vélt ismeretükön alapulnak. A hipotézis szubjektív képünket vetíti a sokaságra, ezt a képet átmenetileg érvényesnek fogadjuk el, majd mintára támaszkodva döntésünk eredménye az állítás fönntartása, vagy elvetése. A hipotézisvizsgálat fogalmi rendszere, és a döntéshozás menete az alábbi. A hipotézisnek egy véletlen mintavétel eredményével való szembesítését a hipotézis tesztelésének nevezzük. Mivel a sokaság a tesztelés során ismeretlen marad, ezért hozhatunk helyes, de helytelen döntést is. Hibát követünk el egyrészt a hipotézis helytelen elvetésekor, illetve a hipotézis helytelen elfogadásakor. Alapvető szempont a hibás döntés(ek) valószínűségének a minimálása. A hipotézisben verbálisan foglalt állítás statisztikai vizsgálata annak formalizálását igényli. A hipotézisben foglalt állítások a gyakorlatban a sokaság eloszlásának a jellemzőire - paramétereire, vagy az eloszlás típusára vonatkoznak. artalmi szempontból az igaznak vélt, vagy remélt állítást kutatási hipotézisként kezeljük. A mintavétel célja annak alátámasztása, hogy a kutatási hipotézis áll közelebb a valósághoz. A kutatási hipotézis elfogadását szigorítjuk úgy, hogy a tagadását jelentő állítást tekintjük kiindulásként érvényesnek, ettől az állítástól pedig csak akkor állunk el, ha ezt a konkrét mintánk markánsan indokolja. A kutatási hipotézis komplementerét teszt hipotézisnek nevezzük, mert ezt tekintjük átmenetileg érvényesnek s ennek fenntarthatóságát vagy elvetését teszteljük a próba során. Értékkészletüket tekintve a statisztikailag tesztelhető hipotézisek lehetnek egyszerűek és összetettek. Egyszerűnek nevezzük a hipotézist, ha egyetlen rögzített számszerű értékre, és összetettnek, ha számértékeknek valamely tartományára vonatkozik. A hipotézisvizsgálat végrehajtásakor a teszt hipotézisben foglalt állítások halmazából csak a kutatási hipotézisnek legkevésbé ellentmondót helyezzük szembe a kutatási hipotézissel, mert ha ezt sem tudjuk tovább fenntartani, akkor a méginkább ellentmondókat még kevésbé tarthatjuk fenn. Egyszerű teszt hipotézis triviálisan legkevésbé mond ellent a kutatási hipotézisnek. Összetett teszt hipotézis alkalmazásakor viszont úgy kell rögzíteni a kutatási hipotézist, hogy a teszt hipotézis állításai közül egyértelműen kiragadható legyen a kutatási hipotézisnek legkevésbé ellentmondó. A kutatási hipotézis érvénytelen voltát jelentő, annak legkevésbé ellentmondó egyszerű állítást null hipotézisnek, az alternatíváját képező kutatási hipotézist pedig alternatív hipotézisnek nevezzük. A nullhipotézist H 0, az alternatív hipotézist pedig H jelöli. 0

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés Elek Péter 1. Valószínűségi változók és eloszlások 1.1. Egyváltozós eset Ismétlés: valószínűség fogalma Valószínűségekre vonatkozó axiómák

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Több valószínűségi változó együttes eloszlása, korreláció

Több valószínűségi változó együttes eloszlása, korreláció Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1 STATISZTIKAI ALAPOK Statisztikai alapok_eloszlások_becslések 1 Pulzus példa Egyetemista fiatalokból álló csoport minden tagjának (9 fő) megmérték a pulzusát (PULSE1), majd kisorsolták ki fusson és ki nem

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM Gazdaság- és Társadalomtudományi Kar Üzleti Tudományok Intézet. Dr. Hajdu Ottó.

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM Gazdaság- és Társadalomtudományi Kar Üzleti Tudományok Intézet. Dr. Hajdu Ottó. BUDAPESI MŰSZAKI ÉS GAZDASÁGUDOMÁNYI EGYEEM Gazdaság- és ársadalomtudományi Kar Üzleti udományok Intézet Dr. Hajdu Ottó Ökonometria oktatási segédanyag Budapest, 04 ARALOM A sokaság... 4. Az adatbázis...

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1 STATISZTIKAI ALAPOK Statisztikai alapok_eloszlások_becslések 1 Pulzus példa Egyetemista fiatalokból álló csoport minden tagjának (9 fő) megmérték a pulzusát (PULSE1), majd kisorsolták ki fusson és ki nem

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI, Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus. KOKI, 2015.09.17. Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze.

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb

Részletesebben

Bevezető Mi a statisztika? Mérés Csoportosítás

Bevezető Mi a statisztika? Mérés Csoportosítás Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető

Részletesebben

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687) STATISZTIKA 10. Előadás Megbízhatósági tartományok (Konfidencia intervallumok) Sir Isaac Newton, 1643-1727 Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Többváltozós lineáris regresszió 3.

Többváltozós lineáris regresszió 3. Többváltozós lineáris regresszió 3. Orlovits Zsanett 2018. október 10. Alapok Kérdés: hogyan szerepeltethetünk egy minőségi (nominális) tulajdonságot (pl. férfi/nő, egészséges/beteg, szezonális hatások,

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Logisztikus regresszió

Logisztikus regresszió Logisztikus regresszió 9. előadás Kvantitatív statisztikai módszerek Dr. Szilágyi Roland Függő változó (y) Nem metrikus Metri kus Gazdaságtudományi Kar Független változó () Nem metrikus Metrikus Kereszttábla

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102 Tárgy- és névmutató A a priori kontraszt 174 175 a priori kritérium 259, 264, 276 adatbevitel 43, 47, 49 52 adatbeviteli nézet (data view) 45 adat-elôkészítés 12, 37, 62 adatgyûjtés 12, 15, 19, 20, 23,

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

Korrelációs kapcsolatok elemzése

Korrelációs kapcsolatok elemzése Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az

Részletesebben

Diszkriminancia-analízis

Diszkriminancia-analízis Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz Diszkriminancia-analízis folyamata Feladat Megnyitás: Employee_data.sav Milyen tényezőktől függ a dolgozók beosztása? Nem metrikus Független

Részletesebben

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens GRADUÁLIS BIOSTATISZTIKAI KURZUS 2012. február hó 22. Dr. Dinya Elek egyetemi docens Biometria fogalma The active pursuit of biological knowledge by quantitative methods Sir R. A. Fisher, 1948 BIOMETRIA

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 2 II. A valószínűségi VÁLTOZÓ És JELLEMZÉsE 1. Valószínűségi VÁLTOZÓ Definíció: Az leképezést valószínűségi változónak nevezzük, ha

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

[GVMGS11MNC] Gazdaságstatisztika

[GVMGS11MNC] Gazdaságstatisztika [GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)

Részletesebben

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,

Részletesebben

Lineáris regressziószámítás 1. - kétváltozós eset

Lineáris regressziószámítás 1. - kétváltozós eset Lineáris regressziószámítás 1. - kétváltozós eset Orlovits Zsanett 2019. február 6. Adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.22. Valószínűségi változó Véletlentől függő számértékeket (értékek sokasága) felvevő változókat valószínűségi változóknak nevezzük(jelölés: ξ, η, x). (pl. x =

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

1. Példa. A gamma függvény és a Fubini-tétel.

1. Példa. A gamma függvény és a Fubini-tétel. . Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +

Részletesebben