Mintavételezés

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Mintavételezés"

Átírás

1 Mintavételezés Informatikai Tudományok Doktori Iskola Statisztikai sokaság, populáció A halmaz egészének kevés adattal történı tömör jellemzése, és a populáció egyedeinek leírására bevezetett változók közötti kapcsolatok leírása a célunk. Arra nincs lehetıség (erıforrás), hogy a populáció minden egyes elemérıl adatokat szerezzünk be, azaz mintát kell vételeznünk a sokaságból Statisztikai minta realizáltja A populáció egy kis elemszámú részhalmazára vonatkozó megfigyelések adatai alkotják a statisztikai minta egy realizációját. A minta úgy kell, hogy tükrözze a populáció tulajdonságait, ahogy a cseppben látjuk a tengert. Azaz a minta reprezentatív kell, hogy legyen. Nem reprezentatív mintából levont következtetések értékelhetetlenek, torzak. Az alkalmazott statisztikai módszerek, becslési hibák akkor lesznek érvényesek, ha a minta, amivel számolunk reprezentatív! "A kutató számára csak a reprezentatív mintavétel az egyetlen helyes mintavételi mód arra, hogy a kiválasztott egyedi objektumok generalizálás (általánosítás) alapjául szolgálhassanak, és ezért rendszerint az egyetlen elfogadható alap arra, hogy megállapítsuk, mi az igazság." (Andrew A. Marino)

2 Kaplan mintavételezési paradoxona Egyrészrıl, a minta használhatatlan, ha nem reprezentatív. Másrészrıl, ahhoz, hogy ellenırizhessük a minta reprezentativitását, tudnunk kell a populáció összes jellemzıjét, amit pedig ha ismerünk, már mintára sincs szükségünk, hisz azt azért vennénk, hogy ezeket a jellemzıket feltárjuk Edward L. Kaplan, M.D Elvárások a mintáról A populáció minden egyes elemének ugyanakkora esélyt kell biztosítani a mintába kerüléshez. A minta elemszámának elég nagynak kell lennie ahhoz, hogy a következtetéseink átvihetık lehessenek a populációra is. Ugyanakkor a szükségesnél ne kelljen nagyobb mintát feldolgozni, mert az költségesebb Alapkérdések Vegyünk-e egyáltalán mintát? Ha igen, milyen eljárással? Milyen típusú mintát vegyünk Mekkora legyen a minta nagysága? Egyéb kérdések: Pl. Mit tegyünk a nem válaszolási hibákkal? A válaszmegtagadókkal?

3 Fogalmak Cenzus: A sokaság elemeinek teljes számbavétele (pl. népszámlálás) Cenzust alkalmazunk, ha Kicsi a sokaság Figyelni kell az egyedi esetekre Sok idı, sok pénz áll rendelkezésre Nagyon szóródik a megfigyelt jellemzı a sokaságban Minta: A sokaság elemeinek egy csoportja. A mintajellemzıkbıl, más néven statisztikákból tudunk valamilyen következtetést levonni a teljes sokaságra A mintavételi eljárás A mintavételi eljárás 5 lépésbıl áll: A célsokaság meghatározása A mintavételi keret meghatározása A mintavételi technika meghatározása A mintanagyság meghatározása A mintavétel kivitelezése Alapfogalmak Célsokaság: azoknak az elemeknek az összessége amelyek rendelkeznek a kutató által keresett paraméterrel. Sokasági elem: az a vizsgálati egység amelyik rendelkezik a kutató által keresett információval. Mintavételi egység: A sokasági elem, vagy az az alapegység, amelyik magában foglalja a sokaság elmeit (pl. háztartásokban elı 8 év feletti nık). Mintavételi keret: a mintavételi egységekrıl készült felsorolás mely segítségével azonosíthatóak az elemek. Egylépcsıs mintavételnél a keret a (vizsgálati) populáció listája

4 A mintavételi keret Sok esetben, mint például amikor a legyártott tételt minıségi szempontból teszteljük, lehetséges, hogy azonosítsuk és megmérjük a populációt kitevı teljes tétel miden egyes elemét, és hogy mindegyik szerepeljen a mintánkban. Azonban sokkal gyakoribb, hogy ez nem lehetséges. Nem lehetséges azonosítani például valamennyi patkányt, valamint abban az esetben, ha a szavazás nem kötelezı, nincs mód arra, hogy azonosítsuk azokat ez egyéneket, akik valóban szavazni fognak az elkövetkezı választásokon. Az ilyen, bizonytalanul körülhatárolható populációk nem alkalmasak a mintavételezésre. Eszközként a mintavételi keretet keressük meg, amely alkalmas arra, hogy a populáció minden egyes elemét azonosítsuk és bevonjuk bármely mintánkba A mintavételi keret A sokaság elemeinek megjelenítése Telefonkönyv Szövetségek taglistái Számlakönyvek Egyéb listák A legfontosabb kérdés itt az, hogy a célsokaság és a mintavételi keret egybeesik-e (Pl. telefonkönyvben mindenki benne van-e, aki rendelkezik a keresett paraméterekkel?) A mintavételi technikák Visszatevéses mintavétel Egy adott elem elvileg többször is a mintába kerülhet Visszatevés nélküli mintavétel Egy elem csak egyszer kerülhet a mintába Bayes-technika Kiválasztási módszer, ahol az elemeket egymást követıen választják ki. Minden egyes kiválasztást követıen kiszámítják a mintajellemzıket és meghatározzák a költségeket Már a mintavétel elıtt ismerni kell a sokaság bizonyos jellemzıit (paraméterek) Nem véletlen mintavételi technikák Véletlen mintavételi technikák

5 Nem véletlen mintavételi technikák Önkényes mintavétel: a minta elemeit általában kérdezıbiztos választja ki pl. üdülıhelyi megkérdezések vendégkör-megkérdezések Nincs mintavételi keret amibıl választani lehetne Elınyei Olcsó A mintavételi egységek könnyen elérhetık Könnyő együttmőködı egységeket választani Hátrányai Semmilyen meghatározható sokaságot nem reprezentálnak Elméletileg semmiféle általánosításra nem ad módot Torzítás óriási Mire jó? Mire nem jó? Leíró kutatásokhoz Feltáró kutatáshoz Hipotézisek felállításához Kérdıívek teszteléséhez Ok-okozati kutatásokhoz Nem véletlen mintavételi technikák elbírálásos mintavétel Elbírálásos mintavétel: a kutató a saját tapasztalatai alapján választ a sokaság elemei közül, és eldönti, hogy bekerüljenek-e a mintába vagy sem. Teszthelyszínek kiválasztása (melyik szállodát, céget, utazási irodát kérdezzük meg. Szakértık kiválasztása Körzetek kiválasztása (kérdıívezés helyszíneinek kiválasztása), stb Nem véletlen mintavételi technikák Kvótás mintavétel Két lépéses eljárás A kutató felállítja a sokaság kontroll kategóriáit, azaz a kvótákat Végig kell gondolni a sokaság jellemzıit és e jellemzık sokaságon belüli eloszlását Nem Kor Nemzetiség, stb..a mintaelemeket önkényesen vagy elbírálással választja ki. Elınye az alacsony költség és a kényelmes kezelhetıség Nem reprezentatív, amennyiben a sokaság egy fontos jellemezıje elkerüli a figyelmünket A több kontrolljellemzı növelheti a reprezentativitást, ám a sok jellemzıt nehézkes kezelni A reprezentativitás javítható, ha a kérdezıbiztosok részletes utasítást kapnak, hogy kiket kell megkérdezni

6 Nem véletlen mintavételi technikák Hólabda mintavétel Speciális jellemzıvel bíró sokaságot keresünk (pl. hackerek) Egyvalakit, vagy egy kis csoportot megkeresünk A kezdeti csoport tagjait arra kérjük, hogy ajánljanak másokat akik szintén a célsokasághoz tartoznak Ezzel a módszerrel egyre több válaszadót érünk el Véletlen kiválasztási technikák I. A véletlen mintavétel során az elérendı cél, az, hogy a minta jellemzıi teljes egészében megegyezzenek a célsokaság jellemzıivel, azaz ne legyen torzítás Ha mégis van eltérés, akkor a különbség statisztikailag mérhetı (megbízhatósági szintekkel) A véletlen technikákkal vett minták jellemzıi kivetíthetık az egész sokaságra Véletlen kiválasztási technikák II. A gyakorlatban alkalmazott technikák Egyszerő véletlen mintavétel Szisztematikus mintavétel Rétegzett mintavétel Csoportos mintavétel Egyéb véletlen mintavételi technikák Mindemellett a nem véletlen mintavételi technikák esetében sem teljesül minden esetben a reprezentativitás

7 Egyszerő véletlen mintavétel A sokaság minden eleme ismert és azonos valószínőséggel kerülhet be a mintába. Minden elemet egymástól függetlenül, a mintát a mintavételi keretbıl véletlen eljárással választjuk ki Technikai megoldások: sorsolás véletlenszám generálása Szisztematikus mintavétel A mintavételi keretben véletlenszerően kijelölnek egy kezdıpontot Ezt követıen kiválasztják a mintavételi keret minden i-dik elemét A mintavételi intervallumot úgy kapják meg, hogy a mintavételi keret elemszámát (N) elosztják a minta elvárt nagyságával (n), az így kapott N/n hányadost a legközelebbi egész számra kerekítik, ez lesz az i Akkor használható, jól, ha a mintavételi keretben nincsenek sorba állítva az elemek a vizsgált jellemzıvel összefüggésben Szisztematikus mintavétel Tegyük fel, hogy a populáció elemszáma N= A kívánt minta elemszám n= N/n=5 Véletlenszerően kiválasztunk egy számot -5 között: pl. 4. A 4. esettıl kezdve minden 5.-ket választjuk a mintába

8 Rétegzett mintavétel A sokaságot elıször csoportokra bontják valamilyen ismert rétegképzı ismérv segítségével. Az egyes rétegekbıl egyszerő véletlen mintavétellel választanak Fontos, hogy a rétegképzı ismérv szoros kapcsolatban álljon a vizsgált jellemzıvel Legáltalánosabb rétegképzı ismérvek a demográfiai jellemzık kor nem jövedelem régió Arányos és nem arányos rétegezés Arányos rétegezés: minden rétegbıl kiválasztott minta nagysága arányos az adott rétegnek a teljes sokasághoz viszonyított nagyságával Nem arányos rétegezés: a rétegekbıl választott minta nagysága arányos a réteg relatív nagyságával és a vizsgált jellemzı eloszlásának rétegen belüli szórásával Nagyobb rétegbıl több elemet kell vennünk Több elemet kell venni azokból a rétegekbıl ahol nagyobb a szórás és kevesebbet azokból ahol kisebb (ehhez azonban ismerni kell a szórást is) A rétegezett mintavétel akkor alkalmazható jól, ha a vizsgált jellemzı eloszlása a sokaságban nem egyenletes, így biztosított, hogy minden részsokaság képviseltesse magát a mintában (pl. jövedelem) Csoportos mintavétel A célsokaságot egymást kölcsönösen kizáró csoportokra bontják, amelyek együttesen lefedik az egész sokaságot (statisztikai populációt). Az így képzett csoportokból egyszerő véletlen mintát vesznek (csoportokat választanak ki). A kiválasztott csoportokból azután vagy mindenkit beválasztanak a mintába, vagy újra EVM-eznek. Gyakori formája a területi mintavétel, ebben az esetben a csoportok területi egységek A mintavétel akkor megfelelı, ha a csoportok mérete ugyanakkora, Ha nagyság alapján nagy az eltérés, akkor a nagysággal arányos véletlen mintavétel alkalmazható

9 Nagysággal arányos csoportos véletlen mintavétel A csoportokat a nagyságukkal arányos valószínőéggel választjuk ki A nagyobb elemszámú csoportok nagyobb valószínőséggel kerülnek kiválasztásra mint a kisebbek A kisebb elemszámú csoportok kisebb valószínőséggel kerülnek kiválasztásra Eredmény: minden elem azonos valószínőséggel kerül kiválasztásra Véletlen kiválasztási technikák Egyéb véletlen mintavételi technikák Többlépcsıs mintavételezés: Nagyobb egységeket részekre bontunk, és a részek között véletlenszerően választunk egyet. A kiválasztott részt újabb részekre bontunk, és véletlenszerően megint választunk Szekvenciális mintavétel (Wald Ábrahám): a sokaság elemeibıl egymást követıen veszünk mintát, majd minden mintavételt követıen elvégezzük az elemzést, és ez alapján döntünk, hogy szükséges-e újabb elemet beválasztani (döntési szabály elıírása a továbblépéshez) Kettıs mintavétel: a sokaság elemeibıl kétszer veszünk mintát

10 Többlépcsıs mintavételezés Választás a véletlen és a nem véletlen mintavételi technikák között Nem véletlen mintavételi technikát alkalmazzuk, ha Feltáró kutatást akarunk folytatni Nagyok az ún. nem mintavételi hibák A sokaság homogén (szórása alacsony) Statisztikai módszerekkel nem kívánjuk elemezni a mintát Egyszerőbb, operatívabb megoldásra törekszünk Véletlen mintavételi technikát alkalmazunk, ha Leíró kutatást akarunk folytatni A mintavételi hibák nagyok A sokaság heterogén (szórása magas) Statisztikai módszerekkel kívánjuk elemezni a mintát Az operatív megoldás kevésbé szempont A mintavétel kivitelezése Elıfordulási arány: a kutatásra alkalmas emberek elıfordulási vagy százalékos arányára utal. Megmutatja, hogy hány kontaktust kell létrehozni egy adott mintanagyság elıállítás érdekében. Megvalósulási arány: a szőrıfeltételeknek megfelelı személyek közül hány emberrel sikerül elkészíteni az interjút/kérdıívet (akik válaszolnak a megkérdezésre) Az elıfordulási és a megvalósulási arányok következtében a kiinduló mintanagyságnak esetenként többszörösen nagyobbnak kell lennie a szükséges mintanagyságnál

11 A mintanagyság meghatározása Minél pontosabb információra van szükség, annál nagyobb mintát kell venni. Ám minél jobban nı a minta, annál kisebb a javulás a mintanagyság egységnyi növekedésével. Vezérfonal: Tanulmány típusa Mintanagyság a.) Problémafeltáró kutatás (vendégkörvizsgálat) 5 fı b.) Problémamegoldó kutatás (pl. árazás) fı c.) Termékteszt (marketingkutatás) fı d.) Tesztpiaci tanulmányok fı e.) Tesztpiac vizsgálata utazási iroda f.) Fókuszcsoport A mintanagyság meghatározása A mintanagyság meghatározása

12 A mintanagyság meghatározása SE = s/ n Mintanagyság meghatározása A mintanagyság más tudományos módszerekkel is meghatározható (ld. késıbb ) Ha a sokaság, illetve a minta nagyobb mint harminc fı, akkor a vizsgált ismérv vélhetıleg normális eloszlást követ, így alkalmazhatók a valószínőségszámítási elvek a mintavételi hiba (konfidencia-intervallumok meghatározásához) A számítási módszereket statisztikából tanultuk A statisztikai módszerek csak akkor mőködnek, ha a minta reprezentatív Mintanagyság meghatározása t-próbához A centrális határeloszlás tételébıl levezethetı, hogy ha egy normális eloszlású változó várható értékére vonatkozó nullhipotézist vizsgálunk az egymintás t próbával, akkor ahhoz, hogy meghatározott (-α) valószínőséggel kimutassunk egy legalább d u α / σ nagyságú különbséget, a mintának n számú elemet kell d tartalmazni. A képletben u α/ a standard normális eloszlás α/ valószínőséghez tartozó értéke, σ az elméleti szórás (vagy annak becslése), d pedig az (-α) valószínőséghez tartozó konfidenciaintervallum szélességének a fele. Azon mintaelemszámok táblázata, amelyek két populáció nagyságszintjének átlagokon alapuló, összetartozó kétmintás t-próbával történı összehasonlítására minimálisan szükségesek ahhoz, hogy egy feltételezett létezı különbségbıl adódóβ második fajta hiba mellett ezt a különbséget (-α) valószínőséggel kimutathassuk. (Beyer (968) nyomán)

13 Beyer táblázata A t-próba szintje Egyoldalú próba α=.5 α=. α=.5 α=.5 Kétoldalú próba α=. α=. α=.5 α=. β (a második fajta hiba valószínősége) η η = σ A minimálisan szükséges mintaelemszám meghatározása Mekkora n minta elemszám garantálja azt, hogy az x n mintaátlag a minta m várhatóértékétıl legfeljebb távolságra essék legalább -µ valószínőséggel? (Vagyis milyen n-ekre teljesül a reláció? ( x n m ) µ P A képletben az egyes paraméterek jelentése: m a minta várható értéke. a mérési pontosság. A kérdésre több válasz is adható, attól függıen, mit tételezhetünk fel a minta eloszlásáról. -µ a bizonytalanság mértéke (azaz a megbízhatóság mértéke) Kapcsolat a minta elemszám, az eltérés és a megbízhatóság között Ha az n minta elemszám, az eltérés és a µ megbízhatóság közül bármely kettıt ismerjük, akkor alsóbecslést tudunk adni a harmadik paraméterre: n f g µ h (, µ ) ( n, µ ) ( n, )

14 Paraméteres módszerek A minta elemszám meghatározása normális eloszlású, ismert σ szórású minta esetén: P z µ σ m = µ n x n n z µ σ ahol µ Φ z µ = σ= σ= \ µ,5,,5, , , , , , , , , , , , , , ,5 7 9, , , , , , , \ µ,5,,5, , , , , , , , , , , , , , , , , , , , ,3 7 9, Paraméteres módszerek A minta elemszám meghatározása normális eloszlású, nem ismert szórású minta esetén: t µ sn m = µ n P xn t n µ sn ahol µ F n t µ = Fn s n az n- szabadságfokú Student-eloszlásfüggvény. a minta varianciája,

15 Nemparaméteres módszerek A centrális határeloszlás-tétel alapján: z µ σ z µ σ P x n m µ n n Nemparaméteres módszerek A minta elemszám megbecslése a Hoeffding-egyenlıtlenség segítségével: amennyiben az méréseink garantáltan az (a, b) intervallumba esnek, P n n i= n X i m > exp ( b a) µ ( b a) ln n Az eltérés és bizonytalanság becslése, ha ismert az n Adott n minta elemszám és maximális eltérés esetén a µ maximális bizonytalanság megbecslése: n exp µ δ Adott n minta elemszám és µ maximális bizonytalanság esetén az maximális eltérés megbecslése: µ δ ln n

16 Nemparaméteres módszerek A minta elemszám becslése a Bernstein-egyenlıtlenség alapján: amennyiben az méréseink garantáltan az (a,b) intervallumba esnek, és ismert a σ szórás n n P X m > exp ( ) i n = b a i σ + 3 µ ln σ + b a 3 n Az eltérés és bizonytalanság becslése, ha ismert az n Adott n minta elemszám és maximális eltérés esetén a µ maximális bizonytalanság megbecslése: n µ exp ( ) b a σ + 3 Adott n minta elemszám és µ maximális bizonytalanság esetén az maximális eltérés megbecslése: ( b a) ( b a) 3 ln µ + 3 n ln µ µ + 8nσ ln Csernov-egyenlıtlenség A Csernov-egyenlıtlenség binomiális eloszlású változó farokeloszlására vonatkozik, tehát paraméteres becslési módszert tesz lehetıvé. Ez azzal kecsegtet, hogy a szükséges minta elemszámra kisebb értékeket lehet vele igazolni, mint a nemparaméteres Hoeffding- illetve Bernstein- egyenlıtlenség esetén. Jelölje X az n minta elemszámú méréssorozatban a megfigyelt A esemény gyakoriságát. Az A esemény p=p(a) valószínőségére akarunk legfeljebb szélességő, -µ megbízhatóságú konfidencia-intervallumot szerkeszteni

17 Csernov-egyenlıtlenség Az X n,p-paraméterő binomiális eloszlást követ: Az X értékkészlete három diszjunkt részre bontható, alsó (a), középsı (k) és felsı (f) részre: n k n k P ( X = k) = p ( p), k =,,..., n k H a = {,..., [ n( p )]} H k = {[ n( p )] +,..., [ n( p + ]} {[ n( p + )] + n} H f =,... H H a k f [ ] H P( X H Csernov-egyenlıtlenség a ) = P ( X < n( p )) p p + exp n ( p )ln + ( p + )ln p p illetve P( X H f ) = P ( X > n( p + )) p + p exp n ( p + )ln + ( p )ln p p P Csernov-egyenlıtlenség P P X n p < µ ( n( p ) < X < n( p + )) µ ( n( p ) < X < n( p + )) = P( X H ) µ Ez pontosan akkor áll fenn, ha P ( X H ) + P( X H ) µ ami természetesen teljesül, ha a P ( µ, X, µ µ = µ X H a ) P ( H f ) µ f k

18 Csernov-egyenlıtlenség A minta elemszám minimumának becslése a Csernov-egyenlıtlenség alapján: ln ln µ µ n max, p + p p p + ( p + )ln ( ) + ( + ) + p ln ( p )ln p ln p p p p µ µ p az alsó tartományhoz tartozás valószínősége a felsı tartományhoz tartozás valószínősége a becsült valószínőség nagysága az elıírt pontosság A minta elemszámok becslései Moivre Laplace Csernov Bernstein Hoeffding p=,,=,,µ=, p=,,=,5,µ=, p=,,=,,µ=, p=,,=,,µ=, p=,,=,,µ=, A Moivre-Laplace tétellel kapjuk a legjobb becslést, de bizonyított, hogy p vagy esetén a konvergencia lassú, azaz a módszer ilyenkor nem alkalmazható Csernov-egyenlıtlenség µ függése p -tıl és n -tıl,,8,6,4, µ n=, =. n=5, =. n=5, =. p

19 Csernov-egyenlıtlenség, n =, =. µ függése p - tıl és -tól n =, =.3,8 n =, =.5,6 n =, =.9,4, Szekvenciális próba a hibavalószínőség ellenırzésére H H : : P P ( S) = p = P ( H t elutasítottuk, holott igaz) ( S) = p = P( H t elfogadtuk, holott nem igaz) A = B = V = X, V n = X i= + X, L, V n = X i, L Addig folytatjuk a mintavételezést, amíg: A < V < B n n n A n p ln A + nln p = p( p ) ln p ( p ) B n p ln B + nln p = p( p ) ln p ( p ) Szekvenciális próba a hibavalószínőség ellenırzésére A döntéshez szükséges átlagos minta elemszámra bebizonyítható, hogy: n = p ( ) ln A + p ln + ( p ) p ln A + n = p p ln + p ln B p ln p ( ) ( p ) ln B p ln p ha igaz a nullhipotézis; ha nem igaz a nullhipotézis

20 Adott mintaelemszám és maximális eltérés esetén a maximális µ bizonytalanság megbecslése Hoeffding: n exp µ δ Bernstein: n µ exp σ + ( b a) 3 Csernov: p + p ( ) ( ) p µ exp + ( ) + n p + ln + n p ln exp n p ln n ln p p p p Adott mintaelemszám és maximális eltérés esetén a maximális µ bizonytalanság megbecslése ,99,985,979,97,96,95,94,99,96,9,886,85,98,97,957,94,95,95,884,86,835,88,779,76 5,97,956,936,94,888,86,88,794,757,78,677,589,96,94,96,886,85,85,774,73,683,634,58,47 5,953,97,895,859,87,77,7,669,6,553,49,363 3,943,9,875,83,783,79,67,69,544,476,47,63 35,934,898,855,85,749,688,6,55,479,44,36,7 4,95,884,835,779,76,647,574,497,47,334,5,83 5,96,856,796,77,65,569,483,39,3,6,,99 6,888,88,757,677,589,495,396,95,9,9,989,797 7,87,8,7,69,53,44,35,5,94,985,88,684 8,85,774,683,58,47,357,39,,4,89,78,587 9,835,748,647,536,47,93,67,4,9,85,696,54,87,7,6,49,363,3,99,969,845,77,69,43,65,483,3,,99,758,64,47,357,64,9,93 3,5,77,48,83,634,467,33,8,5,96,59, 5,39,946,68,46,94,77,,53,7,3,6,,767,448,3,6,43,6,5,,,,, a= b= Adott n mintaelemszám és maximális µ bizonytalanság esetén az maximális eltérés megbecslése Hoeffding: µ δ ln n Bernstein: ( b a) ( b a) ln + 3 µ 3 n µ ln + 8nσ ln µ

21 Adott n mintaelemszám és maximális µ bizonytalanság esetén az maximális eltérés megbecslése,,5,,5,, 5 438, ,55 5,65 555,666 6,84 665,3 3,9 38, , , , , ,89 68,543 88,7944 3, , ,663 9,68 3,567 5,33 77,5333 3,9 33,6 5 96,95 8,4 3,699 48,333 77, , ,38 89,8867 4,85 6,65 53,89 7, ,75 75,89 89,63 9, ,476 5, ,46 64, , ,457 9,68 35, , ,856 58,79 75,575 96,95, , ,7 44,397 6,339 79,38 9,33 7 7,38 4,3 33, , ,75 77, ,634 6,84 5,56 38, ,46 66, ,364 9,63 7,8998 3,834 46,788 56, ,5973 4,5,8496 4,67 38, ,748 69, , , , ,5973 5, ,648 6, , , , , , ,555 5,65 55,5666 6,84 66,53 3,9 3, , ,493 43, ,

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék Mintavétel Kovács István BME Menedzsment és Vállalatgazdaságtan Tanszék Alapfogalmaink Sokaság azon elemek összessége, amelyek valamilyen közös jellemzővel bírnak, és megfelelnek a marketingkutatási probléma

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Statisztika Elıadások letölthetık a címrıl

Statisztika Elıadások letölthetık a címrıl Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Mintavételi eljárások

Mintavételi eljárások Mintavételi eljárások Daróczi Gergely, PPKE BTK 2008. X.6. Óravázlat A mintavétel célja Alapfogalmak Alapsokaság, mintavételi keret, megfigyelési egység, mintavételi egység... Nem valószínűségi mintavételezési

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely. Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel KUTATÁSMÓDSZERTAN 4. ELŐADÁS A minta és mintavétel 1 1. A MINTA ÉS A POPULÁCIÓ VISZONYA Populáció: tágabb halmaz, alapsokaság a vizsgálandó csoport egésze Minta: részhalmaz, az alapsokaság azon része,

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20. FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) 2010. október 20. A kutatási terv fogalmának, a különbözı kutatási módszerek osztályozása, a feltáró és a következtetı kutatási módszerek közötti különbségtétel

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok Eloszlás-független módszerek (folytatás) 14. elıadás (7-8. lecke) Illeszkedés-vizsgálat 7. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok elemzésére Illeszkedés-vizsgálat Gyakorisági sorok

Részletesebben

Mintavétel: terv és eljárások

Mintavétel: terv és eljárások Mintavétel: terv és eljárások Kovács István BME Menedzsment és Vállalatgazdaságtan Tanszék Az előadás felépítése Mi is az a mintavétel A mintavétel folyamata Mintavételi technikák A minta nagyságának meghatározása

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 24. Outline 1 A mintavételi hiba és konfidencia-intervallum 2 A mintaválasztás A mintaválasztás célja Alapfogalmak A mintaválasztás

Részletesebben

Mintavétel: terv és eljárások

Mintavétel: terv és eljárások Mintavétel: terv és eljárások Kovács István BME Menedzsment és Vállalatgazdaságtan Tanszék Az előadás felépítése Mi is az a mintavétel A mintavétel folyamata Mintavételi technikák A minta nagyságának meghatározása

Részletesebben

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra Vörös Zsuzsanna NÉBIH RFI tervezési referens 2013. április 17. Egy kis felmérés nem kor Következtetések: 1. a jelenlevők nemi megoszlása:

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

4. A méréses ellenırzı kártyák szerkesztése

4. A méréses ellenırzı kártyák szerkesztése 4. A méréses ellenırzı kártyák szerkesztése A kártyákat háromféle módon alkalmazhatjuk. Az elızetes adatfelvétel során a fı feladat az eloszlás paramétereinek (µ és σ ) becslése a további ellenırzésekhez.

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

A populáció meghatározása

A populáció meghatározása A mintavétel Mi a minta? Minden kutatásban alapvetı lépés annak eldöntése, hogy hány személyt vonjunk be a vizsgálatba, és hogyan válasszuk ki ıket ezek a mintavétellel kapcsolatos alapvetı problémák.

Részletesebben

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Biometria gyakorló feladatok BsC hallgatók számára

Biometria gyakorló feladatok BsC hallgatók számára Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90

Részletesebben

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687) STATISZTIKA 10. Előadás Megbízhatósági tartományok (Konfidencia intervallumok) Sir Isaac Newton, 1643-1727 Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Matematikai alapok és valószínőségszámítás. Normál eloszlás Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak

Részletesebben

Ismétlı áttekintés. Statisztika II., 1. alkalom

Ismétlı áttekintés. Statisztika II., 1. alkalom Ismétlı áttekintés Statisztika II., 1. alkalom Hipotézisek Milyen a jó null hipotézis?? H0: Léteznek kitőnı tanuló diszlexiások. Sokkal inkább: H0: Nincs diszlexiás kitőnı tanuló általános iskolában Mo-on.

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma: Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:

Részletesebben

Nemparaméteres próbák

Nemparaméteres próbák Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Részletesebben

Kockázatalapú változó paraméterű szabályozó kártya kidolgozása a mérési bizonytalanság figyelembevételével

Kockázatalapú változó paraméterű szabályozó kártya kidolgozása a mérési bizonytalanság figyelembevételével Kockázatalapú változó paraméterű szabályozó kártya kidolgozása a mérési bizonytalanság figyelembevételével Hazai hallgatói, illetve kutatói személyi támogatást biztosító rendszer kidolgozása és működtetése

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Normális eloszlás tesztje

Normális eloszlás tesztje Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel

Részletesebben

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari

Részletesebben

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek Anyagvizsgálati módszerek Mérési adatok feldolgozása Anyagvizsgálati módszerek Pannon Egyetem Mérnöki Kar Anyagvizsgálati módszerek Statisztika 1/ 22 Mérési eredmények felhasználása Tulajdonságok hierarchikus

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement

Részletesebben

10. Mintavételi tervek minısítéses ellenırzéshez

10. Mintavételi tervek minısítéses ellenırzéshez 10. Mintavételi tervek minısítéses ellenırzéshez Az átvételi ellenırzés akkor minısítéses, ha a mintában a selejtes elemek számát ill. a hibák számát vizsgáljuk, és ebbıl vonunk le következtetést a tételbeli

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Normális eloszlás paramétereire vonatkozó próbák

Normális eloszlás paramétereire vonatkozó próbák Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık

Részletesebben

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján

Részletesebben

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157. Kiváltott agyi jelek informatikai feldolgozása 2018 Statisztika - Gyakorlat Kiss Gábor IB.157. kiss.gabor@tmit.bme.hu Példa I (Vonat probléma) Aladár 25 éves és mindkét nagymamája él még: Borbála és Cecília.

Részletesebben

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI, Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus. KOKI, 2015.09.17. Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze.

Részletesebben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,

Részletesebben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,

Részletesebben

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles

Részletesebben

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézis Állítás a populációról (vagy annak paraméteréről) Példák H1: p=0.5 (a pénzérme

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely. 2011. december 8.

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely. 2011. december 8. A társadalomkutatás módszerei I. 13. hét Daróczi Gergely Budapesti Corvinus Egyetem 2011. december 8. Outline 1 célja 2 Alapfogalmak 3 Mintavételi eljárások 4 További fogalmak 5 Mintavételi hiba számítása

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

egyetemi jegyzet Meskó Balázs

egyetemi jegyzet Meskó Balázs egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.

Részletesebben

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet

Részletesebben

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! SPEC 2009-2010. II. félév Statsztka II HÁZI dolgozat Név:... Neptun kód: 20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek! 1. példa Egy üzemben tejport csomagolnak zacskókba,

Részletesebben

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai

Részletesebben

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás Mintavétel fogalmai STATISZTIKA I.. Előadás Mintavétel, mintavételi technikák, adatbázis A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x n, mindig

Részletesebben