Kísérlettervezés alapfogalmak

Hasonló dokumentumok
Kísérlettervezés alapfogalmak

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

6. Előadás. Vereb György, DE OEC BSI, október 12.

Bevezetés a hipotézisvizsgálatokba

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

[Biomatematika 2] Orvosi biometria

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

y ij = µ + α i + e ij

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Normális eloszlás paramétereire vonatkozó próbák

Több valószínűségi változó együttes eloszlása, korreláció

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kettőnél több csoport vizsgálata. Makara B. Gábor

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Valószínűségszámítás összefoglaló

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Biostatisztika VIII. Mátyus László. 19 October

[Biomatematika 2] Orvosi biometria

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Normális eloszlás tesztje

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Hipotézis vizsgálatok

Többváltozós lineáris regressziós modell feltételeinek

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

A maximum likelihood becslésről

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Biometria gyakorló feladatok BsC hallgatók számára

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

A Statisztika alapjai

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Statisztika Elıadások letölthetık a címrıl

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Biomatematika 2 Orvosi biometria

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztikai becslés

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Adatok statisztikai értékelésének főbb lehetőségei

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Mérési hibák

KÖVETKEZTETŐ STATISZTIKA

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Gyártástechnológia alapjai Méréstechnika rész. Előadások (2.) 2011.

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Nemparaméteres próbák

III. Képességvizsgálatok

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Területi sor Kárpát medence Magyarország Nyugat-Európa

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

A valószínűségszámítás elemei

Számítógépes döntéstámogatás. Statisztikai elemzés

Matematikai alapok és valószínőségszámítás. Normál eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Statisztika elméleti összefoglaló

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Méréselmélet MI BSc 1

Minőségmenedzsment (módszerek) BEDZSULA BÁLINT

Hipotézis vizsgálatok

Abszolút folytonos valószín ségi változó (4. el adás)

Matematikai statisztikai elemzések 3.

Biostatisztika Összefoglalás

STATISZTIKAI PROBLÉMÁK A

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Átírás:

Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Kísérlettervezés Cél: a modell paraméterezése a valóság alapján o Vagy absztrakt modell a konkrét modell alapján Információt kísérletek révén szerzünk o Pontosan mit szeretnénk tudni? o Ehhez milyen megfigyelést, hányszor kell elvégezni? o A kapott eredményekből mire lehet következtetni? (statisztikai) kísérlettervezés (Design of Experiment, DOE) o hatékony eljárás a kísérletek tervezésére és elemzésére o valós és objektív konklúziók levonásához Kísérletterv: még a kísérlet elvégzése előtt 2

Mire jó? Kísérlettervezés o Alternatívák közötti választás o Érzékeny paraméterek, kulcsfaktorok o Megfelelő célérték, változékonyság csökkentése o Robosztussá tétel Fontos: o Világos cél, egyértelmű eredmények o Kis méret, alacsony költség o Valós viszonyok 3

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 1 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 Mi van, ha az érték nem állandó? Véletlenszerű változás végezzünk több megfigyelést! 1 2 3 4 5 Mért érték: 4 4

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 5 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 2 3 4 5 Számított átlag: 3,6 5

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 10 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 2 3 4 5 Számított átlag: 3,3 6

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 15 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 2 3 4 5 Számított átlag: 3,4 7

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 30 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 Most már gyanúsan ismétlődik A várható érték alighanem 3,3 és 3,4 közötti 1 2 3 4 5 Számított átlag: 3,3 8

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 50 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 2 3 4 5 Számított átlag: 3,12 9

Számszerű jellemzők mérése Mérjük meg egy jellemző értékét! (1..5) 100 megfigyelés 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 A tényleges várható érték 2,86 lenne 1 2 3 4 5 Számított átlag: 2,88 10

Ismétlés: tapasztalati átlag, szórás Valószínűségi változó: X (vizsgálandó jelenség) o Várható érték: m = E(X) (átlagos viselkedés) o Szórás: d = E X m 2 (eltérések mértéke) Mintavétel: x 1, x 2, x t (mérések, megfigyelések) o Tapasztalati átlag: x = x 1 + x 2 + +x t t o Szórásra NEM JÓ: x 1 x 2+ x 2 x 2+ x t x 2 t o Korrigált tapasztalati szórás: x 1 x 2+ x 2 x 2+ x t x 2 t 1 11

Ismétlés: tapasztalati átlag, szórás Görgetett átlagszámítás o Tapasztalati átlag t megfigyelésből: x t = x 1 + x 2 + +x t t o Tapasztalati átlag t+1 megfigyelésből, x t alapján: x t+1 = x 1 + x 2 + +x t +x t+1 t+1 t x t+1 1 + x 2 + +x t t Probléma + x t+1 t+1 = = x 1 + x 2 + +x t t+1 t x t+1 t + x t+1 t+1 o Tapasztalati átlag várható érték Tapasztalati szórás szórás + x t+1 t+1 = egy számot elég megjegyezni o Mintavétel eredménye x i valószínűségi változó a tapasztalati átlag is valószínűségi változó lesz! 12

Becslés tapasztalati átlaggal Módszer: számtani átlag képzése o Ismételt megfigyelések o Egymástól függetlenül o Azonos feltételek mellett Kérdések o Hány megfigyelést kell végezni? o A tapasztalati átlag mennyire jellemzi a valódi várható értéket? Először tisztázandó: o Tapasztalati átlag mint valószínűségi változó eloszlása 13

Tapasztalati átlag eloszlása Kísérlet = megfigyelések sorozata Megfigyelések sorozatának tapasztalati átlaga: o Egy jellemzőt t db. független megfigyeléssel mérve, Ökölszabály: ismert szórásnál t>30, o majd a mért értékeket átlagolva kapott eredmény Centrális ismeretlen határeloszlás szórásnál t>100 tételéből következik: után kezd elfogadható lenni a közelítés o Tetszőleges eloszlású X jellemző o (de legyen véges m várható értékű és d szórású) o tapasztalati átlaga t esetén közelítőleg o normális eloszlású, o μ = m várható értékkel és σ = d szórással t 14

A normális (Gauss) eloszlás Valószínűségsűrűség-függvénye: (nem kérdezzük) 1 x μ 2 f x = σ 2π e 2σ 2 Paraméterek o Várható értéke μ m a mi esetünkben o Szórása σ d t esetünkben 15

A normális (Gauss) eloszlás A várható érték körül koncentrálódik A magyarázó ábrát Petter Strandmark tette közzé Creative Commons Attribution 2.5 Generic licenc alatt A normális eloszlású változó o az esetek 68%-ában legfeljebb 1σ messze kerül μ-től o az esetek 95%-ában legfeljebb 2σ messze kerül μ-től o az esetek 99,7%-ában legfeljebb 3σ messze kerül μ-től o... 16

Konfidenciaintervallumok Ha tehát a tetszőleges eloszlású, d szórású vizsgált jellemzőről t db. (>30) megfigyelést végzünk A tapasztalati átlagáról o 68% biztonsággal kijelenthető, hogy legfeljebb d Konfidenciaintervallum Konfidenciaszint pontatlansággal becsli m értékét o 95% biztonsággal 2d o 99.7% biztonsággal 3d t t sugara (félszélessége) sugarú intervallumba esik t sugarú intervallumba esik És t növelésével gyökösen szűkül az intervallum 17

Megfigyelésszám növelése 18

Kísérlettervezés példa A várható értékre 30 megfigyelés Cél o Tapasztalati átlag: 2,3 s (jó-e ez? kell még mérni?) o Tapasztalati szórás: d = 1,1 s o 99.7%-os konfidenciaintervallum 0,6 s széles legyen Kísérlettervezés o Elvárt sugár (félszélesség) = 3σ = 3d < 0,3 s t (ez a σ az átlag szórása, nem az eredeti mért jellemzőé!) o Ezért t = 121 megfigyelés kell legalább 19

Kísérlettervezés példa tapasztalati átlag eloszlása t=1 megfigyelésnél (közelítés Gauss-eloszlással) tapasztalati átlag eloszlása t=121 megfigyelésnél (közelítés Gauss-eloszlással) 20

Kísérlettervezés példa A várható értékre 30 megfigyelés Cél o Tapasztalati átlag: 2,3 s (jó-e ez? kell még mérni?) o Tapasztalati szórás: d = 1,1 s o 99.7%-os konfidenciaintervallum 0,6 s széles legyen Kísérlettervezés o Elvárt sugár (félszélesség) = 3σ = 3d < 0,3 s t (ez a σ az átlag szórása, nem az eredeti mért jellemzőé!) o Ezért t = 121 megfigyelés kell legalább Hol a csalás? 21

Korrekció Többnyire a tényleges eloszlás paraméterei a priori ismeretlenek (különben minek mérnénk?) Így nem használható fel a tényleges d szórás Csak a tapasztalati szórás használható Gauss/normális helyett Student t-eloszlás o (más konfidenciaintervallumok) t esetén Student normális Ökölszabály: t>100 esetén használható a Gauss 22

Statisztikai próbák (ízelítő) Hipotézisek o Nullhipotézis: a világ X módon működik o Alternatív hipotézis: a világ nem X módon működik Kísérlet eredménye: Z Pl. o Ha X és az Y eltérés jellemző X-től független nem valószínűségi írható a véletlen változók; számlájára, akkor szignifikáns az eredmény vagy a vállalt SLA be van tartva p-próba (leegyszerűsítve) o p = Pr{X esetén a kísérletnek Z lesz az eredménye} o Ha p << 1, akkor a nullhipotézist cáfoltuk A nullhipotézis sosem igazolható o Vagy szignifikánsan cáfoltuk, vagy nem 23

A/B próba Statisztikai próbák (ízelítő) o A honlapterv esetén 300 mért látogatóból 4 vásárolt o B honlapterv esetén 50 mért látogatóból 2 vásárolt o Mondhatjuk-e, hogy az B jobb az A -nál? Szignifikancia: p=25% több mérés kell még (itt most a magasabb p érték jelzi a szignifikánsabb eredményt) http://web-tracking-guide.com/statistical-significance-calculator.html 24