A statisztika részei. Példa:



Hasonló dokumentumok
7. el adás Becslések és minta elemszámok fejezet Áttekintés

Statisztikai programcsomagok

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

18. Differenciálszámítás

Hipotézis-ellenırzés (Statisztikai próbák)

PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ. Írta Dr. Huzsvai László

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

Az új építőipari termelőiár-index részletes módszertani leírása

GAZDASÁGI MATEMATIKA 1. ANALÍZIS

Matematikai statisztika

KVANTITATÍV MÓDSZEREK

Villamos gépek tantárgy tételei

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Általánosítás. Többdimenziós normális eloszlás. Matematikai statisztika elıadás III. éves elemzı szakosoknak

Sorbanállási modellek

GAZDASÁGI STATISZTIKA

FELADATOK A KALKULUS C. TÁRGYHOZ

Statisztika I. 6. előadás. Előadó: Dr. Ertsey Imre

Tartalomjegyzék. Pemutáció 5 Ismétléses permutáció 8 Variáció 9 Ismétléses variáció 11 Kombináció 12 Ismétléses kombináció 13

Minőségirányítási rendszerek 8. előadás

Kontingencia táblák. Khi-négyzet teszt. A nullhipotézis felállítása. Kapcsolatvizsgálat kategorikus változók között.

konfidencia-intervallum Logikai vektorok az R-ben március 14.

Kevei Péter november 22.

3.3 Fogaskerékhajtások

Definíció. Definíció. 2. El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása fejezet. A variabilitás mér számai 3.

A PÉNZ IDİÉRTÉKE. Egy jövıbeni pénzösszeg jelenértéke:

Biostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Elméleti összefoglalók dr. Kovács Péter

specific (assignable) cause: azonosítható, tettenérhető (veszélyes) hiba megváltozott a folyamat

Hosszmérés finomtapintóval 2.

Ingatlanfinanszírozás és befektetés

AZ ÉPÜLETGÉPÉSZETI RENDSZEREK ENERGIA-HATÉKONYSÁGÁNAK KÉRDÉSEI

Ingatlanok értékelése hozamszámítással

Példa: 5 = = negatív egész kitevő esete: x =, ha x 0

1.1 Példa. Polinomok és egyenletek. Jaroslav Zhouf. Első rész. Lineáris egyenletek. 1 A lineáris egyenlet definíciója

III. FEJEZET FÜGGVÉNYEK ÉS TULAJDONSÁGAIK

Az iparosodás és az infrastrukturális fejlődés típusai

Az SPC alapjai. Az SPC alapjai SPC Az SPC (Statistic Process Control) módszer. Dr. Illés Balázs

A HŐMÉRSÉKLETI SUGÁRZÁS

Statisztika 1. zárthelyi dolgozat március 21.

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel?

VALÓSZÍNŰSÉGSZÁMÍTÁS KÉPLETTÁR

MINİSÉGSZABÁLYOZÁS. Dr. Drégelyi-Kiss Ágota

Matematikai statisztikai elemzések 2.

I. FEJEZET BICIKLIHIÁNYBAN

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

(arcsin x) (arccos x) ( x

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

11. Matematikai statisztika

Rugalmas elektronszórás; Recoil- és Doppler-effektus megfigyelése

Mérések, hibák. 11. mérés. 1. Bevezető

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

10. évfolyam, harmadik epochafüzet

Define Measure Analyze Improve Control. F(x), M(ξ),

Statisztikai módszerek

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

KAOTIKUS VAGY CSAK ÖSSZETETT? Labdák pattogása lépcsôn

képzetes t. z = a + bj valós t. a = Rez 5.2. Műveletek algebrai alakban megadott komplex számokkal

FANTASZTIKUS KOMBINATORIKA. Adva van n különböző elem. A kiválasztás sorrendje számít VARIÁCIÓ. mateking.hu

Területi koncentráció és bolyongás Lengyel Imre publikációs tevékenységében

GEOMETRIAI OPTIKA - ÓRAI JEGYZET

BIOMATEMATIKA ELŐADÁS

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Nagyméretű nemlineáris közúti közlekedési hálózatok speciális analízise

Tranziens káosz nyitott biliárdasztalokon

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

1. Az absztrakt adattípus

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

FELADATOK a Bevezetés a matematikába I tárgyhoz

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Erdei János. Minőség- és megbízhatóság menedzsment. villamosmérnöki kar menedzsment mellékszakirány

Statisztika, próbák Mérési hiba

n akkor az n elem összes ismétléses ... k l k 3 k 1! k 2!... k l!

A logaritmus függvény bevezetése és alkalmazásai

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

Tanmenetjavaslat a 6. osztályos matematika kísérleti tankönyvhöz

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

VI.Kombinatorika. Permutációk, variációk, kombinációk

Csapágyak üzem közbeni vizsgálata a csavarhúzótól a REBAM 1 -ig 2

Véletlenszám-generátorok

7. ELŐADÁS VÍZI SZÁLLÍTÁS A GLOBÁLIS LOGISZTIKÁBAN

1. A skót bakák mellkas körmérete N(88, 10). A skót bakák mekkora hányada fér bele egy 84-es zubbonyba?

5. mérés Mérés és kiértékelés számítógéppel

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Feladatok megoldással

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Felépítés Típus / Konfigurálás setup programmal. Mérési adatok kiolvasása

ANDRÁS SZILÁRD, CSAPÓ HAJNALKA, NAGY ÖRS SIPOS KINGA, SOÓS ANNA, SZILÁGYI JUDIT

Bevezetés az ökonometriába

2 x. Ez pedig nem lehetséges, mert ilyen x racionális szám nincs. Tehát f +g nem veszi fel a 0-t.

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

FOLYADÉKKRISTÁLY-TELEVÍZIÓK Éber Nándor

Statisztika 1. zárthelyi dolgozat március 18.

Matematika B4 I. gyakorlat

Sztochasztikus folyamatok 1. házi feladat

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Átírás:

STATISZTIKA Miért tauljuk statisztikát? Mire haszálhatjuk? Szakirodalom értő és kritikus olvasásához Mit állít egyáltalá a cikk? Korrektek-e a megállaítások? Vizsgálatok (kísérletek és felmérések) tervezéséhez, kiértékeléséhez Mekkora mitával dolgozzuk? Felfedeztük valamit, vagy csak a véletle eredméyezi azt, amit látuk? Meyire megbízható az eredméy? Az eredméyek közléséhez, szemléltetéséhez Mit tegyük a cikkbe? Az egész táblázatot, ábrákat, vagy csak éháy statisztikai mutatót?

A statisztika részei Leíró statisztika (descritive statistics): Mide egyedet megvizsgáluk, az egész sokaság adatait összegezzük, többé-kevésbé részletese A megfigyelt adatokat tömörítjük az összegzés sorá, ezzel iformációt vesztük. iduktív statisztika (statistical iferece): (idukció ~ általáosítás) Egy, a sokaságból választott mita alajá a megfigyelt adatokból következtetük az egész oulációra jellemző adatokra. Példa: mitabeli selejtaráy a sokaságba a selejt valószíűsége

Alafogalmak (statisztikai) ouláció ~ alasokaság (oulatio) A vizsgáladó egyedekek vagy objektumokak az a (teljes) köre, amelyre a vizsgálat iráyul, azaz amelyre következtetéseiket voatkoztati szereték mita (samle) A vizsgáladó egyedekek vagy objektumokak az a köre, amelyet téylegese megvizsgáluk, azaz amelyek adatai következtetéseik alaulak változó (variable) adat, jellemző, ismérv, tulajdoság, amelyet a mitabeli egyedeke megfigyelük, megmérük, feljegyzük (életkor, testtömeg, kaott kezelés tíusa, időtartama, stb.). A mitá megfigyelt adatokat az adatmátri tartalmazza; szokásos elredezésébe mide sor egy mitavételi egységek és mide oszlo egy változóak felel meg.

megfigyelési egység (observatioal vagy eerimetal uit) A ouláció, illetve a mita egy eleme, egy egyed vagy objektum, amelyek adatait feljegyezzük (lehet egy ember vagy állat, egy élőhely, egy vérmita, egyedek egy csoortja, l. egy család, stb.) mitavételi egység (samlig uit) Ugyaaz, mit a megfigyelési egység, ha gyakorisági adatokat számoluk. Egy egység az, amelybe számoljuk az egyedeket. Ebbe az esetbe a megszámolt egyedekek semmi közük a statisztikai oulációhoz! Megfigyelés 47.6 g 3 3 Változó testtömeg tojások száma tuliáok száma Megfigyelési egység egy bizoyos területről --- --- származó széki lile Mitavételi egység --- egy fészek az adott területről egy virágoskert az adott faluba Mita a területe befogott és megmért lilék a vizsgált fészkek a megvizsgált virágoskertek az adott faluba Statisztikai ouláció a területe fellelhető összes az összes fészek az adott az összes virágoskert az lile területe adott faluba

Megfigyelés Orchideák száma Tücskök száma a hálóba Méhek látogatási száma egy adott virágo Gázlómadarak száma a tegerarto Bogarak száma egy csadába Ektoaraziták száma Mitavételi egység Meghatározott terület (kvadrát) A végigsöört vegetáció térfogata Meghatározott időitervallum A artvoal adott hosszúságú darabja Adott méretű csada Egy gazdaállat

Mitavételezés A vizsgálatba a mita rerezetálja a oulációt. A mita rerezetatív, ha bármely tulajdoság előfordulási aráya megegyezik a mitába és a oulációba. A mita azoba gyakra torzított, amit számításba kell vei az eredméyek iterretálásáál.

Mitavételi módszerek: Egyszerű, véletle mitavétel (radom samlig): Az alasokaság mide egyede egyforma eséllyel kerül a mitába. A mita egyedeit egymástól függetleül választjuk, éldául véletleszám geerálással. Rétegezett mitavétel (stratified samlig): Az alasokaság valamilye külső szemot szerit diszjukt részekre botható. Egyes rétegekbe külö-külö véletle mitavétel. (A rétegek aráyosa szereeljeek a mitába?) Szabályos, szisztematikus mitavétel: Ha lehetetle a véletle mitavétel kivitelezése. Csak az első egyedet választjuk véletleszerűe, a többit a meghatározott mitavételi itervallumok kihagyásával (l. mide harmadik egyedet választjuk be). Ekkor a valószíűségszámítást em alkalmazhatjuk statisztikai következtetések levoására.

Nomiális (omial) Mérési skálák (measuremet scales) Csak kategóriák vaak, ics köztük redezés, matematikai műveletek em értelmezhetőek (hajszí, szemszí, ivar, faj) Ordiális (ordial) A kategóriák között va redezés, de matematikai műveletek em értelmezhetőek ( jó közees rossz, -5 skála az iskolai osztályozásba) Itervallum (iterval) A matematikai külöbségkézés már értelmes, az aráy em ( C vagy F) Aráy vagy abszolút (rate, absolute) Az aráykézés is értelmes, va abszolút 0, va fizikai jeletéstartalma aak, hogy egy meyiség többszöröse a másikak (testtömeg, K)

Koverzió itervallum vagy abszolút skáláról ordiálisra: Időkét az itervallum skálá mért adatok em alkalmasak bizoyos módszerekkel való feldolgozásra: koverzió. Pl. túl kevés adat, ismeretle eloszlás stb.. Csoortosítás Életkor helyett korcsoort, testtömeg helyett kicsi-közees-agy, stb. Ragsorolás Az adatokat sorba redezzük és ragszámot (rak) aduk ekik. Előfordulhatak azoos megfigyelések, ekkor azzal az átlagos ragszámmal (kacsolt ragszám (tied rak)) azoosítjuk, amelyet akkor kaáak, ha em leéek azoos megfigyelések. l. Hossz:.0.4.4 3. 3.5 5.0 5.0 5.0 7. 8 rag.5.5 4 5 7 7 7 9 0

Adatok ábrázolása Gyakorisági táblázat (frequecy table): megfigyelt umerikus adatok táblázatos ábrázolása gyakorisági eloszlás (frequecy distributio), taasztalati eloszlás (emirical distributio) Osztályok, osztályitervallumok kialakítása: Diszkrét: ha ics túl sok érték, egy érték egy osztály, egyébkét mit a folytoos esetbe. Folytoos: 0-0 osztály, lehetőleg mide osztályba legalább 6 érték esse. Haszáljuk természetes osztályhatárokat! Koveció: osztályokba az alsó határ beletartozik, a felső em. Abszolút vagy relatív (százalékos), esetleg kumulált gyakoriságok meghatározása Osztály -0 0-30 30-40 40-00 00- Össz. Gyakoriság 38 5 6 36 00 Kumulált gyak. 38 90 5 88 00 Relatív gyakoriság 0.9 0.6 0.3 0.8 0.06 Kumulált rel. gyak. 0.9 0.45 0.76 0.94

A relatív gyakoriságok közelítik az eloszlás sűrűségfüggvéyét, a kumulált relatív gyakoriságok edig az eloszlásfüggvéyét.

Hisztogram (histogram) A hisztogram em más, mit a taasztalati sűrűségfüggvéy. Vízszites tegelyé: osztályitervallumok, fölötte olya téglalaok, melyek területe megegyezik a megfelelő relatív, vagy százalékos gyakorisággal, így a hisztogram teljes területe, vagy 00% lesz. Diszkrét változó eseté a változó értékei az itervallumok közeé helyezkedek el. A hisztogram ha a mita elemszámát öveljük közelíti a valószíűségi változó elméleti sűrűségfüggvéyét. Eek megfelelőe a kumulatív hisztogram em más, mit a taasztalati eloszlásfüggvéy

Haraggörbe alakú eloszlások Ayakocák szaoraságáak hisztogramja Teheek éves tejtermeléséek hisztogramja

Haraggörbe alakú eloszlások? Histogram 5.00 50.00 49.00 48.00 47.00 46.00 45.00 44.00 43.00 4.00 4.00 40.00 39.00 38.00 37.00 36.00 35.00 60 50 40 30 0 0 0 300 Histogram 00 00 Std. Dev.44 Mea 4.30 N 505.00 Std. Dev 7.86 Mea 5.9 0 N 547.00 0.0 40.0 80.0 0.0 60.0 00.0 40.0 80.0 30.0 360.0 400.0 440.0 testtömeg (g) VESEZSIR Frequecy Frequecy 505 lile testtömege Őzek vese körüli zsír meyisége:

Közéértékek Adatok gyakorisági eloszlásáak grafikus ábrázolása helyett összesítő meyiségek, (ala)statisztikák (statistic). Átlag (average, mea) : Mita elemei:,...,,.... i i + + + Az átlag az az érték, amely a "legközelebb" va a mita elemeihez. A mitabeli értékek és a mitaátlag közti eltérések összege midig 0: ( ) 0 i i i i i i i i

Gyakorisági táblázat eseté súlyozott átlag: N j f j j, N ahol f. ahol az osztályokat j -vel, az egyes osztályokba levő adatok számát f j -vel, és az osztályok számát N-el jelöljük. Vigyázat! Ha va egy 80 és egy 0 fős csoortuk, akkor ha megkérdezzük a TO-t, hogy meyi az átlagos csoortlétszám, vagy edig megkérdezzük a hallgatókat, hogy milye létszámú csoortba járak, és ezt átlagoljuk, az em ugyaaz. Nem jellemzi jól a mitát, ha az eloszlás em szimmetrikus, vagy kiugró értékek vaak! Példa. Egy éjszaka 7 csadába esett hagyák száma egy lombhullató erdőbe: 7 i i 5 4 9 5 8 0 / 7 75/ 7 39. 3 j j

Mediá (media) Sorba redezzük az adatokat:..., med k+, ha k +, med k + k+, ha k. Nem érzékey az etrém értékekre. Ordiális adatok eseté is haszálható statisztika, hisze kiszámításához elegedő a megfigyelések sorredjéek ismerete (kivéve ha két közéső va). Módusz (mode) A leggyakrabba előforduló érték. Nomiális skálá mért adatokra csak ez a közéérték alkalmazható.

A közéértékek a hisztogramból is becsülhetők, bár a becslés agyo függ az osztályokba sorolástól: A módusz az az érték, amely fölött a legmagasabb téglala va. A mediától balra és jobbra a hisztogram területéek fele helyezkedik el. Az a ot az átlagérték, amelyél a hisztogram súlyotja va. Szimmetrikus és egy csúcsú hisztogram eseté a három közéérték egybeesik (a szimmetria tegelyre). Ferde eloszlás eseté az átlag midig az eloszlás "farka" (tail) felé csúszik el. Biológiai eloszlásokba szite midig jobbra (ozitíva) ferde az eloszlás, így az átlag agyobb mit a mediá és a módusz. Jobbra ferde Szimmetrikus Balra ferde eloszlás

Összehasolítás átlag leggyakoribb midig létezik mide adatot felhaszál etremális értékekre érzékey általáosa haszált mediá ritkább midig létezik etremális értékek eseté jól jöhet módusz még ritkább omiális skálára is jó

A szóródás mérőszámai A közéértékek em jellemzik elég jól az eloszlást. közéot közéot 0 50 00 0 50 00 szórás szórás Kívácsiak vagyuk arra is, hogy az adatok hogya helyezkedek el az átlagérték körül. Terjedelem (rage) A mita legagyobb és legkisebb értéke közötti külöbség. R ma mi

Iterkvartilis terjedelem (iterquartile rage: IQR) A harmadik ( Q 3) és az első kvartilis ( Q ) külöbsége. (közéső 50% terjedelme): IQR Q 3 Q Kiugró értékek (outlier) A mita olya értékei, amelyek a többihez kéest túl kicsik, vagy túl agyok: i i < > Q Q 3. 5IQR +. 5IQR Grafikusa bolot-tal ábrázolhatók: terjedelem (egyees), mediá, alsó és felső kvartilis (doboz), kiugró értékek. Normális eloszlás eseté kiugró értékekek tekithetjük azokat, amelyek a szórás háromszorosáál jobba eltérek az átlagtól. 50 40 30 N 58 505 53 363 54 34 testtömeg (g)

Taasztalati szórás és szóráségyzet vagy variacia (variace) A szórás a variacia égyzetgyöke (az alábbi s a szórás, égyzete s edig a variacia). s i ( ) i. (ez a szórás lug-i becslése!) A szórás azt mutatja meg, hogy az adataik átlagosa milye távol helyezkedek el a számtai közétől.

Gyakorlatba az ú. korrigált taasztalati szórást (Stadard Deviatio: SD) haszáljuk. i ( ) i s. A evezőbe - áll, ahol a mita elemszáma. - a szabadsági fok (degrees of freedom), ami a téyleges iformáció-tartalommal kacsolatos. A szabadsági fok értéke attól függ, hogy egy, az adathalmazból számított meyiséghez még háy értéket választhatuk meg szabado úgy, hogy a már becsült értékek em változak. Az átlag eseté a szabadsági fok. A szórás eseté egy becsült aramétert, az átlagot fel kell haszáluk. A szórásak ugyaaz a mértékegysége, mit az eredeti adataiké (ezért haszáljuk szívesebbe, mit a variaciát).

Gyakorisági táblázat eseté: s N j f j ( ) i, ahol N j f j. Eltérés égyzetösszeg: SS (sum of squares of deviatios). SS ( ) i i i i i i. Variációs koefficies (coefficiet of variatio) Külöböző átlagú miták szórásáak összehasolítása eseté. s CV % 00%

Stadard hiba (stadard error, SE) Teljes eve a mitaátlag stadard hibája, azaz szórása. SD( X ) SE( ), ahol a mitaelemszám. A mitaátlag véletletől függő meyiség. Ha rögzítjük a mitaelemszámot, és ugyaabból a oulációból többfélekée választuk ugyaolya elemszámú mitát, akkor természetese más mitaátlagot kauk. Az így kaott értékek szórása azoba kisebb, mit a ouláció szórása, hisze a mitába általába vaak az átlagostól kisebb és agyobb értékek is, és ezek a külöbségek az átlagszámításkor kioltják egymást. Más becslésekek is va SE-je, ez midig a szóba forgó becslés szórását jeleti!

Ha a mitából készített hisztogram elég jól közelíti a ormális görbét, akkor a ormális eloszlás táblázatából kiolvasható, hogy az ( s + s) az ( s + s) az ( 3s + 3s), itervallumba va adataik kb. 68%-a (kb /3-a),, itervallumba va kb. 95%-a,, itervallumba edig kb. 99.7%-a esik (majdem mid).

A biológiai változatosság (szórás). A mérési hiba: metodikai véletle hiba A szórás eredete:

Laultság és ferdeség Laultság vagy csúcsosság (Kurtosis) Az eloszlás laultságára, csúcsosságára voatkozó statisztika. Normális eloszlás eseté értéke 0, laosabb eloszlás eseté egatív, csúcsosabb eloszlás eseté ozitív. Ferdeség (skewess) Az eloszlás ferdeségére voatkozó statisztika. Szimmetrikus esetbe 0, egatív esetbe az eloszlás balra ferde, ozitív esetbe jobbra ferde. A laultság és a ferdeség stadard hibája a ormalitás illetve szimmetria tesztelésére szolgálhat. Ha a statisztikák értéke beleesik a ±SE itervallumba, akkor feltételezhetjük a ormalitást, illetve a szimmetriát.

Adatok traszformálása Sok statisztikai módszer feltételezi a ormalitást. Gyakorisági adatok eseté agyo gyakra ferde az eloszlás (biomiális, Poisso, egatív biomiális). Ha agyo ferde az eloszlás, az adatokat a araméteres módszerek alkalmazhatósága érdekébe lehet ormalizáli (ormálissá traszformáli). A araméteres statisztikai módszerek, amelyek két vagy több átlagot hasolítaak össze általába feltételezik, hogy a variacia a mitákba közel ugyaakkora. Poisso, biomiális és egatív biomiális eloszlás eseté a variacia függ az átlagértéktől.

A traszformációs techikák stabilizálják a variaciát, azaz megszütetik az átlagtól való függést. Traszformáció: f( ) i i a gyök- vagy a logaritmus- Például gyakorisági adatok eseté, ha traszformáció segít: s > 0, 3, K 0 0 0 0 log 0 Nem tökéletese ormális az új eloszlás, de ormalizált, azaz a araméteres módszerek haszálhatóak. Ha vaak 0 értékek, akkor értelmezve log helyett log ( +) haszáladó, ugyais log 0 ics

A másik iráyú ferdeség eseté a hatváy- vagy eoeciális traszformáció segíthet: 0, 3, K 0 0 e 0 0 0 A égyzetgyök traszformáció Poisso eloszlás vagy ha s eseté haszálatos. Az arcsi traszformáció Megfigyelt aráyok eseté haszálható. Az eloszlás midkét farka le va vágva, hisze mide érték 0 és közé esik. arcsi

Az adatok traszformálása segíthet, ha a vizsgáli kívát változó em ormális eloszlású, de a sikerre ics garacia, va olya eset is, amikor az eloszlást semmilye traszformáció sem kées ormálissá tei, mit éldául a következő ábrá: 0 0 0 Traszformációra szükség lehet más miatt is, éldául ha az értékek szóródása az értékek agyságától függ (szóráskiegyelítés), vagy ha két változó között a kacsolat em lieáris (liearizálás). Figyelem! Előfordulhat, hogy az eredeti adatok biológiailag jól iterretálhatók, a traszformált adatokak viszot már em tuduk biológiai jeletést tulajdoítai. Ilyekor ikább e traszformáljuk.

Becslés (estimatio) A mita megfigyelései alajá a oulációba valamely ismeretle meyiség vagy hatás mérése

Potbecslés (oit estimate) A válasz egy szám. Mivel a mitából számítjuk, ez a szám a véletletől is függ (az ebből adódó bizoytalaság mértékét leggyakrabba a becslés stadard hibájával fejezzük ki) Példák: mita átlag o. átlag (E(X)) mita variacia (korrigálatla ill. korrigált)( s ) o. variacia (var(x)) mitabeli aráy (relatív gyakoriság) o. aráy (valószíűség) mita maimum o. maimum

A otbecslés torzítatlasága Általáosa: Egy α araméterre egy (,,..., ) a mita függvéye véletle változó. α becslést adhatuk, amely ˆ Vaak olya becslések, amelyek a taasztalatok alajá em haszálhatóak. Például tedeciózusa alábecsülek a következők: mita maimum o. maimum mita variacia (korrigálatla) o. variacia (var(x)) Defiíció: (,,..., ) α torzítatla becslése α -ak, ha ˆ ( α (, )) α ˆ. E,...,

Példa: A mitaátlag torzítatla becslése a ouláció átlagak: E ( ) E( X ), mert Defiíció: ˆ(,,..., ) E( ˆ α,,...,... E( X ) +... + E( X ) E + + + E( X ). α aszimtotikusa torzítatla becslése α -ak, ha -re ( )) α (miél agyobb a mita, aál kisebb a torzítás, sőt a mitaelemszám övelésével tetszőlegese kicsivé tehető). Általába, a statisztikába egy tulajdoságra akkor modjuk, hogy aszimtotikus, ha agyo agy ( ) miták eseté igaz. Defiíció: ˆ, (,..., ) ( ˆ α(,,..., ) α ε ) 0 α kozisztes becslése α -ak, ha bármely ε >0-ra P, ha. (azaz αˆ -ak α -tól való agy eltéréséek valószíűsége 0-hoz tart, ha.)

A oulációátlag becslése a mitaátlaggal A mitaátlagok em egyelők, és em is egyezek meg a ouláció átlaggal. Mekkora a mitaátlag szórása vagy hibája (stadard error: SE)? A mitaátlag is egy valószíűségi változó: X ~ N µ, σ SE a mitaátlag szórása, vagy stadard hibája. Ha ő akkor a stadard hiba csökke. Matematikailag bizoyítható (Cetrális határeloszlás tétel), hogy függetleül a mitaelemek eloszlásától, a mitaátlag eloszlása midig a ormális eloszláshoz tart, várható értéke a ouláció várható értékével egyezik meg. >30 eseté feltételezhetjük a mitaátlag ormalitását. σ 0 5 µσ µσ µ µ+σ µ+σ

Itervallumbecslés (iterval estimate) Kofidecia-itervallum (cofidece iterval) eseté a válasz egy értéktartomáy, amelybe az ismeretle meyiség 95% (esetleg 90% vagy 99%) valószíűséggel beleesik. A választott valószíűség a megbízhatósági szit (cofidece level). Általába szimmetrikus kofidecia-itervallumot keresük (de em midig). A kofidecia-itervallum kostrukciója agyo egyszerű azokba az esetekbe, amikor a szokásos otbecslés legalábbis közelítőleg ormális eloszlást követ (a, az, a, az ilyeek), mert ekkor a ormális eloszlásra érvéyes kélettel számolhatuk: 95%-os itervallum: a otbecslés ±.96 SE

Defiíció: Az eloszlás ismeretle a araméteréek becslésekor a szitű kofidecia (megbízhatósági) itervallum egy olya ( α, α ) itervallum, amely valószíűséggel tartalmazza a-t, azaz P ( α a< ). < α

Kofidecia-itervallum ormális eloszlású változó átlagára Tudjuk, hogy a mitaátlag eloszlása σ X ~ N µ,, tehát a mitaátlag σ σ valószíűséggel bee va a µ z, µ + z itervallumba. Ez azt jeleti, hogy a mitaátlag % valószíűséggel em esik távolabb a oulációátlagtól, mit z. Ha a ouláció-átlagot em ismerjük, de egy mitaátlagot ige, σ akkor ebből visszakövetkeztethetük a ouláció-átlagra, így kajuk a kofideciaitervallumot.

Ha em ismerjük a ouláció szórását, σ-t, akkor megbecsülhetjük azt is ugyaabból a mitából, mit az -t, de ekkor a ormális eloszlás kritikus értékei helyett a t- eloszláséit kell haszáluk, így a kofidecia-itervallum: A t-eloszlás szabadsági foka: -. s s t ; + t. >50 eseté a t-eloszlás és a ormális eloszlás már em tér el agyo, ezért közelítéskét a ormális eloszlás kritikus értékei is haszálhatók. Bár általába azt modjuk, hogy a oulációátlag 95% valószíűséggel bee va a kofidecia-itervallumba, a szóhaszálat helytele. A oulációátlag ugyais egy otosa adott, bár általuk em ismert szám. Ha a kofidecia-itervallumot meghatároztuk, az vagy tartalmazza ezt az értéket, vagy em, de az már em véletleszerű. A helyes szóhaszálat az lee, hogy az adott mitaelemszám mellett 95% valószíűséggel tuduk választai olya mitát, amelyből számított kofideciaitervallum téylegese tartalmazza a oulációátlagot.

Kofidecia-itervallum két ormális eloszlású változó átlaga közötti külöbségre (függetle mitáko) Ismert szórások eseté: + z σ σ ) (, + + z σ σ ) (, ahol és a mitaátlagok, σ és σ az ismert szórások, és a mitaelemszámok, z edig a ormális eloszlás megfelelő értéke.

Ismeretle szórások eseté: Ha va okuk feltételezi, hogy a szórások egyelők: ( ) ( ) ( ) + + + s s t, ( ) ( ) ( ) + + + + s s t, ahol és a mitaátlagok, s és s a mitákból szokásos módo becsült szórások, és a mitaelemszámok, t edig az + szabadsági fokú t-eloszlás megfelelő értéke.

Ha a szórások egyelőségét máshoa em tudjuk, F-róbával szokás elleőrizi. Ha a szórások egyelősége em feltételezhető (em tudjuk előre, és az F-róba alajá is el kell veti), agy mitára (, 30) közelítő érvéyel az ismert szórások esetére megadott kélet is haszálható, egyszerűe a σ-k helyére a becsült szórásokat írva. Kis mitára a Welch-féle korrekció alkalmazható, amit most em ismertetük. A statisztikusok egy része úgy véli, hogy a fetiekek ics értelme. Általáos esetbe em feltételezhető a szórások egyezősége, az F-róba alkalmazásával edig felesleges bizoytalaság kerül a redszerbe, ezért midig úgy kell tekitei, hogy a szórások külöbözőek. A vita a mai aig ics eldötve, ezért ebbe az esetbe úgy kell számoli, ahogy az adott tudomáyterülete (adott folyóiratba) szokás.

Kofidecia-itervallum két ormális eloszlású változó átlaga közötti külöbségre (ugyaazo egyedeke) Ha midkét változót ugyaazoko az egyedeke mértük, akkor először mide egyedre kiszámítjuk a két mért érték külöbségét (d), majd ezekből a kofideciaitervallumot az alábbi módo: d t s d sd, d+ t, ahol d a külöbségek átlaga, s d a külöbségek becsült szórása, a mitaelemszám (úgy értve, hogy midkét mita elemű!), t edig az - szabadsági fokú t-eloszlás megfelelő értéke.

Megjegyzések Ugyaígy számolhatuk akkor is, ha a mérések em ugyaazoko az egyedeke törtétek, de a két mita elemei árosíthatók (l. ikerárok adatai). Nem szükséges az, hogy midkét változó ormális eloszlású legye, elegedő, ha a külöbségek ormális eloszlást követek. Nagy miták eseté ( 30) közelítőleg érvéyes akkor is, ha a külöbség em ormális eloszlású. Nagy miták eseté ( 50) a t-eloszlás kritikus értékei helyett itt is haszálhatjuk a ormális eloszlás kritikus értékeit.

Kofidecia itervallum oulációbeli aráyra (vagy eseméy valószíűségére) (biomiális eloszlás araméterére) Durva közelítés (a biomiálist ormálissal közelítve): ( ) ( ) + z z ˆ ˆ ˆ, ˆ ˆ ˆ ahol $ - a mitából becsült érték Feltétel: 5 5 ˆ

Fiomabb közelítés: ( ) ( ) + + + + + + + 4 4 z z z z z z z z ˆ ˆ ˆ, ˆ ˆ ˆ Feltétel: 5 5 ˆ

Példa: Egy atigé 00 megvizsgált egyed közül 0 vérébe volt kimutatható. Adjuk 95%-os kofidecia-itervallumot az atigéel redelkezők oulációbeli aráyára! 96 0 0 00 0 00 0 00 5.. ˆ. / ˆ %. z z A feltétel feáll. Számoljuk a durva közelítéssel: ( ) ( ) ( ) 59 04 0 0 00 9 0 0 96 0 00 9 0 0 96 0.,.....,.... ˆ ˆ ˆ, ˆ ˆ ˆ + + z z

A szükséges mitaelemszám meghatározása oulációbeli aráy becsléséhez Számítsuk ki, mekkora mita szükséges ahhoz, hogy egy tulajdoság oulációbeli előfordulási aráyára adott 95%-os itervallum szélessége a 0%-ot e haladja meg (mit éldául 6% - 36%). Az hogy milye széles kofidecia-itervallummal lehetük elégedettek, az adott vizsgálat otossági követelméyei szabják meg. A kofidecia-itervallum szélességét több dolog befolyásolja. Aál keskeyebb lesz az itervallum, miél kisebb megbízhatósági szitet követelük meg (90% alá e mejük ) miél jobb, otosabb eljárást alkalmazuk a kofidecia-itervallum kostrukciójára, miél agyobb mitával dolgozuk, miél távolabb esik az aráy az 50%-tól (bármelyik iráyba)

A számítások követhetősége kedvéért most haszáljuk a kofidecia-itervallum kostrukciójára a legegyszerűbb eljárást. Ezzel a 95%-os itervallum: ˆ. 96 ˆ ( ˆ ) ˆ ( ˆ ), ˆ +. 96 ahol ˆ a mitabeli aráyt, edig a mitaelemszámot jelöli. Az itervallum szélessége ie a gyök alatti kifejezés szorozva 3.9-vel. Azt szereték, hogy ez legfeljebb 0% legye, azaz ˆ ( ˆ ) 3.9 0. A ˆ -t megsaccolva, majd az egyelőtleséget -re megoldva kajuk a mitaelemszámot. Például ha ˆ 0.3 körüli értékre számítuk, akkor 35 adódik. Midig legye szó akár átlagértékről, akár ouláció aráyól, vagy bármi másról ugyaígy, a szóba forgó kofidecia-itervallum számítási kéletéből kiidulva határozhatjuk meg a szükséges mitaelemszámot. Persze midig lesz olya araméter, amelyet ehhez meg kell saccoli, mert tőle is függ az itervallum szélessége.

A szükséges mitaelemszám meghatározása átlag becsléséhez A kofidecia-itervallum fél-hossza: h z σ Ebből kifejezve a szükséges elemszámot: z σ h Ha em ismerjük a ouláció szórását, akkor előzetes mitából becsüljük a szórást: t s h, a t szabadsági foka az előzetes mita elemszáma -. Ha a kaott mitaelemszám em agyobb, mit az előzetes, akkor a meglévő mita már elegedő a kívát otossághoz.

A Kofidecia-itervallum a oulációbeli variaciára, ill. szórásra χ ( ) s σ statisztika χ ezért létezik olya χ, χ, hogy Az egyelőtleséget átredezve: χ - χ - eloszlású, - szabadsági fokú valószíűségi változó, ( ) s P χ χ χ σ ( ) s ( ) s P σ χ χ -höz tartozó χ érték, (95% eseté a 0.05-höz tartozó kritikus érték) + -höz tartozó χ érték, (95% eseté a 0.975-höz tartozó kritikus érték)