Számítógépes döntéstámogatás



Hasonló dokumentumok
Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

V. GYAKORLATOK ÉS FELADATOK ALGEBRÁBÓL

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

specific (assignable) cause: azonosítható, tettenérhető (veszélyes) hiba megváltozott a folyamat

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Laboratóriumi mérések

Hipotézis-ellenırzés (Statisztikai próbák)

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

3.3 Fogaskerékhajtások

1.1 Példa. Polinomok és egyenletek. Jaroslav Zhouf. Első rész. Lineáris egyenletek. 1 A lineáris egyenlet definíciója

Valószínűségszámítás. Ketskeméty László

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Descriptive Statistics

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Descriptive Statistics

Statisztikai programcsomagok

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

7. el adás Becslések és minta elemszámok fejezet Áttekintés

A statisztika részei. Példa:

Ingatlanfinanszírozás és befektetés

I. FEJEZET BICIKLIHIÁNYBAN

18. Differenciálszámítás

Tartalomjegyzék. Pemutáció 5 Ismétléses permutáció 8 Variáció 9 Ismétléses variáció 11 Kombináció 12 Ismétléses kombináció 13

A Sturm-módszer és alkalmazása

Hegedős Csaba NUMERIKUS ANALÍZIS

Példa: 5 = = negatív egész kitevő esete: x =, ha x 0

Orosz Gyula: Markov-láncok. 2. Sorsolások visszatevéssel

? közgazdasági statisztika

? közgazdasági statisztika

KÉRDÉSEK_GÉPELEMEKBŐL_TKK_2016.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Mérések, hibák. 11. mérés. 1. Bevezető

I. BEVEZETİ. i= 1 i= Z : Ai F és Ai Ai+ i Z : Bi F és Bi Bi+

Kontingencia táblák. Khi-négyzet teszt. A nullhipotézis felállítása. Kapcsolatvizsgálat kategorikus változók között.

A HŐMÉRSÉKLETI SUGÁRZÁS

Hajtástechnika \ Hajtásautomatizálás \ Rendszerintegráció \ Szolgáltatások MOVITRAC B. Üzemeltetési utasítás. Kiadás:

Nevezetes középértékek megjelenése különböző feladatokban Varga József, Kecskemét

KULCS_GÉPELEMEKBŐL III.

Villamos gépek tantárgy tételei

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Tranziens káosz nyitott biliárdasztalokon

Rugalmas elektronszórás; Recoil- és Doppler-effektus megfigyelése

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Descriptive Statistics

A logaritmus függvény bevezetése és alkalmazásai

Ftéstechnika I. Példatár

2 x. Ez pedig nem lehetséges, mert ilyen x racionális szám nincs. Tehát f +g nem veszi fel a 0-t.

KAOTIKUS VAGY CSAK ÖSSZETETT? Labdák pattogása lépcsôn

1. Az absztrakt adattípus

5. Trigonometria. 2 cos 40 cos 20 sin 20. BC kifejezés pontos értéke?

Bevezetés. Párhuzamos vetítés és tulajdonságai

Hosszmérés finomtapintóval 2.

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Analízis I. példatár. (kidolgozott megoldásokkal) elektronikus feladatgyűjtemény

INTERFERENCIA - ÓRAI JEGYZET

M3 ZÁRT CSATORNÁBAN ELHELYEZETT HENGERRE HATÓ ERŐ MÉRÉSE

Sorbanállási modellek

6. MÉRÉS ASZINKRON GÉPEK

Felhasználói kézikönyv

V. Gyakorlat: Vasbeton gerendák nyírásvizsgálata Készítették: Friedman Noémi és Dr. Huszár Zsolt

2. előadás: További gömbi fogalmak

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

b) Adjunk meg 1-1 olyan ellenálláspárt, amely párhuzamos ill. soros kapcsolásnál minden szempontból helyettesíti az eredeti kapcsolást!

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

AZ ÁLTALÁNOS ISKOLÁSOK IDEGENNYELV-TANULÁSI ATTITŰDJEI ÉS MOTIVÁCIÓJA

Matematikai programozás gyakorlatok

15.KÚPKEREKEK MEGMUNKÁLÁSA ÉS SZERSZÁMAI

Félévi időbeosztás (nagyjából) házi feladat beadási határidőkkel (pontosan) Valószínűségszámítás 2. matematikusoknak és fizikusoknak, 2009 tavasz

képzetes t. z = a + bj valós t. a = Rez 5.2. Műveletek algebrai alakban megadott komplex számokkal

9. LINEÁRIS TRANSZFORMÁCIÓK NORMÁLALAKJA

GEOMETRIAI OPTIKA - ÓRAI JEGYZET

Valószínűségszámítás összefoglaló

TENYÉSZTÉSES MIKROBIOLÓGIAI VIZSGÁLATOK II. 1. Mikroorganizmusok számának meghatározása telepszámlálásos módszerrel

Szennyvíztisztítási technológiai számítások és vízminőségi értékelési módszerek

Az új építőipari termelőiár-index részletes módszertani leírása

A születéskor várható élettartam nemek szerinti térbeli különbségei

Biostatisztika e-book Dr. Dinya Elek

1. BEVEZETÉS. - a műtrágyák jellemzői - a gép konstrukciója; - a gép szakszerű beállítása és üzemeltetése.

1. ZÁRTTÉRI TŰZ SZELLŐZETÉSI LEHETŐSÉGEI

Járattípusok. Kapcsolatok szerint: Sugaras, ingajárat: Vonaljárat: Körjárat:

FELADATOK a Bevezetés a matematikába I tárgyhoz

2. AZ INFORMÁCIÓS TÁRSADALOM ÉRTELMEZÉSI DIFFERENCIÁINAK TERÜLETI KÖVETKEZMÉNYEI

MIKROÖKONÓMIA I. Készítette: K hegyi Gergely és Horn Dániel. Szakmai felel s: K hegyi Gergely június

A hıtermelı berendezések hatásfoka és fejlesztésének szempontjai. Hőtés és hıtermelés október 31.

Matematikai és matematikai statisztikai alapismeretek

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

Egy csodálatos egyenesről (A Simson-egyenes) Bíró Bálint, Eger

Számelméleti feladatok az általános iskolai versenyek tükrében dr. Pintér Ferenc, Nagykanizsa

III. FEJEZET FÜGGVÉNYEK ÉS TULAJDONSÁGAIK

A 2011/2012. tanévi FIZIKA Országos Középiskolai Tanulmányi Verseny első fordulójának feladatai és megoldásai fizikából. I.

HOSSZTARTÓ TERVEZÉSE HEGESZTETT GERINCLEMEZES TARTÓBÓL

Analízisfeladat-gyűjtemény IV.

FELHASZNÁLÓI LEÍRÁS a DIMSQL Integrált Számviteli Rendszer Készlet moduljának használatához

VALÓSZÍNŰSÉGSZÁMÍTÁS KÉPLETTÁR

Tűgörgős csapágy szöghiba érzékenységének vizsgálata I.

Statisztika, próbák Mérési hiba

Statisztikai. Statisztika Sportszervező BSc képzés (levelező tagozat) Témakörök. Statisztikai alapfogalmak. Statisztika fogalma. Statisztika fogalma

Átírás:

Pao Egyetem Műszak Iformatka Kar Vllamosmérök és Iformácós Redszerek aszék Számítógépes dötéstámogatás Előadás vázlatok Dr. Kozma György Veszprém, 0/03

Számítógépes dötéstámogatás tematka, 0 ematka. Leíró és kísérletes bostatsztka/epdemológa vzsgálatok fő típusa, paraméterek, a paraméterek mamum-lkelhood becslése. Mtavétel módszerek (SK:3-53 alapjá). Következtetések adatokból, hpotézsvzsgálat módszerek a következtetésekél, teszt statsztka és stadard error fogalom az átlagszámításál (FLH: 3-48) 3. Egymtás t-teszt, kétmtás t-teszt, párokra voatkozó t-teszt, ANOVA, három, vagy több eloszlás átlagáak összehasolítása, Boferro-féle korrekcó (FLH: 3-48, R: 34-37) 4. Aráyok becsléséek és összehasolításáak módszere, z-appromácó, kh-égyzet teszt. Stadardzált mortaltás statsztka. (FLH: 3-48) 5. Korrelácós együtthatók becslése és összehasolítása, Fsher-traszformált, kofdeca tervallumok, determácós együttható számítása (FLH: 60-64, R: 509-54)) 6. Leárs regresszó, logsztkus regresszó és alkalmazása rzkóbecslésekél (FLH: 403-45, R: 443-465) 7. úlélés statsztkák számítása, Kapla-Meer módszer (FLH: 306-37, R: 609-65) 8. Osztályozás: Bayes-típusú osztályozás két osztályra, a módszer kterjesztése K-osztályra (YC: -8, -4). Az a pror valószíűség (prevaleca) meghatározása, a feltételes valószíűség sűrűségfüggvéyek becslése. Legközelebb szomszédok elve (NN) alapjá törtéő osztályozás (YC: 90-99) 9. Leárs dszkrmaca aalízs, leárs szeparálhatóság, párokét szeparálhatóság (YC: 09-8), a Perceptro taítása végteleített valdált adatokkal, a taítás kterjesztése K-osztályra. Leárs dszkrmaca aalízs módszere em-szeparálható osztályokra, Fscher-féle leárs dszkrmás (YC:38-40) 0. Léyegkemelés: a Karhue-Loève traszformácó léyege, a traszformácó bázsvektoraak meghatározás módja, a kovaraca mátr fogalma (YC: 4-33) Irodalom: Saha, Kurshd: Statstcs epdemology, CRC, Boca Rato, 996. Forthofer RN, Lee ES, Heradez M: Bostatstcs, Academc Press, Amsterdam, 007. Roser B: Bostatstcs, Dubury, Belmot, 995. Youg Y, Calvert W: Classfcato, estmato ad patter recogto. Elsever, New York, 974 Kozma Gy. Számtógépes dötéstámogatás, Veszprém

I. rész: Epdemológa és klka dötések statsztka módszere Bevezetés A statsztka szerepe a tudomáyos tevékeységbe A kutatás alapvető feladata új smeretek szerzése, a tudomáy külöböző területe a megfelelőe gazolt tudásmeység övelése. A tudásmeység három fő csoportba osztható:. Jeleségek leírása a megfgyelhető karaktersztkumok alapjá. Jeleségek között kapcsolatok leírása 3. A jeleségek között feálló ok-okozat kapcsolatok leírása Az egyes tudomáyterületeke a fet három terület részesedése az össz-tudásmeységből más és más lehet. Az egzakt természettudomáyoko belül (fzka, kéma) a harmadk elem domál, más tudomáyoko belül (társadalom- és élőtudomáyok) az első kettő részesedése a magasabb. Mde tudomáyterülete belül gaz azoba, hogy a megállapítások tartalmazak egy bzoytalaságot s, amt a kutatók mmalzál akarak, ll. jellemez kíváják a bzoytalaság mértékét. Eze a poto lép be a kutatás eszköztárába a statsztka. A Számítógépes dötéstámogatás c. tárgy elsősorba az orvos, egészségügy, épegészségügy tudomáyok géye szempotjából a tudás megszerzésével kapcsolatos dötések kérdésevel foglalkozk. Az előtaulmáyok szempotjából a valószíűségszámításra és a statsztkára támaszkodk. Az előadások a felmerülő dötés feladatok elv kérdéset értk, a kapcsolódó gyakorlatok sorá a feladatok megválaszolásáak számítógépes megoldásat mutatjuk be.

. Bostatsztka vzsgálatok típusa, statsztka vzsgálatok mtavétel módszere Statsztka típusú orvos vzsgálatok A vzsgálatok két fő típusa: Leíró (observatoal) vzsgálat: valamlye szempot szert kválasztott egy vagy több csoport tagjaak jellemzőt rögzít, aélkül, hogy a spotá folyamatokba műv beavatkozás törtée. Kísérletes (epermetal, klka: ha betegeke végzk) vzsgálat: a fetekhez hasolóa választott csoportok jellemzőt rögzít, mközbe az életta folyamatokba jól defált beavatkozás törték (gyógyszer adagolás, kezelés). A fő típusok fomabb osztályozása: Leíró (epdemológa) vzsgálatok: - case-cotrol (eset-kotroll) vzsgálat (retrospektív) - keresztmetszet (cross-sectoal) vzsgálat (prevaleca vzsgálat) - követéses típusú (cohort) vzsgálat (prospektív, logtudáls) Kísérletes vzsgálatok: (Kíváatos formája a kotrollált kísérlet, ahol két csoport összehasolítását (refereca ll. beavatkozások) végzk. Eél gyegébb, amkor a kotrollcsoport élkül számolak be eredméyekről. - Párhuzamos (parallel v. cocurret) vzsgálatok - radomzált - em-radomzált - Szekvecáls vzsgálat - ökotrollos - cserélős (crossover) Epdemológa vzsgálatok célja a betegségek ok téyezőek, kockázat téyezőek felderítése. Arra keres a választ, hogy a kórok téyező megléte meyvel övel az új megbetegedések (évekét) gyakorságát, cdecáját. Fogalmak: Icdeca: adott dőszak (pl. év) alatt megjeleő új megbetegedések száma Pravaleca: Egy adott pllaatba valamely betegség gyakorsága a populácóba.

Leíró típusú vzsgálatok logka felépítése Az epdemológa vzsgálatok kotgeca táblája kockázat kockázat Összese téyezővel téyező élkül beteg A B A+B Mtavételezett csoport a egészséges C D C+D retrospektív vzsgálatokál A+C B+D A+B+C+D Összese Prospektív vzsgálatok mtavételezett csoportja Keresztmetszet (prevaleca) vzsgálatok mtavételezett csoportja Eset-kotroll típus: kockázat téyezőek ktett csoport: A kockázat téyező metes csoport: B esetek : A+B (beteg) kockázat téyezőek ktett csoport: C kockázat téyező metes csoport: D egészségesek: C+D t: dő vzsg. kezdete követés ráya (retrospectve stody)

Epdemológa vzsgálatokál haszált valószíűségek (alapparaméterek) p : aak a valószíűsége, hogy kockázat téyezővel redelkező megbetegszk p : aak a valószíűsége, hogy kockázat téyezővel em redelkező megbetegszk. Az alapparaméterek becslése: p A A + B ; p C C + D az alapparaméterek bomáls eloszlást követek, azaz k P( k) p q k E( ) p Var( ) pq Származtatott paraméterek: k Rzkó külöbség: p p Relatív rzkó: p / p Odds (esély): p p ll. p p Odds (esély) háyados: p p ( p ) / /( p ) Megjegyzés: Véges mtából törtéő becslés jeletőse eltérhet az elmélet értékektől. A később fezetekbe több módszert tárgyaluk a becslések ll. az ebből levot következtetések helyességéek garatálása érdekébe.

Keresztmetszet típus: Az epdemológa vzsgálatok kotgeca táblája kockázat kockázat Összese téyezővel téyező élkül beteg A B A+B Mtavételezett csoport a egészséges C D C+D retrospektív vzsgálatokál A+C B+D A+B+C+D Összese Prospektív vzsgálatok mtavételezett csoportja Keresztmetszet (prevaleca) vzsgálatok mtavételezett csoportja Általáos esetbe a prevaleca vzsgálatokál vzsgált populácó az alább ábráak megfelelőe alakul: vzsgált populácó: A+B+C+D beteg csoport: A+B egészséges csoport: C+D a vzsgálat egy pllaatra voatkozk A prevaleca fogalom alkalmazható (pl. mukaegészségügy vzsgálatokál) valamlye veszélyeztető körülméyek ktett ll. attól metes csoportokra s. Ilyekor a betegség prevalecáját számíthatjuk az eek megfelelőe szűkített csoportokra, az alább módo: Alap paraméterek: p A A + C p B B + D Származtatott paraméterek: prevaleca dffereca: p p prevaleca háyados: p / p prevaleca esély (odds) aráy: p /( p) p /( p )

Ameybe valamely betegség prevalecája: p, akkor ha az adott betegség cdeca értéke (I) álladó az dő függvéyébe, akkor p p Id, ahol: d: a betegség átlagos hossza. Követéses típus (cohort): Az epdemológa vzsgálatok kotgeca táblája kockázat kockázat Összese téyezővel téyező élkül beteg A B A+B Mtavételezett csoport a egészséges C D C+D retrospektív vzsgálatokál A+C B+D A+B+C+D Összese Prospektív vzsgálatok mtavételezett csoportja Keresztmetszet (prevaleca) vzsgálatok mtavételezett csoportja vmlye hatásak ktett alcsoport betegség bekövetkezett : A populácó betegség em következett be :C a hatásak em ktett csoport betegség bekövetkezett: B betegség em következett be:d a vzsgálat kezdete t dő yomkövetés ráya

Alap paraméterek: p A A + C p B B + D Származtatott paraméterek: Relatív rzkó: Odds (esély) háyados: p p p p /( p) /( p ) Rzkó külöbség: p p pkus példák: - Framgham study: kardovaszkulárs rzkó becslése (ld.. táblázat) - terápák összehasolítása. táblázat. A Framgham rzkóbecslések változó változó P (CVD/8 year) P (CHD/0 year) Kor X X X Nem X X X BMI (body mass de) X P (stroke/0 year) doháyzás X(I/N) X (db/ap) X(I/N) SBP X X X LVH (EKG alapjá) X(I/N) X(I/N) X(I/N) Dabetes X(I/N) X(I/N) X(I/N) Ptvar fbrllacó CVD Összkoleszter X X Jelölések: CVD: cardovascular dsease CHD: coroary heart dsease SBP: systolc blood pressure X X(I/N)

Kísérletes vzsgálatok Párhuzamos típus: kísérlet ayagok hatás bekövetkezett vzsgált populácó hatás em következett be hatás bekövetkezett kotroll csoport hatás em következett be vzsgálat kezdete beavatkozások t dő - A két alcsoport kezelése azoos, kvéve, hogy a kísérlet alayok hatóayagot, a kotroll csoport placebót kap. - Kísérlet techkák - radomzált: egy kísérlet, ha a csoportra botás véletle, mdek ugyaolya eséllyel kerülhet az egyk vagy a másk csoportba. - em radomzált: a fet kísérlet, ha a csoportba osztás em véletle jellegű. A fő érv ez elle, hogy a kapott eredméy torzított lehet! - Bld: amkor a beteg em tudja, hogy ő a kísérletbe melyk csoportba va (terápás kísérlet v. kotroll csoport) - double bld: amkor sem a beteg, sem az orvos em tudja, hogy az adott alay melyk csoportba va,

Szekvecáls vzsgálatok va hatás va hatás kísérlet cs. kísérlet cs. populácó cs hatás cs hatás hatás va hatás kotroll cs. cs hatás kotroll cs. cs hatás vzsgálat kezdete beavatkozás kmosás beavatkozás peródus Mtavétel módszerek Radom: a vzsgált populácó mde tagja azoos valószíűséggel kerülhet be a,,mtába" Szokásos techka: véletle szám geerátor haszálat Systematc samplg: Ha K mtát akaruk, a populácót K csoportra osztva, mdegykből az azoos sorszamút vesszük. A csoporto belül sorszám: radom Stratfed samplg: A populácót alcsoportokra (pl. em, életkor szert) botják, majd mde alcsoporto belül radom samplg törték. Cluster samplg: Ugyacsak alcsoportokat képez, de geografa alapo, majd radom módo mtavételez.

A mtákból levot következtetések általáosítása: cél populácó A teljes populacóra való következtetés akkor lehet, ha a mtavételezett populácó reprezetálja a célpopulácót. mtavételezett populácó radom mta eseté a mtából következtet lehet a mtavételezett populácóra mta Az orvos gyakorlatba előforduló adatok típusa Nomal scales cathegorcal observatos qualtatve observatos kategorzált adatok Léyeg: az adatok kategorzált, osztályba, típusba sorolt formába állak redelkezésre, sokszor csak kétféle kmeet lehet (valamlye jeleség va vagy háyzk), azaz bárs adatokról va szó (pl. ff-ő, fekete-fehér). Ordal scales (fotosság sorred szert redezett skála): Olya esetekbe, amkor kategórákba sorolt megfgyelések vaak. A kategórák orvos értelembe pl. egyre súlyosabb eseteket foglalak magukba. Agyérbetegségek vzsgálatáál haszált Rak-skála: üetmetes 0 Eyhe tüetek: em befolyásolják az életvezetést Eyhe fogyatékosság: korább tevékeységet em tudja ellát, de öellátó Közepes fogyatékosság: a ház beteggodozást géybe vesz, de segítség élkül képes jár Közepese súlyos fogyatékosság: a ház beteggodozást gyakra géybe vesz, em tud segítség élkül jár 3 4

Súlyos fogyatékosság: éjjel-appal felügyeletre szorul, ágyhoz kötött 5 Pl.: méhyak rák mősítésére szolgáló O,.., IV skála eseté O: csak a méhyakra kterjedő rák, IV: a medecére, vagy a hólyag yálkahártyára és a végbélre s kterjedő dagaat Más példa a rheumatod arthrts (reumaszerü zületgyulladás): : ormál aktvtás 4: tolószékhez kötött uberculoss bőrreakcó mősítése a bőrreakcó agyságától függőe, Apgar score: újszülöttek érettségéek jellemzése a 0-0 skálá, stb. Sokszor valamlye algortmussal végül egy számot redelek egy több faktor által meghatározott sztuácóhoz, pl. Goldma de a szívbetegek sebészet rzkójáak becsléséhez: 0-53 skálá. Rak-order scale: olya skála, amely pl. a ks súllyal születés leggyakorbb okatól a külölegesg haladva a gyakorságot jellemző skálát redel. Numercal scales (umerkus skála) Kvattatv megfgyelések, folytoos vagy dszkrét skálá Véryomás (Hgmm) Elszívott cgaretták száma Percekét etra ütések száma

. Következtetések adatokból, kofdeca tervallumok és hpotézsvzsgálatok Paraméter becslések Cél: egy mta alapjá következtet valamely keresett paraméter lehetséges értékéről A paraméterbecslő eljárás statsztka tulajdoságat defáló téyezők: - a tektett paramétert meghatározó statsztka (átlag, szórás, aráy, stb.) Megjegyzés: Statsztkáak a mtabel változók egy tetszőleges függvéyét evezzük. A statsztka kokrét formája függ attól, hogy mlye paraméter közelítésére szájuk. - véletleszerűe választott mta - a választott mta agysága - aak a populácóak a defálása, amelyet a mta reprezetál A várhatóértéket meghatározó statsztka eloszlása (samplg dstrbuto of the mea) A populácó eloszlása és a várhatóérték meghatározására szolgáló statsztka eloszlása: - A populácó eloszlása gyakorlatlag akármlye lehet (függetle, véges szórású valószíűség változók) - Az átlagot meghatározó statsztka (amely a mtaelemek számta közepe) eloszlása, (mél több elemet tartalmaz a mta) a közpot határeloszlás tétel értelmébe közelít a ormáls eloszláshoz. A közpot határeloszlás tétel értelmébe: - a samplg dstrbuto, a várhatóérték meghatározására szolgáló statsztka, átlaga megegyezk a megfgyelések átlagával - a samplg dstrbuto szórása: σ/ /, ahol a mta elemeek száma, σ a populácó eloszlásáak szórása. Agol eve: stadard error of the mea Megjegyzések: - 30 eseté a közpot határeloszlás általába jó közelítések tekthető - ameybe a populácó szórása em smert, a becslésbe σ helyett az emprkus szórás értéke haszálható (amt ugyaabból a mtából számolhatuk), lyekor azoba az átlag meghatározására szolgáló statsztka eloszlása már em ormáls eloszlású (lsd. később) A fetek értelmébe aak vzsgálatára, hogy egy adott mta meyre közelít az elmélet értéket em szükséges smételt mtavétellel kísérleteket végez, egy mtából becsülhető a kapott közelítés potossága. A kokrét számításokál gyakra haszált traszformált változó defícója: z ( - µ) /σ a z változó tulajdosága: - átlagértéke 0, szórásra ormalzált.

Normál (Gauss) eloszlás sűrűségfüggvéye: f ( ) πσ e µ σ Normalzált Gauss eloszlás eloszlásfüggvéye Φ π α α e v

Következtetések az adatokból Hpotézs vzsgálatok: Célja: a vett mta alapjá yert eredméyt általáosíta arra a populácóra, amelyből származott. Feltételezzük, hogy a mtavétel véletleszerű volt és szakmalag s helyese törtét. A statsztka hpotézs tehát végsősoro egy állítás a populácó bzoyos paramétereről. A hpotézs vzsgálat hbá és ereje I. hba: elsőfajú hba: a. A ull-hpotézs elvetése, holott gaz II. hba: másodfajú hba: b. Nem vet el a ull-hpotézst, pedg az alteratív hpotézs gaz. power: a teszt ereje, képessége, hogy egy adott agyságú külöbséget észlelje, ameybe az (a külöbség) valóba létezk. Számítása: -b. áblázatos összefoglalás: Valóságos helyzet Va külöbség: H Ncs külöbség: H o eszt eredméy Va külöbség (H o elutasítása) cs külöbség (H o gaz) * power: -b I. hba II. hba * Gyakra végezek power (a vzsgálat erejére voatkozó) aalízst egy vzsgálat előtt. Eek az a célja, hogy kderítse, hogy egy adott külöbség felderítéséhez, legalább mekkora mtát kell választa. Ugyacsak szükséges a power aalízs akkor, ha meggyőzőe akarják bzoyíta, hogy pl. két gyógyszer között cs szgfkás külöbség. A hpotézsvzsgálat lépése:. Kérdés megfogalmazás a hpotézsvzsgálat yelvé: - H o : azt állítja, hogy cs külöbség a mta alapjá meghatározott és a populácóra feltételezett érték között (ull-hpotézs: ulla tehát cs külöbség) - H : azt állítja, hogy az előző ellekezője gaz (alteratív hpotézs az gaz) Megkülöböztetük: - oe-taled (egy ráyú, amkor a hpotézs egy adott ráyú eltérés bzoyíthatóságára kérdez rá) - two-taled (két ráyú, amkor az eltérés két ráyú lehet) vzsgálatokat. Helyesebb arról beszél, hogy egy ull-hpotézs a mta adatok alapjá em vethető el ahelyett, hogy elfogadjuk

. est statstcs és a hozzátartozó valószíűségeloszlás meghatározása (kválasztása) Pl. az átlag számítás eseté az u. krtkus aráyt haszáljuk (más esetbe pl. a t- eloszlást): z X µ σ A fet képlet evezőjébe szereplő kfejezést stadard error -ak (SE) evezzük. Az SE tartalmlag azt mutatja, hogy a σ szórású sokaságból vett elemű mták alapjá meghatározott átlagérték mlye módo szóródk a µ elmélet érték körül. ehát a evezőbe lévő kfejezés az mta alapjá törtéő átlag becslés szóródását jellemz, olya esetbe, amkor a mtákat egy σ szórású sokaságból vettük. (Fotos azoba megjegyez, hogy σ általába em smert, értékét szté becsléssel határozzuk meg ugyaabból az mtából, mt magát az átlagot.) 3. A vzsgálat szgfkaca sztjéek meghatározása α elsőfajú hba fálása (aak a valószíűsége, hogy elvetjük a ull-hpotézst, holott az gaz). Szokásos értéke: 0.05, 0.0, 0.00. P érték megadása. Azt a valószíűséget jelöl, hogy a ull-hpotézs gazsága eseté az esetek mlye háyadába fordul elő ayra etrém eredméy, mt amlyet éppe tapasztaltuk (pusztá a véletle játéka következtébe). 4. Aak a krtkus értékek a meghatározása, amél ha agyobb értéket ad a test statstc, akkor azt a szgfkásak tektjük. Egyráyú (oe-taled) vzsgálatál ez egy szám, két ráyúál (two-taled) kettő. 5. A téyleges számítások elvégzése 6. Következtetés levoása. Léyeges a következtetés szóbel megfogalmazása s, valamt a P érték potos megadása. Újabba em tektk elegedőek a korábba szokásos: <.05 jelölést.. Számta középpel kapcsolatos kérdések. Egyetle számta középpel kapcsolatos dötés: egyelő vagy em egy smert értékkel? - egymtás t-teszt - előjel teszt (em-paraméteres). A beavatkozás hatására változott-e az átlag? - pared t-test - Wlcoo teszt (em-paraméteres) 3. Két külöböző csoport átlaga azoos? - kétmtás t-teszt - Wlcoo rag-összeg teszt (em-paraméteres) t-eloszlás

Várható érték becsléskor ameybe a mták egy σ szórású ormáls eloszlásból származak, akkor a emprkus várható érték a µ elmélet érték körül a ( µ )/ σ z ormáls eloszlásak megfelelőe tér el. A gyakorlatba a σ szórás általába em smert, eek becslését ugyacsak a mért függetle mta alapjá kell elvégez. Ezt követőe azoba az elmélet értéktől való eltérés már em a ormáls eloszlást, haem a t-eloszlást követ. Eek összefüggése ( µ ) s t / ahol s: az mtából számolt emprkus szórás. A t-eloszlás értékétől függőe más és más. Az (-) értéket szabadság fokak evezk. Ha 30, a t-eloszlás jól közelíthető ormáls eloszlással. Összefoglalva: - Alkalmazása: átlag becsléskor, ha a mtavételezett sokaság szórása em smert - Alkalmazhatóság: ormáls eloszlású mták eseté - >30 eseté sűrűségfüggvéye gyakorlatlag azoos a ormáls eloszláséval Egyetle számta középpel kapcsolatos vzsgálatok, egymtás t-teszt: - A ull és az alteratív hpotézs defálása - A megfelelő teszt-statsztka kválasztása - Az α elsőfajú hba defálása - A krtkus érték/értékek defálása (az a-hoz tartozó krtkus értékek (kofdeca határok) által határolt kofdeca tervallumo belülre esk a becsült paraméter elmélet értéke a kísérletek -a háyadába) - Számítások elvégzése, következtetések Példa: Hpotézs: H µ : µ µ o : µ o, H o teszt statsztka: t µ o s / α t ll, α /., α / t Értékelés: t H o hpotézst megtartjuk, ha t t, α /, α / H o hpotézst elvetjük, ha

t < t, α / ll. t > t,α / Alkalmazhatóság vzsgálatok és tézkedések - Normaltás vzsgálat Lllefors grafkoal - Ha em tekthető ormálsak az alapeloszlás, a mta elemszámát célszerű 30-ál agyobbra övel (közpot határeloszlás matt lyekor a statsztka a ormáls eloszlást közelít) - Ha a mta em övelhető, a P érték vsz. ksebbek tűk, mt a valóságba, a kofdeca tervallum s. Normaltás éha megteremthető l. vagy em-leárs traszformácóval. Pared t-test (párokra voatkozó t-teszt) - Léyeg a tesztet a beavatkozás előtt és utá ugyaazo személye mért változók külöbségére végzk d d s d ( d d) - Kértékelés mt várható értéktől való eltérésre voatkozó t-tesztél. A vzsgálat lépése: - Hpotézs megfogalmazás H H - A teszt statsztka kválasztása 0 : : δ 0 δ 0

d t SE d Ahol: SE d s d - Az elsőfajú hba rögzítése - Krtkus érték (kofdeca határ) meghatározása, a ull-hpotézst elfogadjuk ha: t t t -, α / < <,α / - következtetés A vzsgálat feltétele: a változók ormáls eloszlásúak - Elleőrzés: Lllefors grafkoal Nem ormáls eloszlás eseté: - megfelelő traszformácó alkalmazása - em-paraméteres statsztka alkalmazása Dötés két függetle mta eseté, kétmtás t-teszt Feltételezések - a mták ormáls eloszlást követek - a két mtába azoosak tekthetők a szórások (em krtkus a gyakorlat életbe, ameybe a két mtába azoos v. közel azoos elem va) - ameybe az elemszámok külöbözek az azoos szórástól kell meggyőződ (F-teszt) - a mtákak egymástól függetleekek kell le A vzsgálat lépése: - Hpotézs megfogalmazás ha.: H o : µ µ, H : µ < µ ekkor egy-oldalas t statsztkát haszáluk. Ameybe a hpotézs: H o : µ µ µ, µ, H : akkor két-oldalas t-statsztkát haszáluk. - A teszt statsztka kválasztása: t s p + Vgyázat, a fet képlet evezőjébe md a két tört a égyzetgyök jel alatt va!

s p ( ) s + ( ) s / + a szabadságfok : + Ahol: s p : pooled emprkus szórás Pooled SD fogalma: Feltételezve, hogy a két részpopulácó varacája azoos (elleőrzését ld. később), a két külö-külö számolt emprkus varacák súlyozott átlagakét kszámoljuk a két mtára közöse jellemző, pooled varacát: s p ( ) s + ( ) + s tovább lépések: - Az elsőfajú hba rögzítése - Krtkus érték (kofdeca határ) meghatározása t t t - +, α / < < +,α / - Számítás elvégzése, következtetés. A varacák (szórások) egyelőségéek elleőrzése Az erre alkalmas F-teszt, az F s / s Emprkus varacák háyadosá alapul (a agyobb a számlálóba). Számítás lépések: - a háyadoshoz két szabadságfokot redelük, az első a számláló mtáak száma míusz, a másk a evező mtáak száma míusz. - az α elsőfajú hba beállítása - krtkus hba beállítása - Számítások, következtetés Kétmtás t-teszt külöböző varacával redelkező függetle mták esetére (Behres- Fsher probléma) A probléma azoos a fet tárgyalttal, azzal a külöbséggel, hogy tt az F-próba elutasította az emprkus szórások azoosságát. Ilyekor ehéz meghatároz a feladathoz tartozó potos t- eloszlást, ehelyett a Satterthwate appromácó haszálata a szokásos. A ull-hpotézs eldötésére tt (s) a

s s t + statsztkát kell alkalmaz. Újdoságot a feladathoz redeledő szabadságfok meghatározása jelet. Satterthwet szert ez a ) /( ) / ( ) /( ) / ( ) / / ( ' + + s s s s d képlettel számítadó, ll. az tt kapott értéket kell a legközelebb ksebb egészszámra kell kerekíte, az így kapott d érték szolgál a t-statsztka szabadságfokául, ezt követőe a hpotézs vzsgálat a szokásos módo a krtkus értékek meghatározásával, az értékelés elvégzésével folytatódk. A dötésekhez szükséges mta agysággal kapcsolatos kérdések. Adott (smert) középértéktől való eltérés vzsgálata Fgyelembe veedő szempotok: - Mekkora elsőfajú hba megegedett? - A kívát ereje a vzsgálatak (-β). - Mekkora várható érték eltérések tulajdoítuk klka fotosságot? - A populácóra jellemző szórás jó becslése. A z változóra az α első és a β másodfajú hbára tett elvárások alapjá a krtkus értékek az alábbak szert alakulak: A két egyeletből a szükséges mta agyság az alábbak szert adódk: A levezetés godolatmeete: z o / σ µ α o z µ σ α +. Z Z / / 0 σ µ σ µ β α 0 ) ( + µ µ σ Z α Z β

z β + µ σ zβ. + µ σ / σ σ. + µ zβ. µ zα o + σ ( zα+ zβ) µ µ o σ z µ α + z β µ o. Két függetle csoport átlagérték külöbségéek vzsgálata: Feltételezve, hogy a két függetle mtába a két populácó σ szórása azoos, valamt, hogy a mták elemszáma szté azoos, valamt µ -µ a két populácó között külöbség, amt gazol kíváuk, akkor mdkét mtába az alább képlet szert számú mtaelemek kell le: ( Z α + Z β ) σ µ µ Ilyekor a számítás alapja hasolóa az smert várhatóértéktől való eltérés vzsgálatáál írottakhoz: ( t ) ( µ µ sp / + / ) Három, vagy több eloszlás átlagáak összehasolítása, ANOVA pkus probléma: Adott egy populácó, amelyet valamlye szempot szert alcsoportokra botuk, pl. em doháyzók és a külöböző erősségű doháyzók. Ilyekor kérdés lehet a doháyzás egészségkárosító hatásáak vzsgálata valamlye paraméterrel, pl. az erőltetett klégzés görbe 50 %-os potjáál mért térfogat áramlással jellemezve. Mvel mde alcsoportba szórak a mért értékek, a károsító hatást az alcsoport átlagok szgfkás eltérése mutatja. Pl: α α α 3

Az ANOVA defícó és képlete Az egy-utas (oe-way, egy változós) ANOVA modellje: az egyed megfgyelés felbotható három kompoesre, amely egy megfgyelést a globáls átlaggal, a csoport átlaggal és egy maradékkal fejez k: ahol: µ + α + e j j j : egyed megfgyelés dee j: az egyed megfgyelés csoportjáak dee µ: globáls átlag (de képzeljük az orgót) α j : j csoporthoz redelt effektus agysága (csoportátlag) e j : eltérés (hba), az egyed megfgyelés és a saját csoportátlagáak a külöbsége A fet egyeletet alapjá a globáls átlagtól való eltérés: j ( ) + ( ) j j j Azaz: (az egyed megfgyelés távolsága az orgótól, a globáls átlagtól) (az egyed megfgyelés távolsága a saját csoportátlagától) + (a csoport átlag távolsága a globáls átlagtól). j : az. megfgyelés a j. csoportba : a j. csoport átlaga j : a globáls átlag Ameybe a csoportátlagok egymástól léyegese eltérek, akkor az egyes csoportátlagok és a globáls átlag között szórás léyegese agyobb lehet, mt a csoporto belül szórás. Feltételezés: ameybe a csoportátlagok közel vaak egymáshoz, akkor a közöttük lévő szórás em lesz (léyegese) több mt a csoporto belül szórás. A vzsgálat az F-teszte alapul és azt döt el, hogy a csoportátlagok között szórás agyobb-e, mt a csoporto belül szórás. A ull-hpotézs az azoosságot tételez fel. Az ANOVA defáló összefüggése A fet jelöléseket megsmételve: j : az. megfgyelés a j. csoportba : a j. csoport átlaga j : a globáls átlag Jelölések (egy faktorra és j db csoportra):

SS E ( ) j j : A csoport átlagtól való eltérések (error) égyzetösszege (sum of squares) SS SS A ( ) : j csoport átlagok között eltéréséek (amog-groups) égyzetösszege ( ) :. j össz-eltérések égyzetösszege (a globáls átlagtól számított eltérések) Igazolható, hogy: SS SS + SS E A Számítás formulák (a fet képletekkel ekvvalesek, ha a yers adatok redelkezésre állak): ahol N Σ j (azaz az összes mta) A égyzetes közepek számítása a szabadságfokok fgyelembevételével (osztás a szabadságfokkal): MS MS A E ahol k: a teszttel összehasolított csoportok száma SS A k Varacák SS E N k Egy-utas (oe-way) ANOVA haszálata, feltételezése A vzsgálat az F statsztka meghatározására va vsszavezetve, amely a korább jelölések alapjá: F MS MS A E ahol: a számláló szabadságfoka: k- a evező szabadságfoka: N-k ameybe F> mt a krtkus értékhez tartozó küszöb, a ull-hpotézst elvetjük. Feltételezések:

. A függőváltozó mde faktor eseté ormáls eloszlást követ. Mde csoportba a varaca azoos 3. A megfgyelések függetleek egymástól. A feltételek fotossága: Az. Krtérum mérsékelt megsértésére F em érzékey, külööse, ha az esetszámok mde csoportba agyok. Külöbe a Kruskal-Walls oparametrkus eljárás alkalmazadó. A. Krtérum relatíve fotos, külööse, ha az egyes csoportokba em azoos az esetszám. A 3. Krtérum léyeges megkötés. Csoportpárok összehasolítása Az ANOVA elvégzése utá érdekes lehet aak vzsgálata, hogy a K csoporto belül mely csoportok várható értéke külöbözek szgfkása! A két kszemelt csoport összehasolításáál H0: α α H: α α Legye két tetszőlegese kszemelt csoport átlaga és Eze a két érték távolsága +α ll. a +α várható értéktől ormáls eloszlást követ, σ²/ ll. σ²/ varacával. Ameybe σ smert (lee) az átlagok külöbsége a z σ + statsztkát követé. Valójába σ²-et az adatokból becsül kell, két osztály eseté: s [( ) s + ( ) s ]/( + ) Esetükbe, amkor k osztály va, s becsléshez az összes mta felhaszáladó, azaz: k k k s ( ) s / ( ) ( ) s / k MS A Az s becslése eseté a z-statsztka helyett, a t-statsztka érvéyes:

t s + mta és k csoport eseté a t -k szabadságfokú eloszlást kell haszál. H 0 -t elvetjük, ha t t t k, α / k,α / Mvel egy több-osztályos feladatba sok kettes kombácó található, rohamosa övekszk aak a valószíűsége, hogy azoos krtkus szt mellett, csupá a véletle játéka következtébe, szgfkásak tűő külöbségre bukkauk. Eek elkerülésére a kombácók számától függ mértékbe a studet-t küszöbét egy alkalmas szorzóval megövelk, aak érdekébe, hogy a véletle hatása következtébe keletkező fals elutasítások száma csökkeje, ll. hogy a teljes tesztre voatkozzo a a megadott α értéke, e a részeredméyekre!. Boferro módszere: A módszer az egyes párokét összehasolítások α értéket úgy változtatja, hogy az összes párokét összehasolítás,,eredő α-sztje" az általuk előírt értékű legye. Az előzőekbe leírt módszer változatla marad, csupá a dötés küszöbök az alábbak szert módosulak. ahol α α / * k t * t t k, α / k,α / *

Példa az ANOVA haszálatára Pulmoary Dsease A topc of ogog publc health terest s whether or ot passve smokg (.e., eposure to cgarette smoke the atmosphere amog osmokers) has a measurable effect o pulmoary health. Whte ad Froeb studed ths questo by measurg pulmoary fucto several ways the followg s groups []: () Nosmokers (NS) People who themselves dd ot smoke ad were ot eposed to cgarette smoke ether at home or o the job. () Passve Smokers (PS) People who themselves dd ot smoke ad were ot eposed to cgarette smoke the home but were employed for 0 or more years a eclosed workg area that routely cotaed tobacco smoke. (3) Nohalg Smokers (NI) People who smoked ppes, cgars, or cgarettes, but who dd ot hale. (4) Lght Smokers (LS) People who smoked ad haled -0 cgarettes per day for 0 or more years. (Note: here are 0 cgarettes a pack.) j (5) Moderate Smokers (MS) People who smoked ad haled -39 cgarettes per day for 0 or more years. (6) Heavy Smokers (HS) People who smoked ad haled 40 or more cgarettes per day for 0 or more years. A prcpal measure used by the authors to assess pulmoary fucto was forced md-epratory flow (FEF). he authors were terested comparg FEF the s groups. Group umber, Group Mea FEF sd FEF ame (L/s) (L/s) NS 3.78 0.79 00 PS 3.30 0.77 00 3 NI 3.3 0.86 50 4 LS 3.3 0.78 00 5 MS.73 0.8 00 6 HS.59 0.8 00

öbb csoport átlagáak összehasolítása a lear cotrast módszerével A lear cotrast fogalmát, mt a csoport átlagok leárs kombácóját, az alábbak szert defáljuk: k L c k c 0 A fet defícók alapjá a hpotézsvzsgálat a lear cotrast várhatóértékéek a 0 voltát va hvatva eldöte, a t-statsztka segítségével. ehát a hpotézsvzsgálat célja az alább lehetőségek között döte: H H 0 : µ : µ L L 0 0 A hpotézsvzsgálat meete a korábbak mtájára:. Az összes csoportra közöse jellemző pooled varaca meghatározása k. Az L c súlyozott átlag kszámítása 3. Az α érték kválasztása 4. A feladathoz tartozó t statsztka meghatározása: t s L k c 5. Dötés H 0, ha : tk, α / t tk,α / H : egyébkét A fet módszer jól alkalmazható az előző feladat esetébe s. Ilyekor a ormál, em doháyzó csoport súlyfaktora, a több, tehát a külöböző teztással doháyzók súlyfaktora egyekét egatívak, értékük úgy választadó meg, hogy összegük - legye, egyekét értékük, pedg legye aráyos a gyakorságukkal.

Változók kapcsolatáak vzsgálata, korrelácó és regresszó számítás Változók között kapcsolat vzsgálata Két változó között kapcsolat vzsgálat léyegébe arra ráyul, hogy az egyk változó smerete alapjá mkét lehet megbecsül a másk értékét. A két változó közül az egyket függetleek tektjük, a máskat függő változóak (agolul: depedet vagy eplaatory változó ll. depedet vagy respose varable) Két módszer: - Korrelácó - Regresszó számítás. A külöbség léyegébe a célokba va, a korrelácó esetébe a kapcsolat kmutatása a feladat, a regresszó esetébe az egyk smeretébe a másk jóslása a cél. Kapcsolódások: korrelácós együttható regresszós egyelet Korrelácó Korrelácós együttható számítása: r y ( ) ( )( y y) ( y y) Az r korrelácós együttható égyzete: determácós együttható. Eek értéke megmutatja, hogy az egyk változó megváltozása a másk változó változásáak háy %-át képes megmagyaráz. ehát a kapcsolat erősségét egyetle számmal jellemz. Az orvos rodalom r helyett szívesebbe haszálja az r kofdeca tervallumát. Segédeszköz: Scatter (szóródás) dagram: kvaltatíve mutatja a kapcsolat jellegét (leartását) és szorosságát, megítélhető, hogy jogos-e a korrelácós együttható vagy a leárs regresszós egyelet számítása. (A) (B) (C) (D)

A t-statsztka alkalmazása a korrelácó vzsgálatáál, egymtás t-teszt Probléma: r értéktartomáya + és között. Ha ρ 0, az egyes becslések ferde eloszlásra vezetek. Az r0 eseté az em áll fe, lyekor alkalmazható a t-statsztka, - szabadságfokkal. t r r Példa a ρ 0 ull-hpotézs vzsgálatára: ételezzük fel, hogy 0 mtából korrelácós együtthatót becsültük, amelyek értéke: r0.4. Vzsgáljuk meg, hogy ez összeférhető-e a ull-hpotézssel! Step. H 0 :ρ 0 (he true correlato s zero.) H :ρ 0 (he true correlato s ot zero.) Step. Sce the ull hypothess s a test of whether ρ s zero, the t rato may be used whe the assumptos for correlato (dscussed below) are met. Step 3. Suppose the vestgators chose α.0 for ths eample. Step 4. he degrees of freedom are - 0 8. he value of t dstrbuto wth 8 degrees of freedom that dvdes the area to the cetral 99% ad the upper ad lower % s.878 (able A-3). herefore, we wll reject the ull hypothess of o correlato f (the absolute value of) the observed value of t s greater tha.878. Step 5. he calculato s 0.4 8 t 0.4 Step 6. he observed value of the t rato wth 8 degrees of freedom s.96, whch s ot greater tha.878. herefore, the ull hypothess of zero correlato s ot rejected. t 8 α 0,0 99%,878 Megjegyzés: A ρ0 esetre kokrét példa lehet, ha pl. házaspárok kolesztersztjét vzsgáljuk. Ilyekor a ull-hpotézs alapjá aak megerősítését várjuk, hogy a magas koleszterszt em attól függ, am a házaspárok életébe közös, tehát pl. az életmód, táplálkozás, stb. Az lye típusú vzsgálatok elvetették a ull-hpotézst, tehát feltehetőleg a hasoló táplálkozás vezetett az eltérésre. ermészetese az s előfordulhat, hogy már a párválasztásál a külső vagy belső személységjegyekkel korrelált koleszterszt a bűös...

A korrelácó vzsgálata r 0 esetre Általáos esetbe az eldötedő hpotézs: H 0 : rr 0, H : r r 0. Α Fsher-traszformácó lehetővé tesz, hogy a korrelácó kofdeca tervallumáak vzsgálata vsszavezethető legye a z-eloszlás haszálatára. A traszformáló formula: A traszformálás utá a teszt az alább (z N(0,) ormáls eloszlást követ) Egymtás l-statsztka: z( r) z( ρ0 ) λ /( 3) Példa az r 0,86 esethez tartozó 99 %-os kofdeca tervallum meghatározására. ételezzük fel, hogy a korrelácót 0 adatból számoltuk (a varaca/-3)! ahol z(r) az r korrelácós együttható Fsher traszformáltja. A vzsgált kokrét esetbe a Fsher-traszformált terébe a kofdeca tartomáy 0,668-tól,98-g tart. A-6 tábla (részlet!!) A korrelácós együttható z traszformáltja r z(r) r z(r) 0,00 0,0 0,0 0,03 0,04 0,000 0,00 0,00 0,030 0,040 0,50 0,5 0,5 0,53 0,54 0,549 0,563 0,576 0,590 0,604 0,05 0,06 0,07 0,08 0,09 0,050 0,060 0,070 0,080 0,090 z( r) 0,55 0,56 0,57 0,58 0,59 l + r r 0,68 0,633 0,648 0,663 0,678 0,35 0,36 0,37 0,38 0,39 0,45 0,46 0,47 0,48 0,49 0,365 0,377 0,388 0,400 0,4 0,485 0,497 0,50 0,53 0,536 0,85 0,86 0,87 0,88 0,89 0,95 0,96 0,97 0,98 0,99,56,93,333,376,4,83,946,09,98,647 A sárgával jelölt részek a kofdeca tartomáy határat jelölk. Eek meghatározása a z- tartomáyba törtét az α-hoz tartozó krtkus értkek (alsó és felső), valamt λ szórásáak smeretébe. A részleteket lsd. a következő oldalo. 33

Példa a Fsher z-traszformácó haszálatára: A- tábla (részlet!!) A stadard N(0,)görbe alatt terület Z Area betwee z & +z Area two tals (<-z & >+z) Area oe tal (<-z or >+z) 0,00 0,05 0,0 0,5 0,0 0,5,05,0,5,0,5,6,30,35,40,45,50,05,0,5,0,5,30,36,35,40,45,50,55,575,60,65,70,75 0,000 0,040 0,080 0,9 0,59 0,97 0,706 0,79 0,750 0,770 0,789 0,800 0,806 0,83 0,838 0,853 0,868 0,960 0,964 0,968 0,97 0,976 0,979 0,980 0,98 0,984 0,986 0,988 0,989 0,990 0,99 0,99 0,993 0,994,000 0,960 0,90 0,88 0,84 0,803 0,94 0,7 0,50 0,30 0, 0,00 0,94 0,77 0,6 0,47 0,34 0,040 0,036 0,03 0,08 0,04 0,0 0,00 0,09 0,06 0,04 0,0 0,0 0,00 0,009 0,008 0,007 0,006 0,500 0,480 0,460 0,440 0,4 0,40 0,47 0,36 0,5 0,5 0,06 0,00 0,097 0,089 0,08 0,074 0,067 0,00 0,08 0,06 0,04 0,0 0,0 0,00 0,009 0,008 0,007 0,006 0,005 0,005 0,005 0,004 0,003 0,003 A fetek alapjá a z traszformált terébe a korrelácós együttható kofdeca tervalluma: z( r) ±,575,93± 3,93± 0,65 (,575)( 0,43) Ebből a Fsher-táblázat segítségével vssza számítható a z-tartomáyból az r- korrelácók tartomáyába az eredméy (végeredméyt ld. az előző oldal táblázatába feltütetve!). Egymtás hpotézs vzsgálat a z-tartomáyba pkus probléma: Apák és elsőszülött fuk testsúlyát vzsgálták. Az eldötedő kérdés az volt, hogy a mta alapjá yert emprkus korrelácó összeegyeztethető-e a geetka megfotolások alapjá várható ρ0.5 értékkel? (Eredméy: Kmutatható az apa és fa között geetka kapcsolat alapjá várható kapcsolat a testsúlyokba.) 34

A feladat statsztka megfogalmazása: Lépések:. Hpotézs felállítása: H 0 : ρρ, Η : ρ ρ.. Az r korrelácós együtthatóak és Fsher-traszformáltjáak számítása 3. A λ teszt-statsztka kszámítása: λ z( r) z( ρ) /( 3) 4. Krtkus határok meghatározása α alapjá 5. Kértékelés: H 0 elfogadása ha: z H egyébkét. z α / λ α / A Fsher-traszformácó felhaszálása két emprkus korrelácó összehasolítására pkus probléma: ektsük gyerekek két csoportját! Az egyk csoport élje a vérszert szülőkkel, a másk evelő szülőkkel. A vzsgált kérdés, hogy a véryomásérték (a gyermekek ll. a mamák adata között!) korrelácó értéke azoosak tekthetők-e a két csoportba statsztka vzsgálat szert? A ull-hpotézs tételezze fel az értékek azoosságát! Ameybe a ull-hpotézs em gaz, az aya és gyermeke között geetka kapcsolat magyarázhatja a véryomások kapcsolatát. A probléma statsztka megoldása:. Hpotézs felállítása: H 0 : ρ ρ, Η : ρ ρ.. Az r és r emprkus korrelácók kszámítása, majd ezekből a z és z traszformáltak meghatározása. 3. A λ teszt-statsztka kszámítása: λ + 3 z z 3 4. Krtkus határok meghatározása α alapjá 5. Kértékelés: H 0 elfogadása ha: z α / λ z α / H egyébkét. (Eredméy: Kmutatható az aya és gyermeke között geetka kapcsolat megylváulása a véryomásokba.) 35

Két vagy több változó kapcsolatáak kterjesztése a külöböző típusú adatokra. Két vagy több változó kapcsolatáak jellemzése Numerkus adatok esete (erről szólt a fet fejezet!) Korrelácós koeffces (Pearso-féle) r ( )( y y ) ( ) A korrelácós koeffces fotosabb tulajdosága: Értékkészlete: - és + között Ha + vagy, az tökéletes leárs kapcsolatot jelöl Ha 0, az a leárs kapcsolat háyára utal. A változókhoz redelt scatter dagram r0 eseté kb. kör, övekvő abszolút érték eseté ellptkus, övekvő agytegely-kstegely aráyal. r : determáltság koeffces (coeff. of determato) azt mutatja, hogy a függő változó varabltásáak mlye háyadát magyarázza a korrelácós (azaz leárs) kapcsolat. A korrelácós együttható értéke függetle a mérés egységétől. A korrelácós együttható értékét erőse befolyásolják (torzítják) a kugró etrém értékek (tehát em jó lerás módja ferde eloszlású változókak. A korrelácó leárs kapcsolatot mér, alkalmazása előtt érdemes scatter dagramot rajzol az esetleges oleartások felfedezésére, a klógó etrém értékek feldertésére, és kzárására. Két vagy több változó kapcsolatáak jellemzése: Ordáls adatok esete Korrelácós együttható (Spearma rak correlato, Spearma s rho): ( y y ) r S ( R ( R R X )( R R R ) ( R R y y y ) ) Ahol R : az debe szereplő változó ragja (a agyság szert redezett változók ragja. A Spearma korrelácós koeffces fotosabb tulajdosága: Értékkészlete: - és + között Ha + vagy, az tökéletes egyezést jelöl aragok között Spearma korrelácó haszáladó akkor s, ha csak az egyk változó ordáls és a másk umerkus (pl. Apgar score vs. születés súly). Két vagy több változó kapcsolatáak jellemzése: Nomáls adatok esete 36

Nomáls adatok eseté a feladat aak a megállaptása, hogy az adatok között va-e szgfkás kapcsolat egyáltalá, s em eek a agyságára vagyuk kívácsak. Máskor vszot éppe az a kérdés, hogy két omáls meység között kapcsolat erősségét jellemezzük. Ilye pl. ha arra vagyuk kívácsak, hogy egy bzoyos eseméy egy bzoyos rzkótéyező eseté bekövetkezk vagy em. Kétféle háyadost szokás haszál a relatív rzkó becslésére, ezek a következők: Relatve rsk (Rsk rato): RR Defcó szert RR: cdece of eposed persos to cdece of o eposed persos. RR csak cohort study vagy clcal tral eseté számítható, ameybe a kotrol és a test csoport (rzkó élkül és rzkós) defálásra került és huzamos deg fgyeljük, hogy a kérdéses kmeet megjelet-e. Odds rato: OR (cross-product rato) Defícó szert: Az OR aak az esélye, hogy egy beteg redelkezk egy bzoyos rzkófaktorral osztva aak az esélyével, hogy egy em beteg redelkezk azzal a bzoyos rzkófaktorral. áblázatok és képletek: Beteg Nem beteg Rzkófaktorral A B A+B Rzkó élkül C D C+D A+C B+D A /( A + B) RR C /( C + D) rzkós _ beteg / összes _ rzkós rzkó _ élkül _ beteg / összes _ rzkó _ élkül A/( A + C) / C /( A + C) OR B /( B + D) / D /( B + D) AD BC 37

Leárs regresszó y a + b alakba keres kapcsolatot a függetle változó és az y függő változó becsült értéke y -között. regresszós egyees jellemzése y y a regresszós egyees és az adatok vszoya: y y'+ε y y Meredekség: b y / a: tegelymetszék egely y ε A regresszós egyelet számításáak elve: A ( y y' ) égyzetes eltérés összegéek mmalzálása (legksebb égyzetek elve) Eredméy: Meredekség: b ( )( y ( ) y) (Számláló: L y korrgált szorzat összeg, evező: L korrgált összeg. A korrgálás az átlagérték kvoására utal) egelymetszet: a y b ovább összefüggések az r smeretébe: y s y b r s Az összefüggés fordítva s gaz: s r b s y 38

A regresszó számítás feltételezése: s, s y : ll. y szórása - Mde értékhez tartozó y értékek ormáls eloszlásúak, amelyek várható értéke megegyezk a becsült értékkel. - Mde értékhez tartozó y értékek azoos szórással redelkezek. - Feltételezzük, hogy a külöböző értékekhez tartozó várható értékek egy egyees meté helyezkedek el. - Az y értékek függetleek egymástól. A regresszós egyees becslés hbája A regresszós becslés rezduáls eltéréseek égyzetes átlaga: s y, ( y y ' ) ektettel arra, hogy a regresszós egyees becsléséél a tegelymetszés és a meredekség és valószíűség változó, mdkettőt külö-külö kell vzsgál. Erre az (-) szabadságfokú t- statsztka alkalmas: Az a tegelymetszék becslésél az se(a): A b meredekség becslésél az se(b): se( a) s y, + ( ) se( b) s y. ( ) Kétoldalas (-a) regresszós egyees paraméter kofdeca tervallumok A két tervallum: a ± t, α / se( a) ll. ± t se( ) b,α / b A fet kofdeca tervallumbecslések akkor haszosak, ha a mosta becslésüket egy másk (pl. korább, vagy az rodalomba olvasott) becsléshez akarjuk hasolíta. 39

Példa a tegelymetszék 0-tól való eltéréséek vzsgálatára: Step. H 0 :β 0 0 (he tercepts s zero) H :β 0 0 (he tercepts s ot zero.) Step. Sce the ull hypothess s a test of whether the tercept s zero, the t rato may be used f the assumptos are met. he t rato s t s a β + 0 ( ) y, Step 3. Let us use α.05 for ths eample. Step 4. he degrees of freedom are - 4 40. he value of t dstrbuto wth 40 degrees of freedom that dvdes the area to the cetral 95% ad the combed upper ad lower 5% s.0 (able A-3). herefore, we wll reject the ull hypothess of a zero tercept f (the absolute value of) the observed value of t s greater tha.0. Step5. he calculato follows; a computer program has bee used to calculate s y,.8 ad (- )² 487.4. Step6. he absolute value of the observed t rato s 0.784, whch s ot greater tha.0. herefore, the ull hypothess of a zero tercept caot be rejected. t.8.6 0 4 4.667 + 487.4 0.784 Példa a regresszós egyees b meredekségéek kofdeca tervallumára A meredekség becslés általáos összefüggése és alkalmazás példája (95%-os kofdeca tervallum esetébe egy kokrét példára): b ± t,α / s y. ( ) 0.406 ±.0 (.8) or 0.39 to 0.573 Note: Because the terval ecludes zero, we ca be 95% cofdet that the regresso coeffcet s ot zero but that t s betwee 0.39 ad 0.573. 487.4 40

4

4 Regresszós egyelet alkalmazásával végzett becslések kofdeca tervalluma: Az y becsült értékek várhatóértékéek stadard hbája se( ' y ): kofdeca tervalluma: Az egyed y becslések stadard hbája se(y ): kofdeca tervalluma: + +, ) ( ) ( ) ' ( s y se y ( ) + ± y s t y, /, ) ( ' α ( ) + y s y se, ) ( ) ' ( + + ±, /, ) ( ) ( ' s t y y α

Megjegyzés: - A kofdeca tervallum mmáls: ál - A kofdeca tervallum határok kokávok, ugyas a regresszós egyees két véletle paramétere közül (az és y változók átlaga által meghatározott pot, amelye a regresszós egyees átmegy, és a meredekség) ál a meredekség változások hatása em érződk, tehát tt csak az átlagképzések varacája érvéyesül, ettől poztív és egatív ráyba eltávolodva az -tegely meté, a meredekség varacája egyre jobba kfejt a hatását és a kofdeca tervallumot kokávvá tesz! öbbváltozós regresszó A regresszós összefüggés formája: y α + β + β +... + β + ε ahol: β parcáls regresszós koeffces A mmalzáladó kfejezés: [ y ( a + b + b + + b )]... 43

öbbváltozós logsztkus regresszó Az tt tárgyalt módszer kterjesztése a regresszó fogalomak, arra az esetre, amkor az y függő változó em a korábba megkövetelt ormáls eloszlást, haem a bomáls eloszlást követ. Az lye feladatok tpkus példája a rzkóbecslés. A kockázat becslésére több taulmáy alapjá, külöböző populácókra külöböző módszereket dolgoztak k. Ezek agy része a többváltozós logsztkus regresszó módszerét vesz eszközül. A logsztkus regresszó módszere a következőképpe közelít az új betegség bekövetkezéséek (cdecájáak) valószíűségét egy meghatározott dőtartamo belül (pl. 8 éve belül). A képlet azokra voatkozk, akk a vzsgálat dejé egészségesek tekthetők!: p + e -( α β + β + + βk + k ) melyből: l p p k α + β, ahol p a megbetegedés valószíűsége, -k a kockázat téyezők, α és β -k a kostas tag és a kockázat téyezőkhöz tartozó regresszós együtthatók. 44

Ezek a képletek az egyé abszolút kockázatát írják le, sokszor szükség lehet azoba aak a vzsgálatára, hogy ez a kockázat meybe külöbözk a épesség átlagos kockázatától, vagy egy-egy adott kockázat téyezőtől metes képzeletbel személy kockázatától. Ilye esetbe érdekes lehet valamlye relatív kockázat érték kszámítása, például az odds rato (OR) értéké. Ez a következőképpe törték: OR p /( p /( r p) p ) r e β j j ahol p az adott személy megbetegedéséek valószíűsége, p r a referecaszemély megbetegedéséek valószíűsége, j a téyleges és a refereca kockázat téyezők közt külöbség, j a befolyásolható kockázat téyezők dee. Összefüggés a logsztkus regresszó ll. A kotgeca táblák alapjá végzett aalízs között: Odds rato: OR (cross-product rato) Defícó szert: Az OR aak az esélye, hogy egy beteg redelkezk egy bzoyos rzkófaktorral osztva aak az esélyével, hogy egy em beteg redelkezk azzal a bzoyos rzkófaktorral. áblázatok és képletek: Beteg Nem beteg Rzkófaktorral A B A+B Rzkó élkül C D C+D A+C B+D A/( A + C) / C /( A + C) OR B /( B + D) / D /( B + D) AD BC A regresszós összefüggés együtthatóak meghatározása: A Framgham-taulmáy A Framgham-taulmáy a szív- és érredszer betegségek területé végzett kísérletek között a leghosszabb deje tartó. 948-ba kezdték az adatok gyűjtését Framgham város lakosa körébe. A taulmáy résztvevő 30-74 év között férfak és ők. A kísérletbe gyűjtött adatok alapjá külöböző kmeetelekre, ll. külöböző becslés módszerek alapjá több formulát s kdolgoztak. Ezekre egy jellemző példa: 8 éves CVD (dardovascular dsease) cdeca meghatározása logsztkus regresszóval A Framgham-taulmáyból kdolgozott módszerél a logsztkus egyeletbe behelyettesítedő együtthatók a áblázat-ba találhatók. 45

áblázat: 8 éves CVD cdecára voatkozó logsztkus regresszós együtthatók a Framgham-taulmáy alapjá Változó Együttható Férf Nő Életkor (év) 0,3743307 0,665693 Életkor -0,0065-0,00655 Koleszterszt (mg/ml) 0,0580 0,060593 Véryomás szsztolés értéke (Hgmm) 0,056953 0,04465 Doháyzás* 0,558303 0,0395348 Balkamra hpertrófa*,059656 0,8745090 Cukorbetegség* 0,600336 0,6858 Koleszterszt Életkor -0,000369-0,00057 Kostas tag -9,7709560-6,459847 * ge, em0 úlélés statsztkák úlélés dő (survval tme) alatt egy adott kdulás dőpottól (dagózs, beválasztás, valamlye beavatkozás deje) egy meghatározott végpotg (legtöbbször halálozás, de lehet más jól meghatározott eseméy dőpotja; a továbbakba mdg halálozást említük) eltelt dőt értjük. Az lye vzsgálatok fő voása, amely az elemzés sajátos voltát s dokolja, az, hogy az esetek egy részét a vzsgálók külöböző okok matt (általába a vzsgálat befejeződése matt) em követk a halálozás bekövetkezéség. Azoba ezek az esetek s tartalmazak haszosítható formácót: azt, hogy az eseméy a megfgyelés dőél hosszabb dő múlva következk be - ezek az ú. cezorált adatok. A túlélés vzsgálatáak egyk lehetséges módja a haladóság tábla (lfe table) készítése. Ez a következőképpe törték: A 0-tól a mamáls követés dőg terjedő dőtartamot szakaszokra osztjuk, és meghatározzuk az egyes szakaszokra jellemző haladóság értékét, amely az abba az dőszakba meghalt személyek és az dőszak közepé életbe levők háyadosa. Ezt az értéket -ből kvova kapjuk az dőszakra jellemző túlélés aráyt. Aak valószíűsége, hogy egy adott személy valamely dőszak végé életbe va, az addg dőszakokra számított túlélés aráyok szorzata. A Kapla-Meer-féle túlélés aalízs célja szté a túlélés görbe meghatározása. Az eljárás agyo hasolít a haladóság tábla módszeréhez, azzal a külöbséggel, hogy a követés dő cs szakaszokra osztva, ehelyett a haladóság aráyt és a túlélés valószíűséget mde olya dőpotba meghatározzuk, amelybe legalább egy halálozás törtét. A túlélés valószíűségeket a követés dő függvéyébe ábrázolva kapjuk a túlélés görbét (survval curve). Ez formáját tektve lépcsős függvéy, melyek függőleges szakasza haladóság tábla eseté az egyes dőszakok végé, Kapla-Meer aalízs eseté pedg azokba a potokba vaak, ahol téylegese bekövetkezett halálozás. 46

A fet két módszer felhaszálható a túlélés dő átlagáak, lletve kellő deg tartó követés eseté a medájáak becslésére s. Statsztka megalapozás, tulajdoságok t t, t,..., 0, t t < t < t..., 0 < t S( t) Prob( túlélés Prob( túlélés t g) Prob( túlélés t 3 g) ( túlélés t t g) ( túlélés g)... Prob( túlélés t g) t g) ( túlélés t g) S ( t ) d S d S d S d... S 3 0 Az S(t ) túlélés valószíűség smeretébe szokás az u. Hazárd-függvéymeghatározása s, amelyek defcója: S( t) S( t + t) H ( t) t t / A fetek szert tehát a hazárd-függvéy az eseméy t pllaatba való bekövetkezéséek valószíűségét adja meg. Az S(t ) túlélés valószíűségek tervallumbecslése: Varaca Var d { [ ]} j l Sˆ( t) j S j ( S j Itervallum becslés c c se d ) l[ Sˆ( t )] z α / se{ l[ Sˆ( t )]} Sˆ( t + z α / se{ Sˆ( t d j { l[ Sˆ( t )]} S ( S j j j j d j ) Mdkét eljárás alkalmazható egyél több vzsgálat csoport eseté s. Ilyekor elvégezhető a csoportokra jellemző túlélés dők összehasolítása. Az összehasolítást el lehet egy adott 47

követés dőtartamra s végez, általába azoba a teljes görbéket hasolítják össze: modható-e, hogy az egyk összességébe magasabba va, mt a másk. Az alábbakba bemutatott táblázatok két csoportra adják meg a túlélés és a hazárd függvéyeket, valamt az ezekhez tartozó stadard error értékeket. Kapla-Meer survval estmates Group: (Group Surv ) me At rsk Dead Cesored S SE(S) H SE(H) 4 0 0.954545 0.044409 0.0465 0.04654 57 0 0.90909 0.069 0.0953 0.0674 63 0 0 0.863636 0.07365 0.46603 0.08477 98 9 0 0.888 0.083 0.0067 0.00504 04 8 0 0.888 0.083 0.0067 0.00504 05 7 0 0.770053 0.090387 0.695 0.7378 3 6 3 0 0.65668 0.05069 0.468935 0.6793 33 3 4 0 0.43355 0.089 0.836659 0.49777 39 9 0 0.38507 0.06338 0.95444 0.7684 40 8 0 0.336898 0.03365.087974 0.30684 6 7 0 0.8877 0.0997.45 0.34343 80 6 0 0.953 0.086369.64759 0.44864 95 4 0 0.09657 0.064663.340737 0.6777 33 0 0.0488 0.04694 3.033884 0.975335 344 0 0.0488 0.04694 3.033884 0.975335 Meda survval tme 33 Mea survval tme (95% CI) [lmt: 344 o 33] 4.834 (9.59463 to 6.97538) Group: (Group Surv ) me At rsk Dead Cesored S SE(S) H SE(H) 43 9 0 0.947368 0.058 0.054067 0.054074 65 8 0 0.894737 0.070406 0.6 0.078689 88 7 0 0.789474 0.09359 0.36389 0.847 90 5 0 0.73684 0.003 0.30538 0.370 9 4 0 0.684 0.06639 0.37949 0.55857 06 3 0 0.63579 0.0665 0.45953 0.759 08 0 0.578947 0.369 0.546544 0.95646 0 0.5636 0.4549 0.64854 0.7643 6 0 0.473684 0.4549 0.7474 0.485 48