Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Hasonló dokumentumok
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics.

Statistical Dependence

Correlation & Linear Regression in SPSS

Correlation & Linear Regression in SPSS

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Hypothesis Testing. Petra Petrovics.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Statistical Inference

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Regression

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

STATISZTIKA PRÓBAZH 2005

KISTERV2_ANOVA_

BIOMETRIA_ANOVA_2 1 1

Sztochasztikus kapcsolatok

Descriptive Statistics

Supporting Information

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

MARKETINGKUTATÁS II. Oktatási segédanyag. Budapest, február

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Logistic regression. Quantitative Statistical Methods. Dr.

Cluster Analysis. Potyó László

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Construction of a cube given with its centre and a sideline

On The Number Of Slim Semimodular Lattices

Választási modellek 3

Supplementary materials to: Whole-mount single molecule FISH method for zebrafish embryo

Mapping Sequencing Reads to a Reference Genome

THE EFFECTIVENESS OF THE E-LEARNING APPLICATION: IMPACT ASSESSMENT OF THE QUALITY

Esetelemzés az SPSS használatával

Tudományos Ismeretterjesztő Társulat

Introduction to Statistics

Nem. Cumulative Percent 1,00 férfi ,9 25,9 25,9 2,00 nı ,1 73,1 99,0 99,00 adathiány 27 1,0 1,0 100,0 Total ,0 100,0

Computer Architecture

Statisztika II. feladatok

Hipotézis vizsgálatok

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Review of Correlation & Regression

PhEur Two-dose multiple assay with completely randomised design An assay of corticotrophin by subcutaneous injection in rats

WIL-ZONE TANÁCSADÓ IRODA

EN United in diversity EN A8-0206/419. Amendment

FOSS4G-CEE Prágra, 2012 május. Márta Gergely Sándor Csaba

Széchenyi István Egyetem

Decision where Process Based OpRisk Management. made the difference. Norbert Kozma Head of Operational Risk Control. Erste Bank Hungary

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Csima Judit április 9.

Cashback 2015 Deposit Promotion teljes szabályzat

Performance Modeling of Intelligent Car Parking Systems

STUDENT LOGBOOK. 1 week general practice course for the 6 th year medical students SEMMELWEIS EGYETEM. Name of the student:

FORGÁCS ANNA 1 LISÁNYI ENDRÉNÉ BEKE JUDIT 2

Normál eloszlás. Gyakori statisztikák

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

bab.la Cümle Kalıpları: İş Sipariş İngilizce-Macarca

bab.la Cümle Kalıpları: İş Sipariş Macarca-İngilizce

Esetelemzések az SPSS használatával

Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK

Módszertani eljárások az időtényező vezetési, szervezeti folyamatokban betöltött szerepének vizsgálatához

Quantitative Statistical Methods

Introduction to 8086 Assembly

Discussion of The Blessings of Multiple Causes by Wang and Blei

BKI13ATEX0030/1 EK-Típus Vizsgálati Tanúsítvány/ EC-Type Examination Certificate 1. kiegészítés / Amendment 1 MSZ EN :2014

First experiences with Gd fuel assemblies in. Tamás Parkó, Botond Beliczai AER Symposium

KIEGÉSZÍTŽ FELADATOK. Készlet Bud. Kap. Pápa Sopr. Veszp. Kecsk Pécs Szomb Igény

Ensemble Kalman Filters Part 1: The basics

A BÜKKI KARSZTVÍZSZINT ÉSZLELŐ RENDSZER KERETÉBEN GYŰJTÖTT HIDROMETEOROLÓGIAI ADATOK ELEMZÉSE

EN United in diversity EN A8-0206/482. Amendment

Több laboratórium összehasonlítása, körmérés

Tudományos Ismeretterjesztő Társulat

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Számítógéppel irányított rendszerek elmélete. Gyakorlat - Mintavételezés, DT-LTI rendszermodellek

Statisztikai szoftverek esszé

Minőség-képességi index (Process capability)

Az R statisztikai programozási környezet: az adatgyűjtéstől a feldolgozáson és vizualizáción át a dinamikus jelentéskészítésig

FÖLDRAJZ ANGOL NYELVEN

Funkcionális konnektivitás vizsgálata fmri-adatok alapján

Create & validate a signature

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Cluster analysis in SPSS

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Bird species status and trends reporting format for the period (Annex 2)

Vállalati kockázatkezelés jelentősége

Klaszterezés, 2. rész

Az egészségügyi munkaerő toborzása és megtartása Európában

Business Opening. Very formal, recipient has a special title that must be used in place of their name

Tóth I. János Mélyponton a nagy exportálók várakozásai

Involvement of ER Stress in Dysmyelination of Pelizaeus-Merzbacher Disease with PLP1 Missense Mutations Shown by ipsc-derived Oligodendrocytes

Kabos Sándor. Térben autokorrelált adatrendszerek

FÖLDRAJZ ANGOL NYELVEN GEOGRAPHY

Supplementary Table 1. Cystometric parameters in sham-operated wild type and Trpv4 -/- rats during saline infusion and

Emlékkonferencia Farkas Ferenc tiszteletére Tudomány napi konferencia, november 15. MAGYAR TUDOMÁNYOS AKADÉMIA

Üzleti élet Nyitás. Nagyon hivatalos, a címzettnek meghatározott rangja van, aminek szerepelnie kell

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Introduction to Multiple Correlation

Üzleti élet Nyitás. Nagyon hivatalos, a címzettnek meghatározott rangja van, aminek szerepelnie kell

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

A jövedelem alakulásának vizsgálata az észak-alföldi régióban az évi adatok alapján

Utasítások. Üzembe helyezés

N É H Á N Y A D A T A BUDAPESTI ÜGYVÉDEKRŐ L

USER MANUAL Guest user

Bevezetés a Korreláció &

MATEMATIKA ANGOL NYELVEN

Átírás:

Nonparametric Tests Petra Petrovics

Hypothesis Testing Parametric Tests Mean of a population Population proportion Population Standard Deviation Nonparametric Tests Test for Independence Analysis of Variance Goodness of Fit

I. Test for Independence Independence of events: if the probability of their joint occurrence is equal to the product of their marginal probabilities In case of qualitative or territory variables (measured in nominal scale) A and B are independent if: P(A B) = P(A)P(B)

Hypothesis test for independence H 0 : the two classification variables are independent of each other H 1 : the two classification variables are NOT independent H 0 : P ij = P i. P.j H 1 : ij: P ij P i. P.j

Properties of the Test for Independence The data are the observed frequencies. The data is arranged into a contingency table. The degrees of freedom are the degrees of freedom for the row variable times the degrees of freedom for the column variable. It is not one less than the sample size, it is the product of the two degrees of freedom. It is always a right tail test. It has a chi-square distribution.

Properties of the Test for Independence The expected value is computed by taking the row total times the column total and dividing by the grand total. The value of the test statistic doesn't change if the order of the rows or columns are switched or interchanged (transpose of the matrix). The test statistic is ( Observed Expected Expected )

Test Statistic Chi-square test statistic for independence: t s * ( f ij fij ) * f i1 j1 ij f ij expected frequencies f i. f n.j Degree of freedom: df = (s-1)(t-1)

Example An article in Business Week reports profits and losses of firms by industry. A random sample of 100 firms is selected, and for each firm of the sample, we record whether the company made money or lost money, and whether or not the firm is a service company. The data are summarized in a x contingency table. Using the information in the table, determine whether or not you believe that the two events the company made a profit this year and the company is in the service industry are independent. (α = 1%)

Contingency table of Profit/Loss vs. Industry Type Industry Type Service Nonservice Total Profit 4 18 60 Loss 6 34 40 Total 48 5 100

Solution H 0 : P ij = P i. P.j H 1 : ij: P ij P i. P.j f f f f f n f n 6048 100 605 100 1..1 11 f f 1.. 1 f f n f n 4048 100 405 100..1 1 f.. 1 8.8 31. 19. 0.8

(4 8.8) 8.8 (18 31.) 31. (6 19.) 19. (34 0.8) 0.8 9.09 df = (-1) (-1) = 1 Critical value: χ crit = 6.63 Pr H 0 H 1 0 6.63 1 a 9.09 we reject the null hypothesis the profit/loss and industry type are probably not independent

II. Analysis of variance (ANOVA) In case of a qualitative and a quantitative variable H 0 : the two variables are independent of each other H 1 : the two variables are not independent H 0 : β 1 = β = = β m = 0 H 1 : not all β i (i = 1,, n) are equal

Assumptions of ANOVA Independent random sampling Normally distributed response variable Equal variances of populations

where m: number of populations n: total sample size Test Statistic SB ( m 1) F SW ( n m) SB n x x i i SW n i 1 s i F crit ( 1 m 1; n m) (1a )

ANOVA table Source of variation Sum of Squares Degrees of Freedom Mean Square F ratio Between Groups (Treatment) SB m 1 SB MB m 1 F MB MW Within Groups (Error) SW n m MW SW n m Total ST n 1

Example A shop assistant examined the demand of bread: Days Number of days Mean (kg) Sold bread Variance Monday 6 4 84.8 Other days 10 41.8 70.4 Saturday 6 57.33 43.87 46.09 110.47

Assuming normal distribution and equal standard deviations : H 0 : β 1 = β = = β m = 0 H 1 : not all β i (i = 1,, 5) are equal ST=1 110.47=319.87 SW=5 84.8+9 70.4+5 43.87=176.95 SB=6(4-46.09) +10(41.8-46.09) +6(57.33-46.09) =104.44 ST=SW+SB=176.95+104.44=319.39 F 104.44 31 176.95 3 7.76

H 0 H 1 F crit 0 m 1 31 F crit < F=7.76 : 1 n m 3 19 3.5 the computed test statistic falls in the rejection region The demand of bread is not the same in the examined days.

III. Goodness of Fit If a sample of data came from a population with a specific distribution. It is a statistical test of how well our data support an assumption about the distribution of a population or random variable of interest. The test determines how well an assumed distribution fits the data.

Steps in a Chi-square Analysis 1. We hypothesize about a population by stating the null and alternative hypotheses.. We compute frequencies of occurance of certain events that we expect under the null hypothesis. These give us the expected counts of data points in different cells. 3. We note the observed counts of data points falling in the different cells. 4. We consider the difference between the observed and the expected Chi-square statistic. 5. We compare the value of the statistic with critical points of the chi-square distribution and make a decision.

Test Statistic Chi-square statistic: k i1 ( Observed i Expected Expected i i ) k i1 ( f i npi ) np i n( g P i i 1) Df: r-1-b where r: number of categories b: number of estimated parameters

Goodness-of-fit test for multinomial distribution H 0 : the probabilities of occurance of events E 1, E k are given by the specified probabilities p 1, p,, p k H 1 : the probabilities of the k events are not the p i stated in the null hypothesis Pr H 0 H 1 0 1 a

Goodness-of-fit test for normal distribution H 0 : Normal distribution H 1 : Not normal distribution Pr H 0 H 1 E.g.: Kolmogorov-Smirnov Test 0 1 a

Thanks for your attention!