Á dott egy X folytonos változó, ami normális eloszlású. X ( µ,σ ) dottak ezen kívül az Y,Y,,Y k diszkrét változók (faktorok) total H 0 : X - re nincs hatással Y Q = Q + Q +... + Q + Q + Q3 +... + Q k hiba minta teles szórásnégyzete Q total ( ) = i Á dott egy X folytonos változó, ami normális eloszlású. X ( µ,σ ) dottak ezen kívül az Y,Y,,Y k diszkrét változók (faktorok) total H 0 : X - re nincs hatással Y Q = Q + Q + +... + Q... + Qk + Q + Q3 hiba z Y magyarázta rész Á dott egy X folytonos változó, ami normális eloszlású. X ( µ,σ ) dottak ezen kívül az Y,Y,,Y k diszkrét változók (faktorok) total H 0 : X - re nincs hatással Y Q = Q + Q + Q Q Q +... + Q... + k + + 3 hiba z első két faktor interakcióához tartozó rész
Á dott egy X folytonos változó, ami normális eloszlású. X ( µ,σ ) dottak ezen kívül az Y,Y,,Y k diszkrét változók (faktorok) total H 0 : X - re nincs hatással Y Q = Q + Q +... + Q + Q + Q3 +... + Q k hiba véletlen hiba okozta rész gyszerű csoportosítás Á X Y dolgozó fizetése dolgozó beosztása (tisztviselő, őrző-védő, menedzser) H 0 : beosztás nincs hatással a fizetésre ( t) ( t) ( t) ( v) ( v) ( v) ( m) ( m) ( m,,...,,,,...,,,,..., ) n n n t v m Á gyszerű csoportosítás Csoportátlagok: nt nv nm m v ( t ) = ( t ) ( ) = ( v ) ( ) = ( m ) nt = nv = nm = égyzetösszegek: nv nm ( ( t ) ) + ( ( v ) ) + ( ( m ) ) nt Q total = = = = ( t) v m ( ) + ( ) nv( ) + ( nm( ) Q k = ) nt Q nt nv = + v v nm + m m ( t) ( t) ( ) ( ) ( ) ( ) b ( ) ( ) ( ) = = =
gyszerű csoportosítás Q total = Q k + Q b Á H0 H Q k 3 Q b n 3 F-eloszlású (, n-3) m t Q ( ) b nm + ( ) ± nt tε n 3 nm nv tudent(n-3) 3
Descriptives Miles per allon 95% Confidence nterval for Mean Mean td. Deviation td. rror Lower Bound Upper Bound Minimum Maimum merican 48 0,3 6,377,405 9,33 0,93 0 39 uropean 70 7,89 6,74,804 6,9 9,49 6 44 Japanese 79 30,45 6,090,685 9,09 3,8 8 47 Total 397 3,55 7,79,39,78 4,3 0 47 Test of Homogeneity of Variances Miles per allon Levene tatistic df df ig.,06 394,900 OV Miles per allon um of quares df Mean quare F ig. Between roups 7984,957 399,479 97,969,000 Within roups 6056,45 394 40,75 Total 404,37 396 eport Miles per allon Country of Origin merican uropean Japanese Total Mean td. Deviation 0,3 6,377 48 7,89 70 6,74 30,45 79 6,090 3,55 397 7,79 Multiple Comparisons Dependent Variable: Miles per allon LD Mean Difference 95% Confidence nterval () Country of Origin (J) Country of Origin (-J) td. rror ig. Lower Bound Upper Bound merican uropean -7,763*,864,000-9,46-6,06 Japanese -0,3*,85,000 -,94-8,70 uropean merican 7,763*,864,000 6,06 9,46 Japanese -,559*,048,05-4,6 -,50 Japanese merican 0,3*,85,000 8,70,94 uropean,559*,048,05,50 4,6 *. The mean difference is significant at the.05 level. 4
Y függőváltozó X, X,... X p független változók Y f(x, X,... X p ) becslés f F (Y- f * (X, X,... X p )) = min (Y-f(X, X,... X p )) f F legkisebb négyzetek módszere. n h(a,b,c,...) = Σ (Y i -f(x i, X i,... X pi,a,b,c,... )) i= min a,b,c,... Lineáris regresszió f(x) = B 0 + B X Többváltozós lineáris regresszió f(x, X,...,X p ) = B 0 + B X + B X +...+ B p X p Polinomiális regresszió f(x, X,...,X p ) = B 0 + B X + B X +...+ B p X p X =X, X =X,..., X p =X p Kétparaméteres (lineárisra visszavezethető) regresszió pl. Y=f(X) = B o e B X lny= B X + lnb o. Kétparaméteres (lineárisra visszavezethető) regresszió y + = b0 + b b quadratic y = b 0 b compound y = ep( b0 + b ) growth y = b + b ln logarithmic y = b 0 0 + b + b + b3 cubic 3 b y = ep b0 + y = b0 + ep( b ) eponential b y = b + 0 inverse y + b = b0 power y = / u + b + b 0 logistic 5
emlineáris regresszió f(x) = B + B ep(b 3 X) aszimptotikus.. f(x) = B -B (B 3 ) X f(x) = (B + B X) -/B3 f(x) = B (-B 3 ep(b X )) f(x) = B ep( -B ep( -B 3 X ))) f(x) = B ep( -B /(X + B 3 )) aszimptotikus. sűrűség auss ompertz Johnson-chumacher emlineáris regresszió f(x) = (B + B 3 X) B f(x) = B -ln( + B ep( -B 3 X ) f(x) = B + B ep( -B 3 X ) f(x) = B X / (X + B ) log-módosított log-logisztikus Metcherlich Michaelis Menten V. f(x) = (B B +B 3 X B4 )/(B + X B4 ) Morgan-Merczer-Florin f(x) = B /(+B ep( -B 3 X +B 4 X + B 5 X 3 )) Peal-eed V. emlineáris regresszió f(x) = (B + B X +B 3 X + B 4 X 3 )/ B 5 X 3 f(x) = (B + B X +B 3 X )/ B 4 X f(x) = B /((+B 3 ep(b X)) (/B4) f(x) = B /((+B 3 ep(b X)) f(x) = (B (-B4) B ep( -B 3 X)) /(-B4) f(x) = B -B ep( -B 3 X B4 ) f(x) = /(B + B X +B 3 X ) köbök aránya négyzetek aránya ichards Verhulst Von Bertalanffy Weibull Yield sűrűség 6
zakaszonkénti lineáris regresszió V. Poligoniális regresszió V. Többváltozós lineárisis regresszió kategória-változóval V. 7
Logisztikusregresszió, ha az esemény bekövetkezik Y dichotóm Y= { 0, ha az esemény nem következik be X, X,...,X p választó fog szavazni páciensnek szívinfarktusa lesz z üzletet meg fogák kötni ordinális szintű független változók X. eddig hányszor ment el, kor, iskola, övedelem napi cigi, napi pohár, kor, stressz ár, mennyiség, piaci forgalom, raktárkészlet Logisztikusregresszió P(Y=) = P() -e - = B 0 + B X + B X +...+ B p X p P() ODD = -P() e log (ODD) = = B 0 + B X + B X +...+ B p X p X. Logisztikusregresszió legnagyobb valószínűség elve L(ε,ε,...,ε n ) = P(Y = ε, Y = ε,..., Y n = ε n ) = = P(Y = ε ) P(Y = ε ) L P(Y n = ε n ) L -e - -e - -e -n X. ln L(ε,ε,...,ε n ) =Σ ( ln ) -ep(b 0 + B X + B X +...+ B p X p ) 8
Lineáris regresszió lineáris kapcsolat kitüntetett: () a legegyszerűbb és leggyakoribb. () két dimenziós normális eloszlás esetén a kapcsolat nem is lehet más (vagy lineáris vagy egyáltalán nincs). X. Lineáris regresszió teles négyzetösszeg maradékösszeg regressziós összeg X. lineáris regresszió Q = Q res + Q reg y res reg (, y ) yˆ i ( i, y i ) ( i, ˆ ) y i = B 0 + B i 0 9
lineáris regresszió teles négyzetösszeg felbontása: Q = Q res + Q reg f reg szabadsági foka n-, mert n tagú az összeg, de ezek között két összefüggés van. f res szabadsági foka mindössze, mert az átlag konstans Ha nincs lineáris regresszió, a varianciákhányadosa (, n-) szabadsági fokú F eloszlást követ. F = Q reg s f Q ( n ) reg reg reg = = s Q res res Q res f res lineáris regresszió legkisebb négyzetek módszere alapelve: y yˆ i = B 0 + B i ( 5, y 5) ( 3, y 3) e 5 0 e 3 e 4 (, y ) e e ( 4, y 4) (, y ) egressziós kapcsolat keresése változók között 0
ummary Country of Origin = merican dusted td. rror of (elected) quare quare the stimate,90 a,846,845 38,866 a. Predictors: (Constant), Vehicle Weight (lbs.) OV b,c um of quares df Mean quare F ig. egression 079737 079737,04 376,806,000 a esidual 37948,4 5 50,55 Total 458885 5 a. Predictors: (Constant), Vehicle Weight (lbs.) b. Dependent Variable: ngine Displacement (cu. inches) c. electing only cases for which Country of Origin = merican Coefficients a,b Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. (Constant) -40,9 0,736-3,058,000 Vehicle Weight (lbs.),5,003,90 37,05,000 a. Dependent Variable: ngine Displacement (cu. inches) b. electing only cases for which Country of Origin = merican ummary Country of Origin = uropean dusted td. rror of (elected) quare quare the stimate,895a,80,798 0,045 a. Predictors: (Constant), Vehicle Weight (lbs.) OV b,c um of quares df Mean quare F ig. egression887,390 887,390 86,54,000 a esidual 763,774 7 00,898 Total 36036,64 7 a. Predictors: (Constant), Vehicle Weight (lbs.) b. Dependent Variable: ngine Displacement (cu. inches) c. electing only cases for which Country of Origin = uropean Coefficients a,b Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. (Constant) 0,75 5,980,78,090 Vehicle Weight (lbs.),04,00,895 6,96,000 a. Dependent Variable: ngine Displacement (cu. inches) b. electing only cases for which Country of Origin = uropean
ummary Country of Origin = Japanese dusted td. rror of (elected) quare quare the stimate,84a,708,704,585 a. Predictors: (Constant), Vehicle Weight (lbs.) OV b,c um of quares df Mean quare F ig. egression 9570,77 9570,77 86,703,000 a esidual 95,577 77 58,384 Total 4766,304 78 a. Predictors: (Constant), Vehicle Weight (lbs.) b. Dependent Variable: ngine Displacement (cu. inches) c. electing only cases for which Country of Origin = Japanese Coefficients a,b Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. (Constant) -3,35 9,977-3,3,00 Vehicle Weight (lbs.),06,004,84 3,664,000 a. Dependent Variable: ngine Displacement (cu. inches) b. electing only cases for which Country of Origin = Japanese Variables ntered/emoved b,c Variables ntered ngine Displacem ent (cu. inches), Time to ccelerate from 0 to 60 mph (sec), Horsepow er, Vehicle Weight (lbs.) a Variables emoved Method. nter a. ll requested variables entered. b. Dependent Variable: Miles per allon c. s are based only on cases for which Country of Origin = merican ummary Country of Origin = merican dusted td. rror of (elected) quare quare the stimate,865a,748,744 3,44 a. Predictors: (Constant), ngine Displacement (cu. inches), Time to ccelerate from 0 to 60 mph (sec), Horsepower, Vehicle Weight (lbs.) 3
OV b,c um of quares df Mean quare F ig. egression 748,899 4 870,75 77,730,000 a esidual 55,63 39 0,56 Total 9998,59 43 a. Predictors: (Constant), ngine Displacement (cu. inches), Time to ccelerate from 0 to 60 mph (sec), Horsepower, Vehicle Weight (lbs.) b. Dependent Variable: Miles per allon c. electing only cases for which Country of Origin = merican Coefficients a,b Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. (Constant) 46,60,498 8,66,000 Horsepower -,09,05 -,7 -,59,09 Vehicle Weight (lbs.) -,003,00 -,34-3,64,000 Time to ccelerate -,49,9 -,83-3,35,00 from 0 to 60 mph (sec) ngine Displacement -,034,007 -,59-4,80,000 (cu. inches) a. Dependent Variable: Miles per allon b. electing only cases for which Country of Origin = merican Variables ntered/emoved a,b Variables Variables ntered emoved Method tepwise (Criteria: Probabilit y-of- Vehicle F-to-enter Weight. <=,050, (lbs.) Probabilit y-of- F-to-remo ve >=,00). tepwise (Criteria: Probabilit y-of- ngine F-to-enter Displacem. <=,050, ent (cu. Probabilit inches) y-of- F-to-remo ve >=,00). 3 tepwise (Criteria: Probabilit Time to y-of- ccelerate F-to-enter from 0 to. <=,050, 60 mph Probabilit (sec) y-of- F-to-remo ve >=,00). a. Dependent Variable: Miles per allon b. s are based only on cases for which Country of Origin = merican 4
ummary Country of Origin = merican dusted td. rror of (elected) quare quare the stimate,845 a,73,7 3,44,858 b,736,734 3,308 3,864 c,747,744 3,48 a. Predictors: (Constant), Vehicle Weight (lbs.) b. Predictors: (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches) c. Predictors: (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches), Time to ccelerate from 0 to 60 mph (sec) OV d,e um of quares df Mean quare F ig. egression 73,60 73,60 60,987,000 a esidual 866,99 4,847 Total 9998,59 43 egression 7360,99 3680,496 336,98,000 b esidual 637,538 4 0,944 Total 9998,59 43 3 egression 7466,03 3 488,734 35,869,000 c esidual 53,36 40 0,55 Total 9998,59 43 a. Predictors: (Constant), Vehicle Weight (lbs.) b. Predictors: (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches) c. Predictors: (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches), Time to ccelerate from 0 to 60 mph (sec) d. Dependent Variable: Miles per allon e. electing only cases for which Country of Origin = merican Coefficients a,b Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. (Constant) 43,04,964 44,75,000 Vehicle Weight (lbs.) -,007,000 -,845-4,535,000 (Constant) 39,64,96 33,48,000 Vehicle Weight (lbs.) -,004,00 -,490-5,8,000 ngine Displacement -,05,005 -,386-4,578,000 (cu. inches) 3 (Constant) 44,73,989,476,000 Vehicle Weight (lbs.) -,003,00 -,377-4,76,000 ngine Displacement -,038,007 -,580-5,66,000 (cu. inches) Time to ccelerate -,336,07 -,43-3,58,00 from 0 to 60 mph (sec) a. Dependent Variable: Miles per allon b. electing only cases for which Country of Origin = merican 3 Horsepower Time to ccelerate from 0 to 60 mph (sec) ngine Displacement (cu. inches) Horsepower Time to ccelerate from 0 to 60 mph (sec) Horsepower cluded Variables d a. Predictors in the : (Constant), Vehicle Weight (lbs.) Collinearity tatistics Partial Correlation Beta n t ig. Tolerance -,40a -,43,06 -,43,30,009 a,6,8,05,794 -,386 a -4,578,000 -,83,54,059b,75,453,049,80 -,43 b -3,58,00 -,00,53 -,7c -,59,09 -,08, b. Predictors in the : (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches) c. Predictors in the : (Constant), Vehicle Weight (lbs.), ngine Displacement (cu. inches), Time to ccelerate from 0 to 60 mph (sec) d. Dependent Variable: Miles per allon 5
ummary and Parameter stimates Dependent Variable: Miles per allon ummary Parameter stimates quation quare F df df ig. Constant b Linear,595 57,709 390,000 39,855 -,57 Logarithmic,658 75,88 390,000 08,45-8,536 nverse,659 754,63 390,000 3,963 808,07 Power,705 933,576 390,000 03,877 -,836 ponential,669 788,834 390,000 47,300 -,007 Logistic,669 788,834 390,000,0,007 The independent variable is Horsepower. 6
Dependent Variable: Miles per allon ummary and Parameter stimates quation Power ummary Parameter stimates Constant b quare F df df ig.,705 933,576 390,000 03,877 -,836 The independent variable is Horsepower. OV egression esidual Total um of quares df Mean quare F ig. 3,889 3,889 933,576,000 3,3 390,034 45,0 39 The independent variable is Horsepower. Coefficients ln(horsepower) (Constant) Unstandardized tandardized Coefficients Coefficients B td. rror Beta t ig. -,836,07 -,840-30,554,000 03,877 8,800 7,949,000 The dependent variable is ln(miles per allon). 7