直线回归分析 Analyze Regression Linear 问题:某地—年级12名女大学生的体重(kg)X与肺活量 (L)Y数据如下表 1、肺活量与体重之间是否有直线关系?如果有直线 关系试用直线回归方程描述。 2、此资料有无可疑的特异点(或异常点)? 3、求总体回归系数的95%可信区间。 4、求体重为50公斤时,肺活量的平均值及95%可信 区间。求体重为50公斤时,个体Y值的95%容许区 「、,AAAA 体重(X) 424246464650505052525858 肺活量(Y):2.552.202.752.402.802.813.413.103.46 2.853.503.00
直线回归分析 Analyze\Regression\ Linear… 问题:某地一年级12名女大学生的体重(kg)X与肺活量 (L)Y数据如下表. 1、肺活量与体重之间是否有直线关系?如果有直线 关系试用直线回归方程描述。 2、此资料有无可疑的特异点(或异常点)? 3、求总体回归系数的95%可信区间。 4、求体重为50公斤时,肺活量的平均值及95%可信 区间。求体重为50公斤时,个体Y值的95%容许区 间。 体重(X): 42 42 46 46 46 50 50 50 52 52 58 58 肺活量(Y):2.55 2.20 2.75 2.40 2.80 2.81 3.41 3.10 3.46 2.85 3.50 3.00
因变量 Linear Regression 糁个体 case Dependent OK 体重冈 带肺活量M Paste Previous Block 1 of 1 No Reset Independent(s Cancel 自变量 秒体重区 Help Method: Enter Selection Variable Rule Case Labels 个体[case WLS > Statistics Plots Sav Cption 个体标签
因变量 自变量 个体标签
回归系数分析 拟合优度统计量 回归系数估计值B 标准误 Linear Regressic n: Statistics 常数 Regression Coefficients v Model fit Continue v Estimates 厂 R squared change 标准化回归系数 Cancel v Confidence intervals y Descriptives Beta 厂 Covariance matriⅸ Part and partial correlations Help Collinearity diagnostic 回归系数B95% Residuals Durbin-Watson 可信区间 Casewise diagnostics Outliers outside standard deviations C All cases 残差分析
回归系数分析 残差分析 回归系数估计值B 标准误 常数 标准化回归系数 (Beta) 回归系数B 95% 可信区间 拟合优度统计量
Linear Regression: Plots 源变量栏 DEPENDNT Continue *ZPRED Previous Scatter 1 of 1 Ne *ZRESID Cancel DENPENDENTPDRESID *ADJPRED ¥ DEPENDN Help 因变量 SRESID SDRESID XZPRED □ X:"ZPRED 标准化预测值 Standardized Residual Plots Produce all partial plots PZRESD 厂 Histogram 标准化残差 Normal probability plot DRESID Linear Regression: Plots 删除的残差 DEPENDNT Continue 米 ADJPRED *ZPRED Previous Scatter 2 of 2 Next ZRESID Cancel 调整残差 DRESID *ADJPRED ¥ ZRESID Help * SRESID SRESID SDRESID Student's残差 X:*ZPRED *SDRESID Standardized Residual plots Produce all partial plots Students删除的m 残差 Normal probability plot
DENPENDENT 因变量 *ZPRED 标准化预测值 *ZRESID 标准化残差 *DRESID 删除的残差 *ADJPRED 调整残差 *SRESID Student’s残差 *SDRESID Student’s删除的 残差 源变量栏
Linear Regression: Save 预测值 Predicted values Residuals Continue V Unstandardized Unstandardized Cancel 厂 Standardized Standardized Help 残差 厂 Adjusted 厂 Studentized S.E. of mean predictions 厂 Deleted 厂 Studentized deleted Distances 厂 Mahalanobis Influence statistics 厂 Cook's 厂 DfBeta[s 厂 Leverage values Standardized DfBeta(s) 厂 DfFit Prediction Intervals 厂 Standardized dffit 预测区间估计 V Mean M Individual 厂 Covariance ratio Confidence Interval 95% Save to New File Coefficient statistics File Export model information to XML file Br rowse
预测值 残差 预测区间估计
Descriptive Statistics 描述性统计结果 MeanStd Deviation N 肺活量 2.9025 4144 12 体重 49.33 5.28 Correlations 相关分析结果 肺活量体重 Pearson Correlation肺活量 1.000 749 体重 749 1.000 Pearson相关系数r=0.749 Sig. (1-tailed) 肺活量 体重 00单侧显著性检验P=0.003 003 N 肺活量 12 12 体重 12 Variables Entered Remove 引入或剔除的变量 Variables variables Model Entered Removed Method 体重a Enter a. All request ed variables entered b. Dependent variable:肺活量
Descriptive Statistics 2.9025 .4144 1 2 49.33 5.28 1 2 肺活量 体 重 Mean Std. Deviation N Correlations 1.000 .749 .749 1.000 . .003 .003 . 1 2 1 2 1 2 1 2 肺活量 体 重 肺活量 体 重 肺活量 体 重 Pearson Correlation Sig. (1-tailed) N 肺活量 体 重 Variables Entered/Removedb 体 重a . Enter Model 1 Variables Entered Variables Removed Method a. All requested variables entered. b. Depe ndent Variable: 肺活量 描述性统计结果 相关分析结果 引入或剔除的变量 Pearson相关系数r = 0.749 单侧显著性检验P = 0.003
Model Summary 拟合优度统计量 adjusted Std Error of Model 1 .749 a. Predictors:( Con stant),体重 b. Dependent variable:肺活量 方差分析 ANOva Sum of Model Squares Mean Square F Regression 1.061 1.061 12.817 005 Residual 828 10 8.280E-02 Total 11 a. Predictors;:( Constant),体重 b. Dependent variable:肺活量 回归均方=1.061、残差均方=0.0828、F=12.817、P=0.05 可认为变量X和Y之间有直线关系
Model Summaryb .749a .562 .518 .2878 Model 1 R R Square Adjusted R Square Std. Error of the Estimate a. Predictors: (Constant), 体 重 b. Dependent V ariable: 肺活量 ANOVAb 1.061 1 1.061 12.817 .005a .828 1 0 8.280E-02 1.889 1 1 Regression Residual Total Model 1 Sum of Squares d f Mean Square F Sig. a. Predictors: (Constant), 体 重 b. Dependent Variable: 肺活量 拟合优度统计量 方差分析 回归均方=1.061、残差均方=0.0828、F=12.817、P=0.05, 可认为变量X和Y之间有直线关系
回归分析中的系数 Coefficents Standardi zed Unstandardized efficien 95% Confidence Interval for Coefficients ts B Model B Std. Error Bet a Lower bound Upper bound ( Constant)4.130E-04 815 1.000 -1.815 1.816 体重 5.883E02 016 749 3.580 02 095 a. Dependent variable:肺活量 常数项( Constant)=0.00043,回归系数(B)=0.05883 P<0.05,可以认为一年级女大学生肺活量与体重之间有 直线关系,直线回归方程为p=00043+005883X
Coefficientsa 4.130E-04 .815 .001 1.000 -1.815 1.816 5.883E-02 .016 .749 3.580 .005 .022 .095 (Constant) 体 重 Model 1 B Std. Error Unstandardized Coefficients Beta Standardi zed Coefficien t s t Sig. Lower Bound Upper Bound 95% Confidence Interval for B a. Dependent Variable: 肺活量 回归分析中的系数 常数项(Constant)=0.000413,回归系数(B)=0.05883 P<0.05,可以认为一年级女大学生肺活量与体重之间有 直线关系,直线回归方程为: y ˆ = 0.000413+ 0.05883x
残差统计结果 Residuals statistics Minimum Maximum Mean Std.DeviationN Predicted value 247113.4123 2.9025 3106 12 Std. predicted valu -1389 1.641 000 1.000 12 Stand ard error of Predicted valu 8379E02.1649 1133 3.225E-02 12 Adjusted Predicted Value 2.4436 3.61382.9175 3305 12 Residual 4123 4683-148E-16 Std residual 1.433 1.627 000 953 12 Stud. Residual -1.748 1.701 023 1.050 12 Deleted residual -.6138 5117-150E02 3357 12 Stud, deleted residual 1991 1.914 -.023 1.132 12 Mahal. dist ance 016 2.694 917 1.065 12 Cook' s Distance 002 747 119 208 12 Centered leverage value 001 245 083 a. Dependent variable:肺活量
Residuals Statisticsa 2.4711 3.4123 2.9025 .3106 1 2 -1.389 1.641 .000 1.000 1 2 8.379E-02 .1649 .1133 3.225E-02 1 2 2.4436 3.6138 2.9175 .3305 1 2 -.4123 .4683 -1.48E-16 .2744 1 2 -1.433 1.627 .000 .953 1 2 -1.748 1.701 -.023 1.050 1 2 -.6138 .5117 -1.50E-02 .3357 1 2 -1.991 1.914 -.023 1.132 1 2 .016 2.694 .917 1.065 1 2 .002 .747 .119 .208 1 2 .001 .245 .083 .097 1 2 Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum Maximum Mean Std. Deviation N a. Dependent Variable: 肺活量 残差统计结果
残差的直方图 Histogram Dependent variable:肺活量 Std Dey = 95 Mean =0.00 0 N=12.00 150-1005000050100150 Regression standardized residual
Regression Standardized Residual -1.50 -1.00 -.50 0.00 .50 1.00 1.50 Histogram Dependent Variable: 肺活量 Frequency 5 4 3 2 1 0 Std. Dev = .95 Mean = 0.00 N = 12.00 残差的直方图