第十三章 回归与相关 第一节 直线回归 附四、直线回归的区间估计 (一)回归系数B的区间估计 直线回归方程中的样本回归系数b是总体回归 系数的点估计值。对总体回归系数进行区间估 计,按下式计算其1-a的可信区间: b±tw2S6 公式(13.13) 吉林大学远程教育学院
2 吉林大学远程教育学院 第十三章 回归与相关 第一节 直线回归 附 四、直线回归的区间估计 ㈠ 回归系数β的区间估计 直线回归方程中的样本回归系数b 是总体回归 系数β的点估计值。对总体回归系数β进行区间估 计,按下式计算其1-α的可信区间: n Sb b t ,, −2 公式(13.13)
式中S6为样本回归系数的标准误,可用公式13.☑求。 例13.7对例13.1求得的回归系数进行区间估计. 由例13.1算得b=0.1507;由例13.3算得S6= 0.0238,V=12-2=10,查t界值表得tav=t0.05,10 =2.228,按公式(13.13)计算的95%的可信区间: (0.1507-2.228×0.0238,0.1507+2.228×0.0238) =(0.0977,0.2037) 白)4的区间估计 3 吉林大学远程教育学院
3 吉林大学远程教育学院 式中Sb 为样本回归系数的标准误,可用公式(13.7)求。 例13.7 对例13.1求得的回归系数进行区间估计。 由例13.1算得b=0.1507; 由例13.3算得Sb= 0.0238,ν=12-2=10,查t 界值表得t α,ν=t 0.05,10 =2.228,按公式(13.13)计算β的95%的可信区间: (0.1507-2.228×0.0238, 0.1507+2.228×0.0238) =(0.0977, 0.2037) ㈡ Yˆ 的区间估计
优表总体中当X为定值X的条件下的蛇数。 表示抽误差大小的标准误按下述公式计算: Iny -l /x S:N 4(X。-X 公式13.14) n-2 \n 按下式计算的1的可信区间: Y±ta.n-2Sg 公式(13.15) 例13.8用例13.1求得的直线回归方程,试计算当X。 =55时4,的95%可信区间。 吉林大学远程教育学院
4 吉林大学远程教育学院 代表总体中当X为定值X0的条件下 的均数。 表示 抽样误差大小的标准误 按下述公式计算: Yˆ Y ˆ Y ˆ Y S ˆ X X YY X Y X X Y l X X n n l l l S 2 0 2 ˆ 1 ( ) 2 / − + − − = 按下式计算 的 Yˆ1-α的可信区间: 公式(13.14) n Y Y t , 2 S ˆ ˆ , − 公式(13.15) 例13.8 用例13.1求得的直线回归方程,试计算当X0 =55时, Yˆ的95%可信区间
由例13.1算得=10.8139+0.33Xxx 7 =1550.7,1w=44.04,1=233.7;已知当X=55时 =10.8139+0.1507×55=1,9.按4式 (13.14)计算 得S, 44.04-233.7/1550.7 S 1,(55-52.33)2 =0.2785 12-2 V12 1550.7 本例V=12-2=10,查1界值表得t&v=t0.05,10 =2.228,按公式(13.15计算当X=55时4,的95% 的可信区间: (19.1024-2.228×0.2785,19.1024+2.228×0.2785) =(18.4819,56.6867) 吉林大学远程教育学院
5 吉林大学远程教育学院 由例13.1算得 , 52.33,lXX =1550.7,lYY=44.04,lXY =233.7;已知当 X0=55时 , , 按公式 (13.14)计算 得: Y ˆ =10.8139+0.1507X X = 10.8139 0.1507 55 19.1024 Y ˆ = + = Y S ˆ 本例ν=12-2=10,查t 界值表得t α,ν=t 0.05,10 =2.228, 按公式(13.15)计算当X0=55时, 的95% 的可信区间: 0.2785 1550.7 (55 52.33) 12 1 12 2 44.04 233.7 /1550.7 2 2 ˆ = − + − − = Y S Yˆ (19.1024-2.228×0.2785, 19.1024+2.228×0.2785) =(18.4819, 56.6867)
白)个体Y值的容许区间 代表总体中当X为定值X的条件下,个体Y值的 波动范围。其标准差按下述公式计算: 公式(13.16 n-2 按下式计算个体Y值的1-a的容许区间: Y±ta,n-2Sy 公式(13.17) 例13.9用例13.1求得的直线回归方程,试计算当X =55时,个体Y值的95%容许区间。 吉林大学远程教育学院
6 吉林大学远程教育学院 ㈢ 个体Y 值的容许区间 代表总体中当X为定值X0的条件下,个体Y 值的 波动范围。其标准差按下述公式计算: X X YY X Y X X Y l X X n n l l l S 2 0 2 1 ( ) 1 2 / − + + − − = 公式(13.16) 按下式计算个体Y 值的1-α的容许区间: n SY Y t , 2 ˆ , − 公式(13.17) 例13.9 用例13.1求得的直线回归方程,试计算当X0 =55时,个体Y值的95%容许区间
按公式(13.16)计算Sy得: 44.04-233.72/1550.7 Sy=1 (55-52.33)2 =0.9796 12-2 12 1550.7 由例13.8已得结果,按公式(13.17)计算当X=55 时,个体Y值的95%容许区间: (19.1024-2.228×0.9796,19.1024+2.228×0.9796) =(16.92,55.12) 即估计该地女性总体中年龄55岁者,有95% 的人,其收缩压在16.92~55.12kPa范围内。 吉林大学远程教育学院
7 吉林大学远程教育学院 按公式(13.16)计算SY 得: 0.9796 1550.7 (55 52.33) 12 1 1 12 2 44.04 233.7 /1550.7 2 2 = − + + − − SY = 由例13.8已得结果,按公式(13.17)计算当X0= 55 时,个体Y 值的95%容许区间: (19.1024-2.228×0.9796, 19.1024+2.228×0.9796) =(16.92, 55.12) 即估计该地女性总体中年龄55岁者,有95% 的人,其收缩压在16.92~55.12kPa范围内
附五、直线回归方程的应用 (一)描述两变量依存关系 通过回归系数的假设检验,若认为两变量间存 在直线回归关系,则可用直线回归方程来描述两 变量间依存的直线定量关系。如例13.1求得的直 线回归方程氵=10.813就是该地女性年龄对收 缩压的直线定量表达式。 (仁)利用回归方程进行统计预测 这是回归方程的重要应用方面。所谓统计预 8 吉林大学远程教育学院
8 吉林大学远程教育学院 附 五、直线回归方程的应用 ㈠ 描述两变量依存关系 通过回归系数的假设检验,若认为两变量间存 在直线回归关系,则可用直线回归方程来描述两 变量间依存的直线定量关系。如例13.1求得的直 线回归方程 就是该地女性年龄对收 缩压的直线定量表达式。 Y ˆ =10.8139+0.1507X ㈡ 利用回归方程进行统计预测 这是回归方程的重要应用方面。所谓统计预
测(statistical forecast)就是把预报因子(自变量)代 入回归方程对预报量(应变量)进行估计,其波动 范围可按求个体Y值的容许区间方法计算。 例13.10某地卫生防疫站根据10年来乙脑发病率(1/10万,预报 量Y)与相应前一年7月份日照时间(小时预报因子X)建立回归方程, 将乙脑发病率作平方根反正弦变换(即取 y=加求得回归方程 为 了=-1170088W1=10.1990年7月份日照时▣X=260小 时,试估计1991年该地的乙脑发病率。(a=0.05) 已知当X=260时,Y=-1.197+0.0068×260=0.571 按公式(13.17)计算95%容许区间为: (0.5150,0.6270) 吉林大学远程教育学院
9 吉林大学远程教育学院 测(statistical forecast)就是把预报因子(自变量X)代 入回归方程对预报量(应变量Y)进行估计,其波动 范围可按求个体Y 值的容许区间方法计算。 例13.10 某地卫生防疫站根据10年来乙脑发病率(1/10万,预报 量Y )与相应前一年7月份日照时间(小时,预报因子X )建立回归方程, 将乙脑发病率作平方根反正弦变换(即取 ),求得回归方程 为 ,SY =0.0243,n=10。1990年7月份日照时间X0=260小 时,试估计1991年该地的乙脑发病率。(α=0.05) y Y 1 sin − = Y ˆ = −1.197+0.0068X 已知当X0=260时, 1.197 0.0068 260 0.571 Y ˆ = − + = 按公式(13.17)计算95%容许区间为: (0.5150, 0.6270)
取反函数,Y=(siny)2,得(0.0000808, 0.0001197),故可预测该地1991年乙脑发病率有 95%的可能在0.08~11.97/10万之间。 (白)利用回归方程进行统计控制 统计控制(statistical control)就是利用回归方程 进行逆估计如要求应变量在一定范围内波动可 以通过自变量X的取值来实现。 例13.11某市环境监测站在某交通点连续测定30天,每天定 时采样3次,测得大气中NO2浓度Y(mgm3)与当时汽车流量X(辆/小 时),共90对数据,求得回归方程 Y=-0.064866+0.000133X 10 吉林大学远程教育学院
10 吉林大学远程教育学院 取反函数,Y=(sin y)2,得(0.0000808, 0.0001197),故可预测该地1991年乙脑发病率有 95%的可能在0.08~11.97/10万之间。 ㈡ 利用回归方程进行统计控制 统计控制(statistical control)就是利用回归方 程 进行逆估计,如要求应变量Y在一定范围内波动,可 以通过自变量X的取值来实现。 例13.11 某市环境监测站在某交通点连续测定30天,每天定 时采样3次,测得大气中NO2浓度Y(mg/m3 )与当时汽车流量X(辆/小 时),共90对数据,求得回归方程 Y ˆ = −0.064866+0.000133X
Sv=0.032522,若N02的最大容许浓度为0.15mg/m3,则汽车流量应如 何控制?(a=0.05) 已知本例Y=0.15,即个体Y值的95%容许区 间的上限,按公式(13.17应为: Yu =Y+tan-2Sy 本例V=90-2=88查t界值表得单侧t&v=t 0.05,88=1.6624,Sy=0.032522,-0.064866+ 0.000133X,代入上式有: Y=(-0.064866+0.000133X)+1.6624×0.032522 0.15=0.000133X-0.010801 吉林大学远程教有学院
11 吉林大学远程教育学院 SY=0.032522,若NO2的最大容许浓度为0.15mg/m3 ,则汽车流量应如 何控制?(α=0.05) 已知本例YU=0.15,即个体Y 值的95%容许区 间的上限,按公式(13.17)应为: U n SY Y Y t , 2 ˆ = + , − 本例ν=90-2=88,查t 界值表得单侧t α,ν= t 0.05,88 =1.6624,SY=0.032522, -0.064866+ 0.000133X,代入上式有: Y ˆ = YU = (−0.064866+ 0.000133X) +1.66240.032522 0.15 = 0.000133X −0.010801