当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

复旦大学:《卫生统计学》课程教学资源(习题)第十章 直线回归和相关Stata实现

资源类别:文库,文档格式:DOC,文档页数:6,文件大小:175KB,团购合买
点击下载完整版文档(DOC)

第十章直线回归和相关的 Stata实现 本章使用的 Stata命令为 直线回归 regress应变量自变量 在执行 regress命令后,执行下列命令 残差计算 predict变量名, residual Pearson相关 pacor变量1变量n,sig Spearman相关 spearman变量1变量2 例10-1为了研究血清胆固醇含量与舒张压之间是否存在依存关系,2006 年在郑州某大学随机抽取10名成年男性,测得他们的血清胆固醇(mg/L)含量和 舒张压(mmHg)如表10-1,请作统计分析。 表10-110名成人的血清胆固醇(mgdL)含量和舒张压(mmHg) 指标 2 3 5 6 8 胆固醇X 307259341237254416267320374316 舒张压Y 75 90 75105 85 H0:总体回归方程不成立(月=0) H1:总体回归方程成立(B≠0) Stata数据 307 80 75 2345678 90 416 105 88 316 Stata命令为

第十章 直线回归和相关的 Stata 实现 本章使用的 Stata 命令为: 直线回归 regress 应变量 自变量 残差计算 在执行 regress 命令后,执行下列命令: predict 变量名,residual Pearson 相关 pwcorr 变量 1 … 变量 n, sig Spearman 相关 spearman 变量 1 变量 2 例 10-1 为了研究血清胆固醇含量与舒张压之间是否存在依存关系,2006 年在郑州某大学随机抽取 10 名成年男性,测得他们的血清胆固醇(mg/dL)含量和 舒张压(mmHg)如表 10-1,请作统计分析。 表 10-1 10 名成人的血清胆固醇(mg/dL)含量和舒张压(mmHg) 指标 编 号 1 2 3 4 5 6 7 8 9 10 胆固醇 X 307 259 341 237 254 416 267 320 374 316 舒张压 Y 80 75 90 70 75 105 70 85 88 78 H0 :总体回归方程不成立(  = 0 ) H1:总体回归方程成立(   0 )  =0.05 Stata 数据: x y 1 307 80 2 259 75 3 341 90 4 237 70 5 254 75 6 416 105 7 267 70 8 320 85 9 374 88 10 316 78 Stata 命令为: reg y x

结果 Source Number of obs Model928.343132 1928.343132 Prob 0.0000 Residual| 114.05686 814.2571086 R-squared 0.8906 Ij R-squared 0.8769 Total 9115.822222 Coef. Std. Err t p>t [95% Conf. Interval] 17786402204198.070.000 1270352 2286927 cons 26.622256.9169953.850.00510.6716342.5728 t=8.07,P值<0.001( Stata输出值0.000),构建直线回归方程将a和b代入 式(10-2),可知 Y=2662+0.178X 本例中,b的统计学意义为:血清胆固醇含量每增加1mg/dL,总体中舒张 压平均增加0.178mmHg 总体均数A1x的区间估计给定X=X0时,Y的总体均数的点估计,例10 1中,当自变量X取值为307mgdL时。个体Y值的容许区间估计给定X=X 值时,估计总体中个体Y值的波动范围,以例10-1中第一个样本点的数据 (30780)为例 Stata命令: predict yhat predict stdf, stdf generate clml yhat - invttail(7,0.025)*stdp generate clm2 yhat t invttail(7,0.025)*stdp generate clpl yhat -invttail(7,0.025)*stdf generate clp2 yhat invttail(7,0.025)*stdf twoway (lfitci y x, level (95))(scatter y x)(line clml clm2 clpl clp2 x, style(p2p2 p3 p3) sort)

结果: Source | SS df MS Number of obs = 10 -------------+------------------------------ F( 1, 8) = 65.11 Model | 928.343132 1 928.343132 Prob > F = 0.0000 Residual | 114.056868 8 14.2571086 R-squared = 0.8906 -------------+------------------------------ Adj R-squared = 0.8769 Total | 1042.4 9 115.822222 Root MSE = 3.7759 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | .177864 .0220419 8.07 0.000 .1270352 .2286927 _cons | 26.62225 6.916995 3.85 0.005 10.67163 42.57287 ------------------------------------------------------------------------------ t=8.07 ,P值<0.001(Stata输出值0.000),构建直线回归方程 将 a 和 b 代入 式(10-2),可知, Y ˆ = 26.62 + 0.178X 本例中, b 的统计学意义为:血清胆固醇含量每增加 1mg/dL,总体中舒张 压平均增加 0.178mmHg。 总体均数 Y X  的区间估计 给定 X X = 0 时, Y 的总体均数的点估计,例 10 -1 中,当自变量 X 取值为 307 mg/dL 时。个体 Y 值的容许区间估计 给定 X X = 0 值时,估计总体中个体 Y 值的波动范围,以例 10-1 中第一个样本点的数据 (307,80)为例。 Stata 命令: predict yhat predict stdp, stdp predict stdf, stdf generate clm1 = yhat - invttail(7,0.025)*stdp generate clm2 = yhat + invttail(7,0.025)*stdp generate clp1 = yhat - invttail(7,0.025)*stdf generate clp2 = yhat + invttail(7,0.025)*stdf twoway (lfitci y x, level(95)) (scatter y x) (line clm1 clm2 clp1 clp2 x, pstyle(p2 p2 p3 p3) sort)

结果 hat stdp stdf cIml clm2 clpl 078081.231.193.9678.484.0571.8690.59 2597572.691.634.1168.8476.5362.9782.41 3419087.271.394.028490.5577.7696.78 2377068.781.994.2764.0873.4858.6978.87 71.81.74.1467.7775.83 416 100.612.644.6194.37106.86 2111.51 2677074.111.514.0770.5477.6964.4983.73 3208583.541.223.9780.6686.4274.1692.92 3748893.141.864.2188.7497.5583.19103.1 3167882.831.23.9679.9885.6773.4692.2 00 350 450 95%c Fitted value y clm 1/clm2 clp1/clp2

结果: x y yhat stdp stdf clm1 clm2 clp1 clp2 307 80 81.23 1.19 3.96 78.4 84.05 71.86 90.59 259 75 72.69 1.63 4.11 68.84 76.53 62.97 82.41 341 90 87.27 1.39 4.02 84 90.55 77.76 96.78 237 70 68.78 1.99 4.27 64.08 73.48 58.69 78.87 254 75 71.8 1.7 4.14 67.77 75.83 62 81.59 416 105 100.61 2.64 4.61 94.37 106.86 89.72 111.51 267 70 74.11 1.51 4.07 70.54 77.69 64.49 83.73 320 85 83.54 1.22 3.97 80.66 86.42 74.16 92.92 374 88 93.14 1.86 4.21 88.74 97.55 83.19 103.1 316 78 82.83 1.2 3.96 79.98 85.67 73.46 92.2 60 70 80 90 100 110 250 300 350 400 450 x 95% CI Fitted values y clm1/clm2 clp1/clp2

例10—2某发热门诊医生根据患者就诊顺序随机抽取12名20~40岁发热 患者,试探讨体温与脉搏之间的伴随关系,数据见表10-4 表10-412名发热患者的体温(℃)与脉搏(次/分) 4 5 7 8 II 体温X41.037.540738438.840.038039039.539840.8396 脉搏Y13585 134 24 106117125130138135 Stata数据 37.5 85 4 5 39 117 39.8 11 40.8 138 12 39.6 135 Stata命令 yx, sig 结果 1.0000 x|0.91731.0000 0.0000 P<00001,体温与脉搏存在线性相关关系

例 10-2 某发热门诊医生根据患者就诊顺序随机抽取 12 名 20~40 岁发热 患者,试探讨体温与脉搏之间的伴随关系,数据见表 10-4。 表 10-4 12 名发热患者的体温(℃)与脉搏(次/分) 指标 编 号 1 2 3 4 5 6 7 8 9 10 11 12 体温 X 41.0 37.5 40.7 38.4 38.8 40.0 38.0 39.0 39.5 39.8 40.8 39.6 脉搏 Y 135 85 134 108 120 124 106 117 125 130 138 135 Stata 数据 x y 1 41 135 2 37.5 85 3 40.7 134 4 38.4 108 5 38.8 120 6 40 124 7 38 106 8 39 117 9 39.5 125 10 39.8 130 11 40.8 138 12 39.6 135 H0:  =0 H1:  ≠0  = 0.05 Stata 命令: pwcorr y x,sig 结果: | y x -------------+------------------ y | 1.0000 | | x | 0.9173 1.0000 | 0.0000 P<0.0001,体温与脉搏存在线性相关关系

例10一3某医生研究新生儿缺氧缺血性脑病( hypoxic- ischemic cephalopathy,HIE)临床分度与其血浆MDA含量(出生后第7天)的关系, 获得了如下资料,试分析HIE临床分度(1轻度,2中度,3重度)与血浆MDA 含量的相关方向及相关程度。 HE临床分度11 MDA(umol)747.067638.172848.98811.510.610.2110 本例目的在于分析HE临床分度与血浆MDA含量的关系,从数据特征上看, HIE临床分度是等级资料,血浆MDA含量是连续性变量,因此应计算 Spearman 等级相关系数r。 同样地,r是样本相关系数,仅为总体相关系数p的一个点估计,还应做总 体相关系数p是否为0的假设检验,其无效假设与备择假设分别为: Ho: P H1: P Stata数据如下 6 23456789 6.3 87888 2 4 8 11.5 0123 10.6 lI Stata命令如下 spearman y x

例 10 - 3 某医生研究新生儿缺氧缺血性脑病( hypoxic-ischemic encephalopathy,HIE)临床分度与其血浆 MDA 含量(出生后第 7 天)的关系, 获得了如下资料,试分析 HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量的相关方向及相关程度。 HIE 临床分度 1 1 1 1 1 2 2 2 2 3 3 3 3 MDA(umol/L) 7.4 7.0 6.7 6.3 8.1 7.2 8.4 8.9 8.8 11.5 10.6 10.2 11.0 本例目的在于分析 HIE 临床分度与血浆 MDA 含量的关系,从数据特征上看, HIE 临床分度是等级资料,血浆 MDA 含量是连续性变量,因此应计算 Spearman 等级相关系数 s r 。 同样地, s r 是样本相关系数,仅为总体相关系数  s 的一个点估计,还应做总 体相关系数  s 是否为 0 的假设检验,其无效假设与备择假设分别为: H0:  s = 0 H1:  s ≠0 Stata 数据如下: i x y 1 1 7.4 2 1 7 3 1 6.7 4 1 6.3 5 1 8.1 6 2 7.2 7 2 8.4 8 2 8.9 9 2 8.8 10 3 11.5 11 3 10.6 12 3 10.2 13 3 11 Stata 命令如下: spearman y x

结果 Number of obs Spearman s rho 0.8910 Test of Ho: y and x are independent Prob>tI= 0.0000 P<00001,HE临床分度(1轻度,2中度,3重度)与血浆MDA含量存在 Spearman相关关系

结果: Number of obs = 13 Spearman's rho = 0.8910 Test of Ho: y and x are independent Prob > |t| = 0.0000 P<0.0001,HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量存在 Spearman 相关关系

点击下载完整版文档(DOC)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
已到末页,全文结束
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有