简单线性相关与回归分析 引言 军事医学科学院 医学统计学教研室 胡良平
基本概念 何为相关分析? ■何为回归分析?
最易犯的错误 ■1、忽视资料的同质性; 2、没有专业知识为依据; ·3、不绘制散布图就分析; 4、仅绘制但不分析散布图;
!" !" !"
最易犯的错误 5、以直线取代曲线; 6、按无重复方法处理有重复实验的回 归分析问题; 7、仅给出相关系数与直线回归方 程,但未做假设检验; 8、下结论时仅看r绝对值大小,忽 视r2的数值大小
!"#$% !"#$% &'()*+,- ()*+,- ()*+,- ./0123456789': ;4$789<
从错误中顿悟 ■例1、某研究者收集到100人的血 小板和血红蛋白的数据,其中 正常人、轻、中、重度贫血患者 各25例。用简单线性相关与回归 分析同时研究这25人血小板和血 红蛋白之间的关系,请问:其结 论的可信度如何?为什么?
!"#$%&'()*+,-. %&'()*+,-. /0123"# /0123"# 45 +6 45 +6789: ; ?@ ; ?@ABC@
从错误中顿悟 ■例2、某研究者测得某地区100名正 常成年人转氨酶和身高的数值,用 简单线性相关与回归分析研究这两 个定量指标之间的关系,并进行了 正确的假设检验。得到的结论是: 可用身高数据去预测转氨酶的数值 大小。请问:此结论真的可信吗? 为什么?
"DEFG DEFGH IJKLMNO P IJKLMNO P% &'()*+,-./03Q RSTUV45 +6 RSTUV45 +6WXYZ [ \]^_$ [ \]^_$E :;`9 <%NOabDKLM P c$789d:;e <=f d:;e <=f d:;e <=f@ ABC@
从错误中顿悟 ■例3、某研究者调查某农村居民 被狗咬伤情况:以居民年龄为自 变量X、以被狗咬伤发生率Y为结 果变量,建立Y依赖x变化的线性 回归方程具有统计学意义。结论 为:狗按直线规律咬人。请问: 此结论真的可信吗?为什么?
ghijklm nopqrs9 nopqrs9tlmJuAv tlmJuAv wTxtnopqyz{ tnopqyz{ tnopqyz{|A: }wT~|xw () -. $ -. $:; A9o(p o(p o(p$789 d:;e <=f@ d:;e <=f@ABC@
从错误中顿悟 例4、某研究者对7例糖尿病患者给某种药物 后,测量其血中胰岛素和血糖的含量。该研 究者采用的是直线相关分析,得:”= 0.3140,P>0.05,结论为胰岛素含量和血糖 的含量之间无直线相关关系。 ·患者编号 1234 5 6 7 ■胰岛素含量uml)2417181215 121 10 血糖含量(mg%) 142170194213214 238249 ■这个结论违反了专业知识,何因?
! " # $ % & ' ( ) ! " # $ % & ' ( ) * + , - ./01. ./01.23./.4567 567 89:$%&''; 89:$%&''; 1 2 3 4 5 6 7 (µu/ml) 24 17 18 12 15 121 10 (mg) 142 170 194 213 214 238 249 ?@ABCD ?@ABCDEFG
从错误中顿悟 例5,设有4组定量指标的数据,设 (X,Y:)(i=1、2、3、4)是第i对在 专业上有联系的指标。对各对指标均 观测了11对数据(具体数据从略) , 请问:可否用简单线性回归分析研究 各对指标之间的变化关系?
!"#$%&%'%()*"+, -./012 -./012+3+4 567$$+89:; ?@ABCDEFGHI J ?@ABCDEFGHI J 3+KLMNO1P 3+KLMNO1P
从错误中顿悟 用方差分析方法评价拟合效果的计算 结果为:检验统计量F约为18.0, P=0.0022。说明在统计学上可以用直线回 归方程来描述4组数据。具体地说,求得的 直线回归方程皆为: 7=3.0+0.5X。 4组数据各不相同,居然可以用同一 条直线回归方程来描述,这是一个难以令 人置信的结果啊!结论正确吗?
F18.0 P=0.0022 !"# !"# $%&'(4)*+,-./0 !"#$%1 !"#$%1 =3.0+0.5X 4)*+2345 )*+234567 58 67 58 9!"#$%&'( 9!"#$%&'(:;8 ?@A BC ?@A BCDEFGH Y )