新世纪全国肩等中医药院校规划教材 医堂 主编」 周仁郁
主编 周仁郁
起关气回具 5.1直线相关 5.1.1积矩相关系数 定义1设X、Y服从正态分布, EX=uxEY=uy' DX>O、DY>0 E(X-Lx)(Y-Ly) DX DY 变量X、Y的总体积矩相关系数 ☒■
5.1 直线相关 5.1.1 积矩相关系数 定义1 设X、Y服从正态分布,EX=μX,EY=μY, DX>0、DY>0 变量X、Y的总体积矩相关系数 DX DY E X X Y Y · ( )( )
E(X-)(-H)称X和Y协方差 1≤ps1,X和Y相关则p=1,X和Y独立则p=0 定义3若(c1y…,cmyn)为X,Y r= 样本,则定义样本相关系数 Lxy =E(X-X)(Y-Y)=EXY-nXY lxx=(X-X)2=(n-1)S2 1y=(Y-T)2=(n-1)S2 一1≤r≤1,适用双正态资料,用计算器LR模式
E(X-μx)(Y-μy)称X和Y协方差 -1≤ρ≤1,X和Y相关则|ρ|=1,X和Y独立则ρ=0 定义3 若(x1 ,y1),…,(xn ,yn )为X,Y 样本,则定义样本相关系数 xx yy xy l l l r lXY (X X )(Y Y ) XY nXY 2 2 ( ) ( 1) XX X l X X n S 2 2 ( ) ( 1) YY Y l Y Y n S -1≤ r ≤1,适用双正态资料,用计算器LR模式
0;一1≤r<0负相关,拟合 直线斜率<0;r=0零相关,拟合曲线或杂乱无章 5.1.2 相关系数的假设检验
-1≤r≤1.|r|越接近于1,X和Y之间的线性关系越 密切.|r|越接近0,X和Y的线性关系越不密切 00;-1≤r <0负相关,拟合 直线斜率<0;r=0零相关,拟合曲线或杂乱无章 r 1 O x y 1 r 0 O x y r 0 O x y r 0 O x y 5.1.2 相关系数的假设检验
_、t(n-2) 用统计量(dfn-2)检验Hop=0,判断Y与X是否线 性相关,称相关系数检验 由df=n一2,查统计用表19,在P≤c时,l 以a水准 拒绝H,认为x与y之间有直线相关关系 例1测某地10名三岁儿童的体重X(kg)与体表面 积Y(10-1m2),计算样本相关系数r, 并检验是否 来自p=0的总体
~ ( 2) 2 1 2 t n n r r t 用t统计量(df=n-2)检验H0:ρ=0 ,判断Y与X是否线 性相关,称相关系数检验 由df=n-2,查统计用表19,在P≤时,以水准 拒绝H0,认为x与y之间有直线相关关系 例1 测某地10名三岁儿童的体重X(kg)与体表面 积Y(10-1m2),计算样本相关系数r,并检验是否 来自ρ=0的总体
体重 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 160 5.28 5.29 5.35 5.60 5.29 5.83 体表 6.01 6.10 6.07 6.41 3 9 8 2 4 0 2 5 1 计量资料,散点图直线趋势 6.5 Ho:总体相关系数p=0 X=13.4400 Y=5.7266 p· n=10,Sx=1.6635,Sy= 0.4142,∑XY=775.3466 5 775.3466-10×13.4400×5.7266 r= =0.9179 10-1)×1.6635×0.4142 ☒■
计量资料,散点图直线趋势 H0:总体相关系数ρ=0 n=10,SX=1.6635 ,SY= 0.4142,∑XY=775.3466 体重 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 体表 5.28 3 5.29 9 5.35 8 5.60 2 5.29 2 6.01 4 5.83 0 6.10 2 6.07 5 6.41 1 12 14 16 5 6 6.5 5 M 1 11 M 0 17 X 13.4400 Y 5.7266 0.9179 (10 1) 1.6635 0.4142 775.3466 10 13.4400 5.7266 r
查统计用表19,r0028=0.7646,双侧P≤0.01,按 a三0.01水准双侧检验拒绝H,可认为该地三岁儿 童体重X与体表面积有正向直线相关关系 5.1.3秩相关 等级或相对数资料,或不服从正态分布资料,或总 体分布类型不知资料,不宜用积矩相关系数作相关 分析,可用等级相关系数作相关分析,称为秩相关 常用秩相关分析方法有Spearman:法和Kendall法。 两法分别将两个变量按原始数值由小到大编秩,用 等级相关系数r和rk作检验统计量
查统计用表19,r0.01/2(8)=0.7646,双侧P<0.01,按 =0.01水准双侧检验拒绝H0,可认为该地三岁儿 童体重X与体表面积Y有正向直线相关关系 5.1.3 秩相关 等级或相对数资料,或不服从正态分布资料,或总 体分布类型不知资料,不宜用积矩相关系数作相关 分析,可用等级相关系数作相关分析,称为秩相关 常用秩相关分析方法有Spearman法和Kendall法。 两法分别将两个变量按原始数值由小到大编秩,用 等级相关系数rS和rK作检验统计量
6∑d2 n'-n 相同秩次较多时, 检验统计量要换为校正值rsc (n-n/6-(Tx+T,)-Σd2 rsc n2-n)/6-2Tx][(n-n)/6-2T,] d为每配对秩次之差,Tx(或Tx)=∑(一)12,巧 为X(或Y)中第个相同秩次的个数 用X与Y的秩值,按积矩相关系数的公式也可计算 出rs,查统计用表20,在Po时以a水准拒绝H
相同秩次较多时,检验统计量要换为校正值rSC n n d rS 3 2 6 1 [( )/ 6 2 ][( )/ 6 2 ] ( )/ 6 ( ) 3 3 3 2 X Y X Y SC n n T n n T n n T T d r d为每配对秩次之差,TX(或TY)=∑(tj3-tj)/12,tj 为X(或Y)中第j个相同秩次的个数 用X与Y的秩值,按积矩相关系数的公式也可计算 出rS,查统计用表20,在P≤时以水准拒绝H0
Kendall法是将X的秩次按从小到大排列,计算配对Y 的每个秩次下面大于自已秩次的秩次个数,合计值S 4S TK= n 相同秩次较多时,检验统计量要换为校正值rkC 2S Vn2-n)/2-Ux][n2-n)/2-Uy] Ux(或U=∑(好-)/2,为X(或)第个相同秩次个数 查统计用表21,Pa时以a水准拒绝Ho:K=0
Kendall法是将X的秩次按从小到大排列,计算配对Y 的每个秩次下面大于自己秩次的秩次个数,合计值S 1 4 2 n n S rK 相同秩次较多时,检验统计量要换为校正值rKC 1 [( ) / 2 ][( ) / 2 ] 2 2 2 X Y KC n n U n n U S r UX(或UY )=∑(tj 2-tj)/2,tj为X(或Y)第j个相同秩次个数 查统计用表21,P≤时以水准拒绝H0:K=0
例2测得2~7岁急性白血病患儿的血小板数X与出血 症状Y资料,研究血小板数X与出血症状Y之间联系 编号 秩 秩 秩差 编号 X 秩 秩 秩差 1 54270 6 ++ 9 -3 7 74240 7 3.5 3.5 10640 2 13790 2 ++ 9 -7 8 8 3.5 4.5 0 12617 3 16500 3 7 -4 9 9 3.5 5.5 0 4 31050 4 3.5 0.5 10 12900 10 3.5 6.5 0 14388 42600 =0. 5 5 11 11 11. ++ 9 -4.0 +++ 0 5 5 ++ 11. -10. 20040 6 12160 1 + 3.5 8.5 5 5 12 0 12
例2 测得2~7岁急性白血病患儿的血小板数X与出血 症状Y资料,研究血小板数X与出血症状Y之间联系 编号 X X 秩 Y Y秩 秩差 编号 X X秩 Y Y秩 秩差 1 54270 6 ++ 9 -3 7 74240 7 - 3.5 3.5 2 13790 2 ++ 9 -7 8 10640 0 8 - 3.5 4.5 3 16500 3 + 7 -4 9 12617 0 9 - 3.5 5.5 4 31050 4 - 3.5 0.5 10 12900 0 10 - 3.5 6.5 5 42600 5 ++ 9 -4.0 11 14388 0 11 +++ 11. 5 -0. 5 6 12160 1 ++ + 11. 5 -10. 5 12 20040 0 12 - 3.5 8.5