
第六章相关和回归6.1Spearman秩相关检验6.2 Kendall T 相关检验6.3Goodman-Kruskal'sr相关检验6.4Somers'd相关性检验6.5Theil非参数回归和几种稳健回归
第六章 相关和回归 6.1 Spearman秩相关检验 6.2 Kendall 相关检验 6.3 Goodman-Kruskal’s r 相关检验 6.4 Somers’ d 相关性检验 6.5 Theil非参数回归和几种稳健回归

对一列数(X1, Yi), (X2, Y2), ..., (Xn, Yn)Pearson相关系数Zn-1(Xi - X)(Yi - Y)Y/r=1(X; - X)?Zr=1(Yi - Y)2如果样本中的n个观测值是独立的,则Pearson相关系数是变量X和Y的相关系数Cov(X, Y)p = Corr(X,Y) =[Var(X)Var(Y)] 2的相容估计和渐进无偏估计,其中Cov(X, Y) = E[(X - E(X))(Y - E(Y))
对一列数 Pearson相关系数 如果样本中的n 个观测值是独立的, 则Pearson 相关系数是变量X 和Y 的相关系数 的相容估计和渐进无偏估计, 其中

如果(X,Y)为二元正态分布,如假设检验为Ho:p=0台Hi:p≠0则统计量N-2一2在零假设下,服从自由度为(n-2)的t 分布Pearson相关系数检验两变量的线性相关性Spearman秩相关系数和Kendall T 度量更加广义的单调(不一定线性)的关系
如果 为二元正态分布, 如假设检验为 则统计量 在零假设下,服从自由度为 的 分布. Pearson 相关系数检验两变量的线性相关性 Spearman秩相关系数和Kendall 度量更加广 义的单调(不一定线性)的关系

6.1 Spearman秩相关检验对一列数(X1, Y1), (X2, Y2), ..., (Xn, Yn记 Ri为 X,在观测 X 中的秩,而Si为 Y 在观测 Y 中的秩,可见,R=r=i Ri = (n +1)/2S= r=1 S; = (n +1)/2假设检验:Ho :X 和Y 不相关;H1:X和Y相关(Hi:X和Y正相关;H1:X和Y负相关)
对一列数 记 为 在观测 中的秩, 而 为 在观测 中的秩. 可见, 假设检验: 不相关; 相关 ( 正相关; 负相关) 6.1 Spearman秩相关检验

Spearman检验统计量:r=i(Ri - R)(Si - S)rs/Zr=1(Ri - R)2 Zr=1(Si - S)26r1 d?1-/n(n2 - 1)其中d2 = (Ri - Si)2可见-1≤rs≤1在零假设下,我们可以求出rs的精确分布
Spearman 检验统计量: 其中 可见 在零假设下, 我们可以求出 的精确分布

在大样本时,即当n一→α时,有Z = rs Vn- 1 → N(0, 1)在X或Y有结时,令u1,u2,...和V1,V2,…分别代表X和Y的各个结的观测值数目记U= (ug - uj), V= (u -vi)调整过的Spearman统计量为n(n2 - 1) - 6Z;(Ri - Si)2 - 6(U + V)rs =V[n(n2 - 1) - Un(n2 - 1) - V)

例:儿童死亡率和母亲死亡率X56113 17 100 31 360 880110 32 54 78 110 1600 230Y438126839262 5 112 17 106 1461345821X51030055 51055026017015562230760130480143Y837468422733529412359321108问:X和Y是否有相关性?
例: 问: 是否有相关性?

a8oO00o00200o50000oOgooo08oO0088?008o8OCC00080000O4o00oo000008m0000S6%%o(K)601C000Yo0o8oo808.8800o8o030000o800880000o0008000%00oO8000.008%Co8RC000020o008CO000008800园8600008Co000oO1-I02354co7500100015002000log(x)x线性相关性:人用log变换后数据更合适
线性相关性:用log变换后数据更合适

Ri,Si及di的数值78Ri41524 29 13 1.5 16.50 910.00 14.00 16.50 30 20.50S;82741025 28 9 2.5 21.00 20 6.50 11.50 18.00 30 17.009di1641441 2.251 16 1.0 20.25 121 12.256.250 12.25619R;5.001223 11.00261.50 27 18 25 2220.50 28 3.001S;14166.5024 11.50265.00 23 13 22 1519.00 29 2.50252516d;491. 02.250.252.2510.2512.25 16.25 9
的数值

ex6.example1=function((d=read.table("D:/Nonpara/DM1.txt")x=d[,2];y=d[,1]rx=rank(x);ry=rank(y)rsd=rbind(rx,ry,(rx-ry)^2)list(rsd,cor.test(x,y,meth=c("pearson""spearman"))))> ex6.example1()4829715241330 20.50rx1.516.50910.0014.0016.50825428927102.521.0030 17.00ry206.5011.5018.00411691441161.020.25012.25121 12.25 6.25 2.25272522191823 11.00261.5065.001220.50283.00rx2322151413265.00124 11.506.501619.002992.50ry925491625251 0.25012.252.25 16 2.250.251
ex6.example1=function(){ d=read.table("D:/Nonpara/DM1.txt") x=d[,2];y=d[,1] rx=rank(x);ry=rank(y) rsd=rbind(rx,ry,(rx-ry)^2) list(rsd,cor.test(x,y,meth=c("pearson", "spearman")))} > ex6.example1() rx 4 7 15 8 24 29 13 1.5 16.50 9 10.00 14.00 16.50 30 20.50 ry 8 4 27 10 25 28 9 2.5 21.00 20 6.50 11.50 18.00 30 17.00 16 9 144 4 1 1 16 1.0 20.25 121 12.25 6.25 2.25 0 12.25 rx 23 11.00 26 1.50 27 18 25 22 19 6 5.00 12 20.50 28 3.00 ry 24 11.50 26 5.00 23 13 22 15 14 1 6.50 16 19.00 29 2.50 1 0.25 0 12.25 16 25 9 49 25 25 2.25 16 2.25 1 0.25