
第四章多样本数据模型样本相互独立4.1Kruskal-Wallis秩和检验4.2正态记分检验*4.3Jonckheere-Terpstra检验样本不独立4.4区组设计数据分析回顾4.5完全区组设计:Friedman秩和检验4.6Kendall协同系数检验4.7完全区组设计:Cochran检验4.8完全区组设计:Page检验4.9不完全区组设计:Durbin检验
第四章 多样本数据模型 样本相互独立 4.1 Kruskal-Wallis 秩和检验 4.2 正态记分检验* 4.3 Jonckheere-Terpstra检验 样本不独立 4.4 区组设计数据分析回顾 4.5 完全区组设计:Friedman秩和检验 4.6 Kendall协同系数检验 4.7 完全区组设计:Cochran检验 4.8 完全区组设计:Page检验 4.9 不完全区组设计:Durbin检验

S秩和检验4.1Kruskal-Wallis例4.1在一项健康实验中,三组人有三种生活方式他们的减肥效果如下表:231生活方式7.39.03.7一个月后4.93.75.27.1减少的重量3.05.33.95.78.7(单位500g)2.76.5554ni=问:这三种生活方式的减肥效果(位置参数)是否相同?
4.1 Kruskal-Wallis 秩和检验 例4.1 在一项健康实验中, 三组人有三种生活方式, 他们的减肥效果如下表: 问:这三种生活方式的减肥效果(位置参数)是否相 同?

此类问题的数据的一般形式为:k2111C21Ck1C12C22k2.....C1n12n2Cknk人N=Zh=1ni.样本量总数为
此类问题的数据的一般形式为: 样本量总数为

在所有样本独立且来自等方差的正态总体的假设下,问题归结为验证总体均值是否相同Ho:μi=...=μk;H1:“不是所有的都相等."检验统计量为Zh=1 n;(; -a)2/(k - 1)MSTFMSEEh=1En=i(aij -z;)2/(N-k)这里; =n=iCi /ni, =h=in=i ai/N.F在Ho下的分布为自由度为(k一1,N一k)的F分布
在所有样本独立且来自等方差的正态总体的假设 下, 问题归结为验证总体均值是否相同. 检验统计量为

假定k总体有连续分布F1,….,Fk(无正态假定)Ho : Fi(α) = ... = Fk(α) = F(c);H1:F(α)=F(α一)i=1,..,k,位置参数并不全部相同这个问题写成线性模型形式:Cii=μ+i+ij,j=l,...,ni及i=l,..,k,这里误差是独立同分布的,检验问题Ho:01=02=...=0kH。:至少Ho的诸等式中有一个不成立类似于两样本Wilcoxon秩和检验的统计量的构造
假定 总体有连续分布 (无正态假定 ) 这个问题写成线性模型形式: 这里误差是独立同分布的. 检验问题 类似于两样本Wilcoxon秩和检验的统计量的构造

1.将K组数据混合排序,得到各观测值在混合样本中的秩,记第组样本的第个观测值订的秩为 Rii·对各组观测值的秩求和得Ri=n=i Ri, i=l,..,k.该组数据的平均秩为 R; = Ri/ni:所有数据的平均秩为 R=Z=1 Ri/N=(N+1)/2.对于固定的样本n1,,nk,共有M = N!/ II'=1 ni!种混合排序结果,在零假设下,每种结果出现的概率应该相等,概率值为1/M
1. 将 组数据混合排序, 得到各观测值在混合 样本中的秩. 记第 组样本的第 个观测值 的 秩为 . 对各组观测值的秩求和得 该组数据的平均秩为 所有数据的平均秩为 对于固定的样本 , 共有 种混合排序结果. 在零假设下, 每种结果出现的概 率应该相等, 概率值为

2.Kruskal-Wallis统计量kh1212R2- 3(N + 1)ZZCn;(R; - R)?=HN(N + 1)N(N+1)ni=1i=1在零假设Ho :Fi(α) =···= F(α) = F(α)下,按每种混合排序结果的概率为1/M,可计算Kruskal-Wallis统计量H ,在零假设的分布.(n1, n2, n3)书上对不同和水平α,给出了满足P(H ≥)= α. 的临界值c表
2. Kruskal-Wallis统计量 在零假设 下, 按 每种混合排序结果的概率为 , 可计算 Kruskal-Wallis 统计量 , 在零假设的分布. 书上对不同 和水平 , 给出了满 足 的临界值 c 表

3. 将观测值代入统计量H,得到相应的数值4.比较零分布和观测值相应的统计量H的值,5.做出是否拒绝零假设的决定.在N大时,并且对每个i,ni/N趋于某个非零数入i≠0统计量H在零假设下近似于x(%-1)分布另外在大样本时,统计量Zh=1 n N+1Ri-/(k-1)2F*Zh=1 Zn=i(Rij - R)2/(N - k)近似于F(k-1,N-k)分布
3. 将观测值代入统计量 , 得到相应的数值. 4. 比较零分布和观测值相应的统计量 的值. 5. 做出是否拒绝零假设的决定

123生活方式例中,3.7(3.5)7.3 (12)9.0 (14)一个月后3.7(3.5)5.2 (7)4.9 (6)减少的重量3.0(2)5.3 (8)7.1 (11)(5)(单位500k)3.95.7 (9)8.7 (13)及秩2.7(1)6.5 (10)15秩和Ri46443秩平均R119.2Ho: Q1= 02= U3;H1:至少有一个等式不成立这里N=14.算出H大约等于9.4114用精确检验方法得到p-值:0.001347858查表找到P(H≥8.52)=0.0048而P(H≥9.51)=0.001031(用大样本近似,p-值0.00895)
例中, 至少有一个等式不成立 用精确检验方法得到p-值:0.001347858 查表 ( 用大样本近似,p-值0.00895)

KW.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114)# this programis for m1=5, m2=5, and m3 can be any integerm=Hvalue))/nn;y10^{-12)[aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(tempc,1-(i-1)/nn)))out<-cbind(aaa,tempc)list(c("(m1,m2,m3)"=c(m1,m2,m3),"H"=Hvalue,"pval"=pvalue),out))
KW.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){ # this program is for m1=5, m2=5, and m3 can be any integer m=Hvalue))/nn; y10^{-12}) {aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(tempc,1-(i-1)/nn)}} out<-cbind(aaa,tempc) list(c("(m1,m2,m3)"=c(m1,m2,m3),"H"=Hvalue,"pval"=pvalue),out)}