
第三章两样本位置检验3.1 两样本Brown-Mood中位数检3.2 Wilcoxon (Mann-Whitney)秩和检验Mx一My的点估计和区间估计3.3正态记分检验3.4成对数据的检验3.5McNemar检验3.6Cohen's Kappa 系数
第三章 两样本位置检验 3.1 两样本Brown-Mood中位数检 3.2 Wilcoxon (Mann-Whitney)秩和检验 的点估计和区间估计 3.3 正态记分检验 3.4 成对数据的检验 3.5 McNemar 检验 3.6 Cohen’s Kappa 系数

例3.1(数据:salary.txt,salary.sav)我国两个地区一些(分别为17个和15个)城镇职工的工资(元):地区1:6864730474777779789583488461955399191007310270115811347213600139621501917244地区2:102761053310633108371120911393118641204012642126751319913683140491406116079人们想要知道这两个地区平均城镇职工工资的中位数是否一样.这就是检验两个独立总体的位置参数是否相等的问题Ho:(μ1-μ2)=Do台Hi:(μμ2)≠Do正态假设下或Ho:(μ1-μ2)=Do台Hi:(μl-μ2)>Do检验问题或Ho:(μ1-μ2)= Do台H1:(μ1-μ2)<Do(-y) -Do~t(m+n-2)t=检验统计量SV=+mi(cia)2 +r=1(i -g)2其中,S2m+n-2
正态假设下 检验问题 检验统计量 其中

3.1两样本的Brown-Mood中位数检验·记Mx为样本Xi..,Xm的中位数My为样本Yi..,Yn的中位数MxY为样本Xi,,XmYi,,Yn的中位数xY总和bt=a+b>MxYa<Mxyn-bm-a(m+n)-(a+b)总和N=m+nmn此例中,总和X样本Y样本b=10观测值大于MxY的数目a=6t=a+b=16观测值小于MxY的数目n-b=5N-t=16m-a=1l总和m=17n=15N=m+n=32
3.1 两样本的Brown-Mood中位数检验 • 记 为样本 的中位数 为样本 的中位数 为样本 的中位数 此例中

·假设检验Ho:Mx =MyHi:Mx+ MyHo:Mx=MyHi:Mx My·记A为表中取值α位置样本的随机变量在零假设Ho:Mx=My下,A的条件分布为超几何分布:kIt-kP(A = k) =im+nT根据2min(P(A≤a),P(A≥a))或P(A≥a)或P(A≤a)值的大小,决定是否拒绝零假设,此检验称为BroWMood中位数检验.此例中用phyper(a,m,n,a+b)p 值为 P(A≤a)=phyper(6,17,15,16)=0.078
• 假设检验 • 记 为表中取值 位置样本的随机变量. 在零 假设 下, 的条件分布为超几何分布: 根据 或 或 值 的大小, 决定是否拒绝零假设. 此检验称为BrowMood中位数检验. 此例中用phyper(a,m,n,a+b), 值为 =phyper(6,17,15,16)=0.078

3.2Wilcoxon(Mann-Whitney)秩和检验及置信区间把样本X1,,Xm和Yi...Yn混在一起,并从小到大排列.令Ri为Yi在这 N个数中的秩.假设检验Ho:Mx=MyHi:Mx≠MyHo:Mx=MyHi:Mx My记 Wy=n=1R为Wilcoxon秩和检验.Wxy等于在所有可能的对子(ai,yi)中,满足ai<y的对子的个数记Wxy为Mann-Whitney检验T满足Wy = Wxy +n(n + 1)2可见Wxy+Wyx=nm
3.2 Wilcoxon (Mann-Whitney)秩和检验及 置信区间 • 把样本 和 混在一起, 并从小到 大排列. 令 为 在这 个数中的秩. 假设检验 记 为Wilcoxon秩和检验. 记 为 Mann-Whitney检验 满足 可见

在零假设下(没有对称要求):1P(Ri = k) =k = 1...., N;.N1k≠l,N(N-I)P(Ri=k,Ri=l):0,k=l.可以验证N2-1N+1E(R) :Var(R,) :212N+1Cov(Ri, R,) =(i≠j),12而Wy=Zn1Ri因此,mn(N +1)n(N +1)E(Wy) =Var(Wy) =212mn(N+1)mnVar(Wxy) =E(Wxy)212
• 在零假设下(没有对称要求): 可以验证 而 因此,

在m=n=2情况得到Wy和WxY的分布秩X和Y的6种组合YYXxx1Y2YXXYYxxYxYxY34xxYxYY022134WxY322410WYX55367Wy476553Wx4116216116-161-6概率Wilcoxon(Mann-Whitney)秩和统计量分布密度dwilc0x(0:4,2,2):0.167 0.167 0.333 0.167 0.167
在 情况得到 和 的分布 Wilcoxon(Mann-Whitney) 秩和统计量分布密度 dwilcox(0:4,2,2): 0.167 0.167 0.333 0.167 0.167

,大样本时,在零假设下Wxy-mn/2Z→ N(0, 1).Vmn(N+1)/12Wy -n(N +1)/2Z→ N(0, 1),Vmn(N+1)/12有打结情况下,下面统计量近似正态分布Wxy-mn/2Z=mn(Zi-1 t? - Di-1 ti)mn(N +1)1212(m+n)(m+n-1)
• 大样本时, 在零假设下 有打结情况下, 下面统计量近似正态分布

·例中.假设检验H。:Mx=MyHi:Mx<MyX(地区1)样本(m=17)的数据和它们在混合样本中的秩:6864730474777779789583488461955399191007310270115811347213600139621501917244627158910111824253032234而Y(地区2)样本(n=15)的数据和它们在混合样本中的秩为:102761053310633108371120911393118641204012642126751319913683140491406116079171516192021232628293112131422可得Wy=306,Wx=222及Wxy=186,Wyx=69.计算p 值 P(Wyx≤69)=0.0135或 P(WxY ≥ 186) = 0.0135决定是否拒绝零假设.(在水平0.015,拒绝零假设)(pwilcox(69,17,15)=0.0135, 1-pwilcox(185,17,15)=0.0135)
• 例中, 假设检验 可得 计算 p 值 或 决定是否拒绝零假设. (在水平0.015, 拒绝零假设) ( pwilcox(69,17,15)=0.0135, 1-pwilcox(185,17,15)=0.0135 )

的点估计和区间估计Mx-My用下面的步骤1. 计算 X,-Yj, i=1,2,.,m,j=1,2,..,n得到所有可能的mn 个差.2. *将这些差按从小到大排列得到:Di,...,DN,N=mn.3. 计算这 mn 对数的中位数,得点估计为-24794.查表或用R得到分位点Wα/2:得到置信区间(Dwa/2, Dmn+1-Wa/2). 例中m = 17,n = 15, Wα/2 = 76,得95%置信区间(qwilcox(0.025,17,15)=76)(Dwa/2,Dmn+1-Wa/2)=(D76,D255+1-76)=(D76,D180)=(-3916,-263)
的点估计和区间估计 用下面的步骤 1. 计算 得到所有可能的 个差. 2. 将这些差按从小到大排列得到: 3. 计算这 对数的中位数, 得点估计为-2479 4. 查表或用 R 得到分位点 得到置信区间 例中 得95%置信区间 ( qwilcox(0.025,17,15)=76 )