第六章次数资料的统计分析 第三章述及,试验资料可分为两种类型,即数量性状资料和质量性状资料。对于质 量性状资料往往难于用数量水平表示,而只能用某种属性性状出现的次数表示。例如将 有芒白粒小麦与无芒红粒小麦杂交,在后代会出现有芒白粒、有芒红粒、无芒白粒、无 芒红粒等植株类型,每一种类型代表一种属性。对于每一种类型的个体,表达其属性程 度,用量值很难测定,而统计各种类型出现的次数却显然是合理而又方便的。 此外,数量性状有时也能用次数表示。例如:植株的高度,我们测量每一个个体的 高度得到的变数是连续性变数,如果把植株的高度按一定标准分成高、中、矮三种类型 计数各类型的株数,则得到的资料也是次数资料。另外,间断性变数也能用次数表示 例如在玉米群体中,按果穗的多少有0(空杆)、1(单穗)、2(双穗)等,如果记录 每株的穗数,就是间断性变数:如果统计空杆、单穗、双穗等类型出现的次数,就是一 种次数资料。 因此,不论质量性状或数量性状,都是可以用次数表示的。凡是试验结果用某种类 型出现的次数表示的,叫做次数资料或计数资料。 第一节次数资料的x测验 对次数资料的假设测验可通过x2分布进行,这里用到了x2分布的一个应用公式 x2=∑0-E)2 式中O为次数变数的实际观察次数,E为对应于O的理论次数,K为组数 本应用公式由 K. Pearson于1899年提出,并指出,当自由度大于1时,其与x2分 布相近似:当自由度大于1,且E不少于5时,其与x2分布近似相当好:仅当自由度 等于1时,两者稍有出入,应予以矫正。这一次数资料x2统计量的一大优点就是对所 研究的对象属于何种分布并无要求,这就使得它的应用范围相当广泛而简便,而且从应 用范围上讲,它既可应用于二项分布资料,也可应用于分类数大于2的多项分布 ( multinomial distribution)资料,因此,从统计功能上讲,其涵盖了后面将要介绍的二 项分布资料假设测验。 、次数资料适合性的假设测验 这一假设测验是测验某一次数资料的样本结果是否符合假设的理论次数分布,下面
1 第六章 次数资料的统计分析 第三章述及,试验资料可分为两种类型,即数量性状资料和质量性状资料。对于质 量性状资料往往难于用数量水平表示,而只能用某种属性性状出现的次数表示。例如将 有芒白粒小麦与无芒红粒小麦杂交,在后代会出现有芒白粒、有芒红粒、无芒白粒、无 芒红粒等植株类型,每一种类型代表一种属性。对于每一种类型的个体,表达其属性程 度,用量值很难测定,而统计各种类型出现的次数却显然是合理而又方便的。 此外,数量性状有时也能用次数表示。例如:植株的高度,我们测量每一个个体的 高度得到的变数是连续性变数,如果把植株的高度按一定标准分成高、中、矮三种类型, 计数各类型的株数,则得到的资料也是次数资料。另外,间断性变数也能用次数表示, 例如在玉米群体中,按果穗的多少有0(空杆)、1(单穗)、2(双穗)等,如果记录 每株的穗数,就是间断性变数;如果统计空杆、单穗、双穗等类型出现的次数,就是一 种次数资料。 因此,不论质量性状或数量性状,都是可以用次数表示的。凡是试验结果用某种类 型出现的次数表示的,叫做次数资料或计数资料。 第一节 次数资料的 2 测验 对次数资料的假设测验可通过 2 分布进行,这里用到了 2 分布的一个应用公式: − = k E O E X 1 2 2 ( ) (6.1) 式中 O 为次数变数的实际观察次数,E 为对应于 O 的理论次数,K 为组数。 本应用公式由 K. Pearson 于 1899 年提出,并指出,当自由度大于 1 时,其与 2 分 布相近似;当自由度大于 1,且 Ei 不少于 5 时,其与 2 分布近似相当好;仅当自由度 等于1时,两者稍有出入,应予以矫正。这一次数资料 2 统计量的一大优点就是对所 研究的对象属于何种分布并无要求,这就使得它的应用范围相当广泛而简便,而且从应 用范围上讲,它既可应用于二项分布资料,也可应用于分类数大于 2 的多项分布 (multinomial distribution)资料,因此,从统计功能上讲,其涵盖了后面将要介绍的二 项分布资料假设测验。 一、次数资料适合性的假设测验 这一假设测验是测验某一次数资料的样本结果是否符合假设的理论次数分布,下面
以实例讲解。 〔例6.1)某地农田杂草谱调查表明,在常规耕作方法下,田间三种主要杂草分布 比率为,一年生杂草:一年生阔叶:宿根性杂草=30:3040。今采用深翻后,得调查结果如 下,试测验杂草谱分布有无发生改变? 表6.1田间杂草谱分布适合性测验资料 杂草类别年生杂草年生阔叶宿根性杂草总次数 实测次数(O) 23 理论次数(E) 16.2 16.2 21.6 ①Ho:深翻后,杂草谱分布未发生改变:对HA:深翻后,杂草谱分布发生了改变, ②显著水平a=0.05 ③由(6.1)式计算x2值 (O-E)2(21-162)2(23-162)2(10-21.6)2 216=1051 ④推断:由于计算得x2=10.51>x2052=5.99故否定Ho而接受HA,即深翻后比之常 规耕作方法田间三种主要杂草分布比率发生了显著改变 对于上述测验,需作两点说明。 ①计算样本与理论分布适合性的x2分布自由度为该样本分类数减1。此来源于计算 各理论值E时,受到总次数确定的限制。 ②适合性测验的接受备择假设与统计上的x2>xa相联系,另,本假设测验为x2的 右尾一尾测验。书后附表4恰为x2分布的右尾概率临界值表,故通常无须标明有关一 尾的说明 、次数资料独立性的假设测验 当次数资料每一变数均具有两种不同的调查目标性状时,其原始资料成为二维数据 资料。其具有如表62的数据结构 此时,若欲对两类目标性状之间的独立性进行测验,即构成次数资料的独立性测验
2 以实例讲解。 〔例 6.1〕某地农田杂草谱调查表明,在常规耕作方法下,田间三种主要杂草分布 比率为,一年生杂草:一年生阔叶:宿根性杂草=30:30:40。今采用深翻后,得调查结果如 下,试测验杂草谱分布有无发生改变? 表 6.1 田间杂草谱分布适合性测验资料 杂 草 类 别 一年生杂草 一年生阔叶 宿根性杂草 总次数 实测次数(O) 理论次数(E) 21 16.2 23 16.2 10 21.6 54 54 ①HO:深翻后,杂草谱分布未发生改变;对 HA:深翻后,杂草谱分布发生了改变。 ②显著水平 = 0.05 ③由(6.1)式计算 2 值 10.51 21.6 (10 21.6) 16.2 (23 16.2) 16.2 ( ) (21 16.2) 3 2 2 2 1 2 2 = − + − + − = − = E O E ④推断:由于计算得 2 =10.51> 2 0.05,2 =5.99,故否定 HO 而接受 HA,即深翻后比之常 规耕作方法田间三种主要杂草分布比率发生了显著改变。 对于上述测验,需作两点说明。 ①计算样本与理论分布适合性的 2 分布自由度为该样本分类数减 1。此来源于计算 各理论值 E 时,受到总次数确定的限制。 ②适合性测验的接受备择假设与统计上的 2 > 2 相联系,另,本假设测验为 2 的 右尾一尾测验。书后附表 4 恰为 2 分布的右尾概率临界值表,故通常无须标明有关一 尾的说明。 二、次数资料独立性的假设测验 当次数资料每一变数均具有两种不同的调查目标性状时,其原始资料成为二维数据 资料。其具有如表 6.2 的数据结构。 此时,若欲对两类目标性状之间的独立性进行测验,即构成次数资料的独立性测验
表62次数资料独立性测验的数据结构 横向分类(A) 纵向分类(B) 总计R1 O1…O1…O1 RI O2…O21…O2c R Our Ri O2…On…One Rr 总计C1 C C2……C1…Cc 〔例6.2)测定不同密度下玉米每株穗数的分布,得结果于表63,试测验穗数分布 是否与密度大小有关? 表63不同密度下玉米每株穗数的分布 密度(万株/hm2) 空杆株 穗株 双穗及以上株 12(73.40) 224(219.60) 76(19.00) 3692 60(15221 49(45539) 39(3940) 246(21949) 659(65669) 28(56.82) 933 416(28890) 765(864.32) 47(74.78) 2196 3120 ①假设H:玉米每株穗数的分布与密度大小无关;对HA:玉米每株穗数的分布 与密度大小有关 ②显著水平a=0.05 ③计算 x2=∑∑ (O-E)=(12-7340)(60-152) (47-74.78) 3926 E 73.40 74.78 ④推断由于所得x2=39262>>x3056=12.59,故应否定Ho假设,而接受H,即 不同密度对玉米每株穗数分布有显著影响。 上面分析的几点说明 ①表63例中各变数实际观测值O与对应的理论值E并列给出,其中E列在实测 值On旁边的括号中。 ②E值的计算为两边缘总和的乘积与全部次数资料总和的商。即 Ei=(RixC)/n 如上例:E1=(312×734)/3120=7340
3 表 6.2 次数资料独立性测验的数据结构 横向分类(A) 纵向分类 (B) 总计 Ri 1 2 … j … C 1 2 ┆ i ┆ r O11 O21 ┆ Oi1 ┆ Or1 O12…O1j…O1c O22…O2j…O2c ┆ ┆ ┆ Oi2…Oij…Oic ┆ ┆ ┆ Or2…Orj…Orc R1 R2 ┆ Ri ┆ Rr 总计 Cj C1 C2… Cj …Cc = r c n Oij 1 1 〔例 6.2〕测定不同密度下玉米每株穗数的分布,得结果于表 6.3,试测验穗数分布 是否与密度大小有关? 表 6.3 不同密度下玉米每株穗数的分布 密度(万株/hm2) 空杆株 一穗株 双穗及以上株 总计 3 6 9 12 12(73.40) 60(152.21) 246(219.49) 416(288.90) 224(219.60) 549(455.39) 659(656.69) 765(864.32) 76(19.00) 39(39.40) 28(56.82) 47(74.78) 312 647 933 1228 总计 734 2196 190 3120 ①假设 H0: 玉米每株穗数的分布与密度大小无关; 对 HA:玉米每株穗数的分布 与密度大小有关。 ②显著水平 =0.05 ③计算 + − + − = − = r i c j i j i j i j E O E 152.21 (60 152.21) 73.40 (12 73.40) ( ) 2 2 2 2 … 392.62 74.78 (47 74.78) 2 = − + ④推断 由于所得 2 =392.62>> 2 0.05,6 =12.59,故应否定 HO 假设,而接受 HA,即 不同密度对玉米每株穗数分布有显著影响。 上面分析的几点说明 ①表 6.3 例中各变数实际观测值 Oij 与对应的理论值 Eij 并列给出,其中 Eij 列在实测 值 Oij 旁边的括号中。 ②Eij 值的计算为两边缘总和的乘积与全部次数资料总和的商。即 Eij=(Ri×Cj)/n 如上例:E11= (312×734)/3120=73.40
其计算依据来自于H二事件相互独立的假设和独立事件交事件的乘法定理。即 Ey=nx P(A,)xP(B,) R C =n×()×(→) R, C:/n ③独立性测验的接受备择假设与x2>x2相联系,与适合性测验相类似,也是x2分 布的右尾一尾测验。 ④由于独立性测验资料的两边缘总和均受到总和n的限制,故其每一向分类性状的 自由度均为其分类数减1。因此,独立性x2测验的自由度为两向分类自由度之乘积。即 v=(r-1)(c-1) 三、次数资料假设测验的连续性矫正 x2分布是连续性变数的分布,而次数资料属间断性变数资料,研究表明,当测验 资料的自由度等于1时,算得的x2值将有所偏大,因此应予以矫正,统计上称为连续 性矫正。既然次数资料连续性矫正的条件是自由度等于1,则仅有两种情况须作连续性 矫正,即适合性测验时资料分类数为二,独立性测验时两向分类数均为二的次数资料。 矫正的x2测验计算公式为 (-E-)2 适合性测验例 〔例6.3)以纯种的紫花豌豆与白花豌豆杂交,杂种F2代得到289株,其中紫花208 株,白花81株,试测验该结果是否符合3:1的理论比率? 表64豌豆花色遗传规律的适合性测验 表现型 实测株数(O) 里论株数 216.75 ①假设HoF2代紫花性状与白花性状分离符合3:1的遗传规律:对HA二性状分离 不符合3:1的比率。 ②显著水平 x=0.05
4 其计算依据来自于 HO 二事件相互独立的假设和独立事件交事件的乘法定理。即 R C n n C n R n E n P A P B i j j i ij i j / ( ) ( ) ( ) ( ) = = = ③独立性测验的接受备择假设与 2 > 2 相联系,与适合性测验相类似,也是 2 分 布的右尾一尾测验。 ④由于独立性测验资料的两边缘总和均受到总和 n 的限制,故其每一向分类性状的 自由度均为其分类数减 1。因此,独立性 2 测验的自由度为两向分类自由度之乘积。即 = (r −1)(c −1) 三、次数资料假设测验的连续性矫正 2 分布是连续性变数的分布,而次数资料属间断性变数资料,研究表明,当测验 资料的自由度等于 1 时,算得的 2 值将有所偏大,因此应予以矫正,统计上称为连续 性矫正。既然次数资料连续性矫正的条件是自由度等于 1,则仅有两种情况须作连续性 矫正,即适合性测验时资料分类数为二,独立性测验时两向分类数均为二的次数资料。 矫正的 2 测验计算公式为 = − − = k i i i i C E O E 1 2 2 ) 2 1 ( (6.2) 适合性测验例 〔例 6.3〕以纯种的紫花豌豆与白花豌豆杂交,杂种 F2 代得到 289 株,其中紫花 208 株,白花 81 株,试测验该结果是否符合 3:1 的理论比率? 表 6.4 豌豆花色遗传规律的适合性测验 表现型 紫 花 白 花 总 数 实测株数(O) 理论株数(E) 208 216.75 81 72.25 289 289 ①假设 HO:F2 代紫花性状与白花性状分离符合 3:1 的遗传规律;对 HA:二性状分离 不符合 3:1 的比率。 ②显著水平 =0.05
③统计计算,由于本资料为分类数为二的二项分布次数资料,应予连续性矫正 (0-E-)2(208-21675-5)2(81-722-)2 =1.2560 216.75 72.25 ④推断:由于计算结果x2=12560<x20s1=3.84,故应接受Ho,即认为此二性状符 合3:1的分离比率 独立性测验例 〔例6.4)病毒病会严重影响马铃薯的产量,有人曾硏究播种期早晚与马铃薯感染 病毒病的关系,得结果于表6.5,试予分析。 表65马铃薯播期与染病情况调査资料 播种期 8月1日 4(90.92) 57(6008) 8月15日 74(77.08) 4(5092) 128 总数 ①假设Ho:马铃薯染病情况与播期无关;对厶A:马铃薯染病情况与播期有关。 ②显著水平a=0.05 ③统计计算由于本独立性测验两向分类数均为二,应采用矫正方式 (-E-1 E 94-90.92-5)2(57-6008-5)2(74-7708-)2(54-5092-)2 90.92 60.08 7708 50.92 ④推断:由于计算得x=0.401x0=384,故应接受无效假设H,即上设计播期 的早晚与马铃薯发病情况无关。 应该注意到,在作次数资料的x2测验时,其测验的分辨能力是与观测总次数相关 的;也即,一般来讲较大的样本容量有较高的判断灵敏度。由于这一特性,所有次数调 査数据均不能简约成成数或百分数,而使其抽样容量成比例变小。同理,次数调查的某 项资料数小于5时,应将其与相邻组合并为一组,以避免过小 统计学家将上面讲述的测验方式进行整理,整理的公式与前面讲述的公式结果是同 的,但其优点是可直接用实测值进行计算,而无须计算各对应的理论值。这些整理公
5 ③统计计算,由于本资料为分类数为二的二项分布次数资料,应予连续性矫正。 1.2560 72.25 ) 2 1 ( 81 72.25 216.75 ) 2 1 ) ( 208 216.75 2 1 ( 2 2 2 2 = − − + − − = − − = E O E X C ④推断:由于计算结果 2 C =1.2560< 2 0.05,1 =3.84,故应接受 HO,即认为此二性状符 合 3:1 的分离比率。 独立性测验例 〔例 6.4〕 病毒病会严重影响马铃薯的产量,有人曾研究播种期早晚与马铃薯感染 病毒病的关系,得结果于表 6.5,试予分析。 表 6.5 马铃薯播期与染病情况调查资料 播 种 期 病 株 健 株 总 数 8 月 1 日 8 月 15 日 94(90.92) 74(77.08) 57(60.08) 54(50.92) 151 128 总 数 168 111 279 ①假设 HO: 马铃薯染病情况与播期无关;对 HA : 马铃薯染病情况与播期有关。 ②显著水平 = 0.05 ③统计计算 由于本独立性测验两向分类数均为二,应采用矫正方式。 0.401 50.92 ) 2 1 ( 54 50.92 77.08 ) 2 1 ( 74 77.08 60.08 ) 2 1 ( 57 60.08 90.92 ) 2 1 ( 94 90.92 ) 2 1 ( 2 2 2 2 2 2 = − − + − − + − − + − − = − − = E O E C ④推断:由于计算得 2 C =0.401< 2 0.01,1 =3.84,故应接受无效假设 HO,即上设计播期 的早晚与马铃薯发病情况无关。 应该注意到,在作次数资料的 2 测验时,其测验的分辨能力是与观测总次数相关 的;也即,一般来讲较大的样本容量有较高的判断灵敏度。由于这一特性,所有次数调 查数据均不能简约成成数或百分数,而使其抽样容量成比例变小。同理,次数调查的某 一项资料数小于 5 时,应将其与相邻组合并为一组,以避免过小。 统计学家将上面讲述的测验方式进行整理,整理的公式与前面讲述的公式结果是同 一的,但其优点是可直接用实测值进行计算,而无须计算各对应的理论值。这些整理公
式列在下面表66中,供使用者参考 表66各类x2测验同功能应用公式 公式 说明 1.分类数为2的适 合性测验O1O2是否 01-nO2|-( 为r:1 r(1+O2) n:总次数 2.分类数大于2的 x=∑2 m:O的理论比率,如对 多项分布资料的适合 i=l mi xn 93:3:1作测验则 性测验 3.2行2列资料的独 (01O2-O12O21|- C:j列总次数。 立性测验 CIC2R,R2 R:i行总次数。 4.2行c列(c>2) 次数资料的独立性测 同上 R,R2 5.r行c列(r>2,c>2) 次数资料的独立性测 x-n∑-1 同上 i=1j=1 第二节二项分布百分数资料的假设测验 在农业科学研究中经常遇到“非此即彼”的性状,如害虫经药物处理后只有死和活 两种情况,每一害虫不是死就是活,两者必居其一。又如种子的发芽试验,每一种子不 是发芽就是不发芽,等等。这类试验资料可以用次数表示,也可以用百分数表示,都服 从二项分布。二项分布百分数的假设测验从理论上讲应按二项分布进行,即从(p+q) 的展开式中求出所需的概率,然后根据概率的大小作出推断。这种方法虽然比较精确, 但很麻烦,所以常用正态近似法来代替。因为二项分布中,在样本容量n较大,P不过 分小,叩和m又均大于5时,二项分布趋向于正态分布。因此,在符合正态近似的条 件下(参见48)可以将百分数资料按正态分布处理,从而作出近似的测验 一、单个样本百分数的假设测验 这是测验一个样本百分数P和某一理论百分数P0的差异显著性,或者说是测验p 的总体百分数p是否等于Po 由于二项成数(百分数)分布的标准误为 6
6 式列在下面表 6.6 中,供使用者参考。 表 6.6 各类 2 测验同功能应用公式 类 型 公 式 说 明 1.分类数为 2 的适 合性测验 O1:O2 是否 为 r:1 2.分类数大于 2 的 多项分布资料的适合 性测验 3.2 行 2 列资料的独 立性测验 4.2 行 c 列(c>2) 次数资料的独立性测 验 5.r 行 c 列(r>2,c>2) 次数资料的独立性测 验 ( ) ) 2 1 ( 1 2 2 1 2 2 r O O r O rO C + + − − = = − = k i i i n m n O 1 2 2 ( ) 1 2 1 2 2 11 22 12 21 2 ) 2 ( C C R R n O O O O C − − = = − n R C O R R n j j 2 1 2 1 1 2 2 2 ( ) 2=n − = = r i c j i j ij R C O 1 1 2 ( ) 1 n: 总次数。 mi: Oi 的理论比率,如对 9:3:3:1 作测验则 m1= 16 9 。 Cj: j 列总次数。 Ri: i 行总次数。 同上。 同上。 第二节 二项分布百分数资料的假设测验 在农业科学研究中经常遇到“非此即彼”的性状,如害虫经药物处理后只有死和活 两种情况,每一害虫不是死就是活,两者必居其一。又如种子的发芽试验,每一种子不 是发芽就是不发芽,等等。这类试验资料可以用次数表示,也可以用百分数表示,都服 从二项分布。二项分布百分数的假设测验从理论上讲应按二项分布进行,即从(p+q)n 的展开式中求出所需的概率,然后根据概率的大小作出推断。这种方法虽然比较精确, 但很麻烦,所以常用正态近似法来代替。因为二项分布中,在样本容量 n 较大,p 不过 分小,np 和 nq 又均大于 5 时,二项分布趋向于正态分布。因此,在符合正态近似的条 件下(参见 4.8)可以将百分数资料按正态分布处理,从而作出近似的测验。 一、单个样本百分数的假设测验 这是测验一个样本百分数 p ˆ 和某一理论百分数 0 p 的差异显著性,或者说是测验 p ˆ 的总体百分数 p 是否等于 0 p 。 由于二项成数(百分数)分布的标准误为
故有 p-p (6.3) 由于二项分布是间断性分布,分布是连续性分布,因此用u测验法处理二项分布 资料时,结果会有出入,补救的方法是采用连续性矫正,在作连续性矫正时公式可表达 为 F-pl (64) 如果样本容量很大,叩是m都大于30,二项分布更逼近正态分布,在此情况下, 就可以不进行连续性矫正。 〔例65)某种子站引进一批小麦种子,平均发芽率是90%,为了防止种子带菌 对这批种子进行药物处理,现从处理后的种子中,随机抽出400粒进行发芽试验,结果 发芽种子数356粒,不发芽44粒。问药物处理对种子发芽率是否有影响? 356 这里p0=090,p==0.89,n=40 ①假设H:p=P0=0.9,即处理后的小麦种子平均发芽率仍为90%;对HA:p≠ P ②显著水平a=0.05 ③测验计算p=0.90,q=1-p=1-0.90=0.10 p=,/090×0.10 =0.015 400 n=p-P=089-090= 0.667 0.015 由于叩、m均大于30,故可不作连续性矫正。 ④推断实得4<005(196),故接受H,推断用药物处理小麦种子对发芽率没 有影响。 〔例66)某种农药防治粘虫,平均粘虫死亡率为60%,现研制一种新农药进行试 验,在50头供试粘虫中,结果有38头死亡,试测验新农药的杀虫效果是否不同于原农 药 这里p0=060,p 38 0.76,n=50
7 n pq P = 故有 P p p u − = ˆ (6.3) 由于二项分布是间断性分布, u 分布是连续性分布,因此用 u 测验法处理二项分布 资料时,结果会有出入,补救的方法是采用连续性矫正,在作连续性矫正时公式可表达 为 P c n p p u 0.5 ˆ − − = (6.4) 如果样本容量很大,np 是 nq 都大于 30,二项分布更逼近正态分布,在此情况下, 就可以不进行连续性矫正。 〔例 6.5〕 某种子站引进一批小麦种子,平均发芽率是 90%,为了防止种子带菌, 对这批种子进行药物处理,现从处理后的种子中,随机抽出 400 粒进行发芽试验,结果 发芽种子数 356 粒,不发芽 44 粒。问药物处理对种子发芽率是否有影响? 这里 0 p =0.90, p ˆ 0.89 400 356 = = ,n=400 ①假设 H0: p = 0 p =0.9, 即处理后的小麦种子平均发芽率仍为 90%;对 HA: p ≠ 0 p 。 ②显著水平 = 0.05 ③测验计算 p =0.90, q =1- p =1-0.90=0.10 400 0.900.10 P = =0.015 0.015 ˆ 0 0.89 − 0.90 = − = p p p u = -0.667 由于 np、nq 均大于 30,故可不作连续性矫正。 ④推断 实得 u u0.05 (1.96),故接受 H0,推断用药物处理小麦种子对发芽率没 有影响。 〔例 6.6〕 某种农药防治粘虫,平均粘虫死亡率为 60%,现研制一种新农药进行试 验,在 50 头供试粘虫中,结果有 38 头死亡,试测验新农药的杀虫效果是否不同于原农 药。 这里 p0 = 0.60, p ˆ 0.76 50 38 = = ,n=50
①假设Hp=p0=060;对HAp≠p ②显著水平a=0.0 ③测验计算p=0.60,q=1-p=1-060=0.40 p_060×040=0069 93 庐-p 0.76-060 30=2164 0.0693 由于m、m都大于5,但myl0,故否定h,推断新农药的杀虫效果与原农药有 显著的不同。 〔例67〕)调査某大麻开花的株数为陌6株,其中36株为雌株,40株为雄株。根据 遗传学的原理,雌雄株的比例为1:1,即雌株与雄株的理论百分数各为50%。试测验所 调查的结果是否符合雌雄1:1的理论比率。 ①假设Ho:p=05,即该大麻雌雄株符合1:1的理论比率,雌株的百分率是50%; HA:p≠0. ②显著水平 ③测验计算p==0.474,m=76p=q=0.5 =0.057 n 76 l=P-P0474-05 0.057 此例叩、n都大于30,故不需作连续性矫正 ④推断实得冋<uas(19%6),故接受H,推断该大麻雌雄株分离符合11的理论 比率,雌株百分数p=0474和p=0.5的相差归属于抽样误差。 以上资料也可直接用次数进行测验,第4章讲过,二项分布资料可用百分数(成数) 表示也可用次数(总和数)表示。上面的例子都是用百分数表示的测验方法,它们也可 以直接用次数进行测验。当二项资料用次数表示时,二项次数分布的平均数H2=四p 标准差σ2=√p,因此,有
8 ①假设 H0:p=p0=0.60;对 HA:p≠p0 ②显著水平 = 0.05 ③测验计算 p =0.60, q =1- p =1-0.60=0.40 0.0693 50 0.60 0.40 = = = n pq P 2.164 0.0693 30 0.5 0.76 0.60 0.5 ˆ = − − = − − = P c n p p u 由于 np、nq 都大于 5,但 nq u0.05 ,故否定 H0,推断新农药的杀虫效果与原农药有 显著的不同。 〔例 6.7〕 调查某大麻开花的株数为 76 株,其中 36 株为雌株,40 株为雄株。根据 遗传学的原理,雌雄株的比例为 1:1,即雌株与雄株的理论百分数各为 50%。试测验所 调查的结果是否符合雌雄 1:1 的理论比率。 ① 假设 H0: p=0.5,即该大麻雌雄株符合 1:1 的理论比率,雌株的百分率是 50%; 对 HA: p ≠0.5 ②显著水平 = 0.05 ③测验计算 p ˆ 0.474 76 36 = = ,n=76 p=q=0.5 0.057 76 0.5 0.5 = = = n pq p 0.057 ˆ 0474 − 0.5 = − = p p p u =-0.46 此例 np、nq 都大于 30,故不需作连续性矫正。 ④推断 实得 u u0.05 (1.96),故接受 H0,推断该大麻雌雄株分离符合 1:1 的理论 比率,雌株百分数 p ˆ = 0.474 和 p =0.5 的相差归属于抽样误差。 以上资料也可直接用次数进行测验,第 4 章讲过,二项分布资料可用百分数(成数) 表示也可用次数(总和数)表示。上面的例子都是用百分数表示的测验方法,它们也可 以直接用次数进行测验。当二项资料用次数表示时,二项次数分布的平均数 x = np , 标准差 x = npq ,因此,有
(6.5) 当需作连续性矫正时 -n-0.5 (66) 例6.7资料可直接用次数进行测验 这里=76,理论比率P=05,雌株理论株数应为叩。=76×05=38株,雄株理论株 数也为76×0.5=38株。 ①假设Ho:np=38株;对HA:四≠38株 ②显著水平a=0.05 ③测验计算=√mg=√76×0.5×0.5=4359(株) p-四36-38 4.359 结果等同于用百分数进行测验 此例四、№q都大于30,不需进行连续性矫正,当需进行连续性矫正时 38-0.5 0.34 4.359 矫正后的u值小于未矫正的问 二、两个样本百分数相比较的假设测验 两个样本百分数相比较的差异显著性测验是测验两个样本百分数p1和p2所属的总 体百分数p1和p是否相等,这类测验在实际应用中更为普遍 在试验中总体的理论百分数p是未知的,而需比较的是样本的结果,由于这种比较 的样本大小不同,所以就不能用样本中某性状出现的次数进行比较,只能用百分数来比 较。例如,两个小麦品种发芽率比较,甲品种试验100粒,发芽95粒:乙品种试验150 粒,发芽120粒,这就不能拿95粒与120粒相比较,必须在百分数的基础上进行比较。 与单个样本百分数测验一样,在两个样本百分数差异显著性测验中,如果两个样本 的叩和mq35,可用正态近似法进行测验。这种测验是假设两个总体百分数相等 p-P=0),两个样本百分数分别从两个二项总体抽出,差数为p1-P2,它服从平均数 为零,标准差为n-B的差数分布,用这个分布测验样本百分数差数是否显著或两个总 体百分数是否相等 两个样本百分数差数标准误为
9 x np np u − = ˆ (6.5) 当需作连续性矫正时 x c np np u ˆ − − 0.5 = (6.6) 例 6.7 资料可直接用次数进行测验。 这里 n=76,理论比率 0 p =0.5,雌株理论株数应为 0 np =76×0.5=38 株,雄株理论株 数也为 76×0.5=38 株。 ①假设 H0: np=38 株;对 HA: np ≠38 株 ②显著水平 = 0.05 ③测验计算 x = npq = 76 0.5 0.5 = 4.359 (株) x np np u − = ˆ 0.46 4.359 36 38 = − − = 结果等同于用百分数进行测验。 此例 np、nq 都大于 30,不需进行连续性矫正,当需进行连续性矫正时 4.359 36 − 38 − 0.5 uc = =0.34 矫正后的 uc 值小于未矫正的 u 。 二、两个样本百分数相比较的假设测验 两个样本百分数相比较的差异显著性测验是测验两个样本百分数 1 p ˆ 和 2 p ˆ 所属的总 体百分数 p1 和 p2 是否相等,这类测验在实际应用中更为普遍。 在试验中总体的理论百分数 p 是未知的,而需比较的是样本的结果,由于这种比较 的样本大小不同,所以就不能用样本中某性状出现的次数进行比较,只能用百分数来比 较。例如,两个小麦品种发芽率比较,甲品种试验 100 粒,发芽 95 粒;乙品种试验 150 粒,发芽 120 粒,这就不能拿 95 粒与 120 粒相比较,必须在百分数的基础上进行比较。 与单个样本百分数测验一样,在两个样本百分数差异显著性测验中,如果两个样本 的 np 和 nq >5,可用正态近似法进行测验。这种测验是假设两个总体百分数相等 (p1-p2=0),两个样本百分数分别从两个二项总体抽出,差数为 1 p ˆ - 2 p ˆ ,它服从平均数 为零,标准差为 P1−P2 的差数分布,用这个分布测验样本百分数差数是否显著或两个总 体百分数是否相等。 两个样本百分数差数标准误为
P1q p2q P-P (6.7) 式中:q1=(1-P1),q2=(1-P2),Pq、Pq2分别为两个样本百分数p1和p2所属 的两个二项总体的方差 但在一般情况下,二项总体方差是未知的,在假定p1=P2=P的情况下,用两个 样本百分数p和P2的加权平均数p来取代式(67)中的P和P2,q取代q1和q2° =与+x2 n1+n2 q=1-p 上式中的x1和x2分别代表两个样本某属性性状出现的次数,n和n2为两样本的样 本容量。因而两样本百分数差数标准误和u值分别为 =p( (6.9) P1- (6.10) P1-P2 〔例68)调査某地某小麦品种受白粉病感染的情况,调査高坡地该小麦品种368 株,发现感病307株,感病率P1=307/368=0834;调查低洼地该小麦品种315株, 发现感病290株,感病率p2=290/315=0.921。试测验两块麦田的感病率有无显著 差异? ①假设H:p1=P2,即该品种在高坡地和低洼地种植的总体感病率相等;对H:p p ②显著水平 ③测验计算 x1+x2307+290 0.874 n1+n2368+315 q=1-p=1-0.874=0.126 )=10.874×0.126( 0.0255 368315 0.834-0921 341 0.0255 ④推断实得=341>00(1.96),否定h,接受HA。推断该小麦品种在高坡 地种植与在低洼地种植感病率有显著差异。 〔例69)现研究一种新型有机磷杀虫农药,在1000头虫子中杀死810头,原类 似的杀虫农药在1000头虫子中杀死678头。问新型的有机磷杀虫农药杀虫率是否高于
10 2 2 2 1 1 1 1 2 n p q n p q P −P = + (6.7) 式中: (1 ) q1 = − p1 , (1 ) q2 = − p2 ,p1q1、p2q2 分别为两个样本百分数 1 p ˆ 和 2 p ˆ 所属 的两个二项总体的方差。 但在一般情况下,二项总体方差是未知的,在假定 p1 = p2 = p 的情况下,用两个 样本百分数 1 p ˆ 和 2 p ˆ 的加权平均数 p 来取代式(6.7)中的 p1 和 p2 ,q 取代 q1 和 q2 。 1 2 1 2 n n x x p + + = q =1− p (6.8) 上式中的 1 x 和 2 x 分别代表两个样本某属性性状出现的次数, n1 和 n2 为两样本的样 本容量。因而两样本百分数差数标准误和 u 值分别为 ) 1 1 ( 1 2 ˆ ˆ 1 2 n n s pq P P = + − (6.9) 1 2 1 2 ˆ ˆ p p s p p u − − = (6.10) 〔例 6.8〕 调查某地某小麦品种受白粉病感染的情况,调查高坡地该小麦品种 368 株,发现感病 307 株,感病率 1 p ˆ = 307/368 = 0.834 ;调查低洼地该小麦品种 315 株, 发现感病 290 株,感病率 2 p ˆ = 290/315 = 0.921 。试测验两块麦田的感病率有无显著 差异? ①假设 H0: p1 = p2 ,即该品种在高坡地和低洼地种植的总体感病率相等;对 HA: p1 ≠ p2 ②显著水平 = 0.05 ③测验计算 0.874 368 315 307 290 1 2 1 2 = + + = + + = n n x x p q =1− p =1−0.874 = 0.126 ) 0.0255 315 1 368 1 ) 0.874 0.126( 1 1 ( 1 2 ˆ ˆ 1 2 = + = + = − n n s pq P P 3.41 0.0255 0.834 0.921 = − − u = ④推断 实得 41 0.05 u = 3. u (1.96),否定 H0,接受 HA。推断该小麦品种在高坡 地种植与在低洼地种植感病率有显著差异。 〔例 6.9〕 现研究一种新型有机磷杀虫农药,在 1000 头虫子中杀死 810 头,原类 似的杀虫农药在 1000 头虫子中杀死 678 头。问新型的有机磷杀虫农药杀虫率是否高于