第一章绪论 1.1为什么要学习“生物统计”? 答:因为正确的设计及统计分析方法,能最大限度地减少试验误差。以便看清事物 间有否本质差异和内在联系,去伪存真,保证统计结论有一定的精确度和靠度。 1.2农业和生物科学领域中进行科学研究的目的是什么? 答:科学研究是人类认识自然、改造自然、服务社会的原动力,其目的在于探求新 的知识、理论、方法、技术和产品。农业和生物学领域的科学研究推动了人们认识 生物界的各种规律,促进人们发掘出新的农业技术和措施,从而不断提高农业生产 水平,改进人类生存环境 1.3简述科学研究的基本过程和方法。 答:科学研究的基本过程:首先根据本人的观察(了解)或前人的观察(通过文献)对 所研究的命题形成一种认识或假说:其次,根据假说所涉及的内容安排相斥性的试 验或抽样调查:最后根据试验或调查所获的资料进行推理,肯定或否定或修改假说, 从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使 所获得的认识或理论逐步发展、深化。 科学研究的基本方法包括选题、文献、假说、假说的检验、试验的规划与设计 1.4什么是试验误差?随机误差与系统误差有何区别? 答:在试验中实际观察值与其相应真值的偏差称为试验误差。系统误差:由于在 观测中因仪器不准,工作者的习惯和偏向等原因所引起的观察值偏大或偏小的差 异(有方向性)。随机误差:由于实验中许多无法控制的偶然因素所造成的实验结 果和正式结果之间产生的误差,叫随机误差(又称偶然误差):系统误差使数据偏 离了其理论真值:偶然误差使数据相互分散。因而系统误差影响了数据的准确性, 准确性是指观测值与其理论真值间的符合程度:而偶然误差影响了数据的精确性。 第二章田间试验的设计与实施 2.1田间试验的基本概念和任务是什么? 答:田间试验是指在自然、生产条件下进行的试验。 任务:在大田自然环境条件下研究新的品种和新的生产技术,客观地评定高产品种 及其适应区域,正确定最有效的措施及其范围,使科研成果充分发挥其在农业增产 上的作用。 2.2简述试验误差的来源及其控制途径。 答:试验误差的主要来源有4个:试验材料固有的差异、试验条件不一致、操作技 术不一致、偶然性因素的影响。 控制试验误差的途径:选择同质一致的试验材料:改进操作管理制度,使之标准化:
第一章 绪论 1.1 为什么要学习“生物统计”? 答:因为正确的设计及统计分析方法,能最大限度地减少试验误差。以便看清事物 间有否本质差异和内在联系,去伪存真,保证统计结论有一定的精确度和靠度。 1.2 农业和生物科学领域中进行科学研究的目的是什么? 答:科学研究是人类认识自然、改造自然、服务社会的原动力,其目的在于探求新 的知识、理论、方法、技术和产品。农业和生物学领域的科学研究推动了人们认识 生物界的各种规律,促进人们发掘出新的农业技术和措施,从而不断提高农业生产 水平,改进人类生存环境。 1.3简述科学研究的基本过程和方法。 答:科学研究的基本过程:首先根据本人的观察(了解)或前人的观察(通过文献)对 所研究的命题形成一种认识或假说;其次,根据假说所涉及的内容安排相斥性的试 验或抽样调查;最后根据试验或调查所获的资料进行推理,肯定或否定或修改假说, 从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使 所获得的认识或理论逐步发展、深化。 科学研究的基本方法包括选题、文献、假说、假说的检验、试验的规划与设计 1.4 什么是试验误差?随机误差与系统误差有何区别? 答: 在试验中实际观察值与其相应真值的偏差称为试验误差。系统误差:由于在 观测中因仪器不准,工作者的习惯和偏向等原因所引起的观察值偏大或偏小的差 异(有方向性)。随机误差:由于实验中许多无法控制的偶然因素所造成的实验结 果和正式结果之间产生的误差,叫随机误差(又称偶然误差);系统误差使数据偏 离了其理论真值;偶然误差使数据相互分散。因而系统误差影响了数据的准确性, 准确性是指观测值与其理论真值间的符合程度;而偶然误差影响了数据的精确性。 第二章 田间试验的设计与实施 2.1 田间试验的基本概念和任务是什么? 答:田间试验是指在自然、生产条件下进行的试验。 任务:在大田自然环境条件下研究新的品种和新的生产技术,客观地评定高产品种 及其适应区域,正确定最有效的措施及其范围,使科研成果充分发挥其在农业增产 上的作用。 2.2 简述试验误差的来源及其控制途径。 答:试验误差的主要来源有4个:试验材料固有的差异、试验条件不一致、操作技 术不一致、偶然性因素的影响。 控制试验误差的途径:选择同质一致的试验材料;改进操作管理制度,使之标准化;
控制引起差异的外界主要因素:(1)选择肥力均匀的试验地:(②)试验中采用适当的 小区技术:(3)应用良好的试验设计和相应的统计分析。 2.3何谓试验设计(狭义)?简述试验设计三原则及其作用。 答:试验设计(狭义)指小区技术,特别是重复区和试验小区的排列方法。 试验设计三原则:重复、局部控制、随机排列 重复:指试验中,每处理有2个或2个以上的试验单位(小区)。 随机排列(随机化):指任一处理安排到哪一个试验单位(小区)是随机的。 局部控制(区组化):就是分范围分地段控制非处理因素,使其对个处理的影响趋 于最大程度的一致。或局部控制指通过对小区的合理安排,把试验误差控制在一个 局部的范围内的做法。 重复作用:估计、诚少试验误差。 局部控制:进一步减少试验误差。 随机排列:正确估计试验误差。 2.4试验设计的目的是什么?试验设计的基本原则是什么,各有什么作用? 答:进行试验设计的目的,在于减少试验误差,提高试验的准确度和精确度,使试 验结果正确可靠。为了有效地控制和降低试验误差,试验设计必须遵循重复、随机 及局部控制三条基本原则。重复的最主要作用是估计试验误差,降低试验误差,因 而可提高试验的精确度:随机的主要作用是无偏的试验估计误差:局部控制可以进 一步降低试验误差。 2.5简述田间试验的基本要求。 答:(1)式验目的要明确:(2)式验条件要有代表性,试验条件应能代表将来准备 推广试验结果的地区的自然条件(如试验地士壤种类、地势、 气象条件 等)与农业条件(如轮作制度、农业结构、施肥水平等):(3)试验结果要可靠(试 验的准确度和精确度两个方面):(4)试验结果要能够重演。 2.6什么是对照?田间试验中为什么要设置对照区?如何设置对照? 答:田间试验应设置对照区(check 以CK表示), 作为处理比较的标准。对照应该 是当地推广良种或最广泛应用的栽培技术措施。设置对照区的目的是:(1)便于在 田间对各处理进行观察比较时作为衡量品种或处理优劣的标准:(2)用以估计和矫 正试验田的土壤差异。通常在一个试验中只有一个对照,有时为了适应某种要求, 可同时用两个各具不同特点的处理作对照 2.7田间试验中为什么要在试验地周围设置保护行?
控制引起差异的外界主要因素:(1)选择肥力均匀的试验地;(2)试验中采用适当的 小区技术;(3)应用良好的试验设计和相应的统计分析。 2.3 何谓试验设计(狭义)?简述试验设计三原则及其作用。 答:试验设计(狭义)指小区技术,特别是重复区和试验小区的排列方法。 试验设计三原则:重复、局部控制、随机排列 重复:指试验中,每处理有2个或2个以上的试验单位(小区)。 随机排列(随机化):指任一处理安排到哪一个试验单位(小区)是随机的。 局部控制(区组化): 就是分范围分地段控制非处理因素,使其对个处理的影响趋 于最大程度的一致。或局部控制指通过对小区的合理安排,把试验误差控制在一个 局部的范围内的做法。 重复作用:估计、减少试验误差。 局部控制:进一步减少试验误差。 随机排列:正确估计试验误差。 2.4 试验设计的目的是什么?试验设计的基本原则是什么,各有什么作用? 答:进行试验设计的目的,在于减少试验误差,提高试验的准确度和精确度,使试 验结果正确可靠。为了有效地控制和降低试验误差,试验设计必须遵循重复、随机 及局部控制三条基本原则。重复的最主要作用是估计试验误差,降低试验误差,因 而可提高试验的精确度;随机的主要作用是无偏的试验估计误差;局部控制可以进 一步降低试验误差。 2.5 简述田间试验的基本要求。 答:(1) 试验目的要明确;(2) 试验条件要有代表性,试验条件应能代表将来准备 推广试验结果的地区的自然条件(如试验地土壤种类、地势、土壤肥力、气象条件 等)与农业条件(如轮作制度、农业结构、施肥水平等);(3) 试验结果要可靠(试 验的准确度和精确度两个方面);(4) 试验结果要能够重演。 2.6 什么是对照?田间试验中为什么要设置对照区?如何设置对照? 答:田间试验应设置对照区(check,以 CK 表示),作为处理比较的标准。对照应该 是当地推广良种或最广泛应用的栽培技术措施。设置对照区的目的是:(1)便于在 田间对各处理进行观察比较时作为衡量品种或处理优劣的标准;(2)用以估计和矫 正试验田的土壤差异。通常在一个试验中只有一个对照,有时为了适应某种要求, 可同时用两个各具不同特点的处理作对照。 2.7 田间试验中为什么要在试验地周围设置保护行?
答:(1)保护试验材料不受外来因素如人、畜等的践踏和损害:(2)防止靠近试验田 四周的小区受到空旷地的特殊环境影响即边际效应,使处理间能有正确的比较。 2 8常用的田间试验设计可以归纳为顺序排列的试验设计和随机排列的试验设计 两大类,试简述这两类设计其在应用及统计分析时侧重点有可不同? 答:在常用的田间试验设计中随机排列这类的试验设计强调有合理的试验误差估 计,以便通过试验的表面效应与试验误差相比较后作出推论,常用于对精确度要求 较高的试验:顺序排列类的试验设计并不在于此,而着重在使试验实施比较方便, 常用在处理数量大、精确度要求不高、不须作统计推论的早期试验或预备试验。 2.9试回答试验设计三大原则在随机区组设计中是如何实现的? 答:(1)重复数>=(12/处理数一1)+1:(2)找出试验地的环境变异主要方向并垂 直划分重复区:(3)将每一重复区划分为小区后在每一重复区中进行随机排列。 2.10简述热带作物试验有哪些特点? 答:(1)多属多年生作物,试验周期长,误差较大。(2)多数能进行无性繁殖。 (3)植株高大,小区也就要大。(4)常有缺株、缺区现象。(5)多在丘陵地进 行,环境差异大。(6)植株间差异较大,试验的数不一。()7作物生长周期长试 验材料难得。 2.11在什么情况下可应用裂区设计? 答:(1)多因子试验中,两个因子要求的精确度不一时。(2)各个因子的各个水 平需要的面积大小不一时。(3)在原有试验的基础上,临时加入 个研究因子时。 可用裂区设计。 2.12配对法设计有何优缺点? 答:优点:(1)设计简单,易掌握,食施方便。(2)对试验地要求不高。(3)精确 度不高,小区、大区试验均可采用 缺点:(1)只限于两个处理,不能用复因子试验。(2)对照占地1/2,浪费地。 2.13随机区组设计有何优缺点? 答:优点:(1)贯彻了三原则,精确度较高:(2)对试验地要求不高。适用范围 较广:(3)对照仅以一供试处理出现:(4)单、复因子试验均可。 缺点:(1)精确度不如拉丁方设计:(2)处理数限于20个以内:(3)田间试验 置容易出差错。 2.14裂区设计的基本原则是什么?为什么主要因子能获得较高的情确度? 答:裂区设计的基本原则是:主要因子的各个水平安排在裂区,次要因子的各个
答:(1)保护试验材料不受外来因素如人、畜等的践踏和损害;(2)防止靠近试验田 四周的小区受到空旷地的特殊环境影响即边际效应,使处理间能有正确的比较。 2.8 常用的田间试验设计可以归纳为顺序排列的试验设计和随机排列的试验设计 两大类,试简述这两类设计其在应用及统计分析时侧重点有可不同? 答:在常用的田间试验设计中随机排列这类的试验设计强调有合理的试验误差估 计,以便通过试验的表面效应与试验误差相比较后作出推论,常用于对精确度要求 较高的试验;顺序排列类的试验设计并不在于此,而着重在使试验实施比较方便, 常用在处理数量大、精确度要求不高、不须作统计推论的早期试验或预备试验。 2.9 试回答试验设计三大原则在随机区组设计中是如何实现的? 答:(1)重复数 n>=(12/处理数-1)+1;(2)找出试验地的环境变异主要方向并垂 直划分重复区;(3)将每一重复区划分为小区后在每一重复区中进行随机排列。 2.10 简述热带作物试验有哪些特点? 答:(1)多属多年生作物,试验周期长,误差较大。(2)多数能进行无性繁殖。 (3)植株高大,小区也就要大。(4)常有缺株、缺区现象。(5)多在丘陵地进 行,环境差异大。(6)植株间差异较大,试验的数不一。()7 作物生长周期长试 验材料难得。 2.11 在什么情况下可应用裂区设计? 答: (1)多因子试验中,两个因子要求的精确度不一时。(2)各个因子的各个水 平需要的面积大小不一时。(3)在原有试验的基础上,临时加入一个研究因子时。 可用裂区设计。 2.12 配对法设计有何优缺点? 答:优点:(1)设计简单,易掌握,食施方便。(2)对试验地要求不高。(3)精确 度不高,小区、大区试验均可采用。 缺点:(1)只限于两个处理,不能用复因子试验。(2)对照占地 1/2,浪费地。 2.13 随机区组设计有何优缺点? 答: 优点:(1)贯彻了三原则,精确度较高;(2)对试验地要求不高。适用范围 较广;(3)对照仅以一供试处理出现;(4)单、复因子试验均可。 缺点:(1)精确度不如拉丁方设计;(2)处理数限于 20 个以内;(3)田间试验 置容易出差错。 2.14 裂区设计的基本原则是什么?为什么主要因子能获得较高的精确度? 答: 裂区设计的基本原则是:主要因子的各个水平安排在裂区,次要因子的各个
水平安排在整区。在裂区设计中主要因子能获得较高的精确度原因:裂区处理重复 次数是整区处理重复次数的n(试验重复数)倍,而试验误差与n成反比。 2.15拉丁方设计有何优缺点? 答:优点:实行双方面局部控制,试验精确度高。缺点:对试验地要求苛刻,平坦 方正:农事活动不易安排。 2.16拉丁方设计与随机区组设计的田间排列有何不同?试举例说明之。 答:拉丁方设计是随机区组设计的一种特殊形式,实行双方面局部控制。将随机 区组的横行、直行都控制为区组。使每种处理在每一直行、横行都出现一次仅一次。 而随机区组设计则是实行单方面局部控制。 2.17复因子试验的随机区组设计与裂区设计有何不同? 答:复因子试验的随机区组设计:处理组合在某区组中随机排列,因子没有主次 之分。裂区设计:因子有主次之分,在区组中先随机排次要因子的各水平(即主区 处理),再在各整区中随机排主因子的各水平(副区处理) 2.18改良对比法设计有何优缺点? 答:优点:适用于丘陵地:处理数不受限制,两个以上均可。缺点:对照地占地三 分之一,浪费:未贯彻试验三原则,精确度低:参处理只能与对照直接比较,处理 间不行:不能用在多因素试验。 2.19结合单因素试验和多因素试验的不同,试区别处理和水平这两个概念。 答:水平:某一因素不同的质量或数量等级。处理:各因素水平与水平的组合: 单因素试验中只有一个试验因素,所有处理都仅是这一个因素的不同数量或质量 水平:多因素试验是考察反应量在各因素不同水平和不同水平组合上的变化规 律,找出水平的最佳组合(固定模型)或估计总体变异度(随机模型),处理是 各因素的不同水平与水平的组合。 2.20什么是唯一差异原则? 答:唯一差异原则:试验中,除掉被研究的因素控制的不同水平外,其余因素都作 为试验背景而要求保持常量。这样就能精确地测定处理的效应。 2.21何为试验指标、研究因子、水平及试验效应(主效应、交互作用)。请举 试验设计的例子,并说明其中的试验指标、研究因子及其水平,可能分析出的效
水平安排在整区。在裂区设计中主要因子能获得较高的精确度原因:裂区处理重复 次数是整区处理重复次数的n(试验重复数)倍,而试验误差与n成反比。 2.15 拉丁方设计有何优缺点? 答: 优点:实行双方面局部控制,试验精确度高。缺点:对试验地要求苛刻,平坦 方正;农事活动不易安排。 2.16 拉丁方设计与随机区组设计的田间排列有何不同?试举例说明之。 答: 拉丁方设计是随机区组设计的一种特殊形式,实行双方面局部控制。将随机 区组的横行、直行都控制为区组。使每种处理在每一直行、横行都出现一次仅一次。 而随机区组设计则是实行单方面局部控制。 2.17 复因子试验的随机区组设计与裂区设计有何不同? 答: 复因子试验的随机区组设计:处理组合在某区组中随机排列,因子没有主次 之分。裂区设计:因子有主次之分,在区组中先随机排次要因子的各水平(即主区 处理),再在各整区中随机排主因子的各水平(副区处理)。 2.18 改良对比法设计有何优缺点? 答:优点:适用于丘陵地;处理数不受限制,两个以上均可。 缺点:对照地占地三 分之一,浪费;未贯彻试验三原则,精确度低;参处理只能与对照直接比较,处理 间不行;不能用在多因素试验。 2.19 结合单因素试验和多因素试验的不同,试区别处理和水平这两个概念。 答:水平:某一因素不同的质量或数量等级。处理:各因素水平与水平的组合; 单因素试验中只有一个试验因素,所有处理都仅是这一个因素的不同数量或质量 水平;多因素试验是考察反应量在各因素不同水平和不同水平组合上的变化规 律,找出水平的最佳组合(固定模型)或估计总体变异度(随机模型),处理是 各因素的不同水平与水平的组合。 2.20 什么是唯一差异原则? 答:唯一差异原则:试验中,除掉被研究的因素控制的不同水平外,其余因素都作 为试验背景而要求保持常量。这样就能精确地测定处理的效应。 2.21 何为试验指标、研究因子、水平及试验效应(主效应、交互作用)。请举一 试验设计的例子,并说明其中的试验指标、研究因子及其水平,可能分析出的效
应。 答:试验指标:试验中用来衡量试验效果的量。 研究因子:试验中对试验指标有影响,需要考察的试验条件。 水平:该因子的各种不同状态(可是质量或数量上的不同)。 主效应:该因子水平间平均效应的差数。 交互作用:某些因子综合作用的平均效应和有关因子单独作用的平均效应之和的 差数 举例(略) 2.22什么是试验方案?拟合一个合理的切实可行的试验方案应考虑什么? 答:试验方案是根据试验目的和要求所拟进行比较的一组试验处理的总称。试验方 案按其供试因子数的多少可以区分为单因素试验、多因素试验、综合性试验共3类。 拟合一个合理的切实可行的试验方案应考虑:(1)根据试验的目的、任务和 条件挑选试验因素(2)根据各试验因素的性质确定因素水平(3)试验方案中必须 设置作为比较标准的对照(4)试验处理之间应遵循唯一差异原则(⑤)有的试验要 设置预试期。 第三章:试验资料的整理及特征数 3.1试验资料分为那几类?各有何特点? 答:数量性状资料与质量性状资料两类。数量性状资料又分为计量资料和计数资料。 计量资料为车续性变异资料,名个观察值不一定是整数,两个相邻的整数间可有带 小数的任何数值出现:计量资料为非连续性变异资料或称间断性资料,它的各个双 察值以整数表示,两个相邻整数间不容许任何带有小数的值存在。质量性状本身不 能用数值表示,要获得这类性状的资料,须对其观察结果作数量化处理,质量性状 资料为属性变数料。 3.2简述计量资料整理的步骤, 答:(1)求全距(2)确定组数(3)确定组距(4)确定组限和组中值(5)归组划 线计数,做次数分布表。 3.3常用的统计表和统计图有哪些? 答:常用的统计表:计量资料的次数分布表、计数资料的次数分布表、质量性状资 料的次数分布表:常用的统计图:柱形图、多边形图、条形图和饼图。 3.4算术平均数有哪些基本性质?
应。 答:试验指标:试验中用来衡量试验效果的量。 研究因子:试验中对试验指标有影响,需要考察的试验条件。 水平:该因子的各种不同状态(可是质量或数量上的不同)。 主效应:该因子水平间平均效应的差数。 交互作用:某些因子综合作用的平均效应和有关因子单独作用的平均效应之和的 差数。 举例(略) 2.22 什么是试验方案?拟合一个合理的切实可行的试验方案应考虑什么? 答:试验方案是根据试验目的和要求所拟进行比较的一组试验处理的总称。试验方 案按其供试因子数的多少可以区分为单因素试验、多因素试验、综合性试验共 3 类。 拟合一个合理的切实可行的试验方案应考虑:(1)根据试验的目的、任务和 条件挑选试验因素(2)根据各试验因素的性质确定因素水平(3)试验方案中必须 设置作为比较标准的对照(4)试验处理之间应遵循唯一差异原则(5)有的试验要 设置预试期。 第三章:试验资料的整理及特征数 3.1 试验资料分为那几类?各有何特点? 答:数量性状资料与质量性状资料两类。数量性状资料又分为计量资料和计数资料。 计量资料为连续性变异资料,各个观察值不一定是整数,两个相邻的整数间可有带 小数的任何数值出现;计量资料为非连续性变异资料或称间断性资料,它的各个观 察值以整数表示,两个相邻整数间不容许任何带有小数的值存在。质量性状本身不 能用数值表示,要获得这类性状的资料,须对其观察结果作数量化处理,质量性状 资料为属性变数资料。 3.2 简述计量资料整理的步骤。 答:(1)求全距(2)确定组数(3)确定组距(4)确定组限和组中值(5)归组划 线计数,做次数分布表。 3.3 常用的统计表和统计图有哪些? 答:常用的统计表:计量资料的次数分布表、计数资料的次数分布表、质量性状资 料的次数分布表;常用的统计图:柱形图、多边形图、条形图和饼图。 3.4 算术平均数有哪些基本性质?
答:算术平均数,指资料中各观测值的总和除以观测个数的所得的商。性质:(1) 离均差平方和为最小(2)离均差之和为零。 3.5简述变量的分类 答:(1)变量按其性质可分为连续变量和非连续变量。连续变量表示在变量范围内 可抽出某一范围的所有值,这种变量是连续的:非连续变量表示在变量数列中仅能 取得固定值。(2)变量又可分为定量变量和定性变量。 3.6简述标准误和标准差的区别和联系。 ∑Y- S= 答:标准差:变数变异程度的度量。 n-1 标准误:统计数变异程度的度量。如号=s/厅 第四章:理论分布与抽样分布 4.1事件的概率具有那些基本性质? 答:概率的基本性质:(1)对于任何事件A0<=P(A)<=1:(2)必然事件概率为1 (3)不可能事件概率为0。 4.2正态分布的密度曲线有何特点?μ和·对正态分布曲线有何影响? 答:正态分布曲线的特征:(1)正态分布密度曲线是单峰、对称的悬钟形曲线,对 称轴为=u(2)f(x)在x=u处达到极大,极大值F(山)=1/「G(2π)1/2](3) (x)是非负函数,以x轴为渐进线,分布从-∞至4)曲线在x=μ士处各有 个拐点,即曲线在(-∞,μ-0)和(μ+0,+∞)区间上是下凸的,在[μ-0, μ+σ]区间上是上凸的(5)正态分布有两个参数,即平均数μ和标准差。μ 确定正态分布在X轴上的中心位置,·确定正态分布的变异度。 4.3标准误与标准差有何联系与区别? 答:(1)标准误反映同一个总体内抽样所得的样本平均数间的差异。标准误的功用: 衡量资料的变异性,估计抽样误差。 (2)样本标准差估计同一个总体内各个个体,由于立地环境条件不同而产生的变 异有多大
答:算术平均数,指资料中各观测值的总和除以观测个数的所得的商。性质:(1) 离均差平方和为最小(2)离均差之和为零。 3.5 简述变量的分类: 答:(1)变量按其性质可分为连续变量和非连续变量。连续变量表示在变量范围内 可抽出某一范围的所有值,这种变量是连续的;非连续变量表示在变量数列中仅能 取得固定值。(2)变量又可分为定量变量和定性变量。 3.6 简述标准误和标准差的区别和联系。 答:标准差:变数变异程度的度量。 2 ( ) 1 Y y s n − = − 。 标准误:统计数变异程度的度量。如 / y s s n = 第四章:理论分布与抽样分布 4.1 事件的概率具有那些基本性质? 答:概率的基本性质:(1)对于任何事件 A 0<=P(A)<=1;(2)必然事件概率为 1 (3)不可能事件概率为 0 。 4.2 正态分布的密度曲线有何特点? μ 和 σ 对正态分布曲线有何影响 ? 答:正态分布曲线的特征:(1)正态分布密度曲线是单峰、对称的悬钟形曲线,对 称轴为 x=μ(2)f(x)在 x=μ 处达到极大,极大值 f(μ)=1/[σ(2π)1/2](3) f(x)是非负函数,以 x 轴为渐进线,分布从-∞至 4)曲线在 x=μ±σ 处各有一 个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凸的,在[μ-σ, μ+σ]区间上是上凸的(5)正态分布有两个参数,即平均数 μ 和标准差 σ。μ 确定正态分布在 X 轴上的中心位置,σ 确定正态分布的变异度。 4.3 标准误与标准差有何联系与区别? 答:(1)标准误反映同一个总体内抽样所得的样本平均数间的差异。标准误的功用: 衡量资料的变异性,估计抽样误差。 (2)样本标准差估计同一个总体内各个个体,由于立地环境条件不同而产生的变 异有多大
4.4样本平均数抽样总体与原始总体的两个参数间有何联系? 答:样本平均数分布的平均数4:、标准差σ,与其原总体平均数μ、标准差 。的关系为: 4=A n 4.5什么是正态分布?什么是标准正态分布? 答:正态分布或称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布。 标准正态分布:平均数μ=0,方差。2=1的正态分布。 4.6什么是二项总体与二项分布? 答:二项总体:试验或调查中最常见的一类随机变数是整个总体的各组或单位可以 根据某种性状的出现与否而分为两组。这类变数均属间断性随机变数,其总体中包 含两项,即:非此即彼的两项,它们构成的总体称为二项总体。通常将二项总体中 的“此”事件以变量“1”表示,具概率p:将“彼”事件以变量“0”表示,具概 率0。因而二项总体又称为0、1总体,其慨率则显然有:D+a=1。 二项分布:如果从二项总体抽取个个体,可能得到y个个体属于“此”,而属 于“彼”的个体为一y。由于是随机独立地从总体中抽取个体的,每一次抽取的个 体均有可能属于“此”,也可能属于“彼”,那么得到的y个“此”个体的数目 可能为0、1、2、·、n个。此处将y作为间断性资料的变量,y共有n+1种取值, 这+1种取值各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫 做二项式概率分布,简称二项式分布或二项分布,即为间断性变数总体的理论分布。 第五章统计假设测验及参数的区间估计 5.1什么是假设检验?假设检验的步骤? 答:假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体 提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算作出在一定意 概率义上应该接受的那种假设的推断。其测验的步骤如下:1)对样本所属总体提 出无效假设H和备择假设H:2)确定检验的显著水平ā;3)在HO正确的前 提下,根据抽样分布的统计数,进行假设检验的概率计算:4)根据概率显著水平 α的临界值,进行差异是否显著的推断。 5.2设立无效假设的原则是什么? 答:是有实际意义的:据之可以算出因抽样误差而获得样本结果的概率。 5.3什么是小概率原理?它在假设检验中有何作用?
4.4 样本平均数抽样总体与原始总体的两个参数间有何联系? 答:样本平均数分布的平均数 、标准差 与其原总体平均数 、标准差 的关系为: 4.5 什么是正态分布 ? 什么是标准正态分布 ? 答:正态分布或称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布。 标准正态分布:平均数 μ=0,方差 σ2 =1 的正态分布。 4.6 什么是二项总体与二项分布? 答:二项总体:试验或调查中最常见的一类随机变数是整个总体的各组或单位可以 根据某种性状的出现与否而分为两组。这类变数均属间断性随机变数,其总体中包 含两项,即:非此即彼的两项,它们构成的总体称为二项总体。通常将二项总体中 的“此”事件以变量“1”表示,具概率 p;将“彼”事件以变量“0”表示,具概 率 q。因而二项总体又称为 0、1 总体,其概率则显然有:p+q=1。 二项分布:如果从二项总体抽取 n 个个体,可能得到 y 个个体属于“此”,而属 于“彼”的个体为 n-y。由于是随机独立地从总体中抽取个体的,每一次抽取的个 体均有可能属于“此”,也可能属于“彼”,那么得到的 y 个“此”个体的数目 可能为 0、1、2、.、n 个。此处将 y 作为间断性资料的变量,y 共有 n+1 种取值, 这 n+1 种取值各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫 做二项式概率分布,简称二项式分布或二项分布,即为间断性变数总体的理论分布。 第五章 统计假设测验及参数的区间估计 5.1 什么是假设检验 ? 假设检验的步骤? 答:假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体 提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算作出在一定意 概率义上应该接受的那种假设的推断。其测验的步骤如下: 1)对样本所属总体提 出无效假设 H0和备择假设 HA; 2) 确定检验的显著水平 α; 3) 在 H0 正确的前 提下,根据抽样分布的统计数,进行假设检验的概率计算; 4) 根据概率显著水平 α 的临界值,进行差异是否显著的推断。 5.2 设立无效假设的原则是什么? 答:是有实际意义的;据之可以算出因抽样误差而获得样本结果的概率。 5.3 什么是小概率原理 ? 它在假设检验中有何作用 ? x x x = n x 2 2 = n x =
答:如果假设一些条件,并在假设的条件下能够准确的算出事件A出现的概率 a为很小,则在假设条件下的n次重复试验中事件A将按预定的概率发生,而在 一次试验中则几乎不可能发生。小概率事件实际不可能原理是统计学上进行假设 实验的基础依据。 5.4假设检验中的两类错误是什么?如何降低犯两类错误的概率? 答:假设检验中的两类错误:第一类错误:H。本来是直,而作出了拒绝的判断所犯 而作出了接受的 降低两类错误的措施:(1)在样本容量一定时,提高显著水平,可以减少犯第 类错误的概率,但同时增大了犯第二类错误的概率。(2)在和显著水平相同的条 件下,真正的总体平均数μ和假设的平均数的相差越大,则犯第二类错误的概 率越小。(3)为了降低犯两类错误的概率,需采用 个较低的显著水平,如ā 0.05 同时适当增加样本容量。(4)如显著水平一定,则改进试验技术和增加样本容量可 以有效的降低犯两类错误的概率。 5.5什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系? 答:区间估计是在一定概率保证下,估计参数可能在内的一个范围或区间(估计 出一个范围或区间以能够覆盖参数)。点估计是是以样本的统计数估计总体的相 应参数。区间估计是要根据样本来确定一个区间L1,L2],保证参数落在这个区间 内的概率称为置信度或胃信概率,以P=1-ā表示。其中「L1,L2]称为该参数的置 信区间,1-ā为此区间的置信度。 5.6、两尾检验、一尾检验各在什么条件下应用 答:统计假设测验中H:=山具有两个否定区,H:μ≠4,这类测验称两尾测 验,在假设测验中所考虑的概率为左右两尾概率之和。在假设测验中所考虑的概 率只用一尾概率的测验称为一尾测验。 5.7什么是小概率事件的实际不可能性原理? 答:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件 在统计学上,把小概率事件再一次试验中堪称是实际不可能发生的时间称为小概 率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能原理是统计 学上进行假设实验的基础依据 5.8简述t分布曲线的特点。 答:·t分布曲线的特点(1)t分布受自由度的制约,每一个自由度都有一条t分 布密度曲线(2)t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布 密度函数取得最大值(3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾 部稍高而平
答:如果假设一些条件,并在假设的条件下能够准确的算出事件 A 出现的概率 α 为很小,则在假设条件下的 n 次重复试验中事件 A 将按预定的概率发生,而在 一次试验中则几乎不可能发生。小概率事件实际不可能原理是统计学上进行假设 实验的基础依据。 5.4 假设检验中的两类错误是什么 ? 如何降低犯两类错误的概率? 答:假设检验中的两类错误:第一类错误:H0 本来是真,而作出了拒绝的判断所犯 的错误称”弃真”错误或 α 错误;第二类错误:H0本来是不真,而作出了接受的 判断所犯的错误称”取伪”错误或 β 错误。 降低两类错误的措施:(1)在样本容量 n 一定时,提高显著水平,可以减少犯第一 类错误的概率,但同时增大了犯第二类错误的概率。(2)在 n 和显著水平相同的条 件下,真正的总体平均数 和假设的平均数 0的相差越大,则犯第二类错误的概 率越小。(3)为了降低犯两类错误的概率,需采用 一个较低的显著水平,如 α=0.05。 同时适当增加样本容量。(4)如显著水平一定,则改进试验技术和增加样本容量可 以有效的降低犯两类错误的概率。 5.5 什么叫区间估计 ? 什么叫点估计 ? 置信度与区间估计有什么关系 ? 答:区间估计是在一定概率保证下,估计参数可能在内的一个范围或区间 (估计 出一个范围或区间以能够覆盖参数) 。点估计是是以样本的统计数估计总体的相 应参数。区间估计是要根据样本来确定一个区间[L1 ,L2],保证参数落在这个区间 内的概率称为置信度或置信概率,以 P=1-α 表示。其中[L1 ,L2]称为该参数的置 信区间,1-α 为此区间的置信度。 5.6、两尾检验、一尾检验各在什么条件下应用? 答:统计假设测验中 H0: µ=µ0具有两个否定区,HA: µ≠ µ0,这类测验称两尾测 验,在假设测验中所考虑的概率为左右两尾概率之和。在假设测验中所考虑的概 率只用一尾概率的测验称为一尾测验。 5.7 什么是小概率事件的实际不可能性原理? 答:若随机事件的概率很小,例如小于 0.05、0.01、0.001,称之为小概率事件。 在统计学上,把小概率事件再一次试验中堪称是实际不可能发生的时间称为小概 率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能原理是统计 学上进行假设实验的基础依据。 5.8 简述 t 分布曲线的特点。 答:.t 分布曲线的特点(1)t 分布受自由度的制约,每一个自由度都有一条 t 分 布密度曲线(2)t 分布密度曲线以纵轴为对称轴,左右对称,且在 t=0 时,分布 密度函数取得最大值(3)与标准正态分布曲线相比,t 分布曲线顶部略低,两尾 部稍高而平
5.9样本百分率的集团均数和集团标准差公式是怎样的?为什么说样本容量越大, 样本百分率的代表性就越大? 答:样本百分率的集团均数4,=P,=四。因为P=x,当n越大P起接近 Vn 集团的概率P,其代表性也就越大。 5.10什么叫样本均数差异显著性测验?为什么一般统计分析上把显著水准定为 5%? 答:样本均数差异显著性测验即测验样本所来自的集团的均数是否相等的一种方 法。因为我们下结论可能犯两种错误:第一种为统计假设为真被误判为不真犯的错 误。第二为统计假设不真被误判为真所犯的错误。为使两种错发生的概率控制在 个适当的地步,故把显著水准定为5% 5.11正态分布曲线有什么特点?曲线与x轴围成的面积等于多少? 答:特点:(1)单峰曲线。(2)左右对称(对称轴X=u)。(3)当趋于土∞,f(x) 趋于零。(4)在μ土o处,曲线各有一个拐点。(⑤)曲线形状随μ、。而改变。(6)、 X轴与曲线所围成的面积为1 5.12正态分布的集团均数μ和集团标准差0指示分布曲线的什么特性? 答:μ和σ决定曲线的图形,当μ改变但·不变时,曲线沿X轴平行移动,但不改 变其形状,当固定μ,曲线则随σ改变在对称轴附近变肥变瘦。 5.13为什么说当样本容量一定时,可靠性为95%估计区间的精确度高于99%估 计区间的精确度,而可靠性小于99%估计区间的可靠性? 答:因为95%的估计区间为(x-1.96/Vn,x+1.96o/√n),而99%的估 计区间为(x+2.58o/√n,x+2.58o/Vn),当n一定时,前者的估计区间窄些, 估计值较接近u,精确度相对高些,而前者的概率保证只有95%,后者为99% 当然可靠性小。 5.14t分布的分布曲线与标准正态分布的分布曲线有哪些差别?什么情况下这两 种分布分布曲线一致? 答:t分布的曲线也是单峰曲线,对称轴t=0,而不是X=u:曲线形状随自由度 不同而改变,不同正态分布曲线形状随、·不同而不同。只有当n趋于无穷, t分布曲线才与标准正态分布曲线一致: 5.15作可量资料大样本均数与总体均数差异显著性测验时,为什么|u|>1.96, 就推翻μ=μ山。的假设?
5.9 样本百分率的集团均数和集团标准差公式是怎样的?为什么说样本容量越大, 样本百分率的代表性就越大? 答:样本百分率的集团均数 p=P,σp= n pq 。因为 P=x/n,当 n 越大 P 起接近 集团的概率 P,其代表性也就越大。 5.10 什么叫样本均数差异显著性测验?为什么一般统计分析上把显著水准定为 5%? 答:样本均数差异显著性测验即测验样本所来自的集团的均数是否相等的一种方 法。因为我们下结论可能犯两种错误:第一种为统计假设为真被误判为不真犯的错 误。第二为统计假设不真被误判为真所犯的错误。为使两种错发生的概率控制在一 个适当的地步,故把显著水准定为 5%。 5.11 正态分布曲线有什么特点? 曲线与x轴围成的面积等于多少? 答:特点:(1)单峰曲线。(2)左右对称(对称轴X=μ)。(3)当趋于±∞,f(x) 趋于零。(4)在μ±σ处,曲线各有一个拐点。(5)曲线形状随μ、σ而改变。(6)、 X 轴与曲线所围成的面积为1。 5.12 正态分布的集团均数μ和集团标准差σ指示分布曲线的什么特性? 答:μ和σ决定曲线的图形,当μ改变但σ不变时,曲线沿X轴平行移动,但不改 变其形状,当固定μ,曲线则随σ改变在对称轴附近变肥变瘦。 5.13 为什么说当样本容量一定时,可靠性为 95%估计区间的精确度高于 99%估 计区间的精确度,而可靠性小于 99%估计区间的可靠性? 答:因为 95% 的估计区间为〔x-1.96σ/ n ,x+1.96σ/ n 〕,而 99% 的估 计区间为〔x+2.58σ/ ,x+2.58σ/ 〕,当n一定时,前者的估计区间窄些, 估计值较接近 μ,精确度相对高些,而前者的概率保证只有 95%,后者为 99%, 当然可靠性小。 5.14t分布的分布曲线与标准正态分布的分布曲线有哪些差别?什么情况下这两 种分布分布曲线一致? 答: t 分布的曲线也是单峰曲线,对称轴 t=0,而不是 X=μ;曲线形状随自由度 不同而改变,不同正态分布曲线形状随 μ、σ 不同而不同。只有当 n 趋于无穷, t 分布曲线才与标准正态分布曲线一致。 5.15 作可量资料大样本均数与总体均数差异显著性测验时,为什么│u│> 1.96, 就推翻μ1=μ0 的假设? n n
答:因为统计假设μ=。,那么从未知总体所抽样看成是从己知总体抽样。若抽 的是大样本,则大样本的E(x)=μ,D(X)=。,相当于从已知总体抽, 就应有u1≤1.96 而|u>1.96,根据小机率原理,概率很小的事件在 性试验中是不至于发生的,居然发生了,我们就推翻假设。 5.16若|u|a,故接受H:X2≥X2.,则D<a, 故否定H。 第五步:依题写出统计结论
答:因为统计假设μ1=μ0,那么从未知总体所抽样看成是从已知总体抽样。若抽 的是大样本,则大样本的E(x)=μ,D(X)= σ ,相当于从已知总体抽, 就应有│u│≤ 1.96,而│u│>1.96,根据小机率原理,概率很小的事件在一 性试验中是不至于发生的,居然发生了,我们就推翻假设。 5.16 若│u│<2.58,能否下“不显著”的结论? 为什么? 答:不能。因为│u│<2.58,有可能 1.96≤ │u│≤2.58 达显著,所以只能下 达极显著的结论。 5.17 大、小样本进行均数差异显著性测验的根本不同点在哪里? 答:大样本均数差异显著性测验用u测验,小样本均数差异显著性测验则用t测验。 因为小样本的S不能近似代替σ,不服从正态分布。 5.18 两个平均数的成对比较较之成组比较有哪些优点? 答:与成组比较相比,成对比较有两个优点: (1)由于加强了试验控制,成对观察值的可比性提高,因而随机误差将减少, 可以发现较小的真实差异。 (2)成对比较不受两样本的总体方差 2 2 1 2 的干扰,分析时不需要考虑 2 2 1 2 和 是否相等。 第六章 检验 6.1 2 测验适用于何种性质的资料?其基本公式是怎样的? 答: 2 适用于:可数资料的独立性测验,可数资料的适合性测验,测定两种性状的 相关关系的研究,多点多年生作物的试验误差有否同质性的测定。 基本公式: 6.2 2 检验的主要步骤有哪些 ? 答:第一步:提出无效假设 H0 与备择假设 HA 第二步:确定显著水平 确定 a=0.05 或 0.01 等。 第三步: 计算 2 值 由样本资料和理论假设计算 2 值;根据自由度,由附表 5 查出 2 a,df。 第四步: 推断,若 χ2≤χ2α.df,则 p>α,故接受 H0;χ2≥χ2α.df ,则 p<α, 故否定 H0。 第五步:依题写出统计结论。 − = E O E x 2 2 ( )