《生物统计学》实验指导 XC 陈志斌关欣杨淑兰编著 沈阳农业大学农学院 2006年11月修订
《生物统计学》实验指导 (Excel 篇) 陈志斌 关欣 杨淑兰 编著 沈阳农业大学农学院 2006 年 11 月修订
前言 生物统计学是农科院校许多专业的专业基础课,涉及试验设计与统计分析两方面内 容,是科研工作者从事科学研究必备的工具。过去,由于计算工具的落后,一度限制了它 的应用,随着计算机的迅速发展和普及,计算工具已不再成为限制因素,大量应用软件的 研制成功,使生物统计学有了突飞猛进的发展。为了适应这种发展的需要,我们改革了生 物统计实验教学,编写了这本实验指导,旨在帮助同学们通过实验实践,掌握应用计算机 完成常用的统计分析的基本方法,为进一步学习打下一个良好的基础。该书不仅是在校学 生学习生物统计的实验指导书,也可作为农业科研工作者的参考书。 Excel是一个非常普及的软件,具有使用方便、容易掌握的优点,这也是我们选用这 一软件的主要原因。本指导书包含8个实验,涵盖了生物统计教材的大部分统计分析内容 考虑到函数型计算器具有体积小、重量轻、携带方便,并具有一些统计运算功能的特点, 我们在实验一给予了介绍。指导书中有大量图片,学习时注意图中选定的单元格及公式编 辑栏中的内容,这是理解书中内容的关键 本书是我们几年来从事生物统计实验课教学的经验总结,书中不乏有许多应用技巧 由于受软件掌握的程度所限,不妥之处在所难免,望使用者多提宝贵意见和建议。 联系方式: zhibinchla126com guanxin73@126.com 者 2006年11月于沈阳农业大学
1 前 言 生物统计学是农科院校许多专业的专业基础课,涉及试验设计与统计分析两方面内 容,是科研工作者从事科学研究必备的工具。过去,由于计算工具的落后,一度限制了它 的应用,随着计算机的迅速发展和普及,计算工具已不再成为限制因素,大量应用软件的 研制成功,使生物统计学有了突飞猛进的发展。为了适应这种发展的需要,我们改革了生 物统计实验教学,编写了这本实验指导,旨在帮助同学们通过实验实践,掌握应用计算机 完成常用的统计分析的基本方法,为进一步学习打下一个良好的基础。该书不仅是在校学 生学习生物统计的实验指导书,也可作为农业科研工作者的参考书。 Excel 是一个非常普及的软件,具有使用方便、容易掌握的优点,这也是我们选用这 一软件的主要原因。本指导书包含 8 个实验,涵盖了生物统计教材的大部分统计分析内容, 考虑到函数型计算器具有体积小、重量轻、携带方便,并具有一些统计运算功能的特点, 我们在实验一给予了介绍。指导书中有大量图片,学习时注意图中选定的单元格及公式编 辑栏中的内容,这是理解书中内容的关键。 本书是我们几年来从事生物统计实验课教学的经验总结,书中不乏有许多应用技巧。 由于受软件掌握的程度所限,不妥之处在所难免,望使用者多提宝贵意见和建议。 联系方式:zhibinch@126.com guanxin73@126.com 编 者 2006 年 11 月于沈阳农业大学
录 实验一计算器的使用 实验二单个样本平均数的统计推断 实验三两个样本平均数的统计推断 实验四卡平方测验 13 实验五单因素试验结果的统计分析…… 实验六多因素试验结果的统计分析…22 实验七直线回归与相关… 实验八多元回归与相关… 32
2 目 录 实验一 计算器的使用............................................................. 3 实验二 单个样本平均数的统计推断 ..................................... 7 实验三 两个样本平均数的统计推断 ..................................... 9 实验四 卡平方测验................................................................13 实验五 单因素试验结果的统计分析 ....................................18 实验六 多因素试验结果的统计分析 ....................................22 实验七 直线回归与相关........................................................26 实验八 多元回归与相关........................................................32
实验一计算器的使用 实验目的: 1.通过实验掌握函数型电子计算器的使用,特别是统计功能键的使用。。 2.掌握利用计算器进行平均数、标准差及相关计算的方法 实验要求 完成习题3.3和34 、方法及步骤: )计算器的常用键盘的名称及作用(以 casiO ix-180P为例) 第二功能键,与红色字符键配合使用,以完成第二种功能。 2、國OD目状态键,与.及数字键19配合使用。常用的包括 Mo们.显示[女,即积分运算状态:圆D[2显示LR,即:回归计算状态 O03].显示SD,即统计运算状态 :程序改正清除键。 P2 程序序号指定显示键 正负符号转换键。单独按该键执行黑色字(+-)的功能,即改变符号。 求平方键。:按NV及该键执行红色字(x2)的功能,即求平方。 a%分数键。单独按该键执行黑色字(ah)的功能,即进行分数运算 如1-+2-,操作方法:1 鸥4即23园 显示3.1720,即3; s、.倒数键, INV 及该键执行红色字(1/x)的功能,即求倒数
3 实验一 计算器的使用 一、实验目的: 1.通过实验掌握函数型电子计算器的使用,特别是统计功能键的使用。。 2.掌握利用计算器进行平均数、标准差及相关计算的方法。 二、实验要求: 完成习题 3.3 和 3.4。 三、方法及步骤: (一)计算器的常用键盘的名称及作用(以 CASIO fx-180P 为例) 1、 :第二功能键,与红色字符键配合使用,以完成第二种功能。 2、 :状态键,与.及数字键 1~9 配合使用。常用的包括: :显示ò dx ,即积分运算状态; :显示 LR,即:回归计算状态; :显示 SD,即统计运算状态; 3、 :程序改正清除键。 4、 、 :程序序号指定显示键。 5、 :正负符号转换键。单独按该键执行黑色字(+/-)的功能,即改变符号。 6、 :求平方键。:按 INV 及该键执行红色字(x 2)的功能,即求平方。 7、 :a b/c 分数键。单独按该键执行黑色字(a b/c)的功能,即进行分数运算, 如 1 4 1 +2 5 3 ,操作方法:1 1 4 2 3 5 显示 3 ¿17¿20 ,即 3 20 17 ; 8、 :倒数键。按 及该键执行红色字(1/x)的功能,即求倒数。 INV INV
统计运算双变数x的输入键(在LR状态时使用)。 s.〖n,常数输入,本计算器共有6个常数库,可把数据存入其内,但需常数库 输入键Kin与数字键1到6配合使用。输入:如存15到2号库;操作:按15 K in] 2(注:输入的新内容覆盖旧内容)。 项目对调键。该键与第二功能键IV配合使用,可使前后两项对调(X←Y), 如计算 2时,可进行如下操作, 2民网刚日显 示0.6。 9〖Ko:常数库输出键。上例中存到2号库中的15可用K小2提取出来,即Kout 显示15。 本计算器还有一个独立存储器,进行存储运算时 显示“M”,其使用方法如下:清除独立存储器中的数据Ac四 屏幕上显示的“M”消失;将12存入到独立存储器中(12 NV Minl ),屏幕 上显示出“M将5累加到独立存储器中(5通M+:提取独立存储器中的数 INV 据(),此时为17:将独立存储器中的数据减3(3 );提取独 立存储器中的数据(),此时为14。 1. Ec3 乘方或乘方根键。 X网 可相应执行x或x/的 功能 (二)平均数和标准差的计算: 先进入统计运算的状态。操作方法为:先按OD目键,再按数字键[3],在屏幕上出 现“SD”时,即可进行统计运算。 2.清空贮存库中的内容。操作方法: PINV AC 3.输入数据。如有一样本,其观察值为:1,2,3,4,5。试计算n、Xx、∑x2、x 操作方法,网3网网网 如刚输入的数据出错,可用部分清除键。将其删除,而不影响前面输入的内容
4 7、 :统计运算双变数 x 的输入键(在 LR 状态时使用)。 8、 :常数库输入键。本计算器共有 6 个常数库,可把数据存入其内,但需常数库 输入键 Kin 与数字键 1 到 6 配合使用。输入:如存 15 到 2 号库;操作:按 15 2(注:输入的新内容覆盖旧内容)。 9、 :项目对调键。该键与第二功能键 INV 配合使用,可使前后两项对调(X«Y), 如计算 2 5 6 ´ 时,可进行如下操作,2 5 6 显 示 0.6。 9、 :常数库输出键。上例中存到 2 号库中的 15 可用 2 提取出来,即按 2 显示 15。 10、 , :本计算器还有一个独立存储器,进行存储运算时,屏幕上 显示“M”。其使用方法如下:清除独立存储器中的数据( ), 屏幕上显示的“M”消失;将 12 存入到独立存储器中(12 ),屏幕 上显示出“M”;将 5 累加到独立存储器中(5 );提取独立存储器中的数 据( ),此时为 17;将独立存储器中的数据减 3(3 );提取独 立存储器中的数据( ),此时为 14。 12、 :乘方或乘方根键。 或 :可相应执行 y x 或 y x 1 的 功能。 (二)平均数和标准差的计算: 1.先进入统计运算的状态。操作方法为:先按 键,再按数字键 ,在屏幕上出 现“SD”时,即可进行统计运算。 2.清空贮存库中的内容。操作方法: 。 3.输入数据。如有一样本,其观察值为:1, 2, 3, 4, 5。试计算 n、Sx、Sx 2 、 x 、s。 操作方法:1 2 3 4 5 如刚输入的数据出错,可用部分清除键 将其删除,而不影响前面输入的内容。 INV INV INV INV INV INV INV
4.提取特征数 提取的特征数名称 按键方法 显示出的数据 x的平方和(x)区Kou1 x的总和数(∑x) Kout 2 15 x的个数(n) Kout 3 x的平均数(x) 总体标准差(σ) 2] 414213562 样本标准差(s) 3 1.58113883 (三)线性回归计算 1.先进入回归计算的状态。操作方法为:先按瓯O0健,再按数字键2,在屏幕上出现 “LR”时,即可进行回归计算 2.请空存库中的内容,操作方法:巴AC 3.输入数据的方法为:xL 例:一些夏季害虫盛发期的早迟和春季温度的高低有关。江苏武进连续9年测定3 月下旬至4月中旬平均温度累积值(x,旬度)和水稻一代三化螟盛发期,以5月10日为0) 的关系,得结果于表11.1.试计算直线回归方程 x累积温度355341317403368402317392442 y盛发期1216927 139 -1 分别求变数x、y的(1)总和数(Xx、xy):(2)平方和(x、xy2) (3)平均数(x、j); (4)xy的乘积和(xxy) (5)回归截距a:(6)回归系数b;(7)相关系数r 输入数据:35.5 2圆,x116逦 44.2 (如刚输入的数据出错,也可用部分清除键删除) 4.提取特征数
5 4.提取特征数。 提取的特征数名称 按键方法 显示出的数据 x 的平方和(Sx 2) 55 x 的总和数(Sx) 15 x 的个数(n) 5 x 的平均数( x ) 3 总体标准差(s ) 1.414213562 样本标准差(s) 1.58113883 (三)线性回归计算 1.先进入回归计算的状态。操作方法为:先按 键,再按数字键 2 ,在屏幕上出现 “LR”时,即可进行回归计算。 2.清空贮存库中的内容。操作方法: 。 3.输入数据的方法为:x1 y1 ,x2 y2 .…..。 例:一些夏季害虫盛发期的早迟和春季温度的高低有关。江苏武进连续 9 年测定 3 月下旬至 4 月中旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以 5 月 10 日为 0) 的关系,得结果于表 11.1。试计算直线回归方程。 x 累积温度 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 y 盛发期 12 16 9 2 7 3 13 9 -1 分别求变数 x、y 的(1)总和数(Sx、Sy);(2)平方和(Sx 2、Sy 2); (3)平均数( x 、 y ); (4)xy 的乘积和(Sxy); (5)回归截距 a; (6)回归系数 b; (7)相关系数 r。 输入数据:35.5 12 ,34.1 16 ,…… ,44.2 1 。 (如刚输入的数据出错,也可用部分清除键 删除)。 4.提取特征数。 INV INV INV INV
提取的特征数名称 按键方法 显示出的数据 x的平方和(∑x2) Kot|12149 x的总和数(∑x) Ku② 333.7 x的个数(n) Kout x的平均数(x) 370778 y的平方和(y)〖Ko4 y的总和数(∑y) y的平均数(y) INV 77778 x与y的乘积和(xy)Kout 2436.4 回归截距a 48.5493 回归系数b 1.0996 相关系数r IN -0.8371
6 提取的特征数名称 按键方法 显示出的数据 x 的平方和(Sx 2) 12517.49 x 的总和数(Sx) 333.7 x 的个数(n) 9 x 的平均数( x ) 37.0778 y 的平方和(Sy 2) 794 y 的总和数(Sy) 70 y 的平均数( y ) 7.7778 x 与 y 的乘积和(Sxy) 2436.4 回归截距 a 48.5493 回归系数 b -1.0996 相关系数 r -0.8371 INV INV INV INV INV
实验二单个样本平均数的统计推断 目的: 通过实验了解exce分析工具的使用 2.掌握单个样本平均数的假设测验及区间估计的方法。 、要求:用自己的学号后两位数及姓名作文件名,保存word和ee文件(xxx实 验二),并发送到老师指定的微机的文件夹中。 习题5.6已知8株杂交水稻的单株产量为(g):272,200,268,247,267,246,363 216。(1)试测验Ho=250:(2)估计单株产量总体平均数μ在95%置信度下的置信区间 三、解题指导 (1)提出无效假设和对应假设 H:p=40=250(该杂交水稻的单株产量的总体平均数为250g) HA:p≠250 确定显著水平 测验计算 ST x-250 查t临界值 当v=7时,to5= 推断: (2)单株产量总体平均数在95%置信度下的置信区间的下限和上限为: 所以单株产量总体平均数μ在95%置信度下的置信区间为 excel的分析工具中没有单个平均数的t测验方法,但可以巧妙地利用成对数据的t测 验法完成有关计算。 将所有的数据与假设的平均数250配成对,这样组成的成对数据的t值计算式为 d 其分子上的差数平均数d必与本题的t的计算式的分子(x-250)相等:而分 母的差数平均数的标准误S,是用在原观察值的基础上均减去250后得到的值d计算的, 所以其值必与用原观察值计算的标准误sz相等,因此,可通过添加8个250,构成成对数 据的形式,进而用“t-检验:平均数的成对二样本分析”完成单个平均数的假设测验问题
7 实验二 单个样本平均数的统计推断 一、目的: 1.通过实验了解 excel 分析工具的使用。 2.掌握单个样本平均数的假设测验及区间估计的方法。 二、要求:用自己的学号后两位数及姓名作文件名,保存 word 和 excel 文件(×××××实 验二),并发送到老师指定的微机的文件夹中。 习题 5.6 已知 8 株杂交水稻的单株产量为(g):272,200,268,247,267,246,363, 216。(1)试测验 H0:m=250;(2)估计单株产量总体平均数m在 95%置信度下的置信区间。 三、解题指导 (1)提出无效假设和对应假设 H0:m=m0=250 (该杂交水稻的单株产量的总体平均数为 250g) HA:m≠250 确定显著水平 a=0.05 测验计算: x = n s s x = = x s x t - 250 = = 查 t 临界值 当n=7 时, 0.05 t = 推断: (2)单株产量总体平均数m在 95%置信度下的置信区间的下限和上限为: L1= x -ta× x s = L2= x +ta× x s = 所以单株产量总体平均数m在 95%置信度下的置信区间为[ ] excel 的分析工具中没有单个平均数的 t 测验方法,但可以巧妙地利用成对数据的 t 测 验法完成有关计算。 将所有的数据与假设的平均数 250 配成对,这样组成的成对数据的 t 值计算式为: d s d t = ,其分子上的差数平均数d 必与本题的 t 的计算式的分子( x - 250 )相等;而分 母的差数平均数的标准误 d s ,是用在原观察值的基础上均减去 250 后得到的值 di计算的, 所以其值必与用原观察值计算的标准误 x s 相等,因此,可通过添加 8 个 250,构成成对数 据的形式,进而用“t-检验:平均数的成对二样本分析”完成单个平均数的假设测验问题
四、方法及步骤 1、将数据输入到 excel工作表中,在原数据旁再输入一组数据(8个)均为250,构成成 对数据的形式。 2、执行“工具(T)数据分析(D)命令。 3、选“检验:平均数的成对二样本分析”按□确定钮。 分析工具A 确定 取消 帮助Q 二险间的 4、在“变量1的区域”选样本观察值(A2:A9),变量2的区域选8个“250”的数据 区域(B2:B9) 5、“假设平均差(E)”输入0或空白(不输任何数)。 6、若将标志(“样本”、“总体平均”)一起选中,需点选“标志”。 7、a维持0.05。 8、“输出区域”可选在同一工作表中(如D15 样本 总体平均 按量:aMa 克量2的城②) 6267 益平均算④ 21625003:a 轴出选项一 G出区组 12标准误r 工作 按匚确定钮。即得到假设测验的结果 9、在工作表中计算出样本平均数的标准误Sz和总体平均数的95%置信限L1、L2 10、将结果填入word文档 总体平均」t-检验:成对双样本均值分析 系数#DV/01 216250d t st at P(T<=t)单尾 12标准误5颜17.3037 单尾临界 13L1=218.9589 T=t)双尾
8 四、方法及步骤: 1、将数据输入到 excel 工作表中,在原数据旁再输入一组数据(8 个)均为 250,构成成 对数据的形式。 2、执行“工具(T)/ 数据分析(D)…命令。 3、选“t-检验:平均数的成对二样本分析”按 钮。 4、在“变量 1 的区域”选样本观察值(A2:A9),变量 2 的区域选 8 个“250”的数据 区域(B2:B9)。 5、“假设平均差(E)”输入 0 或空白(不输任何数)。 6、若将标志(“样本”、“总体平均”)一起选中,需点选“标志”。 7、a 维持 0.05。 8、“输出区域”可选在同一工作表中(如 D1)。 按 钮。即得到假设测验的结果。 9、在工作表中计算出样本平均数的标准误 x s 和总体平均数m的 95%置信限 L1、L2。 10、将结果填入 word 文档
实验三两个样本平均数的统计推断 目的:通过实验掌握两个样本平均数的假设测验及区间估计的方法。 二、要求:用自己的学号后两位数及姓名作文件名,保存word和exc文件(xx实 验三),并发送到老师指定的微机的文件夹中 习题59选面积为30m2的玉米小区10个,各分成两半,一半去雄另一半不去雄,得产 量(kg)为 去雄:28,30,31,32,30,29,30,28,34,27。 不去雄:25,28,29,29,31,25,28,27,32,27。 (1)用成对比较法测验H:μ=0的假设 (2)求包括山在内置信度为95%的区间 (3)试按成组平均数比较法测验假设H0:山=p; (4)求包括山-在内置信度为95%的区间; (5)比较上述第(1)项和第(3)项测验结果并加以解释 三、解题指导 解:(1)提出假设 假设Hn:=0,对HA4≠0 确定显著水平 测验计算 查t临界值 当v=10-1=9时,l05=, 推断: (2)包括山在内,置信度为95%的置信区间的下限和上限为: L2=d+0s×s 所以包括山在内置信度为95%的区间为 (3)假设Hn:山1=2,则HA;≠p 显著水平a=005 测验计算
9 实验三 两个样本平均数的统计推断 一、目的:通过实验掌握两个样本平均数的假设测验及区间估计的方法。 二、要求:用自己的学号后两位数及姓名作文件名,保存 word 和 excel 文件(×××××实 验三),并发送到老师指定的微机的文件夹中。 习题 5.9 选面积为 30m2的玉米小区 10 个,各分成两半,一半去雄另一半不去雄,得产 量(kg)为: 去 雄:28,30,31,32,30,29,30,28,34,27。 不去雄:25,28,29,29,31,25,28,27,32,27。 (1) 用成对比较法测验 H0:md=0 的假设; (2) 求包括md在内置信度为 95%的区间; (3) 试按成组平均数比较法测验假设 H0:m1=m2; (4) 求包括m1-m2在内置信度为 95%的区间; (5) 比较上述第(1)项和第(3)项测验结果并加以解释。 三、解题指导 解:(1)提出假设 假设H0:md=0,对HA:md≠0 确定显著水平 a =0.05 测验计算: n d d S = n s s d d = d s d t = 查 t 临界值 当n=10-1=9 时,t0.05=, 推断: (2) 包括md在内,置信度为 95%的置信区间的下限和上限为: L1= d -t0.05× d s = L2= d + t0.05× d s = 所以包括md在内置信度为 95%的区间为[ ]。 (3)假设 H0:m1=m2,则HA:m1≠m2 显著水平a =0.05 测验计算: x1 - x2 =