生物统计学：《生物统计附试验设计》课程教材（第三版）第三章平均数、标准差与变异系数.doc_大学文库

22 第三章平均数、标准差与变异系数本章重点介绍平均数（mean）、标准差（standard deviation）与变异系数（variation coefficient）三个常用统计量，前者用于反映资料的集中性，即观测值以某一数值为中心而分布的性质；后两者用于反映资料的离散性，即观测值离中分散变异的性质。第一节平均数平均数是统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置。在畜牧业、水产业生产实践和科学研究中，平均数被广泛用来描述或比较各种技术措施的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数（arithmetic mean）、中位数（median）、众数（mode）、几何平均数（geometric mean）及调和平均数（harmonic mean），现分别介绍如下。一、算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为 x 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。（一）直接法主要用于样本含量 n≤30 以下、未经分组资料平均数的计算。设某一资料包含 n 个观测值：x1、x2、…、xn，则样本平均数 x 可通过下式计算： n x n x x x x n i i n = = + + + = 1 2  1 （3-1）其中，Σ为总和符号； = n i i x 1 表示从第一个观测值 x1 累加到第 n 个观测值 xn。当 = n i i x 1 在意义上已明确时，可简写为Σx，（3-1）式即可改写为： n x x =∑ 【例 3.1】某种公牛站测得 10 头成年公牛的体重分别为 500、520、535、560、585、 600、480、510、505、490（kg），求其平均体重。由于Σx=500+520+535+560+585+600+480+510+505+490=5285，n=10 代入（3—1）式得： 528.5(kg) 10 ∑ 5285 = = = n x x 即 10 头种公牛平均体重为 528.5 kg。（二）加权法对于样本含量 n≥30 以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平均数，计算公式为：

24 ( ) 0 1  − = = x x n i i 或简写成 (x − x) = 0 2、样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。 = n i 1 (xi- x ) 2< = n i 1 (xi- a) 2 （常数 a≠ x ）或简写为：  − 2 (x x) <  − 2 (x ) 以上两个性质可用代数方法予以证明，这里从略。对于总体而言，通常用μ表示总体平均数，有限总体的平均数为： x N n i  i = = 1  （3-3）式中，N 表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数（ x ）作为总体平均数（μ）的估计量，并已证明样本平均数 x 是总体平均数μ的无偏估计量。二、中位数将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为 Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。（一）未分组资料中位数的计算方法对于未分组资料，先将各观测值由小到大依次排列。 1、当观测值个数 n 为奇数时，(n+1)/2 位置的观测值，即 x(n+1)/2为中位数； Md= (n+1)/ 2 x 2、当观测值个数为偶数时，n/2 和（n/2+1）位置的两个观测值之和的 1/2 为中位数，即： 2 / 2 + ( / 2+1) = n n d x x M （3-4）【例 3.4】观察得 9 只西农莎能奶山羊的妊娠天数为 144、145、147、149、150、151、 153、156、157，求其中位数。此例 n=9，为奇数，则： Md= ( 1)/ 2 (9 1)/ 2 5 x x x n+ = + = =150（天）即西农莎能奶山羊妊娠天数的中位数为 150 天。【例 3.5】某犬场发生犬瘟热，观察得 10 只仔犬发现症状到死亡分别为 7、8、8、9、 11、12、12、13、14、14 天，求其中位数。此例 n=10，为偶数，则：

即保种群平均规模为208.33头对于同一资料,算术平均数>几何平均数>调和平均数上述五种平均数,最常用的是算术平均数。第二节标准差、标准差的意义用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。如果各观测值变异小,则平均数对样本的代表性强:如果各观测值变异大,则平均数代表性弱。因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。全距大,则资料中各观测值变异程度大,全距小,则资料中各观测值变异程度小。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,即(x-x),称为离均差。虽然离均差能表达一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ(x-x)=0, 因而不能用离均差之和Σ(x-x)来表示资料中所有观测值的总偏离程度。为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值n求得平均绝对离差,即Σ|x-xl。虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先将各个离均差平方,即(x-x)2,再求离均差平方和,即Σ(x-x)2,简称平方和,记为SS 由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小, 即∑(x-x)2/n,求出离均差平方和的平均数:为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n1, 于是,我们采用统计量Σ(x-x)2/n-1表示资料的变异程度。统计量Σ(x-x)2/n-1称为均方( mean square缩写为Ms),又称样本方差,记为S,即相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为: (x-μ)2Z/N 由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S的平方根叫做样本标准差,记为S,即

27 即保种群平均规模为 208.33 头。对于同一资料，算术平均数>几何平均数>调和平均数。上述五种平均数，最常用的是算术平均数。第二节标准差一、标准差的意义用平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。如果各观测值变异小，则平均数对样本的代表性强；如果各观测值变异大，则平均数代表性弱。因而仅用平均数对一个资料的特征作统计描述是不全面的，还需引入一个表示资料中观测值变异程度大小的统计量。全距（极差）是表示资料中各观测值变异程度大小最简便的统计量。全距大，则资料中各观测值变异程度大，全距小，则资料中各观测值变异程度小。但是全距只利用了资料中的最大值和最小值，并不能准确表达资料中各观测值的变异程度，比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时，可以利用全距这个统计量。为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测值与平均数的离差，即（ x − x ），称为离均差。虽然离均差能表达一个观测值偏离平均数的性质和程度，但因为离均差有正、有负，离均差之和为零，即Σ（ x − x ）=0，因而不能用离均差之和Σ（ x − x ）来表示资料中所有观测值的总偏离程度。为了解决离均差有正、有负，离均差之和为零的问题，可先求离均差的绝对值并将各离均差绝对值之和除以观测值 n 求得平均绝对离差，即Σ| x − x |/n。虽然平均绝对离差可以表示资料中各观测值的变异程度，但由于平均绝对离差包含绝对值符号，使用很不方便，在统计学中未被采用。我们还可以采用将离均差平方的办法来解决离均差有正、有负，离均差之和为零的问题。先将各个离均差平方，即 ( x − x ) 2，再求离均差平方和，即Σ 2 (x − x) ，简称平方和，记为 SS；由于离差平方和常随样本大小而改变，为了消除样本大小的影响，用平方和除以样本大小，即Σ (x x) / n 2 − ，求出离均差平方和的平均数；为了使所得的统计量是相应总体参数的无偏估计量，统计学证明，在求离均差平方和的平均数时，分母不用样本含量 n，而用自由度 n-1，于是，我们采用统计量Σ ( ) / 1 2 x − x n − 表示资料的变异程度。统计量Σ ( ) / 1 2 x − x n − 称为均方（mean square 缩写为 MS）,又称样本方差，记为 S 2 ，即 S 2 =( − ) / −1 2 x x n （3—9）相应的总体参数叫总体方差，记为σ2 。对于有限总体而言，σ2 的计算公式为： σ2 =(x − μ）2 /N （3—10）由于样本方差带有原观测单位的平方单位，在仅表示一个资料中各观测值的变异程度而不作其它分析时，常需要与平均数配合使用，这时应将平方单位还原，即应求出样本方差的平方根。统计学上把样本方差 S 2 的平方根叫做样本标准差，记为 S，即：

30 （或）平均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为：  = 100% x S C V （3—15）【例 3.11】已知某良种猪场长白成年母猪平均体重为 190kg，标准差为 10.5kg，而大约克成年母猪平均体重为 196kg，标准差为 8.5kg，试问两个品种的成年母猪，那一个体重变异程度大。此例观测值虽然都是体重，单位相同，但它们的平均数不相同，只能用变异系数来比较其变异程度的大小。由于，长白成年母猪体重的变异系数： 100% 5.53% 190 10.5 C V =  = 大约克成年母猪体重的变异系数： 100% 4.34% 196 8.5 C V =  = 所以，长白成年母猪体重的变异程度大于大约克成年母猪。注意，变异系数的大小，同时受平均数和标准差两个统计量的影响，因而在利用变异系数表示资料的变异程度时，最好将平均数和标准差也列出。习题 1、生物统计中常用的平均数有几种？各在什么情况下应用？ 2、何谓算术平均数？算术平均数有哪些基本性质？ 3、何谓标准差？标准差有哪些特性？ 4、何谓变异系数？为什么变异系数要与平均数、标准差配合使用？ 5、10 头母猪第一胎的产仔数分别为：9、8、7、10、12、10、11、14、8、9 头。试计算这 10 头母猪第一胎产仔数的平均数、标准差和变异系数。（ x =9.8 头，S=2.098 头，C·V=21.40%）。 6、随机测量了某品种 120 头 6 月龄母猪的体长，经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。组别组中值（x）次数（f） 80— 84 2 88— 92 10 96— 100 29 104— 108 28 112— 116 20 120— 124 15 128— 132 13 136— 140 3 （ x =111.07cm，S=12.95cm, C·V=11.66%）。 7、某年某猪场发生猪瘟病，测得 10 头猪的潜伏期分别为 2、2、3、3、4、4、4、5、9、12(天)。试求潜伏期的中位数。（4 天） 8、某良种羊群 1995—2000 年六个年度分别为 240、320、360、400、420、450 只，试求该良种羊群的

生物统计学：《生物统计附试验设计》课程教材（第三版）第三章 平均数、标准差与变异系数

生物统计学：《生物统计附试验设计》课程教材（第三版）第三章平均数、标准差与变异系数