第三章平均数、标准差与变异系数 本章重点介绍平均数(mean)、标准差( standard deviation)与变异系数( variation coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而 分布的性质:后两者用于反映资料的离散性,即观测值离中分散变异的性质。 第一节平均数 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位 置。在畜牧业、水产业生产实践和科学硏究中,平均数被广泛用来描述或比较各种技术措施 的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数( arithmetic mean) 中位数( median)、众数(mode)、几何平均数( geometric mean)及调和平均数( harmonic mean),现分别介绍如下 、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数 记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算 (一)直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算 设某一资料包含n个观测值:x1、x、…、x,则样本平均数x可通过下式计算: 平s互1+x2+…+3= (3-1) n 其中,x为总和符号:∑x表示从第一个观测值x累加到第n个观测值xm。当∑x 在意义上已明确时,可简写为Σx,(3-1)式即可改写为 【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、58 00、480、510、505、490(kg),求其平均体重 由于∑x=500+520+535+560+585+600+480+510+505+490=5285,n=10 代入(3-1)式得 ∑x5285 =5285(kg) 即10头种公牛平均体重为5285kg。 (二)加权法对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础 上采用加权法计算平均数,计算公式为:
22 第三章 平均数、标准差与变异系数 本章重点介绍平均数(mean)、标准差(standard deviation)与变异系数(variation coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而 分布的性质;后两者用于反映资料的离散性,即观测值离中分散变异的性质。 第一节 平均数 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位 置。在畜牧业、水产业生产实践和科学研究中,平均数被广泛用来描述或比较各种技术措施 的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数(arithmetic mean)、 中位数(median)、众数(mode)、几何平均数(geometric mean)及调和平均数(harmonic mean),现分别介绍如下。 一、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数, 记为 x 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 主要用于样本含量 n≤30 以下、未经分组资料平均数的计算。 设某一资料包含 n 个观测值:x1、x2、…、xn,则样本平均数 x 可通过下式计算: n x n x x x x n i i n = = + + + = 1 2 1 (3-1) 其中,Σ为总和符号; = n i i x 1 表示从第一个观测值 x1 累加到第 n 个观测值 xn。当 = n i i x 1 在意义上已明确时,可简写为Σx,(3-1)式即可改写为: n x x =∑ 【例 3.1】 某种公牛站测得 10 头成年公牛的体重分别为 500、520、535、560、585、 600、480、510、505、490(kg),求其平均体重。 由于Σx=500+520+535+560+585+600+480+510+505+490=5285,n=10 代入(3—1)式得: 528.5(kg) 10 ∑ 5285 = = = n x x 即 10 头种公牛平均体重为 528.5 kg。 (二)加权法 对于样本含量 n≥30 以上且已分组的资料,可以在次数分布表的基础 上采用加权法计算平均数,计算公式为:
f+1x2+…+f fr (3-2) ∑f 式中:x,一第i组的组中值 f-第i组的次数 k一分组数 第i组的次数后是权衡第i组组中值x在资料中所占比重大小的数量,因此f称为是x 的“权”,加权法也由此而得名 【例3.2】将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如 下,求其加权数平均数。 表3-1100头长白母猪仔猪一月窝重次数分布表 组中值(x) 次数(0 3 3 910 1350 24 1320 60 520 70 75 合计 100 4520 利用(3-2)式得 fx4520 即这100头长白母猪仔猪一月龄平均窝重为452kg 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权 法计算 【例3.3】某牛群有黑白花奶牛1500头,其平均体重为750kg,而另一牛群有黑白 花奶牛1200头,平均体重为725kg,如果将这两个牛群混合在一起,其混合后平均体重为 多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛 群牛的头数为权,求两个牛群平均体重的加权平均数,即 750×1500+725×120 即两个牛群混合后平均体重为73889k (三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零
23 = = + + + + + + = = = f f x f f x f f f f x f x f x x k i i k i i i k k k 1 1 1 2 1 1 2 2 (3-2) 式中: i x —第 i 组的组中值; i f —第 i 组的次数; k —分组数 第 i 组的次数 fi 是权衡第 i 组组中值 xi 在资料中所占比重大小的数量,因此 fi 称为是 xi 的“权”,加权法也由此而得名。 【例 3.2】 将 100 头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如 下,求其加权数平均数。 表 3—1 100 头长白母猪仔猪一月窝重次数分布表 组别 组中值(x) 次数(f) f x 10— 15 3 45 20— 25 6 150 30— 35 26 910 40— 45 30 1350 50— 55 24 1320 60— 65 8 520 70— 75 3 225 合计 100 4520 利用(3—2)式得: 45.2( ) 100 4520 k g f fx x = = = 即这 100 头长白母猪仔猪一月龄平均窝重为 45.2kg。 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权 法计算。 【例 3.3】 某牛群有黑白花奶牛 1500 头,其平均体重为 750 kg,而另一牛群有黑白 花奶牛 1200 头,平均体重为 725 kg,如果将这两个牛群混合在一起,其混合后平均体重为 多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛 群牛的头数为权,求两个牛群平均体重的加权平均数,即 738.89( ) 2700 750 1500 725 1200 k g f f x x = + = = 即两个牛群混合后平均体重为 738.89 kg。 (三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零
或简写成∑(x-x)=0 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小 (x-x)2 Xi-a (常数a≠x) 或简写为:∑(x-x)2<∑(x-a) 以上两个性质可用代数方法予以证明,这里从略。 对于总体而言,通常用μ表示总体平均数,有限总体的平均数为 (3-3) 式中,N表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏 估计量。统计学中常用样本平均数(x)作为总体平均数(μ)的估计量,并已证明样本平 均数是总体平均数μ的无偏估计量 中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为 Ma。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中 数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方 法因资料是否分组而有所不同。 (一)未分组资料中位数的计算方法对于未分组资料,先将各观测值由小到大 依次排列 1、当观测值个数n为奇数时,(n+12位置的观测值,即xm+为中位数; Md=x(n+1)2 2、当观测值个数为偶数时,m2和(n2+1)位置的两个观测值之和的1/2为中 位数,即 2 【例3.4】观察得9只西农莎能奶山羊的妊娠天数为144、145、147、149、150、151 53、156、157,求其中位数。 此例m=9,为奇数,则 M=xn+112=x9+12=x5=150(天) 即西农莎能奶山羊妊娠天数的中位数为150天 【例3.5】某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、 l1、12、12、13、14、14天,求其中位数。 此例n=10,为偶数,则:
24 ( ) 0 1 − = = x x n i i 或简写成 (x − x) = 0 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 = n i 1 (xi- x ) 2< = n i 1 (xi- a) 2 (常数 a≠ x ) 或简写为: − 2 (x x) < − 2 (x ) 以上两个性质可用代数方法予以证明,这里从略。 对于总体而言,通常用μ表示总体平均数,有限总体的平均数为: x N n i i = = 1 (3-3) 式中,N 表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏 估计量。统计学中常用样本平均数( x )作为总体平均数(μ)的估计量,并已证明样本平 均数 x 是总体平均数μ的无偏估计量。 二、中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为 Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中 数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方 法因资料是否分组而有所不同。 (一)未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大 依次排列。 1、当观测值个数 n 为奇数时,(n+1)/2 位置的观测值,即 x(n+1)/2为中位数; Md= (n+1)/ 2 x 2、当观测值个数为偶数时,n/2 和(n/2+1)位置的两个观测值之和的 1/2 为中 位数,即: 2 / 2 + ( / 2+1) = n n d x x M (3-4) 【例 3.4】 观察得 9 只西农莎能奶山羊的妊娠天数为 144、145、147、149、150、151、 153、156、157,求其中位数。 此例 n=9,为奇数,则: Md= ( 1)/ 2 (9 1)/ 2 5 x x x n+ = + = =150(天) 即西农莎能奶山羊妊娠天数的中位数为 150 天。 【例 3.5】 某犬场发生犬瘟热,观察得 10 只仔犬发现症状到死亡分别为 7、8、8、9、 11、12、12、13、14、14 天,求其中位数。 此例 n=10,为偶数,则:
11.5(天) 即10只仔犬从发现症状到死亡天数的中位数为11.5天 (二)已分组资料中位数的计算方法若资料己分组,编制成次数分布表,则可 利用次数分布表来计算中位数,其计算公式为 L+ I n 式中:L一中位数所在组的下限 一组距; f中位数所在组的次数; 总次数 c一小于中数所在组的累加次数。 【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表 如表3-2所示,求中位数。 表3—268头母牛从分娩到第一次发情间隔时间次数分布表 间隔时间(d) 头数( 累加头数 12-26 741 42-56 57-7l 72—86 16 87-101 102-116 ≥117 2 由表3-2可见:15,m=68,因而中位数只能在累加头数为36所对应的“57-71”这 一组,于是可确定L=57,户=20,C=16,代入公式(3-5)得 M4=L+G7-c)=57156816)=70.5(天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。 三、几何平均数 n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为G。它主要应用于畜 牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长 率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代 表其平均水平。其计算公式如下: (3-6) 为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得
25 11.5 2 11 12 2 2 / 2 ( / 2 1) 5 6 = + = + = + = x x + x x M n n d (天) 即 10 只仔犬从发现症状到死亡天数的中位数为 11.5 天。 (二)已分组资料中位数的计算方法 若资料已分组,编制成次数分布表,则可 利用次数分布表来计算中位数,其计算公式为: ) 2 ( c n f i M d = L + − (3—5) 式中:L—中位数所在组的下限; i—组距; f—中位数所在组的次数; n—总次数; c—小于中数所在组的累加次数。 【例 3.6】 某奶牛场 68 头健康母牛从分娩到第一次发情间隔时间整理成次数分布表 如表 3—2 所示,求中位数。 表 3—2 68 头母牛从分娩到第一次发情间隔时间次数分布表 间隔时间(d) 头数(f) 累加头数 12—26 1 1 27—41 2 3 42—56 13 16 57—71 20 36 72—86 16 52 87—101 12 64 102—116 2 66 ≥117 2 68 由表 3—2 可见:i=15,n=68,因而中位数只能在累加头数为 36 所对应的“57—71”这 一组,于是可确定 L=57,f=20,C=16,代入公式(3—5)得: 16) 70.5 2 68 ( 20 15 ) 57 2 = + ( − c = + − = n f i M d L (天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为 70.5 天。 三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为 G。它主要应用于畜 牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长 率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代 表其平均水平。其计算公式如下: n n n n G x x x x x x x x 1 ( ) = 1 2 3 = 1 2 3 (3—6) 为了计算方便,可将各观测值取对数后相加除以 n,得 lgG,再求 lgG 的反对数,即得
G值,即 G=lg-[(gx+lg x2+-+1g x,) 【例3.7】某波尔山羊群197-2000年各年度的存栏数见表3-3,试求其年平均增 长率 表3-3某波尔山羊群各年度存栏数与增长率 年度 存栏数(只) 增长率(x) 1997 140 280 0.398 2000 350 0.250 0.602 利用公式(3-7)求年平均增长率 G=lg-[(x1+gx2+…+gxn =g[(-0.368-0.398-0602) lgl(-0.456)=0.3501 即年平均增长率为0.3501或3501% 四、众数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M。如 表2-3所列的50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数 为22天。又如【例36】所列出的次数分布表中,57-71这一组次数最多,其组中值为64 天,则该资料的众数为64天 五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即 ∑¥ 调和平均数主要用于反映畜群不冋阶段的平均增长率或畜群不同规模的平均规模 【例3.8】某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220 头,2世代210头;3世代190头,4世代210头,试求其平均规模 利用公式(3-9)求平均规模: 20833(头) 3(如+如+如10+1+20)3(024)00048
26 G 值,即 (lg lg lg )] 1 lg [ 1 2 1 n x x x n G = + + + − (3—7) 【例 3.7】 某波尔山羊群 1997—2000 年各年度的存栏数见表 3—3,试求其年平均增 长率。 表 3—3 某波尔山羊群各年度存栏数与增长率 年度 存栏数(只) 增长率(x) Lgx 1997 140 — — 1998 200 0.429 -0.368 1999 280 0.400 -0.398 2000 350 0.250 -0.602 Σlgx=-1.368 利用公式(3—7)求年平均增长率 G= (lg lg lg )] 1 lg [ 1 2 1 n x x x n + + + − =lg-1 [ 3 1 (-0.368-0.398–0.602)] =lg-1(-0.456)=0.3501 即年平均增长率为 0.3501 或 35.01%。 四、众 数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为 M0。如 表 2-3 所列的 50 枚受精种蛋出雏天数次数分布中,以 22 出现的次数最多,则该资料的众数 为 22 天。又如【例 3.6】所列出的次数分布表中,57—71 这一组次数最多,其组中值为 64 天,则该资料的众数为 64 天。 五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为 H,即 = + + = n x x xn n x H 1 1 1 1 1 1 1 ( ) 1 1 2 (3—8) 调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 【例 3.8】 某保种牛群不同世代牛群保种的规模分别为:0 世代 200 头,1 世代 220 头,2 世代 210 头;3 世代 190 头,4 世代 210 头,试求其平均规模。 利用公式(3—9)求平均规模: 208.33 0.0048 1 (0.024) 1 ( ) 1 5 1 210 1 190 1 210 1 220 1 200 1 5 1 = = = + + + + H = (头)
即保种群平均规模为208.33头 对于同一资料,算术平均数>几何平均数>调和平均数 上述五种平均数,最常用的是算术平均数。 第二节标准差 、标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。如 果各观测值变异小,则平均数对样本的代表性强:如果各观测值变异大,则平均数代表性弱。 因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值 变异程度大小的统计量。 全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。全距大,则资料中 各观测值变异程度大,全距小,则资料中各观测值变异程度小。但是全距只利用了资料中的 最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又 要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求 出各个观测值与平均数的离差,即(x-x),称为离均差。虽然离均差能表达一个观测值偏 离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ(x-x)=0, 因而不能用离均差之和Σ(x-x)来表示资料中所有观测值的总偏离程度。为了解决离均 差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除 以观测值n求得平均绝对离差,即Σ|x-x。虽然平均绝对离差可以表示资料中各观测值 的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。 我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先 将各个离均差平方,即(x-x)2,再求离均差平方和,即Σ(x-x)2,简称平方和,记为SS 由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小, 即∑(x-x)2/n,求出离均差平方和的平均数:为了使所得的统计量是相应总体参数的无偏 估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1, 于是,我们采用统计量Σ(x-x)2/n-1表示资料的变异程度。统计量Σ(x-x)2/n-1称为均 方( mean square缩写为Ms),又称样本方差,记为S,即 ∑(x-x)2/n-1 相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为: ∑(x-u)2 由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而 不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的 平方根。统计学上把样本方差S的平方根叫做样本标准差,记为S,即
27 即保种群平均规模为 208.33 头。 对于同一资料,算术平均数>几何平均数>调和平均数。 上述五种平均数,最常用的是算术平均数。 第二节 标准差 一、标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。如 果各观测值变异小,则平均数对样本的代表性强;如果各观测值变异大,则平均数代表性弱。 因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值 变异程度大小的统计量。 全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。全距大,则资料中 各观测值变异程度大,全距小,则资料中各观测值变异程度小。但是全距只利用了资料中的 最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又 要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求 出各个观测值与平均数的离差,即( x − x ),称为离均差。虽然离均差能表达一个观测值偏 离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ( x − x )=0, 因而不能用离均差之和Σ( x − x )来表示资料中所有观测值的总偏离程度。为了解决离均 差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除 以观测值 n 求得平均绝对离差,即Σ| x − x |/n。虽然平均绝对离差可以表示资料中各观测值 的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。 我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先 将各个离均差平方,即 ( x − x ) 2,再求离均差平方和,即Σ 2 (x − x) ,简称平方和,记为 SS; 由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小, 即Σ (x x) / n 2 − ,求出离均差平方和的平均数;为了使所得的统计量是相应总体参数的无偏 估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量 n,而用自由度 n-1, 于是,我们采用统计量Σ ( ) / 1 2 x − x n − 表示资料的变异程度。统计量Σ ( ) / 1 2 x − x n − 称为均 方(mean square 缩写为 MS),又称样本方差,记为 S 2 ,即 S 2 =( − ) / −1 2 x x n (3—9) 相应的总体参数叫总体方差,记为σ2 。对于有限总体而言,σ2 的计算公式为: σ2 =(x − μ)2 /N (3—10) 由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而 不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的 平方根。统计学上把样本方差 S 2 的平方根叫做样本标准差,记为 S,即:
∑(x-x (3-11) 由于∑(x-x)=∑(x2-2x+x2) +m( ∑ 所以(3-11)式可改写为: (3-12) 相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为 0=∑(x-m)2/N 在统计学中,常用样本标准差S估计总体标准差σ 、标准差的计算方法 一)直接法对于未分组或小样本资料,可直接利用(3-11)或(3-12)式来计 算标准差 【例3.9】计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550 600,600,650(g)的标准差。 此例m=10,经计算得:∑x=5400,Σx2=2955000,代入(3-12)式得: x2-②x/m/295300540 =65.828(g) 即10只辽宁绒山羊产绒量的标准差为65.828g (二)加权法对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权 法计算标准差。计算公式为: x-x) ∑A-/∑ (3-14) 式中,∫为各组次数:x为各组的组中值;Σ/=n为总次数。 【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。 将表34中的x、∑众、Σ代入(3-14)式得
28 1 ( ) 2 − − = n x x S (3-11) 由于 ( − ) = ( − 2 + ) 2 2 2 x x x xx x 2 2 =x − 2xx + nx 2 2 2 ( ) ( ) 2 n x n n x x = − + n x x 2 2 ( ) = − 所以(3-11)式可改写为: 1 2 ( ) 2 − − = n x S n x (3-12) 相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为: σ= (x − ) / N 2 (3-13) 在统计学中,常用样本标准差 S 估计总体标准差σ。 二、标准差的计算方法 (一)直接法 对于未分组或小样本资料,可直接利用(3—11)或(3-12)式来计 算标准差。 【例 3.9】 计算 10 只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550, 600,600,650(g)的标准差。 此例 n=10,经计算得:Σx=5400,Σx 2=2955000,代入(3—12)式得: 65.828 10 1 2955000 5400 /10 1 ( ) / 2 2 2 = − − = − − = n x x n S (g) 即 10 只辽宁绒山羊产绒量的标准差为 65.828g。 (二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权 法计算标准差。计算公式为: − − = − − = 1 ( ) / 1 ( ) 2 2 2 f f x f x f f f x x S (3—14) 式中,f 为各组次数;x 为各组的组中值;Σf = n 为总次数。 【例 3.10】 利用某纯系蛋鸡 200 枚蛋重资料的次数分布表(见表 3-4)计算标准差。 将表 3-4 中的Σf、Σfx、Σfx2 代入(3—14)式得:
众2-///573071107052120 =35524(g) 即某纯系蛋鸡200枚蛋重的标准差为35524g 表3-4某纯系蛋鸡200枚蛋重资料次数分布及标准差计算表 组别组中值(x) 次数(O 44.15 45.0 135.0 6075.0 45.85 280.2 1308534 7.55 774.4 37480.96 49.25 50.1 l102.2 55220.22 1554.0 80497.20 52.65 53.5 2354.0 125939.00 55 15450 85317.12 56.9 1707.0 7128.30 57.75 58.6 703.2 41207.52 59.45 18180.45 61.15 62.0 248.0 15376.00 合计 220026=1070162=575011 三、标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差 也大,反之则小 (二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变 (三)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或 (四)在资料服从正态分布的条件下,资料中约有6826%的观测值在平均数左右一倍 标准差(x±S)范围内:约有9543%的观测值在平均数左右两倍标准差(x±2S)范围内 约有99.73%的观测值在平均数左右三倍标准差(x±3S)范围内。也就是说全距近似地等 于6倍标准差,可用(全距/6)来粗略估计标准差。 第三节变异系数 变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异 程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或) 平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对 值)来比较。标准差与平均数的比值称为变异系数,记为C·V。变异系数可以消除单位和
29 3.5524 200 1 575507.11 10705.1 / 200 1 ( ) / 2 2 2 = − − = − − = f f x f x f S (g) 即某纯系蛋鸡 200 枚蛋重的标准差为 3.5524g。 表 3—4 某纯系蛋鸡 200 枚蛋重资料次数分布及标准差计算表 组别 组中值(x) 次数(f) fx fx2 44.15— 45.0 3 135.0 6075.0 45.85— 46.7 6 280.2 13085.34 47.55— 48.4 16 774.4 37480.96 49.25— 50.1 22 1102.2 55220.22 50.95— 51.8 30 1554.0 80497.20 52.65— 53.5 44 2354.0 125939.00 54.35— 55.2 28 1545.0 85317.12 56.05— 56.9 30 1707.0 97128.30 57.75— 58.6 12 703.2 41207.52 59.45— 60.3 5 301.5 18180.45 61.15— 62.0 4 248.0 15376.00 合计 Σf=200 Σfx=10705.1 Σfx2 =575507.11 三、标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差 也大,反之则小。 (二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。 (三)当每个观测值乘以或除以一个常数 a,则所得的标准差是原来标准差的 a 倍或 1/a 倍。 (四)在资料服从正态分布的条件下,资料中约有 68.26%的观测值在平均数左右一倍 标准差( x ±S)范围内;约有 95.43%的观测值在平均数左右两倍标准差( x ±2S)范围内; 约有 99.73%的观测值在平均数左右三倍标准差( x ±3S)范围内。也就是说全距近似地等 于 6 倍标准差,可用( 全距/ 6 )来粗略估计标准差。 第三节 变异系数 变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异 程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或) 平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对 值)来比较。标准差与平均数的比值称为变异系数,记为 C·V。变异系数可以消除单位和
(或)平均数不同对两个或多个资料变异程度比较的影响 变异系数的计算公式为: C·V==×100% (3-15) 【例3.11】已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大 约克成年母猪平均体重为196kg,标准差为85kg,试问两个品种的成年母猪,那一个体重 变异程度大 此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较 其变异程度的大小 由于,长白成年母猪体重的变异系数:Cp=10.5×100%=55% 大约克成年母猪体重的变异系数:CV=85×1 所以,长白成年母猪体重的变异程度大于大约克成年母猪 注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系 数表示资料的变异程度时,最好将平均数和标准差也列出 习题 生物统计中常用的平均数有几种?各在什么情况下应用? 2、何谓算术平均数?算术平均数有哪些基本性质? 3、何谓标准差?标准差有哪些特性? 4、何谓变异系数?为什么变异系数要与平均数、标准差配合使用? 5、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。试计算这10头母猪 第一胎产仔数的平均数、标准差和变异系数。(x=9.8头,S=2.098头,C·21.40%)。 6、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平 均数、标准差与变异系数。 组别 组中值(x) 次数( 10 104 l16 136— (x=11107cm,S=1295cm,C·11.66%)。 7、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。试 求潜伏期的中位数。(4天) 8、某良种羊群1995-2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的
30 (或)平均数不同对两个或多个资料变异程度比较的影响。 变异系数的计算公式为: = 100% x S C V (3—15) 【例 3.11】 已知某良种猪场长白成年母猪平均体重为 190kg,标准差为 10.5kg,而大 约克成年母猪平均体重为 196kg,标准差为 8.5kg,试问两个品种的成年母猪,那一个体重 变异程度大。 此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较 其变异程度的大小。 由于,长白成年母猪体重的变异系数: 100% 5.53% 190 10.5 C V = = 大约克成年母猪体重的变异系数: 100% 4.34% 196 8.5 C V = = 所以,长白成年母猪体重的变异程度大于大约克成年母猪。 注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系 数表示资料的变异程度时,最好将平均数和标准差也列出。 习 题 1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、何谓算术平均数?算术平均数有哪些基本性质? 3、何谓标准差?标准差有哪些特性? 4、何谓变异系数?为什么变异系数要与平均数、标准差配合使用? 5、10 头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9 头。试计算这 10 头母猪 第一胎产仔数的平均数、标准差和变异系数。( x =9.8 头,S=2.098 头,C·V=21.40%)。 6、随机测量了某品种 120 头 6 月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平 均数、标准差与变异系数。 组别 组中值(x) 次数(f) 80— 84 2 88— 92 10 96— 100 29 104— 108 28 112— 116 20 120— 124 15 128— 132 13 136— 140 3 ( x =111.07cm,S=12.95cm, C·V=11.66%)。 7、某年某猪场发生猪瘟病,测得 10 头猪的潜伏期分别为 2、2、3、3、4、4、4、5、9、12(天)。试 求潜伏期的中位数。(4 天) 8、某良种羊群 1995—2000 年六个年度分别为 240、320、360、400、420、450 只,试求该良种羊群的
年平均增长率。(G=0.106或11.06%) 9、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、 30、140、120、110头。试计算平均世代规模。(H=123.17头) 10、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 128 乙地 129 131 130 (S甲=575cm,C.V442%;Sz=125cm,CVz=0.96%)
31 年平均增长率。(G=0.1106 或 11.06%)。 9、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续 5 个世代的规模分别为:120、 130、140、120、110 头。试计算平均世代规模。(H=123.17 头) 10、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地 137 133 130 128 127 119 136 132 乙地 128 130 129 130 131 132 129 130 (S 甲=5.75cm, C.V 甲=4.42%;S 乙=1.25cm,C.V 乙=0.96%)