第十讲 第三章误差和分析数据和得理 10- 3-3随机误差的正态分布 频率分布 在相同条件下对某样品中镍的质量分数(%) 进行重复测定,得到90个测定值如下: 1601.671.671641.581.641.671.621571.60 1.591.641.741651.641.611.651.691.641.63 1.651.701.631.621.701651.681.661.691.70 1701.631.671.701.701.631.571.591.621.60 1.531.561.581601.581591.611.621.551.52 1491.561571.611.611.611.501.531.531.59 1.661.631.541.661.641.641.641.621.621.65 1.601.631.621.611.651.611.641.631.541.61 1601.641.651591.581.591.601.671.681.69
第十讲 第三章 误差和分析数据和得理 10-1 3-3 随机误差的正态分布 一、 频率分布 在相同条件下对某样品中镍的质量分数(%) 进行重复测定,得到90个测定值如下: 1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69
第十讲 第三章误差和分析数据和得理 10-2 首先视样本容量的大小将所有数据分成若干组: 容量大时分为10-20组,容量小时(n<50)分为57 组,本例分为9组。 再将全部数据由小至大排列成序,找出其中最 大值和最小值,算出极差R。由极差除以组数算出 组距。本例中的R=1.74%-149%=0.25%,组距 R/9=0.25%/9=0.03%。每组内两个数据相差003% 即:148-1.51,151-154等等。为了使每一个数据只 能进入某一组内,将组界值较测定值多取一位。即: 1.485-1.515,1515-1.545,1545-1.575等等。 统计测定值落在每组内的个数(称为频数), 再计算出数据出现在各组内的频率(即相对频数)
第十讲 第三章 误差和分析数据和得理 10-2 首先视样本容量的大小将所有数据分成若干组: 容量大时分为10-20组,容量小时(n<50)分为5-7 组,本例分为9组。 再将全部数据由小至大排列成序,找出其中最 大值和最小值,算出极差R。由极差除以组数算出 组距。本例中的R=1.74%-1.49%=0.25%,组距= R/9=0.25%/9=0.03%。每组内两个数据相差0.03% 即:1.48-1.51,1.51-1.54等等。为了使每一个数据只 能进入某一组内,将组界值较测定值多取一位。即: 1.485-1.515,1.515-1.545,1.545-1.575等等。 统计测定值落在每组内的个数(称为频数), 再计算出数据出现在各组内的频率(即相对频数)
第十讲 第三章误差和分析数据和得理 10-3 分组(%) 频数 频率 1.485-1.515 0.022 1.515-1.545 0.067 1.545-1.575 6 0.067 1.575-1.605 17 0.189 1.605-1.635 22 0.244 1.635-1.665 20 0.222 1.665-1.695 10 0.111 1695-1.725 6 0.067 1.725-1.755 0.01 90 1.00
第十讲 第三章 误差和分析数据和得理 10-3 分组(%) 频数 频率 1.485-1.515 2 0.022 1.515-1.545 6 0.067 1.545-1.575 6 0.067 1.575-1.605 17 0.189 1.605-1.635 22 0.244 1.635-1.665 20 0.222 1.665-1.695 10 0.111 1.695-1.725 6 0.067 1.725-1.755 1 0.011 ∑ 90 1.00
第十讲 第三章误差和分析数据和得理 10-4 0。3001 j206 169 1.9851.5451。6051.6651725 1.5151.5751.6351695:75s 图3-3频率分布的直方图
第十讲 第三章 误差和分析数据和得理 10-4 图3-3 频率分布的直方图
第十讲 三章误差和分析数据和得理 10-5 由表中的数据和图3-3可以看出,测定数据的 分布并非杂乱无章,而是呈现出某些规律性。在全 部数据中,平均值1.62%所在的组(第五组)具有 最大的频率值,处于它两侧的数据组,其频率值仅 次之。统计结果表明:测定值出现在平均值附近的 频率相当高,具有明显的集中趋势;而与平均值相 差越大的数据出现的频率越小。 、正态分布 正态分布,又称高斯分布,它的数学表达式即 正态分布函数式为: y=f() 2 (3-13) O√2丌
第十讲 第三章 误差和分析数据和得理 10-5 由表中的数据和图3-3可以看出,测定数据的 分布并非杂乱无章,而是呈现出某些规律性。在全 部数据中,平均值1.62%所在的组(第五组)具有 最大的频率值,处于它两侧的数据组,其频率值仅 次之。统计结果表明:测定值出现在平均值附近的 频率相当高,具有明显的集中趋势;而与平均值相 差越大的数据出现的频率越小。 二、正态分布 正态分布,又称高斯分布,它的数学表达式即 正态分布函数式为: (3-13) 2 2 2 ( ) 2 1 ( ) − − = = x y f x e
第十讲 三章误差和分析数据和得理 10-6 式中y表明测定次数趋于无限时,测定值x出现 的概率密度。若以x值表示横坐标,y值表示纵坐标, 就得到测定值的正态分布曲线。曲线的最高点,它 对应的横坐标值μ即为总体平均值,这就说明了在 等精密度的许多测定值中,平均值是出现概率最大 的值 式(3-13)中的σ为总体标准偏差,是曲线两 侧的拐点之一到直线x=μ的距离,它表征了测定值 的分散程度。标准偏差较小的曲线陡峭,表明测定 值位于μ附近的概率较大,即测定的精密度高。与 此相反,具有较大标准偏差较大的曲线平坦,表明 测定值位于附近的概率较小,即测定的精密度低
第十讲 第三章 误差和分析数据和得理 10-6 式中y表明测定次数趋于无限时,测定值xi出现 的概率密度。若以x值表示横坐标,y值表示纵坐标, 就得到测定值的正态分布曲线。曲线的最高点,它 对应的横坐标值μ即为总体平均值,这就说明了在 等精密度的许多测定值中,平均值是出现概率最大 的值。 式(3-13)中的σ为总体标准偏差,是曲线两 侧的拐点之一到直线x=μ的距离,它表征了测定值 的分散程度。标准偏差较小的曲线陡峭,表明测定 值位于μ附近的概率较大,即测定的精密度高。与 此相反,具有较大标准偏差较大的曲线平坦,表明 测定值位于μ附近的概率较小,即测定的精密度低
第十讲 第三章误差和分析数据和得理 10-7 图3-4正态分布曲线 (μ相同,σ2>1)
第十讲 第三章 误差和分析数据和得理 10-7 图3-4 正态分布曲线 (μ相同,σ2>σ1)
第十讲 第三章误差和分析数据和得理 10-8 综上所述,一旦μ和G确定后,正态分布曲线的 位置和形状也就确定,因此μ和G是正态分布的两个 基本参数,这种正态分布用N(μ,a2)表示。 正态分布曲线关于直线x=呈钟形对称,且具 有以下特点: 1对称性绝对值大小相等的正负误差出现的概 率相等,因此它们常可能部分或完全相互低消。 2单峰性峰形曲线最高点对应的横坐标x-值 等于0,表明随机误差为0的测定值出现的概率密度 最大 3有界性一般认为,误差大30的测定值 并非是由随机误差所引起的。也就是说,随机误差 的分布具有有限的范围,其值大小是界的
第十讲 第三章 误差和分析数据和得理 10-8 综上所述,一旦μ和σ确定后,正态分布曲线的 位置和形状也就确定,因此μ和σ是正态分布的两个 基本参数,这种正态分布用N(μ,σ 2)表示。 正态分布曲线关于直线x=μ呈钟形对称,且具 有以下特点: 1.对称性 绝对值大小相等的正负误差出现的概 率相等,因此它们常可能部分或完全相互低消。 2.单峰性 峰形曲线最高点对应的横坐标x-μ值 等于0,表明随机误差为0的测定值出现的概率密度 最大。 3.有界性 一般认为,误差大于 的测定值 并非是由随机误差所引起的。也就是说,随机误差 的分布具有有限的范围,其值大小是界的。 3
第十讲 三章误差和分析数据和得理 10-9 标准正态分布 由于μ和G不同时就有不同的正态分布,曲线的 形状也随之而变化。为了使用方便,将正态分布曲 线的横坐标改用u来表示(以σ为单位表示随机误 差),并定义 (3-14) 代入(3-13)中得: y=f(x) e 2丌 由于ax=Ol
第十讲 第三章 误差和分析数据和得理 10-9 三、标准正态分布 由于μ和σ不同时就有不同的正态分布,曲线的 形状也随之而变化。为了使用方便,将正态分布曲 线的横坐标改用u来表示(以σ为单位表示随机误 差),并定义 (3-14) 代入(3-13)中得: 由于 − = x u 2 2 2 1 ( ) u y f x e − = = dx =du
第十讲 第三章误差和分析数据和得理 10-10 故 f(x)dx √2 e2ah=Φ(L)dlu u称为标准正态变量。此时式(3-13)就转化 成只有变量u的函数表达式: y=P(uIu e (3-15) 经过上述变换,总体平均值为p的任一正态分 布均可化为μ=0,a2=1的标准正态分布,以N(0,1) 表示。标准正态分布曲线如图3-5所示,曲线的形 状与和G的大小无关
第十讲 第三章 误差和分析数据和得理 10-10 故 u称为标准正态变量。此时式(3-13)就转化 成只有变量u的函数表达式: (3-15) 经过上述变换,总体平均值为μ的任一正态分 布均可化为μ=0,σ 2=1的标准正态分布,以N(0,1) 表示。标准正态分布曲线如图3-5所示,曲线的形 状与μ和σ的大小无关。 f x dx e du u du u ( ) 2 1 ( ) 2 2 = = − 2 2 2 1 ( ) u y u e − = =