第八章分析实验数据处理 8-1数据的特征及分布 数理统计的某些基本概念 1、总体与样本 总个 体:被研究对象某特性值的全体。 体:组成总体的每个单元。 样本(子样):自总体中随机抽取的一部分个体。 样本容量:样本中所包含个体的数目,用廬示。 2、随机变量 来自同一总体的无限多个测量值都是随机出现的, 叫随机变量。 多次重复测定的结果不能相同,也不能事先知道。 测量值一经取定就是一个常量,不再有随机性
8-1 数据的特征及分布 一、数理统计的某些基本概念 1、总体与样本 总 体 : 被研究对象某特性值的全体。 个 体 : 组成总体的每个单元。 样本(子样): 自总体中随机抽取的一部分个体。 样 本 容 量 : 样本中所包含个体的数目,用n表示。 2、随机变量 来自同一总体的无限多个测量值都是随机出现的, 叫随机变量。 多次重复测定的结果不能相同,也不能事先知道。 测量值一经取定就是一个常量,不再有随机性。 第八章 分析实验数据处理
二、随机变量的频数分布 例〉学生测定BaC2H2O试剂中Ba含量 (%),共有190个数据,区间为55489 5646%将这些数据按组距01.分成10组。 频数:每组中数据的个数 相对频数:频数在总测定 次数中所占的分数 以各组区间为底相对频数 为高做成一排矩形的相对 频数分布直方图 相对频数分布直方图
二、随机变量的频数分布 〈例〉 学生测定 BaCl2·2H2O 试剂中 Ba 含 量 ( % ),共有 190 个数据,区间为 55.48%- 56.46%。将这些数据按组距0.1来分成10组。 频数:每组中数据的个数 相对频数:频数在总测定 次数中所占的分数 以各组区间为底相对频数 为高做成一排矩形的相对 频数分布直方图
其特点 1.离散特性:测定值在平均值周围波动, 波动的程度用总体标准偏差表示 总体标准偏差 2.集中趋势:向平均值集中 =im-∑x总体平均值 n-o n 在确认消除系统误差的前提下,总体平均值就是真 值
其特点: 1. 离散特性: 测定值在平均值周围波动, 波动的程度用总体标准偏差表示 n x n i ∑ i = − = 1 2 ( µ) σ 2. 集中趋势:向平均值集中 ∑ = →∞ = n i i n x n 1 1 µ lim 总体平均值 总体标准偏差 在确认消除系统误差的前提下,总体平均值就是真 值
随机变量的正态分布 当数据无限多,组分的很细时,上述直方图 则变成一条圆滑的曲线,称为正态分布。其数学 表达式称为正态分布密度函数 (x-) f(r) e √2兀 fu) 正态分布曲线
三、 随机变量的正态分布 当数据无限多,组分的很细时,上述直方图 则变成一条圆滑的曲线,称为正态分布。其数学 表达式称为正态分布密度函数 2 2 2 ( ) e 2 π 1 ( ) σ µ σ − − = x f x
其两个重要参数为、σ,记为 N(、a),决定曲线在x轴的位置,a 决定曲线的形状 σ小→曲线高、陡峭、卿 b/o=0. 精密度好; σ大→曲线低、平坦 精密度差。 正态分布的两个参数
其两个重要参数 为 µ、 σ, 记为 N(µ、 σ2), µ 决定曲线在 x轴的位置, σ 决定曲线的形状 σ 小 →曲线高、陡峭、 精密度好; σ 大 →曲线低、平坦、 精密度差
随机误差符合正态分布 1.大误差出现的几率小,小误差出现的几率大 2.绝对值相等的正负误差出现的几率相等。 3.误差为零的测量值出现的几率最大。 所有测量值出现的概率总和应为1,即 P(-0,∞) e dx=l 2兀 求变量在某区间出现的概率,即对该区间求积分 P(a,b)=I O√2m
随机误差符合正态分布 1.大误差出现的几率小,小误差出现的几率大。 2.绝对值相等的正负误差出现的几率相等。 3.误差为零的测量值出现的几率最大。 所有测量值出现的概率总和应为 1,即 e d 1 2 π 1 ( , ) 2 2 2 ( ) −∞ ∞ = = − ∞ − ∫− ∞ P x x σ µ σ 求变量在某区间出现的概率,即对该区间求积分 P a b x x b a e d 2 π 1 ( , ) 2 2 2 ( ) σ µ σ − − ∫ =
对于不同的、σ有不同的 曲线,积分比较麻烦,为 简化做数学上的变量转 换,令n=x 将上式两端微分得adu=dx f(x)dx==2= jou-2ou-nu toubou*30 x -26-00。23x 682% 9546% 9973% 此时正态分布转换为标准 正态分布,记为N0,12) 标准正态分布 99.74
对于不同的µ、σ 有不同的 曲线,积分比较麻烦,为 简化做数学上的变量转 换,令 σ − µ = x u 将上式两端微分得 σ du=dx f x x u f u u u e d ( )d 2π1 ( )d 2 2 = = − 此时正态分布转换为标准 正态分布,记为N(0,12)。 99.74
积分P e2du已被做成概率积分表 2兀 正态分布概丰积分表 面积一a l面积s|面积1面积 00.00001.00.3413 0.4773 010.081.103643|2104821 020.073.203892204861 0301791.30.4032 30.4893 0.4a15.40.419240418 05a19151.5a482250438 06022581.604452260453 0702801.70527065 0.8028811.8046412804974 a935s1.9a73290.87
积分 已被做成概率积分表 P u u u e d 2 π 1 2 0 2 − ∫ =
x-p x P%o =±1±a P=2×0.3413=0.6826=68.26% l=±2±20-20(+20P=2×04773=09546=9546% =±3±3030+30P=2×04987=0994=9974% 按照正态分布x在区间(k0.5+1.50出现的概率 解:根据l 可将0.50≤x≤H+1.50变换为-5≤≤1.5 查表l=0.5时面积为01915 =1.5时面积为04332 则-0.5≤≤1的总面积即为x在区间(-0.5, +1.5o)出现的概率P=0.1915+0.43=0.6247
u x -μ x P % u=±1 ±σ µ-σ µ+σ P=2× 0.3413 = 0.6826 =68.26% u=± 2 ± 2σ µ-2σ µ+2σ P=2× 0.4773 = 0.9546 =95.46% u=± 3 ± 3σ µ-3σ µ+3σ P=2× 0.4987 = 0.9974=99.74% 按照正态分布x在区间(µ-0.5σ, µ+1.5σ)出现的概率 解: 根据 σ x u − µ = 可将 µ-0.5σ ≤x ≤µ+1.5σ 变换为 -0.5≤u ≤1.5 查表 u=0.5 时 面积为0.1915 u=1.5 时 面积为0.4332 则-0.5≤ u ≤1.5的总面积即为x在区间( µ - 0.5σ , µ +1.5σ )出现的概率 P = 0.1915 + 0.4332=0.6247