概率论与数理统 第六章 数理统计的基本概念
1 概率论与数理统 计 第六章 数理统计的基本概念
第六章数理统计的基本概念 6.1总体与样本 6.1.1数理统计的基本问题 在前面的章节中,介绍了概率论的基本内容,从本 章开始将介绍一些数理统计的基本知识和一些常用 的数理统计方法 令概率论中许多问题的讨论,常常是从已给的随机变 量X出发来研究X的种种性质,那里X的概率分布都 是已知的,或者假设是已知的
2 第六章 数理统计的基本概念 v 6.1 总体与样本 v 6.1.1 数理统计的基本问题 v 在前面的章节中,介绍了概率论的基本内容,从本 章开始将介绍一些数理统计的基本知识和一些常用 的数理统计方法. v 概率论中许多问题的讨论,常常是从已给的随机变 量X出发来研究X的种种性质,那里X的概率分布都 是已知的,或者假设是已知的
令概率论中许多问题的讨论,常常是从已给的随机变 量X出发来研究X的种种性质,那里X的概率分布都 是已知的,或者假设是已知的 但是在实际问题中,一般说来,人们事先并不知道 随机事件的概率、随机变量的概率分布和数字特征 而需要对它们进行估计或作某种推断,这就产生了 数理统计的问题 下面看两个例子
3 v 概率论中许多问题的讨论,常常是从已给的随机变 量X出发来研究X的种种性质,那里X的概率分布都 是已知的,或者假设是已知的. v 但是在实际问题中,一般说来,人们事先并不知道 随机事件的概率、随机变量的概率分布和数字特征, 而需要对它们进行估计或作某种推断,这就产生了 数理统计的问题.v 下面看两个例子
例1从5000个产品中随机地抽检一个产品,结果可 能合格,也可能不合格. 令由概率论可知,这个现象可以用两点分布来描述: 这里,“X=0”表示产品不合格,“X=1”表示 品不合格,p为不合格率 但是,p等于多少是事先未知的,也就是说0-1分布 中的参数是未知的
4 v 例1 从5000个产品中随机地抽检一个产品,结果可 能合格,也可能不合格. v 由概率论可知,这个现象可以用两点分布来描述: X 0 1 P 1−p p v 这里, “X= 0”表示产品不合格, “X= 1”表示产 品不合格,p为不合格率. v 但是,p等于多少是事先未知的,也就是说0—1分布 中的参数是未知的
试问 (a)如何求出或近似地求出p的值? 令(b)如果人们根据以往的生产经验提出假设: p<0.05 那么,是同意这个假设还是否定这个假设呢?应该 用什么方法来检验?
5 v 试问 v (a)如何求出或近似地求出p的值? v (b)如果人们根据以往的生产经验提出假设: “ p<0.05” , v 那么,是同意这个假设还是否定这个假设呢?应该 用什么方法来检验?
令例2一个工厂生产某种规格的圆柱齿轮 令由于原料和加工过程中的种种随机因素的影响,各 个齿轮的径向综合误差X的数值一般是不同的,因 此加工出来的齿轮,它的径向综合误差X是一个随 机变量 但是X的分布函数Fx(x)(或概率密度x(x))是什么 事前是未知的 令试 冷(a)如何求出或近似地求出F(x)(或f(x)的值?
6 v 例2 一个工厂生产某种规格的圆柱齿轮. v 由于原料和加工过程中的种种随机因素的影响,各 个齿轮的径向综合误差X的数值一般是不同的,因 此加工出来的齿轮,它的径向综合误差X是一个随 机变量. v 但是X的分布函数FX(x)(或概率密度fX(x))是什么, 事前是未知的. v 试问 v (a)如何求出或近似地求出F(x)(或f(x))的值?
试问 (a)如何求出或近似地求出F(x)(或f(x)的值? 令(b)如果人们根据以往的生产经验提出假设: “X服从正态分布N(,a2)” (和a2已知或未知), 令那么,是接受这个假设还是否定这个假设呢? 应该用什么方法来判断? (c)如果人们只需要知道X的数学期望和方差,那么, 如何估计它们的数值?
7 v 试问 v (a)如何求出或近似地求出F(x)(或f(x))的值? v (b)如果人们根据以往的生产经验提出假设: “X服从正态分布N(μ,σ2)” (μ和σ2已知或未知), v 那么,是接受这个假设还是否定这个假设呢? v 应该用什么方法来判断? v (c)如果人们只需要知道X的数学期望和方差,那么, 如何估计它们的数值?
个怎样解决这些问题呢? 对例1来说,由于产品总数是有限的,人们可以对所 有产品逐个检验,求出不合格产品所占的比例,就 得到概率p 冷同时,假设“p<0.05”是否成立的问题也就得到了 解决. 但是,这种普查的方法是不可取的,有时也是行不 通的 因为对5000个产品逐个检验,一般来说要耗费很多 的人力、物力和时间; 令特别是,当产品质量的检验是属于破坏性检验时, 根本就不可能逐个检验
8 v 怎样解决这些问题呢? v 对例1来说,由于产品总数是有限的,人们可以对所 有产品逐个检验,求出不合格产品所占的比例,就 得到概率p; v 同时,假设“ p<0.05”是否成立的问题也就得到了 解决. v 但是,这种普查的方法是不可取的,有时也是行不 通的. v 因为对5000个产品逐个检验,一般来说要耗费很多 的人力、物力和时间; v 特别是,当产品质量的检验是属于破坏性检验时, 根本就不可能逐个检验
这时,在数理统计中通常采用的办法是 从研究对象的全体元素中随机地抽取一小部分进行 观察(或试验), 令然后以观察得到的资料(或数据)为出发点,以概率 论的理论为基础来对上述的问题进行估计或推断, 这种方法称为统计推断
9 v 这时,在数理统计中通常采用的办法是: v 从研究对象的全体元素中随机地抽取一小部分进行 观察(或试验), v 然后以观察得到的资料(或数据)为出发点,以概率 论的理论为基础来对上述的问题进行估计或推断, v 这种方法称为统计推断
令统计推断的问题可以分为两类: 类是对未知参数以及对未知概率分布(分布函数 概率密度或分布列)的估计问题. 另一类是对未知参数和概率分布的假设检验问题 这些都是数理统计的基本问题 令当然,上述问题远未穷尽数理统计的所有基本问题 令例如,数理统计还要研究如何科学地安排试验,才 能最经济、最有效地取得统计推断所必需的数据资 料. 这部分内容,我们不讨论 为了研究统计推断问题,下面依次介绍总体和样本 的概念 10
10 v 统计推断的问题可以分为两类: v 一类是对未知参数以及对未知概率分布(分布函数、 概率密度或分布列)的估计问题. v 另一类是对未知参数和概率分布的假设检验问题. v 这些都是数理统计的基本问题. v 当然,上述问题远未穷尽数理统计的所有基本问题. v 例如,数理统计还要研究如何科学地安排试验,才 能最经济、最有效地取得统计推断所必需的数据资 料. v 这部分内容,我们不讨论. v 为了研究统计推断问题,下面依次介绍总体和样本 的概念