第六章样本及抽样分布 9§6.1随机样本 §6.2直方图和箱线图 §6.3抽样分布 2/82
2/82 第六章 样本及抽样分布 §6.1 随机样本 §6.2 直方图和箱线图 §6.3 抽样分布
数理统计中的问题 概率论和数理统计的关系 概率论:提供了一套分析和解决随机现象统计规律的基 本理论和方法 数理统计:以概率论为基本理论,根据试验或观察得到 的数据来研究随机现象,对客观规律性作出合理的估计 和判断,以解决实际问题。 研究的问题 在概率论中,通常研究的是随机变量的概率分布已知的 情况下的性质、特点和规律性。 在数理统计中,随机变量的分布是未知的,或不能完全 知道的,人们通过对所研究的随机变量的重复独立的观 察,得到许多观察值,对这些数据进行分析,进而对随 机变量的分布作出种种推断。 3/82
3/82 数理统计中的问题 概率论和数理统计的关系 ⚫ 概率论:提供了一套分析和解决随机现象统计规律的基 本理论和方法 ⚫ 数理统计:以概率论为基本理论,根据试验或观察得到 的数据来研究随机现象,对客观规律性作出合理的估计 和判断,以解决实际问题。 研究的问题 ⚫ 在概率论中,通常研究的是随机变量的概率分布已知的 情况下的性质、特点和规律性。 ⚫ 在数理统计中,随机变量的分布是未知的,或不能完全 知道的,人们通过对所研究的随机变量的重复独立的观 察,得到许多观察值,对这些数据进行分析,进而对随 机变量的分布作出种种推断
§6.1随机样本 1°总体和样本 定义在数理统计研究中,常常关心(一批)研究对象的某 项数量指标,为此,考虑与这一数量指标联系的随机试验, 对这一数量指标进行试验或观察,则 ·将试验的全部可能的观察值称为总体 ·把每一个可能的观察值称为一个个体 。总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体,容量为无限的称为无限总体 。测量一湖泊中鱼的含汞量一一有限总体(鱼的个数有限) ·测量一湖泊中任一地点的深度一一无限总体(连续的) 4/82
4/82 §6.1 随机样本 1°总体和样本 定义 在数理统计研究中,常常关心(一批)研究对象的某 项数量指标,为此,考虑与这一数量指标联系的随机试验, 对这一数量指标进行试验或观察,则 ⚫ 将试验的全部可能的观察值称为总体 ⚫ 把每一个可能的观察值称为一个个体 总体中所包含的个体的个数称为总体的容量 ⚫ 容量为有限的称为有限总体,容量为无限的称为无限总体 ⚫ 测量一湖泊中鱼的含汞量――有限总体(鱼的个数有限) ⚫ 测量一湖泊中任一地点的深度――无限总体(连续的)
§6.1随机样本 例:考察某工厂生产的一批灯泡的寿命这一试验 。研究对象:某工厂生产的一批灯泡(假设10000个) 。关心的数量指标:寿命X 个 体:每一个灯泡的寿命x是一个可能的 观察值,形成个体,它是存在的 ●总 体:所有这批灯泡的寿命,共含有 10000个可能观察值,是有限总体 (x1,2),X10000) 每一个个体x;不一定都不同 。样本空间:任意挑选一灯泡,其所有可能寿命 构成样本空间,可映射到随机变量X 5/82
5/82 §6.1 随机样本 例:考察某工厂生产的一批灯泡的寿命这一试验 ⚫ 研究对象:某工厂生产的一批灯泡 ⚫ 关心的数量指标:寿命X ⚫ 个 体:每一个灯泡的寿命xi是一个可能的 观察值,形成个体,它是存在的 ⚫ 总 体:所有这批灯泡的寿命,共含有 10000个可能观察值,是有限总体 (x1 , x2 , …, x10000) 每一个个体xi不一定都不同 ⚫ 样本空间:任意挑选一灯泡,其所有可能寿命 构成样本空间,可映射到随机变量X (假设10000个)
§6.1随机样本 总体和样本空间的区别和联系 。样本空间是一次随机试验中的所有可能结果 ·它不一定是数量的,也不一定是实际存在的。 ·针对任意一个对象的观察的所有可能结果就构成样本空间 ·它可以映射到随机变量X,它满足一定分布。 。总体是大量具有相同性质的研究对象的某一个数量指标 总体是数理统计中研究大量对象的相关概念,是这些研究对象的数 量指标构成的集合,是存在的 多数情况下,总体是X的部分取值的集合(其中取值可以 重复) 。总体中对象取值的情况会反映相应随机变量的分布特点 6/82
6/82 §6.1 随机样本 总体和样本空间的区别和联系 ⚫ 样本空间是一次随机试验中的所有可能结果 ⚫ 它不一定是数量的,也不一定是实际存在的。 ⚫ 针对任意一个对象的观察的所有可能结果就构成样本空间 ⚫ 它可以映射到随机变量X,它满足一定分布。 ⚫ 总体是大量具有相同性质的研究对象的某一个数量指标 ⚫ 总体是数理统计中研究大量对象的相关概念,是这些研究对象的数 量指标构成的集合,是存在的 ⚫ 多数情况下,总体是X的部分取值的集合(其中取值可以 重复) ⚫ 总体中对象取值的情况会反映相应随机变量的分布特点
§6.1随机样本 2°总体与随机变量的关系 ·一个总体对应于一个随机变量X 将样本空间映射到随机变量,这对应于研究对象的数量指标 那么总体的每一个体的数理指标是一个随机试验的观察值,即相应随 机变量X的某一取值。 ⊙含义:总体的分布不是这些个体构成的空间的分布(这些取值往往是确 定存在的),而是指每一个个体的取值所来自的随机变量X的分布 对总体的研究就是对相应的随机变量X的研究,X的分布函数和数字 特征就是总体的分布函数和数字特征。 ●今后将不区分总体和相应的随机变量,笼统称为总体X ⊙在统计学中,总体这个概念的要旨是:总体就是一个概率分布 7182
7/82 §6.1 随机样本 2°总体与随机变量的关系 一个总体对应于一个随机变量X ⚫ 将样本空间映射到随机变量,这对应于研究对象的数量指标 ⚫ 那么总体的每一个体的数理指标是一个随机试验的观察值,即相应随 机变量X的某一取值。 含义:总体的分布不是这些个体构成的空间的分布(这些取值往往是确 定存在的),而是指每一个个体的取值所来自的随机变量X的分布 ⚫ 对总体的研究就是对相应的随机变量X的研究,X的分布函数和数字 特征就是总体的分布函数和数字特征。 ⚫ 今后将不区分总体和相应的随机变量,笼统称为总体X 在统计学中,总体这个概念的要旨是: 总体就是一个概率分布
§6.1随机样本 例:检查生产的一批零件的正品和次品问题 9正品表示为0,次品为1 。对应于所有生产出来的零件的取值构成总体 。其中有若千个零件为正品0,若千个为次品1。 9 现在生产一个零件是正品或次品的情况可用一个符合(0一 1)分布的随机变量X来描述,设次品率为p,则X的分布为 X Pk 1-p P 9可知: 这批零件中每一个零件的关于正品或次品的取值来自于随机变量X 而且在这批总体中,取1的个体个数与总体中个体总数之比,当总 体容量很大时应接近即,这时的总体可近似看作无限总体。 8/82
8/82 §6.1 随机样本 例:检查生产的一批零件的正品和次品问题 正品表示为0,次品为1 对应于所有生产出来的零件的取值构成总体 ⚫ 其中有若干个零件为正品0,若干个为次品1。 现在生产一个零件是正品或次品的情况可用一个符合(0- 1)分布的随机变量X来描述,设次品率为p,则X的分布为 X 0 1 pk 1-p p 可知: ⚫ 这批零件中每一个零件的关于正品或次品的取值来自于随机变量X ⚫ 而且在这批总体中,取1的个体个数与总体中个体总数之比,当总 体容量很大时应接近p,这时的总体可近似看作无限总体
§6.1随机样本 9显然,无限总体的特性更接近X的分布 无限总体是人们对具体事务的抽象,分布形式较为简明, 便于数学处理,是研究的主要对象 。需要说明的是在实际中大量的总体都是有限总体,这与 人们通常考察某一范围内的个体有关,但如果数量大, 可以近似为无限总体,或抽象为无限总体的情况。 因为个体少量的有限总体与其所对应的X的真实分布一 般相差很大,比如一个总数为2的总体(灯泡的寿命), 很难从中看出它与指数分布有什么关系。 9/82
9/82 §6.1 随机样本 显然,无限总体的特性更接近X的分布 ⚫ 无限总体是人们对具体事务的抽象,分布形式较为简明, 便于数学处理,是研究的主要对象 ⚫ 需要说明的是在实际中大量的总体都是有限总体,这与 人们通常考察某一范围内的个体有关,但如果数量大, 可以近似为无限总体,或抽象为无限总体的情况。 ⚫ 因为个体少量的有限总体与其所对应的X的真实分布一 般相差很大,比如一个总数为2的总体(灯泡的寿命), 很难从中看出它与指数分布有什么关系
§6.1随机样本 3°样本 数理统计目的就是如何推断总体的分布和性质。而即使掌握 了所有个体的取值情况,那么由于这些取值可能仅是对应的 随机变量X的部分取值或总体容量不充足,仍很难十分准确 的判定总体性质 因此,通常从总体中抽取一部分个体,来对总体的分布和性 质进行推断,更具有可行性,被抽取的部分个体叫做总体的 一个样本 抽取样本,特别是对于以下情况更有意义: 。无限总体,无法实际获得全部个体 。有破坏性的试验,如灯泡寿命测试,炮弹的可靠性等 ● 有时间或空间上的限制,如观察或测试耗时太多,可能使工作无意义 了等情况,采用样本来考察总体的办法是十分必要和有效的 10/82
10/82 §6.1 随机样本 3°样本 数理统计目的就是如何推断总体的分布和性质。而即使掌握 了所有个体的取值情况,那么由于这些取值可能仅是对应的 随机变量X的部分取值或总体容量不充足,仍很难十分准确 的判定总体性质 因此,通常从总体中抽取一部分个体,来对总体的分布和性 质进行推断,更具有可行性,被抽取的部分个体叫做总体的 一个样本 抽取样本,特别是对于以下情况更有意义: ⚫ 无限总体,无法实际获得全部个体 ⚫ 有破坏性的试验,如灯泡寿命测试,炮弹的可靠性等 ⚫ 有时间或空间上的限制,如观察或测试耗时太多,可能使工作无意义 了等情况,采用样本来考察总体的办法是十分必要和有效的
§6.1随机样本 4°与样本相关的问题 。样本的描述: 。从总体中抽取一个个体,就是对总体X进行一次观察, 并记录其结果。在相同条件下对总体X进行次重复的、 独立的观察,将n次观察结果按试验次序记为 X1X2…Xm0 ·对于每一次观察,其可能结果构成的随机变量X与总体 X是相同的 比如考察一个灯泡的寿命值,该考察可能出现的结果对 应的随机变量就是总体X 11/82
11/82 §6.1 随机样本 4°与样本相关的问题 样本的描述: ⚫ 从总体中抽取一个个体,就是对总体X进行一次观察, 并记录其结果。在相同条件下对总体X进行n次重复的、 独立的观察,将n次观察结果按试验次序记为 X1 ,X2 ,…,Xn。 ⚫ 对于每一次观察,其可能结果构成的随机变量Xi与总体 X是相同的 ⚫ 比如考察一个灯泡的寿命值,该考察可能出现的结果对 应的随机变量就是总体X