第六章样本及抽样分布 9§6.1随机样本 9§6.2直方图和箱线图 。§6.3抽样分布 2/34
第六章 样本及抽样分布 §6.1 随机样本 §6.2 直方图和箱线图 §6.3 抽样分布 2/34
第六章样本及抽样分布 §6.1随机样本 9§6.2直方图和箱线图 9§6.3抽样分布 3/34
第六章 样本及抽样分布 §6.1 随机样本 §6.2 直方图和箱线图 §6.3 抽样分布 3/34
数理统计中的问题 9概率论和数理统计的关系 ● 概率论:提供了一套分析和解决随机现象统计规律的基 本理论和方法 数理统计:以概率论为基本理论,根据试验或观察得到 的数据来研究随机现象,对客观规律性作出合理的估计 和判断,以解决实际问题。 研究的问题 ●在概率论中,通常研究的是随机变量的概率分布已知的 情况下的性质、特点和规律性。 ● 在数理统计中,随机变量的分布是未知的,或不能完全 知道的,人们通过对所研究的随机变量的重复独立的观 察,得到许多观察值,对这些数据进行分析,进而对随 机变量的分布作出种种推断。 4/34
数理统计中的问题 概率论和数理统计的关系 概率论:提供了一套分析和解决随机现象统计规律的基 本理论和方法 数理统计:以概率论为基本理论,根据试验或观察得到 的数据来研究随机现象,对客观规律性作出合理的估计 和判断,以解决实际问题。 研究的问题 在概率论中,通常研究的是随机变量的概率分布已知的 情况下的性质、特点和规律性。 在数理统计中,随机变量的分布是未知的,或不能完全 知道的,人们通过对所研究的随机变量的重复独立的观 察,得到许多观察值,对这些数据进行分析,进而对随 机变量的分布作出种种推断。 4/34
§6.1随机样本 1°总体和样本 。定义在数理统计研究中,常常关心(一批)研究对象的某 项数量指标,为此,考虑与这一数量指标联系的随机试验, 对这一数量指标进行试验或观察,则 。将试验的全部可能的观察值称为总体 。把每一个可能的观察值称为一个个体 。总体中所包含的个体的个数称为总体的容量 ©容量为有限的称为有限总体,容量为无限的称为无限总体 ●测量一湖泊中鱼的含汞量一一有限总体(鱼的个数有限) ●测量一湖泊中任一地点的深度一一无限总体(连续的) 5/34
§6.1 随机样本 1°总体和样本 定义 在数理统计研究中,常常关心(一批)研究对象的某 项数量指标,为此,考虑与这一数量指标联系的随机试验, 对这一数量指标进行试验或观察,则 将试验的全部可能的观察值称为总体 把每一个可能的观察值称为一个个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体,容量为无限的称为无限总体 测量一湖泊中鱼的含汞量――有限总体 (鱼的个数有限) 测量一湖泊中任一地点的深度――无限总体(连续的) 5/34
§6.1随机样本 例:考察某工厂生产的一批灯泡的寿命这一试验 ·研究对象:某工厂生产的一批灯泡(假设10000个) 。关心的数量指标:寿命X 。个 体:每一个灯泡的寿命x是一个可能的 观察值,形成个体,它是存在的 。总 体:所有这批灯泡的寿命,共含有 10000个可能观察值,是有限总体 (K1)X2,3X10000) 每一个个体x不一定都不同 。样本空间:任意挑选一灯泡,其所有可能寿命 构成样本空间,可映射到随机变量X 6/34
§6.1 随机样本 例:考察某工厂生产的一批灯泡的寿命这一试验 研究对象:某工厂生产的一批灯泡 关心的数量指标:寿命X 个 体:每一个灯泡的寿命xi是一个可能的 观察值,形成个体,它是存在的 总 体:所有这批灯泡的寿命,共含有 10000个可能观察值,是有限总体 (x1 , x2 , ., x10000) 每一个个体xi不一定都不同 样本空间:任意挑选一灯泡,其所有可能寿命 构成样本空间,可映射到随机变量X (假设10000个) 6/34
§6.1随机样本 总体和样本空间的区别和联系 ●样本空间是一次随机试验中的所有可能结果 。它不一定是数量的,也不一定是实际存在的。 ·针对任意一个对象的观察的所有可能结果就构成样本空间 。它可以映射到随机变量X,它满足一定分布。 。总体是大量具有相同性质的研究对象的某一个数量指标 ·总体是数理统计中研究大量对象的相关概念,是这些研究对象的数 量指标构成的集合,是存在的 。多数情况下,总体是X的部分取值的集合(其中取值可以 重复) ·总体中对象取值的情况会反映相应随机变量的分布特点 7134
§6.1 随机样本 总体和样本空间的区别和联系 样本空间是一次随机试验中的所有可能结果 它不一定是数量的,也不一定是实际存在的。 针对任意一个对象的观察的所有可能结果就构成样本空间 它可以映射到随机变量X,它满足一定分布。 总体是大量具有相同性质的研究对象的某一个数量指标 总体是数理统计中研究大量对象的相关概念,是这些研究对象的数 量指标构成的集合,是存在的 多数情况下,总体是X的部分取值的集合(其中取值可以 重复) 总体中对象取值的情况会反映相应随机变量的分布特点 7/34
§6.1随机样本 2°总体与随机变量的关系 ·一个总体对应于一个随机变量X ●将样本空间映射到随机变量,这对应于研究对象的数量指标 ● 那么总体的每一个体的数理指标是一个随机试验的观察值,即相应随 机变量X的某一取值。 °含义:总体的分布不是这些个体构成的空间的分布(这些取值往往是确 定存在的),而是指每一个个体的取值所来自的随机变量X的分布 ·对总体的研究就是对相应的随机变量X的研究,X的分布函数和数字 特征就是总体的分布函数和数字特征。 。今后将不区分总体和相应的随机变量,笼统称为总体X ·在统计学中,总体这个概念的要旨是:总体就是一个概率分布 8134
§6.1 随机样本 2°总体与随机变量的关系 一个总体对应于一个随机变量X 将样本空间映射到随机变量,这对应于研究对象的数量指标 那么总体的每一个体的数理指标是一个随机试验的观察值,即相应随 机变量X的某一取值。 含义:总体的分布不是这些个体构成的空间的分布(这些取值往往是确 定存在的),而是指每一个个体的取值所来自的随机变量X的分布 对总体的研究就是对相应的随机变量X的研究,X的分布函数和数字 特征就是总体的分布函数和数字特征。 今后将不区分总体和相应的随机变量,笼统称为总体X 在统计学中,总体这个概念的要旨是: 总体就是一个概率分布 8/34
§6.1随机样本 例:检查生产的一批零件的正品和次品问题 9正品表示为0,次品为1 °对应于所有生产出来的零件的取值构成总体 ●其中有若千个零件为正品0,若千个为次品1。 。现在生产一个零件是正品或次品的情况可用一个符合(0一 1)分布的随机变量X来描述,设次品率为p,则X的分布为 x01 Pk 1-p P 可知: 。这批零件中每一个零件的关于正品或次品的取值来自于随机变量X ●而且在这批总体中,取1的个体个数与总体中个体总数之比,当总 体容量很大时应接近印,这时的总体可近似看作无限总体。 9/34
§6.1 随机样本 例:检查生产的一批零件的正品和次品问题 正品表示为0,次品为1 对应于所有生产出来的零件的取值构成总体 其中有若干个零件为正品0,若干个为次品1。 现在生产一个零件是正品或次品的情况可用一个符合(0- 1)分布的随机变量X来描述,设次品率为p,则X的分布为 X 0 1 pk 1-p p 可知: 这批零件中每一个零件的关于正品或次品的取值来自于随机变量X 而且在这批总体中,取1的个体个数与总体中个体总数之比,当总 体容量很大时应接近p,这时的总体可近似看作无限总体。 9/34
§6.1随机样本 显然,无限总体的特性更接近X的分布 ●无限总体是人们对具体事务的抽象,分布形式较为简明, 便于数学处理,是研究的主要对象 ●需要说明的是在实际中大量的总体都是有限总体,这与 人们通常考察某一范围内的个体有关,但如果数量大, 可以近似为无限总体,或抽象为无限总体的情况。 ·因为个体少量的有限总体与其所对应的X的真实分布一 般相差很大,比如一个总数为2的总体(灯泡的寿命), 很难从中看出它与指数分布有什么关系。 10/34
§6.1 随机样本 显然,无限总体的特性更接近X的分布 无限总体是人们对具体事务的抽象,分布形式较为简明, 便于数学处理,是研究的主要对象 需要说明的是在实际中大量的总体都是有限总体,这与 人们通常考察某一范围内的个体有关,但如果数量大, 可以近似为无限总体,或抽象为无限总体的情况。 因为个体少量的有限总体与其所对应的X的真实分布一 般相差很大,比如一个总数为2的总体(灯泡的寿命), 很难从中看出它与指数分布有什么关系。 10/34
§6.1随机样本 3°样本 。数理统计目的就是如何推断总体的分布和性质。 。因此,通常从总体中抽取一部分个体,来对总体的分布和性 质进行推断,更具有可行性,被抽取的部分个体叫做总体的 一个样本 抽取样本,特别是对于以下情况更有意义: 。无限总体,无法实际获得全部个体 。有破坏性的试验,如灯泡寿命测试,炮弹的可靠性等 ·有时间或空间上的限制,如观察或测试耗时太多,可能使工作无意义 了等情况,采用样本来考察总体的办法是十分必要和有效的 11/34
§6.1 随机样本 3°样本 数理统计目的就是如何推断总体的分布和性质。 因此,通常从总体中抽取一部分个体,来对总体的分布和性 质进行推断,更具有可行性,被抽取的部分个体叫做总体的 一个样本 抽取样本,特别是对于以下情况更有意义: 无限总体,无法实际获得全部个体 有破坏性的试验,如灯泡寿命测试,炮弹的可靠性等 有时间或空间上的限制,如观察或测试耗时太多,可能使工作无意义 了等情况,采用样本来考察总体的办法是十分必要和有效的 11/34