《概率论与数理统计》课程教学资源（教案）第五章统计量及其分布.doc_大学文库

第五章统计量及其分布一、教材说明本章内容包括：总体与样本，样本数据的整理与显示，统计量及其分布，三大抽样分布。本章的基本概念和重要结论是学习数理统计的基础。 1、教学目的与教学要求 1)掌握数理统计的总体、样本、样本经验分布函数 ,统计量及常用统计量等基本概念。 2)掌握大分布的定义，并能熟练应用来求随机变量的分布， 3)牢记Fisher定理的内容及其三大推论。 4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同。 5)了解如何对样本数据进行整理与现实。 2、本章重点与难点登重点是数理统计的基本概念三大分布的定义、Fisher定理及其推论。难点是Fisher 定理结合二分布茅求随机变量的分布。二、教学内容本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等4 节来进述本章的基本内容。 §5.1总体与样本总体与样本在一个统计问题中，把研究对象的全体称为总体，构成总体的每个成员称为个体。对于实际问题，总体中的个体是些实在的人或物。比如，我们要研究某大学的学生身高情况则该大学的全体学生构成问题的总体，而每一个学生即是一个个体。事实上，每一个学生有许多特征：性别、年龄、身高、体重等等，而在该问题中，我们关心的只是该校学生的身高如何，对其他的特征暂不考虑。这样，每个学生（个体）所具有的数量指标一一身高就是个体，而所有身高全体看成总体。这样，抛开实际背景，总体就是一堆数，这堆数中有大有小，有的出现机会多，有的出现机会小，因此用个概率分布去描述和归纳总体是合适的，从这个意义上说：总体就是一个分布，而其数量指标就是服从这个分布的随机变量。例511考察某厂的产品质量，将其产品分为合格品和不合格品，并以0记合格品，以 1记不格品，若以表示不合格品率，则各总体可用一个二点分布表示 p 1-p p 不同的p反映了总体间的差异。在有些问题中，我们对每一研究对象可能要观测两个或更多个指标，此时可用多维随机向量及其联合分布来描述总体。这种总体称为多维总体。若总体中的个体数是有限的，此总体称为有限总体：否则称为无限总体。实际中总体中的个体数大多是有限的，当个体数充分大时，将有限总体看作无限总体是一种合理抽象

第五章统计量及其分布一、教材说明本章内容包括：总体与样本，样本数据的整理与显示，统计量及其分布，三大抽样分布。本章的基本概念和重要结论是学习数理统计的基础。 1、教学目的与教学要求 1）掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念。 2）掌握三大分布的定义，并能熟练应用来求随机变量的分布。 3）牢记 Fisher 定理的内容及其三大推论。 4）使学生了解数理统计研究问题的方法与概率论研究问题方法的不同。 5）了解如何对样本数据进行整理与现实。 2、本章重点与难点本章重点是数理统计的基本概念、三大分布的定义、Fisher 定理及其推论。难点是 Fisher 定理结合三大分布来求随机变量的分布。二、教学内容本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等 4 节来讲述本章的基本内容。 §5.1 总体与样本一、总体与样本在一个统计问题中，把研究对象的全体称为总体，构成总体的每个成员称为个体。对于实际问题，总体中的个体是一些实在的人或物。比如，我们要研究某大学的学生身高情况，则该大学的全体学生构成问题的总体，而每一个学生即是一个个体。事实上，每一个学生有许多特征：性别、年龄、身高、体重等等，而在该问题中，我们关心的只是该校学生的身高如何，对其他的特征暂不考虑。这样，每个学生（个体）所具有的数量指标——身高就是个体，而所有身高全体看成总体。这样，抛开实际背景，总体就是一堆数，这堆数中有大有小，有的出现机会多，有的出现机会小，因此用一个概率分布去描述和归纳总体是合适的，从这个意义上说：总体就是一个分布，而其数量指标就是服从这个分布的随机变量。例 5.1.1 考察某厂的产品质量，将其产品分为合格品和不合格品，并以 0 记合格品，以 1 记不格品，若以 p 表示不合格品率，则各总体可用一个二点分布表示： X 0 1 p 1-p p 不同的 p 反映了总体间的差异。在有些问题中，我们对每一研究对象可能要观测两个或更多个指标，此时可用多维随机向量及其联合分布来描述总体。这种总体称为多维总体。若总体中的个体数是有限的，此总体称为有限总体；否则称为无限总体。实际中总体中的个体数大多是有限的，当个体数充分大时，将有限总体看作无限总体是一种合理抽象

二、样本与简单随机样本 1、样本为了了解总体的分布，从总体中随机地抽取n个个体，记其指标值为x,x2,,X, 则x,x2,…,x。称为总体的一个样本，称为样本容量或简称为样本量，样本中的个体称为样品。当n≥30时，称x,x2,…,xn为大样本，否则为小样本。首先指出，样本具有所谓的二重性：一方面，由于样本是从总体中随机抽取的，抽取前无法预知它们的数值，因此样本是随机变量，用大写字母X,X2,…,X。表示：另一方面。样本在抽取以后经观测就有确定的观测值，因此样本又是一组数值，此时用小写字母 x,x2,,x。表示。简单起见，无论是样本还是其观测值，本书中均用x,x2,,x。表示从上下文我们能加以区别。每个样本观测值都能测到一个具体的数值，则称该样本为完全样本，若样本观测值没有具体的数值，只有一个范围，则称这样的样本为分组样本。从而知道分组样本与完全样本相比在信息上总有损失，但在实际中，若样本量特别大，用分组样本既简明扼要，又能帮助人们更好地认识总体例51.4略。 2、简单随机样本从总体中抽取样本可有不同的抽法，为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求，最常用的有如下两个要求： 1)样本具有随机性：要求每一个个体都有同等机会被选入样本，这便意味着每一样品 x,与总体X有相同的分布。 2)样本要求有独立性：要求每一样品的取值不影响其它样品的取值，这便意味者 x,2,…xn相互独立。若样本x,x2,…,xn是n个相互独立的具有同一分布的随机变量，则称该样本为简单随机样本，简称为样本。注(I)若总体X的分布函数为Fx,则其样本的联合分布函数为F(x,) (2)若总体X的密度函数为p,则其样本的联合密度为·p(x) (3)若总体X的分布列为p(x),则其样本的联合分布列为口x,) (4)对有限总体不放回抽样，若总体中有几个个体，抽取样本容量为m,当心<W (分≤0.1)时，不放回抽样得到的样本可认为是简单随机样本。例51.5设有一批产品共N个，需进行抽样检验以了解其不合格品率P,现从中抽出n 个逐一检查它们是否是不合格品，记合格品为0，不合格品为1。则总体为一个二点分布： P=p,PK=0l-p。设x,xn为该总体的一个样本，采用不放回抽样得到。这时

二、样本与简单随机样本 1、样本为了了解总体的分布，从总体中随机地抽取 n 个个体，记其指标值为 n x , x , , x 1 2  , 则 n x , x , , x 1 2  称为总体的一个样本，n 称为样本容量或简称为样本量，样本中的个体称为样品。当 n  30 时，称 n x , x , , x 1 2  为大样本，否则为小样本。首先指出，样本具有所谓的二重性：一方面，由于样本是从总体中随机抽取的，抽取前无法预知它们的数值，因此样本是随机变量，用大写字母 X X Xn , , , 1 2  表示；另一方面，样本在抽取以后经观测就有确定的观测值，因此样本又是一组数值，此时用小写字母 n x , x , , x 1 2  表示。简单起见，无论是样本还是其观测值，本书中均用 n x , x , , x 1 2  表示，从上下文我们能加以区别。每个样本观测值都能测到一个具体的数值，则称该样本为完全样本，若样本观测值没有具体的数值，只有一个范围，则称这样的样本为分组样本。从而知道分组样本与完全样本相比在信息上总有损失，但在实际中，若样本量特别大，用分组样本既简明扼要，又能帮助人们更好地认识总体。例 5.1.4 略。 2、简单随机样本从总体中抽取样本可有不同的抽法，为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求，最常用的有如下两个要求： 1）样本具有随机性：要求每一个个体都有同等机会被选入样本，这便意味着每一样品 i x 与总体 X 有相同的分布。 2）样本要求有独立性：要求每一样品的取值不影响其它样品的取值，这便意味着 n x , x , , x 1 2  相互独立。若样本 n x , x , , x 1 2  是 n 个相互独立的具有同一分布的随机变量，则称该样本为简单随机样本，简称为样本。注（1）若总体 X 的分布函数为 F(x)，则其样本的联合分布函数为 ( ) 1 i n i F x =  （2）若总体 X 的密度函数为 p(x)，则其样本的联合密度为 ( ) 1 i n i p x =  （3）若总体 X 的分布列为 ( ) i p x ，则其样本的联合分布列为 ( ) 1 i n i p x =  （4）对有限总体不放回抽样，若总体中有几个个体，抽取样本容量为 n，当 n<<N (  0.1 N n )时，不放回抽样得到的样本可认为是简单随机样本。例 5.1.5 设有一批产品共 N 个，需进行抽样检验以了解其不合格品率 p，现从中抽出 n 个逐一检查它们是否是不合格品，记合格品为 0，不合格品为 1。则总体为一个二点分布： P(X=1)=p，P(X=0)=1-p。设 1 ,..., n x x 为该总体的一个样本，采用不放回抽样得到。这时

第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品： 1 1 ( 1 1) 2 1 − − = = = N Np P x x 1 ( 1 0) 2 1 − = = = N Np P x x 但当 N 很大时，上述两个概率近似都等于 p，所以当 N 很大，而 n 不大时，不放回抽样得到的样本可近似看成简单随机样本。 §5.2 样本数据的整理与显示一、经验分布函数 1、定义设 n x , x , , x 1 2  是取自总体分布函数为 F(x)的样本，若将样本观测值从小到大进行排列为 (1) (2) ( ) , , , n x x  x ,则 (1) (2) (n) x  x  x 为有序样本，如下函数 (1) ( ) ( 1) ( ) 0, ( ) , , 1,2, , 1 1, n k k n x x k F x x x x k n n x x +     =   = −      当当当称为经验分布函数。例 5.2.1 某食品厂生产听装饮料，现从生产线上随机抽取 5 听饮料，称得其净重为：351 347 355 344 351，求此样本的经验分布函数。略。 2、经验分布函数的性质 0 1 对每一个固定的 x，F (x) n 是事件“ X x  ”发生的频率，当 n 固定时， F (x) n 是样本的函数，是一个随机变量，且 F (x) F(x) P n ⎯→ 。 0 2 （格里纹科定理）定理 5.2.1：设 n x , x , , x 1 2  是取自总体分布函数为 F(x)的样本， F (x) n 是经验分布函数，有 (lim sup ( ) − ( ) = 0) = 1 − + → P F x F x n x n 。注此定理表明，当 n 相当大时，经验分布函数是总体分布函数的一个良好的近似。二、频数频率分布表样本数据的整理是统计研究的基础，整理数据的最常用方法之一是给出其频数分布表或频率分布表，其基本步骤是： 1、对样本进行分组：首先确定组数 k，作为一般性原则，组数通常在 5-20 个。对容量较小的样本，通常将其分为 5 组或 6 组，容量为 100 左右的样本可分 7 到 10 组，容量在 200 左右的样本可分 9~13 组，容量为 300 左右级以上的样本可分 12 到 20 组。 2、确定每组组距：每组组距可以相同也可以不同。但实际中常选用长度相同的区间，以 d 表示组距

第六章参数估计一、教材说明本章内容包括参数估计中基本的概念、参数估计的两种方法及评价估计量的四个标准。它们是参数估计最基本的内容，是以后学习参数估计其他内容的基础。 1、教学目的与敕学要求 1)使学生了解参数估计中最基木的占估计及相关橱今 )使学生掌握矩估计及最大似然估计的法 (3) 使学生掌握评价估计量优劣的四个标准，尤其是前三个标准， (4)使学生了解矩估计、最大似然估计的原理。 2、本章的重点本章重点是求未知参数的矩估计与最大似然估计的方法以及如何对求出的估计量的优良性进行评价。教学内容本章主要分2节来讲述。 §6.1点估计的几种方法一、参数估计问题这里所指的参数是指如下三类未知参数： 1、类型已知的分布中所含的未知参数日。如二点分布b(L,p)中的概率pP:正态分布 N(4,σ2)中的4和c2; 2、分布中所含的未知参数0的函数：如正态分布N(4,σ2)的变量X不超过给定值a 的概率P(X≤a=(a-凸)是未知参数4，G的函数： 3、分布的各种特征数也都是未知参数，如均值EX,方差X,分布中位数等等。一般场合，常用日表示参数，参数日所有可能取值的集合称为参数空间，记为日。参数估计问恩就是根据样本对上述各种参数做出估计。二、概率函数总体X的概率函数p(x,)是指：当X为离散型总体时，p(x,)就是总体的分布列：当 X为连续性总体时，P(x,)就是总体的密度函数。三、参数估计形式分为点估计与区间估计。设x,2，…，xn是来自总体的样本，我们用一个统计量0=0(x,…,x,)的取值作为0的估计值，0称为日的点估计量，简称估计。若给出参数日的估计是一个随机区间（但，），使这个区间（但，）包含参数真值的概率大到一定程度，此时称（但，）为参数日的区间估计。四、矩法估计

第六章参数估计一、教材说明本章内容包括参数估计中基本的概念、参数估计的两种方法及评价估计量的四个标准。它们是参数估计最基本的内容,是以后学习参数估计其他内容的基础。 1、教学目的与教学要求 (1) 使学生了解参数估计中最基本的点估计及相关概念; (2) 使学生掌握矩估计及最大似然估计的方法; (3) 使学生掌握评价估计量优劣的四个标准,尤其是前三个标准; (4) 使学生了解矩估计、最大似然估计的原理。 2、本章的重点本章重点是求未知参数的矩估计与最大似然估计的方法以及如何对求出的估计量的优良性进行评价. 二、教学内容本章主要分 2 节来讲述。 §6.1 点估计的几种方法一、参数估计问题这里所指的参数是指如下三类未知参数： 1、类型已知的分布中所含的未知参数  。如二点分布 b(1, p)中的概率 p；正态分布 ( , ) 2 N   中的  和 2  ; 2、分布中所含的未知参数  的函数：如正态分布 ( , ) 2 N   的变量 X 不超过给定值 a 的概率 ( ) ( )  −   =  a P X a 是未知参数 , 的函数； 3、分布的各种特征数也都是未知参数，如均值 EX，方差 VarX，分布中位数等等。一般场合，常用  表示参数，参数  所有可能取值的集合称为参数空间，记为  。参数估计问题就是根据样本对上述各种参数做出估计。二、概率函数总体 X 的概率函数 p(x, ) 是指：当 X 为离散型总体时， p(x, ) 就是总体的分布列；当 X 为连续性总体时， p(x, ) 就是总体的密度函数。三、参数估计形式分为点估计与区间估计。设 n x , x , , x 1 2  是来自总体的样本，我们用一个统计量 ( , , ) 1 ^ ^ n  =  x  x 的取值作为  的估计值， ^  称为  的点估计量，简称估计。若给出参数  的估计是一个随机区间 ( , ) ，使这个区间 ( , ) 包含参数真值的概率大到一定程度，此时称 ( , ) 为参数  的区间估计。四、矩法估计

1、替换原理及矩法估计用样本矩去替换总体矩（矩可以是原点矩也可以是中心矩），用样本矩的函数去替换总体矩的函数，这就是替换原理。用替换原理得到的未知参数的估计量称为矩法估计。注矩法估计适用于总体分布形式未知场合，因此只要知道总体相应的矩即可，而不必知道其具体分布。 2、概率函数 p(x, ) 已知时未知参数的矩法估计设总体的概率函数 ( ) 1 k p x； ，， ，(1 ,  , k ) 是未知参数， n x , x , , x 1 2  是总体 X 的样本，若 k EX 存在，则 j j  k,EX 存在。设 EX j k j k j j ( , , ), 1,2, ,  = = 1   =  ，如果   k , , 1  也能够表示成  k , , 1  的函数 j k j j k ( , , ), 1,2, ,  =  1   =  ，则可给出  j 的矩估计量为 a a j k j j k ( , , ), 1,2, , ˆ ˆ  =  1  =  ，其中 x j k n a n i j j i , 1,2, , 1 1 =  =  = 设 ( , , )  = g 1   k 是   k , , 1  的函数，则利用替换原理可得到  的矩估计量 ) ˆ , , ˆ ˆ (  = g 1   k ，其中  j ˆ 是  j 的矩估计， j = 1,2,  , k 。例 6.1.2 设总体为指数分布，其密度函数为 ( ; ) = ,  0 − p x e x x   ， n x , x , , x 1 2  为样本，   0 为未知参数，求  的矩估计。解   1  X ~ Exp( ), EX = ， EX 1  = ， x 1 ˆ  = 为  的矩估计。注 2 1 ~ ( ),   X Exp  VarX = ， VarX 1  = S S 1 1 ˆ 2  = = 也为  的矩估计。因此矩估计不唯一，此时，尽量采用低阶矩给出未知参数的估计。例 6.1.3 设总体 X ~ U[a,b]， n x , x , , x 1 2  为样本，求 a,b 的矩估计。解 12 ( ) , 2 ~ [ , ], 2 b a VarX a b X U a b EX − = +   = 由      − = + = 12 ( ) 2 2 b a VarX a b EX ，得    = + = − b EX VarX a EX VarX 3 3 ，所以 a,b 的矩估计为 ˆ 3 ˆ 3 a x s b x s  = −   = +

《概率论与数理统计》课程教学资源（教案）第五章 统计量及其分布

《概率论与数理统计》课程教学资源（教案）第五章统计量及其分布