西北工业大学：《概率论与数理统计》课程教学资源（讲义）第五章数理统计的基本概念与抽样分布（5.1）基本概念.pdf_大学文库

第五章数理统计的基本概念与抽样分布基本要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。了解x2分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。本章重点:统计量的概念及其分布。二、教学内容 51基本概念 511数理统计的基本问题概率论与数理统计是研究随机现象统计规律性的一门学科。概率论是对随机现象统计规律性演绎的硏究。数理统计研究以有效的方式采集,整理和分析受到随机因素影响的数据,并对所考察的问题作出推断和预测,直至为采取某种决策提供依据和建议。由此可见,数理统计是对随机现象统计规律性归纳的研究,它与概率论在研究方法上有着明显的差异数理统计研究的内容十分广泛,概括起来可分为两大类:一是试验设计,是研究如何对随机现象进行观察和试验,以便更合理更有效地获得试验数据;二是统计推断,即研究如何对所获得的试验数据进行加工和处理,从而对所考察的对象的某些性质作出尽可能精确可靠的推断。例5.1某钢厂生产某型号钢筋10000根质检员每天只抽查其中50根钢筋的强度,并要解决以下问题 (1)如何从仅有的50根钢筋的强度数据去估计整批(10000根)钢筋的强度平均值?又如何估计整批钢筋强度偏离平均值的离散程度? (2)若规定了这种型号的钢筋的标准强度,从抽查的50根钢筋强度数据如何判断整批钢筋的平均强度与规定标准有无差异 (3)如果钢筋强度与某种原料成分的含量有关,那么从检査的50根钢筋的强度与该成分含量的50组对应数据如何去表述整批钢筋的强度与该成分含量之间的关系? 问题(1)实际上要从50个强度数据出发去估计整批钢筋的强度的某些数字特征这里是要估计数学期望和方差在数理统计中解决这类问题的方法称为参数估计。问题(2)是要求用抽查所得的数据去检验强度分布的某些数字特征与规定标准有无差异,这里是检验数学期望。数理统计中解决这类问题的方法是先作一个假设(如假设平均强度与规定标准无差异),然后利用概率反证法检验这一假设是否成立,这种方法称为假设检问题③3)是要根据观察数据硏究随机变量与确定性变量之间的关系,这里是研究钢筋强度(随机变量)与某成分含量(确定性变量)这样两个变量间的关系,这种研究方法称为回归分析。以上三个方面的内容都属于统计推断问题。其中参数估计和假设检验是数理统计中两个最基本的理论和方法。而回归分析方法在工程中应用极为广泛

第五章数理统计的基本概念与抽样分布一、基本要求 1．理解总体、个体、简单随机样本和统计量的概念，掌握样本均值、样本方差及样本矩的计算。 2．了解分布、t 分布和 F 分布的定义和性质，了解分位数的概念并会查表计算。 2 χ 3．掌握正态总体的某些常用统计量的分布。 4．了解最大次序统计量和最小次序统计量的分布。本章重点：统计量的概念及其分布。二、教学内容 5.1 基本概念 5.1.1 数理统计的基本问题概率论与数理统计是研究随机现象统计规律性的一门学科。概率论是对随机现象统计规律性演绎的研究。数理统计研究以有效的方式采集，整理和分析受到随机因素影响的数据，并对所考察的问题作出推断和预测，直至为采取某种决策提供依据和建议。由此可见，数理统计是对随机现象统计规律性归纳的研究，它与概率论在研究方法上有着明显的差异。数理统计研究的内容十分广泛，概括起来可分为两大类：一是试验设计，是研究如何对随机现象进行观察和试验，以便更合理更有效地获得试验数据；二是统计推断，即研究如何对所获得的试验数据进行加工和处理，从而对所考察的对象的某些性质作出尽可能精确可靠的推断。例 5.1 某钢厂生产某型号钢筋 10 000 根,质检员每天只抽查其中 50 根钢筋的强度,并要解决以下问题: (1)如何从仅有的 50 根钢筋的强度数据去估计整批(10 000 根) 钢筋的强度平均值?又如何估计整批钢筋强度偏离平均值的离散程度? (2)若规定了这种型号的钢筋的标准强度,从抽查的 50 根钢筋强度数据如何判断整批钢筋的平均强度与规定标准有无差异? (3)如果钢筋强度与某种原料成分的含量有关,那么从检查的 50 根钢筋的强度与该成分含量的 50 组对应数据,如何去表述整批钢筋的强度与该成分含量之间的关系? 问题(1)实际上要从 50 个强度数据出发去估计整批钢筋的强度的某些数字特征,这里是要估计数学期望和方差,在数理统计中解决这类问题的方法称为参数估计。问题(2)是要求用抽查所得的数据去检验强度分布的某些数字特征与规定标准有无差异，这里是检验数学期望。数理统计中解决这类问题的方法是先作一个假设（如假设平均强度与规定标准无差异），然后利用概率反证法检验这一假设是否成立，这种方法称为假设检验。问题(3)是要根据观察数据研究随机变量与确定性变量之间的关系，这里是研究钢筋强度（随机变量）与某成分含量（确定性变量）这样两个变量间的关系，这种研究方法称为回归分析。以上三个方面的内容都属于统计推断问题。其中参数估计和假设检验是数理统计中两个最基本的理论和方法。而回归分析方法在工程中应用极为广泛

512总体与样本 1.总体在数理统计中,把所研究对象的全体称为总体(或母体),而把组成总体的每个研究对象称为个体。例如,在考察一批灯泡的质量时,该批灯泡的全体就组成一个总体,而其中每个灯泡就是一个个体。总体中所含有的个体的总数称为总体的容量,它可以是有限的也可以是无限的。因此总体分为有限总体和无限总体。就一批灯泡这个总体而言,这批灯泡的寿命这个数量指标X也是随机变量。假定X的分布函数为F(x),如果把表示这个数量指标的随机变量X的可能取值的全体看作总体,且称总体Ⅹ为具有分布函数F(x)的总体,这样就把总体与随机变量联系起来了。因而,任何个总体,都可用一个相应的随机变量来描述。所以,今后我们说到总体,指的是一个具有确定概率分布的随机变量(但它的分布又是未知的或至少分布中的某些参数是未知的),而每个个体则是随机变量可能取的每一个数值。这样对总体的研究就归结为对表示总体某个数量指标的随机变量的研究。所谓总体的分布及数字特征,就是指总体某个数量指标的随机变量的分布及数字特征。例如,正态总体即指表示总体某个数量指标的随机变量服从正态分布。 2.样本为了对总体ⅹ的分布规律或某些特征进行研究,就必须对总体进行抽样观察,根据抽样所得的数据来推断总体的性质。这种从总体X中抽取若干个个体来观察数量指标X的取值过程,称为抽样(又称采样),这一做法称为抽样法从一个总体x中,随机抽取n个个体X1,X2…,Xn(如10000件产品中随机抽取50 件),通常记为(X1,X2,…,Xn),并称它为来自总体X的一个样本(又称子样),样本中的个体数n称为样本容量,由于每个X(i=1,2,…,)都是从总体X中随机抽取的,它的取值就在总体X可能取值范围内随机取得,故每个X都是随机变量,而样本(X1,X2,…,Xn)就是一个n维随机变量。在一次抽取观察之后,它们是n个数据(x1,x2,…,x),称之为样本 (X1,X2,…,Xn)的一个观测值,简称样本值。一般来说,两次不同的抽样得到的样本值是不同的。样本(X1,X2,…,Xn)所可能取值的全体称为样本空间,记为9,一个样本值 (x1,x2,…,x)就是样本空间9中的一个点。抽取样本的目的是为了利用样本对总体的分布或某些数字特征进行推断,这就要求抽取的样本能够很好地反映总体的特性且便于处理,因而需要对如何抽样提出一些要求,通常有两条 (1)代表性:因抽取的样本要尽可能地代表总体的特性,所以要求每个 (=1,2,…,m)必须与总体X具有相同的分布。 (2)独立性:因独立观察是一种最简单而实用的观察方法且独立样本便于处理,这就要求12,…X是相互独立的随机变量,即每个观察结果既不影响其他观察结果,也不受到其他观察结果的影响

5.1.2 总体与样本 1. 总体在数理统计中，把所研究对象的全体称为总体（或母体），而把组成总体的每个研究对象称为个体。例如，在考察一批灯泡的质量时，该批灯泡的全体就组成一个总体，而其中每个灯泡就是一个个体。总体中所含有的个体的总数称为总体的容量，它可以是有限的也可以是无限的。因此总体分为有限总体和无限总体。就一批灯泡这个总体而言，这批灯泡的寿命这个数量指标 X 也是随机变量。假定 X 的分布函数为 F(x)，如果把表示这个数量指标的随机变量 X 的可能取值的全体看作总体，且称总体 X 为具有分布函数 F(x)的总体，这样就把总体与随机变量联系起来了。因而，任何一个总体，都可用一个相应的随机变量来描述。所以，今后我们说到总体，指的是一个具有确定概率分布的随机变量（但它的分布又是未知的或至少分布中的某些参数是未知的），而每个个体则是随机变量可能取的每一个数值。这样对总体的研究就归结为对表示总体某个数量指标的随机变量的研究。所谓总体的分布及数字特征，就是指总体某个数量指标的随机变量的分布及数字特征。例如，正态总体即指表示总体某个数量指标的随机变量服从正态分布。 2. 样本为了对总体 X 的分布规律或某些特征进行研究，就必须对总体进行抽样观察，根据抽样所得的数据来推断总体的性质。这种从总体 X 中抽取若干个个体来观察数量指标 X 的取值过程，称为抽样（又称采样），这一做法称为抽样法。从一个总体 X 中，随机抽取 n 个个体 1 2 , , , X X " Xn （如 10 000 件产品中随机抽取 50 件），通常记为(X1 , X 2 ,", X n ) ，并称它为来自总体 X 的一个样本（又称子样），样本中的个体数 n 称为样本容量，由于每个 ( 1,2, , i X i = " n) 都是从总体 X 中随机抽取的，它的取值就在总体 X 可能取值范围内随机取得，故每个 Xi 都是随机变量，而样本就是一个 n 维随机变量。在一次抽取观察之后，它们是 n 个数据 ( , , , ) X1 X 2 " X n 1 2 ( , , , ) n x x " x ，称之为样本的一个观测值，简称样本值。一般来说，两次不同的抽样得到的样本值是不同的。样本所可能取值的全体称为样本空间，记为，一个样本值 ( , , , ) X1 X 2 " X n ( , , , ) X1 X 2 " X n Ω 1 2 ( , , , ) n x x " x 就是样本空间Ω 中的一个点。抽取样本的目的是为了利用样本对总体的分布或某些数字特征进行推断，这就要求抽取的样本能够很好地反映总体的特性且便于处理，因而需要对如何抽样提出一些要求，通常有两条：（ 1 ）代表性：因抽取的样本要尽可能地代表总体的特性，所以要求每个 ( 1,2, , ) Xi i = " n 必须与总体 X 具有相同的分布。（2）独立性：因独立观察是一种最简单而实用的观察方法且独立样本便于处理，这就要求 1 2 , , , X X " Xn 是相互独立的随机变量，即每个观察结果既不影响其他观察结果，也不受到其他观察结果的影响

西北工业大学：《概率论与数理统计》课程教学资源（讲义）第五章 数理统计的基本概念与抽样分布（5.1）基本概念

西北工业大学：《概率论与数理统计》课程教学资源（讲义）第五章数理统计的基本概念与抽样分布（5.1）基本概念