第五章数理统计的基本概念与抽样分布 基本要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩 的计算。 了解x2分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、教学内容 51基本概念 511数理统计的基本问题 概率论与数理统计是研究随机现象统计规律性的一门学科。 概率论是对随机现象统计规律性演绎的硏究。 数理统计研究以有效的方式采集,整理和分析受到随机因素影响的数据,并对所考察 的问题作出推断和预测,直至为采取某种决策提供依据和建议。由此可见,数理统计是对随 机现象统计规律性归纳的研究,它与概率论在研究方法上有着明显的差异 数理统计研究的内容十分广泛,概括起来可分为两大类:一是试验设计,是研究如何 对随机现象进行观察和试验,以便更合理更有效地获得试验数据;二是统计推断,即研究如 何对所获得的试验数据进行加工和处理,从而对所考察的对象的某些性质作出尽可能精确可 靠的推断。 例5.1某钢厂生产某型号钢筋10000根质检员每天只抽查其中50根钢筋的强度,并要 解决以下问题 (1)如何从仅有的50根钢筋的强度数据去估计整批(10000根)钢筋的强度平均值?又如 何估计整批钢筋强度偏离平均值的离散程度? (2)若规定了这种型号的钢筋的标准强度,从抽查的50根钢筋强度数据如何判断整批钢 筋的平均强度与规定标准有无差异 (3)如果钢筋强度与某种原料成分的含量有关,那么从检査的50根钢筋的强度与该成分 含量的50组对应数据如何去表述整批钢筋的强度与该成分含量之间的关系? 问题(1)实际上要从50个强度数据出发去估计整批钢筋的强度的某些数字特征这里是 要估计数学期望和方差在数理统计中解决这类问题的方法称为参数估计。 问题(2)是要求用抽查所得的数据去检验强度分布的某些数字特征与规定标准有无差 异,这里是检验数学期望。数理统计中解决这类问题的方法是先作一个假设(如假设平均强 度与规定标准无差异),然后利用概率反证法检验这一假设是否成立,这种方法称为假设检 问题③3)是要根据观察数据硏究随机变量与确定性变量之间的关系,这里是研究钢筋强 度(随机变量)与某成分含量(确定性变量)这样两个变量间的关系,这种研究方法称为回 归分析。 以上三个方面的内容都属于统计推断问题。其中参数估计和假设检验是数理统计中两 个最基本的理论和方法。而回归分析方法在工程中应用极为广泛
第五章 数理统计的基本概念与抽样分布 一、基本要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩 的计算。 2.了解 分布、t 分布和 F 分布的定义和性质,了解分位数的概念并会查表计算。 2 χ 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、教学内容 5.1 基本概念 5.1.1 数理统计的基本问题 概率论与数理统计是研究随机现象统计规律性的一门学科。 概率论是对随机现象统计规律性演绎的研究。 数理统计研究以有效的方式采集,整理和分析受到随机因素影响的数据,并对所考察 的问题作出推断和预测,直至为采取某种决策提供依据和建议。由此可见,数理统计是对随 机现象统计规律性归纳的研究,它与概率论在研究方法上有着明显的差异。 数理统计研究的内容十分广泛,概括起来可分为两大类:一是试验设计,是研究如何 对随机现象进行观察和试验,以便更合理更有效地获得试验数据;二是统计推断,即研究如 何对所获得的试验数据进行加工和处理,从而对所考察的对象的某些性质作出尽可能精确可 靠的推断。 例 5.1 某钢厂生产某型号钢筋 10 000 根,质检员每天只抽查其中 50 根钢筋的强度,并要 解决以下问题: (1)如何从仅有的 50 根钢筋的强度数据去估计整批(10 000 根) 钢筋的强度平均值?又如 何估计整批钢筋强度偏离平均值的离散程度? (2)若规定了这种型号的钢筋的标准强度,从抽查的 50 根钢筋强度数据如何判断整批钢 筋的平均强度与规定标准有无差异? (3)如果钢筋强度与某种原料成分的含量有关,那么从检查的 50 根钢筋的强度与该成分 含量的 50 组对应数据,如何去表述整批钢筋的强度与该成分含量之间的关系? 问题(1)实际上要从 50 个强度数据出发去估计整批钢筋的强度的某些数字特征,这里是 要估计数学期望和方差,在数理统计中解决这类问题的方法称为参数估计。 问题(2)是要求用抽查所得的数据去检验强度分布的某些数字特征与规定标准有无差 异,这里是检验数学期望。数理统计中解决这类问题的方法是先作一个假设(如假设平均强 度与规定标准无差异),然后利用概率反证法检验这一假设是否成立,这种方法称为假设检 验。 问题(3)是要根据观察数据研究随机变量与确定性变量之间的关系,这里是研究钢筋强 度(随机变量)与某成分含量(确定性变量)这样两个变量间的关系,这种研究方法称为回 归分析。 以上三个方面的内容都属于统计推断问题。其中参数估计和假设检验是数理统计中两 个最基本的理论和方法。而回归分析方法在工程中应用极为广泛
512总体与样本 1.总体 在数理统计中,把所研究对象的全体称为总体(或母体),而把组成总体的每个研究对 象称为个体。例如,在考察一批灯泡的质量时,该批灯泡的全体就组成一个总体,而其中每 个灯泡就是一个个体。总体中所含有的个体的总数称为总体的容量,它可以是有限的也可以 是无限的。因此总体分为有限总体和无限总体。 就一批灯泡这个总体而言,这批灯泡的寿命这个数量指标X也是随机变量。假定X的 分布函数为F(x),如果把表示这个数量指标的随机变量X的可能取值的全体看作总体,且 称总体Ⅹ为具有分布函数F(x)的总体,这样就把总体与随机变量联系起来了。因而,任何 个总体,都可用一个相应的随机变量来描述。所以,今后我们说到总体,指的是一个具有 确定概率分布的随机变量(但它的分布又是未知的或至少分布中的某些参数是未知的),而 每个个体则是随机变量可能取的每一个数值。这样对总体的研究就归结为对表示总体某个数 量指标的随机变量的研究。所谓总体的分布及数字特征,就是指总体某个数量指标的随机变 量的分布及数字特征。例如,正态总体即指表示总体某个数量指标的随机变量服从正态分布。 2.样本 为了对总体ⅹ的分布规律或某些特征进行研究,就必须对总体进行抽样观察,根据抽 样所得的数据来推断总体的性质。这种从总体X中抽取若干个个体来观察数量指标X的取 值过程,称为抽样(又称采样),这一做法称为抽样法 从一个总体x中,随机抽取n个个体X1,X2…,Xn(如10000件产品中随机抽取50 件),通常记为(X1,X2,…,Xn),并称它为来自总体X的一个样本(又称子样),样本中的 个体数n称为样本容量,由于每个X(i=1,2,…,)都是从总体X中随机抽取的,它的取值 就在总体X可能取值范围内随机取得,故每个X都是随机变量,而样本(X1,X2,…,Xn)就 是一个n维随机变量。在一次抽取观察之后,它们是n个数据(x1,x2,…,x),称之为样本 (X1,X2,…,Xn)的一个观测值,简称样本值。一般来说,两次不同的抽样得到的样本值是 不同的。样本(X1,X2,…,Xn)所可能取值的全体称为样本空间,记为9,一个样本值 (x1,x2,…,x)就是样本空间9中的一个点。 抽取样本的目的是为了利用样本对总体的分布或某些数字特征进行推断,这就要求抽 取的样本能够很好地反映总体的特性且便于处理,因而需要对如何抽样提出一些要求,通常 有两条 (1)代表性:因抽取的样本要尽可能地代表总体的特性,所以要求每个 (=1,2,…,m)必须与总体X具有相同的分布。 (2)独立性:因独立观察是一种最简单而实用的观察方法且独立样本便于处理,这就 要求12,…X是相互独立的随机变量,即每个观察结果既不影响其他观察结果,也不 受到其他观察结果的影响
5.1.2 总体与样本 1. 总体 在数理统计中,把所研究对象的全体称为总体(或母体),而把组成总体的每个研究对 象称为个体。例如,在考察一批灯泡的质量时,该批灯泡的全体就组成一个总体,而其中每 个灯泡就是一个个体。总体中所含有的个体的总数称为总体的容量,它可以是有限的也可以 是无限的。因此总体分为有限总体和无限总体。 就一批灯泡这个总体而言,这批灯泡的寿命这个数量指标 X 也是随机变量。假定 X 的 分布函数为 F(x),如果把表示这个数量指标的随机变量 X 的可能取值的全体看作总体,且 称总体 X 为具有分布函数 F(x)的总体,这样就把总体与随机变量联系起来了。因而,任何 一个总体,都可用一个相应的随机变量来描述。所以,今后我们说到总体,指的是一个具有 确定概率分布的随机变量(但它的分布又是未知的或至少分布中的某些参数是未知的),而 每个个体则是随机变量可能取的每一个数值。这样对总体的研究就归结为对表示总体某个数 量指标的随机变量的研究。所谓总体的分布及数字特征,就是指总体某个数量指标的随机变 量的分布及数字特征。例如,正态总体即指表示总体某个数量指标的随机变量服从正态分布。 2. 样本 为了对总体 X 的分布规律或某些特征进行研究,就必须对总体进行抽样观察,根据抽 样所得的数据来推断总体的性质。这种从总体 X 中抽取若干个个体来观察数量指标 X 的取 值过程,称为抽样(又称采样),这一做法称为抽样法。 从一个总体 X 中,随机抽取 n 个个体 1 2 , , , X X " Xn (如 10 000 件产品中随机抽取 50 件),通常记为(X1 , X 2 ,", X n ) ,并称它为来自总体 X 的一个样本(又称子样),样本中的 个体数 n 称为样本容量,由于每个 ( 1,2, , i X i = " n) 都是从总体 X 中随机抽取的,它的取值 就在总体 X 可能取值范围内随机取得,故每个 Xi 都是随机变量,而样本 就 是一个 n 维随机变量。在一次抽取观察之后,它们是 n 个数据 ( , , , ) X1 X 2 " X n 1 2 ( , , , ) n x x " x ,称之为样本 的一个观测值,简称样本值。一般来说,两次不同的抽样得到的样本值是 不同的。样本 所可能取值的全体称为样本空间,记为 ,一个样本值 ( , , , ) X1 X 2 " X n ( , , , ) X1 X 2 " X n Ω 1 2 ( , , , ) n x x " x 就是样本空间Ω 中的一个点。 抽取样本的目的是为了利用样本对总体的分布或某些数字特征进行推断,这就要求抽 取的样本能够很好地反映总体的特性且便于处理,因而需要对如何抽样提出一些要求,通常 有两条: ( 1 ) 代 表 性:因抽 取的样本 要尽可能 地代表总 体的特性 ,所以要 求每个 ( 1,2, , ) Xi i = " n 必须与总体 X 具有相同的分布。 (2)独立性:因独立观察是一种最简单而实用的观察方法且独立样本便于处理,这就 要求 1 2 , , , X X " Xn 是相互独立的随机变量,即每个观察结果既不影响其他观察结果,也不 受到其他观察结果的影响
满足上述两条性质的样本称为简单随机样本,获得简单随机样本的方法称为简单随机 抽样 定义51一个随机变量X或其相应的分布函数F(x)称为一个总体。 定义52如果随机变量x1,X2X相互独立且每个x与总体Ⅹ具有相同的分布,则 称(x1,X2,…,Xn)是来自总体X的容量为n的简单随机样本,简称样本。若总体Ⅹ具有 分布函数F(x),也称(x1,X2,…,Xn)为来自总体F(x)的样本 3.样本的分布 定理51设(X1,x2,…,Xn)为来自总体X的样本 (1)若总体X的分布函数为Fx),则样本(X1,X2…,Xn)分布函数为∏F(x) (2)若总体X的分布密度为px),则样本(X1,x2…,X)分布密度为∏p(x,) (3)若总体X的分布律为P{X p(x1)(=1,2,…,则样本(X1,X2,…,Xn)分 布律为∏P(x) P{X=l}=p,P{X=0}=1-p(0<p<1 试求样本(X12X2,…,Xn)的分布律 解:由于总体的分布律可写成 p(x)=P(X=x}=p2(1-p)(x=0.1) 由定理51,样本(X1,X2,…,Xn)的分布律为 p(x)=1p3(1-p)=p-(1-p 例52设总体X服从正态分布N(a2),试求样本(X1,X2,…,Xn)的分布密度 解:由于总体的分布密度为 p(r) ∞<x<+∞) 故样本(x1,X2,…,Xn)的分布密度为
满足上述两条性质的样本称为简单随机样本,获得简单随机样本的方法称为简单随机 抽样。 定义 5.1 一个随机变量 X 或其相应的分布函数 F(x)称为一个总体。 定义 5.2 如果随机变量 1 2 , , , X X " Xn 相互独立且每个 Xi 与总体 X 具有相同的分布,则 称 是来自总体 X 的容量为 n 的简单随机样本,简称样本。若总体 X 具有 分布函数 F(x),也称 为来自总体 F(x)的样本。 ( , , , ) X1 X 2 " X n ( , , , ) X1 X 2 " X n 3. 样本的分布 定理 5.1 设(X1 , X 2 ,", X n ) 为来自总体 X 的样本 (1)若总体 X 的分布函数为 F(x),则样本(X1 , X 2 ,", X n ) 分布函数为 1 ( ) n i i F x = ∏ 。 (2)若总体 X 的分布密度为 p(x),则样本(X1 , X 2 ,", X n ) 分布密度为 。 1 ( ) n i i p x = ∏ (3)若总体 X 的分布律为 { } * * ( )( 1, 2, ), P X i i = = x p x i = " 则样本 分 布律为 。 ( , , , ) X1 X 2 " X n 1 ( ) n i i p x = ∏ P X{ = = 1 , } p P{X = 0} =1− p,(0 < p <1) 试求样本( , , , ) 的分布律. X1 X 2 " X n 解:由于总体的分布律可写成 { } 1 ( ) (1 ) ( 0,1) x x p x P X x p p x − = = = − = 由定理 5.1,样本(X1 , X 2 ,", X n ) 的分布律为 i=1 i=1 x ( ) n i ∏ p x = . 1 (1 ) i i n x x p p − ∏ − 1 1 (1 ) n n i i i i x n p p = = ∑ ∑− = − 例 5.2 设总体 X 服从正态分布 2 N( , µ σ ), 试求样本( , , , ) 的分布密度. X1 X 2 " X n 解:由于总体的分布密度为 2 2 ( ) 2 1 ( ) ( ) 2 x p x e x µ σ πσ − − = −∞ < < +∞ 故样本(X1 , X 2 ,", X n ) 的分布密度为
p(x)= a√2na 51.3统计量 定义53设(X1,X2,…,Xn)为总体X的一个样本,若样本的函数f(X1,X2…,Xn)不包 含任何未知参数,则称f(X1,X2,…,Xn)为一个统计量。如果(x1x2…xn)是样本 (X1,X2…,Xn)的一个观测值,则称f(x1,x2…,xn)是统计量f(X1,x2,…,Xn)的一个观 测值 例如,设总体X~NA,a2),已知而σ2未知,(X1,X2…,Xn)是来自总体X的 个样本,则x和∑(x1-m都是统计量,但∑x,和∑(x,-m户都不 是统计量。 2.常用统计量—样本矩 定义54设(X1,X2…Xn)为总体X的一个样本,称统计量 X=∑x (5.1) 为样本均值;统计量 ∑(X1-X)2=∑X2 为样本方差;统计量 X -X (53) 为修正样本方差;统计量 (x1-X) 为样本标准差:统计量 A X(k=1,2,…,n) 为样本k阶原点矩;统计量 Bk X 为样本k阶中心矩。用x,s2,a,b分别表示X,S2,Ak,B的观测值
2 2 2 2 1 1 ( ) ( ) 2 2 1 1 2 1 1 ( ) . 2 (2 ) n i i i x n n x i n i i n p x e e µ µ σ σ πσ π σ = − − − − = = ∑ ∏ ∏= = 5.1.3 统计量 1. 统计量 定义 5.3 设(X1 , X 2 ,", X n ) 为总体 X 的一个样本,若样本的函数 不包 含任何未知参数,则称 为一个统计量。如果 是样本 的一个观测值,则称 是统计量 的一个观 测值。 f ( X , X , , X ) 1 2 " n f ( X , X , , X ) 1 2 " n ( , , , ) 1 2 n x x " x ( X , X , , X ) 1 2 " n f ( x , x , , x ) 1 2 " n f ( X , X , , X ) 1 2 " n 例如,设总体 X ~ N( µ,σ2 ), µ 已知而σ2 未知,( X1 , X 2 ,", X n ) 是来自总体 X 的 一个样本,则 ∑= n i Xi n 1 1 和 ∑= − n i i ( X ) n 1 1 2 µ 都是统计量,但 ∑= n i Xi 1 1 σ 和 ∑= − n i i ( X ) 1 2 2 1 µ σ 都不 是统计量。 2. 常用统计量——样本矩 定义 5.4 设( X1 ,X 2 ,",X n )为总体 X 的一个样本,称统计量 = ∑= n i i def X n X 1 1 (5.1) 为样本均值;统计量 2 1 2 1 2 2 1 ( ) 1 X X n X X n S n i i n i i def n = ∑ − = ∑ − = = (5.2) 为样本方差;统计量 = ∑= − − n i i def n X X n S 1 2 2* ( ) 1 1 (5.3) 为修正样本方差;统计量 2 1 2 ( ) 1 n n i i def n X X S n S = ∑ − = = (5.4) 为样本标准差;统计量 = ∑= n i k i def k X n A 1 1 ( k =1,2,",n ) (5.5) 为样本 k 阶原点矩;统计量 = ∑= − n i k i def k X X n B 1 ( ) 1 ( k = 1,2,",n ) (5.6) 为样本 k 阶中心矩。用 x , sn 2 , ak ,bk 分别表示 X , Sn 2 , Ak , Bk 的观测值
由定义54可见,A1=X,B2=Sn, 并且,样本矩具有下列性质 性质51设总体X的数学期望E(X)=,方差D(X)=σ2,(X1,X2…,Xn)为 来自总体X的样本,则有: (1)E(X) (2)D(X)=-a2; n-1 (3)E(S2) (4)E(Sn)=a 证明()E(x)=B∑x)=1∑Ex)=1S= 2)D(x)=E(∑x)=∑Dx)=1∑2=1o (3)E(S2)=E(∑x2-X)=∑E(x2)-E(X) (D(X1)+(E(X1)2)-(D(X)+(E(X)2) (a2+2)-(-a2+42) (4)E(S”)=E(,S2)=-,E(S2)= 性质52设总体X的k阶矩E(X)存在,则样本的k阶矩依概率收敛于总体的k 的k阶矩,即 iP∑X-E(X)ke}=1(E>0) 对随即序列{X}(k固定)应用大数定理即可证明该性质。由此性质进一步可得 lim P(X-E(XKa)=1 lim Pi S-D(Xk8)=l
由定义 5.4 可见, A1 = X , , 2 B2 = Sn 2 2* 1 n Sn n n S − = .并且,样本矩具有下列性质。 性质 5.1 设总体 X 的数学期望 E(X ) = µ ,方差 , 为 来自总体 2 D(X ) = σ ( , , , ) X1 X2 " Xn X 的样本,则有: (1) E(X ) = µ ; (2) 1 2 ( ) σ n D X = ; (3) 2 1 2 ( ) σ n n E Sn − = ; (4) 2 2* E(Sn ) = σ 证明 (1) = ∑ = ∑ = ∑µ = µ = = = n i i n i n i i n E X n X n E X E 1 1 1 1 ( ) 1 ) 1 ( ) ( (2) 2 1 2 2 1 2 1 1 1 ( ) 1 ) 1 ( ) ( σ σ n n D X n X n D X E n i i n i n i = ∑ i = ∑ = ∑ = = = = (3) ∑ ∑ = = = − = − n i i n i n i E X E X n X X n E S E 1 2 2 2 1 2 2 ( ) ( ) 1 ) 1 ( ) ( ( ( ) ( ( )) ) ( ( ) ( ( )) ) 1 2 1 2 D X E X D X E X n n i = ∑ i + i − + = ) 1 ( ) ( 1 1 2 2 2 2 ∑= = + − + n n i n σ µ σ µ 1 2 σ n n − = (4) 2 2 2 2* ( ) 1 ) 1 ( ) ( = σ − = − n = n E Sn n n S n n E S E 性质 5.2 设总体 X 的 阶矩 存在,则样本的 阶矩依概率收敛于总体的 的 阶矩,即 k ( ) k E X k k k ( ) | } 1 1 lim {| 1 ∑ − 0) 对随即序列{X i k } (k固定)应用大数定理即可证明该性质。由此性质进一步可得 lim {| − ( ) |< } = 1 →∞ P X E X ε n lim {| ( ) | } 1 2 − < = →∞ P S D X ε n n
此结论表明,样本容量n很大时,可用一次抽样后所得样本均值X和样本方差S2分别 作为总体X的均值E(X)和方差D(X)的近似值(即估计值)。 3.次序统计量 设(X1,X2…,X)是从总体x中抽取的一个样本,(x1,x2,…,xn)是样本的一个观测 值,将观测值按由小到大的次序重新编号排列为 xa)≤x(2)≤…≤x(n) 当(X1,X2,…,Xn)取值为(x1,x2…xn)时,定义X(k取值为x(k)(k=12,…,n)由此得 到的(X(u),X(2,…,X(m)称为样本(X1,X2,…,Xn)的次序统计量,(x(u,x(2,…,xm)称 为次序统计量的观测值。 其中X()=minx,称为最小次序统计量,X(m)=maxx,称为最大次序统计量,X(k) 称为第k个次序统计量。由于每个XA都是样本(X12X2…,Xn)的函数,所以 X(2X(2)…,X(n)也都是随机变量。次序统计量(Xa,X(2)…,X(n)一般不是相互独立 的,因为次序统计量的任一观测值均为由小到大的排列。对于连续总体,次序统计量的分布 由下列定理给出 定理52设总体X的分布密度p(x)(或分布函数为F(x),(X),Xx(2)…,X(m)为 总体X的样本(X1,X2,…,Xn)的次序统计量,则有 1)最小次序统计量Xa的分布密度为 P(x=n[l-F(xIp(x) (2)最大次序统计量X(n)的分布密度为 Pn(x)=川F(x)p(x) 例54设总体X服从区间[0上的均匀分布,(x1,x2…X)为试求总体x的样本 试求x和Xn的分布 0≤x≤6 解:总体X的分布密度为p(x)=10 0,其他
此结论表明,样本容量 n 很大时,可用一次抽样后所得样本均值 X 和样本方差 分别 作为总体 2 n S X 的均值 E(X ) 和方差 D(X ) 的近似值(即估计值)。 3. 次序统计量 设(X1 , X 2 ,", X n ) 是从总体 X 中抽取的一个样本, 是样本的一个观测 值,将观测值按由小到大的次序重新编号排列为 ( , , , ) 1 2 n x x " x (1) (2) (n) x ≤ x ≤ " ≤ x 当 (X1 , X 2 ,", X n ) 取值为(x1 , x2 ,", xn ) 时,定义 X (k ) 取值为 (k ) x (k = 1,2,", n) 由此得 到的 称为样本 的次序统计量, 称 为次序统计量的观测值。 ( , , , ) X (1) X (2) " X (n) ( , , , ) X1 X 2 " X n ( , , , ) (1) (2) (n) x x " x 其中 i 称为最小次序统计量, i n X X ≤ ≤ = 1 (1) min i i n X n X ≤ ≤ = 1 ( ) max 称为最大次序统计量, 称为第 个 次 序 统计量 。 由于每 个 都 是 样 本 的 函 数,所以 也都是随机变量。次序统计量 一般不是相互独立 的,因为次序统计量的任一观测值均为由小到大的排列。对于连续总体,次序统计量的分布 由下列定理给出。 X (k ) k X (k ) ( , , , ) X1 X 2 " X n (1) (2) ( ) , , , X X " X n ( , , , ) X (1) X (2) " X (n) 定理 5.2 设总体 X 的分布密度 (或分布函数为 ), 为 总体 p(x) F(x) ( , , , ) X (1) X (2) " X (n) X 的样本(X1 , X 2 ,", X n ) 的次序统计量,则有 (1) 最小次序统计量 X(1) 的分布密度为 ( ) [1 ( )] ( ) (5.8) 1 (1) p x n F x p x n x − = − (2) 最大次序统计量 X (n) 的分布密度为 ( ) [ ( )] ( ) (5.9) 1 ( ) p x n F x p x n x n − = 例 5.4 设总体 X 服从区间[0,θ ]上的均匀分布, (X1 , X 2 ,", X n ) 为,试求总体 X 的样本 试求 和 的分布. X(1) X (n) 解: 总体 X 的分布密度为 1 ,0 ( ) 0, x p x θ θ ⎧ ⎪ ≤ ≤ = ⎨ ⎪ ⎩ 其他
0,x<0 X的分布函数为F(x)={,0≤x<0 由定理52,得X1的分布密度为p(x)=1601:0≤x≤0 0,其他 而xn的分布密度为Pn(x)={o x"-,0≤x≤ 0,其他 4.经验分布函数 定义55设(x1,X2,…,n)是来自总体X的样本,(X),X(2…,Xx(n)是次序统计 量,其观测值为(x(1,x(2,…,x(m),设x是任一实数,称函数 x<x E(x)4 x(k)≤x<x(k+)(k=12 1) 5.12) ≥x( 为总体X的经验分布函数。换句话说,对任何实数x,经验分布函数Fn(x)等于样本值 中不超过x的个数再除以n,即 (x)(x1,x2…,x中不超过x的个数) 经验分布函数Fn(x)具有如下性质 (1)对给定的一组样本值x1,x2,…,xn,Fn(x)是一个分布函数,因为它具有分布函数 的特征,即①0≤Fn(x)≤1;②F(-∞)=0,F(+∞)=1;③F(x)单调非减且右 连续。 (2)由于Fn(x)是样本的函数,故Fn(x)是随机变量,且取值为0, l,进一步可证明nF(x)服从二项分布B(m,F(x),即 P{nF(x)=k}=CF(x)1-F(x)](k=0,…,n
X 的分布函数为 0, 0 ( ) ,0 1, x x F x x θ θ θ ⎧ , 由定理 5.2, 得 X(1) 的分布密度为 (1) 1 (1 ) ,0 ( ) 0, n X n x x p x θ θ θ ⎧ − ⎪ − ≤ ≤ = ⎨ ⎪ ⎩ 其他 而 X(n) 的分布密度为 ( ) 1 ,0 ( ) . 0, n n n X n x x p x θ θ ⎧ − ⎪ ≤ ≤ = ⎨ ⎪ ⎩ 其他 4. 经验分布函数 定义 5.5 设(X1 , X 2 ,", X n ) 是来自总体 X 的样本, 是次序统计 量,其观测值为 ,设 是任一实数,称函数 ( , , , ) X (1) X (2) " X (n) ( , , , ) (1) (2) (n) x x " x x ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ≥ ≤ < = − < = + ( ) ( ) ( 1) (1) 1 ( 1,2, , 1) 0 ( ) n n k k x x x x x k n n k x x F x " (5.12) 为总体 X 的经验分布函数。换句话说,对任何实数 ,经验分布函数 等于样本值 中不超过 的个数再除以 ,即 x F (x) n x n n x x x x F x n n ( , , , 中不超过 的个数) ( ) 1 2 " = (−∞ < x < +∞) 经验分布函数 Fn (x) 具有如下性质: (1) 对给定的一组样本值 , 是一个分布函数,因为它具有分布函数 的特征,即 ① n x , x , , x 1 2 " F (x) n 0 ≤ Fn (x) ≤ 1;② Fn (−∞) = 0 , Fn (+∞) = 1;③ 单调非减且右 连续。 F (x) n (2)由于 Fn (x) 是样本的函数,故 Fn (x) 是随机变量,且取值为 0,n 1 ,n 2 ,…, n n −1 , 1,进一步可证明 nFn (x) 服从二项分布 B(n, F(x)) ,即 k k n k n n P nF x k C F x F x − { ( ) = } = ( )[1− ( )] (k = 0,1,", n) (5.13)
其中F(x)是总体X的分布函数,由此可知 ELF (x]=F(x) DIE(xJ=F(x)I-F(x)I (3)当n→>∞时,经验分布函数Fn(x)依概率收敛于总体X的分布函数F(x),即 lim P F(x)-F(xke=1 (vE>0) 该性质利用贝努里大数定理即可证之。此性质表明,当n充分大时,就像可以用事件的 概率近似它的概率一样,可以用经验分布函数Fn(x)近似总体X的分布函数F(x)
其中 F(x) 是总体 X 的分布函数,由此可知 E[F (x)] F(x) , n = n F x F x D F x n ( )[1 ( )] [ ( )] − = (5.14) (3) 当 n → ∞ 时,经验分布函数 Fn (x) 依概率收敛于总体 X 的分布函数 F(x) ,即 lim {| ( ) − ( ) | 0) 该性质利用贝努里大数定理即可证之。此性质表明,当 充分大时,就像可以用事件的 概率近似它的概率一样,可以用经验分布函数 近似总体 n F (x) n X 的分布函数 F(x)