第五章数理统计的基本概念 在前四章里我们讨论了概率论的基本概念与方法,从中我们 学到一条基本的道理,随机变量及其所伴随的概率分布全面描述 了随机现象的统计规律性.但是在实际中,一个随机现象所服从的 分布是什么概型可能完全不知道,或者由于随机现象的某些事实 而知道其概型,但不知其分布函数中所含的参数.这些反而正是研 究者所希望了解的,是研究的目的 抽样 1.抽样的概念 从全部对象中按一定方式抽取一部分对象的过程叫作抽样 2.抽样的必要性 (1)违背研究的本来目的 (2)客观上对全部对象进行观测或检验是根本不可能的 (3)对全部对象进行检测的成本很高,或所需时间很长,或者 两者兼而有之 (4)虽然根据抽样调査的数据来推断的情况必定带来误差,但在很 多情况下,这种误差是可以容忍的. 二.统计推断: 伴随有一定概率的推断称为统计推断 5.1母体与子样、经验分布函数 1.母体、个体: 我们把研究对象的全体所构成的一个集合称为母体或总体,而把 组成母体的每一单元成员称为个体 2.随机抽样 按机会均等的原则选取一些个体进行观测或测试的过程称为随机 抽样 样本、容量 假如我们抽取了n个个体,且这n个个体的某一指标为 (51252,…,n),我们称这n个个体的指标(5122,…n)为一个子样 或样本,n称为这个子样的容量 4.子样空间 容量为n的子样的观测值(x12x2…,xn)可以看作一个随机试 验的一个结果,它的一切可能结果的全体构成一个样本空间,称为 子样空间. 5简单随机样本: 记总体为X,总体的分布函数设为F(x).一个容量为n的样本 (X1,X2,…,Xn)如果满足以下两个条件则称之为简单随机样本 (1)Xx与X具有相同的分布函数F(Xi=1,2,…,m)
第五章 数理统计的基本概念 在前四章里我们讨论了概率论的基本概念与方法,从中我们 学到一条基本的道理,随机变量及其所伴随的概率分布全面描述 了随机现象的统计规律性.但是在实际中,一个随机现象所服从的 分布是什么概型可能完全不知道,或者由于随机现象的某些事实 而知道其概型,但不知其分布函数中所含的参数.这些反而正是研 究者所希望了解的,是研究的目的. 一. 抽样: 1.抽样的概念 从全部对象中按一定方式抽取一部分对象的过程叫作抽样. 2.抽样的必要性: ⑴ 违背研究的本来目的. ⑵ 客观上对全部对象进行观测或检验是根本不可能的. ⑶ 对全部对象进行检测的成本很高,或所需时间很长,或者 两者兼而有之. ⑷ 虽然根据抽样调查的数据来推断的情况必定带来误差,但在很 多情况下,这种误差是可以容忍的. 二. 统计推断: 伴随有一定概率的推断称为统计推断. §5.1 母体与子样、经验分布函数 1.母体、个体: 我们把研究对象的全体所构成的一个集合称为母体或总体,而把 组成母体的每一单元成员称为个体. 2.随机抽样: 按机会均等的原则选取一些个体进行观测或测试的过程称为随机 抽样. 3.样本、容量: 假如我们 抽取了 n 个个 体,且 这 n 个 个体的 某一 指标为 ( n , , , 1 2 ),我们称这 n 个个体的指标( n , , , 1 2 )为一个子样 或样本,n 称为这个子样的容量. 4.子样空间: 容量为 n 的子样的观测值( n x , x , , x 1 2 )可以看作一个随机试 验的一个结果,它的一切可能结果的全体构成一个样本空间,称为 子样空间. 5.简单随机样本: 记总体为 X,总体的分布函数设为 F( x ).一个容量为 n 的样本 ( X X Xn , , , 1 2 )如果满足以下两个条件,则称之为简单随机样本: ⑴ X X F(X)(i 1,2, ,n); i与 具有相同的分布函数 =
(2)Xx1,Xx2,…,Xn相互独立 注:设母体X具有分布函数F(x),(x1x2,…,xn)为取自这一母 体的容量为n的子样,则(x12x2,…,xn)的联合分布函数为: (x1x2…x)=∏F(x) 6简单随机抽样: 可获得简单随机样本的抽样方法称为简单随机抽样 7经验分布函数: (1)定义 设(x1,x2,…,xn)是取自分布函数为F(x)的母体中一个简单随 机样本的观测值.若把子样观测值由小到大进行排列,得到 ≤x()≤…≤ 里 x0是子样观测值(x1,x2…,x,)中最小的一个,x是子样观测值中第个小的数等则 F(x)={,当xa)< 显然,Fn(x)是一非减左连续函数,且满足 F(-∞)=0和Fn(+∞)=1 由此可见,F(x)是一个分布函数,称作经验分布函数(或子样分布函 (2)性质(格里汶科关系式) m→时, P sup IFn 一<<+0 由此可见当n相当大时,经验分布函数F(x)是母体分布函数F(x) 的一个良好的近似 §52统计量及其分布 样本是总体的代表和反映,是统计推断的基本依据但是子样所 含的信息不能直接用于解决我们所要研究的问题而需要把子样的 信息进行数学上的加工使其浓缩起来从而解决我们的问题这在数
⑵ X X Xn , , , 1 2 相互独立. 注:设母体 X 具有分布函数 F(x), ( , , , ) 1 2 n x x x 为取自这一母 体的容量为 n 的子样, 则 ( , , , ) 1 2 n x x x 的联合分布函数为: = = n i n i F x x x F x 1 1 2 * ( , ,, ) ( ) 6.简单随机抽样: 可获得简单随机样本的抽样方法称为简单随机抽样. 7.经验分布函数: ⑴定义: 设 ( , , , ) 1 2 n x x x 是取自分布函数为 F( x )的母体中一个简单随 机 样 本 的观 测值 . 若 把子 样 观测 值 由小 到大 进 行排 列, 得 到 ( ) ( ) (n) x x x 1 2 , 这 里 x(1)是子样观测值(x1 , x2 , , xn )中最小的一个, x(i)是子样观测值中第i个小的数等,则 ( ) ( ) ( ) ( ) = − = + n n k k k n x x x x x k n x x F x 当 当 当 , 1,2, , 1 1, , 0, ( ) 1 1 显然, F (x) n 是一非减左连续函数,且满足 Fn (−) = 0和Fn (+) =1 由此可见, F (x) n 是一个分布函数,称作经验分布函数(或子样分布函 数). ⑵性质(格里汶科关系式): = → − ⎯ →⎯ → − + , sup ( ) ( ) 0 1 n n x 当n 时 P F x F x 由此可见,当 n 相当大时,经验分布函数 F (x) n 是母体分布函数 F(x) 的一个良好的近似. §5.2 统计量及其分布 样本是总体的代表和反映,是统计推断的基本依据.但是子样所 含的信息不能直接用于解决我们所要研究的问题,而需要把子样的 信息进行数学上的加工使其浓缩起来,从而解决我们的问题.这在数
理统计中往往通过构造一个合适的依赖于子样的函数一统计量一来 达到的 统计量 统计量的定义: 定义51一个统计量是子样的一个函数,如果子样容量为n, 它也就是n个随机变量的函数,并且要求这个函数是不依赖于任何 未知参数的随机变量。统计量的分布称为抽样分布 即,不含未知参数的样本的函数∫(X1X2…,xn)为统计量。 显然,统计量是随机变量的函数,因此它也是一个随机变量(或 向量)。 例1.设X1,X2是一个容量为2的样本,总体分布为N(,62) 其中62是未知参数则有,K1+X2,X1+4X2+X2,H12+X2都 是统计量,而X1+,H2+X2+62,(X1-)/6都不是统计量 2.常用的统计量: (1)样本矩 定义52设5,52,…,5n是由母体5取出的容量为n的子样,则 有: ①原点矩: A=∑ 称为k阶原点矩,k=1时称为样本均值,记为5 ②中心矩 B=∑(5,-5) 称为k阶中心矩,k=1,2,…,特别地,k=2时称为样本方差,记为S2 (2)样本均值与样本方差的性质: 定理51设母体ξ的分布函数F(x)具有二阶矩,即 E2=<∞,D2=<∞.如果是取自这一母体的一个样本,则样 本均值的数学期望与方差分别为 若假设母体的原点矩和中心矩都存在,则样本方差的数学期望 和方差依次为 并且样本均值与样本方差为 定理52设为两个随机向量,且,其中为一个阶方阵,则有
理统计中往往通过构造一个合适的依赖于子样的函数—统计量—来 达到的. 一.统计量: 1. 统计量的定义: 定义 5.1 一个统计量是子样的一个函数,如果子样容量为 n, 它也就是 n 个随机变量的函数,并且要求这个函数是不依赖于任何 未知参数的随机变量。统计量的分布称为抽样分布。 即,不含未知参数的样本的函数 ( , , , ) X1 X2 Xn f 为统计量。 显然,统计量是随机变量的函数,因此它也是一个随机变量(或 向量)。 例1. 设 1 2 X , X 是一个容量为 2 的样本,总体分布为 ( , ) 2 N , 其中 2 , 是未知参数.则有, 2 2 2 1 4 2 2 3 1 2 1 X + X , X + 4X + X , X + X 都 是统计量,而 , ,( 1 ) 2 2 2 2 X1 + X1 + X + X − 都不是统计量. 2. 常用的统计量: ⑴样本矩: 定义 5.2 设 n , , , 1 2 是由母体 取出的容量为 n 的子样,则 有: ① 原点矩: = = n i k Ak n i 1 1 称为 k 阶原点矩,k=1 时称为样本均值,记为 。 ② 中心矩: = = − n i k Bk n i 1 1 ( ) 称为 k 阶中心矩,k=1,2,…,特别地,k=2 时称为样本方差,记为 2 Sn . ⑵样本均值与样本方差的性质: 定 理 5.1 设 母 体 的分布函数 F(x) 具 有 二 阶 矩 , 即 = = 2 E , D .如果是取自这一母体的一个样本,则样 本均值的数学期望与方差分别为 若假设母体的原点矩和中心矩都存在,则样本方差的数学期望 和方差依次为 并且样本均值与样本方差为 定理 5.2 设为两个随机向量,且,其中为一个阶方阵,则有
定理53设母体服从正态分布,是取自这个母体的一个子样,则 服从正态分布 定理54设是正态母体的一个子样,其样本均值与样本方差分 别为 则有①相互独立; ②服从自由度为n-1的分布 系1.设为取自正态母体的一个子样样本均值与样本方差分别 为,则 是自由度为n-1的t变量,它服从t(n-)分布 系2.设分别是从正态母体抽取的两个子样且相互独立并设这 两个子样的样本方差分别为这两个子样的样本均值分别为于是 服从分布 特别地,当时,则 服从分布 系3.设为取自正态母体的子样为取自正态母体的子样,并且这 两个子样相互独立,则随机变量 服从自由度为的分布其中分别为这两个子样的样本均值,分别为这 两个子样的样本方差,且 53次序统计量及其分布 次序统计量在近代统计推断中起着重要的作用,这是由于次序 统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来 较方便因此在质量管理、可靠性等方面得到广泛的应用现在我们扼 要地介绍有关次序统计量的内容 次序统计量的概念 定义53设是取自分布函数为F(x)的母体的一个子样表示这个 子样的一组观测值这些观测值由小到大的排列用表示,即若其中有 两个分量相等它们先后次序的安排是可以任意的 第i个次序统计量是上述子样的一个函数不论子样取得怎样一 组观测值,它总是取其中的为观测值 显然,对于容量为n的子样可以得到n个次序统计量其中称为最 小次序统计量称为最大次序统计量 例1.设为取自母体的一个容量为3的子样,的分布列为 现在把子样与它们所构成的次序统计量的一切可能观测值列于 下表中 由于子样取到每一组观测值的概率都等于,容易从表中看出 因此一般来说次序统计量之间是相互不独立的 二.第i个次序统计量的分布: 定理55设母体有密度函数f(x)>0(这里可以设a,b=+),并且为
定理 5.3 设母体服从正态分布,是取自这个母体的一个子样,则 服从正态分布. 定理 5.4 设是正态母体的一个子样,其样本均值与样本方差分 别为 则有:①相互独立; ②服从自由度为 n-1 的分布. 系 1. 设为取自正态母体的一个子样,样本均值与样本方差分别 为,则 是自由度为 n-1 的 t-变量,它服从 t(n-1)分布. 系 2. 设分别是从正态母体抽取的两个子样,且相互独立.并设这 两个子样的样本方差分别为. 这两个子样的样本均值分别为.于是 服从分布. 特别地,当时,则 服从分布. 系 3. 设为取自正态母体的子样,为取自正态母体的子样,并且这 两个子样相互独立,则随机变量 服从自由度为的分布,其中分别为这两个子样的样本均值,分别为这 两个子样的样本方差,且 5.3 次序统计量及其分布 次序统计量在近代统计推断中起着重要的作用,这是由于次序 统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来 较方便.因此在质量管理、可靠性等方面得到广泛的应用.现在我们扼 要地介绍有关次序统计量的内容. 一. 次序统计量的概念: 定义 5.3 设是取自分布函数为 F(x)的母体的一个子样.表示这个 子样的一组观测值.这些观测值由小到大的排列用表示,即.若其中有 两个分量相等,它们先后次序的安排是可以任意的. 第 i 个次序统计量是上述子样的一个函数,不论子样取得怎样一 组观测值,它总是取其中的为观测值. 显然,对于容量为n的子样可以得到n个次序统计量.其中称为最 小次序统计量.称为最大次序统计量. 例1. 设为取自母体的一个容量为 3 的子样,的分布列为 现在把子样与它们所构成的次序统计量的一切可能观测值列于 下表中: 由于子样取到每一组观测值的概率都等于,容易从表中看出 因此一般来说次序统计量之间是相互不独立的. 二. 第 i 个次序统计量的分布: 定理5.5 设母体有密度函数f(x)>0,(这里可以设a=-,b=+),并且为
取自这个母体的一个子样,则第i个次序统计量的密度函数为 例1.设母体有密度函数 并且为从取的容量为的子样的次序统计量。求的密度函数和分布函 数,并且计算概率 解母体的分布函数为 由公式得出的密度函数 对于的其他值。分布函数为 而概率 系最大次序统计量的密度函数为 系最小次序统计量的密度函数为 这两个系的证明是明显的,这里不叙述了 下面我们同样以连续型母体分布为例考虑任何两个次序统计量 的联合分布。 定理设母体有密度函数(同样可以设 )。并且 是取自这一母体的一个子样,则其任意两个次序统计量 的 联合分布密度函数为 证第个次序统计量落入无穷小区间和第个次序统 计量落入无穷小区间,这里,这一事件等价于“容量为n的子样本 中有i-1个分量落入区间内,个分量落入区间内,个分量落入区间内 而余下个分量落入区间内”设这一事件的概率等于据其构成的形式, 由图我们见到每一个子样分量落入区间的概率为
取自这个母体的一个子样,则第 i 个次序统计量的密度函数为 例 1.设母体有密度函数 并且为从取的容量为的子样的次序统计量。求的密度函数和分布函 数,并且计算概率 解 母体的分布函数为 由公式得出的密度函数 对于的其他值。分布函数为 而概率 系 最大次序统计量 的密度函数为 系 最小次序统计量 的密度函数为 这两个系的证明是明显的,这里不叙述了。 下面我们同样以连续型母体分布为例考虑任何两个次序统计量 的联合分布。 定理 设母体 有密度函数 (同样可以设 )。并且 是取自这一母体的一个子样,则其任意两个次序统计量 的 联合分布密度函数为 证 第 个次序统计量 落入无穷小区间 和第 个次序统 计量 落入无穷小区间,这里,这一事件等价于“容量为 n 的子样本 中有 i-1 个分量落入区间内,个分量落入区间内,个分量落入区间内, 而余下个分量落入区间内”.设这一事件的概率等于,据其构成的形式, 由图我们见到每一个子样分量落入区间的概率为