§6.3轴样分布 ,正起依的物强纷
§63抽样分布 由于统计量是由样本决定的,而在 次具体的抽样之前,样本中的每一个分量 都是随机变量,所以,在一次具体的抽样 之前,统计量也是随机变量,也有自己的 庄分布我们称统计量的分布为抽样分布下 面,先介绍样本的频数分布 、样本的频数分布 牛将样本值中所有的不同数值由小到大排 上页
§6.3 抽样分布 由于统计量是由样本决定的,而在一 次具体的抽样之前,样本中的每一个分量 都是随机变量,所以,在一次具体的抽样 之前,统计量也是随机变量,也有自己的 分布. 我们称统计量的分布为抽样分布. 下 面,先介绍样本的频数分布. 一、样本的频数分布 将样本值中所有的不同数值由小到大排
王列<x<x样本值中取这些值的频数分 别记m2…m(应有m2+…+m=n),这 样就可得到样本的频数分布: 样本 频数m1 牛当样本容量较大时,可将样本值的范围划 分成若干个长度相等的间隔,然后计算样 本值落在这些间隔中的频数,再按上表列 出频数分布.频数分布通常用样本直方图 (Histogram) 上页
列 , 样本值中取这些值的频数分 别记为 (应有 ),这 样就可得到样本的频数分布: 当样本容量较大时,可将样本值的范围划 分成若干个长度相等的间隔,然后计算样 本值落在这些间隔中的频数,再按上表列 出频数分布. 频数分布通常用样本直方图 (Histogram) k x x x 1 2 m m mk , , , 1 2 m m m n k + ++ = 1 2
除频数直方图外,有时还需考虑概率直方 图,它要求每个直方条的面积需等于相应 间隔上的样本频率,这样直方条的高度就 不再是频数了,并且所有直方条面积之和 等于1.可见,概率直方图类似于概率密度 函数的图像.更多的讨论这里就不再详述了 100 100 a)等间隔情形 (b)不等隔情形 生图65样本直方图(来用10个我数据) 上页
除频数直方图外,有时还需考虑概率直方 图,它要求每个直方条的面积需等于相应 间隔上的样本频率,这样直方条的高度就 不再是频数了,并且所有直方条面积之和 等于1. 可见,概率直方图类似于概率密度 函数的图像. 更多的讨论这里就不再详述了. 图6.5 样本直方图(采用1000个模拟数据)
主二、经验分布函数 对任意实数x∈(-0,+∞),定义 样本(1,H2,…,H2)中不超过x的x的个数 F2(x) ,(6-19) 牛则称其为样本x1…x)的经验分布函数 (Empirical Distribution Function). F(r) 是对总体X的分布函数F(的一个经验模拟 并且可以验证它还具有分布函数的基本性 质:单调不减,右连续,F2(∞)=0,F(+)=1 应当注意,当给定样本值(x1x2…xn)之后, 上页 圆
二、经验分布函数 对任意实数 ,定义 , (6-19) 则称其为样本 的经验分布函数 (Empirical Distribution Function). 是对总体X的分布函数 的一个经验模拟 并且可以验证它还具有分布函数的基本性 质:单调不减,右连续, , . 应当注意,当给定样本值 之后, x (−, + ) ( , , , ) X1 X2 Xn F (x) n F (x) n Fn (−) = 0 (+) =1 Fn ( , , , ) 1 2 n x x x
是具有分布函数性质的普通阶梯形函数 却 是与确定值x有关的随机变量,因为对每个 给定的x,值实际上就是在 F(x) 图6.6经验分布函数 该次抽样中事件X≤x发生的频率(见 王页下
是具有分布函数性质的普通阶梯形函数 (如图6.6所示),但是对样本而言,它却 是与确定值x有关的随机变量,因为对每个 给定的x,值实际上就是在 该次抽样中事件 发生的频率(见 0 1 图 6.6 经验分布函数 1 x 2 x 3 x 4 x 5 x F (x) n 6 x {X x}
王(619)式),它完全由样本决定,而样本 庄是随机的,所以,F(0.是随机变量E(的 这种双重性恰好反映了抽样前后不同的统 压计观点:请注意领会进步地根据分布 9 生的概率,又mn(x)恰是在n次“试验”(抽样) 中事件发生的次数,这样,还有以 下结论: 王(1)nE(x)~BnF(x) 牛(2)对任意给定的x和任意的>0,有 上页
(6-19)式),它完全由样本决定,而样本 是随机的,所以, 是随机变量. 的 这种双重性恰好反映了抽样前后不同的统 计观点,请注意领会. 进一步地,根据分布 函数的定义 , 是事件 发 生的概率,又 恰是在n次“试验”(抽样) 中事件 发生的次数,这样,还有以 下结论: (1) ; (2)对任意给定的x和任意的 ,有 F (x) n F (x) n F(x) = P{X x} F(x) {X x} nF (x) n {X x} n F (x) ~ B(n, F(x)) n 0
PFn(x)-F(x)|0,(见定理51的推论2 可见,当样本容量n足够大时,事件F(+-kl 在一次抽样中几乎是必然发生的,根据实 际推断原理,从而抽样后得到的 般 就可近似x).这也是(x)的一个重要应用 庄关于F(6更深入的讨论见4 生蜀处根捆章讨的机变量大你 生统计量和最小顺序统计量x的抽样分布 上页
, (6-20) 即 , ,(见定理5.1的推论2). 可见,当样本容量n足够大时,事件 在一次抽样中几乎是必然发生的,根据实 际推断原理,从而抽样后得到的 一般 就可近似 . 这也是 的一个重要应用. 关于 更深入的讨论见[4]. 另外,根据第三章讨论的随机变量最大值 和最小值的分布,还可获得 最大顺序 统计量和最小顺序统计量 的抽样分布. lim {| ( ) − ( ) | } = 1 → P F x F x n n F (x) F(x) P n ⎯→ n → {| F (x) − F(x) | } n F (x) n F(x) F (x) n F (x) n X (n) X(1)
王三、正态总体的抽样分布定理 般地,要确定一个统计量的分布, 即抽样分布,并不是一件容易的事情.不过 当总体是正态总体(即总体X服从正态分布) 庄出:下面的两个抽样分布定理在数理统计 中占有极为重要的地位,必须牢固掌握 出定理6.1(单个正态总体的抽样分布定理 设 是取电正态总体N2) 的 上页
三、正态总体的抽样分布定理 一般地,要确定一个统计量的分布, 即抽样分布,并不是一件容易的事情. 不过, 当总体是正态总体(即总体X服从正态分布) 时,一些常用统计量的分布却不难求 出.下面的两个抽样分布定理在数理统计 中占有极为重要的地位,必须牢固掌握. 定理6.1 (单个正态总体的抽样分布定理) 设 是取自正态总体 的 ( , , , ) X1 X2 Xn ( , ) 2 N
王一个样本,x和S分别为样本均值和样本方 差,则 牛(1)x4√n-N01);(6-21) 庄(2)∞2-x(m-D);(62) 庄(3)x与S相互独立;(623) (4)xn=a(n-1).(6-24) 王定理中的结论(1)和(4)可通过对比来 牛记忆,另外,还需强调的是,本定理只适 用于正态总体,对其它总体无效 上页
一个样本, 和 分别为样本均值和样本方 差,则 (1) ; (6-21) (2) ; (6-22) (3) 与 相互独立; (6-23) (4) . (6-24) 定理中的结论(1)和(4)可通过对比来 记忆.另外,还需强调的是,本定理只适 用于正态总体,对其它总体无效. X 2 S n ~ N(0,1) X − ~ ( 1) ( 1) 2 2 2 − − n n S X 2 S ~ ( −1) − n t n S X