§24次序统计量及其分布 次序统计量 设(X1,X2,…,X)是从总体X中抽取的一个样本, 记(x1,x2,…,x)为样本的一个观测值,将观测值的各 个分量按由小到大的递增序列重新排列为 x1≤x<…≤x 2) (n) 当(X1,X2,…,X)取值为(x,x2,…,x)时,定义X取 值为xk(k=1,2…,m)由此得到的(X(,xX(2)2…,X(m)称为 样本(X1,X2…,X,)的次序统计量。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 1 § 2.4 次序统计量及其分布 一 次序统计量 设( ) X X Xn , , , 1 2 是从总体 X 中抽取的一个样本, 记( ) x x xn , , , 1 2 为样本的一个观测值,将观测值的各 个分量按由小到大的递增序列重新排列为 (1) (2) ( ). n x x x 当( ) X X Xn , , , 1 2 取值为( ) x x xn , , , 1 2 时,定 义X( ) k 取 值 为 ( ) ( 1,2, , ), k x k n = 由此得到的 (1) (2) ( ) ( , , , ) X X X n 称 为 样本( ) X X Xn , , , 1 2 的次序统计量
显然有 X<X、<…<X (n) 其中X=minX称为最小次序统计量,它的值x是样本 值中最小的一个;而X(m)=maxX称为最大次序统计量, 它的值xm是样本值中最大的一个。 由于次序统计量的每一个分量Xk都是样本 (X,X2,…,X)的函数,所以X,X2…X也都是随机 变量。样本(X1,X2…,X,)是相互独立的,但其次序统 计量(X),X2y…Xm)一般不是独立的。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 2 显然有 X X X (1) (2) ( ) n 其中 (1) 1 min i i n X X = 称为最小次序统计量,它的值 (1) x 是样本 值中最小的一个;而 ( ) 1 max n i i n X X = 称为最大次序统计量, 它的值 ( ) n x 是样本值中最大的一个。 由于次序统计量的每一个分量X( ) k 都是样本 ( ) X X Xn , , , 1 2 的函数,所以 (1) (2) ( ) , , , X X X n 也都是随机 变量。样本( ) X X Xn , , , 1 2 是相互独立的,但其次序统 计量 (1) (2) ( ) ( , , , ) X X X n 一般不是独立的
定义样本X,X,…,X按由小到大的顺序重排为 X,< XA< (2) X 则称(X,X2y…X(m)为样本(X1,X2,…,Xn)的次序统计 量,X(称为样本的第k个次序统计量。 定理次序统计量是充分统计量。 证明当给定X=x…X(m)=xm时,由于X1,X2,…,Xn 独立同分布,所以 P(X (1) X=x 此条件分布与总体分布无关,故次序统计量是充分统计量。 湘潭大学数学与计算科学学院一页一页3
湘潭大学数学与计算科学学院 上一页 下一页 3 定义 样本X X Xn , , , 1 2 按由小到大的顺序重排为 X X X (1) (2) ( ) n 则称 (1) (2) ( ) ( , , , ) X X X n 为样本(X X Xn , , , 1 2 )的次序统计 量,X( ) k 称为样本的第 k 个次序统计量。 定理 次序统计量是充分统计量。 证 明 当给定 (1) (1) ( ) ( ) , , X x X x = = n n 时,由于X X Xn , , , 1 2 独立同分布, 所以 1 (1) ( ) 1 ( , , ) ! n P X x X x i i n n = = = 此条件分布与总体分布无关,故次序统计量是充分统计量
定理设总体X的分布密度为fx)(分布函数为F(x), X1,X2,…,X为样本,则第k个次序统计量X的分布 密度为 fx(x= [F(x)[1-F(x)”f(x)2k=1,2,…n (k-1)(n-k) 特别,最小次序统计量X和最大次序统计量X的分布 密度为 fxn(x)=1-F(x)了(x) (1) 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 4 定理 设总体 X 的分布密度为 f(x)(分布函数为 F(x)), X X Xn , , , 1 2 为样本,则第 k 个次序统计量X( ) k 的分布 密度为 ( ) 1 ! ( ) [ ( )] [1 ( )] ( ), 1,2, , . ( 1)!( )! k k n k X n f x F x F x f x k n k n k − − = − = − − 特别,最小次序统计量X(1) 和最大次序统计量X( ) n 的分布 密度为 (1) ( ) 1 1 ( ) [1 ( )] ( ), ( ) [ ( )] ( ). n n X n X f x n F x f x f x n F x f x − − = − =
定理设总体X的分布密度为fx)(分布函数为F(x) X1,X2,…,X,为其样本,则次序统计量的分布密度为 (Xy,X(2y)…X(m)的联合分布密度为 f(y1,y2…,yn)=11 nlf()y<y2≤…<y 0其他 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 5 定理 设总体X的分布密度为f(x)(分布函数为F(x)), X X Xn , , , 1 2 为其样本,则次序统计量的分布密度为 (1) (2) ( ) ( , , , ) X X X n 的联合分布密度为 1 2 1 2 1 ! ( ), ( , , , ) 0, n i n n i n f y y y y f y y y = = 其他
定理设总体X的分布密度为fx)(分布函数为F(x) X1,X2,…,Xn为其样本,则次序统计量的分布密度为 (X()x()的联合分布密度为 (xy)Jn(n-1)F(y)-F(x)2f(x)f(y)x<y 0,x≥y 湘潭大学数学与计算科学院一页一页]6
湘潭大学数学与计算科学学院 上一页 下一页 6 定理 设总体X的分布密度为f(x)(分布函数为F(x)), X X Xn , , , 1 2 为其样本,则次序统计量的分布密度为 (1) ( ) ( , ) X X n 的联合分布密度为 (1) ( 2) 2 ( , ) ( 1)[ ( ) ( )] ( ) ( ), , ( , ) 0, , n X X n n F y F x f x f y x y f x y x y − − − =
样本中位数和样本极差 设(X1,X2,…,Xn)是总体X中的样本,(x0y,2y…,Yo) 为其次序统计量,则样本中位数定义为 7奇 [Xn+Xn1.J,n偶 2 它的值为 X n+1 奇 2 X x +x n+1 ,n偶 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 7 二、样本中位数和样本极差 设(X X Xn , , , 1 2 )是总体 X 中的样本 , (1) (2) ( ) ( , , , ) X X X n 为其次序统计量,则样本中位数定义为 1 ( ) 2 1 ( ) ( ) 2 2 1 [ ] 2 n n n X n X X X n + + = + , 奇 , 偶 它的值为 1 ( ) 2 1 ( ) ( ) 2 2 1 [ ] 2 n n n x n x x x n + + = + , 奇 , 偶
样本中位数与样本均值一样是刻划样本位置特征的量, 而且样本中位数的计算方便并不受样本异常值的影响, 所以有时比样本均值更有代表性。 样本极差定义为 R=Xm-Xo=max xi-min, ≤ln 它的值为 r=Xn)- Xo - xi minxi, 样本极差与样本方差一样是反映样本值变化幅度或离 散程度的数字特征,而且计算方便,所以在实际中有 广泛的应用 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 8 样本中位数与样本均值一样是刻划样本位置特征的量, 而且样本中位数的计算方便并不受样本异常值的影响, 所以有时比样本均值更有代表性。 样本极差定义为 ( ) (1) 1 1 max min , n i i i n i n R X X X X = − = − 它的值为 ( ) (1) 1 1 max min , n i i i n i n r x x x x = − = − 样本极差与样本方差一样是反映样本值变化幅度或离 散程度的数字特征,而且计算方便,所以在实际中有 广泛的应用
例从总体中抽取容量为6的样本,测得样本值为 32,65,28,35,30,29 由小到大排列为 28,29,30,32,35,65; 则样本中位数为: X Xa+x (3) 4]=31 而样本均值为: 6 36 5 6 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 9 例 从总体中抽取容量为6的样本,测得样本值为 32, 65, 28, 35, 30, 29, 由小到大排列为 28, 29, 30, 32, 35, 65; 则样本中位数为: (3) (4) 1 [ ] 31; 2 x x x = + = 而样本均值为: 6 1 1 36.5; 6 i i x x = = =
样本均值x大于样本值6个数中的5个数,这 是因为样本值65比其它值大许多,可见样本均值 对异常值或极端值较敏感,而样本中位数则不受异 常值影响,所以有时候估计总体均值用样本中位数 比用样本均值效果更好。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 10 样本均值x 大于样本值 6 个数中的 5 个数,这 是因为样本值 65 比其它值大许多,可见样本均值 对异常值或极端值较敏感,而样本中位数则不受异 常值影响,所以有时候估计总体均值用样本中位数 比用样本均值效果更好