第五章数理统计的基本概念 教学目的要求: 1.要求学生掌握数理统计的基本概念,如:总体、样本、样本分布函数、样本函数、统 计量等。 2.会求样本分布函数,作直方图等处理数据的常用方法 3.掌握样本均值、样本方差、样本原点矩、样本中心矩等常用统计量。 教学重点 1.数理统计中常用的三大分布,如:x2-分布、t分布、F分布的定义和性质 2.正态总体统计量的分布 教学难点: 正态总体统计量的基本性质 §5.1母体与子样、经验分布函数 数理统计的基本内容: 收集、整理、分析观测大量随机现象所得的实验数据。 二、数理统计的基本任务: 硏究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念 特征作出科学的推断 三、基本概念: 1.总体:研究对象的全体所构成的集合(随机变量x可能取值集合代表总体某 指标)。 2.个体:组成总体的每一个单位。 3.样本:抽样结果得到x的一组实验数据(或观测值)。 4.样本容量:样本中包含的个体的个数 四、基本原则 5.随机抽样即:等可能的独立的抽取 6.由样本推断总体 五、基本假设: 7.无限总体(n/N≤0.1经验值) 8.独立同分布 六、样本分布函数:(经验分布函数) 设总体x中抽取容量为n样本,得到下面的样本频率分布表
第五章 数理统计的基本概念 教学目的要求: 1.要求学生掌握数理统计的基本概念,如:总体、样本、样本分布函数、样本函数、统 计量等。 2.会求样本分布函数,作直方图等处理数据的常用方法。 3.掌握样本均值、样本方差、样本原点矩、样本中心矩等常用统计量。 教学重点: 1.数理统计中常用的三大分布,如: 2 -分布、t-分布、F-分布的定义和性质。 2.正态总体统计量的分布 教学难点: 正态总体统计量的基本性质。 §5.1 母体与子样、经验分布函数 一、数理统计的基本内容: 收集、整理、分析观测大量随机现象所得的实验数据。 二、数理统计的基本任务: 研究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念 特征作出科学的推断。 三、基本概念: 1. 总体:研究对象的全体所构成的集合(随机变量 x 可能取值集合代表总体某一 指标)。 2. 个体:组成总体的每一个单位。 3. 样本:抽样结果得到 x 的一组实验数据(或观测值)。 4. 样本容量:样本中包含的个体的个数。 四、基本原则: 5. 随机抽样 即:等可能的独立的抽取 6. 由样本推断总体 五、基本假设: 7. 无限总体(n/N≤0.1 经验值) 8. 独立同分布 六、样本分布函数:(经验分布函数) 设总体 x 中抽取容量为 n 样本,得到下面的样本频率分布表:
观测值 x x 总计 频数 12 n 其中yE)=0 可见当样本容量充分大时Fn(x)-→F(x) 进一步由格里汶科定理 当n→∞时PSup|Fn(x)F(x))-mm→0 §5.2统计量及其分布 、样本函数: 从总体中抽取样本x1,x2…xn得到的观测值分别是xa,x(23,…,xm
观测值 x(1) x(2) … … x(t) 总 计 频 数 m1 m2 … … mt n 频 率 f 1 f 2 … … f t 1 其中 x(1) )=0 可见当样本容量充分大时 Fn (x) ⎯⎯p→ F (x) 进一步由格里汶科定理 当 n→ 时 P{ sup x Fn (x)-F (x) } ⎯⎯n−⎯.00→ 0 §5.2 统计量及其分布 一、样本函数: 从总体中抽取样本 x1,x2 ,… …, xn ,得到的观测值分别是 x(1) ,x(2) ,…, x(n)
则函数g(x,x2 xn)叫样本函数(n维随机函数 统计量 样本函数g(x1,x2 xn)中不含任何未知参数的随机变量。 、常用统计量: )样本均值x=∑x观测值 样本方差S=(x-x)=∑x-x 观测值Sn n(x-x)72x-x通常分母m换成m1,以保证无偏性 x (x1-x) 样本标准差Sn=Vsn= 观测值sn=sn (样本的k阶原点矩=∑x观测值 6样本的k阶中心矩U=n2(x-x)观测的=(x-x) 其中U=04n2=1 其中s=n12(x;-x)观测值=u n 当样本容量较大时,观测值x=∑m1x m(x (x 四、数理统计中的常用分布:
则函数 g( x1, x2 ,… …, xn )叫样本函数(n 维随机函数)。 二、统计量: 样本函数 g( x1, x2 ,… …, xn )中不含任何未知参数的随机变量。 三、常用统计量: ⑴ 样本均值 X = = n i xi n 1 1 观测值 x = = n i xi n 1 1 ⑵样本方差 Sn 2 = − = n i i xi x n 1 ( ) 1 = x n xi − 1 2 观测值 sn 2 = − = n i i xi x n 1 ( ) 1 = x n xi − 1 2 通常分母 n 换成 n-1,以保证无偏性。 ⑶样本标准差 n i n i n n x x s s − = = = 1 2 2 ( ) 观测值 n i n i n n x x s s − = = = 1 2 2 ( ) ; ⑷样本的 k 阶原点矩 = = n i k i k V x n 1 1 观测值 = = n i k i k V x n 1 1 ⑸样本的 k 阶中心矩 ( ) 1 1 U xi x n n k i k − = = 观测值 ( ) 1 1 U xi x n n k i k − = = ; 其中U1 0 u 2 = s n 2 1 1 − 其中 = s 2 1 1 n − − = n i k xi x 1 ( ) 观测值 2 =u 2 = s n 2 1 1 − 当样本容量较大时,观测值 m xi l i i n x = = 1 1 ( ) ( ) 1 1 2 1 2 s m x i x n l i i − − = = ( ) ( ) 1 2 1 2 m x i x n l i i − = = 四、数理统计中的常用分布:
()x-分布:设随机变量x,x2,……xk相互独立,并且都服从正态分 布N0,1),则x=x1+x2+……+x的概率密度 x 2(x)=0 E Dyy T2设x1与x2独立,且x:x()x2x(k2) 则x1+x2x(k1+k: 13上侧分位数,满足P(x>x(n)=fd,=a的数x,(m)则给定 2.t-分布: x~N(O)y~x(k)则随机变量t 的概率密度为 当自由度k→+∞,t-分布趋近与标准 kTPO 正态分布N(0,1) 分布 xx(k)yx(k)则F=2的概率密度为 /k2 k1+k2 k1 (x) k1、k2 k12k2 X k+k (kiX+k 其中k1分子自由度(第一自由度)k2分母自由度(第二自由度)
⑴ 2 -分布: 设随机变量 x1, x2 ,… …, xk 相互独立,并且都服从正态分 布 N(0,1),则 2 = x + x + 2 2 2 1 … …+ xk 2 的概率密度 2 (x) = x f e x k k k T 2 1 2 ) 2 ( 1 2 − − x>0; 2 (x) = x f 0 x≤0; Th1 E = x ( ) 2 k D = x ( ) 2 2*k; Th2 设 2 1 与 2 2 独立,且 ~ ( ) 1 2 2 x1 k ~ ( ) 2 2 2 x2 k 则 ~ ( ) 1 2 2 2 2 2 1 + k + k Th3 上侧分位数,满足 = = f d x x P n ( ) ( ) 2 2 ( ( )) 2 的数 ( ) 2 n 则给定 0< <1; 2. t-分布: x ~ N(0,1) ~ ( ) 2 2 y k 则随机变量 t= k y x 的概率密度为 ) 2 (1 2 ) 2 ( ) 2 1 ( ( ) 2 1 + + + − = k t k k P k T f x 当自由度 k → + ,t-分布趋近与标准 正态分布 N(0,1) 3. F-分布: ~ ( ) 1 2 x k ~ ( ) 2 2 y k 则 k k y x F 2 1 = 的概率密度为: f (x) F = ( ) 1 2 1 2 ) 2 ) ( 2 ( ) 2 ( 2 1 2 2 2 1 2 1 2 1 2 1 1 2 k x k k k k k k k k k k k k T T T + + − + + x>0; f (x) F =0 x≤0; 其中 k1 分子自由度(第一自由度) k 2 分母自由度(第二自由度);
§5.3次序统计量 Def5.3第i个次序统计量ξ(i):是关于子样ξ1,ξ2,、、ξn的函数,无论ξ1,2,、、 ξn取得怎样一组观测值x1,x2,、xn,它总是以其中第i个顺序值x(i)为其观测值. 注:(1)n个次序统计量,(1)≤ξ(2)、、≤ξ(n) 5(1)为最小次序统计量,(n)为最大统计量 (2)1,2,、、n相互独立,不一定有ξ(1)ξ(2)、、(n)相互独立,如 P243例5.2中P((1)=0)=19/27≠9/13P((1)=0|5(2)=1) 二、次序统计量的分布:(母体ξ是连续型) Th5.5若母体ξ有密度函数f(x)>0,a≤x≤b分布函数F(x),(1,52,、n) 为取自母体的一个子样,则第i个次序统计量ξ(i)的密度函数 (-1)(n-l) [FOr[-Forro a≤y≤b 其它 证明:事件(第i个次序统计量5(i)∈(y,y+△y)} e{(1)(2)…(n)∈(,y),()∈(,y+y),(…5)∈(+Ab) (a I+1 P(∈(y+4y b)=1-f(+△y) ∈(Uy+4y)=f(y)A y [F(y)[-F(y+△y) 令Ay→0时,由F(x)的连续性知 80)0- F(v[-F()f(0)asy≤6 其它
§5.3 次序统计量 Def 5.3 第 i 个次序统计量ξ(i):是关于子样ξ1,ξ2,、、ξn 的函数,无论ξ1,ξ2,、、、 ξn 取得怎样一组观测值x1,x2,、、、xn,它总是以其中第i个顺序值x(i)为其 观测值. 注:⑴ n 个次序统计量,ξ(1)≤ξ(2)、、、≤ξ(n) ξ(1)为最小次序统计量 , ξ(n)为最大统计量 ⑵ ξ1,ξ2,、、ξn 相互独立 ,不一定有ξ(1)ξ(2)、、、ξ(n)相互独立 ,如 P243 例 5.2 中 P(ξ(1)=0)=19/27≠9/13 P(ξ(1)=0∣ξ(2)=1) 二、次序统计量的分布: (母体ξ是连续型) Th5.5 若 母体ξ有密度函数 f(x)>0,a≤x≤b 分布函数 F(x),( ξ1,ξ2,、、ξn) 为取自母体的一个子样,则第 i 个次序统计量ξ(i)的密度函数 ( ) ( ) ( ) ( ) − − − − − 0 ( 1)!( )! ! [ ] [1 ] 1 f y i n i n y F y F y g i n i i 其它 a y b 证明: 事件{第 i 个次序统计量ξ(i) (y,y+ y )} {ξ(1)ξ(2)、、、ξ(n)∈(a,y), ξ(i) (y,y+ y ) , (y y b) i n ( ) , 1 + + 而 P( (a y)) F(y) k , = k=1,2、、、I+1 P (y y b) f (y y) t ( + , ) =1− + t=I+1,、、、、、n g m ( ) P (y y y) f y y i ( , + ) = ( ) ( ) ( 1)!( )! ! i n i n g y y i − − = [ ( )] [1 ( )] 1 F y F y y i n i − + − − 令 y → 0 时, 由 F(x) 的连续性知 ( ) ( ) ( ) ( ) − − − − − 0 ( 1)!( )! ! [ ] [1 ] 1 f y i n i n y F y F y g i n i i 其它 a y b
2x 0<x<I 例f(x) 0其它 50(55(5为容量为4的 求5曰的度函数g(分角函数G(求(5=) ≤0 解:F(x)={x20<x<1 H[F(JL-F(()=14 y^5(1-y2) g 0 0<x<1 G3()=4y-3y0<x≤ 243 m最大次计量,的度函数为g()=F(rhyb 0其它 Cor2:最小次序统计量 的密度函数为 n g1F(0 f()≤y<b 0其它 Th5.6:任意两个次序统计量<的联合分布密度函数为 () [F(y)[1-F(=)f(y)f(=),a<y<z<b 8n(y,)={(-1)(-i-1)(n-) 其他
例 = 0 2 ( ) x f x 其它 0 x 1 (1) (2) (3) (4) 〈 〈 〈 为容量为 4 的 , 求 (2) 的密度函数 g (x) 3 和分布函数 G (x) 3 求 ( ) 2 1 3 P 解: ( ) = 1 2 0 F x x 1 0 1 0 x x x ( ) ( ) ( ) − = − = 0 1 14 ^5(1 ^2) 2!1! 4! [ ( )]2 3 F y f y y y y F y g 0 x 1 = = 1 0 0 x x x ( ) 256 243 2 1 1 2 1 3 3 = = − P G Cor1:最大次序统计量 (n) 的密度函数为 ( ) ( ) y b n f y y F y g n n = − 0 0 [ ] ( ) 1 其它 Cor2: 最小次序统计量 (n) 的密度函数为 Th5.6: 任意两个次序统计量 i ( j) < ( ) 的联合分布密度函数为 1 ! [ ( )] [1 ( )] ( ) ( ), ( , ) ( 1)!( 1)!( )! 0 i n j ij n F y F z f y f z a y z b g y z i j i n j − − − = − − − − 其他 证 ( ) = − 1 4 3 0 6 8 G3 y y y ( ) ( ) ( ) = − − 0其它 [1 ] 0 1 1 n f y y b y F y g n
)△v△=P (O) E(v, y+Ay),5 G)(,2+A kela,yhs e(y+yh∈+Ah,∈(:+△)n1∈(+c s=1,2,3,、、、I-1,k=I+1,、、、j-1, 当a≤y≤z≤b时 g,0y=F()[r()F(+A)[-F(+△)/)/ 当Δy→>0A→0时定理得证 其它统计量:1、极差R=5m-50 2、子样中位数若n为奇数5n、若n为偶数、S 3、母体的P分位数an:若,F(an)=「f(x)dx=p,0<P<1 F(x)为母体分布函数 4、子样的P分位数,若k-m+1的次序统计量5a Th3:若母体占有密度函数f(x),an为P分位数,若f(x)在x=an处连续且大 于零,则5→Na p(1-p)
( ) ( ) ( ) ( ) y z y z P y y y (z z z) gij i j , = , + , , + (a y (y y y (z z z (z z z) (z z b s i k j , ] , + + , , + + , s=1,2,3,、、、、I-1, k=I+1,、、、、j-1, =j+1,、、、、、、、n 当 a y z b 时 g (y z) y z F (y) F(z) F(y y) F(z z) f y f z y z i j i n j i j = − + − + − − − − , 1 ( ) ( ) 1 1 当 y → 0 z →0 时 定理得证 其它统计量: 1 、 极差 ( ) (1) = − n Rn 2、 子样中位数 若 n 为奇数 1 ( ) 2 n + 若 n 为偶数 ( ) ( ) 2 2 2 n n + + 3、母体 的 P-分位数 ap :若, ( ) ( ) ,0 1 p a F a f x dx p p p − = = F(x) 为母体 分布函数 4、子样的 P-分位数,若 k= np+1 的次序统计量 (k ) Th3: 若母体 有密度函数 f (x) , ap 为 P-分位数,若 f (x) 在 x=ap 处连续且 大 于零 ,则 ( ) ( ) − → + n p p p N f a ap np 1 1 , 2 1