第一章统计推断准备 0.预备知识 0.1大数定律与中心极限定理 阐明大量随杋现象平均结果的稳定性的一系列定理统 称大数定律,而研究独立随机变量的和的极限分布在 什么条件下为正态分布的一类定理叫中心极限定理。 0.1.1车贝雪夫不等式 设随机变量5有期望E和方差D,则对任意>0,有 P∥5-E引|≥}≤
第一章 统计推断准备 0.预备知识 0.1 大数定律与中心极限定理 阐明大量随机现象平均结果的稳定性的一系列定理统 称大数定律,而研究独立随机变量的和的极限分布在 什么条件下为正态分布的一类定理叫中心极限定理。 0.1.1车贝雪夫不等式 设随机变量 有期望 和方差 ,则对任意 ,有 2 D P E − E D 0
0.12大数定律 定义:若5,k2…,5n,随机变量序列,如果存在常 数列a,a2 使得对任意的E>0有 lim ∑ n→∞O 成立,则称随机变量序列{5n}服从大数定律 定理1(贝努里大数定律)设灿是n重贝努里试验 中事件A出现的次数,又A在每次试验中出现的 概率为p(0p0,有: -p<a
0.1.2大数定律 定义:若 随机变量序列,如果存在常 数列 使得对任意的 有 成立,则称随机变量序列 服从大数定律. 定理1(贝努里大数定律)设 是n重贝努里试验 中事件A出现的次数,又A在每次试验中出现的 概率为p(0<p<1),则对任意的 ,有: 1 2 , ,..., ,... n 1 2 , ,..., ,... n a a a 0 1 1 lim 1 n i n n i P a n → = − = n n 0 lim 1 n n P p n → − =
定理2(车贝雪夫大数定律)设5,52,5”…是一列两两不相 关的随机变量,又设他们的方差有界,既存在常数C>0 使有D≤C,i=12,则对任意的E>0,有 lim p ∑5-∑E0有 lim p al<a n→)
定理2(车贝雪夫大数定律)设 是一列两两不相 关的随机变量,又设他们的方差有界,既存在常数C>0, 使有 则对任意的 ,有 例1.: 设 为独立同分布的随机变量序列,均服 从参数为 的泊松分布 则 定理3(辛钦大数定律)设 是一列独立同分布的 随机变量,且数学期望存在, 则对任意的 有 1 2 , ,..., ,... n , 1,2,... D C i i = 0 1 1 1 1 lim 1 n n i i n i i P E n n → = = − = 1 2 , ,..., ,... n , , 1,2,... E D i i i = = = 1 1 lim 1 n i n i P n → = − = 1 2 , ,..., ,... n 0 1 1 lim 1 n i n i P a n → = − = Ei = a,Di C,i =1,2,
0.1.3中心极限定理 定理1(林德贝格勒维定理)若552…,5n是独立同分布 的随机变量序列,且Ek=a,D5k=a2>0.k=12,…则随机变 量n=5-m,其中S=∑5的分布函数E(x)对一切x, nO 有 lim F(x=lim P(n < x)=lim pl on-na <X e 2 dt n→0 n→) vno 2丌 即随机变量m渐近地服从标准正态分布 定理2(德莫佛-拉普拉斯定理)设是n重贝努里试验中 事件A出现的次数,而0<p<1是事件A在每次试验中出现 的概率,则m渐近的服从正态分布N(m,m,其中q=1-p 或 lim pin, -np <X dt n→00
0.1.3.中心极限定理 定理1(林德贝格-勒维定理)若 是独立同分布 的随机变量序列,且 则随机变 量 ,其中 的分布函数 对一切x, 有: 即随机变量 渐近地服从标准正态分布。 定理2(德莫佛-拉普拉斯定理)设 是n重贝努里试验中 事件A出现的次数,而0<p<1是事件A在每次试验中出现 的概率,则 渐近的服从正态分布 ,其中q=1-p 或 2 n n S na n − = 1 2 , ,..., ,... n 2 , 0, 1,2,... E a D k k k = = = 1 n n i i S = = F x n ( ) ( ) ( ) 2 2 2 1 lim lim lim 2 t x n n n n n n S na F x P x P x e dt n − → → → − − = = = n n N np npq ( , ) 2 2 1 lim 2 t x n n np P x e dt npq − → − − = n
例2:有一批建筑房屋用的木柱,其中80%的长度 不小于3米,现从这批木柱中随机地取出100根, 问其中至少有30根短于3米的概率是多少? 例3:某车间有200台车床,独立工作,开工率为 0.6,开工时耗电各为1000瓦,问供电部门至少 要供给这个车间多少电力才能使99,9%的概率保 证这个车间不会因为供电不足而影响生产。 例4:一加法器,同时收到20个噪声电压 设他们是相互独立的,且在区间(0,10)上服 从均匀分布的随机变量,记U=之U,求 P(U>105 U2k=1,2,…,20
例2:有一批建筑房屋用的木柱,其中80%的长度 不小于3米,现从这批木柱中随机地取出100根, 问其中至少有30根短于3米的概率是多少? 例3:某车间有200台车床,独立工作,开工率为 0.6,开工时耗电各为1000瓦,问供电部门至少 要供给这个车间多少电力才能使99.9%的概率保 证这个车间不会因为供电不足而影响生产。 例 4 : 一 加 法 器 , 同 时 收 到 2 0 个 噪 声 电 压 设他们是相互独立的,且在区间(0,10)上服 从均匀分布的随机变量,记 ,求 , 1,2,...,20 U k k = 20 1 k k U U = = P U( 105)
§1基本概念 1.1总体与样本 总体:研究对象的全体,记为X或ξ,是指一个随机变量。 个体:组成总体的每个单元。 样本:就是n个相互独立且与总体有相同概率分布的随机变量5 i=1,2,…,n,所组成的n维随机变量(5,2…,5n 样本值:每一次具体的抽样所得的教据就是n个随机变量的值 (样本值)用小写字母(x1,x2x康表示。 注:样本具有双重性,即它本身是随机变量,但一经抽取便是 组确定的具体值 定义:若随机变量5152…5相互独立且每个5,i=1,2, 与总体有相同的概率分布,则称随机变量5,52…5n为来自 总体5的容量为n的简单随机样本,称ξ,i=1,2,…,n为样 本的第个分量。若5有分布密度f(或分布函数F())则 称(5,52,5)是来自总体F((或f()的样本
§1基本概念 1.1总体与样本 总体:研究对象的全体,记为X或 ,是指一个随机变量。 个体:组成总体的每个单元。 样本:就是n个相互独立且与总体有相同概率分布的随机变量 , i=1,2,…,n,所组成的n维随机变量 样本值:每一次具体的抽样所得的数据就是n个随机变量的值 (样本值)用小写字母 表示。 注:样本具有双重性,即它本身是随机变量,但一经抽取便是一 组确定的具体值。 定义:若随机变量 相互独立且每个 ,i=1,2,…,n, 与总体 有相同的概率分布,则称随机变量 为来自 总体 的容量为n的简单随机样本,称 ,i=1,2,…,n为样 本的第i个分量。若 有分布密度 (或分布函数 )则 称 是来自总体 (或 )的样本. i ( 1 2 , ,..., n ) ( x x x 1 2 , ,.., n ) i i ( 1 2 ) F x( ) f x( ) , ,..., n f x( ) F x( ) n , , , 1 2 n , , , 1 2
2统计量 定义:设5,2…,n为总体的一个样本,T(x,x,x)为一个 实值函数,如果T中不包含任何未知参数,则称 7(54为一个统计量。统计量的分布称为抽样分布 例如:总体~N(a2)a已知,a2未知,5152,为5的一个 样本,则∑(1-a)2是统计量,但1之不是统计量。 13顺序统计量及经验分布 1.3.1顺序统计量 设5为总体与2)的一个样本,将其诸分量,=1 2,…,n,按由小到大的次序重新排列为(5,5py,5 即5≤52…≤5,称5k=2,…,m为总体的第k个顺序统 计量(次序统计量),特别5称为最小项统计量,n为 最大项统计量
1.2统计量 定义:设 为总体 的一个样本, 为一个 实值函数,如果T中 不包含任何未知参数,则称 为一个统计量。统计量的分布称为抽样分布。 例如:总体 ,a已知, 未知, 为 的一个 样本,则 是统计量,但 不是统计量。 1.3顺序统计量及经验分布 1.3.1顺序统计量 设 为总体, 的一个样本,将其诸分量 ,i=1, 2,…,n,按由小到大的次序重新排列为 , 即 ,称 为总体的第k个顺序统 计量(次序统计量),特别 称为最小项统计量, 为 最大项统计量。 1 2 , ,..., n T x x x ( 1 2 , ,.., n ) 1 2 ( , ,..., ) T n ( ) 2 ~ , N a 2 1 2 , ,..., n ( ) 2 1 n i i a = − 1 1 n i i = i (1) (2) ( ) ( , ,..., ) n ( ) , 1,2,..., k k n = (1) ( ) n ( 1 2 , ,..., n ) (1) (2) ( ) ... n
例1.5:设有一个总体,它以等概率取0,1,2三个 值,现从此总体中取容量为2的一个样本x,x), 列出样本(X,x2)所有可能取值情况和相应的次序 统计量(xa2X(2)的情况
例1.5:设有一个总体,它以等概率取0,1,2三个 值,现从此总体中取容量为2的一个样本 , 列出样本 所有可能取值情况和相应的次序 统计量 的情况。 ( X X1 2 , ) ( X X1 2 , ) ( , ) X(1) X(2)
1.32经验分布 由给定的样本(52,…5)定义一个函数, 无法显示该图片 0 k)≤x<5 (k+1) (k=1,2,,n-1) x≥ 此函数的性质 (1)当样本固定时,作为x的函数是一个阶梯形的分布函数,n(x恰为 样本分量不大于x的频率。 (2)当x固定时,它是一个统计量,其分布由总体的分布所确定。 即nF(5,52,,5n)~b(nF2(x)二项分布) 称F(x)为总体对应于样本(5,5,5n)的经验分布函数
1.3.2经验分布 由给定的样本 定义一个函数, 此函数的性质: (1)当样本固定时,作为x的函数是一个阶梯形的分布函数, 恰为 样本分量不大于x的频率。 (2)当x固定时,它是一个统计量,其分布由总体的分布所确定。 • 即 (二项分布) 称 为总体对应于样本 的经验分布函数。 = − = + ( ) ( ) ( 1), (1) 1, , ( 1,2,..., 1) 0, ( ) n n k k x x k n n k x F x 1 2 ( , ,..., ) n ( ) ( ( )) * 1 2 , ,..., ~ , n n nF b n F x 1 2 ( , ,..., ) n F (x) n F (x) n
14常用的一些统计量 14.1样本的分位数 设~F(x)为总体,25)为样本,(50,52,…5n)为顺序 统计量,定义 (x)=(-((n+1)[)5(1+(2(n+1)[ (an+1) <n n+1 称5(为样本的分位数。当=12时,称5(1/2为样本的 中位数。(也用m2表示) 例1.6:若(1252,1)=(1.5,2.0,4.0,0,8,3.5,9 则( (1)29(2)2…5(7) 42样本的极差 Dn 称为样本的极差
1.4常用的一些统计量 1.4.1样本的分位数 设 ~ 为总体, 为样本, 为顺序 统计量,定义 称 为样本的 分位数。当 =1/2时,称 为样本的 中位数。(也用 表示) 例1.6:若 (1.5,2.0,4.0,0,8,3.5,9), 则 ? 1.4.2.样本的极差 称为样本的极差 F x ( ) 1 2 ( , ,..., ) n (1) (2) ( ) ( , ,..., ) n ( ) ( ( ( ) )) ( ) ( ( ) ) ( ) * 1 1 1 1 1 , 1 n n n n n n n n n + = − + − + + − + ( ) * ( ) * 1/ 2 me ( 1 , 2 ,..., 7 ) = ( (1) , (2) ,..., (7) ) = Dn (n) (1) = −