§4.2随机变量序列的两种收敛性 在上一节中,我们从频率的稳定性出发,引入了 (n→0) 即随机变量序列初}依概率收敛于常数a这么一个概念。我们自然可以把所讨论的问题推广 到a不是一个常数,而是一个随机变量这样的情形,于是需要引入下面的定义。 定义4.2设有一列随机变量,2,,…,刀n,如果对任意的£>0,都有 lim P(-n0 F(x)-2,x50
§4.2 随机变量序列的两种收敛性 在上一节中,我们从频率的稳定性出发,引入了 n = = n i i n 1 1 ⎯⎯p→ a (n → ) 即随机变量序列 n 依概率收敛于常数 a 这么一个概念。我们自然可以把所讨论的问题推广 到 a 不是一个常数,而是一个随机变量这样的情形,于是需要引入下面的定义。 定义 4.2 设有一列随机变量 1,2 ,3,…, n ,如果对任意的 >0,都有 lim n→ P ( − ) n (4.6) 则称随机变量序列 n 依概率收敛于 ,并记作 lim n→ r ⎯⎯p→ 或 n ⎯⎯p→ (n → ) 由此可知,前一节中讨论过的大数定律只是上述依概率收敛的一种特殊情况。我们已经知道 分布函数全面地描述了随机变量的统计规律,如果已知 n ⎯⎯p→ (n → ),那么它们相 应的分布函数 n F (x)与 F(x)之间的关系会有什么样的关系呢?一个猜测是,对所有的 x, 都有 n F (x) → F(x)(n → )成立,这个猜测对不对呢?让我们看一个很简单的例子。 例 4.2 设 , n 都是服从退化分布的随机变量,且 P( =0)=1, P( n =- n 1 )=1,n=1,2,… 于是对任给的 >0,当 n> 1 时有 P( n − ≥ )=P( n ≥ )=0 所以 n ⎯⎯p→ (n → ) 成立。又设 , n 的分布函数分别为 F(x), n F (x),则 F(x)= 2, 0 1, 0 x x
F(x)= n 显然,当x≠0时, lim F.(x)=F (x) 成立,当x0时, lim F.(0)=lim 1=10=F (0) 这个简单的例子表明,一个随机变量序列依概率收敛于某一个随机变量,相应的分布函数列 不一定是在每一点上都收敛于这个随机变量的分布函数的。但是,如果仔细观察一下这个例 子,就会发现收敛关系不成立的点:x0,恰好是F(x)的不连续点。如果我们撒开这些不 连续点而只考虑F(x)的连续点。那么在上述例子中,当门mP→门(n→0)时,它们 的分布函数之间就有 lim F.(x)=F (x) (x是F(x)的连续点)成立。现在为把讨论引向一般的情形,有必要引入下述定义。 定义4.3设F(x),E(x),E(x),,F(x)是一列分布函数,如果对F(x) 的每个连续点都x,有 lim F.(x)=F (x) 成立,则称分布函数列{F(x)}弱收敛于分布函数F(x),并记作 F (x)F() 4.7) 这里称呼“弱收敛”是自然的,因为它比在每一点上都收敛的要求在确是“弱”了些。 如果随机变量序列1(刀=1,2,3,…)的分布函数5(x)弱收敛于随机变量刀的分 布函数F(x),也称门按分布收敛于门,并记作 n。1→g(n→o) 在例42中我们已经看到从刀,”)q(→D)并不能推出相应的分布函数列(x)在 每一点上收敛于F(x,而只是有(x)”F(x)成立,现在自然要同,这个结果 在一般情形下是否成立?也就是说,是香在任何情形下,都能从。P→推出相应的分 布函数列(x)”F(x)?回答是肯定的,这就是下面的定理。 定理4.4若随机变量序列,2,%,,刀。依概率收敛于随机变量刀,即
F(x)= − − n x n x 1 2, 1 1, 显然,当 x 0 时, lim n→ n F (x)= F(x) 成立,当 x=0 时, lim n→ n F (0)= lim n→ 1=1 0= F(0) 这个简单的例子表明,一个随机变量序列依概率收敛于某一个随机变量,相应的分布函数列 不一定是在每一点上都收敛于这个随机变量的分布函数的。但是,如果仔细观察一下这个例 子,就会发现收敛关系不成立的点:x=0,恰好是 F(x)的不连续点。如果我们撇开这些不 连续点而只考虑 F(x)的连续点。那么在上述例子中,当 n ⎯⎯p→ (n → )时,它们 的分布函数之间就有 lim n→ n F (x)= F(x) (x 是 F(x)的连续点)成立。现在为把讨论引向一般的情形,有必要引入下述定义。 定义 4.3 设 F(x), F1 (x), 2 F (x),…, n F (x)是一列分布函数,如果对 F(x) 的每个连续点都 x,有 lim n→ n F (x)= F(x) 成立,则称分布函数列 Fn (x) 弱收敛于分布函数 F(x),并记作 n F (x) ⎯⎯→w F(x) (4.7) 这里称呼“弱收敛”是自然的,因为它比在每一点上都收敛的要求在确是“弱”了些。 如果随机变量序列 n ( =1,2,3,…)的分布函数 n F (x)弱收敛于随机变量 的分 布函数 F(x),也称 n 按分布收敛于 ,并记作 n ⎯⎯→L q (n → ) 在例 4.2 中我们已经看到从 n ⎯⎯→p q (n → )并不能推出相应的分布函数列 n F (x)在 每一点上收敛于 F(x),而只是有 n F (x) ⎯⎯→w F(x)成立,现在自然要问,这个结果 在一般情形下是否成立?也就是说,是否在任何情形下,都能从 n ⎯⎯p→ 推出相应的分 布函数列 n F (x) ⎯⎯→w F(x)?回答是肯定的,这就是下面的定理。 定理 4.4 若随机变量序列 1,2 ,3,…, n 依概率收敛于随机变量 ,即
n,D→gn→o) 则相应的分布函数列F(x),月(x),,F(x)弱收敛于分布函数F(x),即 到这里,许多读者一定会问,这个定理的逆命题是否成立? 即是否能从分布函数列的弱收敛厂(x)”→℉(x)推出相应的随机变量序列依概率收 敛:刀,D→刀?造憾的是,一般说来这个的结论是不成立的,这只要研究-下下面的例 子就可以明白了。 例4.3抛掷一枚均匀的硬币,有两个可能结果:0,=出现正面和,=出现反而,于 是有 P(o)-P(0.)- 7(o)1@=g -10=0, 则刀(0)是一个随机变量,基分布函数为 1x>1 5x)= 5,-1<x≤】 0,xs-1 这时,若5(O)一刀(0),则显然5(0)与1(0)有相同的分布函数F(x)。再令 n。=门,,的分布函数记作F(x),故5(x)=F(x),于是对任意的x∈R,有 lim F.(x)-lim F (x)=F(x) 所以F(x)"→F(x)成立,而对任意的0<£<2,恒有 P(7n-川≥8)=p(2m≥£)=1≠0 即不可能有。P5成立。 在上述例子中,随机变量门与5在每次试验中取相反的两个数值,可是它们却有完全相 同的分布函数。由此可知,一般说米并不能从分布函数列的弱收敛肯定相应的随机变量序列 依概率收敛。但是在特殊情况,它却是成立的,那就是下面的定理
n ⎯⎯→p q (n → ) 则相应的分布函数列 F1 (x), 2 F (x),…, n F (x)弱收敛于分布函数 F(x),即 n F (x) ⎯⎯→w F(x) (n → ) 到这里,许多读者一定会问,这个定理的逆命题是否成立? 即是否能从分布函数列的弱收敛 n F (x) ⎯⎯→w F(x)推出相应的随机变量序列依概率收 敛: n ⎯⎯→p ?遗憾的是,一般说来这个的结论是不成立的,这只要研究一下下面的例 子就可以明白了。 例4.3 抛掷一枚均匀的硬币,有两个可能结果: 1 =出现正面和 2 =出现反而,于 是有 P( 1 )=P( 2 )= 2 1 令 ( )= − = = 2 1 1, 1, 则 ( )是一个随机变量,基分布函数为 n F (x)= − − 0, 1 , 1 1 2 1 1, 1 x x x 这时,若 ( )=- ( ),则显然 ( )与 ( )有相同的分布函数 F(x)。再令 n = , n 的分布函数记作 n F (x),故 n F (x)=F(x),于是对任意的 x∈R,有 lim n→ n F (x)= lim n→ F(x)= F(x) 所以 n F (x) ⎯⎯→w F(x)成立,而对任意的 0< <2,恒有 P( n − ≥ )=P(2 ≥ )=1 0 即不可能有 n ⎯⎯→p 成立。 在上述例子中,随机变量 与 在每次试验中取相反的两个数值,可是它们却有完全相 同的分布函数。由此可知,一般说来并不能从分布函数列的弱收敛肯定相应的随机变量序列 依概率收敛。但是在特殊情况,它却是成立的,那就是下面的定理
定理4.5随机变量序列n,P→门=c(c为常数)的充要条件是 E(x)"→F(x) 这是F(x)是刀=C的分布函数,也就是退化分布: Fx)0.xse 我们知道大数定律所讨论的是随机变量序列依概率收敛于常数的问题,而定理4.5则把 这个问题转化为讨论分布函数列弱收敛于退化分布的问题。这样一转化,两个问题之间的关 系就看得更清楚了。 由上述讨论可知分布函数列的弱收敛是一个很有用的 概念,但要直接判曲 一个分布函 的序列是否弱收敛,有时是很麻烦的,而判断相应的特征函数序列的收敛性却往往比较容易, 在这种情形下,我们要用到下述的特征函数的连续性定理。 定理4.6分布函数列{F(x)}弱收敛于分布函数F(x)的充要条件是相应的特征函 数列{o.)}收敛于F(x)的特征函数()。 在结束本节之前,我们顺便提一下斯鲁茨基定理: 设5,点,占,…,占是k个随机变量序列,并且 又R(x1,X2,…,Xk)是k元变量的有理函数,并且R(a1a2,,a)≠士,则有 R(5,5,5)R(a12,an→成立
定理 4.5 随机变量序列 n ⎯⎯→p =c(c 为常数)的充要条件是 n F (x) ⎯⎯→w F(x) 这是 F(x)是 c 的分布函数,也就是退化分布: F(x)= x c x c 0, 1, 我们知道大数定律所讨论的是随机变量序列依概率收敛于常数的问题,而定理 4.5 则把 这个问题转化为讨论分布函数列弱收敛于退化分布的问题。这样一转化,两个问题之间的关 系就看得更清楚了。 由上述讨论可知分布函数列的弱收敛是一个很有用的概念。但要直接判断一个分布函数 的序列是否弱收敛,有时是很麻烦的,而判断相应的特征函数序列的收敛性却往往比较容易, 在这种情形下,我们要用到下述的特征函数的连续性定理。 定理 4.6 分布函数列 Fn (x) 弱收敛于分布函数 F(x)的充要条件是相应的特征函 数列 n (t) 收敛于 F(x)的特征函数 (t)。 在结束本节之前,我们顺便提一下斯鲁茨基定理: 设 1n , 2n , 3n ,…, kn 是 k 个随机变量序列,并且 in ⎯⎯→p a i , (n → ,i=1,2, …,k) 又 R(x 1 , x 2 ,…, x k )是 k 元变量的有理函数,并且 R(a 1 ,a 2 ,…,a k ) ,则有 R( 1n , 2n,…, kn ) ⎯⎯→p R(a 1 ,a 2 ,…,a k ),n → 成立