第一章预备数学知识 多元质量控制涉及到多元数据的整理和统计推断等复杂内 容。因此,掌握相应的多元统计概念和方法是讨论多元质量控制问 题的必要前提。 众所周知,一元统计质量控制是建立在一元正态分布基础上 的;因为在现实世界中产品和服务质量特性的统计量(随机变量) 大都服从或近似服从一元正态分布,或者它们的某种形式的极限 分布是…元正态分布同样,多元统计质量控制是以多元正态分布 理论为基础的;因为在现实世界中产品和服务的多重质量特性的 统计量(随机向量)都服从或近似服从多元正态分布,其某种形式 的极限分布也是多元正态分布因此,本章先用较大篇幅来讨论多 元正态变量的一些特征及多元正态样本函数的一些性质;同时针 对后面章节的需要,还讨论在多元质量控制中常用的一些统计概 念和方法。 “L欲善其事,必先利其器。”建议对多元分析不够熟悉的读 者,务必先阅读本章介绍的预备数学知识,为顺利研究以后各章打 好基础。 下面依次介绍:随机向量及其矩;多元正态分布;多元样本矩; 多元总体的均值与协差阵估计;多元统计中常用的统计量及其分 布;多元正态性检验; Bonferroni不等式;剔除异常多元数据的 般方法。 第一节随机向量及其矩 在多元统计中我们研究的总体有p个指标,分别用随机变量 ,x2…,x。表示,写成向量形式,令X=(x1,…x)(其中“”表示
转置)则x即为p维随机向量。我们先介绍一般分布的随机向 量矩的定义及性质于研究多元正态分布要用矩阵因此也要介 绍本书后面用到的一些矩阵的知识 随机向量的矩及其性质 设X=(x1,x2,…x2)是p维随机向量设它的每个分量的均 值(数学期望)存在,即E(x;)=共,=1,2,…“p,定义随机向量X 的均值向量为 A1 E(x2) E(X)= (1.1) E(x1) 记E(X)=,P=(均,…p)’,称“为X的均值向量,它也是p维 如果随机向量X的每个分量的方差存在,D(x;)=G2=an,i 1,…p,这时任意二分量的协方差也存在,记COV(x,x)=0,i, 1,2,…,p,则定义随机向量X的协方差矩阵为 D(X)=E{〔X-E(X)〕〔X-E(X)]} D(x1) COV(I1,x2)".COV(I1,xp COV( D(x2) COV( OV( CoV c 12 (1.2) 记D(X)=Σ,它是p×p阶矩阵,简称协差阵。由定义知它是对称 注:在本书中,向量和矩阵一律用黑体;随机变量用大写体或小写体,其取值律 用小写体
矩阵,E=2,而且它是非负定矩阵 设 COV(T:,x D(x;)√D(x;) r,称为随机变量x;,x,的相关系数,且r,≤1。设 了1P R R称为向量X的相关系数矩阵,简称相关矩阵。由定义知R为对 称矩阵R=R,且非负定。 相关矩阵与协差矩阵有如下关系 R 或 R 下面介绍随机向量矩的一些运算性质。 我们知道随机变量的均值、方差有如下性质,设a为一常 数,则有 E(a)=aE(8) dCaF)=a D=aD()a 类似的性质对随机向量X的均值、协差阵也成立。 设A为m×p阶矩阵,则有 E(AX=AE(X) (1.6) 3
D(AX)=A(X)A' (1.7) (1.6)式很易验证,现证(1.7)式。设E(X)u,按定义 D(AX)= EC(AX- E(AX ))(AX- E(AX))) =E〔(AX-A)(AX-A口) =E〔A(X-u)(X-u)A〕 AEC(X-A(X- u)'A'=AD(X)A 二有关矩阵的一些知识 1.正定矩阵 任何随机向量,如果它的协方差矩阵存在,一定是对称的非负 定矩阵。因此学习多元统计需掌握正定矩阵的一些知识。 设A为一个p×p阶矩阵,如果对任何向量x=( x2)’,二次型 X'AX≥0 称A为非负定矩阵,如果只有当X=(0,…,0)时,上式等号才成 立,称A为正定矩阵。非负定矩阵记为A≥0,正定矩阵记作A>0。 我们限于介绍正定矩阵。 正定矩阵有下述性质 (1)A>0,存在正交矩阵厂(厂=F1)使 λ1 厂AT= 其中入>0,=1,…,,入是A的特征值 (2)A>0,存在可逆矩阵B,使 A=BB (1.9) 证明:由(1.8)式,令
则 A=(厂)-DD厂 =fDD厂 令B=「D,则 A=BB (3A>0,存在可逆矩阵C,且C>0,使 A=c (1.10) 证明,A=BB=DD=厂DFD1 令C=TD厂1,则 A=CC即A=C2 这时定义A2=C, (4)A>0,存在下三角矩阵B,使 A=BB (1.11) 证明:A=(a,)为正定矩阵,对任何X=(x1,…,x2) X′AX 可用配方法,把上式代为 十b2xp)2+( 十…+b2px2 )(b)(b;,)′ 11 其中B=(b;) b, 即为下三角矩阵
分块矩阵代数运算 设A=(a)为nXm阶矩阵,将A分块为 r Az n-S 这里A1=(a1)为r×s阶矩阵,=1,…,;=1,…,s A12=(a)为r×(m-s)阶矩阵,i=1,…,r;=5+1,…,m A21=(a)为(n-r)×s阶矩阵=r+1,…,n=1,…, A2=(a)为(n-r)×(m-s)阶矩阵,=r+1,…,n4j=5+1, (1)分块矩阵运算 设A、B都是nXm阶矩阵,作了同样大小的分块 A 1 A L2 B B 12 B A Barn 则有 A1+B1A12+B1 ①A+B (1.12) A21+B21A2+B22 cA ②cA= 其中c为常数 (1.13) cA21 cA22 A A A (1.14) A (2)分块矩阵的逆 设A为n×m阶矩阵,B为mⅩl阶矩阵,对AB相应地分块, 使得分块后相应块的乘积有意义,即: A B A A 22n-r 22 则有 A1B1+A12B2A1B12+A12B22 AB (1.15) A21B1+A2B21A21B12+A22Bt
上述分块矩阵运算规则告诉我们:分块矩阵运算中只要分块分的 恰当,每个块可以当作“元素”,象矩阵不分块时一样进行运算就可 以了,又因为子块是矩阵,做乘法运算时,子块的顺序不能颠倒。 我们利用分块矩阵乘法的性质,可以推出分块矩阵的逆、分块 行列式及一些很有用的公式 ①设A为n×n矩阵 AA A ,而且|A1≠0 A 2 A 22 0 A12[I-A12A 则有 A21A1 IIA, 1 A 21 22 0 A1 (1.16) 0A22-A21A1A12 其中I为相应阶单位矩阵。 ②设同①,若A的逆存在,A1|≠0,则有 Au A A10 AA 00 A1h12(A2-AA1A12)(A2A1,- 或|A2≠0 0A22 (A1-A12A242)1(-I,A12A22) Ao A (1.18) (1.17)(1.18)式可利用(1.16)式两边求逆直接验证 ③设D为nXn阶矩阵可逆,a=(a An)’,则有 (D+ap)I=Di-DaPD/(1+A D'a)(1.19) 特别有
(D+B)=D1-DβD1/(1+BDB)(1.20) 证明:设A为(n+1)×(n+1)阶矩阵 d D B,-1 由(1.17)及(1.18)式A-1为 D a D-10 D (-1-BD-a)l(PD",-1) 00 00 (D+aB)-1( 取上二式左上角上的子块,令其相等得 D+DaPD"/(-1-Bda)=(D+aB)1 (D+aB)-=D-DaB D /(1+8D"a 上式中令a=B,则得 (D+BB)I=D-D D/(1+BD B) ④利用分块矩阵求逆公式可以求得行列式的一些有用公 式 A LI A 2 A1|A2-A2:AA2|(A1|≠0) A A (1.21) A, A A1-A12A2A2n1(A2≠0) A21A2 (1.22) 设∑为nXn方阵,可逆,B=(R1,…,月n) |=2|0+PxB=12|P∑B 8
0 B 即得 B∑B: 12I (1.23) 如果 =|2(1+B21B)=|2+B 即得 β2B Σ+ 3.矩阵的迹 设A=(a1)为n×n阶方阵,A的对角线元素之和称为矩阵A 的迹,记作tr(A),即 (A) (1.25 矩阵的迹有下列性质 (1)tr(a+B)=tr(A)+tr(B) (1.26) (2)t(cA)=cr(A)(c为常数) (1.27) (3)AB、BA都是方阵,则 tr(AB)=tr(BA) (1.28) 特别a=( b=(h1,b2,…,bn)’则有 a b;=a'b=tr(ab)=tr(ba) 第二节多元正态分布 多元正态分布定义 设X=(x1,x2,…,x)为随机向量,M=(,12…,P)为常 向量,E为正定矩阵,如果随机向量X的概率密度函数为 ∑」-2 p (r-p)'2(X-H (2x)2 9
∞<x<+ct=1,2 我们称X服从多元正态分布,记为X~Nμ,2),不强调维数可记 为X~N(u,2),X称为p维正态变量 现求X的均值与协方差矩阵 设X~N2(,2,则E(X)=H,D(X)=2 证明:X~N2(,E),X的概率密度函数为 p (X-p)2(x- (2 因∑为正定矩阵,存在可逆矩阵A,使E=AA,这时∑1=(A) A-1,|2=1A12,|Σ1t=|A|-.令 A(X-p=Y,或X=AY十 该变换的雅可比式为 a( a( A,1|=|A|=|2 在此变换下,得Y的概率密度函数为 g(yt,“yp (27∞1-2(x-E(x-pD}1 exp YY}|2 2 (2x)分p/ 即Y=(y1,…,yy~N2(0,D),因y;…,y独立同分布N(0,1), 所以有 E(Y)=0,D(Y)=I。 而因X=AY+J,从而 E(X)=E(AY+u)=AEY+A=u D(X)=E[(X-4)(X-p)]=E[(AY)(AY) FADCAEAA=2 定理证毕