湘潭大学：《数理统计》课程教学资源（PPT课件讲稿）第八章（8.2）判别分析

在许多自然科学和社会科学的研究中,经常会遇到需要判别的问题。例如一个病人肺部有阴影,大夫要判断他是肺结核、肺部良性肿瘤还是肺癌。这里,肺结核人、肺部良性肿瘤病人以及肺癌病人组成三个总体,病人来源于三个总体之一,判断分析的目的是通过人的指标(阴影大小、阴影部位、边缘是否光滑等)来判断他应该属于哪个总体(即判断他生的是什么病)。

团购合买资源类别：文库，文档格式：PPT，文档页数：21，文件大小：433.5KB

§82判别分析在许多自然科学和社会科学的研究中,经常会遇到需要判别的问题。例如一个病人肺部有阴影,大夫要判断他是肺结核、肺部良性肿瘤还是肺癌。这里,肺结核人、肺部良性肿瘤病人以及肺癌病人组成三个总体,病人来源于三个总体之一,判断分析的目的是通过人的指标(阴影大小、阴影部位、边缘是否光滑等)来判断他应该属于哪个总体(即判断他生的是什么病)。湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 1 §8.2 判别分析在许多自然科学和社会科学的研究中，经常会遇到需要判别的问题。例如一个病人肺部有阴影，大夫要判断他是肺结核、肺部良性肿瘤还是肺癌。这里，肺结核人、肺部良性肿瘤病人以及肺癌病人组成三个总体，病人来源于三个总体之一，判断分析的目的是通过人的指标（阴影大小、阴影部位、边缘是否光滑等）来判断他应该属于哪个总体（即判断他生的是什么病）

又如根据已有的气象资料(气温、气压等)来判断明天是阴天,还是雨还是无雨。在考古学、古生物学和些社会现象的调查中,都有类似的问题,所以判别分析是应用性很强的一种多元分析方法。类别分析的模型可以这样来描述:有R个总体 G1,…,Gn,它们的分布函数分别是F(x),…,F(x), 均为P维分布函数,对给定的一个新样品,需要判断它来自哪个总体解决这个问题可以有多种方法,本段介绍几种常用的判别方法。湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 2 又如根据已有的气象资料（气温、气压等）来判断明天是阴天，还是雨还是无雨。在考古学、古生物学和一些社会现象的调查中，都有类似的问题，所以判别分析是应用性很强的一种多元分析方法。类别分析的模型可以这样来描述：有R 个总体 G GR , , 1  ，它们的分布函数分别是 ( ), , ( ) F1 x  FR x ，均为p维分布函数，对给定的一个新样品，需要判断它来自哪个总体。解决这个问题可以有多种方法，本段介绍几种常用的判别方法

距离判别方法距离判别方法是定义一个样品到某个总体的 “距离”,然后根据样品到各个总体的“距离” 的远近来判断样品的归属。为此先后介绍马氏距离的概念。 1、马氏距离的概念马氏距离是印度统计学家马哈拉诺比斯于 1936年提出的一种距离概念,其定义如下: 湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 3 一、距离判别方法距离判别方法是定义一个样品到某个总体的 “距离” ，然后根据样品到各个总体的“距离” 的远近来判断样品的归属。为此先后介绍马氏距离的概念。 1、马氏距离的概念马氏距离是印度统计学家马哈拉诺比斯于 1936年提出的一种距离概念，其定义如下：

定义8.1设X,是从总体G中抽取的样品,G服从P维正态分布N(,∑),∑>0,定义X,y两点之间的马氏距离为D(X,F),这里 D2(X,Y)=(X-Y)∑(X-Y), 定义X与总体G的均值向量的距离。可以证明,马氏距离符合通常距离的定义即具有非负性、自反性且满足三角不等式。事实上 D(X, Y=D(X,Y)=V(X-Y)2(X-Y) v(x-Y2 2i(X-Y) =y②Σ2(X-Y)C∑2(X-Y)≥0 湘潭大学数学与计算科学学院国国4e

湘潭大学数学与计算科学学院上一页下一页 4 定义 8.1 设X ，Y 是从总体G 中抽取的样品，G 服从 p维正态分布N p (,),  0，定义X ，Y 两点之间的马氏距离为D(X,Y )，这里 ( , ) ( ) ( ) 2 1 D X Y = X − Y  X − Y − ，定义X 与总体G 的均值向量 的距离。可以证明，马氏距离符合通常距离的定义即具有非负性、自反性且满足三角不等式。 ( , ) ( , ) 2 D X Y = D X Y ( ( ))( ( )) 0 2 1 2 1 =  −  −  − − X Y X Y 事实上 ( ) ( ) 1 = X −Y  X −Y − ( ) ( ) 2 1 2 1 = X −Y   X −Y − −

仅当X=Y时,D(X,Y)=0。而自反性:D(X,Y)=D(Y,X)是很明显的。下证满足三角不等式,设X,Y,Z为总体G的样品,为证明 D(X,2sD(X,Y)+D(Y, 2) 令 W=∑2(X-Z)=∑2(X-y+Y-Z) ∑2(X-y)+∑2(Y-Z)defU+V 由 Minkowski不等式得 D(X,Z)=wWW≤√UU+√V=D(X,)+D(Y,Z) 湘潭大学数学与计算科学学院国一5m

湘潭大学数学与计算科学学院上一页下一页 5 仅当X = Y 时，D(X,Y ) = 0。而自反性：D(X,Y ) = D(Y, X)是很明显的。下证满足三角不等式，设X ，Y ，Z 为总体G 的样品，为证明 D(X, Z)  D(X,Y ) + D(Y, Z) ( ) ( ) 2 1 2 1 W =  X − Z =  X −Y + Y − Z − − =  X −Y +  Y − Z U +V − − ( ) ( ) def 2 1 2 1 令由Minkowski不等式得 D X Z W W T ( , ) = U U V V T T  + = D(X,Y ) + D(Y, Z)

当∑为单位矩阵时,马氏距离就化为通常的欧氏距离。有了马氏距离的概念,就可以用“距离”这个尺度来判别样品的归属了。 2、两个总体的判别设有两个总体G和G2,G服从正态分布N(1,∑,), G服从正态分布N(P2,22),∑≠∑2,对于给定的个样品X(P维),要判断它来自哪个总体。个最直观的想法是计算新样品X到两个总体的距离。湘潭大学数学与计算科学院一页一页]6

湘潭大学数学与计算科学学院上一页下一页 6 当为单位矩阵时，马氏距离就化为通常的欧氏距离。有了马氏距离的概念，就可以用“距离”这个尺度来判别样品的归属了。 2、两个总体的判别设有两个总体G1和G2，G1服从正态分布 ( , ) N p 1 1 ， G2服从正态分布 ( , ) N p  2 2 ，1  2，对于给定的一个样品X （p 维），要判断它来自哪个总体。一个最直观的想法是计算新样品X 到两个总体的距离

若X到G和G2的马氏距离分别为D(X,G1)和 D(X,G2),则可用如下规则进行判别 X∈G 当D(X,G1)<D(X,G2) X∈G2, 当D(X,G,)<D(X,G2),(8.6) X∈G或G2当D(X,G1)<D(X,G2) D2(X,G1)=(X-1)∑1(X-1) D2(X,G2)=(X-H2)∑(X-m2) 为了便于实际应用,人们通常考察样品X到G,的距离与到G的距离之差D2(X,G2)-D2(X,G),进一步求出了线性判别函数。湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 7 若X 到G1和G2 的马氏距离分别为 ( , ) D X G1 和 ( , ) D X G2 ，则可用如下规则进行判别            ( , ) ( , ). ( , ) ( , ) ( , ) ( , ) 1 2 1 2 2 1 2 1 1 2 X G G ， D X G D X G X G ， D X G D X G ， X G D X G D X G ，或当当，当（8.6）而 ( , ) ( ) ( )1 1 1 1 1 2 = −   −  − D X G X X ( , ) ( ) ( )2 1 2 2 1 2 = −   −  − D X G X X 为了便于实际应用，人们通常考察样品X 到G2 的距离与到G1的距离之差 ( , ) ( , )1 2 2 2 D X G − D X G ，进一步求出了线性判别函数

若∑,=∑,=∑,这时 D(X,G2)-D(X,G,) X-H2)2(X-12)-(X-1)∑(X-1) X∑X-2X∑2+y2∑p2-X∑X +2X∑1+∑ 2X∑(1-H2)+p2∑2+1∑1 =2X∑(u1-2)+(1+H2)∑(2-1 A, +u ∑( 2 湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 8 若1 = 2 = ，这时 ( , ) ( , )1 2 2 2 D X G − D X G ( ) ( ) ( ) ( )1 1 2 1 1 = −  2  −  − −   −  − − X X X X 1 1 1 1 1 1 2 1 2 2 1 1 2 2       − − − − − − +  +  =  −  +  −  T T T T T T X X X X X X 1 1 2 1 1 1 2 2 1 2 (  )     − − − =  − +  +  T T T X 2 ( ) ( ) ( ) 2 1 1 1 2 1 2 1 =   −  +  +    −  T − T − X ( ) 2 2 1 2 1 2 1       −      + = − − T X

当A1,p2,∑已知时,令 ==(1+P2 ∑(1-2) W(X)=(X-p)∑(1-H2)=(X-p)a D(X,G2)-D(X,G,)=2W(X) 当W(X)>0时, D2(X,G2)>D2(X,G1), 此时应判断X∈G1, 当W(X)<0时应判断X∈G2 湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 9 当1，2，已知时，令 ( ) 2 1  = 1 + 2 ( ) 1 2 1  =   −  −      T T W (X) (X ) ( ) (X ) 1 2 1 = −  − = − − 则 ( , ) ( , ) 2 ( ) 1 2 2 2 D X G − D X G = W X 当W (X)  0时， ( , ) ( , )1 2 2 2 D X G  D X G ，此时应判断X G1，当W (X)  0时应判断X G2

于是判别规则(8.6)可表示为 X∈G 13 W(X)>0, X∈G W(X)<0, X∈G或X∈G2W(X)=0 这个规则取决于W(X)的值,通常称W(X)为判别函数,由于它是X的线性函数,故又称为线性判别函数,a称为判别系数。线性判别函数使用起来很方便,在实际中有着广泛的应用。湘潭大学数学与计算科学学院一页一页

湘潭大学数学与计算科学学院上一页下一页 10 于是判别规则（8.6）可表示为        =     ( ) 0. ( ) 0, ( ) 0, 1 2 2 1 X G X G ， W X X G ， W X X G W X 或，这个规则取决于 W (X)的值，通常称 W (X)为判别函数，由于它是X 的线性函数，故又称为线性判别函数， 称为判别系数。线性判别函数使用起来很方便，在实际中有着广泛的应用

点击下载完整版文档（PPT格式）

共21页，试读已结束，阅读完整版请下载

点击下载（PPT格式）

浏览记录