正在加载图片...
其中A表示方阵A的行列式的值,比较常用的判据是J 基于几何距离的可分性判据计算起来比较简单,只要我们已知各个类别的训练样本集, 就可以计算出三个散度矩阵,同时也就可以计算出各种可分性判据。 基于概率分布的可分性判据 基于几何距离的可分性判据计算起来比较简单,然而它没有考虑各类别的概率分布,因 此与识别错误率之间的联系却不是很紧密。下面介绍一种直接基于概率分布的可分性判据 先以最简单的一维特征、两类问题为例,下图表示了两种极端情况: P(X Q)=p(x Q2,) 第一种情况是两类完全可分:对所有p(X92)≠0的点,有p(X2)=0 第二种情况是两类完全不可分:对所有的X有p(X92)=p(X2) 下面我们可以定义两个类条件概率密度函数之间的距离Jp作为交叠程度的度量,Jp应 该满足如下条件 1.非负性,J2≥0; 2.当两类完全重叠时J取最大值,即若对所有X有p(Xg2)≠0时, P(X92)=0,则Jp=max 3.当两类密度函数完全相同时,J应为零,即若P(X92)=P(Xg21),则J=0 按照这样的要求,可以定义出多种可分性判据,这里我们只介绍其中一种一散度 现在考虑9,和92,两类之间的可分性,取其对数似然比: l(X)=In P(X/2 则Ω1类对Ω,类的平均可分性信息可以定义为:47 其中 Α 表示方阵 Α 的行列式的值,比较常用的判据是 1 J 。 基于几何距离的可分性判据计算起来比较简单,只要我们已知各个类别的训练样本集, 就可以计算出三个散度矩阵,同时也就可以计算出各种可分性判据。 二、基于概率分布的可分性判据 基于几何距离的可分性判据计算起来比较简单,然而它没有考虑各类别的概率分布,因 此与识别错误率之间的联系却不是很紧密。下面介绍一种直接基于概率分布的可分性判据。 先以最简单的一维特征、两类问题为例,下图表示了两种极端情况: 第一种情况是两类完全可分:对所有 p (X   1 ) 0 的点,有 p(X  = 2 ) 0 ; 第二种情况是两类完全不可分:对所有的 X 有 p p (X X  =  1 2 ) ( ) 。 下面我们可以定义两个类条件概率密度函数之间的距离 P J 作为交叠程度的度量, P J 应 该满足如下条件: 1. 非负性, 0 P J  ; 2. 当 两 类 完 全 重 叠 时 P J 取 最 大 值 , 即 若 对 所 有 X 有 p(X   2 ) 0 时 , p (X  = 1 ) 0 ,则 max P J = ; 3. 当两类密度函数完全相同时, P J 应为零,即若 p p (X X  =  2 1 ) ( ) ,则 0 P J = 。 按照这样的要求,可以定义出多种可分性判据,这里我们只介绍其中一种—散度。 现在考虑 i 和  j 两类之间的可分性,取其对数似然比: ( ) ( ) ( ) ln i ij j p l p  =  X X X 则 i 类对  j 类的平均可分性信息可以定义为:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有