D0I:10.13374.i8sn1001663x.1998.04.017 第20卷第4期 北京科技大学学报 VoL.20 No.4 1998年8月 Journal of University of Science and Technology Beijing Aug.1998 一种基于D-S证据理论的状态识别方法 * 郑德玲 汤新蓓 北京科技大学信息工程学院,北京100083 摘要通过距离函数求出待识别样本属于各类别的似然函数.对难识别和易识别错误的样本,通 过新证据的引人,合成2批或多批证据下的似然函数,确定样本的类别,从而减少了非典型样本的 误识率,提高了识别的正确率, 关键词证据理论;状态识别:似然函数 分类号TP18 状态识别的方法很多,主要有统计决策法、句法结构法、模糊判决法、逻辑推理法及人工 神经网络法等.本文研究了一种基于D-S理论的状态识别方法.该方法模拟人类进行识别的 过程, 1定义和定理,2) 设U为样本空间,也称为识别框架,其中的元素互相排斥.领域内的命题用U的子集表 示 定义1设U为识别框架,如果集函数m:2→[0,1](2“为U的子集)满足: (1)m(=0:(2)∑m(A0=1 (1) 则称m为框架U上的基本可信度分配.廿A仁U,m(A)称为A的基本可信数, 定义2设U为识别框架,m:2→[0,1]为框架U上的基本可信度分配,称 Bel()=∑mB(HAsU) (2) 为U上的信度函数, 定义3设U为识别框架,似然函数P1:2+[0,1]为: Pl(0=1-Bel(A)=∑mB (3) P()表示了不怀疑A的程度,或者说A可靠或似真的程度,它描述命题的不可驳斥的信任程 度. 定义4如果【个信度函数的焦元是套形的,即它的焦元可以顺序排列,以至于每1个可 以包含在下1个中,则该信度函数称为一致函数, 关于一致支持函数Bel:2→[0,1]有: 1997-10-21收稿郑德玲女,58岁,教授 ·国家自然科学基金资助课题
DOI :10.13374/j .issn1001-053x.1998.04.017
Vol.20 No.4 郑德玲等:一种基于DS证据理论的状态识别方法 ·381· VAsU,A+④,Pl(A)=max Pl({θ}) (4) 证据理论还定义了信度函数的直和运算,给定几个同一识别框架上基于不同证据的信度 函数.如果这几批证据不完全冲突,可计算出1个信度函数,作为在那几批证据下产生的信度 函数.以2批证据为例. 设Bel,和Bl,是同一识别框架U上的2个信度函数,m,和m,分别是其对应的基本可信 度分配,焦元分别为A,A,…,A和B,B,…,B,则: 0 A=Φ ∑m,(A)m.(B) m(A)= AnB-d A卡中 (5) -∑m,(A)m,(B) AnB=重 由n所给定的信度函数的核心等于Bel,和BeL,的核心的交,由m给定的信度函数称为Bel, 和Bel,的直和,记为Bel,⊕Bel,证据理论的直和公式较好地综合了多批证据的作用. 2识别模型山,引 已知状态集合可分为n类,用A(i=1,2,,m)表示,同时又已知各类中的若干代表样本, 求出各类的中心点向量a(=1,2,,n)为: 三, a,=- (6) 式中n为第i类中样本的个数;X表示第i类中第j个样本的特征向量.这个类中心a,是进行 识别的依据,称为识别证据. 设待识别的样本有k个特征,即x=(,x,…,x).用0代表xeA(i=1,2,,m),则可用 U={0,0,·,日}作为识别框架.利用识别证据在框架U上产生一个似然函数P1或信度函数 Bl.为便于建立似然函数,有下列2个定义. 定义5PI({)的值和x与A,中的点的相似程度成正比. 定义6识别证据是一致性证据,由此产生的信度函数是一致支持函数. 这样,由定义5得: P》=-a (C为常数,i=1,2,…,n) (7) 其中,-o=√公g-a,)广表示与类中心向量a的距离.显然,x-越小,x与a相似 程度越高,可用-a 来表示x与a的相似程度. 由定义6及式(4)可知: VAU,Pl(A)maxPl(())=maxT 9EA x-ao minx-a
·382. 北京科技大学学报 1998年第4期 式中a。代表0对应的类中心, C 当A=U时,P(U)= x-ae min x-a e{1,2,,n 所以 C min x-a e{1.2,,} min 从而得: AeU,PI(④=e12-, (周 min x-a 得到似然函数后,可以进行识别.如果P(8,)较其他的P(8,})i=1,2,…,n,i+)大 得较多,则可将x归人A类.即x与哪个类的中心最相似,而与其他类的中心不太相似,就可 将x归入哪个类.这与人们直观的分类法是相符的,即若 P({e,》)-P(8,)>Po(=1,2,…,n且i*) (9) 则xEA式中P,为一阈值,根据实际情况给出. 若没有满足式(9),则认为“无法识别”,说明识别证据还不够,必须寻找新的证据帮助识 别.如果又找到了一批证据,即又指出了A到A中的若干样本,利用以上方法又可得到框架 U上的一个似然函数,并可求出其信度函数,应用证据理论的直和公式合成以上2个信度函 数,然后再进行x的状态识别,若还无法识别,则继续找新证据,直到能够识别出来为止,或者 直接将样本归入P1值最大的一类中. 根据证据理论的有关定义和定理,可以由似然函数或信度函数求出基本可信度分配,以 进行2个信度函数的直和运算.在此不再赘述, 最小距离法是将待识别样本简单地归入与某类中心距离最近的一类中;而证据理论法是 建立在距离函数之上,因此不是简单地归人离某类中心距离最近的一类中,2种方法得出一 致的结论.但是在实际的待识样本中,常会有一些位于2类之间的非典型样本,这些非典型样 本没有特别严格的属性,如果用最小距离法就很可能出现误识别;而用证据理论状态识别方 法,第1次识别结果为“无法识别”,它将提醒用户补充新的识别证据,如果仍无法识别,则继 续提醒用户补充新证据,直到最后能够识别为止,这个最后识别的结果综合了几批证据的作 用,很可能改变了用最小距离法识别的结果,这样就能够有效地降低非典型样本的误识率.这 种新的识别方法很好地模拟了人类进行识别的过程 当然,新证据的选取在某种程度上将对识别结果产生影响.如果新的识别证据与原证据 一样或相差不大,得到的识别结果将会与最小距离法的识别结果一样,也就体现不出证据理 论状态识别方法的优点.因此新的识别证据应当相异于原有证据. 3应用结果 我们将基于证据理论的状态识别方法用于加热炉工况的状态识别中.事先将几批不同 的证据存于系统中,当第】次无法识别时,立即调人第1批新证据;若第2次仍无法识别,就调 入第2批新证据,依次类推.若全部证据已经用完,仍无I满足式(9),则等待新证据,直到能够 识别为止,或者直接将样本归人P值最大的一类中
Vol.20 No.4 郑德玲等:一种基于DS证据理论的状态识别方法 ·383· 在加热炉工况状态识别的实现中,将加热炉工况状态分为正常、炉温高、炉温低、炉压高、 炉压低、炉温高且炉压高、炉温低且炉压低共7类.共选取了3组识别证据,用30组加热炉样 本进行加热炉工况状态识别,其中P。=0.15.识别结果可以看出,用最小距离法识别正确率 仅为63.3%,而用DS证据理论识别的正确率达90%.结果见表1.对个别样本用最小距离法 可正确识别,证据理论法虽到第3次才能正确识别,但总的来说,识别时间长所付出的代价远 远小于识别错误所付出的代价 表1状态识别结果表 样 炉压 1/℃ 最小距离法 D-S证据理论法 正 号 MPa 均热段 加热I段加热Ⅱ段 识别结果 2 3 性 性 1 2.06 1258 1306 1263 正常 Y 正常 Y 2 1.85 1249 1312 1253 炉压低 炉压低 Y 3 2.63 1327 1379 1330 炉温高 N 2 炉温炉压高 Y 2.00 1269 1330 1226 炉压低 N 3 正常 Y 5 2.56 1266 1344 1272 炉压高 Y 炉压高 Y 2.76 1248 1402 1296炉温炉压高 Y 炉压高 2.50 1301 1312 1264 正常 Y 正常 Y 8 2.71 1303 1370 1312 炉温高 N 炉温炉压高 Y 9 2.05 1190 1340 1212 炉温炉压低 N 炉温低 10 2.35 1259 1347 1281 正常 Y 正常 11 2.69 1325 1349 1328 炉温高 N 炉温高 一 N 12 2.81 1301 1344 1283 炉压高 Y 炉压高 Y 13 2.64 1325 1350 1295 炉温高 N 炉温炉压高 Y 14 2.30 1303 1350 1272 炉温高 N 9 正常 Y 15 2.43 1301 1337 1277 正常 Y 正常 Y 16 2.11 1249 1308 1255 正常 Y 正常 Y 17 1.91 1247 1300 1251 炉压低 Y 炉压低 Y 18 1.93 1202 1286 1254 炉温低 N 炉温炉压低 Y 19 1.63 1256 I304 1248 炉压低 Y 炉压低 Y 20 2.60 1266 1309 1258 正常 N 炉压高 Y 21 2.79 1291 1338 1273 炉压高 4 炉压高 Y 22 2.59 1341 1355 1279 炉温高 N 炉温高 N 23 2.26 1279 1353 1252 正常 Y 正常 Y 24 2.95 1323 1361 1302 炉温炉压高Y炉温炉压高 一 Y 25 1.83 1255 1309 1247 炉压低 Y 炉压低 Y 26 2.48 1292 1341 1262 正常 及 正常 32 2.80 1307 1341 1309 炉温高 N ? 炉温炉压高Y 28 3.01 1337 1347 1288炉温炉压高Y炉温炉压高 Y 29 2.96 12881334 1281 炉压高 Y 炉压高 Y 30 2.37 1269 1345 1277 正常 Y ? 正常 注:表中“Y”表示识别正确,“N“表示识别错误,“?”表示无法识别
·384· 北京科技大学学报 1998年第4期 4结论 用证据理论进行状态识别的优点在于:1)有较严谨的计算:2)识别过程符合人的识别过 程;3)对非典型样本的识别正确率较高.它是一种新的较好的识别方法. 参考文献 1郑德玲,汤新蓓.基于DS证据理论的多专家意见综合方法.见:1996年中国控制会议论文集.山东青 岛,1996 2 Shafer G.A Mathematical Theory of Evidence.Princeton:Princeton University Press,1976 3李凡·人工智能中的不确定性.北京:气象出版社,1992 A Method of State Recognition Based on Theory of Evidence Zheng Deling Tang Xinbei Information Engineering School.UST Beijing,Beijing 100083,China ABSTRACT By using the method of state recognition,a plausibility function which describes the resemblance between the sample and each class can be obtained through distance function.For the marginal samples,a new plausibility function based on two or several groups of evidences can be determined according to plausibility function.This method provides a better framework for modeling the human being's reasoning process. The result proves that the rate of recognition correctness is satisfactory. KEY WORDS evidence theory;state recognition;plausibility function