正在加载图片...
·402 智能系统学报 第4卷 待识别样本可能性最大的识别结果. 在P部的特征进行识别时的识别器评价指标, 辩论是一个说理的过程,每个参与辩论的A 规则5如果P1是相对于Agent1的C1、C2间 gent,从自己的立场出发,重新审视所讨论的问题, 的最大差异部分,P2是相对于Agent2的C1、C2间的 提出自己的理由和根据.通过协商,或者坚持自己的 最大差异部分,P1≠P2,且当用P1替换P2时Aget2 原有观点,努力去说服其他的Agent同意自己的意 支持Agent1的结论;则有理由相信Agentl的结论是 见;或者被其他的Agent说服,改变自己的立场,支 正确的. 持说服者的意见.下面给出一些辩论规则. 该规则反映了Agent在辩论中的退让, 规则1如果C1是特定结构汉字,而C,是非特定 规则6如果已经确认0为专有名词的一员, 结构汉字,当当前待识别的汉字0与C1具有相同的特 且选择C1后,专有名词词典中含有该名词;则有理 定结构时;则有理由相信O为C1,而非C2 由相信0为C· 其中特定结构汉字指的是具有左右结构,或者上 专有名词指人名、地名、公司名等,在一个句子 下结构,或者内外结构的汉字 中,具有明确上下文特征的专有名词可以通过判别 C1、C2的结构信息存放于Agent的知识库中, 法则判定 而O的结构信息在切分时获得,或者通过求解笔画 规则7如果已经确认0为专有名词的一员, 的连通域获得. 且选择C1或C2后,在专有名词词典中均不含有该 注意该规则只规定了当O与C,具有相同的特 名词;则识别类Agent的结果更为可靠. 定结构时才确信O为C1,而0为非特定结构时,并 规则8如果识别Agent对C,和C2的可信度 不能确信0为C2·这是因为在手写体汉字中,习惯 之差小于给定值,而且C,的组句能力与C2的组句 性的连笔往往会破坏汉字的结构特征, 能力之差大于给定值;则有理由相信O为C 规则2如果C1与C2的复杂度差大于给定值, 其中C的组句能力定义为:当0固定为C时,经 且0与C,的复杂度差小于给定值;则有理由相信O 后处理后O所在句子的概率.这也是一条退让规则, 为C 反映了当识别Agent没有较大的把握区分出C,和 其中汉字的复杂度可以用规格化后汉字点阵的 C2时,把决定权交由后处理Agent.. 黑白点之比来度量,也可以用汉字的纵向层次数或 3模糊综合评判 横向层次数度量. 规则3如果0为汉语句子中的一员,且C1、C2 设x为待识汉字,C={c1,c2,…,cn}为其候选 为一对客观相似字,则识别类Agent对此不参与辩 集,A={a1,a2,…,an}为Agent集,每一个a从自 论 己的立场出发,对候选c:是否为x的识别结果有一 将相似字定义为客观相似字和主观相似字] 个评价,经适当的转换后,该评价可以看作是从A 客观相似字指的是那些拓扑结构相似的汉字,而主 到F(C)的模糊映射,即 观相似字指的是那些拓扑结构并不太相似,但是特 子:A+F(C), 征比较相似的汉字,这是由于特征抽取的不连续性 a→f(a)(ta,r2,…,m)∈F(C). 造成的。 式中:F(C)表示定义域为C的模糊集合的全体 客观相似字虽然它们的拓扑结构非常相似,但 由于各Agent所采用的知识不同,其对c:评判 字意一般有很大的差别,如“士”和“土”、“末”和 的精确程度和重要程度也不同,因此对不同的A “未”等.与其通过识别Agent找出它们在字形上的 gent给出的评判,要分别对待,有一定的权重分配. 差别,不如通过后处理等手段进行选择更为可靠. 权重分配可以看作是A上的模糊集,记为 规则4如果P是使C1、C2产生最大差异的部 W=(01,02,…,0m)∈F(A). 分,且在相同的部分0与C1的差异小于0与C2的差 式中:切,表示第j个Agent的权重,它们满足归一化 异;则有理由相信0为C· 条件: 其中,P为汉字的左半部、右半部、上半部、下半 部、中心部或外围部之一,差异指的是当只使用包含
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有