第3卷第6期 智能系统学报 Vol.3 No.6 2008年12月 CAAI Transactions on Intelligent Systems Dec.2008 农业智能系统开发平台的知识表示与推理策略 魏圆圆2,王儒敬12,张英12 (1.中国科学院合肥智能机械研究所,安徽合肥230031:2.中国科学技术大学信息科学技术学院,安微合肥230026)》 摘要:针对农业智能系统的知识特点,提出基于框架知识单元和求解知识单元的知识组织结构,同时采用XML作 为知识描述语言的知识表示方法,在此基础上采用混合推理的推理策略,并实现了不确定推理.该知识表示方法和 推理策略已经在工作中得到实际应用,较以往知识表示方法,在知识获取、知识的直观充分表达、知识扩充、知识模 块化、知识共享等方面都取得了很好的效果, 关键词:知识表示;知识单元;XL;推理 中图分类号:TP182文献标识码:A文章编号:16734785(2008)06052306 A knowledge representation and inference strategy for a development platform of agricultural intelligence system WEI Yuan-yuan'2,WANG Ru-jing'.2,ZHANG Ying'.2 (1.Institute of Intelligent Machines,Chinese Academy of Science,Hefei 230031,China:2.School of Information Science and Tech- nology,University of Science and Technology of China,Hefei 230026,China) Abstract:In view of the knowledge characteristics of an agricultural intelligence system,a knowledge representa- tion structure was formulated based on frame knowledge units and knowledge solving units.XML was chosen as its knowledge description language and a bidirectional reasoning strategy was employed to support uncertain reasoning. This knowledge representation mode and inference strategy was applied in our research work.Compared with other methods,it produced better results in areas such as knowledge acquisition,intuitionistic expression of knowledge, knowledge expansion,knowledge modularization and knowledge sharing. Keywords:knowledge representation;knowledge unit;XML;inference 由于农业知识的复杂性、地域差异性和丰富性统、语义网络、框架、过程表示等人工智能中常用的知 等特点,如何直观充分地表示知识并进行准确高效 识表示方法不能满足农业领域知识表示的需要山, 的推理决策始终是农业智能系统开发平台所要解决 在XML广泛使用以前,农业知识的管理多采用 的主要问题.在建立某个特定任务的智能系统时,首 定制格式的文本管理方式231或直接将知识存入数 先要考虑的就是要选用合适的知识表示策略,知识 据库系统的管理办法4).定制格式的文本形式符 表示方法的合适与否不仅关系到知识库中知识的有 合人们一般的阅读思维和语言习惯:但因为结构化 效存储,而且也直接影响着系统的知识推理效率和 程度弱,文本解析比较麻烦,推理和知识检索效率较 对新知识的获取能力. 低,同时不能实现跨平台,限制了知识的共享.数据 农业智能系统中,通常的数据、方法、模型、经验、 库保存知识的优势在于利用成熟的数据库管理工 案例等信息都是可能的知识源.谓词逻辑、产生式系 具,能够便捷稳定地管理、保存、提取知识;但关系数 据库的二维表结构,使得在描述非结构化问题时存 收稿日期:2008-04-29. 基金项目:国家自然科学基金资助项目(60774096);国家十一五科技 在弊端].随着XML技术的成熟和普及,也出现了 支撑计划资助项目(2006BAD10A1410):国家863计划资 一些新的相关的知识表示方法[910),在软硬件无关 助项目(2006AA10Z237). 通信作者:魏圆圆.Email:jjy@126.com. 性、知识结构性、可扩展性等方面都体现出了优势
·524 智能系统学报 第3卷 但对复杂问题的知识描述能力还非常有限 棉花高产 本文从知识组织结构和知识描述语言两个层次 栽培管 研究农业智能系统的知识表示,结合农业知识库的 特点,提出基于框架知识单元和求解知识单元的知 提前准各移栽技术 种植密度 棉田管理 病虫出 识表示模型,并以XML作为知识描述语言,通过语 防治 法规范的定义,将半结构和非结构化的知识进行尽 可能的结构化存储,形成XML知识库文档,推理机 蕾期管四 花铃地 品种选样 种子准备 管理 依据该知识库文档进行推理.平台采用VC.NET 2003作为开发工具,目前已投入正式使用,较以往 料准备 棉田准备 出期管理 吐絮期 开发平台越来越多地体现出在知识表达、知识扩充、 管理 知识模块化、知识共享等方面的优势 图1框架树片段 Fig.1 Segment of frame tree 1农业智能系统知识库的知识组织 结构 架,该叶子节点就是子框架的根节点.否则叶子节点 就为具体求解的求解目标,图1中,品种选择、肥料 知识表示方法可以从以下几个方面来衡量们: 准备、蕾期管理等是要具体求解的目标.每个求解目 1)表示能力,具备将问题求解中的各类形式化知识 标都有一个“求解类型”属性,指明求解目标的求解 完全表示出来的能力;2)可理解性,便于理解和实 方式.简单的形式可以是直接显示描述问题解决内 现;3)可操作性,有利于知识的利用,能使基于知识 容的网页、播放视频等,复杂问题的求解形式可以是 的推理有效地、符合逻辑地进行;4)结构性,便于知 通过求解知识单元求解,也可以直接调用外部构件 识系统的维护、管理及扩充,并有利于推理的进行. 进行求解,比如神经网络构件、数据挖掘构件等。 知识表示方式有两大基本类型:陈述性表示和 一个求解目标可以包含一个或多个求解资源,或 过程性表示1,2].这是知识理论中的经典问题.陈述 者叫做求解内容.比如目标“种子准备”的求解类型是 性表示方式强调知识的静态,即描述事物的属性及 webpage,推理机根据该属性,提取求解资源,即网页 其相互关系;过程性表示方式则强调知识的动态,即 “zzzb.htm”,在界面中显示.目标“肥料准备”的求解 表示推理和搜索相关事实等运用知识的过程.与知 类型是sku,推理机根据这个属性,分别找到包含的3 识表示方式的这种分类吻合,本文提出的知识表示 个求解资源对应的求解知识单元进行求解, 方法,引入框架知识单元(frame knowledge unit, 1.2求解知识单元 FKU)和求解知识单元(solving knowledge unit,SKU) 求解知识单元指的是描述一个问题求解的过程 的概念,将陈述表示对应框架知识单元,过程表示对 性知识.通过框架树,描述了问题的层次结构以及求 应于求解知识单元 解目标,接下来求解目标如何实现,就要通过求解知 1.1框架知识单元 识单元来完成.。 描述问题逐层分解的框架体系树的知识单元, 类似于程序设计中完成一个基本功能的函数: 体现了求解问题所包含的知识内容和知识间的层次 求解知识单元包括变量声明部分(VARLIST)和执 关系.将要求解的问题按照领域特征和专家知识结 行部分(BODY).变量声明部分定义问题求解过程 构进行层层分解与细化,形成一个树状框架结构,称 中所需的变量,按照变量的用途、变量值的获取方式 为框架树.这种树状结构很直观地描述了整个智能 等属性,将变量分为一般变量(general)、sku变量和 系统知识结点之间的层次关系.以棉花栽培管理专 临时变量3种类型(typ).一般变量又包含3种数 家系统为例,开发平台构建的框架体系树片段如 据类型(datatype):枚举型、实数型、字符串型.推理 过程中用到且其值未知的情况下,通过人机交互界 图1所示 面提问用户.对sku变量,其变量值通过调用其他 框架树中每个节点都是一个框架知识单元,与 sku得到.临时变量是在计算过程中保存临时结果 其关联的上层节点是父节点,所以框架树对应的框 的变量.所以这里,sku变量和临时变量是求解知识 架知识单元是一个单元层层嵌套的结构.框架树过 于复杂的时候,树的叶子节点还可以引出一个子框 单元的局部变量,一般变量的值的作用范围是其所 在的求解目标.执行部分描述了问题求解过程所需
第6期 魏圆圆,等:农业智能系统开发平台的知识表示与推理策略 ·525· 的知识,表示为有序的语句(SENTENCE)序列.语句 从数据描述语言的角度看,XML是灵活的、可扩 类型包括:赋值语句、f…then…else…语句、输出语 展的,有良好的结构和约束;从数据处理的角度看,它 句、数据库访问语句等.输出语句又可以输出字符 足够简单且易于阅读,同时易于被应用程序处 串、变量值、网页、网页超链接等形式.开发平台中包 理451.XML的这些优越性,也使得近年来基于XM 含的这些变量类型和语句类型基本满足了农业智能 的知识表示方法成为知识表示领域研究的热点 系统对知识表示的需求,通过傻瓜化人机交互界面 2.2知识库的XML描述 从领域专家头脑中获取规则、计算模型等各种类型 一个XML知识库文件包含元素和 知识. 元素两大部分.元素对应一 求解知识单元之间既相互独立,又相互联系.求 个递归嵌套的框架知识单元,元素对 解过程通过知识单元的形式来描述,很好地体现了 应多个求解知识单元组成的知识单元序列.每个求 知识的模块化、独立性,可维护性很高.求解知识单 解知识单元对应一个元素,作为SKULIST 元之间通过相互调用联系起来,很好地实现了知识 的子元素.用浏览器打开“棉花栽培管理专家系统” 的共享 的XML知识库文档,并将内容收起后的形式如下: 从上面的描述,很容易看出,一个完整的知识库 由一个递归嵌套的框架知识单元和多个并列的求解 - 2基于XML描述的知识表示方法 2.1XML简介 + 扩展标记语言(extensible markup language)XML 文档和数据文档.XML是W3C确定的Wb上的标准 ta-markup language),也就是说它没有一套能够适用 于各个领域中所有用户的固守的标签和元素;相反, 它允许开发者根据自己的需要定义自己的元素,极大 地强化了保存信息和处理信息的能力.XML的标记 1)XML文档是一种结构化的文档,可用树的形 式表示出来 2)可利用DTD(document type declaration)或 Schema(模式)管理一致性问题.DTD或Schema为 氮肥用量 XML文档提供了一个语法规范,如果XML交换的 双方事先在DTD或Schema的使用和意义理解上都 磷肥用量 达成一致,则可实现对文档的共享.DTD主要用于 钾肥用量 3)具有很好的扩展性,可定义自己的元素和属性。 数据到结构化文档.它还被设计成可对各种数据对 象进行操作 5)在一个设计良好的XML应用中,XML标记 不涉及文档如何显示,只表示文档的结构 <TARGETRES mtzb.htm
526. 智能系统学报 第3卷 发平台中常采用的基于文本的知识库片断如下: FKU棉花高产栽培管理专家系统 棉花高产栽培管理专家系统=(播前准备, 移栽技术,种植密度,…); 播前准备=(品种选择,肥料准备,种子准备, 取SKU片断如下: 棉田准备); SKULIST 病害防治=(苗期病害,铃期病害,枯黄萎病); VARLIST> FKU肥料准备(氮肥用量,磷肥用量,钾肥用量)》 肥料准备=(氮肥用量,磷肥用量,钾肥用量, REAL氮肥用量(MIN,0,MAX,10000,UNT,单位); REAL钾肥用量(MIN,0,MAX,10000,UNT,单位); 尿素 REAL生长需氮量(MⅢN,0,MAX,100O0,UNT,单位); 硝酸铵 REAL土壤含氮量(MN,0,MAX,10000,UNTT,单位); 硫酸铵 ENUM氮肥种类; 碳酸氢铵 氮肥种类={“尿素”,“硝酸铵”,“硫酸铵”, “碳酸氢铵”}; x生长需氮量-土壤含氨量* (生长需氮量-土壤含氮量*0.45)/0.4; 0.45 和规范,使得文本知识库必须要经过严格的语法检 查,推理机在推理过程中对文本的解析工作相当繁 琐.而XML表示的知识库尽可能使知识进行结构化 描述,加上各种开发语言都有较成熟的XML文档解 氮肥用量 析器,所以推理机的实现要相对容易,而且本文研究 x/0.4</RVALUE 的知识表示较以往基于文本的知识库在描述能力上 </SENTENCE 要强很多. </THEN 3推理策略 </SENTENCE 为说明上述知识表示的优点,取作者在以往开 知识库和推理机是专家系统的主要部分16].推
第6期 魏圆圆,等:农业智能系统开发平台的知识表示与推理策略 ·527· 理机是整个专家系统的控制中心,整个系统靠它进行 3.4推理结果 运转.一般推理有两种方式:一种是由下而上,即从用 仍以“棉花栽培管理专家系统”为例,推理机基 户提出因素向目标节点一步一步推导;另一种是从上 于XML知识库文档,对“肥料准备”的求解结果如 向下,即从目标节点到叶节点,反过来一步一步推导 图2所示. 常将前者称作正向推理,后者称作反向推理.正向推 发识机规化其系家系址 理是从事实向目标的推理,又叫事实驱动;反向推理 文件四演》京过 是从目标向事实的推理,也叫目标驱动.在复杂的推 理网络中,还有一种正反向推理或双向混合推理方 式,知识表示策略与推理策略两者是相互配合的,不 同的知识表示策略需有相应的推理机制.本文采用混 合推理模式,同时支持不确定推理. 3.1混合推理模式 基于知识库采用的知识组织结构,首先,根据框 架树引导用户选择求解目标,这个过程是正向推理; 然后,是反向推理过程,根据求解目标包含的资源名 图2推理机运行结果 称找到对应的求解知识单元,顺序执行单元中的语 Fig.2 Infering results 句序列,搜索事实知识或者通过人机交互界面向用 户提问. 4 结束语 3.2推理的不确定性 本文针对农业智能系统知识体系的特点,提出 推理的不确定性体现在求解知识单元的置信度 了基于框架知识单元和求解知识单元的知识组织结 (CF值)上,在求解资源对应多个SKU的时候,就是 构,同时采用XML作为知识描述语言的知识表示方 多路径推理,即问题有多种解决方式.这时就根据 法.在此基础上采用混合推理的推理策略,通过对求 CF值优先求解CF值高的SKU,若该路径中有必要 解知识单元赋以CF值,实现了不确定推理.该知识 的事实知识搜索不到且用户不能给出,则此路径无 表示方法和与之对应的推理机制已经在作者的新的 法求解;取CF值次之的SKU进行求解,直到求解完 智能系统开发平台中得到实际应用,较以往知识表 成为止 示方法,具有以下特点:1)知识库由框架知识单元 3.3推理机运行过程 和求解知识单元组成的思路,与知识表示分为陈述 推理依据XML知识库文档进行,XML语言的 表示和过程表示这一分类法吻合;2)框架知识单元 良好的结构化特性,大大方便了推理机对知识内容 的树状结构和XML文档的树状结构对应,采用 的解析.整个推理步骤如下: XML描述知识,两者优势互补;3)XML描述的知识 1)根据框架树引导选择求解目标 库在形式上以元素为基本单元,一个元素 2)找到求解目标对应的SKU,建立求解队列, 即对应一个求解知识单元,这就为基于知识库的推 并按照CF值由大到小进行排序, 理提高了检索的效率;4)推理采用混合推理方法, 3)优先求解CF值高的SKU,在某一个SKU的 目标选定后只考虑对假设目标有用的知识,缩小了 求解过程中,先依次求解该知识单元变量列表中调 搜索空间,推理效率高;5)支持多路径推理,同时也 用的其他SKU,赋值给对应的sku变量,ku变量求 解决了多路径求解问题;6)针对农业智能系统开发 解完毕后,推理机顺序执行求解语句.如果求解过程 平台,知识库独立于推理机,有利于知识的更新与扩 中遇到未知变量,就通过人机交互界面向用户提问, 充,同时生成的XML知识库文档,适用于不同软硬 用户回答后推理继续进行,直到执行部分运行结束, 件环境下的推理和知识交换 得到求解结果,推理完毕 4)如果步骤中用户针对提问不能给出答案,则 参考文献: 上述SKU无法求解,从求解队列中选择CF值次之 [1]王珏,袁小红,石纯一,等.关于知识表示的讨论[J], 的SKU进行求解,其过程与步骤3)相同.直到有 计算机学报,1995,18(3):212-224. SKU求解完成,推理完毕.若求解队列中所有SKU WANG Jue,YUAN Xiaohong,SHI Chunyi,et al.Discus- 都无法求解,则求解目标求解失败,推理完毕。 sions on knowledge representation[J].Chinese Jourmnal of
·528· 智能系统学报 第3卷 Computers,1995,18(3):212-224. [10]徐伟,王儒敬,杨化峰.基于RuleML的多级知识单元 [2]熊范纶,乔克智,胡海赢.雄风专家系统开发工具[M]: 知识表示方法[J].计算机工程与应用,2005,41(1): 北京:清华大学出版社,1999. 174-177. [3]薛军,王儒敬.一种基于文本知识库的推理方法研究 XU Wei,WANG Rujing,YANG Huafeng.RuleML-based [J].计算机工程与应用,2003,39(21):189-191. knowledge representation of multi-level knowledge units XUE Jun,WANG Rujing.A method of reasoning based on [J].Computer Engineering and Applications,2005,41 text knowledge-base[J].Computer Engineering and Appli- (1):174-177. cations,2003,39(21):189-191. [11]DAVIS R,SHROBE H,SZOLVITS P.What is a knowl- [4]席磊,张丽,张慧,等.农业专家系统中知识表示 edge representation[J].AI Magazine,1993,14(1):17- 技术的研究[J].河南师范大学学报:自然科学版, 33. 2006,34(3):43-47. [12]石纯一.人工智能原理[M].1版.北京:清华大学出 XI Lei,ZHANG Li,ZHANG Hui,et al.Knowledge repre- 版社,1993. sentation research for agriculture expert system[J].Journal [13]丘光华,张文敏.XML编程实例教程[M].北京:科学 of Henan Normal University:Natural Science,2006,34 出版社,2004. (3):43-47. [14]FARSI R.XML J].Informatik -Spectrum,1999,22 [5]涂运华,王东辉,赵卷江.基于Windows CE的HPC/PDA (6):436-438. 农业专家系统开发平台的研究与开发[J].高技术通讯, [15]孙伟,刘大昕.一种XL代数及其查询优化方法 2000,10:28-31. [J].哈尔滨工程大学学报,2007,28(8):899-904. TU Yunhua,WANG Donghui,ZHAO Chunjiang.The re- SUN Wei,LIU Daxin.An XML algebra and query Optimi- search and development of a development platform on HPC zation based on algebra []Joumal of Harbin Engineering PDA for agricultural expert system based on Windows CE University,2007,28(8):899-904. [J].High Technology Letters,2000,10:28-31. [16]NILSSON N J.Artificial intelligence:a new synthesis[M]. [6]张文学,朱乃立.知识表示在牡丹栽培技术专家系统中 San Francisco:Morgan Kaufmann Publishers,1998. 的应用[J].计算机工程,2005,31(17):210-212. 作者简介: ZHANG Wenxue,ZHU Naili.Application of knowledge 魏圆圆,女,1980年生,助理研究 representation in peony growing technology expert system 员,博士研究生,主要研究方向为知识 [J].Computer Engineering,2005,31(17):210-212. 表示、智能决策.发表学术论文4篇。 [7]YAN Hongsen.A new complicated-knowledge representa- tion approach based on knowledge meshes[J].IEEE Trans- actions on Knowledge and Data Engineering,2006,18 王儒敬,男,1964年生,研究员,博 (1):47-62. 士生导师,主要研究方向为知识工程. [8]周桂红,郑磊,黄丽华,等.农业专家系统生成工具的 设计与实现[J].农业工程学报,1999,15(3):53-59. 参与或主持国家自然基金、863项目、国 ZHOU Guihong,ZHENG Lei,HUANG Lihua,et al.De 家支撑等课题10余项.发表学术论文 20余篇. sign and implementation of agricultural expert system tool [J].Transactions of the Chinese Society of Agricultural En gineering,1999,15(3):53-59. [9]黄海,王儒敬,黄河.一种基于HomML的Web知识 张英,男,1983年生,硕士研究 生,主要研究方向为知识获取、知识表 表示方法[J].计算机工程与应用,2006,42(1):53- 示.发表学术论文1篇. 55. HUANG Hai,WANG Rujing,HUANG He.A HomML- based knowledge representation for web knowledge [J]. Computer Engineering and Applications,2006,42(1):53- 55