第12卷第3期 智能系统学报 Vol.12 No.3 2017年6月 CAAI Transactions on Intelligent Systems Jun.2017 D0I:10.11992/is.201610017 网络出版地址:http:/kns.cmki.net/kcms/detail/23.1538.TP.20170404.1218.008.html 利用智能引导和KDML增强可拓 模型人机建模能力研究 毛莉娜1,李卫华2 (1.广东轻工职业技术学院机电工程系,广东广州510300:2.广东工业大学计算机学院,广东广州510006) 摘要:为了利用计算机协助人们建立待求解问题的可拓模型,必须让计算机识别用自然语言描述的问题,而且要 理解问题的含义,这是相当困难的任务。本文提出利用人机界面Agent的智能引导并结合知网(HowNet)中的知识 系统描述语言(KDML),增强计算机语义处理能力的方法。以求职问题为实践的结果说明了方法的有效性。由于 KDML有较强的表示语义信息的作用,通过人机交互也能减轻计算机自然语言理解的困难。因此该方法能将自然语 言描述的待求解问题的目标和条件进行分离和形式化,使计算机更有效地建立待求解问题的可拓模型。 关键词:智能引导;KDML;自然语言理解;语义;可拓模型;Agent;人机交互;知网 中图分类号:TP3文献标志码:A文章编号:1673-4785(2017)03-0348-07 中文引用格式:毛莉娜,李卫华.利用智能引导和KDML增强可拓模型人机建模能力研究[J].智能系统学报,2017,12 (3):348-354. 英文引用格式:MAO Li'na,LI Weihua.Research on enhancing the human--machine modeling ability for an extension model using the intelligent guide and KDML[J].CAAI transactions on intelligent systems,2017,12(3):348-354. Research on enhancing the human-machine modeling ability for an extension model using the intelligent guide and KDML MAO Li'na',LI Weihua2 (1.Department of Mechanical and Electrical Engineering,Guangdong Industry Polytechnic,Guangzhou 510300,China;2.School of Computers,Guangdong University of Technology,Guangzhou 510006,China) Abstract:When using a computer to establish an extension model for solving problems,the computer must be able to recognize problems described in natural languages,and,in particular,must understand the meaning of the problems.This is a very difficult task.Knowledge database mark-up language (KDML)in HowNet has a strong semantic information expression function.Through human-machine interaction,it can also reduce the difficulty that computers encounter when understanding natural language.A method to enhance the computer's semantic processing ability,based on the human-machine interface agent's intelligent guide and KDML,is proposed.The goals and conditions of the problems to be solved described in natural language are separated and formalized,making the computer establish the problem-solving extension model more effectively. Keywords:intelligent guide;KDML;natural language understanding;semantic;extension model;Agent;human- machine interaction:HowNet 计算机为了判断人们待求解的问题是否为矛 形式化,即建立问题的可拓模型),才能针对不同 盾问题(即判断在当前条件下能否实现人们所希望 类型的问题采取不同的解决方法(非矛盾问题用常 的目标),必须分离待求解问题的目标和条件,并且 规方法求解,矛盾问题用可拓学方法解决)。然而, 用户问题经常是用自然语言表述的,比如,“我如何 收稿日期:2016-10-14.网络出版日期:2017-04-04. 提高自己的职业能力才能应聘项目经理”,或者“我 基金项目:国家自然科学基金项目(61273306,61571141). 通信作者:李卫华.E-mail:w@gdut.eu.cm. 如何找到一份工作,工资待遇较好,符合个人兴趣
第 12 卷第 3 期 智 能 系 统 学 报 Vol.12 №.3 2017 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2017 DOI:10.11992 / tis.201610017 网络出版地址:http: / / kns.cnki.net / kcms/ detail / 23.1538.TP.20170404.1218.008.html 利用智能引导和 KDML 增强可拓 模型人机建模能力研究 毛莉娜1 , 李卫华2 (1.广东轻工职业技术学院 机电工程系,广东 广州 510300; 2.广东工业大学 计算机学院,广东 广州 510006) 摘 要:为了利用计算机协助人们建立待求解问题的可拓模型,必须让计算机识别用自然语言描述的问题,而且要 理解问题的含义,这是相当困难的任务。 本文提出利用人机界面 Agent 的智能引导并结合知网(HowNet)中的知识 系统描述语言(KDML),增强计算机语义处理能力的方法。 以求职问题为实践的结果说明了方法的有效性。 由于 KDML 有较强的表示语义信息的作用,通过人机交互也能减轻计算机自然语言理解的困难。 因此该方法能将自然语 言描述的待求解问题的目标和条件进行分离和形式化,使计算机更有效地建立待求解问题的可拓模型。 关键词:智能引导;KDML;自然语言理解;语义;可拓模型;Agent;人机交互;知网 中图分类号:TP3 文献标志码:A 文章编号:1673-4785(2017)03-0348-07 中文引用格式:毛莉娜,李卫华. 利用智能引导和 KDML 增强可拓模型人机建模能力研究 [ J]. 智能系统学报, 2017, 12 (3): 348-354. 英文引用格式:MAO Lina, LI Weihua. Research on enhancing the human⁃machine modeling ability for an extension model using the intelligent guide and KDML[J]. CAAI transactions on intelligent systems, 2017, 12(3): 348-354. Research on enhancing the human⁃machine modeling ability for an extension model using the intelligent guide and KDML MAO Lina 1 , LI Weihua 2 (1. Department of Mechanical and Electrical Engineering, Guangdong Industry Polytechnic, Guangzhou 510300, China; 2. School of Computers, Guangdong University of Technology, Guangzhou 510006, China) Abstract:When using a computer to establish an extension model for solving problems, the computer must be able to recognize problems described in natural languages, and, in particular, must understand the meaning of the problems. This is a very difficult task. Knowledge database mark⁃up language (KDML) in HowNet has a strong semantic information expression function. Through human⁃machine interaction, it can also reduce the difficulty that computers encounter when understanding natural language. A method to enhance the computers semantic processing ability, based on the human⁃machine interface agents intelligent guide and KDML, is proposed. The goals and conditions of the problems to be solved described in natural language are separated and formalized, making the computer establish the problem⁃solving extension model more effectively. Keywords: intelligent guide; KDML; natural language understanding; semantic; extension model; Agent; human⁃ machine interaction; HowNet 收稿日期:2016-10-14. 网络出版日期:2017-04-04. 基金项目:国家自然科学基金项目(61273306,61571141). 通信作者:李卫华. E⁃mail:lw@ gdut.edu.cn. 计算机为了判断人们待求解的问题是否为矛 盾问题(即判断在当前条件下能否实现人们所希望 的目标),必须分离待求解问题的目标和条件,并且 形式化,即建立问题的可拓模型[1] ,才能针对不同 类型的问题采取不同的解决方法(非矛盾问题用常 规方法求解,矛盾问题用可拓学方法解决)。 然而, 用户问题经常是用自然语言表述的,比如,“我如何 提高自己的职业能力才能应聘项目经理”,或者“我 如何找到一份工作,工资待遇较好,符合个人兴趣
第3期 毛莉娜,等:利用智能引导和K①ML增强可拓模型人机建模能力研究 .349. 而且工作条件不会太差”等。如果直接让计算机理 2)KDML中的特定标识符有7种,分别是左括 解这些自然语言信息是很困难的,导致可拓模型难 号({)、右括号(})、冒号(:)、逗号(,)、等号(=)、 以建立。文献[2]曾介绍过如何借助Agent技术协 分号(;)、引号(“)。 助建立矛盾问题的可拓模型,该方案是让Agent处 3)3种特殊的指示符号:义原~、义原?、义 理半结构化的信息,而不涉及自然语言理解。但如 原$。 何构造半结构化的信息也相当复杂,不容易实现。 4)事件类概念的描述方法包括简单概念和复 文献[3]利用分类思想对矛盾问题建模,并要求用 杂概念。 户输入目标句,但没有提及条件,即默认用户的条 5)实体类概念的描述方法包括简单概念和复 件一定不满足目标(矛盾问题)。这就把那些非矛 杂概念。 盾的问题排除在外,无法用计算机求解了。文献 6)属性类概念的描述方法。 [4]建立可拓模型的方法是:当用户提供的需求语 7)属性值类概念的描述方法。 句可能只是目标或条件之中的一个,或者提供了不 8)89种动态角色的使用,复杂概念需要用这些 完整的目标和条件的情况时,利用数据库中数据对 动态角色。 可拓模型进行补充和完善[)。然而,如果数据库中 知网利用KDML把概念表示成义原(也叫义 没有相关数据时则无法成功建模,也就无法用计算 元)的DEF表达式,可称为一个语义表达式。例如: 机求解该问题了。物元有各种属性,文献[3]介绍 “阿姨”这个词知网用两个不同的义项将它们的语 的方法是相关属性由用户自己输入,此方法虽然灵 义表达如下: 活,但仍需要人的操作。文献[4]的方法是预先准 备好若干个属性,再让计算机处理。此方法发挥了 N0.=000808 计算机的作用,但灵活性不足。另外,文献[3]和文 W_C=阿姨 献[4]都未对文献[5]中提出的对矛盾问题的界定 SC= 与建模时出现的语义歧义问题进行处理。 E_C= 针对这些不足,我们开展了深入的研究,探索 W_E=aunt 更好的建立待求解问题可拓模型的方法。在研究 G_E=N 过程中,我们分析了知网(HowNet)I6的KDML SE= (knowledge database mark-up language)—知网知 EE= 识系统描述语言[)。郝长伶等设计了这种知识描 DEF={human|人:belong={family|家庭}, 述规范体系,他们经过对中英文两种语言各8万多 modifier={collateral|旁系}{female|女}{senior 条概念的描述,证明这种体系便于对意义的计算, 长辈} 更直观,有较好的可读性。文献[9]认为中文词 语间的组合主要基于语义,并指出:与其他的中文 N0.=000807 语块抽取系统不同的是,经过用知网中文信息结构 W_C=阿姨 抽取器处理后的中文信息结构内部的语义关系是 G_C=N [al yi2] 清晰明确的,其每一个部分的语义都被确定并保留 S_C= 了。本文在上述工作的基础上,提出一种增强计 E_C= 算机建立待求解问题可拓模型能力的方法:结合人 W_E=nurse 机界面Agent的智能引导能力,并充分利用KDML G E=N 表达性,增强计算机的语义处理能力,使计算机能 S_E= 更有效地将自然语言描述的待求解问题的目标和 EE= 条件进行分离和形式化,建立待求解问题的可拓模 DEF={human|人:HostOf:={Occupation职 型,为进一步协助解决待求解问题奠定基础。 位},{TakeCare|照料:aget={~},patient= KDML的语义描述能力 {human人:modifier={child少儿}}} 有关KDML的详细内容请阅读文献[7],这里 NO.=000807的DEF表达式的首义原是“人”, 只做简单介绍: 说明“阿姨”是人。冒号(:)后用HostOf= 1)KDML总规定有7点,确定描述规范。 {Occupation职位}和{TakeCare|照料:agent={~}
而且工作条件不会太差”等。 如果直接让计算机理 解这些自然语言信息是很困难的,导致可拓模型难 以建立。 文献[2]曾介绍过如何借助 Agent 技术协 助建立矛盾问题的可拓模型,该方案是让 Agent 处 理半结构化的信息,而不涉及自然语言理解。 但如 何构造半结构化的信息也相当复杂,不容易实现。 文献[3]利用分类思想对矛盾问题建模,并要求用 户输入目标句,但没有提及条件,即默认用户的条 件一定不满足目标(矛盾问题)。 这就把那些非矛 盾的问题排除在外,无法用计算机求解了。 文献 [4]建立可拓模型的方法是:当用户提供的需求语 句可能只是目标或条件之中的一个,或者提供了不 完整的目标和条件的情况时,利用数据库中数据对 可拓模型进行补充和完善[4] 。 然而,如果数据库中 没有相关数据时则无法成功建模,也就无法用计算 机求解该问题了。 物元有各种属性,文献[3] 介绍 的方法是相关属性由用户自己输入,此方法虽然灵 活,但仍需要人的操作。 文献[4] 的方法是预先准 备好若干个属性,再让计算机处理。 此方法发挥了 计算机的作用,但灵活性不足。 另外,文献[3]和文 献[4]都未对文献[5]中提出的对矛盾问题的界定 与建模时出现的语义歧义问题进行处理。 针对这些不足,我们开展了深入的研究,探索 更好的建立待求解问题可拓模型的方法。 在研究 过程 中, 我 们 分 析 了 知 网 ( HowNet ) [6] 的 KDML (knowledge database mark⁃up language)———知网知 识系统描述语言[7] 。 郝长伶等设计了这种知识描 述规范体系,他们经过对中英文两种语言各 8 万多 条概念的描述,证明这种体系便于对意义的计算, 更直观,有较好的可读性[8] 。 文献[9] 认为中文词 语间的组合主要基于语义,并指出:与其他的中文 语块抽取系统不同的是,经过用知网中文信息结构 抽取器处理后的中文信息结构内部的语义关系是 清晰明确的,其每一个部分的语义都被确定并保留 了[9] 。 本文在上述工作的基础上,提出一种增强计 算机建立待求解问题可拓模型能力的方法:结合人 机界面 Agent 的智能引导能力,并充分利用 KDML 表达性,增强计算机的语义处理能力,使计算机能 更有效地将自然语言描述的待求解问题的目标和 条件进行分离和形式化,建立待求解问题的可拓模 型,为进一步协助解决待求解问题奠定基础。 1 KDML 的语义描述能力 有关 KDML 的详细内容请阅读文献[7],这里 只做简单介绍: 1)KDML 总规定有 7 点,确定描述规范。 2)KDML 中的特定标识符有 7 种,分别是左括 号({)、右括号( })、冒号(:)、逗号(,)、等号( = )、 分号(;)、引号(“)。 3) 3 种特殊的指示符号: 义原 ~ 、 义原?、 义 原 $ 。 4)事件类概念的描述方法包括简单概念和复 杂概念。 5)实体类概念的描述方法包括简单概念和复 杂概念。 6)属性类概念的描述方法。 7)属性值类概念的描述方法。 8)89 种动态角色的使用,复杂概念需要用这些 动态角色。 知网利用 KDML 把概念表示成义原( 也叫义 元)的 DEF 表达式,可称为一个语义表达式。 例如: “阿姨”这个词知网用两个不同的义项将它们的语 义表达如下: NO. = 000808 W_C =阿姨 S_C = E_C = W_E = aunt G_E =N S_E = E_E = DEF = { human 人:belong = {family 家庭}, modifier = {collateral 旁系}{female 女}{senior 长辈}} NO. = 000807 W_C =阿姨 G_C =N [a1 yi2] S_C = E_C = W_E = nurse G_E =N S_E = E_E = DEF = { human 人:HostOf = {Occupation 职 位}, { TakeCare 照料: agent = { ~ }, patient = {human 人:modifier = {child 少儿}}}} NO. = 000807 的 DEF 表达式的首义原是“人”, 说 明 “ 阿 姨 ” 是 人。 冒 号 (:) 后 用 HostOf = {Occupation 职位}和{TakeCare 照料:agent = { ~ }, 第 3 期 毛莉娜,等:利用智能引导和 KDML 增强可拓模型人机建模能力研究 ·349·
·350 智能系统学报 第12卷 patient={human|人:modifier={child|少儿}}}两个 以解析出两个知网词语,“应聘”和“成本会计师”, 描述项来说明此复杂概念人,第1个描述项是动态 其KDML表达式如下: 角色HostOf((之宿主),说明此人是义原“职位”的宿 N0.=100746 主,第2个描述项“照料”也是复杂概念,用动态角 W_C=应聘 色agent和patient来说明。agent={~}说明,照料 G_C=V 的施事(agent)是此人,照料的受事(patient)是另一 E_C= 个人,这另一个人的描述(modifier)值是义原“少 W_E=accept an offer of employment 儿”。 G E=V N0.=000808的DEF表达式的首义原是“人”, E_E= 说明“阿姨”是人。冒号(:)后用belong={family家 DEF=accept|接受,content=:employ|雇用 庭}和modifier={collateral|旁系}{female|女} {senior长辈}两个描述项来说明此复杂概念“人”, N0.=017547 第1个描述项是动态角色belong(归属),说明此 W_C=成本会计师 “人”属于义原“家庭”,第2个描述项是动态角色描 G_C=N [cheng2 ben3 kuai4 ji4 shil] 述(modifier)的3个值:义原“旁系”、义原“女”、义 S C= 原“长辈”。 E_C= 通过这样的KDML语义表达,可以把两个有歧 W_E=cost accountant 义的概念区分开,不至于产生语义二义性。 GE=N KDML除了对词语所代表的概念进行描述外, S_E= 它还使得每一种信息结构也都成为可以计算的对 E_E= 象[。因此,有利于计算机理解用户输入问题的目 DEF={human|人:HostOf={Occupation|职 标和条件,减少语义模糊。 位},domain={finance金融},{calculate计算: agent={~},content={wealth|钱财}}} 2增强的可拓模型建立方法 N0.=100746的DEF表达式的语义是接受,内 可拓学原理指出:必须把待求解问题解析出目 容是雇用;NO.=017547的DEF表达式的语义清楚 标和条件,才能建立问题的可拓模型。如果计算机 说明,“成本会计师”是人,是职位的宿主,该人属于 直接接收用户用自然语言描述的问题,要解析出目 “金融”领域,是“计算”的施事者,计算内容是“钱 标和条件无疑会陷入自然语言理解的困境中。因 财”。对此表达式,用户和计算机都不难理解其 此,我们提出让Agent引导用户分别输入问题的目 语义。 标和条件,而不要两者混杂在一起输人。 从知网-中文信息结构库[o]知道,“应聘成本 以求职问题为例:Agent可以问用户想应聘什 会计师”的信息结构是SYN_S=V-->N,SEM_S= 么职位,用户必然输入希望应聘的职位,这相当于 (事件)->[内容](万物/部件),其中SYNS表 问题的目标部分:然后Agent再引导用户输入个人 示相应的句法结构式,SEM_S表示信息结构模式, 资质信息,这相当于问题的条件部分。这样,问题 “应聘”是(事件),而“成本会计师”是[内容](万 的目标和条件就基本分离了。 物/部件)。 分离了问题的目标和条件后,还要形式化,以 假设用户输入的资质条件是“大学本科毕业,英 便计算机处理。我们可以用文献[3]的分词步骤或 语过了四级”。“大学本科毕业”可以解析出两个知 文献[4]的组块分析步骤对目标和条件句进行处 网词语,即“大学本科”和“毕业”,“大学本科毕业”的 理,也可以用国内外文献介绍的各种方法进行处 信息结构是SYNS=NN},SEM_S=(事件,行动)<--[动量]
patient = {human 人:modifier = {child 少儿}}}两个 描述项来说明此复杂概念人,第 1 个描述项是动态 角色 HostOf(之宿主),说明此人是义原“职位”的宿 主,第 2 个描述项“照料”也是复杂概念,用动态角 色 agent 和 patient 来说明。 agent = { ~ } 说明,照料 的施事(agent)是此人,照料的受事( patient)是另一 个人,这另一个人的描述( modifier) 值是义原“ 少 儿”。 NO. = 000808 的 DEF 表达式的首义原是“人”, 说明“阿姨”是人。 冒号(:)后用 belong = {family 家 庭} 和 modifier = { collateral 旁系}{female 女 } {senior 长辈}两个描述项来说明此复杂概念“人”, 第 1 个描述项是动态角色 belong ( 归属),说明此 “人”属于义原“家庭”,第 2 个描述项是动态角色描 述(modifier)的 3 个值:义原“旁系”、义原“女”、义 原“长辈”。 通过这样的 KDML 语义表达,可以把两个有歧 义的概念区分开,不至于产生语义二义性。 KDML 除了对词语所代表的概念进行描述外, 它还使得每一种信息结构也都成为可以计算的对 象[9] 。 因此,有利于计算机理解用户输入问题的目 标和条件,减少语义模糊。 2 增强的可拓模型建立方法 可拓学原理指出:必须把待求解问题解析出目 标和条件,才能建立问题的可拓模型。 如果计算机 直接接收用户用自然语言描述的问题,要解析出目 标和条件无疑会陷入自然语言理解的困境中。 因 此,我们提出让 Agent 引导用户分别输入问题的目 标和条件,而不要两者混杂在一起输入。 以求职问题为例:Agent 可以问用户想应聘什 么职位,用户必然输入希望应聘的职位,这相当于 问题的目标部分;然后 Agent 再引导用户输入个人 资质信息,这相当于问题的条件部分。 这样,问题 的目标和条件就基本分离了。 分离了问题的目标和条件后,还要形式化,以 便计算机处理。 我们可以用文献[3]的分词步骤或 文献[4] 的组块分析步骤对目标和条件句进行处 理,也可以用国内外文献介绍的各种方法进行处 理,但这些方法处理中文语义不如知网。 本文提出 用文献[9]的描述基于“知网”的中文信息结构抽取 方法对问题目标和条件进行处理,再用 KDML 形 式化。 假设用户目标是“应聘成本会计师”,该短语可 以解析出两个知网词语,“应聘”和“成本会计师”, 其 KDML 表达式如下: NO. = 100746 W_C =应聘 G_C =V E_C = W_E = accept an offer of employment G_E =V E_E = DEF = accept 接受,content = employ 雇用 NO. = 017547 W_C =成本会计师 G_C =N [cheng2 ben3 kuai4 ji4 shi1] S_C = E_C = W_E = cost accountant G_E =N S_E = E_E = DEF = { human 人:HostOf = {Occupation 职 位},domain = { finance 金融},{calculate 计算: agent = { ~ },content = {wealth 钱财}}} NO. = 100746 的 DEF 表达式的语义是接受,内 容是雇用;NO. = 017547 的 DEF 表达式的语义清楚 说明,“成本会计师”是人,是职位的宿主,该人属于 “金融”领域,是“计算” 的施事者,计算内容是“钱 财”。 对此表达式,用户和计算机都不难理解其 语义。 从知网-中文信息结构库[10] 知道,“应聘成本 会计师”的信息结构是 SYN_S = V --> N,SEM_S = (事件) --> [内容] (万物/ 部件),其中 SYN_S 表 示相应的句法结构式,SEM_S 表示信息结构模式, “应聘”是(事件),而“成本会计师” 是[内容] (万 物/ 部件)。 假设用户输入的资质条件是“大学本科毕业,英 语过了四级”。 “大学本科毕业”可以解析出两个知 网词语,即“大学本科”和“毕业”,“大学本科毕业”的 信息结构是 SYN_S =N <-- V,SEM_S =(万物/ 部件) [内容] <-- (事件,行动),“大学本科”是(万物/ 部 件)[内容],而“毕业”是(事件,行动)。 “英语过了四 级”可以解析出 4 个知网词语:“英语” “过” “四” “级”,“过四级” 的信息结构类似 SYN_S = V < - - {NUM --> N},SEM_S = (事件,行动) <-- [动量] ·350· 智 能 系 统 学 报 第 12 卷
第3期 毛莉娜,等:利用智能引导和K①ML增强可拓模型人机建模能力研究 ·351 {(数量值)-->(物质,用具/部件,%动物)}。 因此,用户问题P:“我大学本科毕业,英语过了 目标和条件用KDML形式化后,为了建立可 四级,如何应聘成本会计师?”就成功地被建立为以 拓模型,还需要把KDML表达的词语转变成基元。 下可拓模型: 本课题组曾研究过相关的内容,主要是靠人来建 P=「应聘,支配对象,M门 立基元,存储后作为基础库。本文提出用人机 「求职者B,学历,大学本科 交互方式建立基元,发挥计算机的作用,减轻人的 英语水平,四级 劳动。基元可以是物元M、事元A、关系元R,详细 综上所述,增强计算机可拓建模能力的方法归 内容见文献[1]。比如,目标“应聘成本会计师” 纳如下: 的KDML表达式句法是SYN_S=V→N,动词“应 1)引导用户输入待求解问题的目标部分: 聘”为首,名词“成本会计师”为后,计算机将前者 2)引导用户输入待求解问题的条件部分; 转变为可拓学的事元A,后者转变为物元M。本文 3)用基于“知网”的中文信息结构抽取方法分 让计算机从KDML表达式中提取物元各属性值, 别解析目标和条件,用KDML形式化: 再提交给用户确认属性名。经用户确认后,目标 4)将KDML表示的目标和条件通过人机交互 基元如下: 转变成目标基元G和条件基元L: A=[应聘,支配对象,M] 5)形成待求解问题P的可拓模型P=G·L。 「{成本会计师}, 领域, 金融 M= 3 方法实践 职位内容, A A,=[计算,支配对象,钱财] 我们将职业学院毕业生求职问题作为应用实 条件“大学本科毕业,英语过了四级”是求职者 践来说明本文所提方法的有效性。 的属性,计算机把KDML表达式填入求职者物元属 为了实现智能引导,我们采用本课题组曾研究 性值中,再经过用户确认属性名后建立起条件物 过的MVC架构的人机界面Agent!),不同之处是领 元M1: 域知识不一样。文献[12]的知识库存放的是旅游 「求职者B, 学历, 大学本科 领域知识,本文则要存放职业信息。我们搜集了国 M, 英语水平 四级 家职业大典,部分信息如图1所示。 D F G 代码 国标代码职业名称 大类代码职业类型职业描谜备注 1-01 GB10-1 中国共产党中央委员会和地方各: 1管理 在中国共产党中央委 3 1-02 GBMO-2 国家机关及其工作机构负责人 1管理 1-03 GB0-3 民主党派和社会团体及其工作机 1管理 在各级人民代表大会 在各民主党派, 5 1-04 G3H0-4 事业单位负责人 1管理 在事业单位及其工作 6 1-05 GBHO-5 企业负责人 1管理 在企业及其职能部门 7 2-01 GB1-1/1-科学研究人员 2专业技术从事社会科学和自然 8 2-02 GB1-3/1-工程技术人员 2专业技术从事矿物脚探和开采 9 2-03 GBM1-7 农业技术人员 2专业枝术从事土壤肥料、植物 10 2-04 GBM1-8 机和船舶技术人员 2安全.运输从事飞机与船帕的加 -11 2-05 GBM1-9 卫生专业技术人员 2社区,家政从事医疗、预防、康 12 2-06 GB"2-1 经济业务人员 2经济.财务从事经济计刘、统计 2-07 GB2-2 金种业务人员 2金融业务.市场营销研充和设 14 2-08 GBM2-3 法律专业人员 2专业技术依法行使审判权、检 15 2-09 GB112-41 高等教育教师 2专业枝术在高等学校专门从事 16 2-10 GBM2-5 文学艺未工作人员 2 事文学艺术工作的 17 2-11 GBM2-6 体育工作人员 2 从事竞技体有运动员 18 2-12 GB"2-7 新闻出版、文化工作人员 从事新闻采访报道」 92-i3 GBM2-8 宗教职业者 专门从事佛教、道教 图1职业信息 Fig.1 Occupational information 这些信息是Agent处理用户目标的背景知识, 引导用户输入问题信息,并灵活对待不同的问题。 用Excel表存放在计算机中备用。Agent用Java技 假设Agent问:“您想应聘什么职位?”用户输入 术)开发,运行在Wb4环境下,系统采用开源的 某职位名称后,Agent先检查国家职业大典Excel表 Tomcat服务器[1)和MySQL数据库[6]。 有无此职位,有则Agent可以转向引导用户输入,无 3.1引导目标和条件 则要求用户进一步指明。我们在实践中发现大致 为了使Agent引导用户输入目标,我们采用与 有3种情形:1)用户有时输入错误;2)用户输入的 文献[17]相似的交互策略。在输入界面给予示范, 职位名称不是职业大典使用的名称,但实际上语义
{(数量值) --> (物质,用具/ 部件,%动物)}。 目标和条件用 KDML 形式化后,为了建立可 拓模型,还需要把 KDML 表达的词语转变成基元。 本课题组曾研究过相关的内容,主要是靠人来建 立基元,存储后作为基础库[11] 。 本文提出用人机 交互方式建立基元,发挥计算机的作用,减轻人的 劳动。 基元可以是物元 M、事元 A、关系元 R,详细 内容见文献[ 1] 。 比如,目标“应聘成本会计师” 的 KDML 表达式句法是 SYN_S = V→ N,动词“应 聘”为首,名词“成本会计师” 为后,计算机将前者 转变为可拓学的事元 A,后者转变为物元 M。 本文 让计算机从 KDML 表达式中提取物元各属性值, 再提交给用户确认属性名。 经用户确认后,目标 基元如下: A = [应聘, 支配对象, M] M= {成本会计师}, 领域, 金融 职位内容, A1 é ë ê ê ù û ú ú A1 = [计算,支配对象,钱财] 条件“大学本科毕业,英语过了四级”是求职者 的属性,计算机把 KDML 表达式填入求职者物元属 性值中,再经过用户确认属性名后建立起条件物 元 M1 : M1 = 求职者 B, 学历, 大学本科 英语水平, 四级 é ë ê ê ù û ú ú 因此,用户问题 P:“我大学本科毕业,英语过了 四级,如何应聘成本会计师?”就成功地被建立为以 下可拓模型: P = [应聘,支配对象,M]· 求职者 B, 学历, 大学本科 英语水平, 四级 é ë ê ê ù û ú ú 综上所述,增强计算机可拓建模能力的方法归 纳如下: 1)引导用户输入待求解问题的目标部分; 2)引导用户输入待求解问题的条件部分; 3)用基于“知网” 的中文信息结构抽取方法分 别解析目标和条件,用 KDML 形式化; 4)将 KDML 表示的目标和条件通过人机交互 转变成目标基元 G 和条件基元 L; 5)形成待求解问题 P 的可拓模型 P =G·L。 3 方法实践 我们将职业学院毕业生求职问题作为应用实 践来说明本文所提方法的有效性。 为了实现智能引导,我们采用本课题组曾研究 过的 MVC 架构的人机界面 Agent [12] ,不同之处是领 域知识不一样。 文献[12]的知识库存放的是旅游 领域知识,本文则要存放职业信息。 我们搜集了国 家职业大典,部分信息如图 1 所示。 图 1 职业信息 Fig.1 Occupational information 这些信息是 Agent 处理用户目标的背景知识, 用 Excel 表存放在计算机中备用。 Agent 用 Java 技 术[13]开发,运行在 Web [14]环境下,系统采用开源的 Tomcat 服务器[15]和 MySQL 数据库[16] 。 3.1 引导目标和条件 为了使 Agent 引导用户输入目标,我们采用与 文献[17]相似的交互策略。 在输入界面给予示范, 引导用户输入问题信息,并灵活对待不同的问题。 假设 Agent 问:“您想应聘什么职位?”用户输入 某职位名称后,Agent 先检查国家职业大典 Excel 表 有无此职位,有则 Agent 可以转向引导用户输入,无 则要求用户进一步指明。 我们在实践中发现大致 有 3 种情形:1)用户有时输入错误;2) 用户输入的 职位名称不是职业大典使用的名称,但实际上语义 第 3 期 毛莉娜,等:利用智能引导和 KDML 增强可拓模型人机建模能力研究 ·351·
·352· 智能系统学报 第12卷 是一致的,比如用户输入“软件开发人员”,而职业 N0.=001198 大典中的“计算机与应用工程技术人员”的确解释 W_C=爱好 为“从事计算机硬件、软件、网络研究、设计、开发、 G_C=V [ai4 hao4] 调试、集成、维护和管理以及系统分析的工程技术 S_C=PlusFeeling|正面情感 人员”:3)职业大典未明确列出的新职位。对于这 E_C=一唱京戏,~跳舞,~书法,一滑冰,音乐~者 些情形,Agent巧妙地回答“我尚未发现此类职位, W_E=be fond of 它属于哪个大类?”同时列出职业大典的八大类职 G_E=V 业名称来请用户选择,并逐步引导至中类甚至小 S_E=PlusFeeling|正面情感 类,最后选项是“不便分类的其他从业人员”,至此 EE= 解决目标问题。 DEF={FondOf|喜欢} 目标明确后,Agent下一步又问“您目前有什么 工作经验或知识水平”,请用户输入个人资质条件, N0.=001202 比如“爱好编程”“会Java语言”等。 W_C=爱好 3.2KDML形式化 G_C=N [ai4 hao4] 对于五花八门的目标和条件,如“应聘软件开 S_C= 发人员”“爱好编程”等,本文提出用基于“知网”的 E_C=~广泛,不要因为你的~影响学习,仅凭~ 中文信息结构抽取方法进行处理,知网-中文信息 学习会偏科 结构库是Word文档,如图2所示。 W E=interest 目录 G E=N 一,信息结构模式及例子 S E= 1万物与部件 E_E= 1,1万物与部件的合成 1.2万物与部件的并列 DEF={emotion|情感:CoEvent={FondOf|喜 1.2.1万物的并列 欢} 1.2.2部件的并列 1.2.3万物与部件的紧缩并列 Agent此时需要在人机交互下消歧,在屏幕显 1.3万物与部件限定或修饰 示“爱好”的两个KDML语义表达式后问用户哪一 1.3.1万物的专指 1.3.2部件的整体 个“爱好”是符合语义的词,用户选出这里的“爱好” 1.3.3万物与部件的功能或性能 应该是动词(N0.=001198),因此Agent将“爱好- 1.3.4万物与部件的来源或归属 1.3.5万物与部件的材料 编程”中“爱好”名词消去,保留动词(同理将“编 1.3.6万物与部件的性状 1.3.7万物与部件的类型 程”动词消去,保留名词),再抽取信息结构:SYN_ 1.3.8万物与部件的数量与特指 S=V-->N,SEM_S=(事件,精神状态/变精神)--> 2属性 2.1属性的合成 [对象](万物/属性)(例子:爱好-音乐),并将结果 2.2属性的限定或修饰 显示给用户,通过人机交互更有效地确认形式化。 2.2.1属性的宿主 “会Java语言”的切分是“会-Java-语-言”(英 图2知网-中文信息结构库 语不用切分),组词得到“会-Java-语言”,“会”在知 Fig.2 HowNet-Chinese information structure libraries 网中有多个义项数,如: 我们采用文献[18]介绍的切分、组词、消歧和 DEF=BeAble|能够 中文语块抽取步骤,可以做到最后从文本中抽取到 DEF=ComeTogether|集聚 的不只是句法结构,更是语义结构)。如“爱好编 DEF=aValue|属性值,ability|能力,able|能, 程”的切分是“爱-好-编-程”,在知网知识库的支 desired|良 持下组词(本文采用知网中英双语知识词典.xt文 DEF=community|团体 件,存放在计算机中)得到“爱好-编程”,因为组词 DEF=fact事情 时可能会产生歧义8】,“爱好”可以是名词,也可以 DEF=fact事情,@communicate|交流 是动词(“编程”也是如此)。所以分别写出“爱好” DEF=meet|会面 的两个KDML语义表达式让用户确定: DEF=pay|付
是一致的,比如用户输入“软件开发人员”,而职业 大典中的“计算机与应用工程技术人员”的确解释 为“从事计算机硬件、软件、网络研究、设计、开发、 调试、集成、维护和管理以及系统分析的工程技术 人员”;3)职业大典未明确列出的新职位。 对于这 些情形,Agent 巧妙地回答“我尚未发现此类职位, 它属于哪个大类?” 同时列出职业大典的八大类职 业名称来请用户选择,并逐步引导至中类甚至小 类,最后选项是“不便分类的其他从业人员”,至此 解决目标问题。 目标明确后,Agent 下一步又问“您目前有什么 工作经验或知识水平”,请用户输入个人资质条件, 比如“爱好编程”“会 Java 语言”等。 3.2 KDML 形式化 对于五花八门的目标和条件,如“应聘软件开 发人员”“爱好编程”等,本文提出用基于“知网”的 中文信息结构抽取方法进行处理,知网-中文信息 结构库是 Word 文档,如图 2 所示。 图 2 知网-中文信息结构库 Fig.2 HowNet⁃Chinese information structure libraries 我们采用文献[18] 介绍的切分、组词、消歧和 中文语块抽取步骤,可以做到最后从文本中抽取到 的不只是句法结构,更是语义结构[18] 。 如“爱好编 程”的切分是“爱-好-编-程”,在知网知识库的支 持下组词(本文采用知网中英双语知识词典 .txt 文 件,存放在计算机中)得到“爱好-编程”,因为组词 时可能会产生歧义[18] ,“爱好”可以是名词,也可以 是动词(“编程”也是如此)。 所以分别写出“爱好” 的两个 KDML 语义表达式让用户确定: NO. = 001198 W_C =爱好 G_C =V [ai4 hao4] S_C = PlusFeeling 正面情感 E_C= ~唱京戏,~跳舞,~书法,~滑冰,音乐~者 W_E = be fond of G_E =V S_E = PlusFeeling 正面情感 E_E = DEF = {FondOf 喜欢} NO. = 001202 W_C =爱好 G_C =N [ai4 hao4] S_C = E_C = ~广泛,不要因为你的~影响学习,仅凭~ 学习会偏科 W_E = interest G_E =N S_E = E_E = DEF = {emotion 情 感: CoEvent = {FondOf 喜 欢}} Agent 此时需要在人机交互下消歧,在屏幕显 示“爱好”的两个 KDML 语义表达式后问用户哪一 个“爱好”是符合语义的词,用户选出这里的“爱好” 应该是动词(NO. = 001198),因此 Agent 将“爱好- 编程”中“爱好” 名词消去,保留动词(同理将“编 程”动词消去,保留名词),再抽取信息结构:SYN_ S =V--> N,SEM_S = (事件,精神状态/ 变精神) --> [对象] (万物/ 属性)(例子:爱好-音乐),并将结果 显示给用户,通过人机交互更有效地确认形式化。 “会 Java 语言”的切分是“会-Java-语-言” (英 语不用切分),组词得到“会-Java-语言”,“会”在知 网中有多个义项数,如: DEF =BeAble 能够 DEF =ComeTogether 集聚 DEF = aValue 属性值, ability 能力,able 能, desired 良 DEF = community 团体 DEF = fact 事情 DEF = fact 事情,@ communicate 交流 DEF =meet 会面 DEF = pay 付 ·352· 智 能 系 统 学 报 第 12 卷
第3期 毛莉娜,等:利用智能引导和K①ML增强可拓模型人机建模能力研究 ·353· DEF=time|时间 也无法为Agent准备有效的应对措施,目前只能输 DEF=time时间,important|主 出“抱歉”等字样来表明Agent无法引导某些问题。 DEF=understand领会 另外,在人机交互时如果用户对某词语的多个(比 DEF={modality|语气} 较接近的)义项理解有偏差,会导致计算机建立的 Agent根据自主性[9)排除了与求职者属性无关 可拓模型不符合现实逻辑的情况,这点只能由集体 的义项,保留了以下义项: 智慧[0来发现和纠正。 N0.=039130 4结束语 W_C=会 G_C=V 本文提出了利用KDML并结合人机界面Agent E_C= 的智能引导的方法增强计算机建立可拓模型能力, W E=grasp 本方法一方面减轻了计算机自然语言理解的困难, G_E=V 另一方面减少了语义歧义,计算机可以更快速有效 E_E= 地建模,从而为用计算机求解问题奠定了基础。 DEF=understand领会 如何评价所提方法的有效性?我们认为通过 据此抽取信息结构:SYN_S=V-->N,SEM_S= 集体智慧发表意见比较可行。每当建立了一个可 (事件)-->[受事](万物/部件/属性/时间)。 拓模型后,让其他人对结果进行评议,如果多数人 3.3转变为基元 认为建模成功,该次建模就有效。如果多数人认为 Aget引导了目标和条件,并对目标和条件用 建模不正确,该次建模就失败,这时就要分析原因, KDML规范形式化后,还需转变为基元。 进行改进,不断完善。 目标“应聘软件开发人员”根据句法表达式 建立了待求解问题的可拓模型,只是计算机协 SYN_S=V→N可以转变为事元A和物元M,物元M 助人们解决问题的第一步,后面的工作还很艰巨。 的属性值是计算机从“软件开发人员”的KDML表 因为“自然语言理解”这样对人来说不太困难的任 达式中抽取并填入的,属性名通过人机交互由用户 务,计算机都完成得相当困难,那么后面的“求解问 确定: 题”这样对人来说很不轻松的任务,计算机就更难 A=[应聘,支配对象,M] 解决了。然而我们认为,充分发挥人的智慧和机器 「软件开发人员, 领域, IT 智能进行人机交互,扬长避短,是利用计算机求解 M= 工作内容, A 问题的有效方法,是未来的研究方向。 A,=[编写,支配对象,程序] 参考文献: 条件“爱好编程”和“会Java语言”是求职者的 属性,用类似的方法转变为条件物元M1: [1]杨春燕,蔡文.可拓学[M].北京:科学出版社,2014: 「求职者C,爱好,编程 1-381. M,= 资质,A2」 [2]李卫华.Aget协助建立矛盾问题的可拓模型研究[J] 数学的实践与认识,2009,39(4):173-177. A2=[了解,支配对象,Java语言] LI Weihua.The research of extension model for contradiction 3.4形成待求解问题的可拓模型 problems with Agent[J].Mathematics in practice and 经过上述步骤,用户问题P“我爱好编程,会 theory,2009,39(4):173-177. Java语言,想应聘软件开发人员”被引导出,目标G= [3]汪中飞,李卫华,陶星.基于分类的E$GS矛盾问题建模 “应聘软件开发人员”,条件L=“爱好编程,会Java 的研究[J].广东工业大学学报,2014,31(4):14-19. 语言”,最后成功地建立为以下可拓模型P=G·L: WANG Zhongfei,LI Weihua,TAO Xing.Research on 「求职者C,爱好,编程] ESGS contradiction problem modeling based on classification P=[应聘,支配对象,M]· 资质,A2」 [J].Journal of Guangdong university of technology,2014, 31(4):14-19. 从我们的实践来看,Agent对特定问题的智能 [4]王定桥,李卫华,杨春燕。从用户需求语句建立问题可 引导还是有效的,因为我们对特定问题输人的目标 拓模型的研究[J].智能系统学报,2015,10(6): 或条件的可能性基本都估计到了。但是,对于过于 865-871. 广泛的问题,由于人本身无法预料全部输入,因此 WANG Dingqiao,LI Weihua,YANG Chunyan.Research
DEF = time 时间 DEF = time 时间,important 主 DEF = understand 领会 DEF = {modality 语气} Agent 根据自主性[19]排除了与求职者属性无关 的义项,保留了以下义项: NO. = 039130 W_C =会 G_C =V E_C = W_E = grasp G_E =V E_E = DEF = understand 领会 据此抽取信息结构:SYN_S = V-->N,SEM_S = (事件)-->[受事] (万物/ 部件/ 属性/ 时间)。 3.3 转变为基元 Agent 引导了目标和条件,并对目标和条件用 KDML 规范形式化后,还需转变为基元。 目标“ 应聘软件开发人员” 根据句法表达式 SYN_S =V→N 可以转变为事元 A 和物元 M,物元 M 的属性值是计算机从“软件开发人员”的 KDML 表 达式中抽取并填入的,属性名通过人机交互由用户 确定: A = [应聘,支配对象,M] M= 软件开发人员, 领域, IT 工作内容, A1 é ë ê ê ù û ú ú A1 = [编写,支配对象,程序] 条件“爱好编程”和“会 Java 语言”是求职者的 属性,用类似的方法转变为条件物元 M1 : M1 = 求职者 C, 爱好, 编程 资质, A2 é ë ê ê ù û ú ú A2 = [了解, 支配对象, Java 语言] 3.4 形成待求解问题的可拓模型 经过上述步骤,用户问题 P “ 我爱好编程,会 Java 语言,想应聘软件开发人员”被引导出,目标G = “应聘软件开发人员”,条件 L = “爱好编程,会 Java 语言”,最后成功地建立为以下可拓模型 P =G·L: P=[应聘, 支配对象, M]· 求职者 C, 爱好, 编程 资质, A2 é ë ê ê ù û ú ú 从我们的实践来看,Agent 对特定问题的智能 引导还是有效的,因为我们对特定问题输入的目标 或条件的可能性基本都估计到了。 但是,对于过于 广泛的问题,由于人本身无法预料全部输入,因此 也无法为 Agent 准备有效的应对措施,目前只能输 出“抱歉”等字样来表明 Agent 无法引导某些问题。 另外,在人机交互时如果用户对某词语的多个(比 较接近的)义项理解有偏差,会导致计算机建立的 可拓模型不符合现实逻辑的情况,这点只能由集体 智慧[20]来发现和纠正。 4 结束语 本文提出了利用 KDML 并结合人机界面 Agent 的智能引导的方法增强计算机建立可拓模型能力, 本方法一方面减轻了计算机自然语言理解的困难, 另一方面减少了语义歧义,计算机可以更快速有效 地建模,从而为用计算机求解问题奠定了基础。 如何评价所提方法的有效性? 我们认为通过 集体智慧发表意见比较可行。 每当建立了一个可 拓模型后,让其他人对结果进行评议,如果多数人 认为建模成功,该次建模就有效。 如果多数人认为 建模不正确,该次建模就失败,这时就要分析原因, 进行改进,不断完善。 建立了待求解问题的可拓模型,只是计算机协 助人们解决问题的第一步,后面的工作还很艰巨。 因为“自然语言理解”这样对人来说不太困难的任 务,计算机都完成得相当困难,那么后面的“求解问 题”这样对人来说很不轻松的任务,计算机就更难 解决了。 然而我们认为,充分发挥人的智慧和机器 智能进行人机交互,扬长避短,是利用计算机求解 问题的有效方法,是未来的研究方向。 参考文献: [1]杨春燕, 蔡文. 可拓学[M]. 北京: 科学出版社, 2014: 1-381. [2]李卫华. Agent 协助建立矛盾问题的可拓模型研究[ J]. 数学的实践与认识, 2009, 39(4): 173-177. LI Weihua. The research of extension model for contradiction problems with Agent[J]. Mathematics in practice and theory, 2009, 39(4): 173-177. [3]汪中飞, 李卫华, 陶星. 基于分类的 ESGS 矛盾问题建模 的研究[J]. 广东工业大学学报, 2014, 31(4): 14-19. WANG Zhongfei, LI Weihua, TAO Xing. Research on ESGS contradiction problem modeling based on classification [J]. Journal of Guangdong university of technology, 2014, 31(4): 14-19. [4]王定桥, 李卫华, 杨春燕. 从用户需求语句建立问题可 拓模 型 的 研 究 [ J]. 智 能 系 统 学 报, 2015, 10 ( 6 ): 865-871. WANG Dingqiao, LI Weihua, YANG Chunyan. Research 第 3 期 毛莉娜,等:利用智能引导和 KDML 增强可拓模型人机建模能力研究 ·353·
·354 智能系统学报 第12卷 on building an extension model from user requirements[J] [I6]KOFLER M.MySQL5权威指南[M].杨晓云,王建桥, CAAI transactions on intelligent systems,2015,10(6): 杨涛,等,译.北京:人民邮电出版社,2006:1-662 865-871」 [17]李卫华,杨春燕,方卓君.提高软件Agent策略生成的 [5]赵杰,李卫华.基于知网的矛盾问题语义二义性研究 语义互操作能力[J].数学的实践与认识,2012,42 [].广东工业大学学报,2014,31(2):21-26. (11):131-138. ZHAO Jie,LI Weihua.Research on the ambiguity of LI Weihua,YANG Chunyan,FANG Zhuojun.Improve the contradiction based on hownet [J].Journal of Guangdong semantic interoperability for software Agents strategy university of technology,2014,31(2):21-26. generation[J].Mathematics in practice and theory,2012, [6]董振东,董强.知网[EB/OL].http://www.keenage.com/ 42(11):131-138. zhiwang/c_zhiwang.Html. [18]董强,郝长伶,董振东.基于《知网》的中文语块抽取器 [7]KDML.知网知识系统描述语言[EB/OL].htp://ww [C]//语言计算与基于内容的文本处理一全国第七 keenage.com/html/c_index.Html. [8]郝长伶,董强.知网知识库描述语言[C]/语言计算与 届计算语言学联合学术会议论文集.哈尔滨:中国中文 基于内容的文本处理一全国第七届计算语言学联合 信息学会,2003:234-239. 学术会议论文集.哈尔滨:中国中文信息学会,2003: DONG Qiang,HAO Changling,DONG Zhendong.HowNet- 371-377. based Chinese chunk extractor[C]//Language Computing HAO Changling,DONG Qiang.Knowledge database mark- and Content Based Text Processing,Proceedings of the 7th up language of HowNet C]//Language Computing and National Joint Academic Conference on Computational Content Based Text Processing,Proceedings of the 7th Linguistics.Harbin,China,2003:234-239. National Joint Academic Conference on Computational [19]WOOLDRIDGE M.多Agent系统引论[M].石纯一,译. Linguistics.Harbin,2003:371-377. 北京:电子工业出版社,2003:1-258. [9]董强,郝长伶,董振东.基于知网的中文信息结构抽取 [20]庄子匀,陈敬良,罗尧成.网络集体智慧研究述评[J]. [EB/OL].http://www.keenage.com/html/c_index.html. 情报杂志,2014,33(5):31-37. [10]董振东,董强.关于知网-中文信息结构库[EB/OL] ZHUANG Ziyun,CHEN Jingliang,LUO Yaocheng.A http://www.keenage.com/html/c_index.html. review on web-enabled collective intelligence[]Journal of [11]陶星.基于知网的领域可拓基础库的研究与实现[D]. intelligence,2014,33(5):31-37 广州:广东工业大学,2015:1-61. 作者简介: TAO Xing.Research and implementation of extension 毛莉娜,女,1988年生,讲师,主要 domain base on HowNet [D].Guangzhou:Guangdong 研究方向为自动控制技术、计算机技 University of Technology,2015:1-61. 术、电子工程技术。主持广东省发明专 [12]方卓君.基于Agent的用户信息智能引导的研究[D] 利产业化重点项目1项、江西省重点研 广州:广东工业大学,2010:1-54. 发计划项目1项,参与国家自然科学基 FANG Zhuojun.Research on Agent-based intelligent guide 金项目2项,其他项目多项。发表学术 for user information[D].Guangzhou:Guangdong University of Technology,2010:1-54. 论文8篇。 [I3]李卫华.Java技术及其应用[M].北京:清华大学出版 李卫华,女,1957年生,教授,主要 社.2009:1-281. [l4]刘甫迎,饶斌,郑显举,等.Java EE Web编程技术教 研究方向为智能软件、面向Agent计算、 网络信息系统。主持广东省自然科学 程[M].北京:电子工业出版社,2010:1-374 基金项目3项,参与国家自然科学基金 [l5]孙卫琴.Tomcat与Java Web开发技术详解[M].2版 项目2项。发表学术论文40余篇。 北京:电子工业出版社,2009:1-734
on building an extension model from user requirements[ J]. CAAI transactions on intelligent systems, 2015, 10 ( 6): 865-871. [5]赵杰, 李卫华. 基于知网的矛盾问题语义二义性研究 [J]. 广东工业大学学报, 2014, 31(2): 21-26. ZHAO Jie, LI Weihua. Research on the ambiguity of contradiction based on hownet [ J]. Journal of Guangdong university of technology, 2014, 31(2): 21-26. [6]董振东, 董强. 知网[EB/ OL]. http: / / www.keenage.com/ zhiwang / c_zhiwang.Html. [7]KDML. 知网知识系统描述语言[EB/ OL]. http: / / www. keenage.com/ html / c_index.Html. [8]郝长伶, 董强. 知网知识库描述语言[C] / / 语言计算与 基于内容的文本处理———全国第七届计算语言学联合 学术会议论文集. 哈尔滨: 中国中文信息学会, 2003: 371-377. HAO Changling, DONG Qiang. Knowledge database mark- up language of HowNet [ C ] / / Language Computing and Content Based Text Processing, Proceedings of the 7th National Joint Academic Conference on Computational Linguistics. Harbin, 2003: 371-377. [9]董强, 郝长伶, 董振东. 基于知网的中文信息结构抽取 [EB/ OL]. http: / / www.keenage.com/ html / c_index.html. [10]董振东, 董强. 关于知网-中文信息结构库[EB/ OL]. http: / / www.keenage.com/ html / c_index.html. [11]陶星. 基于知网的领域可拓基础库的研究与实现[D]. 广州: 广东工业大学, 2015: 1-61. TAO Xing. Research and implementation of extension domain base on HowNet [ D]. Guangzhou: Guangdong University of Technology, 2015: 1-61. [12]方卓君. 基于 Agent 的用户信息智能引导的研究[D]. 广州: 广东工业大学, 2010: 1-54. FANG Zhuojun. Research on Agent⁃based intelligent guide for user information[D].Guangzhou: Guangdong University of Technology, 2010: 1-54. [13]李卫华. Java 技术及其应用[M]. 北京: 清华大学出版 社, 2009: 1-281. [14]刘甫迎, 饶斌, 郑显举, 等. Java EE Web 编程技术教 程[M]. 北京: 电子工业出版社, 2010: 1-374. [15]孙卫琴. Tomcat 与 Java Web 开发技术详解[M]. 2 版. 北京: 电子工业出版社, 2009: 1-734. [16]KOFLER M. MySQL 5 权威指南[M]. 杨晓云, 王建桥, 杨涛, 等, 译. 北京: 人民邮电出版社, 2006: 1-662. [17]李卫华, 杨春燕, 方卓君. 提高软件 Agent 策略生成的 语义互操作能力[ J]. 数学的实践与认识, 2012, 42 (11): 131-138. LI Weihua, YANG Chunyan, FANG Zhuojun. Improve the semantic interoperability for software Agents strategy generation[J]. Mathematics in practice and theory, 2012, 42(11): 131-138. [18]董强, 郝长伶, 董振东. 基于《知网》的中文语块抽取器 [C] / / 语言计算与基于内容的文本处理———全国第七 届计算语言学联合学术会议论文集. 哈尔滨: 中国中文 信息学会, 2003: 234-239. DONG Qiang, HAO Changling, DONG Zhendong. HowNet⁃ based Chinese chunk extractor[C] / / Language Computing and Content Based Text Processing, Proceedings of the 7th National Joint Academic Conference on Computational Linguistics. Harbin, China, 2003: 234-239. [19]WOOLDRIDGE M. 多 Agent 系统引论[M]. 石纯一, 译. 北京: 电子工业出版社, 2003: 1-258. [20]庄子匀, 陈敬良, 罗尧成. 网络集体智慧研究述评[ J]. 情报杂志, 2014, 33(5): 31-37. ZHUANG Ziyun, CHEN Jingliang, LUO Yaocheng. A review on web⁃enabled collective intelligence[J] Journal of intelligence, 2014, 33(5): 31-37. 作者简介: 毛莉娜,女,1988 年生,讲师,主要 研究方向为自动控制技术、计算机技 术、电子工程技术。 主持广东省发明专 利产业化重点项目 1 项、江西省重点研 发计划项目 1 项,参与国家自然科学基 金项目 2 项,其他项目多项。 发表学术 论文 8 篇。 李卫华,女,1957 年生,教授,主要 研究方向为智能软件、面向 Agent 计算、 网络信息系统。 主持广东省自然科学 基金项目 3 项,参与国家自然科学基金 项目 2 项。 发表学术论文 40 余篇。 ·354· 智 能 系 统 学 报 第 12 卷