正在加载图片...
第5期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·795. 这样清楚直观的表示后,可以方便计算机理解 现并未存放“华师”这一信息物元的具体信息。通 并处理此语义关系,即可清晰的表达出具有清晰的 过与知识库中的基元比较,得出结果如下: 语义互操作性的信息元。 华中师范大学,collegeID, 10511 4.3实验结果 collegeLevel, 应用前面所讨论的理论知识,考虑到关系型数 collegeLocation, 据库具有查询、插入、修改和删除操作的简洁性,从 M1= scienceScore, 湖北武汉 执行效率和成本角度考虑,本文使用关系型数据库 artScore, 533 建立教育领域的概念体系。本文使用的是SQL year, 2014 Server Express关系型数据库。 华南师范大学, collegelD 10574 知网是一个较为完整的知识系统,且具有语义 collegeLevel, 1 可操作性。所以,将知网2000知识库存入SQL collegeLocation, 广东广州 Server2012 Express数据库中,数据库名为: M2= scienceScore, 560 Extenics_HowNet,.并提取其中关于“教育”的所有词 artScore, 579 汇,共6O6条记录,建立表:Edu_HowNet。.再按照 year, 2014 G_C属性值的不同,分别建立Edu_HowNet_N, T华东师范大学,collegelD, 10269 Edu_HowNet_V,Edu_HowNet._ADJ3张表,如图3 collegeLevel. 1 所示。 collegeLocation, 上海 M3= a▣dbo.Edu_Extenics scienceScore, 423 日口列 artScore, 444 objID(PK,nchar(10).not null) year, 2014 objName(nvarchar(50),null) 数据库中查询结果如图4所示。 synonymobj(nvarchar(50),null) 口结果白消息 isKindOfobj(nvarchar(50),null) 6 bjID ob调t symonymobj isKindofobj isPartofobj isPartOfObj(nvarchar(50),null) 00001华南师范大学华师 场所 大学 2 00002华中师范大学华师 场所 大学 田□键 3 00003华东师范大学华师 场所 大学 田□约束 图4查询结果 田☐触发器 Fig.4 Result of query 田白素引 田□统计信息 于是,可以将计算结果:“华中师范大学”,“华 南师范大学”,“华东师范大学”推送给用户。再通 图3信息元表结构 过与用户的交互与反馈,确定哪所“华师”,从而消 Fig.3 Table of information element 除语义模糊,以达到理解用户意图的目的。 如何才能证明计算机是否能理解我们的语义关 系呢?本文主要通过基元语义相似度算法来判断。 5结束语 如果算法的输入结果在可接受范围内,就可以判定 本文基于知网这个通用的语义知识库,借助知 该领域信息元库具有语义互操作性。 网义原表达方式,解决概念语义二义性问题并提出 在可拓信息-知识-策略形式化体系研究过程 了一种建立可拓领域信息元库的创建方法,并以教 中,一个待求解问题最初可能是用自然语言表达的 育领域的高考信息咨询问题为例,用计算机实现了 信息,如果自然语言存在二义性,计算机无法识别, 该建库方法,验证了该方法可行性,得到了可接受的 就无法对该问题建立正确的可拓模型,更无法进一 结论。这个基础工作的完成对今后可拓策略生成系 步处理。假设一个考生想要报考华师,但是在知识 统解决教育领域矛盾问题有重要意义。 库中并没有“华师”这个基元,所以,利用文献[12] 的词汇相关度算法,找出所有与其相关的词语。 参考文献: 首先,建立“华师”信息物元, [1]杨春燕,蔡文.可拓工程[M].北京:科学出版社, [学校,isKindOf, 场所 M= 2007:1-10. hasInstanceOf, 华师」 YANG Chunyan,CAI Wen.Extension engineering[M]. 然后,在信息元库中查询相应信息物元信息,发 Beijing:Science Press,2007:1-10.这样清楚直观的表示后,可以方便计算机理解 并处理此语义关系,即可清晰的表达出具有清晰的 语义互操作性的信息元。 4.3 实验结果 应用前面所讨论的理论知识,考虑到关系型数 据库具有查询、插入、修改和删除操作的简洁性,从 执行效率和成本角度考虑,本文使用关系型数据库 建立教育领域的概念体系[11] 。 本文使用的是 SQL Server Express 关系型数据库。 知网是一个较为完整的知识系统,且具有语义 可操作 性。 所 以, 将 知 网 2000 知 识 库 存 入 SQL Server 2012 Express 数 据 库 中, 数 据 库 名 为: Extenics_HowNet,并提取其中关于“教育”的所有词 汇,共 606 条记录,建立表:Edu _HowNet。 再按照 G_C 属 性 值 的 不 同, 分 别 建 立 Edu _ HowNet _ N, Edu_HowNet_V,Edu _HowNet _ADJ 3 张表,如图 3 所示。 图 3 信息元表结构 Fig.3 Table of information element 如何才能证明计算机是否能理解我们的语义关 系呢? 本文主要通过基元语义相似度算法来判断。 如果算法的输入结果在可接受范围内,就可以判定 该领域信息元库具有语义互操作性。 在可拓信息-知识-策略形式化体系研究过程 中,一个待求解问题最初可能是用自然语言表达的 信息,如果自然语言存在二义性,计算机无法识别, 就无法对该问题建立正确的可拓模型,更无法进一 步处理。 假设一个考生想要报考华师,但是在知识 库中并没有“华师”这个基元,所以,利用文献[12] 的词汇相关度算法,找出所有与其相关的词语。 首先,建立“华师”信息物元, M = 学校, isKindOf, 场所 hasInstanceOf, 华师 é ë ê ê ù û ú ú 然后,在信息元库中查询相应信息物元信息,发 现并未存放“华师”这一信息物元的具体信息。 通 过与知识库中的基元比较,得出结果如下: M1 = 华中师范大学, collegeID, 10511 collegeLevel, 1 collegeLocation, scienceScore, 湖北武汉 artScore, 533 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú M2 = 华南师范大学, collegeID, 10574 collegeLevel, 1 collegeLocation, 广东广州 scienceScore, 560 artScore, 579 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú M3 = 华东师范大学, collegeID, 10269 collegeLevel, 1 collegeLocation, 上海 scienceScore, 423 artScore, 444 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú 数据库中查询结果如图 4 所示。 图 4 查询结果 Fig.4 Result of query 于是,可以将计算结果:“华中师范大学”,“华 南师范大学”,“华东师范大学” 推送给用户。 再通 过与用户的交互与反馈,确定哪所“华师”,从而消 除语义模糊,以达到理解用户意图的目的。 5 结束语 本文基于知网这个通用的语义知识库,借助知 网义原表达方式,解决概念语义二义性问题并提出 了一种建立可拓领域信息元库的创建方法,并以教 育领域的高考信息咨询问题为例,用计算机实现了 该建库方法,验证了该方法可行性,得到了可接受的 结论。 这个基础工作的完成对今后可拓策略生成系 统解决教育领域矛盾问题有重要意义。 参考文献: [1] 杨春燕, 蔡文. 可拓工程 [ M]. 北京: 科学出版社, 2007: 1⁃10. YANG Chunyan, CAI Wen. Extension engineering [ M]. Beijing: Science Press, 2007: 1⁃10. 第 5 期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·795·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有