正在加载图片...
第2期 胡文彬,等:模式匹配不确定性的多因素集结度量 ·291· 表42种方案下的模式匹配的不确定率 [2]MAGNANI M,RIZOPOULOS N,BRIEN P,et al.Schema Table 4 Uncertainty ratio of schema matching from two integration based on uncertain semantic mappings[J].Lec- projects ture Notes in Computer Science,2005(3716):31-46. 第1种方案 第2种方案 [3]HALEVY A,RAJARAMAN A,ORDILLE J.Data integra- USM 41=0 41=0.34 tion:the teenage years[Z].Seoul,2006:9-16. UAM u3=0.21 [4]翁年凤,刁兴春,曹建军,等.不确定模式匹配研究综述 43=0.95 [J刀.计算机科学,2011,38(12):1-5. DP 43=0.17 43=0.17 WENG Nianfeng,DIAO Xingchun,CHAO Jianjun,et al. 总计 ubh.=0.19 Mwbole =0.72 Survey of uncertain schema matching[J].Computer Sci- 4.2分析 ence,2011,38(12):1-5. 第1种方案中,首先通过S0C处理后,匹配规模 [5]姜芳艽,孟小峰,贾琳琳.Deep Web集成服务的不确定 比2中降低50%。2个模式的模式对象名语义相同, 模式匹配[J].计算机学报,2008,31(8):1412-1421. 因此μ,=0。属性匹配中只有属性名匹配具有不确定 JIANG Fangjiao,MENG Xiaofeng,JIA Linlin.Uncertain 性。决策过程中的不确定率随模式匹配规模的减小 schema matching in deep web integration service[J].Chi- 而降低,利用公式计算得到的u值符合实际情况。 nese Journal of Computers,2008,31(8):1412-1421. [6]MAGNANI M,MONTESI D.Probabilistic data integration 第2种方案中,模式对象规模和属性匹配的规模突然 [R].Bologna(italy):UBLCS,2009. 增大,通过S0C的处理后,匹配规模降低了近1/10, [7]DONG X L,HALEVY A,YU CONG.Data integration with 同时计算效率也明显提高,不确定率随匹配规模增大 uncertainty[J].The VLDB Journal,2009,18:469-500. 而增大符合不确定性度量的基本准则。实验表明度 [8]AVIGDOR G.Managing uncertainty in schema matching 量模式匹配不确定性的模型和不确定率计算方法具 with top-k schema mappings[J].Journal on Data Seman- 有可行性、有效性、可扩展性和高效性。 tics,2006,6:90-114. [9]LIU Baoding.Uncertainty theory[M].Berlin:Springer-Ver- 5 结束语 1ag,2007:3-12. 模式匹配的不确定性研究是国际上相关领域近 [10]LIU Baoding.Some research problems in uncertainty theory [J].Journal of Uncertain Systems,2009,3(1):3-10. 年来才兴起的热点研究方向,度量原始匹配的不确 [11]王永利,钱江波,孙淑荣.AMUR:一种RFID数据不确 定性是关键问题。本文根据模式匹配中产生不确定 定性的自适应度量算法[J].电子学报,2011,39(3): 性的主要因素,首次将全知嫡不确定率和过程不确 579-584 定率结合起来,并证明模式匹配的全知熵不确定率 WANG Yongli,QIAN Jiangbo,SUN Shurong.AMUR:an 满足粗糙集不确定性度量的基本准则,提出了一个 adaptive measuring algorithm of underlying uncertainty for 多因素集结的模式匹配不确定性度量模型,利用集 rfid data[J].Chinese of Journal Electronics,2011,39 结算子判断各不确定性因素对模式匹配不确定性的 (3):579-584 影响程度和合成各阶段的度量结果,实验证明本文 [12]PAWLAL Z.Rough sets[J].International Journal of Com- 提出的方法与已有方法相比可获得更加合理的度量 puter and Information Science,1982,11(5):341-356. 结果。所提模型解决了不确定性度量中规模限制问 [13]QIU Taorong,YOU Min,GE Hanjuan,et al.A method of 题,使得大规模模式匹配不确定性的处理复杂度降 uncertainty measure based on rough set[Z].2008:544- 547 低。下一步的工作将探讨动态环境下模式匹配不确 [14]JIANG Feng,SUI Yuefei,CAO Cungen.An information 定性的度量方法及其处理过程中不确定性传播的测 entropy-based approach to outlier detection in rough sets 算方法。 [J].Expert Systems with Applications,2010,37(9): 参考文献: 6338-6344. [15]LIANG Jiye,WANG Junhong,QIAN Yuhua.A new meas- [1]SHVAIKO P,EUZENAT J.A survey of schema-based matc- ure of uncertainty based on knowledge granulation for rough hing approaches[J].Journal on Data Semantics IV,2005 sets[]].Information Sciences,2009,179(4):458-470. (3730):146-171 [16]IFTIKHAR-U S,ARYYA G.Managing uncertainty in loca-表 4 2 种方案下的模式匹配的不确定率 Table 4 Uncertainty ratio of schema matching from two projects 第 1 种方案 第 2 种方案 USM μ1 = 0 μ1 = 0.34 UAM μ2 = 0.21 μ2 = 0.95 DP μ3 = 0.17 μ3 = 0.17 总计 μwhole = 0.19 μwhole = 0.72 4.2 分析 第 1 种方案中,首先通过 SOC 处理后,匹配规模 比[2]中降低 50%。 2 个模式的模式对象名语义相同, 因此 μ1 = 0。 属性匹配中只有属性名匹配具有不确定 性。 决策过程中的不确定率随模式匹配规模的减小 而降低,利用公式计算得到的 μwhole值符合实际情况。 第 2 种方案中,模式对象规模和属性匹配的规模突然 增大,通过 SOC 的处理后,匹配规模降低了近 1/ 10, 同时计算效率也明显提高,不确定率随匹配规模增大 而增大符合不确定性度量的基本准则。 实验表明度 量模式匹配不确定性的模型和不确定率计算方法具 有可行性、有效性、可扩展性和高效性。 5 结束语 模式匹配的不确定性研究是国际上相关领域近 年来才兴起的热点研究方向,度量原始匹配的不确 定性是关键问题。 本文根据模式匹配中产生不确定 性的主要因素,首次将全知熵不确定率和过程不确 定率结合起来,并证明模式匹配的全知熵不确定率 满足粗糙集不确定性度量的基本准则,提出了一个 多因素集结的模式匹配不确定性度量模型,利用集 结算子判断各不确定性因素对模式匹配不确定性的 影响程度和合成各阶段的度量结果,实验证明本文 提出的方法与已有方法相比可获得更加合理的度量 结果。 所提模型解决了不确定性度量中规模限制问 题,使得大规模模式匹配不确定性的处理复杂度降 低。 下一步的工作将探讨动态环境下模式匹配不确 定性的度量方法及其处理过程中不确定性传播的测 算方法。 参考文献: [1]SHVAIKO P, EUZENAT J. A survey of schema⁃based matc⁃ hing approaches[ J]. Journal on Data Semantics IV, 2005 (3730): 146⁃171. [2]MAGNANI M, RIZOPOULOS N, BRIEN P, et al. Schema integration based on uncertain semantic mappings[ J]. Lec⁃ ture Notes in Computer Science, 2005(3716): 31⁃46. [3]HALEVY A, RAJARAMAN A, ORDILLE J. Data integra⁃ tion:the teenage years[Z]. Seoul, 2006: 9⁃16. [4]翁年凤,刁兴春,曹建军,等. 不确定模式匹配研究综述 [J]. 计算机科学, 2011, 38(12): 1⁃5. WENG Nianfeng, DIAO Xingchun, CHAO Jianjun, et al. Survey of uncertain schema matching [ J]. Computer Sci⁃ ence, 2011, 38(12): 1⁃5. [5]姜芳艽,孟小峰,贾琳琳. Deep Web 集成服务的不确定 模式匹配[J]. 计算机学报, 2008, 31(8): 1412⁃1421. JIANG Fangjiao, MENG Xiaofeng, JIA Linlin. Uncertain schema matching in deep web integration service[ J]. Chi⁃ nese Journal of Computers, 2008, 31(8): 1412⁃1421. [6] MAGNANI M, MONTESI D. Probabilistic data integration [R]. Bologna(italy): UBLCS, 2009. [7]DONG X L, HALEVY A, YU CONG. Data integration with uncertainty[J]. The VLDB Journal, 2009, 18: 469⁃500. [8] AVIGDOR G. Managing uncertainty in schema matching with top⁃k schema mappings[ J]. Journal on Data Seman⁃ tics, 2006, 6: 90⁃114. [9]LIU Baoding. Uncertainty theory[M]. Berlin: Springer⁃Ver⁃ lag, 2007: 3⁃12. [10]LIU Baoding. Some research problems in uncertainty theory [J]. Journal of Uncertain Systems, 2009, 3(1): 3⁃10. [11]王永利,钱江波,孙淑荣. AMUR:一种 RFID 数据不确 定性的自适应度量算法[ J]. 电子学报, 2011, 39(3): 579⁃584. WANG Yongli, QIAN Jiangbo, SUN Shurong. AMUR: an adaptive measuring algorithm of underlying uncertainty for rfid data [ J]. Chinese of Journal Electronics, 2011, 39 (3): 579⁃584. [12]PAWLAL Z. Rough sets[J]. International Journal of Com⁃ puter and Information Science, 1982, 11(5): 341⁃356. [13]QIU Taorong, YOU Min, GE Hanjuan, et al. A method of uncertainty measure based on rough set [ Z]. 2008: 544⁃ 547. [14] JIANG Feng, SUI Yuefei, CAO Cungen. An information entropy⁃based approach to outlier detection in rough sets [J]. Expert Systems with Applications, 2010, 37 ( 9): 6338⁃6344. [15]LIANG Jiye, WANG Junhong, QIAN Yuhua. A new meas⁃ ure of uncertainty based on knowledge granulation for rough sets[J]. Information Sciences, 2009, 179(4): 458⁃470. [16]IFTIKHAR⁃U S, ARYYA G. Managing uncertainty in loca⁃ 第 2 期 胡文彬,等:模式匹配不确定性的多因素集结度量 ·291·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有