正在加载图片...
·1172· 智能系统学报 第15卷 些给定的查询g可以得到一些语义相关结果。 6结束语 本文使用准确率P来评估查询效果,计算公式为 P=H(OOR(O) 针对现有空间关键字查询处理模式仅支持位 (11) Vol 置相近和文本匹配,但未考虑语义信息,且不能 式中:I(q)是距离查询q最近的top-k个对象的理 处理数值属性的问题,提出了一种支持语义近似 想集合;R(q)是本文提出算法所返回的结果集。 查询处理的空间关键字查询方法。本文研究了通 这里,为了获取更具有鲁棒性的准确率,将返回 过Word Embedding中的Skip-gram模型来实现空 结果数设置为100。由图10可知:当x<0.55时, 间对象的语义近似查询的方法,并且利用Sky- 准确率随着字符串相似度的增大而增大;当τ≥ Iine查询方法实现了查询结果的个性化。实验结 0.55时,准确率不再发生改变并保持在85%左右。 果表明,本文提出的算法不仅支持空间关键字的 精确匹配,支持语义近似查询和形式上的近似匹 6500 6000 配,且能处理文本信息中的数值属性,这样更符 5500 合用户查询要求,在一定程度上提高了用户体验 4500 以及满意度。 400 在未来的工作中,将会利用深度学习的方法 23500 3000 研究路网上的移动对象的集合关键字查询。 2500 2000 2 468101214161820 参考文献: 0 IDW万 [1]LU Ying,LU Jiacheng,CONG Gao,et al.Efficient al- 图9D与构建索引所用时间的关系 gorithms and cost models for reverse spatial-keyword k- Fig.9 Relationship between D and the time taken to build nearest neighbor search[J.ACM transactions on database the index systems..2014,39(2:13 1.00·AR [2]DE FELIPE I.HRISTIDIS V,RISHE N.Keyword search 0.95 on spatial databases[C]//Proceedings of 2008 IEEE 24th 0.90 International Conference on Data Engineering.Cancun, 是085 Mexico:IEEE,2008:656-665. 0.80 [3]ZHANG Chengyuan,ZHANG Ying,ZHANG Wenjie,et 0.75 al.Inverted linear quadtree:efficient top K spatial keyword search[J].IEEE transactions on knowledge and data engin- 0.700002030.4050.60.7080.91.0 eering,2016,28(7):1706-1721. [4]BECKMANN N,KRIEGEL H P,SCHNEIDER R,et al. 图10π与查询准确率的关系 The R*-tree:an efficient and robust access method for Fig.10 Effect of r on the query accuracy points and rectangles[J].ACM SIGMOD record,1990, 3)k与查询准确率的关系 19(2):322-331 通过设置k来查看其对查询准确率的影响, [5]ZHANG Dongxiang,OOI B C,TUNG A K H.Locating 本文设置k区间为[10,100],步长为10。由图11 mapped resources in web 2.0[C]//Proceedings of 2010 可知,本文所提算法AIR-Tree较IR-Tree、IRS- IEEE 26th International Conference on Data Engineering Tree分别在准确率上提高了10.14%和16.15%。 (ICDE 2010).Long Beach,USA:IEEE,2010:521-532. [6]LI Feifei,YAO Bin,TANG Mingwang,et al.Spatial ap- 100 -A proximate string search[J].IEEE transactions on know- 90 RS ledge and data engineering,2013,25(6):1394-1409. [7]ROCHA-JUNIOR J B,VLACHOU A,DOULKERIDIS C, 70 et al.Efficient processing of top-k spatial preference quer- 60 ies[J].Proceedings of the VLDB endowment,2010,4(2): 50 93-104. 401 102030405060708090100 [8]YAO Bao,LI Feifei,HADJIELEFTHERIOU M,et al.Ap- proximate string search in spatial databases[Cl//Proceed- 图11k与查询准确率的关系 ings of 2010 IEEE 26th International Conference on Data Fig.11 Effect of k on the query accuracy Engineering.Long Beach,CA,USA:IEEE,2010:些给定的查询 q 可以得到一些语义相关结果。 本文使用准确率 P 来评估查询效果,计算公式为 P = |I(q)∩R(q)| |I(q)| (11) 式中:I(q) 是距离查询 q 最近的 top-k 个对象的理 想集合;R(q) 是本文提出算法所返回的结果集。 这里,为了获取更具有鲁棒性的准确率,将返回 结果数设置为 100。由图 10 可知:当 τ<0.55 时, 准确率随着字符串相似度的增大而增大;当 τ≥ 0.55 时,准确率不再发生改变并保持在 85% 左右。 |D|/万 构建时间/ms AIR IRS IR 2 4 6 8 10 12 14 16 18 20 6 500 6 000 5 500 5 000 4 500 4 000 3 500 3 000 2 500 2 000 0 图 9 |D|与构建索引所用时间的关系 Fig. 9 Relationship between |D| and the time taken to build the index τ 准确率 AIR 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 图 10 τ 与查询准确率的关系 Fig. 10 Effect of τ on the query accuracy 3) k 与查询准确率的关系 通过设置 k 来查看其对查询准确率的影响, 本文设置 k 区间为 [10, 100],步长为 10。由图 11 可知,本文所提算法 AIR-Tree 较 IR-Tree、IRS￾Tree 分别在准确率上提高了 10.14% 和 16.15%。 k 准确度 AIR IRS IR 100 90 80 70 60 50 40 10 20 30 40 50 60 70 80 90 100 图 11 k 与查询准确率的关系 Fig. 11 Effect of k on the query accuracy 6 结束语 针对现有空间关键字查询处理模式仅支持位 置相近和文本匹配,但未考虑语义信息,且不能 处理数值属性的问题,提出了一种支持语义近似 查询处理的空间关键字查询方法。本文研究了通 过 Word Embedding 中的 Skip-gram 模型来实现空 间对象的语义近似查询的方法,并且利用 Sky￾line 查询方法实现了查询结果的个性化。实验结 果表明,本文提出的算法不仅支持空间关键字的 精确匹配,支持语义近似查询和形式上的近似匹 配,且能处理文本信息中的数值属性,这样更符 合用户查询要求,在一定程度上提高了用户体验 以及满意度。 在未来的工作中,将会利用深度学习的方法 研究路网上的移动对象的集合关键字查询。 参考文献: LU Ying, LU Jiacheng, CONG Gao, et al. Efficient al￾gorithms and cost models for reverse spatial-keyword k￾nearest neighbor search[J]. ACM transactions on database systems, 2014, 39(2): 13. [1] DE FELIPE I, HRISTIDIS V, RISHE N. Keyword search on spatial databases[C]//Proceedings of 2008 IEEE 24th International Conference on Data Engineering. Cancun, Mexico: IEEE, 2008: 656−665. [2] ZHANG Chengyuan, ZHANG Ying, ZHANG Wenjie, et al. Inverted linear quadtree: efficient top K spatial keyword search[J]. IEEE transactions on knowledge and data engin￾eering, 2016, 28(7): 1706–1721. [3] BECKMANN N, KRIEGEL H P, SCHNEIDER R, et al. The R*-tree: an efficient and robust access method for points and rectangles[J]. ACM SIGMOD record, 1990, 19(2): 322–331. [4] ZHANG Dongxiang, OOI B C, TUNG A K H. Locating mapped resources in web 2.0[C]//Proceedings of 2010 IEEE 26th International Conference on Data Engineering (ICDE 2010). Long Beach, USA: IEEE, 2010: 521−532. [5] LI Feifei, YAO Bin, TANG Mingwang, et al. Spatial ap￾proximate string search[J]. IEEE transactions on know￾ledge and data engineering, 2013, 25(6): 1394–1409. [6] ROCHA-JUNIOR J B, VLACHOU A, DOULKERIDIS C, et al. Efficient processing of top-k spatial preference quer￾ies[J]. Proceedings of the VLDB endowment, 2010, 4(2): 93–104. [7] YAO Bao, LI Feifei, HADJIELEFTHERIOU M, et al. Ap￾proximate string search in spatial databases[C]//Proceed￾ings of 2010 IEEE 26th International Conference on Data Engineering. Long Beach, CA, USA: IEEE, 2010: [8] ·1172· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有