正在加载图片...
·1166· 智能系统学报 第15卷 下,如果用户对价格的在意程度较低,则三者中 信息以及用户对数值信息的重视程度,对于空间 最优的查询结果应该是02,反之,最优的查询结 关键字查询也至关重要,并且其处理方法与文本 果应该是。由此可见,空间对象中包含的数值 关键字的匹配处理方法完全不同。 表2空间对象的文本和数值属性信息 Table 2 Text and numerical attribute information for spatial objects 空间对象 数值属性 位置信息(latitude,longitude) 文本属性keywords 噪声 价格 拥挤度 01 (33.3306902,-111.9785992) pizza,steak 0.3 0.5 0.7 0% (41.1195346.-81.4756898) chicken,McDonald 0.2 0.6 0.4 03 (33.5249025,-112.1153098) tea,coffee 0.3 0.4 0.5 04 (40.2916853,-80.1048999) chicken,McDonald 0.5 0.3 0.6 05 (33.3831468,-111.9647254) shopping,market 0.8 0.7 0.9 06 (48.7272.9.14795) bar.beer.chicken 0.9 0.7 0.9 9 (40.6151022445,-80.0913487465) chicken,McDonald 0.3 0.3 0.5 08 (36.1974844.-115.2496601) bread,sandwich 0.4 0.3 0.4 (36.20743,-115.26846) movie,drink 0.2 0.4 0.3 9 (34.2.-81.839) chicken,KFC low low low 给定一个空间数据集O={0,02,…,0},0中的 值属性赋权重而不是限定属性的精确查询范围, 每个对象0,由一个三元组(1,K,A)表示,其中 目的是为了实现数值属性上的模糊查询。 0,1是对象o,的位置信息,0K是o,中的文本关键 2.2解决方案 字集合,0A是0,中的数值属性集合,0,.A中的 本文提出的解决方案如图3所示,可分为 o.4,标准化到[0,1]之间。假设这些数值属性的值 2步: 越小越好,如:噪声低、价格低等。如果数值属性 1)对于用户发起的查询q=(2,K,,根据离 值越高越好,例如:环境氛围、评分等信息,则可 线阶段计算的语义相关性和字符串相似度,将满 以通过a=l-a,将其转换。查询q由三元组(亿,K, 足条件的关键字拓展到查询关键字的集合中; W表示,其中q.1是查询条件的位置信息,qK是 2)构建AR-Tree混合索引结构,对查询条件 查询关键字集合,9W是不同数值属性的权重的 集合和用户对于这些数值属性的偏好,q:w∈qW, 与数据库中的空间对象进行位置相近性、文本相 w≥0(口1,2,,.m并且∑9w=1,为每个 似度和数值接近度的计算,根据最终得分筛选出 最符合用户需求的top-k个结果。 计算字符串相似度 离线预处理阶段 计算语义相关性 发起一个查询 AIR-Tree 位置信息 计算位置相近度 查询 关键字 数据库 十算文本相似度 属性权重 扩展查询 十算数值接近度 关键字 Top-k相关查询 OOOOO 返回相关查询结果 计算综合得分 在线处理阶段 图3解决方案框图 Fig.3 Solution block diagram下,如果用户对价格的在意程度较低,则三者中 最优的查询结果应该是 o2,反之,最优的查询结 果应该是 o7。由此可见,空间对象中包含的数值 信息以及用户对数值信息的重视程度,对于空间 关键字查询也至关重要,并且其处理方法与文本 关键字的匹配处理方法完全不同。 表 2 空间对象的文本和数值属性信息 Table 2 Text and numerical attribute information for spatial objects 空间对象 位置信息(latitude, longitude) 文本属性keywords 数值属性 噪声 价格 拥挤度 o1 (33.330690 2, −111.978599 2) pizza, steak 0.3 0.5 0.7 o2 (41.119534 6, −81.475689 8) chicken, McDonald 0.2 0.6 0.4 o3 (33.524902 5, −112.115309 8) tea, coffee 0.3 0.4 0.5 o4 (40.291685 3, −80.104899 9) chicken, McDonald 0.5 0.3 0.6 o5 (33.383146 8, −111.964725 4) shopping, market 0.8 0.7 0.9 o6 (48.7272, 9.147 95) bar, beer, chicken 0.9 0.7 0.9 o7 (40.615 102244 5, −80.091348 7465) chicken, McDonald 0.3 0.3 0.5 o8 (36.197484 4, −115.249660 1) bread, sandwich 0.4 0.3 0.4 o9 (36.207 43, −115.26846) movie, drink 0.2 0.4 0.3 q (34.2, −81.839) chicken, KFC low low low ∑ |q.W| i=1 q.wi = 1 给定一个空间数据集 O={o1 , o2 ,…,on},O 中的 每个对象 oi 由一个三元组 (λ, K, A) 表示,其中 oi .λ 是对象 oi 的位置信息,oi .K 是 oi 中的文本关键 字集合,oi .A 是 oi 中的数值属性集合,oi .A 中的 o.ai 标准化到 [0,1] 之间。假设这些数值属性的值 越小越好,如:噪声低、价格低等。如果数值属性 值越高越好,例如:环境氛围、评分等信息,则可 以通过 ai=1−ai 将其转换。查询 q 由三元组 (λ, K, W) 表示,其中 q.λ 是查询条件的位置信息,q.K 是 查询关键字集合,q.W 是不同数值属性的权重的 集合和用户对于这些数值属性的偏好,q.w∈q.W, q.w≥0 (i=1,2,···,|q.W|) 并且 。为每个数 值属性赋权重而不是限定属性的精确查询范围, 目的是为了实现数值属性上的模糊查询。 2.2 解决方案 本文提出的解决方案如图 3 所示,可分为 2 步: 1) 对于用户发起的查询 q=(λ, K, W),根据离 线阶段计算的语义相关性和字符串相似度,将满 足条件的关键字拓展到查询关键字的集合中; 2) 构建 AIR-Tree 混合索引结构,对查询条件 与数据库中的空间对象进行位置相近性、文本相 似度和数值接近度的计算,根据最终得分筛选出 最符合用户需求的 top-k 个结果。 数据库 返回相关查询结果 位置信息 查询 关键字 属性权重 发起一个查询 计算语义相关性 计算字符串相似度 计算综合得分 计算文本相似度 计算数值接近度 计算位置相近度 离线预处理阶段 在线处理阶段 Top-k 相关查询 扩展查询 关键字 AIR-Tree 图 3 解决方案框图 Fig. 3 Solution block diagram ·1166· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有