下，如果用户对价格的在意程度较低，则三者中最优的查询结果应该是 o2，反

正在加载图片...

·1166· 智能系统学报第15卷下，如果用户对价格的在意程度较低，则三者中信息以及用户对数值信息的重视程度，对于空间最优的查询结果应该是02，反之，最优的查询结关键字查询也至关重要，并且其处理方法与文本果应该是。由此可见，空间对象中包含的数值关键字的匹配处理方法完全不同。表2空间对象的文本和数值属性信息 Table 2 Text and numerical attribute information for spatial objects 空间对象数值属性位置信息(latitude,longitude) 文本属性keywords 噪声价格拥挤度 01 (33.3306902,-111.9785992) pizza,steak 0.3 0.5 0.7 0% (41.1195346.-81.4756898) chicken,McDonald 0.2 0.6 0.4 03 (33.5249025,-112.1153098) tea,coffee 0.3 0.4 0.5 04 (40.2916853,-80.1048999) chicken,McDonald 0.5 0.3 0.6 05 (33.3831468,-111.9647254) shopping,market 0.8 0.7 0.9 06 (48.7272.9.14795) bar.beer.chicken 0.9 0.7 0.9 9 (40.6151022445,-80.0913487465) chicken,McDonald 0.3 0.3 0.5 08 (36.1974844.-115.2496601) bread,sandwich 0.4 0.3 0.4 (36.20743,-115.26846) movie,drink 0.2 0.4 0.3 9 (34.2.-81.839) chicken,KFC low low low 给定一个空间数据集O={0,02,…,0},0中的值属性赋权重而不是限定属性的精确查询范围，每个对象0，由一个三元组(1，K,A)表示，其中目的是为了实现数值属性上的模糊查询。 0,1是对象o,的位置信息，0K是o,中的文本关键 2.2解决方案字集合，0A是0，中的数值属性集合，0，.A中的本文提出的解决方案如图3所示，可分为 o.4,标准化到[0,1]之间。假设这些数值属性的值 2步：越小越好，如：噪声低、价格低等。如果数值属性 1)对于用户发起的查询q=(2,K,,根据离值越高越好，例如：环境氛围、评分等信息，则可线阶段计算的语义相关性和字符串相似度，将满以通过a=l-a,将其转换。查询q由三元组（亿，K, 足条件的关键字拓展到查询关键字的集合中； W表示，其中q.1是查询条件的位置信息，qK是 2)构建AR-Tree混合索引结构，对查询条件查询关键字集合，9W是不同数值属性的权重的集合和用户对于这些数值属性的偏好，q:w∈qW, 与数据库中的空间对象进行位置相近性、文本相 w≥0（口1,2，，.m并且∑9w=1,为每个似度和数值接近度的计算，根据最终得分筛选出最符合用户需求的top-k个结果。计算字符串相似度离线预处理阶段计算语义相关性发起一个查询 AIR-Tree 位置信息计算位置相近度查询关键字数据库十算文本相似度属性权重扩展查询十算数值接近度关键字 Top-k相关查询 OOOOO 返回相关查询结果计算综合得分在线处理阶段图3解决方案框图 Fig.3 Solution block diagram下，如果用户对价格的在意程度较低，则三者中最优的查询结果应该是 o2，反之，最优的查询结果应该是 o7。由此可见，空间对象中包含的数值信息以及用户对数值信息的重视程度，对于空间关键字查询也至关重要，并且其处理方法与文本关键字的匹配处理方法完全不同。表 2 空间对象的文本和数值属性信息 Table 2 Text and numerical attribute information for spatial objects 空间对象位置信息(latitude, longitude) 文本属性keywords 数值属性噪声价格拥挤度 o1 (33.330690 2, −111.978599 2) pizza, steak 0.3 0.5 0.7 o2 (41.119534 6, −81.475689 8) chicken, McDonald 0.2 0.6 0.4 o3 (33.524902 5, −112.115309 8) tea, coffee 0.3 0.4 0.5 o4 (40.291685 3, −80.104899 9) chicken, McDonald 0.5 0.3 0.6 o5 (33.383146 8, −111.964725 4) shopping, market 0.8 0.7 0.9 o6 (48.7272, 9.147 95) bar, beer, chicken 0.9 0.7 0.9 o7 (40.615 102244 5, −80.091348 7465) chicken, McDonald 0.3 0.3 0.5 o8 (36.197484 4, −115.249660 1) bread, sandwich 0.4 0.3 0.4 o9 (36.207 43, −115.26846) movie, drink 0.2 0.4 0.3 q (34.2, −81.839) chicken, KFC low low low ∑ |q.W| i=1 q.wi = 1 给定一个空间数据集 O={o1 , o2 ,…,on}，O 中的每个对象 oi 由一个三元组 (λ, K, A) 表示，其中 oi .λ 是对象 oi 的位置信息，oi .K 是 oi 中的文本关键字集合，oi .A 是 oi 中的数值属性集合，oi .A 中的 o.ai 标准化到 [0,1] 之间。假设这些数值属性的值越小越好，如：噪声低、价格低等。如果数值属性值越高越好，例如：环境氛围、评分等信息，则可以通过 ai=1−ai 将其转换。查询 q 由三元组 (λ, K, W) 表示，其中 q.λ 是查询条件的位置信息，q.K 是查询关键字集合，q.W 是不同数值属性的权重的集合和用户对于这些数值属性的偏好，q.w∈q.W, q.w≥0 (i=1,2,···,|q.W|) 并且。为每个数值属性赋权重而不是限定属性的精确查询范围，目的是为了实现数值属性上的模糊查询。 2.2 解决方案本文提出的解决方案如图 3 所示，可分为 2 步： 1) 对于用户发起的查询 q=(λ, K, W)，根据离线阶段计算的语义相关性和字符串相似度，将满足条件的关键字拓展到查询关键字的集合中； 2) 构建 AIR-Tree 混合索引结构，对查询条件与数据库中的空间对象进行位置相近性、文本相似度和数值接近度的计算，根据最终得分筛选出最符合用户需求的 top-k 个结果。数据库返回相关查询结果位置信息查询关键字属性权重发起一个查询计算语义相关性计算字符串相似度计算综合得分计算文本相似度计算数值接近度计算位置相近度离线预处理阶段在线处理阶段 Top-k 相关查询扩展查询关键字 AIR-Tree 图 3 解决方案框图 Fig. 3 Solution block diagram ·1166· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：【自然语言处理与理解】空间关键字个性化语义近似查询方法