《智能系统学报》：基于用户意图理解的社交网络跨媒体搜索与挖掘（北京邮电大学：崔婉秋、杜军平、周南、梁美玉）

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：722.21KB

第12卷第6期智能系统学报 Vol.12 No.6 2017年12月 CAAI Transactions on Intelligent Systems Dec.2017 D0:10.11992/tis.201706075 网络出版t地址：http:/kns.cnki.net/cms/detail/23.1538.TP.20171109.1255.024.html 基于用户意图理解的社交网络跨媒体搜索与挖掘崔婉秋，杜军平，周南，梁美玉 (北京邮电大学智能通信软件与多媒体北京市重点实验室，北京100876)》摘要：随者在线社交网络的盛行，网络用户不仅对信息资讯的获取速度和实时性提出了更高的要求，对个性化和精确化的搜索需求日益增长。为了提升搜索引擎的质量以及其结果列表的准确性，需要深层次地挖掘用户搜索意图。本文分析了用户搜索意图理解在线社交网络跨媒体进行精准搜索与挖掘的研究现状，包括知识图谱在线社交网络多模态信息感知、面向用户搜索意图匹配的跨媒体大数据深度语义学习方面的应用，以及用户搜索意图理解的在线社交网络精准搜索与挖掘的应用等。最后，对未来研究存在的问题和可能面临的挑战进行了展望。关键词：在线社交网络：用户搜索意图：知识图谱：深度语义学习：精准搜索关键词中图分类号：TP393文献标志码：A文章编号：1673-4785(201706-0761-09 中文引用格式：崔婉秋，杜军平，周南，等.基于用户意图理解的社交网络跨媒体搜索与挖据.智能系统学报，2017,12(6)：761-769. 英文引用格式：CUI Wanqiu,.DU Junping,ZHOU Nan,etal.Social network cross-.media searching and mining based on user inten- tion[J.CAAI transactions on intelligent systems,2017,12(6):761-769. Social network cross-media searching and mining based on user intention CUI Wanqiu,DU Junping,ZHOU Nan,LIANG Meiyu (Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia,Beijing University of Posts and Telecommunic- ations,Beijing 100876,China) Abstract:With the popularity of online social networks,users not only have higher requirements for speed and real-time performance of information acquisition but also increased demand for personalized and accurate searching.To improve the quality of the search engine and accuracy of the result list,it is necessary to deeply mine the search intentions of the users.This paper summarizes the current situation in precise cross-media searching and mining based on user search in- tentions.We focus on multi-modal information perceptions based on an online social network knowledge graph,deep semantic learning and analysis of cross-media data for user search intention matching,and precise online social network searching and mining based on users'search intentions.Finally,future research problems and possible challenges are discussed. Keywords:online social network;user searching intention;knowledge graph;deep semantic learning,precise searching 随着在线社交网络信息发布、传播以及分享的社交网络搜索吸引了国内外学者的普遍关注，如对功能越来越完善，大量用户持续活跃，积累了文本、社交网络个性化搜索技术的研究以及美国的实图片和视频等海量数据，导致网络空间中的信息急时搜索引擎Google和Scoopler等。通过抓取Twit 剧膨胀。然而这些庞大的数据中蕴藏着极为有价值 ter、Facebook等社交网络上用户随时随地发布的海的潜在信息，传统的在线社交网络搜索技术难以满量信息，可以给人们提供最新的搜索内容。大量社足用户的深层次、个性化的精准需求。因此近年来交网络数据产生的同时使得数据的形式和表达具有多样性，简单的用户搜索匹配方法不再能够满足用收稿日期：2017-06-22.网络出版日期：2017-11-09. 基金项目：国家自然科学基金重点项目(61532006)：国家自然科学户的搜索需求，返回的结果也不能精确匹配用户的基金国际合作项日(61320106006)：国家自然科学基金青年科学基金项目(61502042). 初始意图。因此国内外众多学者深入开展了基于用通信作者：杜军平.E-mail:junpingdu@126.com 户搜索意图理解的在线社交网络精准搜索与挖掘研

DOI: 10.11992/tis.201706075 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20171109.1255.024.html 基于用户意图理解的社交网络跨媒体搜索与挖掘崔婉秋，杜军平，周南，梁美玉（北京邮电大学智能通信软件与多媒体北京市重点实验室，北京 100876）摘要：随着在线社交网络的盛行，网络用户不仅对信息资讯的获取速度和实时性提出了更高的要求，对个性化和精确化的搜索需求日益增长。为了提升搜索引擎的质量以及其结果列表的准确性，需要深层次地挖掘用户搜索意图。本文分析了用户搜索意图理解在线社交网络跨媒体进行精准搜索与挖掘的研究现状，包括知识图谱在线社交网络多模态信息感知、面向用户搜索意图匹配的跨媒体大数据深度语义学习方面的应用，以及用户搜索意图理解的在线社交网络精准搜索与挖掘的应用等。最后，对未来研究存在的问题和可能面临的挑战进行了展望。关键词：在线社交网络；用户搜索意图；知识图谱；深度语义学习；精准搜索关键词中图分类号：TP393 文献标志码：A 文章编号：1673−4785(2017)06−0761−09 中文引用格式：崔婉秋, 杜军平, 周南, 等. 基于用户意图理解的社交网络跨媒体搜索与挖掘[J]. 智能系统学报, 2017, 12(6): 761–769. 英文引用格式：CUI Wanqiu, DU Junping, ZHOU Nan, et al. Social network cross-media searching and mining based on user intention[J]. CAAI transactions on intelligent systems, 2017, 12(6): 761–769. Social network cross-media searching and mining based on user intention CUI Wanqiu，DU Junping，ZHOU Nan，LIANG Meiyu (Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China) Abstract: With the popularity of online social networks, users not only have higher requirements for speed and real-time performance of information acquisition but also increased demand for personalized and accurate searching. To improve the quality of the search engine and accuracy of the result list, it is necessary to deeply mine the search intentions of the users. This paper summarizes the current situation in precise cross-media searching and mining based on user search intentions. We focus on multi-modal information perceptions based on an online social network knowledge graph, deep semantic learning and analysis of cross-media data for user search intention matching, and precise online social network searching and mining based on users’ search intentions. Finally, future research problems and possible challenges are discussed. Keywords: online social network; user searching intention; knowledge graph; deep semantic learning; precise searching 随着在线社交网络信息发布、传播以及分享的功能越来越完善，大量用户持续活跃，积累了文本、图片和视频等海量数据，导致网络空间中的信息急剧膨胀。然而这些庞大的数据中蕴藏着极为有价值的潜在信息，传统的在线社交网络搜索技术难以满足用户的深层次、个性化的精准需求。因此近年来社交网络搜索吸引了国内外学者的普遍关注，如对社交网络个性化搜索技术的研究[1-2]以及美国的实时搜索引擎 Google 和 Scoopler 等。通过抓取 Twitter、Facebook 等社交网络上用户随时随地发布的海量信息，可以给人们提供最新的搜索内容。大量社交网络数据产生的同时使得数据的形式和表达具有多样性，简单的用户搜索匹配方法不再能够满足用户的搜索需求，返回的结果也不能精确匹配用户的初始意图。因此国内外众多学者深入开展了基于用户搜索意图理解的在线社交网络精准搜索与挖掘研收稿日期：2017−06−22. 网络出版日期：2017−11−09. 基金项目：国家自然科学基金重点项目 (61532006)；国家自然科学基金国际合作项目 (61320106006)；国家自然科学基金青年科学基金项目 (61502042). 通信作者：杜军平. E-mail：junpingdu@126.com. 第 12 卷第 6 期智能系统学报 Vol.12 No.6 2017 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2017

·762· 智能系统学报第12卷究山，，该研究具有重要的理论意义和广泛的应用还有一些研究将社交网络的稀疏语义与其关联特征价值。相结合，在短文本语义提取方面进行了探索，针对对用户搜索意图的理解是在用户多模态输人及在线社交网络短文本语义特点，优化文本语义的理消除语义歧义性的基础上，充分结合用户的上下文解，挖掘用户隐藏的搜索意图。下面将分析基于用语境和语义知识，迅速、准确地理解和定位用户的户搜索意图的社交网络搜索中的两个技术，即信息真实意图，并结合匹配、推理、计算以及众包等技感知与知识图谱的构建。术，给出真正满足用户需求的精准搜索结果。用户 1.1多模态信息感知搜索意图的分析、提取与匹配是社交网络智能精准在社交网络的大量数据中蕴含着丰富的社会事搜索的研究重点，针对用户意图的搜索模式目前已件发生和发展的过程，如何有效地从这些数据中挖经取得了不少成果，但是现有的搜索意图理解多是掘出有价值的信息是当前社交网络分析的重要问经验式的，仅是分析性而非预测性的，仍缺少统一题。基于社交网络跨媒体多模态事件的感知通过的理论和算法对搜索意图的理解进行指导。因此，分析社交中的文本、时间地点、图像、评论、观点、在大数据时代，面对海量的跨媒体信息实现基于用情感和用户交互等多模态数据，感知事件整体发展户搜索意图理解的在线社交网络精准搜索与挖掘技过程，并刻画出各事件彼此的关联，进而实现对信术是必然的发展趋势。息的全方位获取。基于知识图谱的在线社交网络多模信息感知是指假设被感知数据来自n个多模态异构数据源，且对不同观测对象均从m个维度来描态信息感知述，则能获得一组多源异构多模态的感知数据。在通过对在线社交网络用户信息的深入挖掘，有线社交网络多模态数据信息感知的形成过程分为以效地全面理解用户的搜索意愿，构建虚拟空间的知下4步：识图谱，为特定虚拟空间中网络用户搜索意图的发 1)信息获取。根据在线用户显性或隐性地提出现提供数据支持5刀。针对在线社交网络数据简短、获取感知信息的需求，由系统分析后自动给出可能背景信息依赖明显等问题，目前的研究多是将数据的请求结果。的语义分布与背景信息相结合0，一方面用于解决 2)信息过滤。由于多模态信息的数据形式及种社交网络数据语义稀疏的问题，另一方面用于类多样，大量的反馈信息给用户带来一定的困扰，社交网络语义分布与线下的用户行为、位置特征的因此还需预先定义好过滤规则，建立过滤引擎。将关联6。时空特征作为社交网络数据最主要的背感知收集信息过滤后，存储并返回给相关用户。其景信息之一是理解用户搜索意图的关键1。来自中信息过滤机制可以是用户自定义的规则，便于个在线社交网络的文本或图像数据中蕴含着丰富的时性化地定义自己想要获取的信息，可以提高感知信空信息，可以利用自然语言处理技术识别文本中隐息的效率，或基于感知强度计算得出。含的时空信息，利用图像场景分类方法判断图像场 3)信息的感知。由感知引擎提供获取方法和工景类别，确定图像隐含的时空信息920。具，进一步分析用户交互结构和社交网络特性、社此外，考虑到社交网络数据具有明显的时空标区形成的规模、用户所处位置等信息，获取用户社签，直接利用时空标签信息获取更多的附加信息也交中的身份、发布的资源和参与的社交活动。是当前的研究热点。社交关系作为社交网络另一项 4)信息显示。最后将感知信息显示出来，呈现主要的背景信息，同样是理解用户搜索意图的重给社交网络中的用户或需求者。点四。相关研究更多是将社交关系作为数据语义在线社交网络环境中活跃的用户在交互时，能的补充以此来实现社交网络数据语义的提取，完成够从彼此显性沟通和隐性非直接的沟通中获取对方社交用户群体发现、兴趣分布等工作，从用户信息的需求感知信息。但实际应用中，用户可能发现的中挖掘用户的搜索意图22。此类基于数据聚合的知识和信息感知程度较低，会损失用户之间交流沟方法在用户层面进行主题分类、社区发现或者朋友通的机会。因此随着社交网络多模态信息大量涌推荐等方面取得了较好的效果，然而仍然不能解决现，对信息感知技术的要求更加紧迫，只有用户能单一短文本的语义获取问题262。一些学者对社交够更好地感知网络动态数据，才能够更深入全面地网络对象的语义表达2930、社交关联模型的建立和参与到社交活动中来，了解彼此的社交动态并挖掘进化)、时空图像特征感知和去噪)、基于聚类集出潜在的社交行为和关系，增大用户决策和沟通的成的社交网络图像分割3别等工作开展了广泛研究。效率

究 [1, 3-8] ，该研究具有重要的理论意义和广泛的应用价值。对用户搜索意图的理解是在用户多模态输入及消除语义歧义性的基础上，充分结合用户的上下文语境和语义知识，迅速、准确地理解和定位用户的真实意图，并结合匹配、推理、计算以及众包等技术，给出真正满足用户需求的精准搜索结果。用户搜索意图的分析、提取与匹配是社交网络智能精准搜索的研究重点，针对用户意图的搜索模式目前已经取得了不少成果，但是现有的搜索意图理解多是经验式的，仅是分析性而非预测性的，仍缺少统一的理论和算法对搜索意图的理解进行指导。因此，在大数据时代，面对海量的跨媒体信息实现基于用户搜索意图理解的在线社交网络精准搜索与挖掘技术是必然的发展趋势。 1 基于知识图谱的在线社交网络多模态信息感知通过对在线社交网络用户信息的深入挖掘，有效地全面理解用户的搜索意愿，构建虚拟空间的知识图谱，为特定虚拟空间中网络用户搜索意图的发现提供数据支持[5-7]。针对在线社交网络数据简短、背景信息依赖明显等问题，目前的研究多是将数据的语义分布与背景信息相结合[8-10] ，一方面用于解决社交网络数据语义稀疏的问题[11-13] ，另一方面用于社交网络语义分布与线下的用户行为、位置特征的关联[14-16]。时空特征作为社交网络数据最主要的背景信息之一是理解用户搜索意图的关键[17-18]。来自在线社交网络的文本或图像数据中蕴含着丰富的时空信息，可以利用自然语言处理技术识别文本中隐含的时空信息，利用图像场景分类方法判断图像场景类别，确定图像隐含的时空信息[19-20]。此外，考虑到社交网络数据具有明显的时空标签，直接利用时空标签信息获取更多的附加信息也是当前的研究热点。社交关系作为社交网络另一项主要的背景信息，同样是理解用户搜索意图的重点 [21-22]。相关研究更多是将社交关系作为数据语义的补充以此来实现社交网络数据语义的提取，完成社交用户群体发现、兴趣分布等工作，从用户信息中挖掘用户的搜索意图[23-25]。此类基于数据聚合的方法在用户层面进行主题分类、社区发现或者朋友推荐等方面取得了较好的效果，然而仍然不能解决单一短文本的语义获取问题[26-28]。一些学者对社交网络对象的语义表达[29-30] 、社交关联模型的建立和进化[31] 、时空图像特征感知和去噪[32] 、基于聚类集成的社交网络图像分割[33]等工作开展了广泛研究。还有一些研究将社交网络的稀疏语义与其关联特征相结合，在短文本语义提取方面进行了探索，针对在线社交网络短文本语义特点，优化文本语义的理解，挖掘用户隐藏的搜索意图。下面将分析基于用户搜索意图的社交网络搜索中的两个技术，即信息感知与知识图谱的构建。 1.1 多模态信息感知在社交网络的大量数据中蕴含着丰富的社会事件发生和发展的过程，如何有效地从这些数据中挖掘出有价值的信息是当前社交网络分析的重要问题 [34]。基于社交网络跨媒体多模态事件的感知通过分析社交中的文本、时间地点、图像、评论、观点、情感和用户交互等多模态数据，感知事件整体发展过程，并刻画出各事件彼此的关联，进而实现对信息的全方位获取。信息感知是指假设被感知数据来自 n 个多模态异构数据源，且对不同观测对象均从 m 个维度来描述，则能获得一组多源异构多模态的感知数据。在线社交网络多模态数据信息感知的形成过程分为以下 4 步： 1）信息获取。根据在线用户显性或隐性地提出获取感知信息的需求，由系统分析后自动给出可能的请求结果。 2）信息过滤。由于多模态信息的数据形式及种类多样，大量的反馈信息给用户带来一定的困扰，因此还需预先定义好过滤规则，建立过滤引擎。将感知收集信息过滤后，存储并返回给相关用户。其中信息过滤机制可以是用户自定义的规则，便于个性化地定义自己想要获取的信息，可以提高感知信息的效率，或基于感知强度计算得出。 3）信息的感知。由感知引擎提供获取方法和工具，进一步分析用户交互结构和社交网络特性、社区形成的规模、用户所处位置等信息，获取用户社交中的身份、发布的资源和参与的社交活动。 4）信息显示。最后将感知信息显示出来，呈现给社交网络中的用户或需求者。在线社交网络环境中活跃的用户在交互时，能够从彼此显性沟通和隐性非直接的沟通中获取对方的需求感知信息。但实际应用中，用户可能发现的知识和信息感知程度较低，会损失用户之间交流沟通的机会。因此随着社交网络多模态信息大量涌现，对信息感知技术的要求更加紧迫，只有用户能够更好地感知网络动态数据，才能够更深入全面地参与到社交活动中来，了解彼此的社交动态并挖掘出潜在的社交行为和关系，增大用户决策和沟通的效率。 ·762· 智能系统学报第 12 卷

第6期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·763· 1.2知识图谱的构建含其中的时空、结构关系、社交关系等背景特征知知识图谱s-36是Google提出的用于把复杂知识，建立多模态信息的知识图谱。其数据大部分来识领域的信息通过数据挖掘和信息处理，展示该知源于专业知识领域的网站，将文本或图像、视频中识领域的动态发展规律。其构建目的是便于社交网的共现知识信息为实体建立联系，并利用该关系帮络的搜索理解，能够按照用户的搜索内容自动辨别助搜索内容特征的提取，调整权重，最后使用文本其涉及的最相关实体及其属性等，根据实体的重要或图像分类算法对搜索分类，深度挖掘用户搜索意性揭示相对应的知识卡片，最后改善查询结果。利图。将获取的感知数据与其隐含、关联的背景特征用相关实体发掘来推荐其他用户可能感兴趣的实体相结合是分析社交网络信息的基础，是理解用户搜供进一步查阅。知识图谱可以在以下3个方面提升索意图以及构建社交网络精准搜索研究的关键科学搜索体验：问题。 1)理解用户查询的初始意图。搜索请求具有灵 2跨媒体大数据的深度语义学习与分活性，可能表示多重含义。知识图谱将信息全面发掘并显现出来，将搜索结果范围缩小到最接近用析户意图的含义，可以让用户自主确定最终满意的在线社交网络产生的数据大部分是异构、离散结果。且没有结构的，隐含了丰富的多属性、多模态语义 2)提供最全面的搜索信息。更好地全面理解用信息。多模态数据之间存在着千丝万缕的语义关户搜索信息，挖掘所有与搜索话题相关的内容，帮联，结合获得的时空等信息，对社交网络用户进行助用户了解各事物及信息之间的关系。搜索意图分析与行为意图理解，可以从不同角度来 3)拓宽了用户搜索的深度及广度。构建与用户掌握用户在社交平台上的各种网络行为特征。因此搜索结果相关的完整知识体系，使用户获取搜索需需要结合多属性、多形式的特征对社交网络在语义求之外的知识发现。在搜索过程中，用户有可能同层面上对大量数据进行深度学习，从多角度挖掘出时认识到搜索需求以外的某个新事实或新联系，引用户在社交网络活动中的意图模式和意图特征。通导用户开始一些全新的搜索查询。过对多属性、多模态社交网络大数据的深度语义学基于知识图谱的用户搜索初始意图发现方法利习与分析建模，可以实现异常用户意图特征的实时用知识库中含有的词间联系，对用户搜索中的请求获取以及凸显用户意图的实时表达，这对提升社会文本调整权重，从而提高分类准确率，提高搜索意热点话题的感知能力以及社交网络异常意图用户的图挖掘效果。其构建技术是自底向上并迭代进行更发现能力具有促进作用。新的过程，每次更新包括3个步骤：信息的抽取、知 2.1大数据语义分析识融合和加工。其中抽取是指从多模态的数据源中大数据语义分析为基于社交网络大数据的用户抽取出实体、属性及实体间的关联关系，以便形成意图理解与分析提供了关键的支持。随着异构数据本体知识的表达；知识融合是对抽取的数据进行实的快速产生，其以不同媒体的形式存在，如何从异体链接及知识合并，消除实体之间的歧义性、共指构数据中辨别出相应所需的概念成为了当前的研究消解的分类和聚类等操作，然后对获取的知识进行热点。合并，主要是对外部的知识库和内部关系数据库的 1)文本分析技术合并。最后进行知识加工，构建对概念统一模式规可以根据知识源或模型粒度的不同进行分类，范的本体，描述客观世界中的抽象概念模型，然后如表1所示。进行知识推理和质量评估，完成最终的知识图谱的 2)多模态分析技术构建。对于社交网络中不断涌现的多模态数据形式，在线社交网络产生的信息在网络上的呈现并不单纯的分析文本已经不能够满足对社交网络数据的仅仅局限于单一的文本模式，而是集签到、图像、视分析和挖掘，因此有大量研究针对于文本及图像、视频等各种模态数据的信息综合体，同时伴随产生了频等数据综合进行语义分析。如M.L.Blei等o在时间、空间、结构、社会关系等一系列隐含信息。多分析文本和图像的基础上，分别采用了3种不同的模态信息所蕴含的语义是单纯文本所无法比拟的，生成模型：文本和图像主题为同一主题的主题强相其极大地丰富了知识空间，为理解用户意图提供了关模型、文本和图像主题分别从同一主题分布中采充足的数据支持。因此，需要基于高效的数据感知样得到的弱相关模型，以及假设文本以图像标注形技术获取特定虚拟空间内跨媒体大数据，并提取隐式存在的，文本主题从图像主题中均匀采样得到的

1.2 知识图谱的构建知识图谱[35-36]是 Google 提出的用于把复杂知识领域的信息通过数据挖掘和信息处理，展示该知识领域的动态发展规律。其构建目的是便于社交网络的搜索理解，能够按照用户的搜索内容自动辨别其涉及的最相关实体及其属性等，根据实体的重要性揭示相对应的知识卡片，最后改善查询结果。利用相关实体发掘来推荐其他用户可能感兴趣的实体供进一步查阅。知识图谱可以在以下 3 个方面提升搜索体验： 1）理解用户查询的初始意图。搜索请求具有灵活性，可能表示多重含义。知识图谱将信息全面发掘并显现出来，将搜索结果范围缩小到最接近用户意图的含义，可以让用户自主确定最终满意的结果。 2）提供最全面的搜索信息。更好地全面理解用户搜索信息，挖掘所有与搜索话题相关的内容，帮助用户了解各事物及信息之间的关系。 3）拓宽了用户搜索的深度及广度。构建与用户搜索结果相关的完整知识体系，使用户获取搜索需求之外的知识发现。在搜索过程中，用户有可能同时认识到搜索需求以外的某个新事实或新联系，引导用户开始一些全新的搜索查询。基于知识图谱的用户搜索初始意图发现方法利用知识库中含有的词间联系，对用户搜索中的请求文本调整权重，从而提高分类准确率，提高搜索意图挖掘效果。其构建技术是自底向上并迭代进行更新的过程，每次更新包括 3 个步骤：信息的抽取、知识融合和加工。其中抽取是指从多模态的数据源中抽取出实体、属性及实体间的关联关系，以便形成本体知识的表达；知识融合是对抽取的数据进行实体链接及知识合并，消除实体之间的歧义性、共指消解的分类和聚类等操作，然后对获取的知识进行合并，主要是对外部的知识库和内部关系数据库的合并。最后进行知识加工，构建对概念统一模式规范的本体，描述客观世界中的抽象概念模型，然后进行知识推理和质量评估，完成最终的知识图谱的构建。在线社交网络产生的信息在网络上的呈现并不仅仅局限于单一的文本模式，而是集签到、图像、视频等各种模态数据的信息综合体，同时伴随产生了时间、空间、结构、社会关系等一系列隐含信息。多模态信息所蕴含的语义是单纯文本所无法比拟的，其极大地丰富了知识空间，为理解用户意图提供了充足的数据支持。因此，需要基于高效的数据感知技术获取特定虚拟空间内跨媒体大数据，并提取隐含其中的时空、结构关系、社交关系等背景特征知识，建立多模态信息的知识图谱。其数据大部分来源于专业知识领域的网站，将文本或图像、视频中的共现知识信息为实体建立联系，并利用该关系帮助搜索内容特征的提取，调整权重，最后使用文本或图像分类算法对搜索分类，深度挖掘用户搜索意图。将获取的感知数据与其隐含、关联的背景特征相结合是分析社交网络信息的基础，是理解用户搜索意图以及构建社交网络精准搜索研究的关键科学问题。 2 跨媒体大数据的深度语义学习与分析在线社交网络产生的数据大部分是异构、离散且没有结构的，隐含了丰富的多属性、多模态语义信息。多模态数据之间存在着千丝万缕的语义关联，结合获得的时空等信息，对社交网络用户进行搜索意图分析与行为意图理解，可以从不同角度来掌握用户在社交平台上的各种网络行为特征。因此需要结合多属性、多形式的特征对社交网络在语义层面上对大量数据进行深度学习，从多角度挖掘出用户在社交网络活动中的意图模式和意图特征。通过对多属性、多模态社交网络大数据的深度语义学习与分析建模，可以实现异常用户意图特征的实时获取以及凸显用户意图的实时表达，这对提升社会热点话题的感知能力以及社交网络异常意图用户的发现能力具有促进作用。 2.1 大数据语义分析大数据语义分析为基于社交网络大数据的用户意图理解与分析提供了关键的支持。随着异构数据的快速产生，其以不同媒体的形式存在，如何从异构数据中辨别出相应所需的概念成为了当前的研究热点。 1）文本分析技术可以根据知识源或模型粒度的不同进行分类，如表 1 所示。 2）多模态分析技术对于社交网络中不断涌现的多模态数据形式，单纯的分析文本已经不能够满足对社交网络数据的分析和挖掘，因此有大量研究针对于文本及图像、视频等数据综合进行语义分析。如 M. I. Blei 等 [40]在分析文本和图像的基础上，分别采用了 3 种不同的生成模型：文本和图像主题为同一主题的主题强相关模型、文本和图像主题分别从同一主题分布中采样得到的弱相关模型，以及假设文本以图像标注形式存在的，文本主题从图像主题中均匀采样得到的第 6 期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·763·

·764· 智能系统学报第12卷文本图像主题生成模型。使用Cor-LDA模型建模， Bian在研究跨媒体数据的基础上提出了MM- 将文本与图像映射到同一主题语义空间中，在图像 LDA模型，将多模态的数据映射在主题空间中，用标注及跨模态检索上都取得了很好的效果。Jingwen 以发现社交网络中事件的子事件，形成事件摘要。表1文本分析技术分类 Table 1 Classification of text analysis techniques 分类依据类别名称特征描述隐性语义分析模型无知识源参考，典型技术有潜在语义分析LSA、神经网络语言模型等半显性语义分析模型指理解文本时采用构建主题模型的方式，以PLSA、LDA为代表知识源依靠人工构建的知识库或词典(Probase网等)对文本进行语义、语法及词汇显性语义分析模型等方面的深入分析，如LexSAl9等原始文本粒度构建的分析模型，将文本的向量表示作为最后的模型输出，如文本模型粒度 LDA和LSA 词以词向量作为表示、分析和输出的模型上述以LDA为基础的生成模型中，都是严格最终输出了下一个词的概率。此外为图像特征与语以文本图像为研究对象，假设其具有同样的主题分义词建立共享空间已应用在跨模态搜索中，对于布，或者一种模态的主题分布依赖于另一种模型的用户意图理解得到了很好的效果。以学习哈希函数主题分布。然而现实生活中对同一事件或者物体的为基础保留多标记图像之间多层次语义相似性的深描述不仅在媒介上为异质异构数据，通常情况下在度语义排序方法s以及将深度卷积神经网络结合内容、数量、层次粒度上也并不是一一对应的。王哈希函数来共同学习特征表示和映射，已应用于对智愚等提出了一种社会多媒体的双向语义关联模社交网络用户意图搜索的语义理解中。用区域生成型，对文本、图像主题多种情况下的依赖关系建模：方法s对图像生成候选区域，结合训练好的CNN Wang等4提出了一种多模态共同话题推理模型，模型在这些区域上提取语义特征，最后利用线性为多模态建立共享语义空间的同时加入了额外的类 SVM进行分类，能够得到更好的搜索结果。别信息，在跨模态检索任务中取得了很好的效果； Kang等使用矩阵分解方法，通过学习特征的一致 3在线社交网络精准搜索与挖掘性表示，为非成对数据的跨模态检索提供了可能。社交网络搜索与传统网络的搜索应用形式相 2.2深度学习语义分析比，信息的传播速度更快、传播方式更加隐蔽，覆盖对用户搜索意图的图像理解常用方法是深度神人群更广、用户的交互也更加频繁。因此基于用户经网络，常用的两种深度神经网络结构有AlexNet 搜索意图理解的智能精准搜索不再局限于针对跨媒和VGG-Net6。深度学习得到的特征相比手工提体内容的搜索，而是涵盖了网络产生的信息以及与取的特征在社交网络用户的搜索意图理解中能够取其相关的所有外部信息的全面搜索，包括社交关系得更好的效果。深度神经网络语义分析模型具有自搜索、社交行为搜索以及线上线下关联信息搜索动提取特征的优点，可以找出有效的特征进行分等，需要有效地挖掘出社交网络中各种跨媒体的时类，所以也称为表示学习。社交网络带来的大数据空信息，分析隐含的特有属性，并结合知识库体系、给神经网络学习提供了大量的训练样本，而GPU的语义推理演算等，才能弥补传统搜索在信息关联等使用给运行速度提供了保障。面向用户意图的搜索方面的缺陷，实现对在线社交网络跨媒体大数据的理解中对图像特征的提取主流的方法是采用卷积神组织和管理，并对在线社交网络的精准搜索提供底经网络提取CNN特征79，图像与文本的语义学习层索引支持和基于本体知识库的搜索拓展。可以在不同的深度语义层面上对图像CNN特征和 3.1用户搜索意图理解与匹配文本特征进行映射学习0s。目前的搜索引擎对于用户查询仅仅从关键词角深度学习已经广泛用于文本、图像、视频和语度出发进行相似度匹配，而不是从用户搜索意图出音各方面的深度语义分析，基于神经网络的语言模发搜寻相关信息，使得返回结果和搜索意图有较大型最早是由Bengio提出的，主要解决了泛化问题，出人。在该方面的研究中，Wolframalpha从公众和通过嵌入和3层网络把词映射到空间中的一个点，已授权资源中发掘并构建的数据库，能够理解用户

文本图像主题生成模型。使用 Corr-LDA 模型建模，将文本与图像映射到同一主题语义空间中，在图像标注及跨模态检索上都取得了很好的效果。Jingwen Bian[ 4 1 ]在研究跨媒体数据的基础上提出了 MMLDA 模型，将多模态的数据映射在主题空间中，用以发现社交网络中事件的子事件，形成事件摘要。上述以 LDA 为基础的生成模型中，都是严格以文本图像为研究对象，假设其具有同样的主题分布，或者一种模态的主题分布依赖于另一种模型的主题分布。然而现实生活中对同一事件或者物体的描述不仅在媒介上为异质异构数据，通常情况下在内容、数量、层次粒度上也并不是一一对应的。王智愚等[42]提出了一种社会多媒体的双向语义关联模型，对文本、图像主题多种情况下的依赖关系建模； Wang 等 [43]提出了一种多模态共同话题推理模型，为多模态建立共享语义空间的同时加入了额外的类别信息，在跨模态检索任务中取得了很好的效果； Kang 等 [44]使用矩阵分解方法，通过学习特征的一致性表示，为非成对数据的跨模态检索提供了可能。 2.2 深度学习语义分析对用户搜索意图的图像理解常用方法是深度神经网络，常用的两种深度神经网络结构有 AlexNet[45] 和 VGG-Net[46]。深度学习得到的特征相比手工提取的特征在社交网络用户的搜索意图理解中能够取得更好的效果。深度神经网络语义分析模型具有自动提取特征的优点，可以找出有效的特征进行分类，所以也称为表示学习。社交网络带来的大数据给神经网络学习提供了大量的训练样本，而 GPU 的使用给运行速度提供了保障。面向用户意图的搜索理解中对图像特征的提取主流的方法是采用卷积神经网络提取 CNN 特征[47-49] ，图像与文本的语义学习可以在不同的深度语义层面上对图像 CNN 特征和文本特征进行映射学习[50-51]。深度学习已经广泛用于文本、图像、视频和语音各方面的深度语义分析，基于神经网络的语言模型最早是由 Bengio 提出的，主要解决了泛化问题，通过嵌入和 3 层网络把词映射到空间中的一个点，最终输出了下一个词的概率。此外为图像特征与语义词建立共享空间已应用在跨模态搜索中[52] ，对于用户意图理解得到了很好的效果。以学习哈希函数为基础保留多标记图像之间多层次语义相似性的深度语义排序方法[53-54]以及将深度卷积神经网络结合哈希函数来共同学习特征表示和映射，已应用于对社交网络用户意图搜索的语义理解中。用区域生成方法[55]对图像生成候选区域，结合训练好的 CNN 模型在这些区域上提取语义特征，最后利用线性 SVM 进行分类，能够得到更好的搜索结果。 3 在线社交网络精准搜索与挖掘社交网络搜索与传统网络的搜索应用形式相比，信息的传播速度更快、传播方式更加隐蔽，覆盖人群更广、用户的交互也更加频繁。因此基于用户搜索意图理解的智能精准搜索不再局限于针对跨媒体内容的搜索，而是涵盖了网络产生的信息以及与其相关的所有外部信息的全面搜索，包括社交关系搜索、社交行为搜索以及线上线下关联信息搜索等，需要有效地挖掘出社交网络中各种跨媒体的时空信息，分析隐含的特有属性，并结合知识库体系、语义推理演算等，才能弥补传统搜索在信息关联等方面的缺陷，实现对在线社交网络跨媒体大数据的组织和管理，并对在线社交网络的精准搜索提供底层索引支持和基于本体知识库的搜索拓展。 3.1 用户搜索意图理解与匹配目前的搜索引擎对于用户查询仅仅从关键词角度出发进行相似度匹配，而不是从用户搜索意图出发搜寻相关信息，使得返回结果和搜索意图有较大出入。在该方面的研究中，Wolframalpha 从公众和已授权资源中发掘并构建的数据库，能够理解用户表 1 文本分析技术分类 Table 1 Classification of text analysis techniques 分类依据类别名称特征描述知识源隐性语义分析模型无知识源参考，典型技术有潜在语义分析LSA、神经网络语言模型[37]等半显性语义分析模型指理解文本时采用构建主题模型的方式，以PLSA、LDA为代表显性语义分析模型依靠人工构建的知识库或词典(Probase[38]等)对文本进行语义、语法及词汇等方面的深入分析，如LexSA[39]等模型粒度文本原始文本粒度构建的分析模型，将文本的向量表示作为最后的模型输出，如 LDA和LSA 词以词向量作为表示、分析和输出的模型 ·764· 智能系统学报第 12 卷

第6期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·765· 查询需求并迅速给出结果。搜狗的“知立方”引人了在线两种处理阶段，其整体基于用户意图理解的搜用户查询语义的理解技术，试图分析用户的查询目索框架如图1所示。其中离线阶段是指在没有接收标，对搜索结果进行重新优化计算。Pak等m提用户搜索请求时系统自动进行的操作，主要对用户出了利用搜索上下文来预测用户的搜索意图：在社交网络中的各种行为特征、发布信息的文本特 Gupta等s提出了使用用户查询日志的方法，对日征或活动的时空信息及社会互动关系特征等个性化志分析并预测出用户的搜索目标；王大玲等提出信息进行分析和建模，挖掘出长期的兴趣偏好，为了利用决策树的方法识别用户搜索意图。在意图匹在线意图分析和抽取提供历史数据。利用TF 配方面，基于文本模型的匹配通过以关键词查询检 DF等算法进行主题分类抽取，并对热点进行分类索的方式，把意图语义进行转换并与目标文档匹及矢量描述分析，然后提取主题用户特征和主题热配，获得相关度排名。在图模型的意图匹配中，通点特征。当用户提出搜索请求时，首先对用户情景过图查询来实现用户搜索意图与搜索空间目标项之进行抽取，并对查询意图的信息和情感进行初步分间的查找和匹配，包括关键词图搜索、子图匹配和析，综合进行意图分析和提取操作，最后将主题节近似图匹配技术等6@。点的用户及热点特征与在线分析出的搜索意图、改目前基于意图理解的智能搜索机制分为离线和进的关键字综合进行匹配与搜索。用户情景抽取用户查询初步分析 ·用户最近的 ·意图信息词语在操作 ·意图情感词语段期兴趣由文本解析的意图意图分析和提取匹配与搜索 ·对查询数据进行多查询 ·根据意图缩小主题范围改进后的关关键词扩充和改写维度的分析（进度意图 ·根据关键词的扩充和改键词矢量 ·相关性分析内容、情感意图) 写在特定主题范围内进 ·局部聚类意图维度与主题类行匹配期兴趣查询用户特征主题节点的用主题节点的用户个性化分析户特征构成热点构成 ·用户特征、时空热点分析提取行为、社会关系等主题-用月主题分类抽取主题-热点关多维度建模 ·对热点进行主 ·每个维度用定量方关联分析 ·TF-DF 联分析题分类 ·层次聚类法 ·每个热点以词段法描述用户维度定语矢量描述量描述主题及词语矢量主题及词语矢量热点、热度及词语矢量图1基于用户意图的搜索框架 Fig.1 The searching framework based on user intentions 3.2在线社交网络精准搜索的应用手，对查询算法进行重构，与传统的基于关键字的随着社交网络的日益普及，在线社交网络成为搜索算法相比返回结果的相关度更高；Bennett等例了现实社会中人和事进行评论和发表观点的一个集提出探索式搜索概念，帮助搜索用户进行信息获中平台，是社会生活的真实写照。Facebook开发了取：Teevan等6从人口统计学、兴趣和职业等特征备受欢迎的社交图谱搜索技术，Twitter提供了基于分析入手，辨别不同的用户群体，提供基于相似请社交网络的搜索，新浪微博也提供了自己的在线搜求用户的查询结果。索系统，这些搜索系统的出现给用户带来了很多便在社交网络事件监测研究方面，Prerna等6从利。现在已有大量学者对在线社交网络的搜索技术技术层面对Twitter的舆情及其演化趋势进行了研进行研究。贾焰等从社交网络中的知识挖掘与推究：Jasmina等6提出了基于Twitter的事件搜索与演、用户初始查询意图的理解与表示、符合用户意监测方法，并将其应用于保加利亚选举事件中。随图的智能结果在线响应等3个问题为目标，讨论了着事件监测研究的不断进展，基于多模态的社交网社交网络智慧搜索相关技术的发展；郑炜等6提出络事件监测方法成为研究热点。Manos等6提出了了基于用户搜索意图的智能搜索引擎系统框架，该一种基于时间窗的多模态方法，对海量图片进行事框架从社交网络内容的存储、索引以及排名方面着件监测：Gao等6利用超图分割的思想引入文本内

查询需求并迅速给出结果。搜狗的“知立方”引入了用户查询语义的理解技术，试图分析用户的查询目标，对搜索结果进行重新优化计算[56]。Park 等 [57]提出了利用搜索上下文来预测用户的搜索意图； Gupta 等 [58]提出了使用用户查询日志的方法，对日志分析并预测出用户的搜索目标；王大玲等[59]提出了利用决策树的方法识别用户搜索意图。在意图匹配方面，基于文本模型的匹配通过以关键词查询检索的方式，把意图语义进行转换并与目标文档匹配，获得相关度排名。在图模型的意图匹配中，通过图查询来实现用户搜索意图与搜索空间目标项之间的查找和匹配，包括关键词图搜索、子图匹配和近似图匹配技术等[60]。目前基于意图理解的智能搜索机制分为离线和在线两种处理阶段，其整体基于用户意图理解的搜索框架如图 1 所示。其中离线阶段是指在没有接收用户搜索请求时系统自动进行的操作，主要对用户在社交网络中的各种行为特征、发布信息的文本特征或活动的时空信息及社会互动关系特征等个性化信息进行分析和建模，挖掘出长期的兴趣偏好，为在线意图分析和抽取提供历史数据。利用 TFIDF 等算法进行主题分类抽取，并对热点进行分类及矢量描述分析，然后提取主题用户特征和主题热点特征。当用户提出搜索请求时，首先对用户情景进行抽取，并对查询意图的信息和情感进行初步分析，综合进行意图分析和提取操作，最后将主题节点的用户及热点特征与在线分析出的搜索意图、改进的关键字综合进行匹配与搜索。 3.2 在线社交网络精准搜索的应用随着社交网络的日益普及，在线社交网络成为了现实社会中人和事进行评论和发表观点的一个集中平台，是社会生活的真实写照。Facebook 开发了备受欢迎的社交图谱搜索技术，Twitter 提供了基于社交网络的搜索，新浪微博也提供了自己的在线搜索系统，这些搜索系统的出现给用户带来了很多便利。现在已有大量学者对在线社交网络的搜索技术进行研究。贾焰等[56]从社交网络中的知识挖掘与推演、用户初始查询意图的理解与表示、符合用户意图的智能结果在线响应等 3 个问题为目标，讨论了社交网络智慧搜索相关技术的发展；郑炜等[61]提出了基于用户搜索意图的智能搜索引擎系统框架，该框架从社交网络内容的存储、索引以及排名方面着手，对查询算法进行重构，与传统的基于关键字的搜索算法相比返回结果的相关度更高；Bennett 等 [62] 提出探索式搜索概念，帮助搜索用户进行信息获取；Teevan 等 [63]从人口统计学、兴趣和职业等特征分析入手，辨别不同的用户群体，提供基于相似请求用户的查询结果。在社交网络事件监测研究方面，Prerna 等 [64]从技术层面对 Twitter 的舆情及其演化趋势进行了研究；Jasmina 等 [65]提出了基于 Twitter 的事件搜索与监测方法，并将其应用于保加利亚选举事件中。随着事件监测研究的不断进展，基于多模态的社交网络事件监测方法成为研究热点。Manos 等 [66]提出了一种基于时间窗的多模态方法，对海量图片进行事件监测；Gao 等 [67]利用超图分割的思想引入文本内 ⩔ᝣ͖ᕓࡂ᲼ܲ ͧ䷄ܲㆧ៩ं • TF−IDF • ᅮ⁍㖆ㆧ∁ ☙◥ܲ᲼᣼ं • ᄥ☙◥䔇㵸ͧ ䷄ܲㆧ • ⃻͖☙◥Б䃹䄙ⴎ䛻᣻䔜 ͧ䷄−⩔ᝣ ᲼ܲ㖀ڟ ڟ◥☙−䷄u 㖀ܲ᲼ ⩔ᝣ㐠Ꮢ჆ 䛻᣻䔜 ͧ䷄ࣶ䃹䄙ⴎ䛻 ͧ䷄ࣶ䃹䄙ⴎ䛻 ☙◥ȟ☙Ꮢ 䃹䄙ⴎ䛻ࣶ ᴑ䄎⩔ᝣ➥ᒭ ͧ䷄㞮◥⮰⩔ ᝣ➥ᒭᲰ᜼ ͧ䷄㞮◥⮰ ☙◥Ჰ᜼ ࡥ䙹̺᥈㉎ • ᵥᢚᘻప㑕ᄻͧ䷄㠯ఠ • ᵥᢚڟ䩚䃹⮰ផٱসᩥ 䔇ڱ㠯ఠ౔➥჆ͧ䷄ۅ 㵸ࡥ䙹 ۅᩥসٱ䩚䃹ផڟ • Ⱔڟᕓܲ᲼ • ᅬ䘔㖆ㆧ ڟ⮰ऺ䔇ᩥ 䩚䃹ⴎ䛻 ᘻపܲ᲼স᣼ं • ᄥᴑ䄎᪜ᢚ䔇㵸ๆ 㐠Ꮢ⮰ܲ᲼(䔇Ꮢȟ (ქȟᗱᙋᘻపڱ • ᘻప㐠Ꮢ̺ͧ䷄ㆧ ᴑ䄎 ᘻప ⩔ᝣᗱᮛ៩ं • ⩔ᝣᰬ䓽⮰ ᧹҈ ⩔ᝣᴑ䄎݉ₑܲ᲼ • ᘻపԍᖛ䃹䄙 • ᘻపᗱᙋ䃹䄙 ⩝᪳᱘㼏᲼⮰ᘻప • ⩔ᝣ➥ᒭȟᬢ⾦ȟ 㵸ͦȟ⹪цڟ㈧ふ ๆ㐠ᏒᐦὍ • ⃻͖㐠Ꮢ⩔჆䛻᫥ ∁᣻䔜 ౔ ㏫䭢 ⃡ 䓽 ᱋ ڠ 䋏䪫 ᱋ ڠ 䋏⻧㏫䭢 ⃡ 图 1 基于用户意图的搜索框架 Fig. 1 The searching framework based on user intentions 第 6 期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·765·

·766· 智能系统学报第12卷容、视觉内容、位置信息、时间信息等实现社交网络的研究现状，未来研究中可能面临的挑战包括：跨媒体的事件监测，但是该方法无法预测热点事 1)面对在线社交网络数据的歧义性、模糊性件；Unankard6s提出了基于位置感知的社交网络事时变性等问题，如何基于知识图谱获取在线社交网件监测方法，把Twitter事件和位置信息进行统一表络跨媒体大数据，并提取其相关背景信息以及如何示，将用户位置和事件位置的相关性的强度进行标利用感知数据与背景信息之间的关联、不同媒体数识，监测和预测热点事件。此外，随着各大社交网据之间的关联，构建虚拟空间的知识图谱，挖掘数络的盛行使针对社交网络的研究越来越广泛而全据中隐藏的用户搜索意图，以实现社交网络数据信面69川，人们在社交网络中应用更加便捷，并且可以息的全面、完整地表达与理解，仍然是亟待解决的从海量的信息中受益。科学问题。 4总结与展望 2)虽然面向用户搜索意图的理解已经有许多跨媒体语义映射学习的方法，但是这些方法没有考虑本文对基于知识图谱的在线社交网络多模态信图像和文本的时空性对语义的影响，因此需要根据息感知方法、搜索中面向用户意图匹配的跨媒体大图像与文本在不同时间和不同地点出现时体现不同数据深度语义学习与分析、在线社交网络精准搜索的语义，进一步对用户搜索意图的理解进行深入研与挖掘进行了研究与分析，可以看出在基于用户搜究。如何基于深度学习来突破跨媒体大数据知识空索意图理解的在线社交网络跨媒体精准搜索与挖掘间浅层特征与深度语义之间存在的语义障碍是有待研究领域已有的理论、技术及应用仍然存在一些问研究的问题。题，总结为以下几方面： 3)目前已有的社交网络搜索与挖掘算法是分离 1)目前已有的跨媒体信息感知方法只关注于一的，而搜索系统和挖掘系统都会对最终的搜索精度定区域和范围内的代表性数据获取，从社交网络中造成影响。因此建立搜索与挖掘一体化的模型能够感知得到的稀疏且零散的数据不足以支撑用户意图有效提高搜索性能。需要建立支持时空特性和社交理解搜索的信息需求。单纯的社交网络数据难以实特性的跨媒体、跨空间的挖掘体系，根据时空特性、现语义分析，因此需要必要的数据关联特征来实现社交特性、用户行为特征、现实空间的实时数据，并数据的语义理解。已有的信息感知方法没有考虑与结合领域本体知识库推理演算和语义查询扩展，构数据相关联的背景特征信息以及用户属性信息的建支持时间、空间特性的在线社交网络对象的精准获取，不能及时、快速从感知数据中提取出隐含信搜索模型。息，不能为高层的处理与应用提供必要的信息支持。参考文献： 2)目前已有的语义学习与分析方法中通常只针对单一模态数据或特定的应用场景，难以从多模态 [1]XIE H,LI X.WANG T,et al.Personalized search for so- 的跨媒体大数据中完整地识别出社交网络用户的意 cial media via dominating verbal context[J].Neurocomput- 图倾向，以及网络意图模式与现实社会热点话题与 ing,2016,172(C):27-37. 事件的语义关联关系，无法实时地获取体现社交网 [2]LI J,LIU C,YU JX,et al.Personalized influential topic 络用户的行为特征，从而进行用户意图分析和异常 search via social network summarization[J].IEEE transac- 用户意图检测。基于单一模态单一属性的语义识别 tions on knowledge and data engineering,2016,28(7): 模型难以快速而精准地分析社交网络热点话题和事 1820-1834. 件相关内容的语义及其影响范围和深度。 [3]KOU F,DU J,HE Y,et al.A survey on social network 3)目前已有的社交网络搜索技术对特定对象精 search based on semantic analysis and learning[J].CAAI 准搜索的研究无法实现跨空间搜索。搜索匹配方法 transactions on intelligence technology,2016,11(1):293- 302 不能从超大规模、超高维度、不完备、有噪声、语义 [4石磊，杜军平，周亦鹏，等.在线社交网络挖掘与搜索技术模糊的在线社交网络跨媒体大数据中挖掘出与特定研究.智能系统学报，2016,11(6)：777-787 对象时空特性、社会属性相关的知识模式。由于用 SHI Lei,DU Junping,ZHOU Yipeng,et al.A survey onon- 户搜索的意图往往很抽象，目前的搜索方法无法满 line social network mining and search[J].CAAI transac. 足抽象的搜索意图理解与匹配，因此需要研究基于 tions on intelligence technology,2016,11(6):777-787 搜索意图识别的高质量、高效率的跨媒体大数据搜 [5]DEUFEMIA V,GRANATELLO M.MEROLA A,et al. 索算法。 Comparing classifiers for web user intent understanding 围绕社会网络面向用户意图的搜索与挖掘目前 [J].Empowering organizations,2016,11(2):147-159

容、视觉内容、位置信息、时间信息等实现社交网络跨媒体的事件监测，但是该方法无法预测热点事件；Unankard[68]提出了基于位置感知的社交网络事件监测方法，把 Twitter 事件和位置信息进行统一表示，将用户位置和事件位置的相关性的强度进行标识，监测和预测热点事件。此外，随着各大社交网络的盛行使针对社交网络的研究越来越广泛而全面 [69-71]，人们在社交网络中应用更加便捷，并且可以从海量的信息中受益。 4 总结与展望本文对基于知识图谱的在线社交网络多模态信息感知方法、搜索中面向用户意图匹配的跨媒体大数据深度语义学习与分析、在线社交网络精准搜索与挖掘进行了研究与分析，可以看出在基于用户搜索意图理解的在线社交网络跨媒体精准搜索与挖掘研究领域已有的理论、技术及应用仍然存在一些问题，总结为以下几方面： 1）目前已有的跨媒体信息感知方法只关注于一定区域和范围内的代表性数据获取，从社交网络中感知得到的稀疏且零散的数据不足以支撑用户意图理解搜索的信息需求。单纯的社交网络数据难以实现语义分析，因此需要必要的数据关联特征来实现数据的语义理解。已有的信息感知方法没有考虑与数据相关联的背景特征信息以及用户属性信息的获取，不能及时、快速从感知数据中提取出隐含信息，不能为高层的处理与应用提供必要的信息支持。 2）目前已有的语义学习与分析方法中通常只针对单一模态数据或特定的应用场景，难以从多模态的跨媒体大数据中完整地识别出社交网络用户的意图倾向，以及网络意图模式与现实社会热点话题与事件的语义关联关系，无法实时地获取体现社交网络用户的行为特征，从而进行用户意图分析和异常用户意图检测。基于单一模态单一属性的语义识别模型难以快速而精准地分析社交网络热点话题和事件相关内容的语义及其影响范围和深度。 3）目前已有的社交网络搜索技术对特定对象精准搜索的研究无法实现跨空间搜索。搜索匹配方法不能从超大规模、超高维度、不完备、有噪声、语义模糊的在线社交网络跨媒体大数据中挖掘出与特定对象时空特性、社会属性相关的知识模式。由于用户搜索的意图往往很抽象，目前的搜索方法无法满足抽象的搜索意图理解与匹配，因此需要研究基于搜索意图识别的高质量、高效率的跨媒体大数据搜索算法。围绕社会网络面向用户意图的搜索与挖掘目前的研究现状，未来研究中可能面临的挑战包括： 1）面对在线社交网络数据的歧义性、模糊性、时变性等问题，如何基于知识图谱获取在线社交网络跨媒体大数据，并提取其相关背景信息以及如何利用感知数据与背景信息之间的关联、不同媒体数据之间的关联，构建虚拟空间的知识图谱，挖掘数据中隐藏的用户搜索意图，以实现社交网络数据信息的全面、完整地表达与理解，仍然是亟待解决的科学问题。 2）虽然面向用户搜索意图的理解已经有许多跨媒体语义映射学习的方法，但是这些方法没有考虑图像和文本的时空性对语义的影响，因此需要根据图像与文本在不同时间和不同地点出现时体现不同的语义，进一步对用户搜索意图的理解进行深入研究。如何基于深度学习来突破跨媒体大数据知识空间浅层特征与深度语义之间存在的语义障碍是有待研究的问题。 3）目前已有的社交网络搜索与挖掘算法是分离的，而搜索系统和挖掘系统都会对最终的搜索精度造成影响。因此建立搜索与挖掘一体化的模型能够有效提高搜索性能。需要建立支持时空特性和社交特性的跨媒体、跨空间的挖掘体系，根据时空特性、社交特性、用户行为特征、现实空间的实时数据，并结合领域本体知识库推理演算和语义查询扩展，构建支持时间、空间特性的在线社交网络对象的精准搜索模型。参考文献： XIE H, LI X, WANG T, et al. Personalized search for social media via dominating verbal context[J]. Neurocomputing, 2016, 172(C): 27–37. [1] LI J, LIU C, YU J X, et al. Personalized influential topic search via social network summarization[J]. IEEE transactions on knowledge and data engineering, 2016, 28(7): 1820–1834. [2] KOU F, DU J, HE Y, et al. A survey on social network search based on semantic analysis and learning[J]. CAAI transactions on intelligence technology, 2016, 11(1): 293– 302. [3] 石磊, 杜军平, 周亦鹏, 等. 在线社交网络挖掘与搜索技术研究[J]. 智能系统学报, 2016, 11(6): 777–787. SHI Lei, DU Junping, ZHOU Yipeng, et al. A survey on online social network mining and search[J]. CAAI transactions on intelligence technology, 2016, 11(6): 777–787. [4] DEUFEMIA V, GRANATELLO M, MEROLA A, et al. Comparing classifiers for web user intent understanding [J]. Empowering organizations, 2016, 11(2): 147–159. [5] ·766· 智能系统学报第 12 卷

第6期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·767· [6]CHRISTOPH K,MARTHA L,ALAN H.User intent in 进展与展望[.地球信息科学学报，2015,17(2)：127 multimedia search:a survey of the state of the art and future 134. challenges[J].ACM computing surveys,2016,49(2):1-37. YU Li,LU Feng,ZHANG Hengcai.Extracting geographic 7]KATO M.Web search query privacy,an end-user perspect- information from web texts:status and development[J]. ive[J].Journal of information security,2017,8(1):56-74. Journal of geo-information science,2015,17(2):127- [8]RISHIRAJ S R,RAHUL K,NILOY G,et al.Discovering 134. and understanding word level user intent in web search [20]王宇.基于网络文本的地名空间模糊建模[D].南京：南 queries[J].World wide web,2015,30:22-38 京师范大学，2012. [9]JIN Y K,MARK C,JAIME T,et al.Understanding how WANG Yu.A dissertation submitted in partial fulfillment people interact with web search results that change in real- of the requirements for the degree of master of science[D]. time using implicit feedback[C]//The 22nd ACM Interna- Nanjing:Nanjing Normal University,2012. tional Conference on Information and Knowledge Manage- [21]JIN T,LIL,LI P,et al.Hidden conditional random fields ment.San Francisco,USA,2014:2321-2326 for category and scene classification[J].Journal of compu- [10]CHRISTOPH K,SUBHABRATA B,MARTHA L,et al. tational information systems,2012,8(2):877-885. Uploader intent for online video:typology,inference and [22]CHIEN B C,SHI H T,FU C H,et al.Automatic geotag- applications[J].IEEE transactions on multimedia,2015, ging for personal photos with sharing images on social me- 17(8):1200-1212 dia networks[C]//Multidisciplinary Social Networks Re- [11]ZHENG Y,CAPRA L,WOLFSON O,et al.Urban com- search.Berlin:Springer Berlin Heidelberg,2015:495-508. puting:concepts,methodologies and applications[J].ACM [23]SENGSTOCK C,GERTZ M.Latent geographic feature transactions on intelligent systems and technology,2014, extraction from social media[C]//Proceedings of the 20th 5(3:38. ACM International Conference on Advances in Geograph- [12]ZHENG Y,LIU T,WANG Y,et al.Diagnosing new york ic Information Systems.New York,USA,2012:149-158. city's noises with ubiquitous data[C]//Proceedings of the [24]HONG L,DAVISON B D.Empirical study of topic mod- 2014 ACM International Joint Conference on Pervasive eling in Twitter[C]//Proceedings of the ACM First Work- and Ubiquitous Computing.Seattle,Washington,2014: shop on Social Media Analytics.Washington D C,USA, 715-725. 2010:80-88. [13]ZHENG Y.Trajectory data mining:an overview[J].ACM [25]SONG S,LI Q,ZHENG X.Detecting popular topics in mi- transactions on intelligent systems and technology,2015, cro-blogging based on a user interest-based model[J].The 6(3):29. complex system of management and control of state key [14]SONG S,LI Q,ZHENG N.A spatio-temporal framework laboratory,2012(IJCNN):1-8. for related topic search in micro-blogging[C]//Internation- [26]ZHENG N.SONG S,BAO H.A temporal-topic model for al Conference on Active Media Technology.Springer Ber- friend recommendations in Chinese microblogging sys- lin Heidelberg,2010:63-73 tems[J].IEEE transactions on systems,man,and cybernet- [15]SONG S,LI Q,BAO H.Detecting dynamic association ics:systems,2015,45(9):1245-1253. among twitter topics[C]//International Conference on [27]BAO H,LI Q,LIAO SS,et al.A new temporal and social World Wide Web.Lyon,France,2012:605-606. pmf-based method to predict users'interests in micro-blog- [16]LIU AA,SU Y T,NIE WZ,et al.Hierarchical clustering ging[J].Decision support systems,2013,55(3):698-709. multi-task learning for joint human action grouping and re- [28]GAO H,LI Q,BAO H,et al.How shall we catch people's cognition[J].IEEE trans pattern anal mach intell,2017, concerns in micro-blogging[C]//Proceedings of the 21st 391上102-114 ACM International Conference on World Wide Web.Ly- [17]CUI P,WANG F,YANG S,et al.Item-Level Social Influ- on,France,2012:505-506. ence Prediction with Probabilistic Hybrid Factor Matrix [29]WANG Y.WANG X.DU J,et al.Object detection based Factorization[Cl//AAAI Conference on Artificial Intelli- on exemplar object expression[M].Advanced Multimedia gence 2011.San Francisco.USA,2011:34-45. and Ubiquitous Engineering.Springer Berlin Heidelberg, [18]CRANSHAW J,TOCH E,HONG J,et al.Bridging the gap 2015 between physical location and online social networks[C]// [30]WANG X,DU J,WU S.High-level semantic image an- ACM International Conference on Ubiquitous Computing. notation based on hot internet topics[J.Multimedia tools Copenhagen,Denmark,2010:119-128. and applications,2015,74(6):2055-2084. [19余丽，陆锋，张恒才.网络文本蕴涵地理信息抽取：研究 [31]WU L,GE Y,LIU Q,et al.Modeling the evolution of

CHRISTOPH K, MARTHA L, ALAN H. User intent in multimedia search: a survey of the state of the art and future challenges[J]. ACM computing surveys, 2016, 49(2): 1–37. [6] KATO M. Web search query privacy, an end-user perspective[J]. Journal of information security, 2017, 8(1): 56–74. [7] RISHIRAJ S R, RAHUL K, NILOY G, et al. Discovering and understanding word level user intent in web search queries[J]. World wide web, 2015, 30: 22–38. [8] JIN Y K, MARK C, JAIME T, et al. Understanding how people interact with web search results that change in realtime using implicit feedback[C]//The 22nd ACM International Conference on Information and Knowledge Management. San Francisco, USA, 2014: 2321–2326. [9] CHRISTOPH K, SUBHABRATA B, MARTHA L, et al. Uploader intent for online video: typology, inference and applications[J]. IEEE transactions on multimedia, 2015, 17(8): 1200–1212. [10] ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: concepts, methodologies and applications[J]. ACM transactions on intelligent systems and technology, 2014, 5(3): 38. [11] ZHENG Y, LIU T, WANG Y, et al. Diagnosing new york city's noises with ubiquitous data[C]//Proceedings of the 2014 ACM International Joint Conference on Pervasive and Ubiquitous Computing. Seattle, Washington, 2014: 715–725. [12] ZHENG Y. Trajectory data mining: an overview[J]. ACM transactions on intelligent systems and technology, 2015, 6(3): 29. [13] SONG S, LI Q, ZHENG N. A spatio-temporal framework for related topic search in micro-blogging[C]//International Conference on Active Media Technology. Springer Berlin Heidelberg, 2010: 63–73. [14] SONG S, LI Q, BAO H. Detecting dynamic association among twitter topics[C]//International Conference on World Wide Web. Lyon, France, 2012: 605–606. [15] LIU A A, SU Y T, NIE W Z, et al. Hierarchical clustering multi-task learning for joint human action grouping and recognition[J]. IEEE trans pattern anal mach intell, 2017, 39(1): 102–114. [16] CUI P, WANG F, YANG S, et al. Item-Level Social Influence Prediction with Probabilistic Hybrid Factor Matrix Factorization[C]//AAAI Conference on Artificial Intelligence 2011. San Francisco, USA, 2011: 34–45. [17] CRANSHAW J, TOCH E, HONG J, et al. Bridging the gap between physical location and online social networks[C]// ACM International Conference on Ubiquitous Computing. Copenhagen, Denmark, 2010: 119–128. [18] [19] 余丽, 陆锋, 张恒才. 网络文本蕴涵地理信息抽取: 研究进展与展望[J]. 地球信息科学学报, 2015, 17(2): 127– 134. YU Li, LU Feng, ZHANG Hengcai. Extracting geographic information from web texts: status and development[J]. Journal of geo-information science, 2015, 17(2): 127– 134. 王宇. 基于网络文本的地名空间模糊建模[D]. 南京: 南京师范大学, 2012. WANG Yu. A dissertation submitted in partial fulfillment of the requirements for the degree of master of science[D]. Nanjing: Nanjing Normal University, 2012. [20] JIN T, LI L, LI P, et a1. Hidden conditional random fields for category and scene classification[J]. Journal of computational information systems, 2012, 8(2): 877–885. [21] CHIEN B C, SHI H T, FU C H, et al. Automatic geotagging for personal photos with sharing images on social media networks[C]//Multidisciplinary Social Networks Research. Berlin: Springer Berlin Heidelberg, 2015: 495–508. [22] SENGSTOCK C, GERTZ M. Latent geographic feature extraction from social media[C]//Proceedings of the 20th ACM International Conference on Advances in Geographic Information Systems. New York, USA, 2012: 149–158. [23] HONG L, DAVISON B D. Empirical study of topic modeling in Twitter[C]//Proceedings of the ACM First Workshop on Social Media Analytics. Washington D C, USA, 2010: 80–88. [24] SONG S, LI Q, ZHENG X. Detecting popular topics in micro-blogging based on a user interest-based model[J]. The complex system of management and control of state key laboratory, 2012(IJCNN): 1–8. [25] ZHENG N, SONG S, BAO H. A temporal-topic model for friend recommendations in Chinese microblogging systems[J]. IEEE transactions on systems, man, and cybernetics: systems, 2015, 45(9): 1245–1253. [26] BAO H, LI Q, LIAO S S, et al. A new temporal and social pmf-based method to predict users’ interests in micro-blogging[J]. Decision support systems, 2013, 55(3): 698–709. [27] GAO H, LI Q, BAO H, et al. How shall we catch people's concerns in micro-blogging[C]//Proceedings of the 21st ACM International Conference on World Wide Web. Lyon, France, 2012: 505–506. [28] WANG Y, WANG X, DU J, et al. Object detection based on exemplar object expression[M]. Advanced Multimedia and Ubiquitous Engineering. Springer Berlin Heidelberg, 2015. [29] WANG X, DU J, WU S. High-level semantic image annotation based on hot internet topics[J]. Multimedia tools and applications, 2015, 74(6): 2055–2084. [30] [31] WU L, GE Y, LIU Q, et al. Modeling the evolution of 第 6 期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·767·

·768· 智能系统学报第12卷 users'preferences and social links in social networking ser- [43]WANG Y,WU F,SONG J,et al.Multi-modal mutual top- vices[J].IEEE transactions on knowledge and data engin- ic reinforce modeling or cross-media retrieval[Cl//Proceed- eering,2017(99):1-l. ings of 2014 ACM International Conference on Multime- [32]LIANG M,DU J,LIU H.Self-adaptive spatial image de- dia.Orlando:ACM Press,2014:307-316. noising model based on scale correlation and sure-let in the [44]KANG C,XIANG S,LIAO S,et al.Learning consistent nonsubsampled contourlet transform domain[J].Science feature representation for cross-modal multimedia retriev- China-information sciences,2014,57(9):1-15. al[J].IEEE transactions on multimedia,2015,17(3): [33]WANG X,DU J,WU S,et al.Cluster ensemble-based im- 370-381. age segmentation[J].International journal of advanced ro- [45]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Im- botic systems,2013,10(4):1-11. agenet classification with deep convolutional neural net- 「34欧阳逸，郭斌，何萌，等.微博事件感知与脉络呈现系统 works[C]//Proceedings of Advances in Neural Informa- [J月.浙江大学学报：工学版，2016,50(6)：1176- tion Processing Systems.Cambridge:MIT Press,2012: 1182 1097-1105 OUYANG Yi,GUO Bin,HE Meng,et al.Event sensing [46]SIMONYAN K,ZISSERMAN A.Very deep convolution- and vein presentation leveraging microblog[J].Journal of al networks for large-scale image recognition[J.Arxiv pre- Zhejiang university:engineering science,2016,50(6):1176- print,axiv,2014:1409-1556. 1182 [47]ANDREJ K,ARMAND J,LI F.Deep fragment embed- [35)刘峤，李杨，段宏，等.知识图谱构建技术综述.计算机 dings for bidirectional image sentence mapping[J].Arxiv 研究与发展，2016,53(3)：582-600 Preprint,,Axiv,2014,143):1406-5679. LIU Jiao,LI Yang,DUAN Hong,et al.Knowledge graph [48]AMIRHOSSEIN H,THOMAS M,CEES G,et al.Discov- construction technique[J].Journal of computer research ering semantic vocabularies for cross-media retrieval and development,2016,53(3):582-600. [C]//Proceedings of ACM SIGMM International Confer- [36]BALAID A,ABD R M Z,HIKMI S N,et al.Knowledge ence on Multimedia Retrieval.Shanghai:ACM Press, maps[J].International journal of information management, 2015:131-138. 2016,36(3:451-475 [49]JIANG XY,WU F,LI X.et al.Deep compositional cross- [37]MIKOLOV T,CHEN K,CORRADO G,et al.Efficient es- modal learning to rank via local-global alignment[Cl// timation of word representations in vector space[J].Com- Proceedings of 2015 ACM International Conference on puter science,2013,2(12):27-35. Multimedia.Brisbane,2015:69-78. [38]WU W,LI H,WANG H,et al.Probase:a probabilistic tax- [50]MA L,LU ZD,SHANG LD,et al.Multimodal convolu- onomy for text understanding[C]//ACM SIGMOD Interna- tional neural networks for matching image and sentence[Cl// tional Conference on Management of Data.Scottsdale, Proceedings of 2015 International Conference on Com- USA,2012:481-492 puter Vision.Boston,USA,2015:2623-2631. [39]HUA W,WANG Z,WANG H,et al.Short text under- [51]ZHAO F,HUANG Y,WANG L,et al.Deep semantic standing through lexical-semantic analysis[Cl//Internation- ranking based hashing for multi-label image retrieval[C]// al Conference on Data Engineering.Seoul,South Korea, Proceedings of the IEEE Conference on Computer Vision 2015:495-506. and Pattern Recognition.Boston,USA,2015:1556- [40]DAVID M,BLEI M I,JORDAN.Modeling annotated 1564. data[Cl//Proceedings of 2003 ACM International Confer- [52]WANG J,SONG Y,LEUNG T,et al.Learning fine- ence on Research on Development in Information Retriev- grained image similarity with deep ranking[C]//IEEE Con- al.Toronto:ACM Press,2003:1-8. ference on Computer Vision and Pattern Recognition. [41]BIAN J,YANG Y,CHUA T S.Multimedia summariza- IEEE Computer Society,2014:1386-1393. tion for trending topics in microblogs[C]//Proceedings of [53]REN S,GIRSHICK R.GIRSHICK R,et al.Faster R-CNN: ACM International Conference on Information and Know- towards real-time object detection with region proposal ledge Management.San Francisco:ACM Press,2013: networks[J].IEEE transactions on pattern analysis and ma- 1807-1812 chine intelligence,2017,39(6):1137-1149. [42]王智愚.社会化多媒体内容分析与摘要D1.北京：清华 [54]QIAN SS,ZHANG TZ.HONG R,et al.Cross-domain col- 大学2013：1-119 laborative learning in social multimediafCl//Proceedings of WANG Zhiyu.Social multimedia analysis and summariza- 2015 ACM International Conference on Multimedia.Bris- tion[D].Beijing:Tsinghua University,2013:1-119. bane:ACM Press,2015:99-108

users’ preferences and social links in social networking services[J]. IEEE transactions on knowledge and data engineering, 2017(99): 1–1. LIANG M, DU J, LIU H. Self-adaptive spatial image denoising model based on scale correlation and sure-let in the nonsubsampled contourlet transform domain[J]. Science China-information sciences, 2014, 57(9): 1–15. [32] WANG X, DU J, WU S, et al. Cluster ensemble-based image segmentation[J]. International journal of advanced robotic systems, 2013, 10(4): 1–11. [33] 欧阳逸, 郭斌, 何萌, 等. 微博事件感知与脉络呈现系统 [J]. 浙江大学学报: 工学版, 2016, 50(6): 1176– 1182. OUYANG Yi, GUO Bin, HE Meng, et al. Event sensing and vein presentation leveraging microblog[J]. Journal of Zhejiang university: engineering science, 2016, 50(6): 1176– 1182. [34] 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582–600. LIU Jiao, LI Yang, DUAN Hong, et al. Knowledge graph construction technique[J]. Journal of computer research and development, 2016, 53(3): 582–600. [35] BALAID A, ABD R M Z, HIKMI S N, et al. Knowledge maps[J]. International journal of information management, 2016, 36(3): 451–475. [36] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[J]. Computer science, 2013, 2(12): 27–35. [37] WU W, LI H, WANG H, et al. Probase: a probabilistic taxonomy for text understanding[C]//ACM SIGMOD International Conference on Management of Data. Scottsdale, USA, 2012: 481–492. [38] HUA W, WANG Z, WANG H, et al. Short text understanding through lexical-semantic analysis[C]//International Conference on Data Engineering. Seoul, South Korea, 2015: 495–506. [39] DAVID M, BLEI M I, JORDAN. Modeling annotated data[C]//Proceedings of 2003 ACM International Conference on Research on Development in Information Retrieval. Toronto: ACM Press, 2003: 1–8. [40] BIAN J, YANG Y, CHUA T S. Multimedia summarization for trending topics in microblogs[C]//Proceedings of ACM International Conference on Information and Knowledge Management. San Francisco: ACM Press, 2013: 1807–1812. [41] 王智愚. 社会化多媒体内容分析与摘要[D]. 北京: 清华大学, 2013: 1–119. WANG Zhiyu. Social multimedia analysis and summarization[D]. Beijing: Tsinghua University, 2013: 1–119. [42] WANG Y, WU F, SONG J, et al. Multi-modal mutual topic reinforce modeling or cross-media retrieval[C]//Proceedings of 2014 ACM International Conference on Multimedia. Orlando: ACM Press, 2014: 307–316. [43] KANG C, XIANG S, LIAO S, et al. Learning consistent feature representation for cross-modal multimedia retrieval[J]. IEEE transactions on multimedia, 2015, 17(3): 370–381. [44] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks[C]// Proceedings of Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2012: 1097–1105. [45] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[J]. Arxiv preprint, arxiv, 2014: 1409–1556. [46] ANDREJ K, ARMAND J, LI F. Deep fragment embeddings for bidirectional image sentence mapping[J]. Arxiv Preprint, Arxiv, 2014, 14(3): 1406–5679. [47] AMIRHOSSEIN H, THOMAS M, CEES G, et al. Discovering semantic vocabularies for cross-media retrieval [C]//Proceedings of ACM SIGMM International Conference on Multimedia Retrieval. Shanghai: ACM Press, 2015: 131–138. [48] JIANG XY, WU F, LI X, et al. Deep compositional crossmodal learning to rank via local-global alignment[C]// Proceedings of 2015 ACM International Conference on Multimedia. Brisbane, 2015: 69–78. [49] MA L, LU ZD, SHANG LD, et al. Multimodal convolutional neural networks for matching image and sentence[C]// Proceedings of 2015 International Conference on Computer Vision. Boston, USA, 2015: 2623–2631. [50] ZHAO F, HUANG Y, WANG L, et al. Deep semantic ranking based hashing for multi-label image retrieval[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA, 2015: 1556– 1564. [51] WANG J, SONG Y, LEUNG T, et al. Learning finegrained image similarity with deep ranking[C]//IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2014: 1386–1393. [52] REN S, GIRSHICK R, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137–1149. [53] QIAN SS, ZHANG TZ, HONG R, et al. Cross-domain collaborative learning in social multimedia[C]//Proceedings of 2015 ACM International Conference on Multimedia. Brisbane: ACM Press, 2015: 99–108. [54] ·768· 智能系统学报第 12 卷

第6期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·769· [55)柯圣财，赵永威，李弼程，等.基于卷积神经网络和监督 hance supervised learning[C]//International Conference on 核哈希的图像检索方法[J].电子学报，2017,45(1)： Intelligent Text Processing and Computational Linguistics. 157-163 Cairo,Egypt,2015:49-65. KE Shengcai,ZHAO Yongwei,LI Bicheng,et al.Image [65]SMAILOVIC J,KRANJC J,GRCAR M,et al.Monitoring retrieval based on convolutional neural network and kernel- the Twitter sentiment during the Bulgarian elections[Cl// based supervised hashing[Jl.Acta electronica sinica,2017, IEEE International Conference on Data Science and Ad- 45(1):157-163. vanced Analytics.Paris,France,2015:1-10. [56贾焰，甘亮，李爱平，等.社交网络智慧搜索研究进展与 [66]MANOS S,SYMEON P,GEORGIOS P,et al.Multimod- 发展趋势J.通信学报，2015,36(12)：9-16 al event detection and summarization in large scale image JIA Yan,GAN Liang,LI Aiping,et al.Research progress collections[Cl//Proceedings of the 2016 ACM on Interna- and development trend of onfine social network smart tional Conference on Multimedia Retrieval.New York, search[J].Journal on communications,2015,36(12):9-16. USA.2016:421-422 [57]PARK K,JEE H,LEE T,et al.Automatic extraction of [67]GAO Y.ZHAO S,YANG Y,et al.Multimedia social user's search intention from web search logs[J.Multime- event detection in microblog[M]//Multimedia Modeling. dia tools and applications,2012,61(1):1-18. Springer International Publishing,2015:269-281. [58]GUPTA V,GARG N,GUPTA T.Search bot:search inten- [68]UNANKARD S,LI X,SHARAF M.Emerging event de- tion based filtering using decision tree based technique[Cl// tection in social networks with location sensitivity[J]. Third IEEE International Conference on Intelligent Sys- World wide web-internet and web information systems, tems,Modelling and Simulation.Kota Kinabalu,Malaysia, 2014,18(5):1-25. 2012:49-54. [59王大玲，于戈，鲍玉斌，等.基于用户搜索意图的Web [69]YANG Y,DU J,HE B.A novel ontology-based semantic 网页动态泛化[J.软件学报，2010,21(5)：1083-1097. retrieval model for food safety domain[J].Chinese journal of electronics.2013.22(2):247-252. WANG Daling,YU Ge,BAO Yubin,et al.Dynamically generalizing Web pages based on users'search intentions 作者简介： [J].Journal of software.2010.21(5):1083-1097. 崔婉秋，女，1990年生，博士研究 [60]FAN W,LI J,MA S,et al.Graph homomorphism revis- 生，主要研究方向为社交网络分析、机 ited for graph matching[C]//Proceedings of the VLDB En- 器学习、信息检索。 dowment,2010,3(1/2):1161-1172. [61]郑炜，梁战平，梁建.面向用户意图的智能搜索引擎框架研究.现代图书情报技术，2014,30(3)：65-72. ZHENG Wei,LIANG Zhanping,LIANG Jian.Research on user oriented intelligent search engine framework[J].Lib- 杜军平，女，1963年生，教授，博 rary and information science,2014,30(3):65-72 土生导师，主要研究方向为人工智能、 [62]BENNETT P N,WHITE R W,CHU W,et al.Modeling 社交网络分析、数据挖掘、运动图像处理，主持国家“863”、“973”计划项目 the impact of short-and long-term behavior on search per- 国家自然科学基金重点项目、国家自 sonalization[C]//Proceedings of the 35th International 然科学基金重大国际合作项目、北京 ACM SIGIR Conference on Research and Development in 市自然科学基金重点项目等。 Information Retrieva.Portland,USA,2012:185-194 63]CHILTON L B,TEEVAN J.Addressing people's informa- 周南，男，1991年生，博士研究 tion needs directly in a web search result page[C]//ACM 生，主要研究方向为社交网络分析、机 International Conference on World Wide Web.Hyderabad. 器学习、信息检索。 India.2011:27-36. 64]CHIKERSAL P,PORIA S,CAMBRIA E,et al.Modelling public sentiment in twitter:using linguistic patterns to en-

柯圣财, 赵永威, 李弼程, 等. 基于卷积神经网络和监督核哈希的图像检索方法[J]. 电子学报, 2017, 45(1): 157–163. KE Shengcai, ZHAO Yongwei, LI Bicheng, et al. Image retrieval based on convolutional neural network and kernelbased supervised hashing[J]. Acta electronica sinica, 2017, 45(1): 157–163. [55] 贾焰, 甘亮, 李爱平, 等. 社交网络智慧搜索研究进展与发展趋势[J]. 通信学报, 2015, 36(12): 9–16. JIA Yan, GAN Liang, LI Aiping, et al. Research progress and development trend of onfine social network smart search[J]. Journal on communications, 2015, 36(12): 9–16. [56] PARK K, JEE H, LEE T, et al. Automatic extraction of user’s search intention from web search logs[J]. Multimedia tools and applications, 2012, 61(1): 1–18. [57] GUPTA V, GARG N, GUPTA T. Search bot: search intention based filtering using decision tree based technique[C]// Third IEEE International Conference on Intelligent Systems, Modelling and Simulation. Kota Kinabalu, Malaysia, 2012: 49–54. [58] 王大玲, 于戈, 鲍玉斌, 等. 基于用户搜索意图的 Web 网页动态泛化[J]. 软件学报, 2010, 21(5): 1083–1097. WANG Daling, YU Ge, BAO Yubin, et al. Dynamically generalizing Web pages based on users’ search intentions [J]. Journal of software, 2010, 21(5): 1083–1097. [59] FAN W, LI J, MA S, et al. Graph homomorphism revisited for graph matching[C]//Proceedings of the VLDB Endowment, 2010, 3(1/2): 1161–1172. [60] 郑炜, 梁战平, 梁建. 面向用户意图的智能搜索引擎框架研究[J]. 现代图书情报技术, 2014, 30(3): 65–72. ZHENG Wei, LIANG Zhanping, LIANG Jian. Research on user oriented intelligent search engine framework[J]. Library and information science, 2014, 30(3): 65–72. [61] BENNETT P N, WHITE R W, CHU W, et al. Modeling the impact of short- and long-term behavior on search personalization[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieva. Portland, USA, 2012: 185–194. [62] CHILTON L B, TEEVAN J. Addressing people’s information needs directly in a web search result page[C]//ACM International Conference on World Wide Web. Hyderabad, India, 2011: 27–36. [63] CHIKERSAL P, PORIA S, CAMBRIA E, et al. Modelling public sentiment in twitter: using linguistic patterns to en- [64] hance supervised learning[C]//International Conference on Intelligent Text Processing and Computational Linguistics. Cairo, Egypt, 2015: 49–65. SMAILOVIC J, KRANJC J, GRCAR M, et al. Monitoring the Twitter sentiment during the Bulgarian elections[C]// IEEE International Conference on Data Science and Advanced Analytics. Paris, France, 2015:1–10. [65] MANOS S, SYMEON P, GEORGIOS P, et al. Multimodal event detection and summarization in large scale image collections[C]//Proceedings of the 2016 ACM on International Conference on Multimedia Retrieval. New York, USA, 2016: 421–422. [66] GAO Y, ZHAO S, YANG Y, et al. Multimedia social event detection in microblog[M]//Multimedia Modeling. Springer International Publishing, 2015: 269–281. [67] UNANKARD S, LI X, SHARAF M. Emerging event detection in social networks with location sensitivity[J]. World wide web-internet and web information systems, 2014, 18(5): 1–25. [68] YANG Y, DU J, HE B. A novel ontology-based semantic retrieval model for food safety domain[J]. Chinese journal of electronics, 2013, 22(2): 247–252. [69] 作者简介：崔婉秋，女，1990 年生，博士研究生，主要研究方向为社交网络分析、机器学习、信息检索。杜军平，女，1963 年生，教授，博士生导师，主要研究方向为人工智能、社交网络分析、数据挖掘、运动图像处理，主持国家“863”、“973”计划项目、国家自然科学基金重点项目、国家自然科学基金重大国际合作项目、北京市自然科学基金重点项目等。周南，男，1991 年生，博士研究生，主要研究方向为社交网络分析、机器学习、信息检索。第 6 期崔婉秋，等：基于用户意图理解的社交网络跨媒体搜索与挖掘 ·769·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录