正在加载图片...
第6期 石磊,等:在线社交网络挖掘与搜索技术研究 ·783· 序生成的结果进行融合,并根据潜在因素模型推断 常存在歧义性、模糊性、甚至恶意性等问题,特别是 文件的排序等级和分数,将最终的排序结果返回给 一些影响力较大的用户的言论,会对社会造成较大 用户。Wang等)根据与用户回复和转发数进行评 的影响,因此需要综合利用自然语言处理、统计学习 分,回复和转发数高的评分越高。为了降低名人微 和社交网络挖掘等各种技术进行处理,这将给观点 博回复和转发数对评分结果的影响,提出了基于参 挖掘、情感分析、影响力分析等研究带来挑战。 与用户时间窗的异常检测方法,把用户的原始参与 在线社交网络挖掘领域中的各热点话题都面临 引入评分算法,很好地解决了名人评分问题。Lu 着如何研究更有效方法应对在线网络的大规模化、 等[6]运用LDA推断微博的主题分布和用户的兴趣 复杂化等带来的效率和质量问题。特别是针对在线 取向,通过实时Top-k响应,实时微博查询,然后比 社交网络中的海量跨媒体大数据,如何研究高效率、 较用户取向和微博主题分布之间的相似度判断用户 高质量的数据挖掘技术,帮助人们从社交网络中得 的兴趣。该方法是基于社交网络搜索算法基础上的 到更有价值的信息,实现满足用户个性化需求的个 一个用户个性化的搜索算法,可以应用在社交网络 性化搜索,仍然是目前该领域重要的研究方向。 个性化推荐中。卫冰洁等[)]将社交网络文本搜索 在线社交网络搜索技术对特定对象精准搜索的 总结为以下三点,时间感知的文本表示、时间感知的 研究还存在不足,不能从超大规模、超高维度、不完全 文档先验、时间感知的查询扩展,将查询相关文档分 的、有噪声的、模糊的在线社交网络跨媒体大数据中 布的高峰时刻称为该查询的热门时刻,提出了基于 挖掘出与特定对象时空特性、社会属性相关的知识模 查询热门时刻的4个系列语言模型。周霞娟等】 式,因此需要研究高质量、高效率的跨媒体大数据挖 提出了一个用户驱动的可视化微博搜索方法。采用 掘算法以及支持时空特性的跨媒体时空数据挖掘体 特征词及其权重来对用户兴趣进行建模,在此基础 系,根据时空特性、社交特性、用户行为特征,并结合 上建立用户特征词直接的关系。搜索微博信息时, 领域本体知识库推理演算和语义查询扩展,构建支持 首先定位与检索词相关的微博用户,在相关微博用 时空特性的在线社交网络对象的精准搜索模型。 户的微博中筛选与搜索相关的微博。Severyn等[] 随着社交图谱搜索技术的发展,这种与人相关 把深度学习方法引入社交网络搜索,建立了基于卷 的时间、地点、多媒体、社交内容等进行搜索的技术 积神经网络的短文本对的重排序方法,取得了较好 必将成为社交网络搜索的发展趋势,与此同时,结合 的效果。Chy等[o]提出融合时间特征、用户特征、 深度语义学习、情感立场、事件传播、群体社团关系, 文本特征的搜索结果重排序方法,并结合上述特征 实现对用户的社交行为分析、搜索意图理解的智能 加权的排名模型来估计最后的得分。 化、智慧化搜索是一个亟待解决的问题。 上述搜索和排序算法大部分都是基于传统的搜 由于用户移动端的普及,各个社交网络都提供了 索和排序机制上的改进和扩展,尽管提高了搜索的 手机签到的功能,通过这个功能可以获取用户的时间 效率,但是没有从用户角度去感知用户的搜索目的 信息、空间信息,如何结合数据挖掘技术实现基于时 和实现智能化的社交搜索。同时搜索内容都是基于 空特性的社交网络搜索也是一个需要解决的问题。 社交网铬文本或事件的搜索,而缺少对社交网络中 参考文献: 跨媒体内容的索引和搜索机制。 [1]李立耀,孙鲁敬,杨家海.社交网络研究综述[J].计算 3结论和展望 机科学,2015,42(11):8-21,42. 本文总结了社交网络结构建模、社交网络信息 LI Liyao,SUN Lujing,YANG Jiahai.Research on online 传播、社区发现、情感分析、事件监测及社交网络索 social network[J].Computer science,2015,42(11):8- 21,42. 引、搜索等技术的研究现状和最近进展。尽管取得 [2]王大玲,冯时,张一飞,等.社会媒体多模态、多层次资 了较多成果,但以下方面的研究仍然亟待解决。 源推荐技术研究[J].智能系统学报,2014,9(3):265 现有社交网络挖掘工作一般都是基于宏观层 275 面,很少从微观或者更细粒度层面开展研究,比如情 WANG Daling,FENG Shi,ZHANG Yifei,et al.Study on 感分析大都只是从积极、消极和中立等情感词分析 the recommendations of multi-modal and multi-level re- 进行研究,而影响力分析也大都只是从全局影响力 sources in social media[J].CAAl transactions on intelligent 开展研究,同时在线社交网络用户发表的评论信息 systems,2014,9(3):265-275序生成的结果进行融合,并根据潜在因素模型推断 文件的排序等级和分数,将最终的排序结果返回给 用户。 Wang 等[75]根据与用户回复和转发数进行评 分,回复和转发数高的评分越高。 为了降低名人微 博回复和转发数对评分结果的影响,提出了基于参 与用户时间窗的异常检测方法,把用户的原始参与 引入评分算法,很好地解决了名人评分问题。 Liu 等[76]运用 LDA 推断微博的主题分布和用户的兴趣 取向,通过实时 Top⁃k 响应,实时微博查询,然后比 较用户取向和微博主题分布之间的相似度判断用户 的兴趣。 该方法是基于社交网络搜索算法基础上的 一个用户个性化的搜索算法,可以应用在社交网络 个性化推荐中。 卫冰洁等[77] 将社交网络文本搜索 总结为以下三点,时间感知的文本表示、时间感知的 文档先验、时间感知的查询扩展,将查询相关文档分 布的高峰时刻称为该查询的热门时刻,提出了基于 查询热门时刻的 4 个系列语言模型。 周霞娟等[78] 提出了一个用户驱动的可视化微博搜索方法。 采用 特征词及其权重来对用户兴趣进行建模,在此基础 上建立用户特征词直接的关系。 搜索微博信息时, 首先定位与检索词相关的微博用户,在相关微博用 户的微博中筛选与搜索相关的微博。 Severyn 等[79] 把深度学习方法引入社交网络搜索,建立了基于卷 积神经网络的短文本对的重排序方法,取得了较好 的效果。 Chy 等[80] 提出融合时间特征、用户特征、 文本特征的搜索结果重排序方法,并结合上述特征 加权的排名模型来估计最后的得分。 上述搜索和排序算法大部分都是基于传统的搜 索和排序机制上的改进和扩展,尽管提高了搜索的 效率,但是没有从用户角度去感知用户的搜索目的 和实现智能化的社交搜索。 同时搜索内容都是基于 社交网络文本或事件的搜索,而缺少对社交网络中 跨媒体内容的索引和搜索机制。 3 结论和展望 本文总结了社交网络结构建模、社交网络信息 传播、社区发现、情感分析、事件监测及社交网络索 引、搜索等技术的研究现状和最近进展。 尽管取得 了较多成果,但以下方面的研究仍然亟待解决。 现有社交网络挖掘工作一般都是基于宏观层 面,很少从微观或者更细粒度层面开展研究,比如情 感分析大都只是从积极、消极和中立等情感词分析 进行研究,而影响力分析也大都只是从全局影响力 开展研究,同时在线社交网络用户发表的评论信息 常存在歧义性、模糊性、甚至恶意性等问题,特别是 一些影响力较大的用户的言论,会对社会造成较大 的影响,因此需要综合利用自然语言处理、统计学习 和社交网络挖掘等各种技术进行处理,这将给观点 挖掘、情感分析、影响力分析等研究带来挑战。 在线社交网络挖掘领域中的各热点话题都面临 着如何研究更有效方法应对在线网络的大规模化、 复杂化等带来的效率和质量问题。 特别是针对在线 社交网络中的海量跨媒体大数据,如何研究高效率、 高质量的数据挖掘技术,帮助人们从社交网络中得 到更有价值的信息,实现满足用户个性化需求的个 性化搜索,仍然是目前该领域重要的研究方向。 在线社交网络搜索技术对特定对象精准搜索的 研究还存在不足,不能从超大规模、超高维度、不完全 的、有噪声的、模糊的在线社交网络跨媒体大数据中 挖掘出与特定对象时空特性、社会属性相关的知识模 式,因此需要研究高质量、高效率的跨媒体大数据挖 掘算法以及支持时空特性的跨媒体时空数据挖掘体 系,根据时空特性、社交特性、用户行为特征,并结合 领域本体知识库推理演算和语义查询扩展,构建支持 时空特性的在线社交网络对象的精准搜索模型。 随着社交图谱搜索技术的发展,这种与人相关 的时间、地点、多媒体、社交内容等进行搜索的技术 必将成为社交网络搜索的发展趋势,与此同时,结合 深度语义学习、情感立场、事件传播、群体社团关系, 实现对用户的社交行为分析、搜索意图理解的智能 化、智慧化搜索是一个亟待解决的问题。 由于用户移动端的普及,各个社交网络都提供了 手机签到的功能,通过这个功能可以获取用户的时间 信息、空间信息,如何结合数据挖掘技术实现基于时 空特性的社交网络搜索也是一个需要解决的问题。 参考文献: [1]李立耀, 孙鲁敬, 杨家海. 社交网络研究综述[ J]. 计算 机科学, 2015, 42(11): 8-21, 42. LI Liyao, SUN Lujing, YANG Jiahai. Research on online social network[J]. Computer science, 2015, 42( 11): 8- 21, 42. [2]王大玲, 冯时, 张一飞, 等. 社会媒体多模态、多层次资 源推荐技术研究[J]. 智能系统学报, 2014, 9(3): 265- 275. WANG Daling, FENG Shi, ZHANG Yifei, et al. Study on the recommendations of multi⁃modal and multi⁃level re⁃ sources in social media[J]. CAAI transactions on intelligent systems, 2014, 9(3): 265-275. 第 6 期 石磊,等:在线社交网络挖掘与搜索技术研究 ·783·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有