正在加载图片...
·272. 智能系统学报 第9卷 目”的点击情况,因而存在“用户-项目矩阵稀疏”等 次资源中,用户兴趣与资源之间、资源与资源之间的 问题。社会媒体中,“网络社群性”可望更好地解决 相似或相关性度量无法采用传统的“距离”度量机 上述问题。但这里用户与资源的关系已不仅是“点 制予以实现。 击”操作,在“用户角色双重性”及在多种媒体形式 构成的社会媒体环境中,如何构建“用户-资源”异 5进一步的研究方向 构信息网络并在其中挖掘用户社群,并最终映射为 可以认为,社会媒体中用户角色的变化构成了 用户兴趣,则是一个挑战。 更加复杂的用户关系,社会媒体资源表现形式呈现 2)多层次资源质量与条件相关性判别问题。 多模态特点,社会媒体资源推荐应该、并可以满足多 社会媒体的资源是用户发布的,因此存在大量 层次的用户需求。基于此,提出进一步的研究方向。 噪音、重复数据等信息质量问题,不同用户发布的相 1)社会媒体资源与用户兴趣模型结构研究。 同内容的资源质量也不尽相同,信息质量问题较传 令社会媒体资源集合为R={,2,,T},每 统媒体愈发严重。此外,就推荐而言,在传统的推荐 个r(i=1,2,,n)为一个资源,n为资源总数。对 系统中,如果以项目或网页序列表达用户兴趣,那么 一用户u,其兴趣模型Mu={mu1,m山2,,mm}是 序列“A”与“AB”对应的推荐应该是不同的。在社会 根据该用户对资源的操作历史及其社群关系得到的 媒体中,这一特点同样存在,然而不同的是,A、B资 资源序列集合,其中每个mu∈Mu为用户u感兴趣 源的媒体形式更加多样。而在多层次资源推荐中,的一个资源序列。不失一般性,将mu表示为mu=r A、B的粒度则可为子资源、资源和复合资源,推荐结 r2Tn(m为该序列长度,即用户u感兴趣的一组相 果还可能是综合资源,条件相关性的分析变得更加 关资源数目,m<n)。就兴趣模型存储本身,将r∈R 困难。 表示为(r,心,〉,心,为用户对r的兴趣度,基于用户对 3)用户兴趣与多层次资源的描述问题。 r的操作(发布、转发、、以及来源于社群兴趣等) 无论多层次资源模型、还是用户兴趣模型,均涉 赋予不同的权值。而在推荐时,将根据兴趣度对资 及用户、各层次资源及其关系的描述,而资源之间关 源序列进行筛选。基于指定的mu∈Mu的推荐,实 系的获取需要不同模态的内容分析,这种分析又将 际上需要在R中发现一个最适合推荐的资源序列 落实到特征分析,因此带来如下问题:首先,表现这RcR,使该序列中任一项r∈R,满足argmaxf(rlr 些资源的数据本身大多是非结构化的:其次,不同资 2Tm),其中f为推荐指数,f(rlr12rm)即用户 源数据之间是内容异构的:第三,这些非结构化数据 u对r2rn感兴趣的条件下、推荐资源r的指数。 的特征是高维的。若准确而合理地表达不同资源之 由于社会媒体推荐中“资源”已非原始粒度的信息, 间的关系、并有效地支持综合资源的挖掘以及多层 因此,资源的识别和描述将是一个新的问题。同时, 次资源推荐时的搜索,这种描述非简单的数据结构 如何对多层次资源和用户兴趣建模,如何进行推荐 所能胜任。 条件判断,乃至模型的维护和支持查询的有效索引 4)综合资源的发现与推荐问题。 均为需要研究的问题。 前述定义2中,多层次资源的“子资源”、“资 2)社会媒体多模态内容与资源质量分析基础研究。 源”和“复合资源”一般以显式方式存在,而“综合资 由于社会媒体中存在大量噪音、重复资源等质 源”则是隐式的,需要在资源和复合资源基础上,通 量问题,无论在构建资源模型与用户兴趣模型、还是 过分析和挖掘才能获得。如何在多(跨)模态的社 构建用户资源信息网络时,均存在资源的质量分析 会媒体资源中,通过针对各种模态的内容分析,发现 问题,噪音和重复资源的检测依赖于多模态内容分 并表达综合资源、进而向所需用户推荐综合资源,将 析。此外,资源模型的表达是以计算两资源T。。∈R 涉及多(跨)模态挖掘以及推荐时的搜索与匹配等 的f(rIr。)为基础的,而f(r.Ir6)正比于资源内 若干新问题。 容相关性,内容相关性的度量同样依赖于多模态内 5)多层次资源模型中的信息度量问题。 容分析。如前所述,这里的多模态内容除包括媒体 如本节内容3)所述,表达社会媒体多层次资源 上下文线索、标签等元数据等语义信息外,视觉、听 推荐模型已非简单的数据结构,推荐时用户兴趣与 觉等内容分析的基础是特征提取,这需要将特征相 资源的匹配又涉及条件相关性判别。在结构化和纯 关性问题首先在不同类别的特征中解决,再进一步 文本内容中,由于特征形式单一,传统的距离度量机 在多类特征中融合。这样,分层次、分类别的特征提 制一般尚可奏效。但在社会媒体多模态内容和多层 取将是一个重要的研究问题。目”的点击情况,因而存在“用户-项目矩阵稀疏”等 问题。 社会媒体中,“网络社群性”可望更好地解决 上述问题。 但这里用户与资源的关系已不仅是“点 击”操作,在“用户角色双重性” 及在多种媒体形式 构成的社会媒体环境中,如何构建“用户-资源” 异 构信息网络并在其中挖掘用户社群,并最终映射为 用户兴趣,则是一个挑战。 2)多层次资源质量与条件相关性判别问题。 社会媒体的资源是用户发布的,因此存在大量 噪音、重复数据等信息质量问题,不同用户发布的相 同内容的资源质量也不尽相同,信息质量问题较传 统媒体愈发严重。 此外,就推荐而言,在传统的推荐 系统中,如果以项目或网页序列表达用户兴趣,那么 序列“A”与“AB”对应的推荐应该是不同的。 在社会 媒体中,这一特点同样存在,然而不同的是,A、B 资 源的媒体形式更加多样。 而在多层次资源推荐中, A、B 的粒度则可为子资源、资源和复合资源,推荐结 果还可能是综合资源,条件相关性的分析变得更加 困难。 3)用户兴趣与多层次资源的描述问题。 无论多层次资源模型、还是用户兴趣模型,均涉 及用户、各层次资源及其关系的描述,而资源之间关 系的获取需要不同模态的内容分析,这种分析又将 落实到特征分析,因此带来如下问题:首先,表现这 些资源的数据本身大多是非结构化的;其次,不同资 源数据之间是内容异构的;第三,这些非结构化数据 的特征是高维的。 若准确而合理地表达不同资源之 间的关系、并有效地支持综合资源的挖掘以及多层 次资源推荐时的搜索,这种描述非简单的数据结构 所能胜任。 4)综合资源的发现与推荐问题。 前述定义 2 中,多层次资源的“子资源”、“资 源”和“复合资源”一般以显式方式存在,而“综合资 源”则是隐式的,需要在资源和复合资源基础上,通 过分析和挖掘才能获得。 如何在多(跨) 模态的社 会媒体资源中,通过针对各种模态的内容分析,发现 并表达综合资源、进而向所需用户推荐综合资源,将 涉及多(跨) 模态挖掘以及推荐时的搜索与匹配等 若干新问题。 5)多层次资源模型中的信息度量问题。 如本节内容 3)所述,表达社会媒体多层次资源 推荐模型已非简单的数据结构,推荐时用户兴趣与 资源的匹配又涉及条件相关性判别。 在结构化和纯 文本内容中,由于特征形式单一,传统的距离度量机 制一般尚可奏效。 但在社会媒体多模态内容和多层 次资源中,用户兴趣与资源之间、资源与资源之间的 相似或相关性度量无法采用传统的“距离” 度量机 制予以实现。 5 进一步的研究方向 可以认为,社会媒体中用户角色的变化构成了 更加复杂的用户关系,社会媒体资源表现形式呈现 多模态特点,社会媒体资源推荐应该、并可以满足多 层次的用户需求。 基于此,提出进一步的研究方向。 1)社会媒体资源与用户兴趣模型结构研究。 令社会媒体资源集合为 R = {r1 , r2 ,..., rn },每 个 ri(i = 1, 2, ..., n)为一个资源,n 为资源总数。 对 一用户 u,其兴趣模型 Mu = {mu1 , mu2 , ..., mum }是 根据该用户对资源的操作历史及其社群关系得到的 资源序列集合,其中每个 mu ÎMu 为用户 u 感兴趣 的一个资源序列。 不失一般性,将 mu 表示为 mu = r1 r2 ...rm(m 为该序列长度,即用户 u 感兴趣的一组相 关资源数目,m<n)。 就兴趣模型存储本身,将 r ÎRr 表示为〈r, wr〉,wr为用户对 r 的兴趣度,基于用户对 r 的操作(发布、转发、...、以及来源于社群兴趣等) 赋予不同的权值。 而在推荐时,将根据兴趣度对资 源序列进行筛选。 基于指定的 mu ÎMu 的推荐,实 际上需要在 R 中发现一个最适合推荐的资源序列 RrÍR,使该序列中任一项 r ÎRr满足 argmaxf rec( r | r1 r2 ...rm ),其中 f rec为推荐指数,f rec(r | r1 r2 ...rm )即用户 u 对 r1 r2 ...rm感兴趣的条件下、推荐资源 r 的指数。 由于社会媒体推荐中“资源”已非原始粒度的信息, 因此,资源的识别和描述将是一个新的问题。 同时, 如何对多层次资源和用户兴趣建模,如何进行推荐 条件判断,乃至模型的维护和支持查询的有效索引 均为需要研究的问题。 2)社会媒体多模态内容与资源质量分析基础研究。 由于社会媒体中存在大量噪音、重复资源等质 量问题,无论在构建资源模型与用户兴趣模型、还是 构建用户⁃资源信息网络时,均存在资源的质量分析 问题,噪音和重复资源的检测依赖于多模态内容分 析。 此外,资源模型的表达是以计算两资源 ra 、rbÎR 的 f rec(ra | rb)为基础的,而 f rec(ra | rb) 正比于资源内 容相关性,内容相关性的度量同样依赖于多模态内 容分析。 如前所述,这里的多模态内容除包括媒体 上下文线索、标签等元数据等语义信息外,视觉、听 觉等内容分析的基础是特征提取,这需要将特征相 关性问题首先在不同类别的特征中解决,再进一步 在多类特征中融合。 这样,分层次、分类别的特征提 取将是一个重要的研究问题。 ·272· 智 能 系 统 学 报 第 9 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有