正在加载图片...
信息检索模型(12) 信息检索的一个核心问题是如何决定查询和文档之间的相 关度,節信息检索模型中的排序函数R(q,d)。 ■常用的相关度评价方法是向量空间模型( ector Space Model, vsm ■向量空间模型基于共有词汇假设( shared bag of words),即査询和文档都被认为是有所有关键词组成的 N维向量,相关度根据他们在向量空间中的夹角的 cosine 值表示,即 R(d, a)=cos(d, a)=d g / q 那么如何决定N维向量每一维的权重,即N维向量中每个 关键词的权重呢??信息检索模型(1/2) „ 信息检索的一个核心问题是如何决定查询和文档之间的相 关度,即信息检索模型中的排序函数R(q,d) 。 „ 常用的相关度评价方法是向量空间模型(Vector Space Model,VSM) „ 向量空间模型基于共有词汇假设(shared bag of words),即查询和文档都被认为是有所有关键词组成的 N维向量,相关度根据他们在向量空间中的夹角的cosine 值表示,即 R(d, q) = cos(d, q) = d·q / |d| ×|q| „ 那么如何决定 N维向量每一维的权重,即 N维向量中每个 关键词的权重呢??
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有