正在加载图片...
实际上,LS采用T维词条空间中前k个主成 分来近似原始的T维词条空间,使用N×T的 文档词条来估计这个方向。 主成分方法的直观解释是,由原始词条的加 权组合所构成的单个向量可以非常好的近似 由大得多的向量集合所起的效果。于是可以 把原来的N×大小的文档-词条矩阵简化为 N×k的矩阵(k<<T), >对于固定的查全率,和前面讨论的向量空间 方法相比,LS可以提高查准率。➢ 实际上,LSI采用T维词条空间中前k个主成 分来近似原始的T维词条空间,使用N×T的 文档-词条来估计这个方向。 ➢ 主成分方法的直观解释是,由原始词条的加 权组合所构成的单个向量可以非常好的近似 由大得多的向量集合所起的效果。于是可以 把原来的N×T大小的文档-词条矩阵简化为 N×k的矩阵(k<<T), ➢ 对于固定的查全率,和前面讨论的向量空间 方法相比,LSI可以提高查准率
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有