➢ 实际上，LSI采用T维词条空间中前k个主成分来近似原始的T维词条空间

正在加载图片...

实际上,LS采用T维词条空间中前k个主成分来近似原始的T维词条空间,使用N×T的文档词条来估计这个方向。主成分方法的直观解释是,由原始词条的加权组合所构成的单个向量可以非常好的近似由大得多的向量集合所起的效果。于是可以把原来的N×大小的文档-词条矩阵简化为 N×k的矩阵(k<<T), >对于固定的查全率,和前面讨论的向量空间方法相比,LS可以提高查准率。➢ 实际上，LSI采用T维词条空间中前k个主成分来近似原始的T维词条空间，使用N×T的文档-词条来估计这个方向。 ➢ 主成分方法的直观解释是，由原始词条的加权组合所构成的单个向量可以非常好的近似由大得多的向量集合所起的效果。于是可以把原来的N×T大小的文档-词条矩阵简化为 N×k的矩阵(k<<T)， ➢ 对于固定的查全率，和前面讨论的向量空间方法相比，LSI可以提高查准率

<<向上翻页向下翻页>>

点击下载：《数据把掘概念与技术》第九章（9-3）文本检索