特征提取(Feature Selection) 特征提取 ·在文本分类问题中遇到的一个主要困难就是高 维的特征空间。 ·通常一份普通的文本在经过文本表示后,如果 以词为特征,它的特征空间维数将达到几千, 甚至几万。 ·大多数学习算法都无法处理如此大的维数。 ·为了能够在保证分类性能的前提下,自动降低 特征空间的维数,在许多文本分类系统的实现 中都引入了特征提取方法。 特征提取(Feature Selection) 特征提取 在文本分类问题中遇到的一个主要困难就是高 维的特征空间。 通常一份普通的文本在经过文本表示后,如果 以词为特征,它的特征空间维数将达到几千, 甚至几万。 大多数学习算法都无法处理如此大的维数。 为了能够在保证分类性能的前提下,自动降低 特征空间的维数,在许多文本分类系统的实现 中都引入了特征提取方法