点击下载:哈尔滨工业大学:《信息检索》课程教学资源(课件讲义)文本分类 Text Categorization(主讲:刘挺)
正在加载图片...
预处理 去掉网页中的导航信息 ■去掉HTL网页中的tag标记 ■(中文)分词、词性标注、短语识别、 . ■ 去除停用词和词根还原(stemming) ■数据清洗:去掉不合适的噪声文档或文档内垃 圾数据 0。●00预处理 去掉网页中的导航信息 去掉HTML网页中的tag标记 (中文)分词、词性标注、短语识别、… 去除停用词和词根还原(stemming) 数据清洗:去掉不合适的噪声文档或文档内垃 圾数据 ⋅⋅⋅⋅⋅⋅
<<向上翻页
向下翻页>>
点击下载:哈尔滨工业大学:《信息检索》课程教学资源(课件讲义)文本分类 Text Categorization(主讲:刘挺)
©2008-现在 cucdc.com 高等教育资讯网 版权所有