正在加载图片...
预处理 去掉网页中的导航信息 ■去掉HTL网页中的tag标记 ■(中文)分词、词性标注、短语识别、 . ■ 去除停用词和词根还原(stemming) ■数据清洗:去掉不合适的噪声文档或文档内垃 圾数据 0。●00预处理 „ 去掉网页中的导航信息 „ 去掉HTML网页中的tag标记 „ (中文)分词、词性标注、短语识别、… „ 去除停用词和词根还原(stemming) „ 数据清洗:去掉不合适的噪声文档或文档内垃 圾数据 „ ⋅⋅⋅⋅⋅⋅
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有