正在加载图片...
为什么要预处理数据? 现实世界的数据是“肮脏的”——数据多了, 什么问题都会出现 口不完整的:有些感兴趣的属性缺少属性值,或仅包 含聚集数据 a含噪声的:包含错误或者“孤立点” 口不一致的:在编码或者命名上存在差异 ■没有高质量的数据,就没有高质量的挖掘结果 口高质量的决策必须依赖高质量的数据 ¤数据仓库需要对高质量的数据进行一致地集成为什么要预处理数据? ◼ 现实世界的数据是“肮脏的”——数据多了, 什么问题都会出现 ❑ 不完整的:有些感兴趣的属性缺少属性值,或仅包 含聚集数据 ❑ 含噪声的:包含错误或者“孤立点” ❑ 不一致的:在编码或者命名上存在差异 ◼ 没有高质量的数据,就没有高质量的挖掘结果 ❑ 高质量的决策必须依赖高质量的数据 ❑ 数据仓库需要对高质量的数据进行一致地集成
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有