正在加载图片...
噪声数据处理 噪声数据是指数据中存在着错误或偏离期望值的数据,引起噪声数据的原 因可能是硬件故障、编程错误、拼写错误或者识别程序中的乱码。对于噪 声数据,尤其是孤立点或异常数据,不能随便删除,这些数据很可能是数 据分析中的异常数据 在耐热导线生产数据(这里主要是各工序成品质量检测数据)中,主要存在的 数据噪声形式有缺失值、异常值、冗余值等 缺失值主要存在生产过程记录的数据中,并不是每一项指标的数据都有记录,同一批铝杆拉 出的铝线,时常会出现某个铝线线径空缺的情况,这主要与工厂的生产线记录管理有关 异常值是指存在一些明显不符合常规的数据,如有些记录中铝线的线径数值达到了423mm 而这个数实际可能取值是4.23mm,属于手工录入错误 冗余主要表现为同一生产批次的数据重复出现,这往往是数据整合过程中产生的问题议程噪声数据处理 • 噪声数据是指数据中存在着错误或偏离期望值的数据,引起噪声数据的原 因可能是硬件故障、编程错误、拼写错误或者识别程序中的乱码。对于噪 声数据,尤其是孤立点或异常数据,不能随便删除,这些数据很可能是数 据分析中的异常数据 • 在耐热导线生产数据(这里主要是各工序成品质量检测数据)中,主要存在的 数据噪声形式有缺失值、异常值、冗余值等 – 缺失值主要存在生产过程记录的数据中,并不是每一项指标的数据都有记录,同一批铝杆拉 出的铝线,时常会出现某个铝线线径空缺的情况,这主要与工厂的生产线记录管理有关 – 异常值是指存在一些明显不符合常规的数据,如有些记录中铝线的线径数值达到了423mm ,而这个数实际可能取值是4.23mm,属于手工录入错误 – 冗余主要表现为同一生产批次的数据重复出现,这往往是数据整合过程中产生的问题
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有