五.统计模式识别系统 待识模式数据采集及预 特征提取与选 识别结果 模式分类 分类 训练模式 数据采集及预 特征提取与选 分类器设计 统计模式识别系统包括两个部分:训练和识别 l、模式的采集和预处理 就是根据具体问题,使用相应的设备或传感器对要识别的对象进行信息采集,并将这些 信息转化为数字量输入计算机,每个模式的这种数字量表示可以称为一个“样本”。例如, 汽车车型的识别,需要通过摄像机或照相机拍摄汽车的照片,然后转化为数字图像输入到计 算机中;语音信号需要通过麦克风转化为电信号,然后再通过AD采样形成一定的数字波 形输入到计算机中 2、特征提取与选择 1)为什么要进行特征提取? 通常来说通过数据采集输入到计算机中的原始样本数据量比较大,例如一幅图像或一个 波形的数据量要有几十K或上百K,这样处理起来非常困难;同时在原始样本中还存在着 很多无用数据,例如在汽车车型识别中,图像中的道路和行人,以及其它建筑物都属于无用 信息,对于识别任务来说没有任何意义,应该去除掉,否则在识别时会产生不利的影响 2)什么是特征? 特征是从模式得到的对分类有用的度量、属性。所谓特征应该能够反映不同类别之间的 本质差别。例如下面的一组图形,是几个两类分类问题,位于同一列上的三个样本属于一类。 因國四图 △ 囟囚囚 在统计模式识别中,模式的特征一般表示为一组数字,这组数字构成一个矢量,称为是 特征矢量。 3)如何抽取和表示特征? 特征抽取的方法不是模式识别研究的内容,这需要由其它知识来完成,比如说图像处理 信号处理等等,对于一个特定的模式识别问题,到底要抽取那些特则来作为识别特征,也没 有一个具体统一的方法可以指导我们来进行,都需要根据具体问题来具体分析,选择出一组3 五.统计模式识别系统 数据采集及预 处理 特征提取与选 择 模式分类 数据采集及预 处理 特征提取与选 择 分类器设计 待识模式 训练模式 识别结果 分类 训练 统计模式识别系统包括两个部分:训练和识别。 1、 模式的采集和预处理 就是根据具体问题,使用相应的设备或传感器对要识别的对象进行信息采集,并将这些 信息转化为数字量输入计算机,每个模式的这种数字量表示可以称为一个“样本”。例如, 汽车车型的识别,需要通过摄像机或照相机拍摄汽车的照片,然后转化为数字图像输入到计 算机中;语音信号需要通过麦克风转化为电信号,然后再通过 A/D 采样形成一定的数字波 形输入到计算机中。 2、 特征提取与选择 1) 为什么要进行特征提取? 通常来说通过数据采集输入到计算机中的原始样本数据量比较大,例如一幅图像或一个 波形的数据量要有几十 K 或上百 K,这样处理起来非常困难;同时在原始样本中还存在着 很多无用数据,例如在汽车车型识别中,图像中的道路和行人,以及其它建筑物都属于无用 信息,对于识别任务来说没有任何意义,应该去除掉,否则在识别时会产生不利的影响。 2) 什么是特征? 特征是从模式得到的对分类有用的度量、属性。所谓特征应该能够反映不同类别之间的 本质差别。例如下面的一组图形,是几个两类分类问题,位于同一列上的三个样本属于一类。 在统计模式识别中,模式的特征一般表示为一组数字,这组数字构成一个矢量,称为是 特征矢量。 3) 如何抽取和表示特征? 特征抽取的方法不是模式识别研究的内容,这需要由其它知识来完成,比如说图像处理, 信号处理等等,对于一个特定的模式识别问题,到底要抽取那些特则来作为识别特征,也没 有一个具体统一的方法可以指导我们来进行,都需要根据具体问题来具体分析,选择出一组