模式识别的一些基本问题 模式识别的一些基本问题 口相似和分类 口相似和分类 ■人们依据物体之间的相似程度将其归类】 ■几种可作相似性度量的距离度量 ■在特征空间中,用特征向量描述样本的属性,用 口欧式距离 某种距离度量作为样本间相似性度量。 8(X.K)- 口相似性度量非负: 口样本本身间的相似性度量应最大: o绝对值距离(absolute value distance) 口相似性度量具对称性; 0KX-- 口在满足紧致性的条件下,相似性度量应是点间距离的 单调函数。 口向量夹角 ■统计模式识别的各种方法实际上都是直接或间接 6(X.X)-cos XIX 以距离度量为基础的。 XX, 模式识别的一些基本问题 模式识别的一些基本问题 口相似和分类 口特征生成 ■分类具有主观性:目的不同,分类不同,常缺乏 ■模式识别系统设计的任务就是要寻找一种变换, 纯客观的分类标准。依据哪些特征决定相似并进 即选择一种特征空间,使不同类别的样本在相应 行分类,取决于行为的目的和方法。 的特征空间能正确地分开(满足紧致性)。 口低层特征:最靠近信息输入端。 口例如:鲸鱼,牛,马从生物学的角度来讲都属于哺乳 。无序尺度:有明确的数量和数值 类,但是从产业角度来讲鲸鱼属于水产业,牛和马属 ·有序尺度:有先后、好坏的次序关系: 于高牧业。 ·名义尺度:无数量、无次序关系,如有红,黄颜色。 ■分类的客观性:科学性,判断分类必须有客观标 口中层特征:经过计算,变换得到的特征。 准。 口高层特征:在中层特征的基础上有目的的经过运 算形成。 ■分类追求客观性,但主观性也很难避免,这就是 口例:椅子的重量=体积*比重(体积与长,宽,高有 分类的复杂性。 幸:紫整桌科整:纹理,色有关.间比包谷了低 模式识别的一些基本问题 模式识别的一些基本问题 口特征生成 口特征生成 ■选择特征须适应特定的行为目的,是认知和识别 ■选择特征须适应特定的行为目的,是认知和识别 的核心问题。 的核心问题。 口要判别一个病人是否发类,应用什么特征? ·身高、体重、血压?今否 年经爱绿 2 。体温? →可能 。白血球数目? →是 如何根据这些 特将这些样 人分成几类?翻什么分? 口要从一段语音识别说话人的性别,应用什么特征? 本分类? ·直接利用声音信号(时间序列)?→否 ·声音大小?说话快慢?说话内容?…今否 ·音调高低(频率)? 今可能模式识别的一些基本问题 相似和分类 人们依据物体之间的相似程度将其归类。 在特征空间中,用特征向量描述样本的属性,用 某种距离度量作为样本间相似性度量。 相似性度量非负; 样本本身间的相似性度量应最大; 相似性度量具对称性; 在满足紧致性的条件下,相似性度量应是点间距离的 单调函数。 统计模式识别的各种方法实际上都是直接或间接 以距离度量为基础的。 模式识别的一些基本问题 相似和分类 几种可作相似性度量的距离度量 欧式距离 绝对值距离(absolute value distance) 向量夹角 模式识别的一些基本问题 相似和分类 分类具有主观性:目的不同,分类不同,常缺乏 纯客观的分类标准。依据哪些特征决定相似并进 行分类,取决于行为的目的和方法。 例如:鲸鱼,牛,马从生物学的角度来讲都属于哺乳 类,但是从产业角度来讲鲸鱼属于水产业,牛和马属 于畜牧业。 分类的客观性:科学性,判断分类必须有客观标 准。 分类追求客观性,但主观性也很难避免,这就是 分类的复杂性。 模式识别的一些基本问题 特征生成 模式识别系统设计的任务就是要寻找一种变换, 即选择一种特征空间,使不同类别的样本在相应 的特征空间能正确地分开(满足紧致性)。 低层特征:最靠近信息输入端。 无序尺度:有明确的数量和数值; 有序尺度:有先后、好坏的次序关系; 名义尺度:无数量、无次序关系,如有红,黄颜色。 中层特征:经过计算,变换得到的特征。 高层特征:在中层特征的基础上有目的的经过运 算形成。 例:椅子的重量=体积*比重 (体积与长,宽,高有 关;比重与材料,纹理,颜色有关。因此包含了低、 中、高三层特征。) 模式识别的一些基本问题 特征生成 选择特征须适应特定的行为目的,是认知和识别 的核心问题。 模式识别的一些基本问题 特征生成 选择特征须适应特定的行为目的,是认知和识别 的核心问题。 要判别一个病人是否发炎,应用什么特征? 身高、体重、血压…? 否 体温? 可能 白血球数目? 是 要从一段语音识别说话人的性别,应用什么特征? 直接利用声音信号(时间序列)? 否 声音大小?说话快慢?说话内容?… 否 音调高低(频率)? 可能