第十二章目标识别 Lecture 12 Object Recognition
第十二章 目标识别 Lecture 12 Object Recognition
目标识别 》怎样识别图像中物体,如汽车、牛等? 热已
目标识别 怎样识别图像中物体,如汽车、牛等?
目标识别的应用 sNaaN:. FACESNAPR 视频监控 智能汽车 场景搜索 Google vs Hrn Mu* QtA YouT山 Miran Arfatsknat Videos 基于内容的图像\视频检索 医学图像分析
目标识别的应用
难点之一:如何鲁棒识别? 光照的影响 物体姿态的影响 背景混淆 遮挡 类内差异 视点的影响
难点之一: 如何鲁棒识别?
类内差异( intra- class variability) Many face of madonna
类内差异(intra-class variability)
类间相似性( inter- class similarity) www.marykateandashley.com news. bbc. co uk/hinglish/in depth/americas/2000/us el ections 双胞胎 父子
类间相似性(inter-class similarity)
难点之二:计算量大 幅图像中像素个数多,目前每秒约产生30G像素的 图像/视频数据。 Google图片搜索中已有几十亿幅图像 全球数字照相机一年产生180亿张以上的图片(2004 年) 全球一年销售约3亿部照相手机(2005) 人的物体识别能力是强大的 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 99] -可以识别3,00030,000种物体 物体姿态可允许30度以上的自由度
难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生30G像素的 图像/视频数据。 - Google图片搜索中已有几十亿幅图像 - 全球数字照相机一年产生180亿张以上的图片(2004 年) - 全球一年销售约3亿部照相手机(2005) 人的物体识别能力是强大的 - 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 1991] - 可以识别3,000-30,000种物体 - 物体姿态可允许30度以上的自由度
难点之三:如何在小样本条件下学习 低 人为监督学习的复杂程度) 高 网通/色 无标注,多物体 图像整体标注,有背物体标注(分割到物 景混淆 体甚至部件)
难点之三:如何在小样本条件下学习
物体识别方法 检测( detection)vs.不检测 表示( representation) 颜色、纹狸、边缘、梯度、局部特征、深度、运 动等等。 分类( classification or categorization) K近邻(KNN 神经网络(NN 生成学习 Generative 支持向量机(SVM) learning )vs.判别学习 Boosting( Adaboost等 (discriminative 隐马尔科失模型(HMM) earnIng 其他
物体识别方法 检测(detection)vs. 不检测 表示(representation) - 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 分类(classification or categorization) - K近邻(KNN) - 神经网络(NN) - 支持向量机(SVM) - Boosting(Adaboost等) - 隐马尔科夫模型(HMM) -其他 生成学习(Generative learning)vs. 判别学习 (discriminative learning)
生成学习vs.判别学习 两种分类器学习模式 生成学习 目标是学习到符合训练数据的类别模型 如EM算法( Maximum likelihood) 》判别学习 口在训练阶段即考虑类别之间的判别信息 口包括 Support Vector Machines(SVs, Boosting, Minimun Classification Error(MCE), Maximum Mutual Information(MMI), Lager Margin(LM), and etc 判别学习算法比生成学习算法表现出更好的分类性能
生成学习 vs. 判别学习 两种分类器学习模式 生成学习 ---目标是学习到符合训练数据的类别模型 --- 如EM算法(Maximum Likelihood) 判别学习 在训练阶段即考虑类别之间的判别信息 包括Support Vector Machines (SVMs), Boosting, Minimum Classification Error (MCE), Maximum Mutual Information (MMI), Lager Margin (LM), and etc. 判别学习算法比生成学习算法表现出更好的分类性能