第十二章目标检测与识别 Lecture 12 Object Detection and Recognition
第十二章 目标检测与识别 Lecture 12 Object Detection and Recognition
目标检测和识别 怎样检测和识别图像中物体,如汽车、牛等? 金0
目标检测和识别 怎样检测和识别图像中物体,如汽车、牛等?
目标识别的应用 地fa图 10.5214 FACESNAPO 视频监控 智能汽车 场景搜索 Google You Tube Videos Cetegortes mag0star间ne0eai Videos boing watched right now.. 0 基于内容的图像视频检索 医学图像分析
目标识别的应用
难点之一:如何鲁棒识别? 光照的影响 物体姿态的影响 背景混淆 遮挡 类内差异 视,点的影响
难点之一: 如何鲁棒识别?
类内差异(intra-class variability) Many face of Madonna
类内差异(intra-class variability)
类间相似性(inter-class similarity) www.marykateandashley.com news.bbc.co.uk/hi/english/in depth/americas/2000/us el ections 双胞胎 父子
类间相似性(inter-class similarity)
难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生300G像素的 图像/视频数据。 -Google图片搜索中己有几百亿幅图像 -每天有3.5亿张以上的图片上传到Facebook(2015年) -全球销售约3.4亿部照相手机(2018年第一季度) 人的物体识别能力是强大的 ·灵长类动物约使用大脑皮层的一半来处理视觉信息、 [Felleman and van Essen 1991] -可以识别3,000-30,000种物体 ·物体姿态可允许30度以上的自由度
难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生300G像素的 图像/视频数据。 - Google图片搜索中已有几百亿幅图像 - 每天有3.5亿张以上的图片上传到Facebook(2015年) - 全球销售约3.4亿部照相手机(2018年第一季度) 人的物体识别能力是强大的 - 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 1991] - 可以识别3,000-30,000种物体 - 物体姿态可允许30度以上的自由度
难点之三:如何在小样本条件下学习 低 (人为监督学习的复杂程度) 高 十 无标注,多物体 图像整体标注,有背 物体标注(分割到物 景混淆 体甚至部件)
难点之三:如何在小样本条件下学习
物体识别方法 》 检测(detection)vs.不检测 >表示(representation) 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 y分类(classification or categorization) -K近邻(KNN) -神经网络(NN) 生成学习(Generative -支持向量机(SVM) learning.)vs.判别学习 Boosting(Adaboost) (discriminative -隐马尔科夫模型(HMM) learning) -其他
物体识别方法 检测(detection)vs. 不检测 表示(representation) - 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 分类(classification or categorization) - K近邻(KNN) - 神经网络(NN) - 支持向量机(SVM) - Boosting(Adaboost等) - 隐马尔科夫模型(HMM) -其他 生成学习(Generative learning)vs. 判别学习 (discriminative learning)
生成学习Vs.判别学习 ,两种分类器学习模式 〉生成学习 目标是学习到待合训练数据的类别模型 -如EM算法(Maximum Likelihood) 判别学习 口在训练阶段即考虑类别之问的判别信息、 ☐包括Support Vector Machines(SVMs),Boosting,Minimum Classification Error (MCE),Maximum Mutual Information (MMI),Lager Margin (LM),and etc. ,判别学习算法比生成学习算法表现出更好的分类性能
生成学习 vs. 判别学习 两种分类器学习模式 生成学习 ---目标是学习到符合训练数据的类别模型 --- 如EM算法(Maximum Likelihood) 判别学习 在训练阶段即考虑类别之间的判别信息 包括Support Vector Machines (SVMs), Boosting, Minimum Classification Error (MCE), Maximum Mutual Information (MMI), Lager Margin (LM), and etc. 判别学习算法比生成学习算法表现出更好的分类性能