动手学深度学习 16.目标检测,计算机视觉训练技巧 中文教材:zh.d2l.ai 英文教材:www.d2l.ai 教学视频:https:l/courses.d2l.ai/berkeley-stat-157/units/detection.html D2L.ai
动手学深度学习 16.目标检测,计算机视觉训练技巧 中文教材:zh.d2l.ai 英文教材:www.d2l.ai 教学视频:https://courses.d2l.ai/berkeley-stat-157/units/detection.html
概要 ·目标检测 ·边界框和锚框 ·交并比 。 区域卷积神经网络(R-CNN) ·单发多框检测(SSD) ·计算机视觉训练技巧 D2L.ai
概要 • 目标检测 • 边界框和锚框 • 交并比 • 区域卷积神经网络( R-CNN) • 单发多框检测(SSD) • 计算机视觉训练技巧
trtraff气e14ght59% 91 DR DUANE 目标检测 :99 erson. person:97 in
目标检测
truck traffic light 面国 car per son car car car bicycle car car car car ycle
图像分类 目标检测 Dog Dog Dog Cat D2L.ai
图像分类 目标检测
边界框和锚框 D2L.ai
边界框和锚框
边界框 60.45 ·一个边界框可以 由4个数字定义: 100 (左上角x, 200 左上角 , 300 右下角 X, 400 右下角y) (左上角x, 500 右上角y, 200 400 600 宽度,高度) 378,516 D2L.ai
边界框 • 一个边界框可以 由 4 个数字定义 : • (左上角 x , 左上角 y , 右下角 x , 右下角 y ) • (左上角 x , 右上角 y , 宽度,高度) 60, 45 378, 516
目标检测数据集 0 100 200 ·每行都有一个目标物体 300 ·图像名称,物体类别,边界框 400 500 COCO数据集(cocodataset..org) 0 200 400 600 ·80个物体 ·330K个图像 1.5M目标物体 Common Objects in Context D2L.ai
目标检测数据集 • 每行都有一个目标物体 • 图像名称,物体类别,边界框 • COCO 数据集(cocodataset.org) • 80 个物体 • 330K 个图像 • 1.5M 目标物体
锚框 ·目标物体检测算法: s=0.75,r=0.5 ·选择多个区域,称为锚框 s=0.75,r=1 5=0.75,r=2 5,r=1 。 预测每个锚框是否包含目 200 5=0.25,r=1 标物体 ·如果是,则预测从锚框到 300 实际边界框的偏移量 400 500 0 200 400 600 D2L.ai
锚框 • 目标物体检测算法: • 选择多个区域,称为锚框 • 预测每个锚框是否包含目 标物体 • 如果是,则预测从锚框到 实际边界框的偏移量
交并比 交并比(IoU)测量两个框之间 的相似性: 相交面积 ·0表示不重叠 ·1表示完全相同 ·Jaccard系数,给定集A和B: 相并面积 A∩B J(A,B)= IAUBI D2L.ai
交并比 • 交并比(IoU)测量两个框之间 的相似性: • 0 表示不重叠 • 1 表示完全相同 • Jaccard 系数,给定集A和B: �(�, �) = |� ∩ �| |� ∪ �|