体感传感器与3D视觉交互 信息与通信工程学院潘哗 电子特战女草 in内0xt由iand hdervp d0in
体感传感器与3D视觉交互 信息与通信工程学院 潘晔
计算机视觉概述 Computer Vision COMPLETE 是什么? Staf 为什么? Marie Souza 怎么实现? 电子特战女学 in内0xt由iand hdervp d0in
计算机视觉概述 Computer Vision 是什么? 为什么? 怎么实现?
人与机器不同: [[oo]o2]o]g[4 [[阿 ]][4 [2[阿 []]2] [2]][[4 ][o ]]]]的4 我们眼中的图像 计算机“眼中”的图像 http://open.163.com/movie/2015/3/Q/R/MAKN9A24M MAKN9QAQR.html 电子科战女草 in内0xt由iand hdervp d0in
我们眼中的图像 计算机“眼中”的图像 人与机器不同: http://open.163.com/movie/2015/3/Q/R/MAKN9A24M_MAKN9QAQR.html
原因与技术 Question1:为什么要让计算机“眼中"”的图像是这个样子?(Why) Question2:实现这些设想需要哪些技术支撑?(hat) Question3:这些技术又是怎样实现这些处理转化的?(HoW) [o[阿ooo[阿购 Why [阿的][ [▣]的]]购 What?How? ▣][4 电子科战女学 我们希望的计算机“眼中”的图像 in内0xt由iand hdervp d0i同
What? How? Why? 原因与技术 Question1:为什么要让计算机“眼中”的图像是这个样子?(Why) Question2:实现这些设想需要哪些技术支撑?(What) Question3:这些技术又是怎样实现这些处理\转化的?(How) 我们希望的计算机“眼中”的图像
计算机视觉 人脑中大约70%的信息是来自于眼睛。大概20-30%的皮层区域是做视觉处理的。 计算机视觉是人工智能的核心技术。机器要像人一样,会看,会听,会说,会 学习,会思考等等。 自动驾驶 智能监控 智能机器人 行人检测 电子科战女学 in内0xt由iand hdervp d0in
自动驾驶 智能监控 智能机器人 行人检测 计算机视觉 人脑中大约70%的信息是来自于眼睛。大概20-30%的皮层区域是做视觉处理的。 计算机视觉是人工智能的核心技术。机器要像人一样,会看,会听,会说,会 学习,会思考等等
计算机视觉 除了这些新事物需要计算机视觉技术的支持,我们日常生活中也到处充 满了视屏与图像,数量庞大的图像也需要新技术来帮我们分类、处理。 中中央电提丝候20171.21 CHEST PA 电子科战女学 i内0xt由impiand hdervp0ig
除了这些新事物需要计算机视觉技术的支持,我们日常生活中也到处充 满了视屏与图像,数量庞大的图像也需要新技术来帮我们分类、处理。 计算机视觉
计算机视觉技术发展 20世纪60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸 如立方体、楔形体、棱柱体等多面体的三维结构; 70年代中期,麻省理工学院(MT)人工智能(A)实验室正式开设“机器视 觉”(Machine Vision)课程,由国际著名学者B.K.P.Hom教授讲授; 80年代以来,计算机视觉的研究已从实验室走向实际应用的发展阶段; 近几年Deep Learningl的出现、大数据和云计算的支撑,使得计算机视 觉各方面都得到了快速的发展: 图像分类:2015年微软ResNetI以96.43%的正确率超过人类的94.9% 图像检测:SSD达到精度75.1%,速度23帧/秒 图像分割:牛津大学CRF as RNN达到74.7%的平均精度 图像标注:可用于图片搜索, 谷歌、百度微软、UCBerkely、多伦 多大学等都在研究 文字生成图像:图像标注的逆过程,最新算法是用SRGAN.生成图片 物体跟踪:TCNN —VOT2016冠军,效果最好; DSST一VOT2016冠军,速度快达到100fps。 电子科战女草 i内0xt由impiand hdervp0ig
计算机视觉技术发展 • 20世纪60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸 如立方体、楔形体、棱柱体等多面体的三维结构; • 70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视 觉”(Machine Vision)课程,由国际著名学者B.K.P.Hom教授讲授; • 80年代以来,计算机视觉的研究已从实验室走向实际应用的发展阶段; • 近几年Deep Learning的出现、大数据和云计算的支撑,使得计算机视 觉各方面都得到了快速的发展: • 图像分类:2015年微软ResNet以96.43%的正确率超过人类的94.9% • 图像检测:SSD达到精度75.1%,速度23帧/秒 • 图像分割:牛津大学CRF as RNN达到74.7%的平均精度 • 图像标注:可用于图片搜索,谷歌、百度微软、UCBerkely、多伦 多大学等都在研究 • 文字生成图像:图像标注的逆过程,最新算法是用SRGAN生成图片 • 物体跟踪:TCNN——VOT2016冠军,效果最好; DSST—— VOT2016冠军,速度快达到100fps
计算机视觉与其他领域的关系 人工智能 壁芙制 信号处理 机器学习 计算机 视觉 机器视觉 物理学 图象处理 数学 神经生物学 成像技术 电子转战女学 in内0xt由iand hdervp d0i同
计算机视觉与其他领域的关系
Why is CV difficult? 1 Challenges:viewpoint variation Challenges:illumination 3 Challenges:scale ④ Challenges:deformation 5 Challenges:occlusion 6Challenges:background clutter ⑦Challenges:Motion ⑧) Challenges:object intra-class variation ⑨ Challenges:local ambiguity Forsyth Ponce,Computer Vision:A Modern Approach 电子科战女草 behr0ket:tenf0i同
Why is CV difficult? ① Challenges: viewpoint variation ② Challenges: illumination ③ Challenges: scale ④ Challenges: deformation ⑤ Challenges: occlusion ⑥ Challenges: background clutter ⑦ Challenges: Motion ⑧ Challenges: object intra-class variation ⑨ Challenges: local ambiguity • Forsyth & Ponce, Computer Vision: A Modern Approach
Challenges:viewpoint variation 电子科皮女学 Michelangelo 1475-1564 slide credit:Fei-Fei,Fergus Torralba
Challenges: viewpoint variation Michelangelo 1475-1564 slide credit: Fei-Fei, Fergus & Torralba