点击切换搜索课件文库搜索结果(487)
文档格式:PDF 文档大小:421.95KB 文档页数:3
从手语识别的角度出发对中国手语的特征进行了分析,对现有的手语识别方法——基于计算机视觉的方法和基于佩带式输入设备的方法进行了分析和比较,并提出了一种新的手语分类方法
文档格式:PDF 文档大小:864.6KB 文档页数:7
针对高炉布料过程操作者无法直接观察炉内料流轨迹、料面形状等信息,利用光学原理,提出极坐标激光栅格测试技术,对料面进行标定测量.引入模式识别中的双目视觉技术进行轨迹检测,对布料轨迹图像采用边缘分析算子,优化算子阈值,获得布料过程中料流信息,重现料流轨迹的动态图像,为高炉布料模型提供数据支撑
文档格式:PDF 文档大小:753.13KB 文档页数:6
针对连续域函数优化问题,提出了一种新的全局极大值搜索方法——多感官群集智能算法(multi-sense swarmintelli-gence algorithm,MSA).受鱼群算法(artificial fish-swarmalgorithm,AFA)和FS算法(free search algorithm,FSA)的启发,MSA的搜索机制将大范围勘察和小范围精确搜索相结合,个体在使用视觉信息快速逼近局部较优解的同时,利用嗅觉信息避免群体过于集中并引导个体向全局较优解方向移动.仿真结果证明:MSA鲁棒性较强,全局收敛性好,收敛速度较快,收敛精度较高.最后,将该方法应用于前向神经网络训练,结果表明满足应用要求
文档格式:PDF 文档大小:642.12KB 文档页数:5
在发生火灾或地震的建筑物内,由于烟雾或墙体倒塌等原因,救援机器人往往无法通过视觉、超声和红外等传感器直接发现建筑物内不可见区域或者其他房间中呼救的目标.利用声音信号波长较长可以衍射绕过障碍物传播的特性,结合现有的语音识别技术,开发出基于听觉的救援机器人导航系统.该系统使机器人可以在全局运动控制中跟踪幸存者的呼救声并向幸存者移动.通过相关实验验证了基于听觉的救援机器人导航方法的可行性
文档格式:PDF 文档大小:549.76KB 文档页数:6
铁水扒渣检测系统是一套基于机器视觉的扒渣评级系统,其主要作用是采用高分辨率摄像器观察铁水罐中实时情况,通过工控机采集成像,分析图像中铁渣的厚度和范围,并对照评级工艺条件评判出扒渣的等级.本系统提高在线扒渣等级评判的自动化水平,降低工人经验判别不稳定因素的影响,实现工人的劳动保护
文档格式:PDF 文档大小:754.89KB 文档页数:8
在输电场景中,吊车等大型机械的运作会威胁到输电线路的安全。针对此问题,从训练数据、网络结构和算法超参数的角度进行研究,设计了一种新的端到端的输电线路威胁检测网络结构TATLNet,其中包括可疑区域生成网络VRGNet和威胁判别网络VTCNet,VRGNet与VTCNet共享部分卷积网络以实现特征共享,并利用模型压缩的方式压缩模型体积,提升检测效率,从计算机视觉和系统工程的角度对入侵输电场景的大型机械进行精确预警。针对训练数据偏少的问题,利用多种数据增强技术相结合的方式对数据集进行扩充。通过充分的试验对本方法的多个超参数进行探究,综合检测准确率和推理速度来研究其最优配置。研究结果表明,随着网格数目的增加,准确率也随之增加,而召回率有先增加后降低的趋势,检测效率则随着网格的增加迅速降低。综合检测准确率与推理速度,确定9×9为最优网格划分方案;随着输入图像尺寸的增加,检测准确率稳步上升而检测效率逐渐下降,综合检测准确率和效率,选择480×480像素作为最终的图像输入尺寸。输入实验以及现场部署表明,相对于其他的轻量级目标检测算法,该方法对输电现场入侵的吊车等大型机械的检测具有更优秀的准确性和效率,满足实际应用的需要
文档格式:PDF 文档大小:7.94MB 文档页数:6
非刚性图像配准一直是计算机视觉领域的研究重点. 为解决上述问题, 提出一种改进的光流场模型算法, 以提高光流估计的准确度. 算法首先对原始变分光流模型进行了改进, 提出利用新的各向异性正则项来代替原来的同向扩散函数, 以避免图像模糊, 保留图像的边缘特征与细节特征; 此外, 通过引入包含邻域信息的非局部平滑项来去除光流噪点, 同时增加了一个结合图像结构与光流运动信息的权函数, 以减少过平滑所造成的细节丢失, 提高算法的鲁棒性. 最后, 利用交替最小化与金字塔分层迭代策略相结合的方法求解位移场, 实现非刚性图像的自动配准. 仿真实验结果表明, 与传统方法相比, 本文算法对不同类型的非刚性图像均具有较高的鲁棒性, 取得了理想的图像配准效果
文档格式:PDF 文档大小:2.36MB 文档页数:11
深度神经网络近年在计算机视觉以及自然语言处理等任务上不断刷新已有最好性能,已经成为最受关注的研究方向.深度网络模型虽然性能显著,但由于参数量巨大、存储成本与计算成本过高,仍然难以部署到硬件受限的嵌入式或移动设备上.相关研究发现,基于卷积神经网络的深度模型本身存在参数冗余,模型中存在对最终结果无用的参数,这为深度网络模型压缩提供了理论支持.因此,如何在保证模型精度条件下降低模型大小已经成为热点问题.本文对国内外学者近几年在模型压缩方面所取得的成果与进展进行了分类归纳并对其优缺点进行评价,并探讨了模型压缩目前存在的问题以及未来的发展方向
文档格式:PDF 文档大小:956.71KB 文档页数:9
触觉作为人的一种独特的感官通道具有独特的优势,它不仅能最大限度的贴合人体的生理构造,传递硬度、大小、纹理、形状、温度等视听觉无法传递的信息,而且拥有快速准确的特性,触觉不仅可以实现全方位的感知,而且能够有效感知一些很难被视觉或听觉形式表达的更真实复杂的信息,和外界环境进行一系列的交互。振动触觉编码的设计是开发触觉的一个重要途径,也是未来人机交互的一种重要手段。本文从振动触觉感知机理入手,讨论了不同振动参数的振动触觉分辨率和振动信息编码理论,并按照方向导航和文字交互的应用对振动信息编码进行归纳总结,介绍了振动信息编码的实验手段和结论,最后展望了振动信息编码领域未来的发展前景
文档格式:PDF 文档大小:0.99MB 文档页数:9
多聚焦图像融合是计算机视觉领域中的一个重要分支,旨在使用图像处理技术将同一场景下的聚焦不同目标的多张图像中各自的清晰区域进行融合,最终获得全清晰图像。随着以深度学习为代表的机器学习理论的突破,卷积神经网络被广泛应用于多聚焦图像融合领域,但大多数方法仅关注网络结构的改进,而使用简单的两两串行融合方式,降低了多图融合的效率,并且在融合过程中存在的失焦扩散效应也严重影响了融合结果的质量。针对上述问题,在显微成像分析的应用场景下,提出了一种最大特征图空间频率融合策略,通过在基于无监督学习的卷积神经网络中增加后处理模块,规避了两两串行融合中冗余的特征提取过程,实验证明该策略显著提高了多张图像的多聚焦图像融合效率。并且提出了一种矫正策略,在保证融合效率的情况下可有效缓解失焦扩散效应对融合图像质量的影响
首页上页1819202122232425下页末页
热门关键字
搜索一下,找到相关课件或文库资源 487 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有