基于尺度-时间网格的视频中物体检测算法,解决如何优化和平衡视频物体检测中精度和速度的难题.doc
《基于尺度-时间网格的视频中物体检测算法,解决如何优化和平衡视频物体检测中精度和速度的难题.doc》由会员分享,可在线阅读,更多相关《基于尺度-时间网格的视频中物体检测算法,解决如何优化和平衡视频物体检测中精度和速度的难题.doc(4页珍藏版)》请在三一文库上搜索。
1、基于尺度-时间网格的视频中物体检测算法,解决如何优化和平衡视频物体检测中精度和速度的难题在物体检测与识别领域,香港中文大学-商汤科技联合实验室在CVPR 2018发表论文,提出基于尺度-时间网格的视频中物体检测算法,解决如何优化和平衡视频物体检测中精度和速度的难题。本文为商汤科技CVPR 2018论文解读第6期。简介本文主要研究如何更好地优化和平衡视频中物体检测的准确率和检测速度。物体检测器为了达到高准确率,往往需要使用高性能的卷积神经网络来提取图像特征,导致检测速度难以满足实时性的需求。解决这个问题的关键在于寻求一种有效的方式,在准确率和检测速度之间作出平衡。为了寻找一个良好的平衡点,之前的
2、研究工作通常集中在如何优化网络结构上。本文提出一种新的方法,基于尺度-时间网格(Scale-Time Lattice,简记为ST-Lattice)来重新分配计算资源。提出的方法在ImageNet VID 数据集上达到了 79.6 mAP(20fps)和 79.0 mAP(62 fps)的准确率和速度。本文的主要贡献有:提出了尺度-时间网格,其为算法提供了丰富的设计空间来对物体检测性能进行优化;基于尺度-时间网格,提出了新的视频中物体检测的框架,实现了优异准确率和快速检测速度的平衡;设计了一些新的技术模块,包括高效的传播模块和动态的关键帧选取模块。基本思想视频中相邻帧之间有着很强的连续性和信息冗
3、余性,为了提高效率,应该充分利用这些性质来设计新的检测框架。之前的方法已经对视频中的物体检测作了很多探索,通常包含若干个步骤,例如基于单帧的物体检测,进行跨时间的传播和空间上位置的修正等,如何用一种更高效的方式将这些独立的步骤结合起来是一个值得研究的问题。本文提出的基本思想是在一个计算网格中对计算资源进行更好的分配,将精确但速度较慢的静态图像物体检测器应用于稀疏的关键帧上,然后利用一些简单高效的网络在时间和空间两个维度上不断地传播和修正这些检测结果,以达到更好的平衡。尺度-时间网格本文将尺度-时间网格表示成一个有向无环图(如图1所示)。图中的每一个节点都表示某个图像尺度和时间点的中间结果,即一
4、系列检测框。这些节点以类似网格的方式关联起来:从左到右遵循时间顺序,从上到下图像尺度(分辨率)逐渐提高。图中的一条边代表一个特定的操作,以一个节点的结果作为输入,输出另一个节点的检测结果。我们在图中定义两种操作,时间传播(temporal propagation)和空间修正(spatial refinement)。它们分别对应图中横向边和纵向边。时间传播是在同一图像尺度下,在相邻的帧之间进行检测框的传播。而空间修正是在同一帧下,对检测框的位置进行修正,获得更高图像尺度下的检测框结果。在尺度-时间网格中,检测结果会通过上述操作从一个节点传播到另一个节点,最终到达最底端的所有节点,也即在最大的图像
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 尺度 时间 网格 视频 物体 检测 算法 解决 如何 优化 平衡 精度 速度 难题
链接地址:https://www.31doc.com/p-3417378.html