伯克利发布最大规模也是最多样化的驾驶视频数据集.doc
《伯克利发布最大规模也是最多样化的驾驶视频数据集.doc》由会员分享,可在线阅读,更多相关《伯克利发布最大规模也是最多样化的驾驶视频数据集.doc(4页珍藏版)》请在三一文库上搜索。
1、伯克利发布最大规模也是最多样化的驾驶视频数据集近日,伯克利大学发布了BDD100K,一个目前来说最大规模也是最多样化的驾驶视频数据集,这些数据具有四个主要特征:大规模,多样化,在真实的街道采集,并带有时间信息。数据的多样性对于测试感知算法的鲁棒性尤为重要。利用这个数据集,你还可以参加伯克利在CVPR 2018 举办的自动驾驶竞赛,其在在arXiv上也发表了相关的介绍文章。BDD100K: A Large-scale Diverse Driving Video Database伯克利大学发布了BDD100K,一个目前来说最大规模也是最多样化的驾驶视频数据集,其中包含了丰富的各种标注信息。论文:B
2、DD100K: A Diverse Driving Video Database with Scalable Annotation Tooling大规模,多样化,驾驶,视频:Pick Four自动驾驶有望改变每个人的生活。然而,最近的一系列自动驾驶事故表明,还不清楚一个人造的驾驶感知系统如何才能能够避免在人类看来是明显的错误。作为计算机视觉研究人员,BAIR有兴趣探索最前沿的自动驾驶感知算法,使其更安全。为了设计和测试潜在的算法,BAIR希望利用来自真实驾驶平台收集的数据中的所有信息。这些数据具有四个主要特征:大规模,多样化,在真实的街道采集,并带有时间信息。数据的多样性对于测试感知算法的鲁棒
3、性尤为重要。但是,当前的开放数据集只能覆盖上述属性的一个子集。因此,在Nexar【4】的帮助下,BAIR发布了BDD100K数据库,这是迄今为止计算机视觉研究中规模最大,最多样化的开放式驾驶视频数据集。该项目是由Berkeley DeepDrive【5】工业联盟组织和赞助的,该组织负责研究计算机视觉和汽车应用机器学习领域的最新技术。图:随机视频子集的位置。正如名称所示,BAIR的数据集包含100,000个视频。 每个视频长约40秒,720p,30 fps。视频还附带了由手机记录的GPS/IMU信息,以显示粗糙的驾驶轨迹。我们的视频是从美国各地收集来的,如图所示。BAIR的数据库涵盖了不同的天气
4、情况,包括晴天、阴天和雨天,以及白天和夜间的不同时段。下表总结了与以前的数据集的比较,这表明BAIR的数据集更大、更多样化。图:与其他一些街景场景数据集比较。很难公平地比较数据集之间的images,但我们在这里列出它们作为粗略参考。这些视频及其轨迹可以帮助我们模仿学习驾驶法规,如BAIR在CVPR 2017论文【6】中所述。为了便于对大规模数据集进行计算机视觉研究,BAIR还在视频关键帧上做了基本的标注,详见下一节。 您现在可以在【1】下载数据和标注。标注(Annotations)我们在每个视频的第10秒采样一个关键帧,并为这些关键帧提供标注。它们分别在多个层次上被标记:图像标记,道路对象边界
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 伯克利 发布 最大 规模 也是 多样化 驾驶 视频 数据
链接地址:https://www.31doc.com/p-3377198.html