数据集介绍 近年来,人们对将计算机视觉技术集成到零售行业产生了新的兴趣。自动结账 (aco) 是该领域的关键问题之一,旨在从要购买的产品图像中自动生成购物清单。这个问题的主要挑战来自产品类别的大规模和细粒度特性,以及由于产品的不断更新,难以收集反映真实结账场景的训练图像。尽管具有重要的实践和研究价值,但这个问题在计算机视觉社区中并没有得到广泛的研究,主要是由于缺乏高质量的数据集。为了填补这一空白,
该数据集已特别针对非洲地区进行了改进。 两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。 该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。
streetscenes challenge framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 dsc-f717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关
argoverse针对的任务:3d追踪和动作预测,两个任务对应的数据集其实是独立的,只是采集设备和采集地点一样而已。提供了360度的视频和点云信息,并根据点云重建了地图,全天候全光照。标注了视频和点云中的3d bounding box。3d追踪的数据集包含113段15-30秒的视频,动作预测中包含323,557段5秒的视频(总计320小时)。数据集的主要亮点还是在原始数据和地图的联动上。