argoverse针对的任务:3d追踪和动作预测,两个任务对应的数据集其实是独立的,只是采集设备和采集地点一样而已。提供了360度的视频和点云信息,并根据点云重建了地图,全天候全光照。标注了视频和点云中的3d bounding box。3d追踪的数据集包含113段15-30秒的视频,动作预测中包含323,557段5秒的视频(总计320小时)。数据集的主要亮点还是在原始数据和地图的联动上。
streetscenes challenge framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 dsc-f717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关
本数据集来自于aim 2022 压缩图像和视频超分辨率挑战赛”中的前 5 名pg电子试玩链接的解决方案工作:swin2sr: swinv2 transformer for compressed image super-resolution and restoration please check our project swin2sr https://github.com/mv-lab/swin2sr ???? ????
svhn is a real-world image dataset for developing machine learning and object recognition algorithms with minimal requirement on data preprocessing and formatting. it can be seen as similar in flavor
3d-ircadb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3d ct 扫描组成。 20个文件夹对应20个不同的患者,可以单独下载也可以联合下载。下表提供了图像信息,例如肝脏大小(宽度、深度、高度)或根据 couninaud 分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度,甚至图像中的伪影。 for refer