本数据集共有 1224 张图像来自四个公共图像数据集:coco、voc07、imagenet 和 sun。amazon mechanic turk 工作人员将每个图像标记为包含 0、1、2、3 或 4 个以上的显着对象。可以在imgidx.mat中找到此标签信息以及边界框注释,一个存储图像信息的matlab结构数组。mso 数据集是 sos 数据集测试集的子集。波士顿大学的团队删除了一些显着对象严
该数据集是麻省理工学院提供的原始数据。室内场景识别是高层次视觉中一个具有挑战性的开放性问题。 大多数适用于室外场景的场景识别模型在室内领域表现不佳。主要困难在于,虽然一些室内场景(例如走廊)可以通过全局空间属性很好地表征,但其他的(例如书店)可以通过它们包含的对象更好地表征。 更一般地说,为了解决室内场景识别问题,我们需要一个可以利用局部和全局判别信息的模型。 该数据库包含 67 个室内类别,
数据集介绍: 数据来自 lytro illum,捕获为 40mp 图像,然后转换为 5mp rgb d 图像。 第二个数据集来自 lenovo phab2(project tango),它利用双图像传感器重新创建大型 3d 结构的点云。这些以 .ply 和 .obj 数据集的形式提供
该数据集包含 12,500 张带有细胞类型标签 (csv) 的增强血细胞图像 (jpeg)。4 种不同细胞类型中的每一种都有大约 3,000 张图像,这些图像被分组到 4 个不同的文件夹中(根据细胞类型)。细胞类型是嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞。该数据集附带一个额外的数据集,其中包含原始 410 幅图像(预增强)以及两个额外的子类型标签(wbc 与 wbc),以及这 410 幅图像
数据集介绍 近年来,人们对将计算机视觉技术集成到零售行业产生了新的兴趣。自动结账 (aco) 是该领域的关键问题之一,旨在从要购买的产品图像中自动生成购物清单。这个问题的主要挑战来自产品类别的大规模和细粒度特性,以及由于产品的不断更新,难以收集反映真实结账场景的训练图像。尽管具有重要的实践和研究价值,但这个问题在计算机视觉社区中并没有得到广泛的研究,主要是由于缺乏高质量的数据集。为了填补这一空白,