计算机视觉技术 •
OBJECT-NET物网视觉训练
什么是ObjectNet?
一种新型的视觉数据集,它借鉴了其他科学领域的控制思想。
没有训练集,只有测试集!让您的视觉系统步入正轨。
收集以有意在新背景下从新观点显示对象。
50,000个图像测试集,与ImageNet相同,具有旋转,背景和视点控件。
313个对象类和113个重叠的ImageNet
巨大的性能下降,这是您在现实世界中视觉系统所能期望的!
鲁棒的微调和一个非常困难的转移学习问题
控制偏差会增加差异
对人类容易,对机器很难
准备帮助开发考虑到健壮性,偏差和安全性的下一代对象识别算法。控件可以消除其他数据集机器学习的偏见,而不仅仅是视觉。
ObjectNet是用于对象识别的大型真实测试集,带有控制,对象背景,旋转和成像视点是随机的。
大多数科学实验都有控件,这些控件已从数据中删除,以确保受试者无法利用数据中的琐碎相关性来执行任务。从历史上看,大型机器学习和计算机视觉数据集缺乏这种控制。这导致必须对新数据集进行微调的模型,并且在数据集上的性能要比实际应用程序更好。在ObjectNet上进行测试时,由于对偏差的控制,对象检测器的性能相对于其他基准性能下降了40-45%。控件使ObjectNet具有微调的鲁棒性,仅显示很小的性能提升。
我们开发了一个高度自动化的平台,该平台可以通过众包图像捕获和注释来收集带有控件的数据集。ObjectNet与ImageNet测试集的大小相同(50,000张图像),并且在设计上没有与训练集配对以鼓励通用化。数据集比ImageNet更容易-对象在很大程度上居中且不受遮挡-并且由于控件的原因而变得更难。尽管这里我们专注于对象识别,但是可以在整个机器学习过程中使用自动化工具大规模地收集带有控件的数据,以生成以新方式行使模型的数据集,从而为研究人员提供有价值的反馈。