据悉,DINOv2采用了一种新的高性能计算机视觉模型的方法,无需微调具备自我监督学习(SSL),可以从任何图像集合中学习。还可以学习当前标准方法无法学习的特征,
例如,深度估计
这使得DINOv2的应用范围非常广泛,例如,通过简单的指令和提示构建虚拟现实世界,这将加速元宇宙的构建效率;世界资源研究所通过DINOv2绘制森林地图。
Meta对此模型宣传规格极高,由扎克伯格亲自宣布DINOv2:具有自我监督学习的最先进的计算机视觉模型。摘录几点如下:
1、DINOv2是一种训练高性能计算机视觉模型的新方法。
2、提供强大的性能并且不需要微调。这使得它适合用作许多不同计算机视觉任务。
3、因为它使用自我监督,DINOv2 可以从任何图像集合中学习。它还可以学习当前标准方法无法学习的特征,例如深度估计。
4、DINOv2 补充了我们最近的其他计算机视觉研究,包括 Segment Anything。
Segment Anything是一个可提示的分割系统,专注于对不同分割任务集的零样本泛化。DINOv2 与简单的线性分类器相结合,在分割子领域之外的多个任务中取得了很好的结果,产生了横向影响。