摘要:
这篇论文介绍了 Segment Anything (SA) 项目:用于图像分割的新任务、模型和数据集。
在数据收集循环中使用高效模型,构建了迄今为止最大的分割数据集,在 1100 万张许可和尊重隐私的图像上有超过 10 亿个掩码。
该模型被设计和训练为可提示的,因此它可以将零样本转移到新的图像分布和任务中。
该文评估了它在众多任务上的能力,发现它的零样本性能令人印象深刻——通常与之前完全监督的结果具有竞争力,甚至优于之前的结果。
该文将在此 https URL 上发布 1B 掩模和 11M 图像的 Segment Anything Model (SAM) 和相应数据集 (SA-1B),以促进对计算机视觉基础模型的研究。