引言
无监督的语义分割是图像处中最具挑战的领域之一,在一些例如医学、生物或者深空探索等领域,对于图像的真实标注是无法获取的、不是完全可信的、又或者是压根的人都没见过的,即使真实标注是可知可控的,标注所需要的人力成本也是巨大的。于是,如果一个模型有无监督语义分割的能力,能在一定程度上给出基于模型自身“理解”的有意义的分割(这里的“理解”并不一定表示模型是强智能的、和人一样的理解,而是模型对于分割或者分类按照某种足够可信的方式组织完成的、或者说可以被人理解和认可的),就显得尤为重要。2022年,STEGO 就给出了这样一种尝试,在无监督语义分割上达到了 SOTA 的性能。