MICCAI 2022 | 半监督医学图像分割的平滑性和类间分离研究
-
- 论文标题:Exploring Smoothness and Class-Separation for Semi-supervised Medical Image Segmentation
- 论文地址:https://arxiv.org/pdf/2203.01324.pdf
- 代码地址:https://github.com/ycwu1997/SS-Net
摘要
- 半监督分割在医学成像中仍然具有挑战性,因为标签医学数据量通常很少,并且在边缘附近或低对比度区域中存在许多模糊像素。
- 为了解决这些问题,作者主张首先约束具有和不具有强扰动的像素的一致性,以应用充分的平滑约束,并进一步鼓励类间特征分离,利用低熵正则化进行模型训练。特别是,通过同时探索像素级平滑度和类间分离,提出了用于半监督医学图像分割任务的SS-Net。像素级平滑迫使模型在对抗性扰动下生成不变的结果。同时,类间分离鼓励单个类特性接近其相应的高质量原型,以使每个类分布紧凑并分离不同的类。
- 根据公开的LA和ACDC数据集上的五种最新方法评估了SS-Net。在两个半监督设置下的大量实验结果证明了SS-Net模型的优越性,在两个数据集上都实现了最先进的(SOTA)性能。
算法
图2显示了SS-Net的整体架构。提出了两种设计来分别促进像素级平滑和类间分离。
首先,通过在原始图像x∈X及其带有像素对抗噪声的扰动样本之间应用一致性约束来强制像素级平滑度。
其次,从标记数据XL计算一组特征原型Z,然后鼓励高维特征F接近原型Z,以便在特征空间中分离不同的类。
像素级平滑
local distributional smoothness(LDS)对于半监督学习至关重要。这种正则化可以表示为:
这里D用于计算噪声样本的预测与其真实标签ˆy之间的差异,ϵ并控制噪声r的大小。由于在半监督场景中没有足够的真标签,所以通常将ˆy设置为伪标签p(ˆy|x)。本质上,LDS将模型正则化的更稳健。
同时,为了应用强扰动,遵循VAT模型,使用梯度g作为radv的方向来扰动原始样本x,可以估计为:
其中,rini可以设置为随机噪声矢量,g表示测量D时变化最快的方向,radv∈ Radv是相应的逆流噪声矢量。请注意,在原始VAT模型[14]中,D被用作K-L散度。然而,通过实验,作者发现K-L散度可能不适合分割任务。因此,利用骰子损失作为D来产生对抗性噪声,LDS损失变为
以这种方式,可以通过反向传播方案有效地计算g。与随机噪声相比,这种对抗性噪声可以提供更强的平滑度约束。
类间分离
当分割模糊目标时,仅执行LDS是不够的,因为决策边界附近的模糊像素很容易被分配给不确定的标签,这会混淆模型训练。因此,为了补充LDS,进一步鼓励特征空间中的类间分离。与直接将熵最小化应用于结果相比,该特征级约束对于半监督图像分割更有效[16]。
因此,采用基于原型的策略[1,27]来断开不同类的特征流形,这可以降低计算成本。
具体而言,首先使用非线性投影来获得投影特征F=Fl∪Fu 。然后,根据它们在目标类别中的正确预测来选择标记特征Fl的子集。接下来,通过C个注意力模块生成的排名得分对这些候选特征进行排序,排名前K的得分最高的特征最终被采用为高质量原型Z。
之后,利用当前的预测对各个类特征fc∈ F进行分组并迫使他们接近相应的原型zc∈ Z、 旨在缩小类内分布。使用余弦相似性计算zc和fc之间的距离,损失Lcs定义为
最后,总损失是分割损失Lseg和其他两个损失的加权和:
实验
Performance on the LA Dataset
Performance on the ACDC Dataset
Ablation Study