MICCAI2022 | 使用几何学习对放射治疗分割误差进行自动识别
-
论文标题:Automatic Identification of Segmentation Errors for Radiotherapy Using Geometric Learning
论文地址:https://arxiv.org/pdf/2206.13317.pdf
代码地址:https://github.com/rrr-uom-projects/contour_auto_QATool
摘要
- 背景介绍: 使用卷积神经网络(CNN)在CT扫描中自动分割危险器官(OAR)正被引入放射治疗工作流程。
- 现存问题: 这些分割仍然需要临床医生在临床使用前进行手动编辑和批准,这可能很耗时。
- 解决方法: 这项工作的目的是开发一种工具,在没有标签的情况下自动识别3D OAR分割中的错误。作者的工具使用了一种结合CNN和图形神经网络(GNN)的新颖架构来利用分割的外观和形状。
- 通过消融测试评估了模型的有效性,评估了结构不同部分的有效性以及从定制前置任务中迁移学习的使用。最佳性能模型预测腮腺错误,内部和外部错误的准确率分别为85.0%和89.7%,召回率分别为66.5%和68.6%。该离线QA工具可用于临床,通过检测需要关注的区域,可能减少临床医生校正轮廓的时间。
算法
自动QA工具使用多种形式的输入信息:分割结构的形状信息和来自周围CT扫描外观的信息。为了训练,使用了一个带有分割的公共数据集,并生成了具有实际错误的附加分割。
数据集
使用了一个公开可用的数据集,其中34个头颈部(HN)CT扫描,重新采样为1×1×2.5 mm体素间距。34个HN CT中的每一个都有两名医生进行的OAR分割。使用了一位医生对左右腮腺的分割作为标签。对于给定的患者,左右腮腺为双侧结构,且大多对称。然而,患者之间的腺体形状差异很大。将所有患者数据横向翻转,以创建68个左腮腺地面真实分割的数据集。
生成训练数据集
为了创建包含分割误差的训练样本的大数据集,扰动了腮腺的标签(图1a)。实际上,创建了真实分割的signed距离变换,并添加了结构化噪声体素。通过从正态分布中提取噪声,然后将正态分布与振幅为7.5mm的高斯核卷积,使用marching cubes algorithm提取扰动分割,以获得三角形网格。应用连通分量算法来消除任何不连通的伪分割。为了简化网格,应用了100次Taubin平滑迭代和二次误差度量抽取,将网格大小减小到∼1000个三角形,然后进行最后10次Taubin平滑迭代。对每个真实分割进行100次扰动,以生成6800个腮腺的数据集。
然后,为每个受干扰的分割确定节点类。计算每个节点到地面真实分割的signed最近距离,将其分为五类(如图1所示)
用于轮廓误差预测的混合CNN-GNN模型
提出的方法来执行逐节点分类,并做出与真实分割的signed距离相对应的预测,而无需明确了解地面真实(图1b)。
使用了编码器、处理器和解码器结构。图2显示了模型结构的示意图,它由CNN编码器、GNN处理器和多层感知器(MLP)解码器组成(图2,分别标记A、B和C)。将以每个节点为中心的5×5×5体素CT子体素提供给CNN编码器,该编码器是两个3D卷积层的特征提取器,以产生逐节点表示。GNN采用这些表示并在连接的节点之间执行消息传递,根据每个节点的本地邻居更新每个节点的表示。MLP采用最终表示来预测节点分类。
CNN编码器将允许从CT扫描外观中获取上下文,而GNN处理器将利用输入的几何结构,并在意识到局部邻域的情况下进行逐节点预测,类似于主动外观模型。
对于GNN处理器,使用SplineConv层来执行消息传递。SplineConv是用于几何输入的传统CNN卷积层的推广。局部邻域中的节点特征由B样条连续核函数加权,然后由可训练权重集参数化。如何在相邻节点之间聚集节点特征是由空间关系决定的。使用范围[0,1]上的3D笛卡尔伪坐标对每个节点的相对空间位置进行编码。在GNN层中,使用了加法聚合操作,因为这已被证明可以产生最具表现力的GNN模型。模型中的所有样条Conv层都使用样条阶数2,核大小5,然后是LeakyReLU激活函数和批归一化。
CNN预训练
预训练是一种流行的迁移学习技术,其中训练模型执行前置任务,以学习一组特征,这些特征在应用于主要任务时对模型有帮助。应用它来初始化模型的CNN编码器的权重。
设计了一个定制的前置任务:将3D CT斑块分为腮腺边界的“开”或“关”(图3),就是判断是否为边界。
实验