本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】Kaggle百万美元大赛优胜者:如何用CNN识别CT图像检测肺癌?(2)

时间:2017-05-08 08:25来源:本港台现场报码 作者:118KJ 点击:
LUNA16 v2数据集的标签是直接从LUNA16传来,一般是多个结节检测系统错误标出的假阳性结节。要注意的是,部分结节是上面提到的不到3名医生标记的结节。

  LUNA16 v2数据集的标签是直接从LUNA16传来,一般是多个结节检测系统错误标出的假阳性结节。要注意的是,部分结节是上面提到的不到3名医生标记的结节。我保留了这些结节标记,是为了平衡那些可疑的假阳性结节。

  为了得到肺部轮廓,我需要得到非肺组织的底片。我使用了论坛中提到的简单肺分割算法,在分割掩边缘周围进行采样标注,从而分割得到肺部组织。

  在进行第一轮训练之后,我在LUNA16数据集上进行结节预测,得到了所有假阳性结节,也并入LUNA16 v2数据集中。

  随着比赛的进行,我想建立第二个模型。对于这个模型,我做了放射科医生的工作,在NDSB数据集上训练网络。我手动地从癌症样本中选择明显的阳性结节,并从非癌症样本中选择假阳性结节,用这些数据训练了第二个模型。我希望效果不错,但我是一个不合格的放射科医生,实际上第二个模型比无手动标注的模型要糟糕得多。但是结合这两个模型,这个得到的融合模型比单独的模型效果更好,所以我保留了第二个模型。

  我简单地建立了一个结节观察器,来调试所有的标记。在观察时,我注意到医生忽略了一些大于3cm的大结节。在LIDC数据集的说明文档中,我发现医生被要求忽略掉大于3cm的结节。我担心这些被忽视的结节区域会迷惑分类器,故删除了相重叠的底片。下面是肺部CT图像的一些截图。

  

wzatv:【j2开奖】Kaggle百万美元大赛优胜者:如何用CNN识别CT图像检测肺癌?

  图2:图像中的标记。

  左上:LUNA16 v2数据,右上:非肺组织的边缘,

  左下:假阳性的区域,右下:被移除的无标注区域。

  3D卷积神经网络的训练方法和网络结构

  在一个高质量的训练集下,我们仍需要多次调整来有效地训练神经网络。数据集的两类样本量严重不平衡,正反两类样本量的比为5000:500000,且正面例子的大小和形状有很大差异。我曾考虑使用U-net网络,但2D U-net不能完全利用结节本身的三维结构信息,3D U-net网络的训练过程非常缓慢而且不灵活。我不使用U-net的主要原因是不需要建立细粒度的概率图,而只是一个粗略的检测器。在CT图像的滑动窗口中,建立小型的3D Convnet,这更加轻便和灵活。

  我的第一个目标是训练一个可作为基础的结节检测器。我先要对正面例子进行过采样,将正反两类的样本比上调到1:20。为了提高模型的泛化能力,我尝试了一些图像增强操作,但是只有一些无损的操作是有用的。最后我用了大量的转化操作和所有3D翻转操作。

  设计好分类器后,我想训练一个用于估计恶化程度的回归模型。将肿瘤恶化程度分为从1(很可能不是恶性)到5(很可能是恶性的)。为了强调肿瘤的恶性程度,我将标签平方,范围扩大为从1到25。最开始,我考虑了分阶段的一种方法,用第一个网络来分类节点,然后训练另一个网络估计结节的恶化程度。为了缩短计算时间,我尝试只用一个网络,以多任务学习的方法,同时进行训练这两个任务。当编程实现后,我发现这个方法简单快速,网络的效果也很好。

  通常,神经网络的结构是比赛和案例研究中最重要的成果之一。对于这场比赛,我在神经网络的结构上花费的时间相对较少,因为已经有很多优秀网络可供参考。刚开始我使用了一些简单的VGG网络和Resnet网络的相似结构,但是它们的性能大致相同。然后我尝试用一个预训练好的C3D网络,原有的网络权重根本没有帮助,但直接初始化权重后,这种网络结构的效果很好。基于C3D网络进行若干次调整后,我得到最终的分类评估网络。

  我首先调整了输入大小,设置为32x32x32 mm。这看起来可能太小,但是在后续的网络层中加入一些技巧,发现这种维度的实际效果很好。这个想法是保持一切轻量化,并在比赛结束后再建立一个更大输入维度的网络。但是由于Daniel的网络输入是64x64x64 mm,我决定保持目前的输入大小,使网络的输出互补。接下来我立即对z轴进行平均池化操作,使得每个体素表示2mm的区域。这进一步减少了网络的参数量,并没有影响到精度,因为在大多数扫描中,z轴会比x轴和y轴更粗糙。最后,我在网络顶部引入了64个节点的全连接层。这里,我们不是直接预测恶性肿瘤,而是通过训练图片的中级特征,输出结节的恶化程度。

  

wzatv:【j2开奖】Kaggle百万美元大赛优胜者:如何用CNN识别CT图像检测肺癌?

  表2:3D Convnet的网络结构示意图

  有趣的插曲:“奇怪组织”检测器

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容