深度 | 变革的开始，深度学习将如何改变医疗成像领域？_本港台直播_J2开奖直播

深度学习在数据分析方面正在呈现持续增长的趋势，并被称为 2013 年的 10 项突破性技术之一 [1]。它是对神经网络的改进，包含更多的计算层，从而能够在数据中进行更高层次的抽象和预测 [2]。到目前为止，它正成为通用成像和计算机视觉领域领先的机器学习工具。

特别地，卷积神经网络（CNN）已经被证明是可用于许多计算机视觉任务的有利工具。深度卷积神经网络（Deep CNN）可以自动学习从原始数据（例如，图像）获得的中级和高级的抽象概念。最近的结果表明，从 CNN 提取的通用描述符（generic deor）在自然图像的对象识别和定位中非常有效。世界各地的医学图像分析组正在迅速进入该领域，并将 CNN 和其他的深度学习方法应用于广泛的应用当中。许多不错的成果正在涌现。

在医学成像领域，疾病的准确诊断或评估取决于图像采集和图像解译。近年来，随着技术的发展，设备能以更快地速率和更强大的分辨率来收集数据，这大大提高了图像采集的质量。然而，计算机技术对图像解译的改进，才刚刚开始。目前，大部分的医学图像解译都由医生来进行。可是，人类进行的图像解译因为其主观性、不同解读者的较大变化和产生的疲劳，往往是片面的。许多诊断任务需要初始搜索过程来检测异常，并且量化测量值和时间的变化。计算机化的工具，尤其是图像分析和机器学习，对改善诊断起到关键作用。他们通过帮助识别需要治疗的部位来支持专家工作流程。在这些工具当中，深度学习被迅速的证实了其作为基础的优越性，能够提高准确性。它还开辟了数据分析的新领域，并以一种前所未有的速度不断发展。

A. 历史上的网络

神经网络和深度学习背后的基本思想已经存在了几十年了 [3]。它们通常只有几个层。反向传播算法的出现，使得神经网络的性能有了显著的提升。然而，性能仍然不够。其他分类器逐渐发展开来，包括决策树、boosting 和支持向量机。其中每一个都已经应用于医学图像分析，特别是用于检测异常，而且他们也在分割（segmentation）等其它一些相关领域得到了应用。尽管取得了这样的发展，相对高的假阳性率依然很普遍。

早在 1996 年在 Sahiner 等人的工作中，CNN（卷积神经网络）就被应用在医学图像处理上 [4]。在这项工作中，从乳腺 X 光照片中提取包含活检证实的肿块或者正常组织的 ROIs（Region of Interests）。CNN 包含一个输入层、两个隐含层和一个输出层以及使用的反向传播。在这个前 GPU 时代，训练时间被描述为「计算密集型」，但是却没有给出具体的时间。1993 年，CNN 被用于肺结节检测 [5]。1995 年，CNN 被用于检测乳腺 X 光照片上的微钙化 [6]。

一个典型的用于图像处理的 CNN，其结构包含一连串卷积滤波器的层，夹杂着一连串数据压缩或者池化层。卷积滤波器（convolution filter）处理输入图像的一小块。类似于人脑的低级像素处理，卷积滤波器能够检测相关度高的图像特征，比如可以代表明显边缘的线或圆（例如用于器官检测）或者圆形（比如用于圆形的物体，像结肠息肉），然后是高阶特征比如局部或是全局形状和纹理。CNN 的输出通常是一个或多个概率或者图像对应的类别的标签。卷积滤波器能够直接从训练的数据当中学习。这正是人们所需要的，因为它降低了对很花费时间的手动标记特征的需求。如果不用卷积滤波器，那么在预处理图像阶段，针对特定应用设计的滤波器以及一些需要计算的特征是离不开这些人工特征的。

CNN 是高度并行化的算法。与单独的的 CPU 处理相比，使用 CNN 的实用性一大部分是来源于图像处理单元（GPU）促成的巨大的速度提升（大约 40 倍）。早期描述 GPU 对训练的 CNN 和其他机器学习技术价值的论文是在 2006 年发表的 [8]。在医学图像处理中，GPU 首先被引入用于分割、重建和配准，然后才是机器学习 [9]，[10]。有趣的是，虽然 Eklund et al. [10] 在他们的 2013 年的论文中广泛谈论卷积，但卷积神经网络和深度学习一点也没有被提及。这突出了深度学习的重大改革对医学图像处理研究的迅速调整有多迅猛。

B. 今天的网络

由于 CNN 的新变体的开发和针对现代 GPU 优化的高效并行求解器（parallel solver）的出现，深度神经网络最近已经获得了相当大的商业利益。CNN 的强大得益于它的深层架构，这让它在不同抽象级别上，提取一系列辨别特征。从头开始训练一个深层的卷积神经网络是一个巨大的挑战。首先，CNN 需要很大数量的标记数据，而这这在医学领域很难达到。这是因为请专家来进行标记是很昂贵的，并且疾病（比如，病变）的样本十分稀少。其次，训练深度 CNN 需要大量的计算和存储器资源，没有它们的话，训练的过程会非常耗时。第三，训练一个深度 CNN 经常由于过拟合和收敛问题而变得复杂化，通常需要对网络的学习参数或者架构重复调整以确保所有的层都以相当的速度学习。鉴于以上的困难，一些被称为「迁移学习（transfer learning）」和「微调（fine-tuning）」的新的学习方案被提出来提供解决方案，并且被越来越多的人接受。这些将在 II-C 节进一步讨论。

C. 医学领域的网络

(责任编辑：本港台直播)