「所有的实验室都配备了 DGX-1,并且 NVIDIA 已经为不同 GPU、Pascal 等优化了大多数的通用框架。我们在 DGX-1 上运行的任何东西都可以很容易地实现分布式。英特尔有自己的长远计划,并且并不是所有的这些计划都是公开的。我可以表明的是,我们正在与英特尔的所有适合的部门合作。」Stevens 说,他是 ANL 研究员和临床前筛选项目的领导者。 事实上,英特尔一直很忙,忙于购买 Nervana(一个用于深度学习的完整平台),最近又推出了扩展计划。Stevens 说:「他们谈论到为机器学习而优化的 Knights X 系列的版本。Knights Mil 是他们的线路图的第一个版本,」这个芯片巨头还在 SC16 上推出了深度学习推理加速卡;它是用于神经网络加速的基于现场可编程门阵列(field-programmable gate array (FPGA))的软硬件解决方案。Stevens 认为英特尔像 NVIDIA 一样,正在制定一个应用战略。 他说:「英特尔非常想尝试确定一种战略,以区分训练和推理平台之间的某些级别。大多数深度学习系统现在在『quasi』上做推理,它比用于训练的平台更小。英特尔希望确保『未来的 IA 架构擅长推理』」。 不足为奇的是现在人们花费了大量的精力用于评估来自谷歌、微软、Facebook 等公司的深度学习框架。Stevens 说:「我们也正在评估哪些框架最适合解决我们的问题,我们正在与供应商一起在硬件上优化它们。同时我们也与 Livermore 有合作关系,他们有一个内部的被称为 LBANN 的项目,该项目旨在构建一个可扩展的人工神经网络框架。」 「该计划是想以一种独立于框架的方式去开发我们的模型,所以我们可以在不需要重新编码我们的模型的情况下交换框架。这是一个非常常见的深度学习方法,其中有一个脚本层(ing layer)可以捕获您的模型的表示(用于训练和管理数据的元算法(meta algorithms)等),我们同时与学术界和 NVIDIA 在顶层的工作流引擎上进行合作。因此,我们有一种堆叠式架构(stacked architecture),它与深度学习全景周围的所有不同群体进行合作。」 Stevens 说:「有趣的是下一代平台的供应商强烈支持提高机器学习所需的架构理念和功能,以及传统的物理驱动仿真(physics-driven simulation)。」他指出,与传统 HPC 相比,深度学习的快速增长和市场压力正在推动它们朝着这个方向发展。「它也让我们洞察到了 DOE 应用的发展方向:将需要传统的物理驱动的仿真的地方,但通常我们也可以找到一个利用机器学习的方法。」 共享学习是试点项目的重要组成部分。Stevens 说:「我们正在为机器学习社区抽象模型问题,这也是我们正在研究的 seven candle benchmarks 的一种净化版本,」这将包括可分布式的数据、代码,这些内容都 将在 GitHub 上开放。这些元素的第一部分预计会在第二季度发行。 个别试点小组也正在与学术界开展自己的外联活动。在试点项目计算能力的方面,「我们瞄准了一些平台,特别是 CORAL 平台、Oak Ridge 和 Livermore 的新机器,然后最终选定百亿亿次(exascale)级。这是一个普遍化的概念,所以它不是具体的 GPU 或者具体的多少核。」 有趣的是,这三个项目计划会用不同的方式使用深度学习。
因为 RAS 是在分子尺度上的项目,所以它在所有项目中拥有最小尺寸规模。你可能听说过 RAS,它是一个著名的癌症基因,其编码会生成嵌入在细胞膜中信号蛋白(signaling protein)。这些蛋白质控制着可以延伸到细胞中并驱动许多不同的细胞过程的信号传导途径。RAS 目前涉及约 30% 的癌症,包括一些最棘手的癌症,例如胰腺癌。该试点项目将把模拟和湿实验室筛选数据进行结合,以详细阐述 RAS 相关信号级联的细节,并且希望可以找到用于制造能干预这种病症所使用的新药的关键点。 即使一个相对较小的肿瘤也可能有「成千上万个突变,包括驱动突变(driver mutation)和许多偶然突变(passenger mutation),」Stevens 说。这些遗传差异会改变信令网络(signaling network)的重要细节信息。多年来,RAS 本身及其相关信令网已经成为药物靶点,但正如 Stevens 指出的:「这种信令网的行为很不直观。有时如果你击中了其中一个下游组分,它其实会产生负反馈,这实际上增加了你试图去抑制的效果。」 (责任编辑:本港台直播) |