图4B显示了 Intel Stratix 10 FPGA 和 Titan X GPU 在 ResNet-50上的性能和性能/功耗比。即使保守估计,Intel Stratix 10 FPGA 也比 Titan X GPU 性能提高了约60%。中度和激进的估计会更好(2.1x和3.5x的加速)。有趣的是,Intel Stratix 10 750MHz的激进预估可以比 Titan X 的理论峰值性能还高35%。在性能/功耗比方面,从保守估计到激进估计,Intel Stratix 10 比 Titan X 要好2.3倍到4.3倍。 6 FPGA如何在研究测试中堆叠 微信编辑器 构思编辑器 结果表明,Intel Stratix10 FPGA的性能(TOP /秒)比稀疏的、Int6 和二进制DNN的GEMM上的 Titan XPascal GPU分别提高了10%、50%和5.4倍。在三进制 Res Net 上,Stratix10 FPGA 的性能比Titan X Pascal GPU 提高了60%,而性能/功耗比好2.3倍。结果表明,FPGA 可能成为下一代DNN 加速的首选平台。 7 深层神经网络中FPGA的未来 微信编辑器 构思编辑器 FPGA 能否在下一代 DNN 的性能上击败 GPU ?Intel 对两代 FPGA(Intel Arria 10和 Intel Stratix 10)以及最新的 Titan X GPU 的各种新兴DNN的评估显示,目前DNN算法的趋势可能有利于FPGA,而且FPGA甚至可以提供卓越的性能。虽然这些结论源于2016年完成的工作,Intel 团队在继续测试 Intel FPGA 的现代 DNN 算法和优化(例如,FFT / winograd 数学变换,量化,直播,压缩)。 该团队还指出,除了DNN之外,直播,FPGA在其他不规则应用以及延迟敏感(如ADAS和工业用途)等领域也有机会。 “目前使用32位密集矩阵乘法的机器学习是GPU体现优势的领域”,Randy Huang博士表示:“我们鼓励其他开发人员和研究人员与我们一起重新表述机器学习问题,以充分发挥 FPGA 更小位数处理能力的优势,因为 FPGA 可以很好地适应向低精度的转变。” (责任编辑:本港台直播) |