本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:业界 | 剖析用于深度学习的硬件:GPU、FPGA、ASIC和DSP

时间:2017-04-03 20:15来源:本港台直播 作者:j2开奖直播 点击:
我喜欢深度学习... 深度学习最近取得的成功势不可挡:从图像分类和语音识别到图片标注、理解视觉场景、视频概述、语言翻译、绘画,甚至是生成图像、语音、声音和音乐! …而我

我喜欢深度学习...

深度学习最近取得的成功势不可挡:从图像分类和语音识别到图片标注、理解视觉场景、视频概述、语言翻译、绘画,甚至是生成图像、语音、声音和音乐!

…而我想让它运行得飞快!

其成果令人震惊,因而需求就会增长。比如你是谷歌/ Facebook / Twitter 的工作人员:在你找到一种「阅读」图片或视频内容的方法来建立一个更贴近用户特征(他们的喜好、谈论对象、推荐、分享的内容)的模型之后,你会做什么?你可能会想做得更多!

或许你会使用 ResNet / Xception / denseNet 的某个版本来将用户图片分类为成千上万个类别。而如果你是某个互联网巨头企业的一员,你拥有许多的服务器和服务器群组,因而理想情况下你希望在这个现有架构上运行深度学习算法。然这种方法曾经很有效……直到你意识到自己用来分析文本语法结构的这些服务器现在所不得不进行的运算是你之前运行单一图像分类所需操作次数的一百万倍以上。而用户产生的数据则流动得越来越快:现实生活中每过一分钟就会产生 300 小时时长的视频!

服务器群组会消耗大量的功率,并且如果我们需要使用大量基础设施来处理图像和视频,那么我们就需要建立大量的发电装置,或是使用效率更高的方式在云端进行深度学习计算。能耗问题很难解决,因此我们最好走提高效率的路线。

然而对于需要更多用于深度学习解决方案的硬件和优化型芯片的领域来说,数据中心只是其中的一个方面。1000 瓦的计算系统对于自动驾驶汽车来说或许可行,但在许多其它的应用中,功率是一个很大的限制。比如无人机、机器人、手机、平板电脑和其它的移动设备。它们都需要几瓦甚至不到 1 瓦的功率预算才行。

还有很多消费类电子产品,比如智能相机、增强现实眼镜等设备,它们需要小功率,并且由于隐私问题,用户们可能不会想要采用云计算解决方案。

随着我们的家变得越来越智能,你会发现许多设备都会需要连续地使用深度学习应用、收集和处理数据。

那么…你就需要新的硬件,对吗?

所以我们需要新的硬件,一个比 Intel Xeon 所驱动的服务器更加高效的硬件。一个英特尔服务器 CPU 可能会消耗 100-150 瓦功率并需要一个有着冷却装置的超大系统来支持其性能的正常发挥。

还有哪些其它的选择?

图形处理器、GPU

现场可编程的逻辑器件、FPGA(现场可编程门阵列/Field-Programmable Gate Array)

定制芯片、特殊应用型集成电路、ASIC、芯片系统或 SoC

数字信号处理器、DSP

未来的、外星人发明的、由新的物理定律所发展出的技术

GPU

GPU 最早是为生成基于多边形网络的计算机图形而设计的。在最近几年,由于近来计算机游戏和图形引擎领域的需求和复杂度需要,GPU 积累了强大的处理性能。英伟达是 GPU 领域的领军者,能生产有数千个内核的处理器,这些内核的设计工作效率可以达到 100%。实际上这些处理器也非常适用于运行神经网络和矩阵乘法方面的计算。注意,atv,矩阵向量的乘法运算被认为是「尴尬的并行(embarrassingly parallel)」,因为它可以通过简单的算法扩展被并行化(它们缺少分支因而可以避免缓存信息丢失)。

Titan X 是训练深度学习模型的一个最得力的助手。它拥有 3500 多个内核,每秒能够执行超过 11 万亿次浮点运算。更多测试性能方面的信息请参考这里(https://github.com/soumith/convnet-benchmarks)。

由于 GPU 的超多核(~3500 个,对比 Intel Xeon 的 16 个/ Xeon Phi 的 32 个),英特尔的 CPU 和英伟达的 GPU 之间的竞争助长了后者的发展,使其 GPU 比 CPU 在时钟频率快 2~3 倍。GPU 核是更为复杂(分支预测和流程)的 CPU 核的流线型版本,但是前者许多都支持更高级别的并行运算,因而拥有更好的性能。

这种 GPU 很擅长训练深度学习系统——卷积神经网络或者循环神经网络。它们可以在仅仅几毫秒之内就运行一批 128 或 256 张图像。但是它们同时也会消耗大约 250 瓦的功率并且需要一个完整的计算机来支持运行,这又消耗了额外的 150 瓦的功率。一个高性能的 GPU 系统至少需要消耗 400 瓦的功率。

这并不适用于增强现实眼镜、无人机、手机、移动设备和小型机器人。甚至对于未来的消费级自动驾驶汽车来说也是不可接受的。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容