本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】业界 | ARM推出新一代移动端CPU和GPU:提升机器学习效率(2)

时间:2017-05-31 19:30来源:天下彩论坛 作者:开奖直播现场 点击:
我们之前的性能测试给出了 A73 和 A72 比较的混乱结果——在整型数任务上 A73 超过 A72 一点点,而在浮点数负载下则落后 A72 一点;鉴于它们的微架构之间

我们之前的性能测试给出了 A73 和 A72 比较的混乱结果——在整型数任务上 A73 超过 A72 一点点,而在浮点数负载下则落后 A72 一点;鉴于它们的微架构之间的显著不同,所以这样的结果并不让人惊讶。A75 的表现则好多了,至少在 ARM 的数据上是这样:其在整型数和浮点数任务以及 memory streaming 上的表现都显著优于 A73。

  

码报:【j2开奖】业界 | ARM推出新一代移动端CPU和GPU:提升机器学习效率

上图给出了在 10nm 节点上以 3 GHz 速度运行的 A75 实现了在 10nm 节点上以 2.8 GHz 速度运行的 A73 更好的性能和同样的效率,这意味着 A75 功率更大。但基于这张简单的图,我们很难说清超过多少。我们知道 A73 在使用 4 个核时有热限制(尽管比 A72 的少),atv,所以 A75 肯定一样好。但这并不是一个常见情形。大多数移动负载在一个时间点一般仅在较短时间内使用 1 到 2 个核。ARM 显然使用了 A73 的额外热余量来提升性能,而不会给持续性能带来负面影响。

  

码报:【j2开奖】业界 | ARM推出新一代移动端CPU和GPU:提升机器学习效率

ARM 希望将 A75 推到更大的 form-factor 设备,且功率预算通过将主频提高而超过移动端的 750mW/core。这就像 Chromebook 或其他 2 合 1 的便捷式产品。在 1W/core 功率上,A75 要比 A73 高 25% 的性能,而在 2W/core 的功率上,A75 的优势在于运行 SPECint 2006 时效率提升了 30%。这些数字表明了将性能仅仅和主频挂钩并不好的原因——因为动态功率呈指数级变化。

ARM 针对适用于移动端的 A73 设计,很大一部分聚焦于能源效率和移除一些对其他应用有用的特征以简化设计,包括在一级缓存移除 ECC 和 256 位 AMBA 5 CHI 端口的选项等。因为有了 A75,A72 就有了一条明确的升级路径。对于服务器和基础架构市场,A75 支持所有级别缓存的 ECC/parity 和用于连接到大型 CCI、CCN 或 CMN fabrics 的 AMBA 5 CHI。对于自动化和其他关键安全应用,该芯片有架构性 RAS 支持,这样就保护了免受数据中毒的影响并提升了错误管理。在原文接下来的几页中,其深入探讨了 ARM 新 IP 的技术细节,包括 DynamIQ、Cortex-A75 和 Cortex-A55。

新的 Mali GPU 拥有 32 个渲染核心、提升了 25% 的能源效率和 20% 的性能密度(performance density/每 mm?2;空间的性能)。Mali-G72 是 ARM 提升机器学习效率的核心,ARM 声称其在机器学习基准上要比 G71 优秀 17%。其公司的优化设计更多地是为加速推断引擎而不是训练引擎而量身定做。也就是说,ARM 的芯片更多地用于累积机器学习性能而不是发展它们,因此其能更好地支持移动应用。而训练人工智能可以更多地交给英伟达和 AMD 的 GPU 或谷歌为 TensorFlow 定制的 TPU。

  原文链接:

  更多有关GMIS 2017大会的内容,请点击「阅读原文」查看机器之心官网 GMIS 专题↓↓↓

  

码报:【j2开奖】业界 | ARM推出新一代移动端CPU和GPU:提升机器学习效率

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容