李杉 编译整理 量子位 报道 | 公众号 QbitAI 上周,英伟达刚刚发布了性能提升5倍的GPU新架构Volta、Tesla V100深度学习加速处理器以及搭载Volta GPU的新超级计算机DGX-1、工作站DGX Station。 今年年初就在CES透露了新GPU架构的AMD,有点坐不住了。 在今天的财务分析师会议上,他们展示了公司接下来在数据中心、CPU、显卡等领域的一系列新品发布计划,atv直播,其中关注度最高的,是Vega架构的第一款新卡Radeon Vega Frontier Edition。 另外,AMD还公布了在机器学习ROCm开源软件栈方面取得的进展,在提及Vega Frontier的用途和目标用户时,也处处强调机器学习。 Vega新卡
Radeon Vega Frontier Edition是一个用于工作站的GPU,瞄准机器学习开发环境。AMD表示,Vega的战略是提供比英伟达Pascal更好的性能,而性价比则达到后者的两倍。 AMD高级副总裁、首席架构师Raja Koduri在Vega Frontier的介绍文章中称,在机器学习和专业图形领域,它是全球最快GPU。 下表,是目前已知的Vega Frontier参数: 计算单元 64 单精度计算性能(FP32) ~13 TFLOPS 半精度计算性能(FP16) ~25 TFLOPS 像素填充 ~90 Gpixels/sec 内存容量 16 GB高带宽缓存 内存带宽 ~480 GBs/sec 《福布斯》网站把Vega Frontier和英伟达Tesla P100的性能进行了对比,结果如下:
开奖,性价比是N厂两倍" src="http://www.wzatv.cc/atv/uploads/allimg/170517/20392DM8_0.jpg" /> 虽说Vega Frontier性能超越了英伟达上一代PASCAL架构的P100,不过与刚刚发布的Volta架构Tesla V100相比,还有一定的距离。 根据英伟达上周宣布的参数,V100的单精度计算性能(FP32)和半精度计算性能(FP16)分别是15TFLOPS和30TFLOPS。 AMD希望吸引那些想要评估Vega机器学习产品的研发人员,帮助其开发开源软件和库。 值得注意的是,AMD希望通过两种方式来降低拥有成本:一是基于Zen的Naples服务器CPU具备较低的价格和较高的I/O容量,二是高性价比的Vega机器学习GPU。 AMD去年12月发布了Radeon Instinct MI6、MI8和基于Vega的MI25,同时表示Vega有望在2017年中发货。MI25的定位是对计算密集型任务展开训练,对手则是基于Pascal的英伟达Tesla P100。 《福布斯》评论说,这些新的Vega GPU似乎将具备与备受赞誉的英伟达PASCAL GPU比肩的性能。与AMD开发的优化版ROCm机器学习软件配合后,该公司向着进军这一市场迈出了坚实的第一步。 但最终还要取决于ROCm开源软件利用硬件的潜在性能发挥实际价值的能力。 ROCm机器学习软件 AMD去年开始利用开源Linux驱动器、库和工具打造关键的机器学习软件生态系统。该公司已经展示了这项工作取得的良好进展,这对于把硬件的理论配置转化成应用级人工智能性能至关重要。 AMD在该公司的财务分析师大会上透露,随着库的优化,该公司的软件性能自从11月以来提升了13至16倍。 AMD高管还规划了软件产品路线图,详细阐述了将于今年夏天发布的Caffe2、Tensorflow、PyTorch和MXNet,从而对Vega形成支持,另外还有经过优化的ROCm解算器。
△从去年11月到今年3月,AMD通过优化机器学习库,将软件性能提升了13-16倍 结论 AMD认识到英伟达在机器学习市场大幅领先的地位,并且花费数年时间研发了软件和硬件,而且刚刚发布了新的高端Volta GPU。但机器学习市场仍然很年轻,增长很迅猛,AMD仍拥有与英伟达竞争的空间。 因此,AMD还是要进入这个市场,追击一下英伟达。 AMD似乎正在硬件、软件和开发者关系上努力打好基础,希望借此吸引企业用户。该公司已经完全调整和优化了软件栈,并且设计了新的GPU,针对机器学习算法进行了优化。 最重要的是,决定开发开源软件使得整个行业生态系统都可以为该公司的发展计划提供动力。 (责任编辑:本港台直播) |