Quadro GP100 面向不同用户。对于那些需要一台适合 GP100 显卡工作站的计算机用户来说,Quadro GP100 就是他们的选择。它能提供所有 GP 100 的核心功能,atv直播,包括 ECC 存储器,半速 FP64,倍速(打包)FP 16 指令集。另外一个杀手锏就是,Quadro GP100 为 PCIe 引入了一个新的 NVLink 连接器,能让一对 Quadro 在一种双向 NVLink 配置中连接起来,这样 PCIe 就有了低延迟数据传输的好处,也可以接入 NVLink 存储器。很显然,这是目前 Tesla PCIe 显卡所不具备的。 正如英伟达所言,这款产品会很受计算机用户欢迎,他们对此很有信心,理由也很充分。Tesla P100 已经成了神经网络程序员中的抢手货,现在,研究人员们又有了适合工作站的显卡。 与此同时,该产品的第二市场也是传统的高端 CAD/CAE 市场。对于那些需要快速 FP64 性能和 ECC 存储器的工作站显卡(为了实现最大的精确性和可靠性)的特别用户来说,Quadro GP100 是第一个自 K6000 后提供此种功能的 Quadro 显卡。可以说,这是一个利基市场,因为几乎所有的 CAD 用户都不需要那种可靠性,但是,对于那些从事复杂工程模拟之类工作的用户来说,这个产品非常具有吸引力(更别提这是英伟达的又一个利润市场了)。满足这一市场需求也让 Quadro GP100 显得与众不同,因为这是唯一的一款开启图形功能的 GP100 显卡。 不过,当涉及到图形工作载荷时,Quadro GP100 和 P 6000 之间的区别就变得很模糊了。Quadro P6000 能够达到 12Tflops 的 FP32,而 GP 100 的描述是「大于 10 Tflops」, 同样 Quadro GP100 的纹理吞度量大约能达到这个数字的 83%。当然,纸面性能并非全部,但是,在纯信号吞吐限制场景下,P6000 的速度会更快。这也是更加紧凑(以及可制造)GP102 较之庞大的 GP100 的优势所在。
这里,一个出其不意的设计是 HBM2 存储器以及相关的 ROPs。英伟达正在专门兜售 Quadro GP100,在合适的适用场景下,能提供最快的诠释性能。英伟达并没披露 Quadro GP100 的官方存储频率,不过,如果类似 Tesla 对应的产品,那么,每秒达 720G,Quadro P6000 仅达每秒 432G。加上 ROP 计数上的优势——英伟达仍然没有披露 GP100 的 ROP 计数,不过,根据我们对 GP102 架构的了解,128ROP 的猜测是靠谱的——而且,Quadro GP100 纯像素处理能力要比 P6000 强劲 60%。考虑到 CAD/CAE 任务非常依赖于像素处理能力,对于某些 Quadro 用户来说,这是一个摸得到的优点。 它的一个缺点是存储容量。虽然由于 GDDR5X 更好的实际容量 Quadro P6000 能提供 VRAM 24 GB,但和所有的 GP100 产品一样,Quadro GP 100 最多是 HBM2 16GB。 这意味着对大数据集用户而言,单个 Quadro GP100 是好的选择,只是比 P6000 能获得的容量更小一点。值得一提的是,英伟达正在兜售 NVLink 帮助解决容量问题,但或许这种问题根植于计算,而非图显中。
除了 GPU 底层,Quadro GP100 集成了 Quadro 系列硬件所有典型的特征。这包括 4 DisplayPort 的 1.4 端口、显示输出的单个 DVI 端口,英伟达也把它分类为 VR Ready 系列产品。同时,显卡后方是 Quadro Sync 和 Stereo 连接器(connectors) 分别进行同步更新与四倍缓冲立体(quad-buffered stereo)。 同今天发布的其他 Quadro 显卡一样,英伟达希望 Quadro GP100 能赶在今年三月份发货。目前价格尚未确定,但因为 Quadro GP100 是 GP100 显卡的公版,据悉它的价格将会比 Quadro P6000 稍微高一些。 ©本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |