事实证明,atv,使用64个vCPU不利于深入学习,因为当前的软件/硬件架构无法充分利用所有这些,并且通常会导致与32个vCPU完全相同的性能(或更差)。在平衡训练速度和成本方面,训练模型与16个vCPU +编译的TensorFlow似乎是赢家。编译的TensorFlow库的30%-40%的速度提升是一个意想不到的惊喜。 这里显示的成本优势只能在可抢占的情况下才是有价值的, Google Compute Engine上的常规高CPU实例价格约为5倍,因此可以完全消除成本优势。 来源: (责任编辑:本港台直播) |