在这篇文章中,我向大家展示了一个在AWS Batch中运行支持GPU的作业的示例,使用MXNet作为深度学习库。AWS Batch揭示了框架原语,从而让你专注于为你的工作负载实施最有效的算法。它使你能够管理提交的作业的生命周期,并在指定的范围内动态调整作业的基础架构要求。利用AWS提供的计算实例,我们可以以一个经济高效的方式轻松利用其水平可扩展性。 另一方面,MXNet提供了一整套高度优化和可扩展的构建块来开始实现你自己的深度学习算法。总而言之,你不仅可以解决需要大型神经网络模型的问题,还可以通过利用Amazon EC2中看似无限的计算资源来减少迭代时间。 通过AWS Batch中以你的名义来管理资源,你可以轻松实施诸如超参数优化之类的工作负载,并行排列数十甚至数百个搜索,从而为你的问题空间找到最佳的模型参数集。此外,由于你的作业在Docker容器中运行,你可以选择与你的需求最匹配的工具和库,构建Docker映像,并使用你选择的映像提交作业。 我们鼓励你自己可以进行尝试,并且,我们十分希望你可以让我们知道你的想法! 机器人圈附上反馈地址,有兴趣尝试的圈友可以去留言 https://aws.amazon.com/cn/blogs/compute/deep-learning-on-aws-batch/?from=groupmessage&isappinstalled=0 (责任编辑:本港台直播) |