上面这张图,这位女士正带着一台小型计算机Microsoft Band,上面有十几台传感器。在她运动的过程中,开奖,这些传感器在测量她的心率、跟踪她的路线等等……海量的数据由此产生。 而当这台设备与她的手机等其他设备进行同步,在云端可能有更多设备在为她服务,直播,这就是云计算。 云计算的能力包括核心CPU、内存、存储和网络,通常位于大型数据中心,这些数据中心基本上是包含大量计算设备的大型建筑,具有高度优化和精心管理的电源和冷却功能。 微软在世界各地拥有超过110个数据中心,我们的客户对我们的数据中心的使用正以每年一倍的速度增长。我们每个月都要向我们的数据中心添加更多计算机。这是我们一个数据中心的航拍照片: 涉及到数据中心这种大规模的工程背后还有许多棘手的科学问题有待解决,网络、分布式计算、容错、资源分配和调度,以及一系列基本算法问题等。所以,实现超大规模的计算能力是微软等顶尖公司的研究目标。 摩尔定律如今正在接近一些物理的限制,若要保持这一部分的增长,就必须为数据中心找到新的增长方法来提高计算能力。 今天,在微软的数据中心,我们正在部署基于现场可编程门阵列FPGA的新处理元件,以期实现人工智能超级计算机的计算需求。 此外,我们还在努力研究如何以环境可持续的方式驱动数据中心。 我们做了一些有趣的早期试验。 刘铁岩博士:Peter提到,为了推动计算机行业的持续高速发展,不仅要从事软件研究,也要反思硬件的局限性,发明更新型的硬件体系结构。这几年,微软在硬件方面的投入很多,包括用FPGA武装云计算的数据中心。FPGA是一种非常灵活的低功耗硬件,可以适应丰富的计算需求。我们研究院最近做了很多关于如何利用FPGA来加速深度学习的工作,让硬件的研究和人工智能研究无缝接轨。 数据中心的维护费用耗资巨大,如何降低服务器降温过程中的能耗问题十分关键。微软研究院的Project Natick项目创新地把数据中心置入大海,利用寒冷的海水冷却服务器,并用海浪为之提供电能,还可能减少近海大城市数据传输的延迟。 除了云计算之外,大数据和算法的进步也格外重要。特别是机器学习算法对人工智能的推动作用。 微软水下数据中心 【延伸阅读】: 这张图我们显示了机器学习的简化流程图。机器学习的一个应用方向是赋予机器理解人类语言的能力。我们搜集了大量音频数据及对应的文本数据作为训练数据,输入到机器学习算法中。该算法将“学习”训练数据中的模式,并从中创建称为“模型“的新算法,最终将该算法投入语音作为输入的系统中实用,并输出对应的语音翻译。 目前,这一技术已经成功应用在了微软实时语音翻译Skype Translator上了,目前已支持8种语言的实时语音翻译和50种语言的文本翻译。 刘铁岩博士:利用深度学习技术,微软研究院最近在语音识别上有了新的突破,识别了已经超过了人类的水平。而且也在积极推动这项技术的产业化。 “神经语音识别+神经机器翻译”是Skype Translator背后的秘密武器。我们亚洲研究院的自然语言处理组在神经机器翻译方面做了非常前沿的工作,也把翻译的范围拓展到了包括粤语在内的相对小的语种之中。我所在的机器学习组最近也在关注神经机器翻译,我们在今年的NIPS上发表了一篇通过增强学习(reinforcement learning)技术、从无标签数据中自动获得翻译能力的论文,它利用了机器翻译的对偶结构,取得了非常好的翻译精度。我们把这项技术成为Dual learning(对偶学习)。有兴趣的同学们可以关注一下。 【延伸阅读】 (责任编辑:本港台直播) |