谷歌AlphaGo将在5月同柯洁进行“乌镇论剑”的消息,不仅让“围棋”成为焦点,更令原本就大热的“人工智能”再度升温。 自2016年3月AlphaGo击败围棋世界冠军李世乭后,全世界对人工智能的热情似乎被彻底点燃,层出不穷的“大事件”促进科技领域发生着深远变革。本文将集中盘点2016年5月——2017年5月,人工智能在学术研究方面取得的重要突破,以及国内外各种重量级会议中释放出的关于行业的前沿观点,藉此对人工智能在2017年的表现进行展望。 学术研究领域: 学术上的巨大成功无疑会推动产业的快速发展,人工智能产业界和学术界已经产生很多正向的“化学反应”,如深度学习的出现为人工智能的发展提供了良好的条件,而最终这些成果会被广泛运用到更多行业,以下是一些重要的学术研究突破: 神经机器翻译 2016年9月底,谷歌在 ArXiv.org 上发表论文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》,介绍谷歌的神经机器翻译系统(GNMT:Google Neural Machine Translation)。该系统使用了当前最先进的训练技术,实现了机器翻译领域的重大突破。经过在来自维基百科和新闻网站的样本句子上测定发现:GNMT 在多个主要语言对的翻译中将翻译误差降低了55%-85%以上。 11 月,atv,谷歌再发论文宣布了其在多语言机器翻译上的突破:实现了 zero-shot 翻译,这表明它可以一次性翻译一整段句子,而不只是像之前一样只能一个词一个词地翻译。 语音识别 2016年10月19日的一篇论文《Achieving Human Parity in Conversational Speech Recognition》中,微软人工智能与研究部门的一个研究者和工程师团队报告出他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(WER),达到了5.9%,这个数字已经等同于人速记同样一段对话的水平。这一里程碑将为能用语音识别来增强的消费和企业产品带来广泛的影响。 值得一提的是,2017年3月, IBM官方博客发文宣称IBM 的系统的词错率已经超越了之前微软报告的最佳水平,达到了5.5%。IBM方表示“要达到像人一样,仍然要付出更多努力”。 语音合成 2016年9月,谷歌 DeepMind 发布博客介绍他们在文本转语音系统上取得的重大进展。DeepMind 表示,他们最新的深度生成模型 WaveNet 将机器语音合成的表现与人类之间水平的差距至少缩减了50%。 进入2017年后,语音合成继续成为深度学习社区研究的重要领域之一,业界相继发表有关这一课题的研究论文,包括百度的Deep Voice、Yoshua Bengio团队提出的Char2Wav以及谷歌的Tacotron等。 深度学习诊断皮肤癌 除了上面提到了技术研究上的突破,深度学习在实际应用中也有重大的研究进展。其中,值得一提的就是,斯坦福大学的研究者成功训练了一个可以诊断皮肤癌的算法。该研究的相关论文《Dermatologist-level classification of skin cancer with deep neural networks》发表于2017年1月的Nature 封面上,该算法处理的是带有一个相关疾病标签的图像的原始像素。与其他训练算法的方法相比,该方法需要的处理非常少,也不需要在分类之前对图像进行分组,这允许算法处理种类更广泛的数据。该结果已经过了21位认证皮肤科医生的对比测试。在论文中的最常见的和最致命的皮肤癌的诊断上,该算法的表现已能媲美皮肤科医生。 国外重要会议观点: 国际顶尖行业会议的动态已经成为科技公司战略部署进展的风向标,人工智能观点的碰撞和对其趋势的预测,一次次推进着人类智能生活的进化: 微软Build2016开发者大会:人工智能将在该公司愿景中扮演重要角色 在2016年3月31日举办的Build 2016开发者大会上,微软CEO纳德拉表示,人工智能将在该公司愿景中扮演重要的角色。纳德拉称微软的AI计划为“对话即平台”,而这颗皇冠上的明珠最终被命名为微软Bot架构,直播,未来开发者可利用该工具将各种聊天机器人整合进自己的应用。 2016谷歌I/O开发者大会:机器学习和人工智能是谷歌未来10年的重点 (责任编辑:本港台直播) |