该部分的第二位嘉宾是百度硅谷人工智能实验室总监 Adam Coates,Adam 主要介绍了让深度学习惠及 1 亿人的想法 – 让语音识别既多样又快捷:同传统的 ASR 方法相比,深度学习有很多优点,比如准确率高,利于扩大数据量等 ( Scaling )。 最后一位嘉宾是来自亚马逊的资深首席科学家 Nikko Ström。Nikko 以「Jeff Dean 也用我们的产品是个巨大的胜利」轻松开场。Nikko 之后回顾了 Alexa 中深度学习技术的发展,以及巨大的存储与分布式训练模式,Alexa 的唤醒原理以及语义理解过程,并且介绍了有韵律地阅读内容。下一步 Alexa 的目标是更准确识别不同方向不同源头的音源,或者在两人对话过程中判断识别出两个人。 在之后的讨论环节,各位嘉宾关于聊天机器人取代手机应用的看法进行了探讨。 邓力表示很多手机应用没有被使用过,通过手机接入网站的比例也非常低,atv,这就给聊天机器人留下来空间。Adam 则表示顶尖的应用程序还会被保留,因为较好的视觉反馈会很有吸引力。Nikko 提到这就是他们做 Alexa 的目的之一,用户不需要下载,安装和调试任何应用。 机器之心将在之后对本部分分享内容进行更加详尽的重现报道。
谷歌大脑 Lukasz Kaiser:自然语音处理
大会第一天下午的第一位嘉宾是来自谷歌大脑高级研究科学家,NLP 专家 Lukasz Kaiser。Lukasz 分享了在多年实践后,他对深度学习与 NLP 的看法和经验。 首先,Lukasz 明确了 NLP 具体需要处理哪些问题,比如语音标记,解析,语言模型等。在面对不一样大小且不断变化的输入输出,RNN 可以很好的起到作用,一种 Encoder-Decoder ( Sequence-to-sequence) 的构架应运而生(此处我们之后会有详细解读,尽情关注)。 在这种高级的 Sequence-to-sequence 的 LSTM 框架下,Lukasz 又举了具体例子来说明,各种场景均有应用且效果不错。最后 Lukasz 也指出了这种方法的局限性:速度慢和需要大量数据。 机器之心将在之后对本部分分享内容进行更加详尽的重现报道。 计算机视觉
下午的第一个论坛是关于计算机视觉,大会邀请到了 OpenCV 的创始人兼首席执行官 Gary Bradski,Bosch 的首席科学家任骝和谷歌计算机视觉负责人 Jay Yagnik。 Gary 主要分享了 OpenCV 3+的最新情况,OpenCV 3+ 将会支持硬件加速,更好的校正,将利用 DNN 和 Tiny-DNN 技术。 第二位嘉宾 Jay 主要介绍了机器理解的演进和未来,包括不同的应用场景如视频理解,手写识别等,以及深度学习在该领域的应用。 视觉部分最后一位嘉宾任骝主要介绍了传感器可意识的增强现实技术,该技术与机器学习配合可以让我们更好的处理人机接口(HMI)问题。 麦肯锡自动化报告 之后登场的同样是一位重量级嘉宾——来自 McKinsey 的 MGI 总监,高级合伙人 James Manyika。他分享了关于 AI 对就业及市场驱动因素的影响:技术和经济会起到主导因素。对这份报告感兴趣的读者可以参考之前机器之心的。 物联网: 人工智能硬件不能遗忘的 4S 机遇
下面一组嘉宾是物联网方面的专家,包括来自 Bosch 的数据科学负责人 Mohak Shah,来自 Intel 的深度学习架构师 Andres Rodriguez 以及来自中国的企业——文安科技创始人及首席执行官陶海。 (责任编辑:本港台直播) |