极客公园微信号:geekpark GIF2017 提起虚拟个人助理(Virtual Personal Assistant,简称 VPA),估计大多数人很难产生一个非常直观的印象,但若说到科幻电影《她》里面那个声音性感的虚拟人物「萨曼莎」,j2直播,相信大家都是「心神向往」的。 Siri、Alexa、Cortana、Google Assistant ……过去几年,互联网公司纷纷推出了自有的语音服务,试图「教育」我们利用语音来解决很多问题。但现实情况是,它们的使用场景和承载设备在当下还比较有限,距离我们期待中的 VPA 形态还有不小的距离。 对于一直践行让 AI 技术落地更多智能设备的初创公司出门问问,对于 VPA 未来的发展有什么思考呢?以下内容根据出门问问(Mobvoi)创始人 & CEO 李志飞在极客公园创新大会(GIF 2017)的演讲内容整理而成。 大家好,我是出门问问的李志飞,今天很高兴跟大家跟大家一起做个分享。其实前面两个演讲(李飞飞、王小川)我都仔细听了一下,其实挺有感慨的,因为他们分享的内容都跟我有很大的关系。
其实从 2012 年到今天,大家发现有一个很大的变化:由于深度神经网络的应用,翻译的质量得到了大规模提升。很多时候技术是一个螺旋式上升的过程,所以当你遇到困难的时候,再耐心一点,很有可能就会有一些突破。 我自己由于从科研到谷歌翻译再到现在自己创业,今天主要想跟大家分享的是更接近现实的一些东西——出门问问在过去的四年都做了什么尝试?作为一个小小的创业公司,到底我们能够做一些什么样的事情,我们对整个行业有一些什么样的想法。 今天主要跟大家分享的话题,就是虚拟个人助理。 关于虚拟个人助理,大家其实已经讨论了很多年,包括大家去看很多自然语言处理的教科书,可能前几页就会讲到一个助理可以跟你对话,可以帮你完成很多工作,它基本上随时都在等待为你做一些事情。甚至有的像现在电影里面描述的,它是一个非常性感,甚至能够跟你产生情感的一个助理。 虚拟个人助理不是一个新的概念,所以很多人都对它有很高的期待。但是如果大家去看现实,其实还是有很多的问题,首先这个对话是非常难做的事情,基本上还是一种听不太懂、看不太懂的状态。比如说「Siri,Call me an ambulance」,Siri 可能理解为以后可以称呼你为「救护车」。 过去几十年人工智能遇到的最核心的问题,到现在仍然没有解决。自然语言理解背后的系统不具备简单的常识,也没有一些复杂的推理,以至于我们对这个世界的知识没有很好的表述方法。今天计算机系统还无法像人类一样,能够对世界知识有一个比较好的表述方式——基于现有的知识,我们能够去理解这个世界,并自己推理出新的知识。但今天的自然语言理解,坦白地讲离这一步还非常远。 机器终归是机器,我们想象中它能够颠覆人类或者是消灭人类,甚至跟我们产生情感,其实不管从真正的工程或到最后的代码层面上去看都是比较难实现的。因为机器跟人不一样,它没有直觉,也没有意识,更别说后面的情感或者是创意的一些想法。
其实就算是技术已经做到非常完美,前面两点都解决了,很多时候技术都是在跟人的习惯在做对抗,但习惯很难去改变的。比如说语音交互,当你习惯了用一个屏幕的方式,改变语言交互的形式很多人不一定会适应。所以就算技术问题解决了以后,实用性还是非常差。 上面是现在遇到的一些问题,那么虚拟个人助理的实用化还依赖于哪些进展? 第一,使用场景。今天我们的使用场景可能更多还是手机,但是前面提到在手机上面,当你习惯了用屏幕,而且 app 做得非常好的情况下,我们是不是真的需要一个语音对话的虚拟个人助理呢?这不是很确定的。 第二,我们需要的助理不是只是用来信息查询。比如说只是问一个天气,你打开 app 很快就能看到,也不需要跟它进行交互,但是可能更需要的是,比如说当我知道天气很冷的时候,它是不是自动能给我调温度,是不是真正能够帮你把这个事情做完,而不只是做事情的查询。 (责任编辑:本港台直播) |