当然,以后人类可能会发展出更高效的人机、人人交互方式,比如直接用脑电波进行交互(想想三体人)。但这个目前看还是需要段时间的。在此之前, 对话交互是最高效的人人交互方式,也将成为最高效的人机交互方式。 各种对话交互(Bot)平台 首先需要承认,现在机器的智能还非常有限,它们没法和人类做到什么都能聊 (开放域对话交互),但是在某些小的垂直领域它们已经能和人聊的很好 (任务导向对话交互)。这种现状应该还会持续一段时间。现在大部分Bot领域的公司做的事都是与任务导向对话交互相关。 那怎么开发任务导向的对话机器人系统呢?如果你只是想让机器人用在一个固定领域或固定企业业务,那么你针对此领域或此企业业务进行技术优化即可。这时候使用的技术可以具有领域特性,不需要能够推广到其他领域或者其他业务。这里最有代表性的是Google的Gmail和Allo中的Smart Reply功能。 如果你的系统是帮助其他开发者更便捷地开发对话机器人,即Bot创建平台,那么使用的技术就最好不要与某个领域或业务有关。国外比较典型的是Facebook的Wit.ai和Google的Api.ai,国内也有不少创业公司在做这方面的事,比如一个AI、知麻、如意等,基本处于起步阶段。 篇幅有限,接下来我们只讨论第二类对话系统,即Bot创建平台,对Gmail和Allo的Smart Reply感兴趣的同学可以看看我之前写的《Google的智能问答技术》。 不同的Bot平台:可控性与智能性的权衡 企业通常会更关注自己bot的可控性,也即掌控力度,在出现问题时必须快速定位并解决。企业宁愿bot答不上来,也不能允许它瞎答。而用户当然希望bot能解答自己的各种问题,所以bot一定是越智能越好。但可控性和智能性本身就是一对互相矛盾的性质,智能本就包含了不可控。我一直记得K.K.在《失控》中的一个观点: 智能来自于失控。 基于可控性和智能性的矛盾性,再考虑到现阶段技术的可行性,各种bot平台能做的就只能是在可控性和智能性之间找平衡点了。技术的发展只是会不断拓展可控性和智能性的帕累托边界而已。 下面介绍几类典型的bot平台:微信与旺旺、Viv、Api.ai与一个AI、Wit.ai,它们似乎大不相同,其实也只是在可控性和智能性之间的权衡不同罢了,见下图。 一个bot平台想要获得更好的智能性,那它就要付出可控性的代价。(一个AI放在api.ai上面倒不是说现在它的智能性比api.ai强,而是表明我们对一个AI的定位,希望它能在中文方面做得比api.ai好。)把Gmail的Smart Reply功能放在图中的原因是把它作为其他bot平台的参照对象。作为特定领域的bot,它能够更好地兼顾可控性和智能性。
下面分别介绍这几类bot平台 一、极度可控的微信和旺旺 其实我们早就在用各种bot服务了,这些bot太不智能以至于我们都没把它们往bot这个方向上想。比如各种电话服务里的操作步骤,旺旺里商家维护的常见问题列表,微信公众号里的菜单和功能编码:
这些bot虽然不智能,但是却很有用,因为它们很可靠,不会犯错误。我们点击微信里的菜单,获得的响应一定是公众号管理者设定好的那个反馈,不会因为系统理解错而出现管理者不希望出现的东西。 二、较可控和较智能的Api.ai和一个AI Api.ai目前应该是美国最流行的bot创建平台。9月19日,Api.ai宣布自己被Google收购。相比于Viv,api.ai的优势是简单和可控,它里面的每个意图通常只包含一轮对话,开发者只需要维护其中的 用户提问、机器回复、动作,以及涉及到的 实体。这样系统可以依据用户设定的这些数据训练模型以便在服务时预测用户输入对应的意图和识别包含的实体。 在接收到用户输入后,系统会分析用户的输入,预估用户的意图,以及识别输入中包含的实体,这些实体是在达成意图时需要的。下图给出了完成一次请求时的大致流程和一个示例。 (责任编辑:本港台直播) |