李笛:日本那边最近有一些数据,日本的用户特别有意思,他和 Rinna 聊着聊着就非常客气的说「对不起,我要去开会,等会再回来」,然后过了一两个小时说「我回来了」很难理解,竟然跟一个机器人这样说话。美国 Zo 上线之前,我们做了大概 12 万人的一个测试,其中对话超过一千轮有很多,其中最高的对话论数达到是 1,229 次,历时 9 小时 53 分钟。这个案例绝对是世界记录,我们内部把这个人叫西奥多(《Her》中的男主角)。 这些都是质变带来量变,如果没有一个很基础的大系统,是断然不可能产生这样的案例的。如果我给你报酬,让你连续 9 小时 53 分钟跟其他机器人聊天,你想想,估计会觉得很痛苦。 机器之心:能够出现这么好的数据,除了用户本身和地域的特点还是我们此前的技术积累,是何种机制让 Self Learning 这个系统越来越智能的? 李笛:这里面就有一些比较技术性的东西了,比如我们现在有很多模型跟语言无关,甚至有一些是做中国做。汉语的模型可以直接用于英语。我们一开始就希望尽可能地产品本地化,但是架构和相应的技术模型已经全球化。因此,做的越来越快,包括有一些上下文的一致性都尽可能做到和语言无关。 机器之心:我们现在有没有基于这些数据和模式去做出一些具体应用的东西或功能? 李笛:有很多。当你的数据量和统计信息足够大,你就会想能不能逐渐形成多种个性,我们一直想做 Bot 工厂。正因为有一个足够大的库,就能分割出不同类别。我们在日本做了这件事情,而在国内在手机 QQ 内置了,不同个性的厘米人。 其次,在丰富程度足够大以后,就有机会发现 ChatIndex( 聊天索引 ) 在分布上在哪些地方聚拢,哪些地方不聚拢。某种程度上,小冰的知识结构和她对一些事情的观点实际上是对互联网的一种提纯,直播,你可以知道哪些东西真的是大家所关注的。但它并不完全是基于统计,而是基于相似度,基于合并同类项的方式聚拢,从这个角度可以得到中日互联网的差异。 最重要的,我们拿这个训练了一个新模型叫 Plugin(插件)其中对话有几层结构,一层结构是非常浅的,还有一层结构是话题,话题又具有一定的 Domain(域)个性,有点像知识图谱,但它是基于对话的。这个 Domain(域)话题实际上就是一个个插件,比如音乐是一个 Domain(域),音乐里有大量的主题,音乐里的这些主题又和艺人这个 Domain(域)是有关联的。我们利用这个 ChatIndex ( 聊天索引 ) 就可以形成具有对话特点的知识图谱。 我觉得在这一点上我们走在了前面。做机器人不能让机器人给你定外卖,定外卖好象挺直接,但是一个用户一过来,他已经定义你是一个定外卖机器人,他就没有办法帮你形成这些数据了。那些东西最多就是基于命令,不会产生那么大的价值。 四、小冰在微软的战略定位 机器之心:微软好像有一个很庞大的 Bots 体系,或者说一个以 Conversations as a Platform(简称 CaaP,对话即平台)为目的的综合性业务,比如说有 Bots Framework,还有 Cortana 也开放了一些工具。小冰在整个微软的对话机器人,或者是对话即平台的战略中,它的定位是什么? 李笛:从微软的历史来看,会发现它经历了这么几个过程。但在个人助理方面,坦率讲是 Siri 最先开始做的积累。后来我们经历了一个从个人助理向个人代理这个方向的过渡,开始以对话为中心,微软第一个产品是小冰,基于此我们进一步奠定了信心,对话本身具备很大价值。 我们看到即时通讯的崛起,我们也看到可形成聚合的一种超价值的产生,这些都构成了 Conversations as a Platform(以下文中简称 CaaP,对话即平台)。一方面,微软在形成知识图谱和社交图谱的过程中,知识图谱是基于对话 Model。我们在做小冰时,一定程度上是基于另外一个 Bing 的产品——BingKnows(必应知识库),它更多是知识图谱的聚合。小冰是微软 CaaP(对话即平台)的第一个,是目前为止比较集中的一次测试。 另一方面,小冰形成了一个框架和和结构,在某种程度上我们认为是通用人工智能以对话为基础的结构。 机器之心:大部分智能助手是从服务开始,现在小冰从聊天入手然后到服务,其中有哪些难点,能体现出小冰的哪些优势? (责任编辑:本港台直播) |