本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

时间:2017-07-04 20:46来源:本港台现场报码 作者:j2开奖直播 点击:
此公开课为极客公园策划的「极客公开课·Live」第八期。三角兽首席科学家王宝勋将为大家教授聊天机器人的两种技术路线及对比,自动聊天系统中的主要问题及解决方案(短文本语

此公开课极客公园策划的「极客开课·Live」第八期。三角兽首席科学家王宝勋将为大家教授聊天机器人的两种技术路线及对比,自动聊天系统中的主要问题及解决方案(短文本语义关系计算、基于 IR 自动聊天框架下的上下文相关模型、聊天系统评价方法等),还有目前聊天机器人面临的主要挑战(公开数据集和评测方法、聊天过程中的主题切换、与用户的情感沟通)。

什么是「极客公开课」?

1 位技术产品大牛和 10 位优秀技术产品人围绕技术产品相关话题,面对面深度分享和讨论,共同创造更优的知识与更高的学习效率。

而现在,这种深度的交流方式属于每一个人,知乎 Live 同步线上实时问答,随时随地参与提问互动,与数百人共创一本知乎 live 版的「课堂笔记」

每周 1 次,全年 50 场,极客公开课,推动产品人的自我迭代

以下为本期课堂笔记精华摘要:

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

背景介绍

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

聊天机器人应该有的基本的能力和状态是什么样子的。

第一,它应该能够跟人进行持续的聊天对话,它对应的是后面面临的几个关键的问题。

第二,我们需要在用户可能任何的 query,有一个合理的回答,你不能要求一个用户说,你只能跟我聊这个话题,不能聊别的,我可以跟聊天机器人说任何东西,你都能接住,理想的情况是这样。最后,最好是能考虑到用户的个体差异,至少说,年轻的女孩聊的时候是什么状态,跟成年大叔聊的是什么状态,或者跟比较高的教育背景的人应该聊什么。对于同一个 query 来了之后,你的回复最后能不同。

这里面有几个重点的地方,一个是持续,接下来是对于任何 query 都要有合理的回复,最后要考虑个体差异。对于一个实际能力影响的产品或者系统来说,我们认为,这也是三角兽在这么长时间的商务的沟通和合作过程中,我们认为自动聊天应该是一个很基本的模块,任何一个产品,只要是提供对话接口的话,免不了做一些聊天,因为你很难保证用户说了什么。比如说,我的产品只做天气预报,你就只问我天气,用户是不会那么听话的,我就跟你聊一点人生,你如果接得不好的话,你对我的产品印象就会差,所以说,它是一个基本的模块。

对于一个单纯的聊天系统来说,它的用户黏性是有问题的。一般来说,最好它能完成一些任务,能配合着聊天做一些事情,达到一些目的。这样的话,这里面存在了对话协作,这两个模块,一个是任务对话,一个是聊天,之间能够自由切换。详解请见知乎 Live

聊天机器人的主要技术路线

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

第二个大的部分,聊天机器人主要的路线。在这之前,我们要讨论一个很重要的问题,就是自动聊天系统的技术基因。它是从一个实际应用的聊天系统来说,是从哪些问题或者技术里面借用的概念和方法?来看一下聊天机器人典型的技术路线,也是现在大家比较能接受的技术路线。

自动聊天系统的发展得益于以下的研究和发展。

第一,非事实类的问答。就是外号这种问答,这跟我的博士课题是完全一样的,我当时就是做这个方向。

第二,CQA、百度知道,典型的为代表,英文的可能有更多。CQA 他们的发展主要提供了足球的语料、数据资源。

第三,从在线的比如说像论坛、或者 SNS,我们去挖问答对,这也是一个方向,这个方向的发展有助于自动聊天系统的推进。这其实也是一个方向,FAQ 的应用。这个大概是 2010 年左右,ACL 一个重要的研究方向。

这些研究的共同出发点,或者说他们理想的 idea 是这样的,atv,如果我的 QA 数据,一来一回的数据足够多,多到能足以 cover 用户所有的可能的 query 的话,我们再配合以足够好的匹配能力、算法和答案排序算法,那么问答系统是可以实现的,再推广的话,聊天系统无非也就是这样的。

码报:「极客公开课·Live」5 分钟带你复习自动聊天系统

所以,在早期的研究里面,我们得到了一些重要的结论,这些结论其实现在来说,也非常重要。

第一,文本语义的相似性和相关性,实际上是完全不同的两个需求。就是说,很多时候,我们说相似文本实际上不对,很多时候我们需要量化的并不是相似,而是相关。为什么这么说?两句话可能完全在句子层面或者是在词法层面完全不相似,没有任何相似性,但是他们的语义是相关的。那这种情况下,你进行相似的量化,这个方法不适用于相关性的量化。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容