本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【组图】什么是 AI 领域人机对话系统?该如何评估好坏?

时间:2017-04-17 22:32来源:本港台直播 作者:j2开奖直播 点击:
注:三角兽科技 CEO Zhuoran Wang 博士曾参与 DSTC 2013的评测,期间他提出的一种领域无关的对话状态跟踪算法曾获 SIGDial 2013国际会议最佳论文提名,该系统在 DSTC 2014(即 DSTC 23)中被用做

  注:三角兽科技 CEO Zhuoran Wang 博士曾参与 DSTC 2013的评测,atv,期间他提出的一种领域无关的对话状态跟踪算法曾获 SIGDial 2013国际会议最佳论文提名,该系统在 DSTC 2014(即 DSTC 2&3)中被用做官方 baseline 系统

  人工智能语义领域目前在国内高速发展,资本的支持引发了新一轮创业大潮,泡沫也随之而来。很多公司 DEMO 演示的“黑科技”和对 AI 终极态的吹捧,给行业发展带来很大伤害。如何评测语义领域相关技术是大家共同关注的。基于多年理论和相关技术实践的经验,针对语义领域的4个方向技术,我们将会发表一系列详尽解读和评测标准文章。

  正 文 如 下

  人机对话,是人工智能领域的一个子方向,通俗的讲就是让人可以通过人类的语言(即自然语言)与计算机进行交互。作为人工智能的终极难题之一,一个完整的人机对话系统涉及到的技术极为广泛,例如计算机科学中的语音技术,自然语言处理,机器学习,规划与推理,知识工程,甚至语言学和认知科学中的许多理论在人机对话中都有所应用。笼统的讲,人机对话可以分为以下四个子问题:开放域聊天、任务驱动的多轮对话、问答和推荐。

  

  我们通过下面的例子来说明这四类问题的不同体现。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  图1: 人机对话示例

  开放域聊天:顾名思义,就是不局限话题的聊天,即在用户的 query 没用明确的信息或服务获取需求(如 social dialogue)时系统做出的回应。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  图1中1-2行为开放域聊天的典型示例

  开放域聊天在现有的人机对话系统中,主要起到拉近距离,建立信任关系,情感陪伴,顺滑对话过程(例如在任务类对话无法满足用户需求时)和提高用户粘性的作用。

  任务驱动的多轮对话:用户带着明确的目的而来,希望得到满足特定限制条件的信息或服务,例如:订餐,订票,寻找音乐、电影或某种商品,等等。因为用户的需求可以比较复杂,可能需要分多轮进行陈述,用户也可能在对话过程中不断修改或完善自己的需求。此外,当用户的陈述的需求不够具体或明确的时候,机器也可以通过询问、澄清或确认来帮助用户找到满意的结果。

  因此,任务驱动的多轮对话不是一个简单的自然语言理解加信息检索的过程,而是一个决策过程,需要机器在对话过程中不断根据当前的状态决策下一步应该采取的最优动作(如:提供结果,询问特定限制条件,澄清或确认需求,等等)从而最有效的辅助用户完成信息或服务获取的任务。在学术文献中所说的 Spoken Dialogue Systems(SDS)一般特指任务驱动的多轮对话。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  图1中的3-6行是一个音乐领域的任务驱动的多轮对话的例子

  问答:更侧重于一问一答,即直接根据用户的问题给出精准的答案。问答更接近一个信息检索的过程,虽然也可能涉及简单的上下文处理,但通常是通过指代消解和 query 补全来完成的。问答系统和任务驱动的多轮对话最根本的区别在于系统是否需要维护一个用户目标状态的表示和是否需要一个决策过程来完成任务。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  图1中8-9行,是一个问答的例子

  推荐:前面的开放域聊天,任务驱动的多轮对话和问答系统本质上都是被动的响应用户的 query,而推荐系统则是根据当前的用户 query 和历史的用户画像主动推荐用户可能感兴趣的信息或者服务,如图1中第7行的例子。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  因为上述的四类系统各自要解决的问题不同,实现技术迥异,用一套系统实现所有功能是不现实的。通常要将上述功能整合在一个应用中,我们还需要一个中控决策模块。之所以叫中控决策,是因为这个模块不仅负责需求和问题的分类,还内包括任务之间的澄清、确认和跨领域的引导,所以最理想的技术实现也应该通过一个决策过程来完成[1]。

  商业应用的人机对话系统根据应用的场景不同既可以是同时综合上述四类问题的复杂系统,也可以单纯解决其中一类问题。例如大家熟知的苹果 Siri、微软 Cortana、百度度秘等语音助手类产品就是集合上述四类问题综合系统(但是 Siri 和 Cortana 的聊天功能并不能算开放域,而是人工为高频的 query 编辑了对应的话术,当用户的聊天 query 不在预先配置的范围内时,系统则回复“我听不懂”之类的固定答案。而度秘的开放域聊天则是应用了更先进的基于海量数据的检索式聊天技术。相关技术的讨论超出了本文范畴,我们会在后续的文章中详解。)目前的智能客服类系统则多以解决问答和推荐类问题为主;微软推出的“小冰”,包括后继推出的同类型产品日文版 Rinna、英文版 Zo 和 Ruuh,主打的就是开放域聊天;而许多订票,订酒店类的对话系统则是任务驱动的多轮对话的典型应用。

  问答和推荐是比较经典的问题,各自的技术和评估体系业界也相对熟悉。所以这篇文章先从任务驱动的多轮对话讲起。

  

  首先我们来科普一下任务驱动的多轮对话系统。图2 为学术文献中任务驱动的多轮对话系统的一个经典框图。

  

wzatv:【j2开奖】什么是 AI 领域人机对话系统?该如何评估好坏?

  图2: 任务驱动的多轮对话系统的一个经典框图

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容