编译|Aileen,Huo Jing 你跟女票说:“今晚的球赛特别重要,但是为了陪你我勉强放弃不看!”实际上今晚比赛的球队你根本不感兴趣,这样做只是让女票同意你明天和哥们喝酒的谈判“小伎俩”。 这个“使诈”的技能是不是很熟悉?而这次,学会这个技能的是Facebook的讨价还价机器人,而且,这还是人家AI自己独立学会的技能。 今日凌晨,Facebook发布最新研究,称他们训练的机器人已经get了谈判技能。而且,有些情况下,机器人最初假装对无价值项目感兴趣,只有通过放弃它才能“妥协” - 这是人们经常使用的有效谈判策略。这个行为并不是由研究人员编写的,而是由机器人发现的,作为试图实现目标的方法。 大数据文摘后台回复“谈判”下载论文全文。 每天,从我们醒来的那一刻开始,我们的生活就是不断地与人谈判:从讨论看什么电视频道,到说服你的孩子吃蔬菜或试图买菜时获得更好的价格。所有这些都是共通的,它们需要复杂的交流和推理技能,这是计算机所没有的属性。 迄今为止,现有的chatbots(聊天机器人)上的工作已经导致系统可以进行短暂的对话,并执行简单的任务,如预订餐厅等。但是,与人们进行有意义的对话的机器人还是很具有挑战性的,因为它需要机器人将其对话的理解与其对世界的知识相结合,然后产生一个新句子来帮助实现其目标。 今天,Facebook人工智能研究(FAIR)的研究人员已经开放源代码,并发表论文,介绍机器人具有的新功能 - 谈判能力。 *https://github.com/facebookresearch/end-to-end-negotiator 类似于人们有不同的需求,遇到冲突,然后谈判达成一个商定的妥协,atv直播,研究人员已经表明,对于具有不同目标的对话机器人(实现为端对端训练的神经网络)在达成共同决定或结果的同时,与其他机器人或人员可以进行从开始到结束的谈判。 任务:多议题讨价还价 FAIR研究人员研究了多议题谈判任务。对两个机器人都显示了相同的项目集合(比如说两本书,一个帽子,三个球),并且被指示他们通过谈判把这些物品分配给彼此。 每个机器人都提供自己的价值函数,它表示对每个类型的项目关心多少(比如对于机器人1,每个球值得3分)。 在生活中,两个机器人都不知道其他机器人的价值函数,必须从对话中推断出(如果你说你想要球,那你应该很重视球)。 FAIR研究人员创造了许多这样的谈判方案,始终确保两位机器人商不可能同时获得最佳交易。 此外,如果谈判进行不下去(或者不经过10次对话之后的协议),那这两个人都只得0分。 简单地说,谈判是至关重要的,良好的谈判导致更好的表现。 对话框部署 谈判同时是语言和推理问题,其中必须制定意图,然后口头实现。 这样的对话包含合作和对抗的要素,要求机器人了解和制定长期计划并产生话语以实现其目标。 FAIR研究人员在构建这样的长期规划对话机器方面的关键技术创新是一种称为对话部署的概念。 当聊天人可以建立对方(对话者)的心理模型,提前思考或预测未来谈话的方向时,他们可以选择避开没意义的,混乱的或令人沮丧的交流,j2直播,从而走向成功的谈判。 具体来说,FAIR已经开发了对话部署,作为一种新技术,其中机器通过将对话模型推出到对话结束来模拟未来的对话,从而可以选择具有最大预期未来奖励的话语。 类似的想法已被用于游戏环境规划中,但从未被应用于语言上,因为语言可能的动作数量要高得多。为了提高效率,研究人员首先产生了一组较小的候选语言来表达,然后对于每个候选语言,他们反复模拟对话的完整未来,以估计它们的成功程度。该模型的预测精度足够高,使得该技术在以下几个方面大大提高了谈判策略: 谈判更加努力:新的机器人与人类进行了长时间的对话,反过来也会很快接受交易,这个模型会一直谈判直到交易成功。 智能机动:有些情况下,机器人最初假装对无价值项目感兴趣,最后只有通过放弃它才能“妥协” - 这是人们经常使用的有效谈判策略。这个行为并不是由研究人员编写的,而是由机器人发现的,作为试图实现目标的方法。 创造语句:虽然神经模型很容易从训练数据中重复句子,但这项工作表明,模型能够在必要时进行泛化。 建立和评估谈判数据集 (责任编辑:本港台直播) |