本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】前沿 | 斯坦福NLP团队介绍交互式语言学习:从语言游戏到日程规划(2)

时间:2017-01-13 18:12来源:668论坛 作者:开奖直播现场 点击:
事件安排这个任务,很常见但仍然没有被解决:尽管几个现成的日历程序允许有限自然语言输入,但是,根据我们的体验,一但遇到稍微复杂的事情,比如

事件安排这个任务,很常见但仍然没有被解决:尽管几个现成的日历程序允许有限自然语言输入,但是,根据我们的体验,一但遇到稍微复杂的事情,比如,「把周二下午所有的会见推迟一个小时」,这些系统就会失灵。我们认为,交互式学习会给日历提供更好的自然语言接口,对真实世界(而不是 blocks world)产生影响。而且,为了把我们的方法论从定义扩展到描述,我们选择了这个领域,因为大多数用户都已熟悉日历图形用户界面,也知道怎么操作。另外,因为已经采用了日历自然语言接口,特别是在手机上,因此,我们希望用户能自然而然地趋向使用自然语言方式的遣词造语,而不是使用一个更加技术化的语言,就像我们在 blocks world 里看到的那样。最后,日历是相当复杂的领域,当有了一套更广泛的基元(primitives)和可能动作后,我们就可以用更大的动作空间来测试我们的框架。

从示范和社区学习

在我们的实验中,用户通过滑动,并针对给定表达选择一个合适的动作,来给予反馈——对大型动作空间来说,这个过程不自然也不可扩展。人类交流中的反馈信号包括再形成(reformulation)、意译、修补序列等。我们扩展了我们的系统来接收描述的反馈,因为它 1)对人来说非常自然,特别在使用日历时,允许进行简单的数据搜集;2)对于语言学习有益,当前机器学习方法可以加以利用。实践中,如果正确的解释并没有在排名高的选项里,那么,系统会退回到 GUI,用户通过 GUI 向系统表明自己的意思。从指示符号中学习的算法非常适用于这类问题,这些问题中,交互式有望帮助搜索潜在逻辑形式。

虽然学习和适应每个用户为试点研究提供了一个干净的设置,但是,如果每个人都必须从头开始教计算机,就不会有好的覆盖。虽然存在个体差异,但是用户也应该有很多共同点,这些共同点使得计算机学地更快,泛化地更好。就我们的日历而言,我们放弃了个性化的特定用户语言模型,转而采用一个集体社区模型,这个模型包含了一套语法规则以及从所有用户和交互中搜集到的参数。每一个用户都对语言的表达性和复杂性做出了贡献,其中行话和习俗以一种分布式的范式得以发明、修改、或拒绝。

初步结果

通过使用亚马逊土耳其机器人(Amazon Mechanical Turk ),我们支付了 20 名工人每位 2 美金来玩我们的日历。在 356 种表达、196 种情况中,工人从建议排名列表中选择了其中一种状态作为想要的日历状态。通过示范,有 68 次工人使用日历 GUI 来人工修改和提交描述反馈。

搜集到的一个小型包含命令的子集如图 2 所示。尽管有很大一部分是相对简单的命令,AMT 工人还是使用了不是那么琐碎的措辞,确实挑战了复杂任务系统。正如我们期待的那样,用户非常倾向于使用自然语言,并没有发展出一种技术性的人工语言。少量日历命令因为不平常的日历命令,其自然属性受到了质疑。(请看 Questionable)

  

报码:【j2开奖】前沿 | 斯坦福NLP团队介绍交互式语言学习:从语言游戏到日程规划

图 2:目录化命令的分类样例。为评估学习表现,我们测量了系统在一个给定自然语言命令的条件下正确预测出正确日历动作的能力。我们看到排名最高的动作有 60% 的正确率。80% 的时候,正确意思位于三个系统动作排名中的首位。

  讨论

关键挑战是找出哪一个反馈信号既对计算机有用又对人类来说很自然。通过提供备选方案和从示范中学习,我们对此进行了探索。我们也正在尝试定义和重新表述。比如,当一位用户将「明天早上的会议」的表述改为「明天早上七点之后中午之前的会议」后,我们就能够推断「早晨」的含义。

我们相信,未来,自然语言接口一定是从与用户的交互中进行学习并随着时间推移不断得以改善。自然语言界面有望在许多任务上替代 GUIs 和改写,而且这样做能够弥合数字技术之间的巨大鸿沟,让我们更好地使用计算机。

©本文为机器之心编译,转载请联系本公众号获得授权

  ?------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容