通过训练软件来精确总结归纳文件资料,可以在医药、法律、科学等诸多领域产生重大影响。
现在,atv,还有多少人有时间完整地阅读文章或是文件呢?如今,随着信息量越来越庞大,电脑可能成为我们处理这些文件的唯一希望。因此依靠机器来分析文章、研究论文和其他文本今后可能会变得非常普遍。 Salesforce 的研究人员对此开发出了一个算法,最终计算机很有可能实现自己总结归纳文档。它运用了几种机器学习的技巧,可以从较长的文本生成非常连贯且准确的短文本。 例如,这个算法生成了最近《纽约时报》关于 Facebook 打算在即将到来的英国大选之前打击虚假新闻的文章摘要: 1、星期一,Facebook在英国的报纸上发表了一系列广告; 2、它已经在英国删除了数万个的假帐户; 3、Facebook 还表示,今后将雇用超过 3000 名内容监管人,几乎将全球从事这一工作的人数翻了一番。 根据用于测量文本摘要准确性的通用软件工具,Salesforce 算法明显优于之前开发的任何算法。 Salesforce 首席科学家 Richard Socher 说:“在自然语言处理领域,我们提出的这个算法是一个巨大的进步。” Socher这个名字现在在机器学习和自然语言处理领域如雷贯耳,他的新创公司 MetaMind 也于 2016 年被 Salesforce 收购。 这个软件要想实现人类对文本的理解能力还有很长路要走,而且它生成的摘要重点也不都十分准确。事实上,想要完美地总结文本将需要真正的智能,包括需要有常识以及专业地掌握这门语言。 解析语言仍然是人工智能的巨大挑战之一,但却拥有巨大的商业潜力。即使有限的人工智能,atv,例如解析口语或书面问题的能力,以及用更复杂和一致的方式作出反应,这些功能都有广泛的应用场景。在许多专业领域,如医学、科学研究、法律,精炼冗长文本和提取有效信息具有巨大的商业利益。 Salesforce 的研究科学家 Caiming Xiong 表示,他们的算法虽然不完善,但可以总结每天的新闻文章,或是为客户提供他们的电子邮件概要——后者可能对于 Salesforce 自己的平台尤其有用。 他们的算法结合了多种方法,例如监督学习和增强学习。然后将它们组合在一起来实现功能上的提升。这个系统利用监督学习的方法,从优秀摘要的例子中学习,但也对其正在输入和输出的文本进行了一种人为的关注。这有助于确保它不会产生太多重复的文本,这是归纳算法的常见问题。 这个系统实验为了产生自己的概要,还使用了增强学习的过程。受动物学习方式的启发,增强学习是对一个导致特定目标的动作提供正反馈的过程。增强学习已经被用来训练电脑去实现很复杂的行为,例如玩很复杂的游戏或者是控制机器人。那些在会话接口上工作的人越来越关注增强学习,以便来优化他们的系统。 美国西北大学教授、Narrative Science 公司的创始人Kristian Hammond认为,Salesforce的研究是一个很好的进步,但这也显示出纯粹依赖统计机器学习的局限性。“我们必须承认,有些时候我们需要在这些系统中使用一些语义和句法知识,让它们变得更准确、更流畅。”Hammond说。 Hammond认为,使用注意机制是在一个很简易的水平上对一个人的说话行为进行模仿。这种行为就是人们说话的时候,会被自己刚才说的话影响。他说:“当你在说话的时候,即将说的内容是由你之前所说的内容驱动的——这项工作是向模仿人类交流这一方向迈出的一步。” 提高计算机的语言技能在推进人工智能方面也很重要。微软今年早些时候收购的一家名为 Maluuba 的新创公司最近制作了一个能够根据文本内容生成相关问题的系统。 Maluuba 团队同样结合了监督学习和增强学习。 Maluuba 的高级研究科学家 Adam Trischler 认为,提问是学习的重要组成部分,所以创造出一个很“好奇”的机器也同样重要。“最终的目标是在人机对话中使用问答机制,也就是‘提问—回答’。但想想,如果机器可以自己出去收集信息,然后向自己提问,这该怎么办呢?” 编辑:王凯立 「DeepTech深科技」招募编辑记者 (人工智能、生物医学、自动驾驶等方向) 工作地点:北京 ● 国贸 申请加入:[email protected] 热点 (点击查看)
人物
公司
深度
(责任编辑:本港台直播) |