本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】百度NLP | 智能写作机器人:不抢人类饭碗,我们只想人机协作(2)

时间:2017-04-11 20:16来源:118图库 作者:j2开奖直播 点击:
答 :目前媒体报道的写作机器人大多面向体育、财经等特定领域,我们的智能写作文章类型更加多样,覆盖的领域更为广泛,并且可以实现个性化的推荐

:目前媒体报道的写作机器人大多面向体育、财经等特定领域,我们的智能写作文章类型更加多样,覆盖的领域更为广泛,并且可以实现个性化的推荐和订阅。总体来说,实际的用户需求、大规模数据资源,先进的技术积累,以及产品应用中的反馈迭代,形成了百度智能写作的独特价值和优势。

我们的智能写作的文章类型和话题源于实际的用户和产品需求。根据对资讯流产品内容分布和用户兴趣点分布的分析,我们确定了三类文章类型:速报类、知识类和资讯聚合类,分别用于改善产品中三类需求满足问题:高时效性需求,中长尾需求,和热点话题信息的高效获取需求。在具体话题的选择上,我们根据用户兴趣点分布确定话题覆盖优先级。目前百度智能写作的文章已经涵盖电影,美食、旅游、汽车、创业、房地产等 50 多个话题,涉及社会、财经、娱乐等 15 个领域。

百度在数据资源和人工智能技术方面的积累为智能机器写作的研发提供了有力支持。

在数据方面,除了海量的全网优质数据,百度拥有大量的自建高质量数据,包括百度阿拉丁(优质资源开放平台)、百度知道、百度百科、知识图谱等,不仅可以支持基于结构化数据的文章生成,还可以支持基于内容聚合方式的文章生成。百度阿拉丁的时效性结构化数据,如体育比赛、彩票、股票信息、恶劣天气预警等,atv,是速报类文章生成的数据基础。百度百科、百度知道和知识图谱是知识类文章生成的重要数据来源。以百度百科中的城市百科为例,城市百科中包含了大部分城市的景点、美食、文化排行榜数据,这些数据与对应景点、美食的描述数据相结合就可以生成城市旅游、美食、文化的介绍文章。同时,基于海量的用户行为日志数据,可以准确地捕捉对这些内容感兴趣的用户,就可以实现生成内容的个性化推荐和满足。

在技术方面,百度在内容理解、语言生成、知识推理、机器学习等方面的技术积累,是智能机器写作的重要技术基础。以资讯聚合类文章生成为例: 首先,聚合类文章的话题选择和资讯内容获取是基于内容理解和用户理解技术。利用百度自建的关注点图谱(主题、实体、事件标签以及标签间的关系)和标签预测技术,我们为每篇资讯内容打上关注点标签,同时根据用户的搜索或阅读行为可以获得用户的关注点标签,即用户的兴趣点。这样就获得了用户感兴趣的话题,同时基于内容标签可以获得相关话题的资讯内容。其次,基于内容理解和生成技术对于同一话题的内容进行压缩和聚合,相关技术包括:事件分析,话题聚类,事件脉络抽取,自动摘要,标题生成、结构生成等,而机器学习和知识推理是这些技术实现的基本方法。图 3 以事件脉络型文章的生成为例说明聚合类文章写作中所依赖的主要技术。可以看到,百度深厚的技术积累为智能机器写作提供了有力的技术支撑。

  

码报:【j2开奖】百度NLP | 智能写作机器人:不抢人类饭碗,我们只想人机协作

图 3 事件脉络型文章生成主要技术

目前,我们的智能写作机器人在百家号和百度资讯流产品中已累计发文近万篇,阅读量超过千万。图 4 是智能机器人写作的新闻实例,包括通用领域新闻,生活新闻,体育新闻等。随着产品的应用,我们可以积累更多数据和用户反馈,不断实现技术的更新迭代。

  

码报:【j2开奖】百度NLP | 智能写作机器人:不抢人类饭碗,我们只想人机协作

图 4:百度智能机器人写作应用实例

Q5. 智能写作技术上最大的难点是什么?百度未来是否会尝试深度文章的撰写?

: 人类作者在撰写文章时通常会对数据、内容和话题进行深入理解,并可以进行演绎、推理和联想,从而完成更深入的报道,充分表达自己的观点和立场。而相比之下,机器则更长于数据分析和规范的写作,在自然语言深入理解,以及让稿件具有观点和立场等方面还有很大的提升空间。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容