本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

时间:2017-04-03 20:11来源:本港台直播 作者:j2开奖直播 点击:
“语言可能是人类面对人工智能最后的壁垒,尤其是中文。” 在3月18日集智俱乐部在中央财经大学学术会堂举办的公开讲座上,华院数据首席数据科学家尹相志结合NLU(Natural Languag

  “语言可能是人类面对人工智能最后的壁垒,尤其是中文。”

  在3月18日集智俱乐部在中央财经大学学术会堂举办的公开讲座上,华院数据首席数据科学家尹相志结合NLU(Natural Language Understanding,自然语言理解)在金融领域的应用之处侃侃而谈。在阿尔法狗在围棋领域击败人类之后,人类又一引以为傲的智慧壁垒被攻破,那么究竟有没有一个领域是人工智能暂时无法企及人类的?尹相志给出的答案是中文

  NLP(Natural Language Processing,自然语言处理)是人工智能的一个子领域,也是人工智能中最为困难的问题之一,“语言本身就是一种特殊的数据,它本身就覆盖着意义,我们需要提取的是语言的意义,而不是语言的符号形式。”

  而NLU将通过对自然语言的理解,实现极佳的人机交互体验,将人类从无聊、繁琐但必要的事务性工作中解脱出来。

  

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

  尹相志在集智俱乐部的公开讲座

新时代的“孔乙己之问”:

形容物流很快有几种说法?

  金融从业者每天一早就要读报表、新闻,写出晨报或纪要;而一个医生每天也要对病房、病人的情况进行记录,并进行分析。这些“繁琐但必要”的工作,正是NLU的用武之地。

  “人工智能首先替代的不是体力劳动。”尹相志说。人工智能将首先攻陷重复劳动较多、毛利率较高的行业,例如金融、医疗

  传统的NLU技术往往采用穷举法,在尹相志看来,这一招对于神秘莫测、巨量词汇的中文不管用。

  “想想看,在电商网站的评论中,形容物流很快有几种说法?”尹相志的这个提问,让人想起了鲁迅《孔乙己》中的孔乙己之问:茴香豆的茴有几种写法?

  这两个问题的不同点是,孔乙己之问相对封闭,可以通过穷举法轻松回答,而由于中文词汇的多义性,“尹相志之问”则几乎不可能通过穷举法回答,atv,“我们分析,形容物流很快至少有3600种说法,比如第二天就到了物流很给力给快递点赞等等,这就给NLU技术提出了很高的考验。”

  

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

  汉语表达的多样性

金融业NLU应用痛点:

实体/关系识别

  对于人工智能,最难的就是理解语言中不同代词的具体所指。”尹相志举例说,在一段文字中,可能出现多个公司的单词,那么人工智能就要判断这些公司分别是什么公司,而它们之间又是什么关系,这样才能真正理解一段文字。

  尹相志说,在金融业的法金授信、二级市场分析、个人资料掩、授信照会、投资研究等实际工作中,都可以由NLU对实体、关系进行识别。同样的工作如果由人工来做,难免出现疏漏、错误,并且会产生高昂的时间和工资成本。

  

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

  活动现场照片

词向量:NLU的华丽杀招

  NLU的核心命题,在于将语言符号数字化。因此,人们利用计算机工具,将词变成了“词向量”,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,然后透过深度学习将高达数百维度的超大向量压缩至200~300维,这样高度压缩的结构就是词向量,这个维度就代表了当前的词。通过阅读“词向量”,人工智能可以把语言“可视化”。

  “透过自然语言整理知识图谱,知识图谱再透过自然语言进行推理,是人工智能的下一波增长点。”尹相志预测。

  除了语义模拟之外,尹相志还举例介绍了如何利用词向量快速生成实体列表与商务规则。为了消灭歧义,可引入语义增强、语义消歧两种手段。

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

词向量的应用

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

词向量的应用: 语义增强和语义消歧

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

词向量的应用: 语义增强和语义消歧

码报:【j2开奖】演讲 | 华院首席科学家:中文或是人类面对人工智能的最后壁垒

词向量的应用: 语义增强和语义消歧

Brain of Things 2017竞赛题剧透:

人工智能竟然要做这些事

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容