:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】作为国内语音行业的龙头,讯飞自从明确“认知革命”,从感知智能到认知智能的发展路径后,在国际上拿到了众多顶级AI比赛的冠军,这算是跳出语音,走向全面人工智能技术的一种颠覆。这一颠覆背后,深度学习的力量功不可没。本文将细谈科大讯飞是如何使用深度学习技术、如何理解和应用最新的 Attention模型的。在商业模式上,讯飞也在经历另一种颠覆:从To B 到 To C。2016年年度发布会,科大讯飞将交出本年度的成绩单,他们会如何用AI+共创新世界? 美国当地时间11月15日,2016国际知识图谱构建大赛(NIST TAC Knowledge Base Population) 揭晓结果,科大讯飞在首次参赛的情况下,一举包揽了本届赛事核心任务的冠亚军。 国际知识图谱构建大赛(KBP)始办于2009年,由美国国家标准与技术研究院(NIST)主办,是国际上影响力最大、参赛队伍最多、水平最高的科技赛事。实体发现与链接(Entity Discovery and Linking Track)作为该项赛事的核心任务,需要从目标文本中抽取命名实体,并将命名实体链接到已有的知识库上,具有很高的技术挑战性。 这是科大讯飞在认知智能领域取得的又一项重要科研成就,充分体现了科大讯飞在自然语言理解、知识库构建、知识推理等领域的技术实力。可以看到,科大讯飞已经不再仅仅是一家语音技术公司。在以语音技术为基础的其他相关AI技术上,讯飞正在谋求从感知智能到认知智能的颠覆。 一个颠覆:感知智能到认知智能的革命 讯飞研究院曾提出,人工智能分为三个阶段:计算智能、感知智能和认知智能。感知智能,比如语音合成技术、语音识别技术和语音转写技术等,是目前机器可以做得比较好的一些方面。 科大讯飞这几年正在努力跳出只有语音技术的限制,自然而然地,会在感知智能的下一步,也就是认知智能上发力。2016年10月18日,j2直播,在新智元与中国自动化学会联合举办的世界人工智能大会上,科大讯飞董事长刘庆峰介绍说,科大讯飞选择了一条路,就是以语音为入口的认知革命。 其中涉及的技术包括:自然语言理解、人机交互、机器翻译、知识图谱等等更加广泛的人工智能技术。 2016年,我们看到,科大讯飞拿下了几个含金量极高的国际赛事冠军:第四届国际多通道语音分离和识别大赛(CHiME-4)赛事全部三个项目的冠军、测试机器“常识”水平的Winograd Schema Challenge冠军等。 从感知到认知的过渡以及“认知革命”的提出,反映了科大讯飞不甘心只做一家语音技术公司的野心。他们希望建立的,是以认知革命为契机,借助语音技术的积累,成为一家人工智能公司。刘庆峰在世界人工智能大会上曾说,通过大数据和人工智能的深度神经网络、卷积神经网络、递归神经网络的全新算法,让科大讯飞将在不同领域一个一个改变世界。 颠覆背后的力量:深度学习技术
可以看到,从2010年,科大讯飞便开始了深度学习研究。2011年上线了首个中文语音深度神经网络(DNN)系统。2013年,讯飞推出BN-ivec 语种识别技术。2014年,发布“超脑计划”,深度布局NLP领域。2015年,RNN(递归神经网络)语音识别系统全面升级。在2016年,讯飞更是采用了国际上最新的Attention 神经网络模型,用于认知智能,并推出全新的DFCNN语音识别系统。 新智元此前曾报道了科大讯飞轮值总裁胡郁关于讯飞语音核心技术的报告。以下截取报告中对讯飞全新构型DFCNN和Attention模型的介绍。 据胡郁介绍,现在最新的一个方式是用图像的方法识别语音,这是当前最新的技术,什么叫做图像方法呢?大家可以看到,下面这个语音是我们平常在录音里看到的波形,但当语音进入我们的耳朵时,耳朵里的纤毛会根据它的长度不同与语音中不同的频率进行共振,如果把共振的频率分析出来,我们可以得到下面的语谱图,这张图可能会受噪音、口音的干扰,但这个图形里的信息很丰富。在MIT专门有科学家研究,如何根据这些图形就能够分辨出你说的这句话里用了哪些文字。
DFCNN的全称是 Deep Fully Convolution Neural Network (深度全卷积神经网络)。
Attention 的例子 (责任编辑:本港台直播) |