5月2日,腾讯宣布任命语音识别技术顶级专家俞栋博士为AI Lab(人工智能实验室)副主任,并成立美国西雅图AI实验室。俞栋将负责西雅图AI实验室的运营及管理,推动腾讯在语音识别及自然语言理解等AI领域的基础研究。 这是近段时间以来,腾讯在人工智能领域的第三个大动作。 一个多月前的3月19日,由腾讯AI Lab研发的围棋AI绝艺,在日本UEC杯围棋大赛中夺得冠军。这是低调运行近一年后,腾讯AI Lab首次对外展示研究成果。 就在绝艺夺冠后不久,3月23日,腾讯宣布任命人工智能领域顶尖科学家张潼博士担任腾讯AI Lab(腾讯人工智能实验室)主任。 腾讯AI Lab副主任及西雅图人工智能实验负责人俞栋博 “俞栋博士是语音识别与深度学习领域的专家。我们很高兴能邀请到俞博士加入腾讯AI Lab,相信他的到来将极大提升腾讯AI的技术实力。” 腾讯AI Lab主任张潼博士表示,“我们希望腾讯AI Lab不仅是一个实验室,还是一个连接器,通过将全球的优秀人才连接在一起,不断推动AI的基础研究及在更多场景的应用落地,让AI无处不在。” 俞栋博士表示:“我很高兴能加入腾讯AI Lab。在过去十多年里,腾讯积累了丰富的应用场景、海量数据、强大的计算能力和一流的科技人才,这些都是开展AI深度研究与应用的重要基础,也是吸引全球人才的重要原因。我相信,随着西雅图AI实验室的成立,未来将会有更多的一流人才加入腾讯AI Lab,共同推动全球AI技术的发展。” 俞栋:团队将主攻远场语音识别以及自然语言理解两个方向 俞栋博士是首次将深度学习技术应用在语音识别领域的研究领头人之一,该应用极大推动了语音识别的技术发展。俞栋博士在该领域出版了两本专著并发表过大量论文,也是60项专利的发明人及深度学习开源软件CNTK的发起人和主要作者之一。加入腾讯前,他曾担任美国微软研究院语音和对话组(Speech and Dialog Group)首席研究员,并兼任浙江大学兼职教授、中科大客座教授及上海交通大学客座研究员。俞栋博士曾获 2013 年和2016年 IEEE信号处理协会最佳论文奖,现任 IEEE 语音语言处理专业委员会委员,曾任 IEEE/ACM 音频、语音及语言处理汇刊、IEEE 信号处理杂志等期刊的编委。俞栋博士有中国浙江大学电子工程学士学位、美国印第安纳大学计算机硕士学位、中国科学院自动化所模式识别与智能控制硕士学位及美国爱达荷大学计算机博士学位。 作为语音领域最重要的两个国际会议之一(另一个为ICASSP),每年的Interspeech都会吸引来自学术界和工业界的从业人员参加,在大会上围绕语音领域的最新技术和研究方向进行交流。 大会进行到第二天,一篇名为《Conversational Speech Tranion Using Context-Dependent Deep Neural Networks》(使用上下文相关深层神经网络进行交谈语音转写)的论文发表,并迅速引起了科研界的高度重视。 论文提出了基于人工神经网络的语音识别新方法,实验结果显示,新方法大幅降低了语音识别的错误率。这意味着,曾于20世纪80年代末掀起热潮并最终沉寂下去的人工神经网络被再次引入语音识别研究领域,开启了语音识别的深度学习时代。 俞栋正是这一成果的主要研究人员。 回想起当时的情景,俞栋仍颇有感慨:“这项工作(将深度学习的方法引入语音识别领域)一开始受到很多怀疑,很多同事或者朋友都经历过80年代末90年代初,神经网络从高潮跌落到低潮的过程,所以他们都对此有一定的怀疑。” 但俞栋及其团队开辟的新方法用实际成果回应了质疑,“基本上两年之内,很多公司重复了我们的工作,发现确实对识别率有很大帮助,很快变成行业标准。但在我们这项工作之前,这类论文发表其实有一定困难,但是两年之后,变成没用深度学习技术就很难发文章了,反过来了。” 深度学习的钥匙打开了语音识别研究的新大门,进入深度学习时代后,语音识别也在不断取得突破。 2016年9 月中旬,微软报告了在语音识别方面取得的新里程碑:在Switchboard这一电话交谈基准测试集上新系统的识别词错率降至 6.3%;一个月后,微软又公布了在这一基准测试集上成功实现了历史性突破:他们的语音识别系统词错率(WER)和专业转录员相当甚至更低,达到5.9%。 (责任编辑:本港台直播) |