数据背后的意义是,语音识别的识别率在近场上已经可以做到超过实用的门槛,在很多应用场景里可以应用。比如微信里面的语音转文字、语音输入法以及各类APP的语音输入框等。 在实际应用层面,语音输入已经成为许多APP必备的一项功能;但在研究层面,语音识别仍有许多留待攻克的难点。 俞栋介绍,当下更困难环境下比如远场、高噪音、或带口音的语音识别是仍需解决的问题;自适应方法(adaptation)也是重要的研究方向。 身处语音领域最前沿,俞栋的研究重点在往更深的层次走。而在加入腾讯AI Lab之后,直播,俞栋也将带领团队主攻远场语音识别以及自然语言理解两个方向。 美国西雅图AI实验室:侧重语音识别和NLP的基础和前沿研究工作 2016年4月,腾讯成立AI Lab(腾讯人工智能实验室),致力于人工智能基础科学的开放研究, 目前实验室有50余位世界知名学院的AI科学家(90%为博士)、及200多位经验丰富的工程师进行基础研究与应用探索。 AI Lab聚焦四大领域的基础研究,包括:计算机视觉、语音识别、自然语言处理与机器学习,力求全面覆盖,并深层次拓展AI的前沿技术能力。同时发展AI在具有腾讯特色的四大业务场景中的应用能力:内容 AI、社交AI、游戏AI和平台工具AI。 腾讯AI Lab研究方向 俞栋介绍,在腾讯AI Lab的研究体系中,美国西雅图AI实验室将承担一些语音识别和NLP的基础和前沿研究工作,并试图解决这些领域更困难的问题,位于深圳的AI Lab则将继续基础研究+快速应用的结合,把在四大领域的研究和技术比较快的应用到实际场景中。 简单来说可以概括为,西雅图实验室专注于基础研究,深圳总部的团队还需兼顾应用研究。但实际上在基础研究和应用研究之间没有非常严格的界限,有时很难说清楚一个东西是属于基础还是应用,比如基础研究团队如果把某一项技术里的关键问题直接解决,那么它就可以立刻应用到产品里面,但这些问题一般来说会比较难,因此很难预测它什么时候能解决。 由此,西雅图实验室进展的确定性没有那么强,这意味着需要投入更多耐心,需要激发更多新颖的想法和算法。 在语音识别做了二十多年研究的俞栋深刻了解做基础研究需要的耐心和投入,而在与腾讯方面进行了多次沟通后,在长期耐心投入研究上内部也形成了共识。 “如果要在技术研究上取得突破,确实需要有一定耐心,相对来说长期稳定的投入,西雅图这边基本上秉持这样的理念。我们希望长远来讲,能够创新性地攻克关键的、主要的技术难题,在真实应用场景里有很大的性能提升。但是因为我们没有办法预测到底哪天能成功,我们希望在每一个阶段都会有一些进步,这是我们唯一可以定义的一些进步,但是这个进步会有多大,开奖,也是没有办法比较明确说出来的。” 俞栋回答。 但在语音识别研究与腾讯业务可能的结合点上,俞栋的判断非常乐观:物联网、游戏、微信、QQ等,都有很多业务场景用到语音识别,而语义理解与腾讯社交应用的关系会更大。 如今西雅图实验室刚刚成立,作为实验室负责人,俞栋当前的主要工作是招揽人才搭建团队。 俞栋希望能建立一个20人左右的团队,招徕有一定研究能力的人才,“研究人员能力和潜力两个部分我们都会注意,现在在通过各种渠道去发现合适的人才来加入。” 接下来,俞栋就要带领更偏向于研究、更接近于美国大公司研究院性质的西雅图实验室在语音识别和语义理解研究上继续探索了。这是一项需要长期坚定投入的工作,但已经做了二十多年研究的俞栋以及腾讯已经有了充分准备。 “我们有耐心。” ——素材部分来自腾讯科技 (责任编辑:本港台直播) |