题图为科大讯飞云平台事业部总经理于继栋 提起科大讯飞,或许已经不需要百科了。这家总部位于合肥的公司以技术立命,跟这个时代对技术的崇拜相吻合,所以他们谈起人工智能让人觉得理所当然,而他们也的确是这么做的。 今年4月的英特尔深圳IDF上,讯飞研究院副院长王智国在台上演讲,当屏幕上将他说的话实时转录成文字时,场下的观众、包括我被吸引了,这也是这家公司在公开场合比较大的技术展示。 不仅如此,这家以人工智能为卖点的企业还有很多绝活儿,7月份,虎嗅等媒体参观科大讯飞总部,在2楼的一个演示大厅里,atv,讯飞的工作人员带着我们体验了体验了语音合成,dingdong智能音箱、aiui、讯飞听见、讯飞车载语音系统、讯飞智能阅卷系统等技术演示。 科大讯飞告诉虎嗅,这些技术在习近平主席今年4月份参观科大讯飞时同样展示过。其中,当科大讯飞董事长刘庆峰为习近平演示可用于单机涉密情况下的“讯飞听见”实时语音听写技术后(也就是这次在虎嗅上演示过的高级版),习近平表示:“那今后包括写作、速记,都可以用我们的语音了。这个将来用处广了!” 而在9月9日的虎嗅F&M节上,科大讯飞云平台事业部总经理于继栋再次演示了一边这些绝活儿。尤其当其演示讯飞听见时,屏幕上把于继栋说的话飞速转写成文字后,场下的观众感到非常新奇。 而我现在采访录音后几乎不用找速记公司帮我整理,在讯飞听见官网上可以直接把录音上传,几分钟后,它就可以把1个小时的录音转录成文字,虽然还有小瑕疵,但是它不会像速记那样偷工减料,而我主需要按小时付费就行,100块钱转录5个小时的录音,非常划算。 这是个神奇的网站,你去试试就知道我所言非虚。 以下是于继栋的演讲内容: 我今天带来的主题是“人工智能改变生活”。时间比较紧,我就讲快点。 (AlphaGo战胜李世乭)这个事情大家应该都非常了解,就是今年所有人都知道的。其实在1997年计算机已经战胜了人类,当时认为围棋不能被计算机搞定,把所有的步骤都能够算一遍的话你需要一百年时间。今天通过人工智能把围棋推到风口的时候,大家突然觉得人工智能进步如此之快,其实后台就是算法的改进,让整个人工智能快速进步。 从讯飞人工智能来看,我们过去一直认为人工智能是分为从运算智能、感知智能到认知智能三个阶段。和人不一样的地方是,人是从感知智能到认知智能。人到现在为止,运算智能其实远远不如现在的计算机这么厉害。 在讯飞人工智能观念来看,因为计算机天然有运算和存储的优势,所以最近几年在感知方面,计算机一直在获得非常快速的进步,包括语音识别这样原来非常难的东西,其实在最近几年有了一个飞速进步,在讯飞云平台上语音识别率从我们刚上线时的50%做到了现在的95%。 我们今天带来这样的系统,就是我们在语音方面最新的成果,它能够把我现场的语音变成文字,在未来,可能今年年底我们就把它转化为多种文字和语言,这样的话就可以为我们参会提供方便,这样的能力我相信在未来为会议或知识管理带来巨大的改变。 其实在讯飞整个人工智能观念中,我认为在计算机超级运算能力之下,即将通过感知和认知智能的突破,我们能将人工智能推向把能听会说转为会理解会思考。 说得简单一点,讯飞主要解决的是人的感知和思考的这些问题。其实从第一个领域来看,就是语音合成,从讯飞成立到现在大概有17年多时间,我们一直在做的就是语音合成技术。现在这个技术,我们追求的是表现力和个性化。 我们在去年跟阅读软件推出《舌尖上的中国》这样的声音,跟高德导航推出导航个性化语音,那这个功能推出之后,整个用户接触度有翻番的提升,就是大家对这种个性化有非常高的分科,其实最近整个讯飞在语音合成方面也获得非常大的进步,我们在近期会推出更多相关的技术。 还有一个大的领域,就是最近非常火热的语音识别,语音识别在我们理解里面分为传统意义上的语音识别,然后还有声纹识别、语音频次等,这些技术都是在语音识别的领域里为我们生活提供非常多方便的技术。 另外,最近两年特别热的就是人脸识别,人脸识别现在也得益于人工智能技术进步,识别率达到95.7%。其实已经超过了人眼睛判断人脸的水平,在这样基础突破下,很多已经开始人脸身份验证,其实我后面还有真正的广告,人脸这样的技术还是可以用在类似于数字营销方面的应用。那以上就是讯飞的一些技术的分类和进展。 其实我们从2010年10月开放,到现在我们已经有6年时间,我们一直坚持开放,就是把我们这些技术不断开放给互联网开发者。 (责任编辑:本港台直播) |