英国科幻小说作家亚瑟·克拉克曾指出,任何科技如若足够先进,就和魔法别无二致。 《经济学人》今年 1 月发表的封面文章《轻而易 “语” 》回应了亚瑟的观点,作者以迅速发展的语音识别技术举例:对着空气说一句话,附近的智能设备就会帮你得偿所愿。 这种变化非同小可。机器诞生之初,仅能对纵列数字做简单的加法运算,而现在却可下出一盘好棋、理解简单对话并执行指令。 第 2 期「 X 实验室」,峰瑞资本(FreeS Fund)将与中国人工智能学会一道,走进科大讯飞大数据研究院。他们从 2003 年起即启动语音识别项目,至今识别准确率已达到 97%,而期间积累下来的大数据,则为精准营销、个性化学习、智慧城市等领域的研究打下基础。 本期值班研究员谭昶将于 5 月 12-14 日在由中国人工智能学会主办的《大数据:从理论到应用》讲习班分享更多内容,点击文末「阅读原文」 即可报名。 「 X 实验室」第 2 期 值班研究员
我是 2015 年加入科大讯飞的,atv,此前曾经创办了一个大数据创业公司,为中国移动等企业做了一些大数据项目。随着业务的开展,我和创业小伙伴们发现做好大数据技术的前提条件是能够接触到真正意义上的大数据,否则就像是一直围绕着大数据这座金山周围的小土丘打转,挖不到真正的金子。恰好这时,讯飞邀请我加入,组建讯飞大数据研究院,从讯飞人工智能开放平台 8.9 亿用户这座金山里挖掘数据价值。 讯飞核心研发部门包括讯飞研究院、云平台研发部、大数据研究院、语音资源部。这几个部门加起来共有 500 人左右,不到讯飞的员工总数 6000 人的十分之一,但是这些部门产出了讯飞几乎所有的科研成果。 通常,核心研发部门相对较为关注如何把技术做到极致,而业务部门则更注重思考技术的落地和应用。我们的工作不仅局限于研发顶尖技术,还包括业务系统研发过程中的技术咨询、方案设计等很接地气的工作。有时为了核心技术的落地应用,我们也会和业务部门一起走到前线,和最终用户沟通需求。同时,核心研发部门也是公司内部资源共享的重要平台,例如公司会把所有部门的数据处理分析任务都放到研发部门的大数据平台 Odeon 上来,整个公司的业务数据都是打通和共享的。 今天,我们重点关注以下几个问题: 语音识别准确率达到 97% 之后,我们计划做什么? 大数据变现的关键要素是什么? 要想实现「红海」突围,大数据企业可以做什么?
语音识别的下一步 回答这个问题前,我们可以先回顾一下讯飞是怎么一步一步把核心技术做到世界领先的。 2003 年时,讯飞下定决心,要做中国的原创核心技术企业。那时,大家都认为语音识别不可能赚钱,有谁会对着机器说话呢?正是市场的这种认知,逼着我们尝试把语音技术应用到各个领域去,在各个领域都扎下了一些业务的苗子。例如,我们通过声纹识别和人脸识别的结合来搭建社会保障生存认证系统,又通过语音识别和转写来做讯飞输入法,还做了口语考试的语音评测体系等等。 我们在技术层面取得的突破,得益于 2006 年开始,深度学习技术的迅速发展。在 2008 年至 2010 年间,讯飞最早把这项技术运用到了语音识别领域。 2010 年后,我们又把单纯的语音识别扩展到自然语音理解,并尝试了人机交互、图像识别方面的工作。现在,讯飞的语音识别准确率已经可以达到 97%,并且能够实现实时语音转写和翻译。 回顾过去,我们最初的愿景其实是让机器能听会说,而能听会说的下一步则是理解自然语言。这个标准实际上已经非常接近于要求机器能理解、会思考。语言是人类区别于其他动物的最大特征,到了以 「能理解、会思考」为目标的阶段,讯飞也自然而然地从语音技术公司转变成了人工智能公司。 (责任编辑:本港台直播) |