英国科幻小说作家亚瑟·克拉克曾指出,任何科技如若足够先进,就和魔法别无二致。 《经济学人》今年 1 月发表的封面文章《轻而易 “语” 》回应了亚瑟的观点,作者以迅速发展的语音识别技术举例:对着空气说一句话,附近的智能设备就会帮你得偿所愿。 这种变化非同小可。机器诞生之初,仅能对纵列数字做简单的加法运算,而现在却可下出一盘好棋、理解简单对话并执行指令。 在语音识别与大数据的宝藏中,我们还可以挖掘什么? 来源 | 峰瑞资本「 X 实验室」 我是 2015 年加入科大讯飞的,此前曾经创办了一个大数据创业公司,为中国移动等企业做了一些大数据项目。随着业务的开展,我和创业小伙伴们发现做好大数据技术的前提条件是能够接触到真正意义上的大数据,否则就像是一直围绕着大数据这座金山周围的小土丘打转,挖不到真正的金子。恰好这时,讯飞邀请我加入,组建讯飞大数据研究院,从讯飞人工智能开放平台 8.9 亿用户这座金山里挖掘数据价值。 讯飞核心研发部门包括讯飞研究院、云平台研发部、大数据研究院、语音资源部。这几个部门加起来共有 500 人左右,不到讯飞的员工总数 6000 人的十分之一,但是这些部门产出了讯飞几乎所有的科研成果。 通常,核心研发部门相对较为关注如何把技术做到极致,而业务部门则更注重思考技术的落地和应用。我们的工作不仅局限于研发顶尖技术,还包括业务系统研发过程中的技术咨询、方案设计等很接地气的工作。有时为了核心技术的落地应用,我们也会和业务部门一起走到前线,和最终用户沟通需求。同时,核心研发部门也是公司内部资源共享的重要平台,例如公司会把所有部门的数据处理分析任务都放到研发部门的大数据平台 Odeon 上来,整个公司的业务数据都是打通和共享的。 今天,我们重点关注以下几个问题: 语音识别准确率达到 97% 之后,我们计划做什么? 大数据变现的关键要素是什么? 要想实现「红海」突围,大数据企业可以做什么? 语音识别的下一步 2003 年时,讯飞下定决心,要做中国的原创核心技术企业。那时,大家都认为语音识别不可能赚钱,有谁会对着机器说话呢?正是市场的这种认知,逼着我们尝试把语音技术应用到各个领域去,在各个领域都扎下了一些业务的苗子。例如,我们通过声纹识别和人脸识别的结合来搭建社会保障生存认证系统,又通过语音识别和转写来做讯飞输入法,还做了口语考试的语音评测体系等等。 我们在技术层面取得的突破,得益于 2006 年开始,深度学习技术的迅速发展。在 2008 年至 2010 年间,讯飞最早把这项技术运用到了语音识别领域。 2010 年后,我们又把单纯的语音识别扩展到自然语音理解,并尝试了人机交互、图像识别方面的工作。现在,讯飞的语音识别准确率已经可以达到 97%,并且能够实现实时语音转写和翻译。 回顾过去,我们最初的愿景其实是让机器能听会说,而能听会说的下一步则是理解自然语言。这个标准实际上已经非常接近于要求机器能理解、会思考。语言是人类区别于其他动物的最大特征,到了以 「能理解、会思考」 为目标的阶段,讯飞也自然而然地从语音技术公司转变成了人工智能公司。 不过,虽然我们的核心技术已经应用到了各个领域,我们仍始终认为,让技术转化为实际生产力是一个非常漫长的过程。即便技术登峰造极,产品如果不接地气,市场仍然不会去买单。即使技术走到了 90% 或 99% 那一步,如果还没有得到市场的认可,我们也只是刚刚起步。 大数据的变现通路 讯飞基于自有大数据或者合作伙伴的大数据,重点在精准营销、个性化学习、智慧城市三个方向做了应用落地和技术研发。 精准营销 在精准营销领域,讯飞最大的优势是有自己独一无二的大数据来源。讯飞的人工智能开放平台向所有有兴趣做人工智能应用的合作伙伴开放人工智能能力,同时通过这些合作伙伴手机到了大量的用户行为数据。讯飞现在有 20 万家合作伙伴,领域从手机输入法、手机语音助手,到导航 App 里林志玲、郭德纲的语音,还有购物 App 里的语音搜索,讯飞已经构建起一个人工智能和语音服务的生态圈。 (责任编辑:本港台直播) |