11月22日,百度语音开放平台举行了三周年活动,期间再次展示了百度语音技术在爱奇艺APP以及数字农家书屋的实际应用,此外更重要的是此次百度宣布将4项全新语音技术接口免费开放给用户和开发者共享,分别为情感合成、远场方案、唤醒二期技术和长语音方案。 互联网女皇将今年的《互联网报告》十分之一篇幅给了语音技术,而语音技术也在今年成为了媒体最大的关注焦点,百度的深度语音识别系统Deep Speech 2也被《麻省理工评论》列入十大突破性技术——百度也是唯一一家中国公司入选,说明了其语音技术的实力。 传统的语音开放平台更注重技术本身,而此次百度语音平台已经开始围绕场景进行重点布局,可以预见的是,百度正在朝着智能语音的场景进行全力加码,那么值得讨论的是:未来的智能语音到底有着多大空间? 一,智能语音将成未来基础设施 李彦宏此前在乌镇说过“移动互联网已经落幕”,而王兴也表示移动互联进入到了下半场,实际上都在说明,移动互联网时代大的机会已经过去,真正有价值的平台将在下一轮风口中崛起。 而这下一轮的技术风口无疑是人工智能,未来的一切都将智能化,智能将无处不在。那时仅靠利用手机并不能很高效的完成工作,反而会成为负担,而语音交互将成为未来的关键。 在当前的移动互联网生态中,凡是涉及支付的场景均无法绕开支付平台,因为它们已经成为了基础设施,同样在未来的智能生态中,凡是涉及用户交互的场景,均无法绕开语音平台,用户的语音交互将会成为不可避免的一环,其承载着连接一切生态的价值,此时各家公司的语音技术能力就尤为重要。 但是否每家公司都需要发展自身的语音技术?答案是否定的,如同每家公司不需要再做一个支付平台一样,这其中有极高的门槛,而未来公司更需要的就是像接入支付平台一样接入语音平台,节省自己的资源消耗,完成人工智能的布局。 目前百度语音在颇多场景已经有了落地实践,例如此前百度钱包就演示过“声纹支付”,用户外卖下单后可以直接读出系统验证码,而系统会根据“声纹”来判定用户身份进而为其支付。 除此之外,当前百度的语音技术除了被利用到百度体系的各个产品中,其实还被各大企业运用到行业中,海尔、小米、乐视、爱奇艺、联想、中兴、特斯拉等知名公司均是百度语音的重要合作伙伴,j2直播,都接入了百度语音的技术,来为自己的用户提供服务。 因此,百度语音不仅有着成熟的技术,更有实际的落地经验,将其开放给开发者,对于开发者来说是莫大福音。 二,开发者的未来是组装者 这里再说另一个趋势,开发者。 事实上,当前的开发者已经与最初的开发者的定义相去甚远,早期的开发者需要精通二进制规则,需要会为机器条带打孔,需要懂汇编,需要存储原理...... 而当前的开发者除了专门研发CPU、内存、等底层架构的人员之外,绝大多数人早已将这些抛之脑后,其只懂得高级编程语言,以及调用他人已经写好的封装接口,不需要再做此前的复杂工作。 而移动互联网时代的开发者更为幸福,消息推送、地图定位、地图导航、统计功能等所有基础功能都已经由第三方公司将其完成,其只需要调用就行,而服务器也已经有云计算公司提供。 一言蔽之,开发者的未来是组装者,其越来越不需要管基础的原理,其要做的只是借助所有第三方公司提供的接口完成自身的服务,例如饿了么做外卖却不需要自己做支付而是接入第三方,陌陌做LBS社交但LBS定位数据依靠第三方,巨人自己做手游但却将服务器放在了第三方云计算平台等等,这也是互联网世界带来的高度分工。 在未来充满智能的时代,开发者将会更为需要第三方的开放语音平台的接口作为助力,而此次百度所开放的语音产品正是面向未来的场景,价值极大。 三,语音技术的未来价值将不小于支付平台 凯文凯利在其新书《必然》中谈到一个重要概念“重混”,其引用了经济学家保罗罗墨的观点,经济的真正可持续性增长并非来自新资源的发现和利用,而是源于将已有资源进行重新安排后,使其产生更大的价值。 而技术的发展也同样如此,所有技术全都是依赖其他技术而生存,直播,在这种重混经济之下,创造出了更大的价值。例如移动时代的支付平台,其已经成为整个生态中最为重要的基础设施,美团、大众点评、外卖、线下支付等等场景均需要这二者的助力。 (责任编辑:本港台直播) |