钱晨不是第一个揭破皇帝新衣的,而且他是敢于直面行业陋习,大声说出真话的圈内大牛。钱晨指出,智能音箱做前端声音处理层面,国内没有高水平的。在前端声音处理技术领域,分为麦克风阵列(多个麦克风)以及两麦这两种技术流派,前者是亚马逊ECHO所创,后者是Google Home研发。 钱晨表示,“不管厂商怎么讲故事,都逃不出这两个。” 而在设备端,噪声抵消是首要难题,国内部分品牌如科胜讯、云知声、思必驰,科大讯飞等,所提供的技术解决方案主要是集中噪声抵消和后面的云端处理。 但是钱晨强调,目前语音设备技术可以分为三个阶段:噪声抵消、语音识别,和语义识别。 “但在语义识别这块,与国外差距很大。” 如果说,j2直播,云知声、思必驰,科大讯飞等企业未来在语义识别领域还有逐步追赶微软、亚马逊的可能,那么目前最大的隐患就是:设备端都还没有做好。 钱晨指出,“如果降噪这一块没有处理好,科大讯飞算法再好也不行,识别率就会下降,语义识别就更别谈了。” 他在访谈中所提出的这些问题,业界并非没有共识,但是一窝风上马的新品,虽然“百家争鸣”但也暴露出技术和创新方面的短视。市场,真的能靠这些产品走向成熟? 浮躁,不仅仅体现在智能音箱厂家的心态方面,声智科技创始人陈孝良曾撰文表示,如果不把智能音箱产品作为战略产品来投入研发,估计做出的产品难免差强人意。虽然国内很多厂商都自认为投入巨大,但是相比亚马逊ECHO来说,这就有点小巫见大巫了。 “事实上,公司之间竞争,不在于投入20%实现的80%,而在于投入80%才换来的20%。大多时候,往往就是这20%决定了公司竞争的成败。” 或许,这已经不是国家有关部门成立专门的实验室,对这些智能音箱进行相关认证能够解决的。这里面的差距,真的不仅仅语音识别错误率的提升,也不仅仅是把麦克风从七八个改为两个或者一个,而是对一个新型的市场,浮躁的心态。 智能音箱行业会不会被做烂,钱晨的这一句忠言逆耳不一定全对,但却令人清醒。 (责任编辑:本港台直播) |