多么美好的未来。但它离实现还有多远?创业家&i黑马人工智能系列,本篇将带你认识,智能生活的语音交互新入口。 在物联网和人工智能时代,产品的智能化已经成为趋势。从电子产品、家电到家居用品,智能的概念在前两年大行其道。智能家居和可穿戴的风口从2014年开始井喷,但这种势头在2015年下半年,却开始放缓。 于是,我们能对比到,现在大多数人的智能家居和硬件产品,还离我们想象中的“智能”非常遥远。只在硬件上加上一个WiFi、传感器和APP,这并不是我们期待的“智能化”的未来。 最像“智能”的产品,或许是亚马逊的Echo。它整合了Alexa语音识别技术,让消费者用声音上网、检索信息、控制家居生活,已经拥有300万台的销量,让谷歌都为之眼馋。它体现的价值,也集中在搜索、伺服式语音识别和人工智能之上。 一个新的交互形态,在智能家居和硬件之上正亟需提高。当我们使用上述的智能化场景时,无论是可穿戴设备,还是家居、家电,如果仍然靠PC或智能手机的界面来操作,这可能是很难想象的。 不依托于这些手动装置,就能实现对它们的操控,无疑是这些设备最吸引人的便捷性所在。语音交互,也成为智能化过程中日益普遍的一项功能。 “交互的形态正在改变。”云知声CEO黄伟说。“移动互联网和PC互联网时代最大的区别是,我们现在是基于多点触控的应用,用手机上网,用移动设备上网,而不是仅仅用PC,通过键盘。而到了IoT时代,我们又不再只是通过手机,我们可以通过更多的设备联网,而它可能不再有触摸屏。” 从家居到家电,从物流到驾驶,从医疗到娱乐,一个智能的趋势正席卷而来。从Siri、小冰,到Echo,到搜狗的语音输入,再到度秘。也许人工智能的发展进程我们还不能预判,但商业和生活的智能化,却已经是一个不可逆转的过程。而其中,语音交互,或许会是一个新的智能时代的新入口。 创业家&i黑马在云知声的体验间里,体验了乐视超级电视X55和华帝抽油烟机,如何在家庭场景噪声下唤醒和操控。通过语音的控制,窗帘可以自动开启,灯光可以调节。创业4年,累计融资近亿美元之后,云知声,也许在物联网和人工智能兴起的浪潮中,也将面对一个更大的发展时机。 物联网智能硬件要和服务打通 2008年,科大讯飞上市,一度垄断国内语音识别市场的半壁江山。深度学习的发展,给了语音识别新的驱动力,但在2012年,云知声初成立之时,在这片江湖中,玩家还是寥寥无几。如何实现弯道超车?当时云知声,决心从开发者平台做起。 在当年,许多公司的创业方向都还是语音助手APP。“但我并不认为这个方向能够成功,尤其说它根本不适合一个创业公司去做,做这个会比较难。”黄伟说。 黄伟的判断来源于自己多年来的从业经验。作为语音识别的领军人物之一,他先后就职于摩托罗拉和盛大创新院,曾成立盛大创新院语音分院,在2012年,黄伟离开盛大。“我自己做过很多年的技术,我非常清楚,语音其实是技术,并不是产品。它是用来解决人跟设备的交互问题的,但交互本身不是目的,人们是要通过一种最便捷的方式来获得后面的服务。就像手机的多点触控,你离不开屏幕,但你觉得只有这块屏幕好玩吗?当然不是,吸引你的,是它背后的各种互联网服务。”Echo之所以成功,不仅是它的语音交互,还是由于,它可以和亚马逊电商打通,可以直接提供服务。 但是,对于创业公司而言,它也往往只限于提供这种交互方式本身,是很难具备连接交互后面服务的能力的。“当时选择做平台,是因为这样至少我们是有技术价值的。”黄伟总结。2012年9月,云知声语音平台发布,当时的精确度只有85%。 但是,语音平台也为云知声源源不断积累了语音数据。2013年初,准确度提高到了91%;而到了2013年底,云知声的语音数据已经积累到3000小时,精确度提高到95%,平台上开发者超过8000家。 从那时起,数据+算法就成为云知声“双门驱动”的引擎。从一开始,云知声就和深度学习结合在一起。当时的深度学习还主要是停留在学术界,很多人对此了解并不多,而深度学习,也需要超过以往不同数量级的数据支撑。但在2011年,在一个语音识别的国际会议上,黄伟遇到了微软首席研究员俞栋,对方告诉黄伟,这是“确确实实进展非常快、能够取得非常大的成就”的。 (责任编辑:本港台直播) |