这坚定了云知声做深度学习的决心。当时公司刚刚拿了天使轮,钱还不多,就在淘宝上买显卡、买机器,在9月平台发布后,10月份就投入了对深度学习算法的学习。2013年1月,云知声深度学习系统对外开放。搜狗云助手、乐视电视,都成为这个系统的首批服务对象。 而2012年和搜狗的合作,则是让云知声一战成名。 “当时国内大的公司,百度、搜狗,都想发布自己的语音助手产品,想抢2012年底前这个时间点。搜狗自己没有语音能力,就去找合作。”黄伟说。语音识别当年的圈子本来就不大,云知声就进入了搜狗的视线。“他们肯定也评估了很多家,但我记得很清楚,我们跟搜狗从第一次见面到最后达成合作协议,一周时间。”黄伟言及于此,颇有些得意。 从2012年中到2013年底,云知声没有做过多的商业化的尝试。在这段时间内,云知声通过算法和平台的搭建,逐渐打通了自己数据驱动的路。而到了2014年,黄伟觉得,公司到了一个新的阶段,是时候开始仔细思考公司的定位问题了。 黄伟把当时市场上的主流公司做了分类。科大讯飞和BAT作为先发者,占据了市场和资源的优势,但是,它们都是从PC互联网时代迁移过来的,那么,新的时代转折,是否可以给云知声提供机会?“在IoT领域,它们也没有积累,或者说足够的壁垒,那么我们就在IoT切入。” 这个新的机会就像黄伟在开始所说的,IoT时代改变了交互的形态。同时,这些新的设备和人是有距离的,那么,在交互时就必须加入新的能力,而芯片就是解决它的方法。因此,2014年,云知声提出了“云端芯”,要把自己的能力从云端扩展到终端、再到芯片端。 5米之外能语音唤醒和操控家电吗? “这个端,你可以把它理解成带界面或者不带界面的一个虚拟UI。”黄伟解释说。“我们把端定位成一个AIUI,是一个基于人工智能的交互系统。我们也会把很多AI技术植入到芯片里面去。比方说,距离比较远的时候,如何实现设备的识别、唤醒、打断;再比如说,在房间里或空旷地段,会有回响,怎么把这个回响给消除掉……我们要把这些新能力不断地补充进来。” 云上是数据的积淀,端是入口,芯片承载了云知声的服务,这也是在这一波物联网智能硬件和人工智能的浪潮中,黄伟对云知声在竞争中脱颖而出的期望所在。 云知声拿着demo去和客户演示,一个个说服他们接受这种交互形态。2014年底,云知声获得高通的5000万美元B轮融资,开始发力芯片。 但这是比之前的研发要困难得多的一件事,要想做好它,困难重重。“我一直自信我们在技术领域算是做得比较好的,但我们从来没有在任何一个技术点上花过这么大精力来解决问题。”黄伟对创业家&i黑马感慨。一方面是性能问题要解决,另一方面,要实现芯片工业化量产,需要有太多算法之外的问题需要解决,比如功耗、散热、热高温、防摔……“做demo容易,做产品真是太难,太难了。” 2016年,云知声的芯片开始出货,其中花费了一年半的时间。但黄伟觉得,这些是有价值的。“因为这些能力的补充,包括这些新的产品形态,使得我们的交互方式从移动互联网时代时只能对着手机、做距离比较近的讲话,到今天我们可以实现在3-5米之外,通过声音遥控。” 或许很多人还并不理解这会有什么样的意义。但实际上,atv,智能手机之后,下一个人和信息沟通的方式将会是什么形态,atv,是很多科技公司一早就在设想的事情。Google Glass尽管是个失败的产品,但它却是科技界为此做出的大胆尝试。智能化的趋势必不可逆,而手机APP,也不会永远都是控制众多智能设备的方式。 但是“去手机化”的过程,需要迈过高高的技术门槛。至今为止,较为成功的产品,也只有一个Echo。 云知声和乐视电视有着长期的合作。从第一代到现在第三代乐视超级电视,从语音操控到语音交互,都是云知声提供语音交互技术。 2016年8月,美的智能空调发布,它搭载了云知声的AI芯,使用者可以在家庭环境中5米内通过语音控制空调的开关和温度,空调能结合关键词分析、理解用户意图。 但这款产品的问世也是历经挑战。要想获得厂商的合作支持,就必须能够消除噪声环境影响实现语音控制;空调一般都是壁挂式,所以要实现远场交互;且成本可控。 (责任编辑:本港台直播) |