“Echo是6+1个麦克风,外圈6个和中间1个,所以它效果不错。但我不行,家电厂商对成本是非常在意的。”黄伟说。“麦克风多了,信息源多,就需要更强的CPU,成本功耗就要提升。其次,家电大多是靠墙安装的,麦克风怎么放?” 云知声最后采用的是双麦克解决方案,两个麦克风,间距不超过3厘米。但问题又来了,只有两个麦克,如何达到性能?云知声花了一年多时间解决这个技术问题,终于在2015年这款产品开始生产。现在,市场上的大多数智能家电产品,华帝、格力、海尔、美的等,都是和云知声合作的。 但软件可解决,硬件也还是让黄伟觉得比较麻烦的一件事。比如麦克风。“现在手机上的麦克风,对电话场景下的噪音意识,已经做得非常好了。但在家居市场上,硬件厂商还没有这个意识。比如他们以前从来不会想到,一台电冰箱上会需要一个麦克风。所以,现在对我们软件的要求就更高了。” 除了智能家电和家居,车载以及医疗、教育等行业,也是云知声商业化落地的主要领域。比起智能家居来,车载的应用场景更好想象。当人们在驾驶时,双手都被占用,语音交互就成了最佳选择。但黄伟认为,车载前端产品周期非常长,“从接触到产品要出来差不多要用5年左右时间,不适合一个创业公司”。因此,云知声选择从后装市场切入。而2014年,黄伟认为是一个新的契机正在出现:“当时已经有10%的设备开始使用安卓平台了。我们判断,安卓在车载系统里将是未来的趋势。”经过了半年多的研发,到2015年中,云知声开始和厂商对接。到现在,安卓系统已经占据了市场上90%的份额,而目前,搭载云知声智能语音SDK的车机产品出货量已超过150万台。 在医疗方面,协和医院已经和云知声合作,使用医疗语音识别系统,对病历、医嘱等进行录入。而且,这也有助于未来的医疗大数据挖掘工作。 在商业化的策略上,云知声一直选择的是B2B2C。这也是很多AI公司的选择。当一种新技术仍在发展和完善过程中,通过与B端的合作,不断获取用户的需求,了解行业,通过反复迭代来完善技术,是看似必然的选择。而B端的企业,也是在技术投入成本较大的现阶段,比C端更具备付费与创新的动力。 之前,云知声的合作公司还多数是互联网公司的中小型企业,而从2016年开始,公司的商业重心开始向大B倾斜。“对于中小型公司而言,新的技术和交互形态它们更乐于去尝试。而大企业的推动进程也比较慢。而今年,很多大的企业的生产计划也可以排好了。”而和大型企业合作,对云知声而言,既能扩大市场规模,又能树立起行业中的标杆。 “做商业公司,一定得回归到商业本质上,那就是收入。尤其是像今天资本市场并不是特别好的情况下,大家更看重收入。但我们并不是到B为止了,我们还会到C。我们为什么要做平台?C端对我们具有用户价值,这能帮助我们的后台不断提升,在B端会更有持续的竞争力。”黄伟说。 让机器去理解人类 而这样用语音操控机器,或者机械的一问一答,还是远远达不到“智能”的程度的。开发者们需要去做的,是让它们更加聪明。 如果你坐进自己的爱车,感觉到今天的温度有些低,于是你说:今天有些冷。而这时,你车内的系统会自动将空调温度调高。再或者,当你和你的机器人在户外,你仍然随口表示:今天有些冷。而机器人,会自动理解你的意思,但此时,它不会去寻找空调,而是提示你:披上外套吧。这样的,是不是更令人向往的一个美好未来? 今年7月,云知声宣布,完成了技术引擎3.0版本的升级,并提出了“语用计算”的概念。关于这个概念,你可以简单地理解成,机器可以理解我们对话的语境,联系上下文进行回答。 调戏过Siri和小冰的人,或许了解要达到这一场景有多么困难。“我们推出语用计算是为了产品落地。”黄伟坦率地说。“现在很多聊天机器人,我觉得就是个学术命题。我们对聊天没有强需求,聊天也不是产品。作为创业公司,我希望能解决当下的问题。在智能产品里,我和机器聊天说上好几轮,技术上是很厉害,但用户会不耐烦。我们更多地是把多人对话管理技术和当前状态信息结合在一起,把语音识别、物理环境以及之前的对话信息等结合在一起,让机器做出对应的回答。”而前面提到过的场景,也正在逐渐向现实转化。例如,在应用了云知声语音技术的格力金贝空调中,如果你说有点儿冷,它就会自动把温度调高一度。 (责任编辑:本港台直播) |