因此智能音箱会成为一阵浪潮,在美国家庭被用户解决各式各样的生活问题。因为它天然规避了手机的使用场景,形成了人们日常生活的有益补充。 对话式人工智能的实质 我们真正需要探讨的是,智能音箱它到底是像智能可穿戴设备一样,仅仅只是智能手机的有益补充,还是能够成为未来个人、家庭的服务入口。 因为,如果智能音箱仅仅只是智能手机的补充,atv,那这意味着它的量级永远只是局限数百万台的规模,仅仅被少数人所使用。 不过,目前来看,智能音箱的实质其实并不是音箱甚至不是智能语音助理这么简单,准确定义的话,这实际上是“对话式”人工智能。 在微软Build2016开发者大会上,微软CEO纳德拉首先提出了“Conversations as a Platform”,也就是“对话即平台”的人工智能发展方向。 这个概念在后来也被成为是“对话式人工智能”。 所谓“对话式人工智能”指的是,对话本身就是一个平台,各种知识、信息与服务都运行在“对话”其上,可以形成生态环境的基础平台。人和人工智能之间的对话,即是解决各种问题的一种路径和方式。 如果说的更浅显一些,那就是人们能够通过人和人正常交流的方式,来与机器进行沟通,以此来获取信息和服务。 也就是说,未来人们其实不仅仅是在家里可以用智能语音助理来获取服务,智能语音助理甚至可能无所不在。所以你会发现,阿里人工智能实验室在发布天猫精灵的同时,还公布了配套的研发平台AliGenie开发者平台。这一开发平台主要面向个人内容开发者、应用开发者、智能家居开发者以及硬件生产商等四类开发者。 未来我们可以在汽车、冰箱、电视甚至是家庭的垃圾桶上享受到智能语音助理的服务,随时用语音获取信息。用阿里人工智能实验室负责人浅雪的话来说,“终端方面的合作伙伴包括阿里智能IoT、涂鸦科技以及一些大厂,涉及千万款以上产品、100多个品类。” 这也意味着将来智能语音助理将无所不能、连接一切。 这种交互方式或许令人意外,但是语言本来不就是人诞生以来的交互方式么? 语音是所有动物最早最原始的信息交流方式,这对于使用者来说几乎没有任何的门槛,哪怕是还不识字的孩童。 只是随着信息化时代的来临,键鼠成了我们操纵电脑与他人交流、获取信息服务的交互方式,而随着移动时代的来临,触摸屏又取代键鼠成了新的交互方式。 细细数来,键鼠这种交互方式存在至今不过50年,而触摸屏这种交互方式严格算来也仅仅只有不到20年。 但触摸屏取代键鼠的那一刹那,有多少人表示过惊讶?当乔布斯宣称说其实人类有一个天然的操作工具的时候,我们还认为他可能会推出全键盘手机。然而他说的是全触摸屏手机。所有人都认为,触摸屏手机收发邮件不方便,打字不够快捷。 黑莓时任联席CEO兼创始人Jim Balsillie在2007年2月曾经说过的一句话:(苹果和iPhone)有点像一位试图加入一间已经十分拥挤的屋子的新人,在这里消费者已经有许多许多选择了……但是如果说这将对黑莓产生海啸般的影响,我会觉得有点夸张了。 后来的事情大家都知道,更符合人类直觉的触摸屏取代了全键盘。在智能音箱的身后其实也存在这个交互变革的逻辑。 云计算大数据重塑语音 尽管是回到语音这个交互逻辑上,但本质来看,智能语音助理下的语音和过去的语音交互其实存在着本质的差别。 过去我们用语音调用的实际上是另外一个人的服务。对话和对话之间本质上信息量很少。 实际上,语音交互存在大量问题: 1、场景覆盖的低; 2、缺乏系统可视性; 3、语音无法表现信息层级。 4、语音交互消耗注意力,增加记忆负担。 5、随之带来的交互效率低。 所以,当你在地铁上,别人却在微信上给你发来一条59秒的语音消息时,你会对那个人恨之入骨。 但是随着人工智能和云计算、大数据的到来,人和语音的交互本质上正在发生变化。因为这并非双向语音之间的交互,只需要人发出指令即可。 刘慈欣在《乡村教师》的这段话很形象地点名了未来语音交互的信息量: (责任编辑:本港台直播) |