2017-07-26 16:32来源:钛媒体 原标题:【钛坦白】腾讯物联云语音云总经理毛华:语音交互的八个大问题 图片来源:视觉中国 在钛媒体在线课“钛坦白”第47期,我们邀请了三位钛客分享对于人机交互方式中的语音交互的看法。本期钛客之一、腾讯物联云语音云总经理毛华,负责腾讯的物联和语音技术的产品研发和生态建设。自2011年加入腾讯以来,先后负责腾讯手机管家、应用宝、QQ物联、视频云、语音云的产品规划与建设,在互联网产品与创业方面拥有超过17年的行业经验。 本文节选自毛华在钛坦白的分享。如果您还不是钛媒体Pro用户,希望查看钛坦白所有干货,进入钛坦白九个专业群交流,并查看更丰富的专业数据和信息,可点击:注册。 以下根据毛华在钛坦白的分享实录整理: 非常感谢佳音,也感谢钛媒体,可以有这样的机会跟群里的各位朋友交流。 先介绍一下腾讯云小微。腾讯云是一个智能服务平台,主要由两大平台组成:一是小微硬件开放平台,各类硬件都可以接入这个平台;二是小微Skill开放平台,让接入的这些硬件具备一些能力。 小微硬件开放平台可以接入的硬件形式多样,种类也不限,大部分联网的硬件都可以接入,目前支持Android和Linux两大操作系统。而且接入非常简单,小微提供SDK,硬件只需要接入这个SDK,经过简单的配置即可实现所有语音输入与内容输出的能力。我们最快的接入案例是一个Android机器人,只用了两天时间就完成了所有的能力接入。 小微Skill开放平台则可以接入大量的内容与服务,以便让硬件具备更多的能力。比如为智能音箱设备提供QQ通信、音乐、FM、物联等能力,用一个QQ或微信帐号即可实现内容与服务的联动。我们希望通过小微智能服务平台帮助硬件快速实现听觉和视觉的能力,无论是音箱、小屏设备、机顶盒电视机,还是汽车、机器人、冰箱等设备都可以快速接入,并具备小微语音和视觉的能力。 小微背后是腾讯在人工智能领域的积累 腾讯其实有很多Ai技术储备,只是都在为各自的业务提供能力,比如语音识别和语义分析,微信在过去的几年里一直在打磨并应用于微信内,比如优图的人脸识别已经做到了全球第一,并应用于天天P图和视频监控等领域,比如QQ物联在过去的2年多时间里接入大量的智能硬件设备。就是因为有了这些技术积累,小微智能服务平台只用了1个月时间就实现了从0到1的智能语音音箱Demo,如此之快的原因就在于,小微的框架用的是QQ物联平台,语音能力用的是微信的语音识别与语义分析,再结合微信的QQ音乐、企鹅FM、腾讯视频、K歌等带有大量版权的内容,完成了从0到1的搭建。大公司有个优势,就是把资源一整合,一个新的东西就出来了,不过从Demo到平台稳定易用还有一堆的事情要做。 接入小微,就可以自带很多资源,具体来说分这么几部分: 一是带有大量版权的内容,音乐(QQ音乐是中国最大的正版音乐库,四大唱片公司中有3大公司的版权在腾讯),企鹅FM里有广泛的有声读物内容包括相声故事评书等,还有腾讯文学(阅文集团是中国最大的文学版权方),腾讯视频也是最大的版权拥有方,以及其他如新闻、动漫、股票等内容。 二是所投资的内容与服务公司的业务很广泛,如滴滴出行、58同城、美团、医疗、新东方英语等,这些都为设备提供了很多有价值的服务,如在设备上用语音打车或叫家政服务或在带屏设备上进行语音互动等。 三是QQ、微信的通信能力,每个接入的设备都可以是通信工具,实现与QQ或微信的电话、消息的互通。 四是物联能力,Skill开放平台不仅可以直接连接QQ物联上的设备,也允许其他物联平台,如美国的Ayla物联平台、中国的机智云等通过Skill开放平台接入,从而实现语音对设备的控制。 小微背后的腾讯团队 小微涉及到腾讯公司好几个团队的协作,包括微信人工智能团队、AI Lab和优图团队。微信与AI Lab负责相关技术如语音识别、语义分析、翻译、百科等,其他内容团队提供海量的内容。小微其实就是把腾讯内部的这些人工智能团队的一些优秀的成果集合到小微里为大家提供服务,无论是语音相关的能力还是图像相关的能力,接入我们的平台就可以实现一站式服务,从语音的识别到语义的分析以及内容的返回再到TTS播放。 (责任编辑:本港台直播) |