大数据对AI产业化带来哪些影响?毫无疑问,大数据的积累使得我们可以拥有更好的性能,这让我回想起来我刚参加工作时在摩托罗拉,我们做了很多国家的语言,汉语的、英语的,包括英语做的很多版本,英式英语、美式英语,我们获得的语料是以100小时为单位,今天不光光是算法的突破,还有移动互联网,使得我们可以采集到更真实的数据,我们以前很多机构在采集数据的时候都是靠人去录,我们都知道人念和说是完全不一样的,通过移动互联网我们可以很方便地搜集到用户在自然状态下的真实说的数据而不是朗读数据,包含信道信息、年龄信息、口音信息等等,这个海量信息使得我们在引擎这个层面上能得到更好的结果。 我们有语音平台、语义平台,我们的终端客户提供服务,每天实时收到这样的数据。大数据带来哪些好处?包括朱总讲的Bot,每个Bot上个性化,有了海量数据之后,我们可以对每个用户来做用户画像,甚至来针对每个人来做优化,这样的话我们能为每个用户提供精准服务和定制化学习,这些人无论是企业用户还是个人用户,都能为他们提供更好的服务。
通过云计算平台,做一些模型的更新学习,弊端是把训练和服务割裂开来。我们在底层搭了通用的系统平台,基于GPU、CPU或者FPGA,上层把智能学习和智能服务放到一起,白天给客户提供服务,晚上可以用数据来实时学习,这样保证AI系统每天至少在理论上可以做到实时更新。 这个信息非常重要,我举个例子,昨天有专家说到其实人脑和我们今天的AI系统的显著区别是,第一,我们有很多神经元。第二我们的神经元之间有很多连接,每一个神经元未必很智能,但通过神经元的连接可以使我们具备超出很多其他生物体的智能。人工智能也是如此。谷歌有很多服务器,有很多服务器和你能够利用很多服务器的能力之间是有巨大区别的,我们都知道 AlphaGo 可能在单个任务里面调用了上千个GPU或者CPU,如果我有几百万台服务器,但是单个任务里面只能使用几台服务器或者几万台服务器,无法利用我的大数据能力,怎么搭建这样一个系统?我们内部经常开玩笑,你要有大数据还要有使用大数据的能力,你有好的炼钢材料,但是你还要有好的刀法。 云知声深度学习技术产品多领域落地
AI 和IoT怎么结合?前面讲交互的时候说到 IoT这个场景里面语音可能是最便捷的交互方式,IoT和设备结合,需要我们的产品方案应该多元化、系统化。不光要有云端服务,还要有终端的AIUI交互,还有 AI 芯片,还要整合其他的第三方服务,餐饮的、音乐的、天气的等等,甚至结合用户的使用习惯有一些个性化的服务推荐。无论在家居,还是车载,给用户提供他们需要的服务。
云知声是专注物联网的人工智能服务,云知声的成长历程也是深度学习的历程,2012年6月份成立,9月份在国内发布了第一个完全Free的语音云平台,2012年底把深度学习推向社会。2014年之后我们开始思考人工智能技术怎么和场景结合,怎么给用户提供有价值的服务,2014年开启我们的芯片战略,2015年推出支持五米远讲技术的智能家居,去年已经在市场开卖,乐视第三级超级电视X55,到今天为止每个月和连接到芯片上的结合云端的智能服务,包括其他第三方服务的芯片,每个月出货量已经达到几万台。
云知声作为一个初创的创业公司,我们是怎么样一步步从算法到引擎到平台到产品到商业的?总体来说,我们的产品形态是云端芯,云指云端服务;端指终端交互,我们希望在终端上面用最自然便捷的方式来给用户提供服务;很多产品场景下必须跟芯片结合,深度学习不光在云端终端,在芯片里面也做到了深度学习。我们远讲距离的唤醒、打断,包括离线识别都做到芯片里面去。 (责任编辑:本港台直播) |