本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:第四范式戴文渊:构建AI的商业大脑,需要5大核

时间:2017-06-03 23:09来源:118图库 作者:j2开奖直播 点击:
5月27-28日,在机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)上,「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯 AI Lab 副主任俞栋等知名人工智能专家参与峰

码报:第四范式戴文渊:构建AI的商业大脑,需要5大核

5月27-28日,在机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)上,「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯 AI Lab 副主任俞栋等知名人工智能专家参与峰会,并在主题演讲、圆桌论坛等互动形式下,从科学家、企业家、技术专家的视角,解读人工智能的未来发展。

在大会上,第四范式创始人戴文渊发表了主题为《构建 AI 商业大脑》的演讲,分享了如何使机器学习的过程变得更简单,如何使企业在降低成本的同时,拥有 AI 的能力。

在戴文渊看来,企业构建AI商业能力,必须具备5个要素:大数据(Big data)、外部的反馈(Response)、算法的能力(Algorithm)、计算的能力(Infrastructure),以及商业需求(Needs)的带动,他将之总结为“BRAIN”。

在详细解释每一个要素之后,戴文渊建议,企业要通过“专业化分工+专注核心环节”的方式,借力人工智能平台,关注数据本身及业务需求,更加高效通过智能决策引擎,让数据发挥价值。

以下是该演讲的主要内容,经黑智编辑整理:

如今,一些大型企业已经获得 AI 能力,甚至已经享受 AI 带来的红利,但更多的企业在思考:如何拥有 AI 的能力?这么多纷繁复杂的信息,有那么多算法、技术,应该如何选择?今天我将会在这方面进行分享。

生物智能我们相对容易理解。我们评判一个生物智能的高低,是看它的脑细胞有多少,比如人的脑细胞比狗要多,大家会觉得人比狗聪明,而狗的脑细胞比昆虫多,大家会觉得狗比昆虫聪明。

机器是怎么回事呢?统计学家早就给我们奠定了机器的理论,叫 VC 维理论,为什么叫 VC 维?因为这两个科学家姓的首字母一个是 V,一个是 C,它就被叫做 VC 维。

VC 维理论的结论是这样:一个模型的维度越高,能力就越强。我们甚至发现,VC 维可以用来解释生物智能,比如,人的大脑 VC 维大概等于脑细胞的个数,在 VC 维理论下,我们可以把人的智能和机器的智能进行对比,最后达到比较的方式。

在这种情况下,我们发现人和机器可以类比。人最高的智慧在哪儿?在于我们对社会、对自然界经验的提炼,比方牛顿三大定律。如果让机器做牛顿的工作,应该如何做?机器可以去记录大量物理学的自然现象的数据,让机器去读数据,按照不同的速度区间总结不同的规律,甚至总结出可能三千万,乃至更多的定律。如此一来,我们可能并不需要牛顿。

码报:第四范式戴文渊:构建AI的商业大脑,需要5大核

如今,业务专家在设计营销、金融、风控,医疗各个领域的业务规律。但在各行各业,机器都有可能超越人。我 2009 年加入百度,百度的广告是一个利润丰厚的业务,百度的广告不是 AI 做的,而是由业务专家制定规则,他们制定了将近一万条规则。我们基于百度的数据,当年写出一千万条规则,比业务专家多出了将近一千倍,当年提升了 40%。后来我们逐渐加,2013 年把整个规则数写到了一千亿条以上。2009 年-2013 年,百度的广告利润提升了八倍。

我们把这个方法论应用到不同的行业,包括金融的实时反欺诈。过去,比较好的反欺诈系统也能写出一千多条规则,我们能够很轻易的基于目前的交易以及投诉的数据能够写到 25 亿条以上。再比如个性化的内容分发,过去,编辑最多写几十、上百条的规则,用机器人则能写出十亿条以上的规则。

机器比人有更强的精力,能写出更细的规则,因而它能做得更好更精细。如果你能用机器基于数据写出超过一千万条规则,VC 维超过一千万,人基本上没有办法跟机器抗衡了。这就是机器为什么能在各个领域打败人的原因。

但机器超越人,有一定前提条件,这是因为做出好的 AI Model 有前提条件。我们总结五个要素,它们分别是:

大数据;

外部的反馈;

算法的能力;

计算的能力;

商业需求的带动。

码报:第四范式戴文渊:构建AI的商业大脑,需要5大核

1

大数据

并不是有数据就行,而是要有意义的大数据,比如过程数据。举个例子,我们学习围棋,去看围棋手的等级和排名、围棋赛事的报道,是学不会的。只有把别人下的棋一盘一盘看完,才能够每日精进。

那么,我们如何去搜集这种过程数据呢?通常我们会对客户提供一个服务,这个服务可能收到正反馈,也可能收到负反馈,我们把这个过程收集下来。具体来说,对于在线广告,我们有一个搜索,搜索以后给他推出广告,用户点击是正反馈,没有点击则是负反馈;对于个性化推荐、访问,我们提供推荐,用户接受是正反馈,不接受是负反馈。对于反欺诈,我们提供授权,用户投诉,是正反馈,没有投诉,说明授权是对的,是负反馈。最后,我们要做好的 AI 模型,而这通常需要一千万以上的过程数据。一千万以上,我们就有机会制作比资深的业务专家更好的模型。这不仅是有经验的支撑,也有理论的支撑。通俗地讲,一个模型的规则数,模型的 VC 维,要和数据量匹配,要做到一千万以上的维度才能够打败人,这就需要一千万以上的样本,一千万以上的过程数据。

码报:第四范式戴文渊:构建AI的商业大脑,需要5大核

2

外部的反馈

反馈非常重要。例如搜索的点击,推荐的接受,反欺诈的投诉,这样的反馈对优化模型是非常重要的。

在推荐领域,今日头条、快手这些风头正健的应用,和上一代推荐系统最大的不同是什么?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容