本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【组图】媒体|迈克尔·乔丹:几百年内AI不会觉醒(3)

时间:2017-01-10 18:54来源:天下彩论坛 作者:www.wzatv.cc 点击:
在硅谷,越来越多的公司在设计、开发类似的个性化大数据系统,比如搜索引擎、电子商务、精准医疗等等。他们在数据不断涌入的情况下,通过调整参数

在硅谷,越来越多的公司在设计、开发类似的个性化大数据系统,比如搜索引擎、电子商务、精准医疗等等。他们在数据不断涌入的情况下,通过调整参数、尝试不同模型,提高预测的精准性。相比控制出错的比例,公司更关心的是出错的绝对数量不要随着数据的增多而增加。

  同时,大数据带来的另一个挑战是对计算速度的要求。数据越多,处理的时间也就越长。一个高度个性化的、准确的服务系统,如果运行起来很慢,用户是不会满意的。比如,搜索引擎的响应时间已经从最初的几秒优化到如今的几毫秒。如果思考得更长远些,今天我们有TB(1024GB)级的数据,几年后我们会有PB(1024TB)级的数据。丰富多样的数据可以使系统个性化、精准化方面再上几个台阶,但是同时人们也期待计算速度能够越来越快。

  

wzatv:【j2开奖】媒体|迈克尔·乔丹:几百年内AI不会觉醒

而计算思维来自于计算机科学,是一种思想,是关于思考特定问题的抽象化、模块化、扩展化和稳健化等方法,绝不仅仅是如何编程。计算机专业的学生在这些方面都会接受很好的训练,但被大家忽视的,也是特别重要的推理思维。推理思维不是新思想,它是有几百年发展历史,它是统计学中最核心的东西。推理思维强调的是,拿到数据,我们要思考数据是从哪里来的,背后的真实世界是怎样的,数据如何从真实世界中采集来的,会不会有采样偏差,等等。

遗憾的是,计算科学和统计学长久以来独立发展,直到如今的大数据时代,两个学科的交叉,才使得这两门学科遇到了真正的机遇,同时也带来了挑战。

  一方面,计算机科学家并不太懂统计推断,所以他们把这方面的研究命名为机器学习。然而机器学习只是将模型应用到数据上,并不关注推断问题,以及样本和总体之间的关系,也没有涉及统计学中偏差和因果推断的内容。

  另一方面,传统统计学理论关注损失、风险、随机性等概率性质,极少涉及计算时间方面的概念。

我们举一个医疗研究的例子来体会计算思维和推理思维的不同和联系。假设有一个存放患者健康信息和医疗历史的数据库,如果有直接查询的权限,我们就可以得到想要的信息,并进行下一步操作。但由于保护隐私的考虑,我们通常只能查询到经过随机化处理的间接信息。计算思维考虑的问题,就是基于间接信息的结果,如何尽可能得到近似原始观测得到的结果,使用这些扰动过的数据,能不能做出和使用原始数据一样好的预测。

  推断思维的角度则完全不同。我们通常假设:数据库中所有患者的信息只是某未知真实总体的抽样观测,我们不仅关注那些信息已经存在数据库里的患者,我们也关心那些不在数据库中、但类型相似的患者。那么,统计学家关注的是,基于数据库直接信息的结果会对真实世界的结果有多好的近似。

  这是几十年前,这两个领域各自研究的问题。现在是如何把这两种思维结合起来。

  所以,在这个医疗数据隐私例子上,我们关心的问题就变成了我们如何利用随机化的间接信息,来得到近似真实世界的结果。推理思维在连接真实世界和间接信息中起到了桥梁作用。

  因此,大数据带来的挑战层出不穷,将两种思维结合起来,并且认真研究新问题,才是真正的核心。无论是对理论还是实践感兴趣,我们都应该为有更多的机遇而感到兴奋。

  延伸阅读

2012年10月25日,由微软亚洲研究院、南开大学、天津大学联合主办的第十四届“二十一世纪的计算”大型国际学术研讨会在天津隆重举行。本届大会以“计算,自然而然”为主题,邀请来自国内外计算领域的大师,通过精彩的主题演讲和专家论坛与到天津的2,000多名高校师生分享计算科学领域的最新趋势和研究成果,为中国乃至亚太地区计算机科学的研究和教育提供新的视野。以下是迈克尔.乔丹的演讲现场视频。

  

  你也许还想看:

  感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:[email protected]

  微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容