当一个一个超级大城市在不断增加时,应该怎么管? 交通越来越堵塞,人口流动性越来越强,空气质量越来越令人担忧,噪音等污染越来越严重……数据、智能,能否给我们搭把手,在监测、预测和调控方面,助我们一臂之力? 前几天,黑智(VR-2014)也报道了在今年的GMIC现场,驭势科技CEO吴甘沙和《机器学习》作者、卡内基梅隆大学计算机科学学院机器学习系主任Tom Mitchell ,就也对进行了讨论。甚至,他们还提到,是否可以用人工智能技术,来帮助雄安新区的规划。 郑宇博士和他的团队,就是在用“城市计算”回答这些问题的人。 郑宇博士是微软亚洲研究院“城市计算”领域负责人。他主持开发了多个城市大数据系统,其中Urban Air首次利用大数据来监测和预报细粒度空气质量,该服务覆盖了中国的300多个城市,并被中国环境保护部采用。 2013年,郑宇被MIT科技评论评为“全球杰出青年创新者”(TR35),并作为现代创新者代表登上了美国《时代》周刊。2014年,由于他主导的城市计算具有巨大的商业前景和改变行业格局的潜力,他被《财富》评选为中国40位40岁以下商界精英。2016年被评为美国计算机学会杰出科学家 (ACM Distinguished Scientist)。 在不久前结束的AAAI 2017上,郑宇发表了研究论文《运用时空深度残差网络进行城市人群流动量预测》,这也是全球真正把深度学习有效用在时空数据上的第一个研究成果。而人工智能在城市计算领域的进展究竟如何?郑宇在源码资本2017年码会上,进行了详细的讲解。 口述 | 郑宇 来源 | 源码资本 编辑 | 黑智(VR-2014) 非常高兴有机会能够跟大家分享我们在城市计算(Urban Computing)领域的工作。大家平时听到很多人工智能用于语音、图象、文本的场景。怎么样用人工智能和大数据技术改变我们的生活,我围绕这个主题探讨一下,人工智能在城市领域的进展。 做好人工智能在城市领域的应用需要四个方面的技能: 1、理解城市文化本身,数据科学家纯粹的理论无法代替行业知识; 2、理解数据本身,不仅仅要了解数据的表征,也要了解数据背后蕴含了什么样的知识; 3、掌握数据科学的模型,包括数据管理,数据挖掘,机器学习,还有可视化; 4、懂得如何利用云平台,把算法高效部署在平台上解决问题。 在城市领域,以上四点也有应用上的不同之处。 可以想象,城市里面数据特别多。链家的、搜房的,从地理信息到人流量,好像千差万别上百种、上千种的数据。实际上按照数据的结构来分的话有两种数据,一种点的数据,一种网的数据。按照数据关联的时空属性来分,可以分为三类。所以总共有六种数据。这六种中最为复杂的就是轨迹数据,因为物体的位置和在每个位置上的属性都在不断的随着时间改变,而且点和点之间存在着关联。像摩拜和滴滴的车的轨迹都属于这种类型。 我不希望来了一千种数据要建一千种模型和算法,使得系统变得非常复杂。我们希望只要定义好这个模型之后,不管你来什么数据,可以高效利用平台,利用对应的分析和挖掘算法去处理。 城市领域有大规模的数据,多元、多模,变化非常快,这么复杂的数据怎样快速更新,以及大规模的应用?必须要有一个平台。大家自然会想到,我们就用云平台把它连接到一起。可惜的是,不管哪家商用云平台都无法做好时空大数据,对城市大数据支持的并不是很好。 现有云平台处理城市大数据的限制,与MSRA的实践: 1、数据结构很不一样,跟图象文本结构不一样。 2、查询方式不一样。例如我们在找滴滴的时候,希望是找周边这个时间段内有没有空车经过,而不是关键词进去匹配一个文本出来。 3、真正我们做城市计算的时候我们往往用到多个数据源,而不是单一数据。比如说空气质量预测的时候我们需要用到气象、交通、地理信息以及人的移动数据,怎么样把这些数据多元管理起来?这是一个难题,这个技术是缺失的。所以基于它的原因,现在已有的云平台并不能支持很好支持时空大数据。 (责任编辑:本港台直播) |