【新智元导读】近日微软亚洲研究院主管研究员郑宇发在 AAAI 2017 发布了其团队用深度时空残差网络预测城市人流量的论文。他在微博上称这是兑现了“上海踩踏事件”后的承诺。本文结合郑宇演讲和论文,介绍该项目训练数据获取及整合、如何融合外部因素和时间空间相关性、为什么选择深度残差网络等方面,并且讨论该技术在实际应用中的成本,以及深度学习对其它社会公共问题的解决方案。 【人物简介】郑宇 (博士、教授、博导),微软亚洲研究院主管研究员、美国计算机学会杰出科学家(ACM Distinguished Scientist)、上海交通大学讲座教授(Chair Professor)、香港科技大学和香港理工大学客座教授。
郑宇 郑宇团队一直从事城市计算的相关研究,之前他们利用机器学习对雾霾进行预测。这篇关于城市人流量预测的AAAI论文也是首次(在国际知名学术会议上)公开发表的把深度学习用于城市大数据的研究成果,并开启了深度学习在时空数据中的探索之路(以往的深度学习的研究通常集中在视频、图像和文本数据上)。新智元于2月9日参加郑宇对论文的分享,并且对郑宇进行了访谈。本文将结合郑宇演讲和论文,从训练数据获取及整合、如何融合外部因素和时间空间相关性、为什么选择深度残差网络等方面进行讲解,并且讨论该技术在实际应用中的问题,以及深度学习对其它社会公共问题的解决方案。
2014到2015的跨年之夜,在上海外滩发生的一起踩踏事故,事故造成多人伤亡。事故发生前外滩地区人流量超过100万人、超出该地区人流容量上限(30万人)达2倍多。
悲剧发生后,郑宇在微博上表示:“上海的踩踏悲剧完全可以通过基于手机数据的城市异常检测来避免。当发现人流过于聚集并且移动滞留,就可以提前预警和疏散... 是时候加快城市计算的产业化了。” 他认为,如果我们能够在提前几个小时就知道外滩会有多少人进去,多少人出来,如果我们知道,进去的人远远大于出来的人,而且知道这个地方的存在容量不足以支撑这么多人停留的时候,我们就应该提前做管控,发布一些疏导信息,甚至提前倡导不要进入该区域。因为这么多人一旦聚集在一个地方,上百万人,仅靠一两百个警察或管理人员来维护秩序是很难做到的,那个时候就为时太晚了。 所以当时郑宇就有了这个想法。他说,这次也算兑现了自己的承诺。当时在说这个的时候,有很多人不太理解,因为他们对技术背景可能并不是那么熟悉,觉得这是不可能做到的。但现在我们真的把它做出来了,还结合一些实际的案例,证明这个技术是可行的,其实可以推广到很多城市,对我们的城市公共安全和交通等管理都有很大的价值和帮助。 时空深度残差网络预测城市人流量技术解读 郑宇表示,传统的预测人流量是从个人出发,把每个人的运动轨迹预测来,然后再按区域对进出的人流进行整合,从而得到各个区域的人流量。这不仅涉及到个人的隐私问题,而且准确性也很低(要准确预测每个人的活动是一件非常困难事情)。也有通过基于物理学模型、交通动力学模型之类的经典模型的方法,但这些方法难以应对大范围(整个城市范围)、高密度(上千万人口)和细粒度时空范围(每平方公里、每小时)的集成、同时预测(即不是每个区域单独预测,而是所有区域同时预测,因为各个区域的人流量有关联性)。 而他们这次研究是第一次将深度残差网络用于时空数据,提出了时空深度残差网络模型(ST-ResNet),把整个城市,比如说北京地区,划成很多个网格,多个网格进行同时分析,所以它是一种整体性的预测。 城市人流量预测三大挑战 郑宇提到城市人流量预测三大挑战: 1.影响到人流量的因素非常之多,与区域里面前一个小时,有多少人进和出有关系,与周边区域有多少人进和出也有关系,甚至很远的地方,有多少人进和出对这个地方的人流量也会有影响。一旦一个大型事件发生的时候,很多人会从很远的地方坐地铁,或者通过高速公路前往,并不直接经过该周边区域,就直接达到,所以一个地方的人流量不光只是取决于周边有多少人。 2. 外部的影响因素多:天气、事件; (责任编辑:本港台直播) |