线下数据不光只是通过热力图来看,重点是如何用这些数据,构建人群画像,获取潜客,来达精准化营销,资源配置,估算人口,招商引资等。 背景 每个做数据分析的人员应该尝试过热力图,热力图包含线上&线下,线上的热力图其实根据用户点击次数来绘制,其目的就是给网站运营&移动运营产品经理等提供对页面按钮&功能参考,从而得知用户兴趣倾向,精简按钮等。 而线下的热力图又叫等值线地图(choropleth map),以不同颜色表示不同的人口密度、天气情况、人均收入、或者社会价值等。我们的现实生活中用的最多的是反应人口密度的线下热力图,但是我们通常也往往遇到一个问题,这些漂亮的图有啥用?同时,也会引起我们的反思,难道线下数据只有热力图这个用途么? 线下数据的数据源 先说用途之前,我们先说说人口密度数据从哪来,线下热力图的核心就是获取:经纬度;地址。 线下热力图的数据可以从几个方面来说: 1、IP 地址 IP可以通过各种网段来判断地址,目前IPV4协议使用的是32位地址,约有42亿个地址,全球共用,中国约分配到6000多万个IP地址,同理各个省、各个地区的地址段也不一样,因此可以从地址段ip数判断用户密度 但是,现在大部分ip地址是动态ip,如果用ip地址打比方是门牌号的话,动态ip地址就是反应此用户经常搬家,门牌号不固定,这样不能精准定位人群以及确定用户的活动范围 所以,IP地址通常定位的数据范围是城市、省。 2、GPS GPS全球卫星定位导航系统,常用的设备中其他蜂窝电话网络如GSM/GPRS也有类似自定位技术 但是一般而言,GPS会有很多问题: 需要开启定位功能的终端或者APP GPS定位卫星的标准钟时间不统一,致使在计算客户端到相应卫星的距离时有误差 运动状态,GPS信号频繁变化 3、WIFI其原理就是用AP(路由)接收Beacon,或者发送请求帧(probe request)。 被动扫描:就是我们说的wifi 探针,原理就是通过安装在特定的路由,通过握手协议将手机mac地址收集。 自动扫描:手机不定时会发送请求收集wifi信号,同样也是握手协议,但是我们知道ssid和bssid,但是不知道他们的对应关系(ssid 可以理解路由器名称;bssid其实就是路由器的mac地址)因此很多公司会派出很多人力去各大地方用自己手机探测wifi去寻找bssid。 同时,不管主动扫描、被动扫描,wifi信号强弱都会被同一个手机握手协议去收集(即穿墙技术),只能通过规则,时长等来判断此设备到底停留在具体位置。 再者,由于iphone ios8 以上,会发送假的mac地址,因此,不能只通过握手协议来判断,所以wifi确定的大部分设备系统为安卓。 线下数据源其实对后期数据用途的理解起到一定作用,那么我们这就聊聊线下数据应该怎么使用。 线下数据用途 用途1:估算人口,合理配置资源 我们常用的线下数据是反应人口比例密度,来估算某处的人流量,来提供线下资源配置建议 分析步骤如下: 案例1 获取IP定位分析城市: 例如某金融机构,根据他们手机数据IP来源查询到位于深圳的客户最多,因此想重点探查下深圳现有网点和人流密度差异,即想查看某处周围人流密度是否过于稀疏、集中而应该减少、增加网点,支持业务需求。 同时,通过对热力图采样的人流数据,和实际人口统计的人数,估算某地点的人数,与实际kpi核对是否达到设置网点的承载能力。 于是,线下数据用途之一观察热力图,估算人口(见下图),我们可以根据估算的用户数增减网点配比 当然这里是数值是用手机的GPS数据来反应人口密度,数值还可以用发声用户量,人口属性(男女),年龄段最多人数比例等,或者app类型数据等来反映,其目的是要解决实际业务和线下数据问题,这里不赘述,欢迎讨论 绘制线下热力图&增加网点分布: 统计时间:15年7月1-7月6日 统计口径:在统计时间内打开此金融机构app并开启定位功能的设备获取的经纬度 分析步骤:绘制基于设备热力图后,增加此金融机构网点分布 分析目的:估算的用户数增减网点配比 分析结论: 从图中可以看到编号9、10、13附近,应该增设网点、而在64、70、37附近应该减少网点。 案例2:根据工作日VS周末的不同时间,来估算人口数量 (责任编辑:本港台直播) |