桑文锋:这个问题特别好,其实这是一个恶性循环,分析不能解决实际问题的最主要原因就是数据采集没做好,那后面的环节就都受影响了。许多公司在做数据分析时的一个很大的问题就是靠需求驱动,比如老板要一个数据,分析人员就处理一个数据,下次要了另一个数据,就再单独处理,根本没有数据体系的建设。 我们可以从四个方面来考虑这个问题:首先,我们要做好数据采集,这是根基;其次是做好数据建模,比如神策一直强调的一个模型,就是event-user模型,其实就是最重要的两张表,一张表记录用户做了什么,另一张表记录用户有什么属性;三是各种分析方法,比如漏斗分析等,界面上点选几下就可以实现,而不是让工程师花数周时间专门开发;最后是指标体系,围绕产品从拉新、留存、变现等各个角度来看,我们需要关心哪些指标。所以我觉得真正去建好一个数据体系,应该分成四层,即“采集、建模、分析方法、指标体系”。 iCDO: 您一直提到神策的愿景是帮助企业建立数据根基,这里其实很大程度上是对数据源的有效把控,但数据源在采集的时候,该采什么数据或者哪些数据是对公司有用的,这些问题神策是怎么考量和解决的呢? 桑文锋:我对数据有一个看法,数据这个事情想要做好是需要经验的,没有经验真的是很难做好,因为会不断的踩坑,比如哪些字段要采集,哪些不要采,然后该用什么系统,涉及哪些系统组件,其实都是一个一个坑。即使你想好了,然后推动业务部门去配合你,工程部门配合你开发,业务部门配合去用,其实这里面都是一系列的坑。 这也是神策的一个价值,神策是一个80%产品+20%咨询,我们有一个强大的分析师团队,还有一个客户成功团队,基本上就是分析师团队在部署之前会帮助客户去梳理他的业务,然后围绕业务里面有哪些关键的行为事件,事件里面涉及哪些关键的维度,再去决定部署,只有这样的话,才能把这个底子打好,否则你凭空产出分析或工具去用,可能也只有10%的功能客户会埋单。 iCDO: 中国人很着急,花钱买了你神策的东西,或是Adobe的东西(比如AdobeOmniture等),就希望能够立即看到效果——能够马上看到企业组织在工作流程或方式上的改变;另外一种心态则是,我花了5万元买了你的产品,你的产品必须给我带来超过50万额外的销售作为回报,否则你的产品就是“忽悠我的钱”,您怎么看这个问题? 桑文锋:我是这样看的,中国确实有一个大的背景,就是中国的人力便宜,在这种情况下,大家许多时候能用人顶上,干嘛还要用你这个第三方工具呢,还得额外花费成本,然后大家就不愿意为效率付费,这是一个问题;另外一个问题是流量很便宜,许多时候获取流量太容易了,粗放型的也能活得很好。 但现在我觉得这两个条件都不具备了,已经被打破了,首先人力变得越来越贵,就拿咱们数据分析这个领域来说,招人非常困难,很难招到合适的人选;其次,流量红利没了,做广告带来的收入又不是纯利,亏多少就是一个问题。所以从这些因素就逼迫着互联网企业要精耕细作,要挖掘好已有的用户群,并想办法把它利用好。 所以在我看来,互联网统计分析其实经历了三个阶段:最开始是流量阶段,这个阶段大家只关注访问量就够了;到了第二个阶段,是用户阶段,我们开始关心DAU、MAU等一类指标,但仍然不需要深挖;而现在我觉得已经是第三个阶段,就是订单阶段,我们要关心一个用户怎么转化进来的,来了之后怎么去盘活他,所以整体数据分析的需求都变强了。 同时,确实如你所说,我们希望尽快看到效果,这也是一种趋势,而且我觉得最后按效果付费会占到很大的比例,虽然这个过程比较着急,但我觉得一定会进入这个阶段,可能还需要3~5年的时间。 iCDO: 目前Sensors Analytics采集的数据主要是用户行为数据,其他类型的数据也可以采集吗?比如业务数据,线下数据等? 桑文锋:都是可以采集的,比如客户的业务数据,线下数据,服务端数据等,这些数据都能采集过来。从我们的理念上来说,大数据总结成四个字就是“大”、“全”、“细”、“时”,这里面的“大”主要指宏观的大,实际采集上我们并不用关注它;“时”指高实效,实时的数据,这个我们一般也忽略它,我们更多的是考虑一个“全”,一个“细”。其中“全”,就是指多种数据源,不管是客户端的、服务端的、线上线下的、或是各种设备的,将数据全量采集。其次“细”,就是强调多维度,采集过来用户一个提交按钮,用户一次浏览,他相关的维度“who、when、where,how、what”信息也采集起来,这才能建立一个好的数据底子,之后的分析也会变得容易很多了。 (责任编辑:本港台直播) |