本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

创业者必备能力:创业各个阶段应该如何进行数据分析?| 创世界(3)

时间:2017-04-19 08:48来源:天下彩论坛 作者:www.wzatv.cc 点击:
从你现有的网络分析和事件跟踪迁移到Snowplow Analytics。 Snowplow具有所有付费工具都具备的功能,但它是开源的。你可以自己运营(只需支付你的EC2实例费用

从你现有的网络分析和事件跟踪迁移到Snowplow Analytics。Snowplow具有所有付费工具都具备的功能,但它是开源的。你可以自己运营(只需支付你的EC2实例费用),或者你可以支付Snowplow或Fivetran,让他们帮助你运营。如果你不在此阶段进行这样的过渡,那么你将丢掉更多细节数据。而且你以后会收到来自Segment、Heap或Mixpanel的庞大的账单。一旦你挺过去这个阶段,这些付费工具就可以轻松收取每月最低10万美元的费用。

深思熟虑地增长你的团队。你团队的核心人物应该始终是业务分析师:谁是SQL专家和你的商务智能工具。并花时间与业务用户合作,帮助他们服务于他们的数据请求。了解这个人的背景,以及如何训练和装备他们是非常重要的。在这个阶段你也应该聘请你的第一位数据科学家。在雇用经验丰富的(和昂贵的)数据科学人才之前,让你的数据基础架构和核心分析团队准备好,是非常重要的,但在某些时候你应该添加这个技能组。

开始选择性地应对一些即将到来的挑战。预测比运行计数更难,但是潜伏在几个关键领域是非常有意义的。如果你是做SaaS业务的,你应该研究一个流失预测模型。如果你是做电子商务的,你必须要做一个需求预测模型。这些模型不需要特别复杂,但它们将比可以随便入侵的杂乱无章的Excel工作簿要好的多。

花时间和精力找到你的营销归因。这是一个独立的自发博文,意思是说,你不能把这个关键的商业问题给交给第三方处理。

  什么不该做

  很容易被自己带上道,然后开始投资重型数据库基础设施。不要这样做。在这个阶段,主要的基础设施投资仍然是一个昂贵的部分。以下是如何保持灵活的一些建议:

大力支持SQL和数据仓库。你可以使用数据仓库的,处理这个阶段几乎全部的操作。 你可以随便购买任何需要的数据仓库马力,因为支付服务器比支付人力要便宜得多。

在Jupyter Notebooks中添加数据科学工作。如果数据已经在你的仓库中预先聚合,则通常不需要在Spark或Hadoop集群上进行此处理。

寻找低成本的ETL数据集,我们不需要装配好的成品。这就是为什么我们喜欢Singer的原因之一。

  避免昂贵的琐碎小事,可以让你专注于解决实际的业务问题。

  成长阶段

  (150至500名员工)

  这个阶段需要创建扩展的分析流程。你需要取得两者的平衡。一者是你今天需要的答案,而另一者是当你扩大规模时,你需要执行的数据分析业务。

  有150名员工,你可能只有一个小团队(3-6人)全职专注于分析。当你拥有500名员工时,你可以轻松拥有30名或以上的员工分析数据。3-6名分析师可以以非常特殊的方式运作,非正式地交换知识(和代)。当你有多于8名分析师时,这就要崩盘了。

  如果你不能很好地管理这种转换,那么你的团队就无法健康成长:你需要更长时间才能产生有意义的见解,你的答案质量较差。这只是非线性复杂性的一个功能:你将有更多的数据被生产,并且更多的分析人员使用它。为了解决这个问题,你需要将流程保持在可靠的状态。

  什么该做

实施数据检测。这时候,atv,你至少有十几个来源的数据流入你的数据仓库,你需要一个程序,来确保正在载入的数据将继续符合你的期望规则:独特性,外键关系,非空字段以及自定义业务逻辑。如果你没有一个坚如磐石的自动化流程来检查这个东西,你分析的质量将会持续下降,而且你还不知道为什么。我们使用dbt的功能为我们的客户测试。

使用拉扯请求和代码审查。你的分析代码是一种资产,就像你的网站和应用程序的代码一样。制作高质量的代码需要严格的版本控制。让你团队中的每个成员都使用Git,培训他们如何使用分支,并禁用强制推送。所有部署到生产的代码都应该通过 pull request 过程进行合并,并让一个团队成员审核。

认真对待文档。你公司的数据环境很复杂。有效管理知识并与你的团队分享的唯一方法是花费时间和精力来记录。这将增加一些开销,但如果你不进行此项投资,你会发现分析师花更多的时间来了解获取数据的位置和使用方法,而不是在真正地分析数据。Airbnb在这方面做得很好。

(责任编辑:本港台直播)

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容