笔者(Data scientist)之前在内部分享会上与团队讨论过的议题: 总结共有十点: 1.以解决问题为导向 数据科学家需要透过数据识别、分析和解决问题。海量的数据不等于高质量的数据,优秀的数据科学家不仅仅需要熟练掌握算法和挖掘分析工具,而且需要结合实际情况,帮助企业解决现实世界的问题。 2.保持旺盛的求知欲 眼中只有数据和算法的人,很难成为一名优秀的数据科学家。你不需要成为Hadoop或Java方面的专家,但需要懂得编程的思维能能偶尔写写代码;你不需成为成功的企业家,但需要保持一定的商业敏感度和营销策略。对一切抱有强烈的好奇心是优秀数据科学家的标配。 3.换位思考的同理心 数据科学家无法一个人完成所有工作,必须依靠团队的综合实力才能更有效地解决问题,一个优秀的数据团队需要技术人员与业务分析人员之间的无缝配合。你需要理解码农的难处和业务的苦衷,权衡利弊BOSS的安排做出最优的决策。 4.身先士卒的做表率 在具体某一项任务中,如何指定每一名角色的职责及分配相应的任务至关重要。但一名优秀的数据科学家很多时候需要以一己之力给团队做一个好的表率,遇到难啃的算法、复杂的调参、繁杂的数据时必须当仁不让一马当先。 5.化繁为简的讲故事 如果你不能让你的BOSS理解你在做什么,为公司创造了什么样的价值。那么即使你的算法再高效、模型再完美、技术再先进也都是无用功。很多时候,你需要把听众们当成一个3岁的孩子一样讲述你的分析报告。 6.尝试不同的数据源 数据整理需要花费很多精力和时间。有时候你并不知道你的数据从何而来,中间经历了怎么样的过程,atv,一名优秀的数据科学家需要对自己的数据有充分的了解。有些时候,别的部门清洗过的数据并不比原始的数据「质量」更高,因为那不一定是你所需要的。 7.谨慎使用最酷技术 有些时候,一些看起来很酷炫的可视化技术确实能够让人眼前一亮,但大部分时候,那只会让看你图表的人分心。你需要做的只有一件事:让观众理解报告内容的核心价值,核心价值,核心价值。重要的事情要记得说三遍。 8.指标不是最关键的 观众们愿意来听你讲故事,不是希望你提出问题,而是希望你能解决问题。关键绩效指标(KPI)只能证明问题确实存在,但观众们更想知道的是你下一步准备如何做。解决问题的方法、备选方案ABC、应急方案的设计才是最考验能力的。 9.时刻更新你的认知 数据科学家通过数据预见未来,atv,而预测模型会受到很多变量的影响。对手提出新的定价方案、政府发布新的工作报告、产品出现始料未及的BUG都会影响预测的准确性,《蝴蝶效应》很多人都看过,十分微小的初始变化经过不断放大,对其未来状态会造成极其巨大的差别。但这里要注意区分相关性与因果性。 10.全面了解分析对象 仅仅通过日志和设计观测节点来完成分析报告是不靠谱的。一名优秀的数据科学家需要对产品的结构设计、主要功能、参数接口、运行平台、用户操作和时间序列有一个全方位的认知。辩证的思考问题,数据不会说谎,但是人是会说谎的。 数据人对数据应当心存敬畏之心。 个人微信公众号:Dataology (责任编辑:本港台直播) |