从Glassdoor受访者提供的554条真实的面试问题中,我们找到了一个数据宝藏,其中涵盖了数据科学团队在面试中测试到的所有技能。我们将这些问题归结为以下几类: 第一类: 统计和概率问题 上面这张图来源于脸书(Facebook),发表于2013 年9月12日。问题是这样的:你计划乘飞机去西雅图,想知道是否应该带伞。你随机选了住在当地的3个朋友,分别给他们打电话,询问是否在下雨。每个朋友都有2/3的几率告诉你真实情况、有1/3几率用假消息干扰你。所有的3个人都回答你“是的”在下雨。那么西雅图真正下雨的概率是多少? 该问题共有26 条回答。其中一条用贝叶斯统计答道:你应该取得任何一天西雅图下雨的几率作为先验概率。如果面试中你提到这点或者询问这点,面试者告诉你用25%,atv,然后直接这样解答: 于是你得到答案:是的,我应该带伞。(是的,是的,除非你朋友一直都是用假消息在干扰你) 统计和概率的问题常常是数据科学工作的重要组成部分。这类面试问题是测试求职者的思维,以及如何就不确定性作出合理解释,是数据科学家要掌握的一种基本技能。 帮助你准备统计和概率面试问题的文章请点击:How Bayes Theorem, Probability, Logic and Data Intersect (https://www.springboard.com/blog/probability-bayes-theorem-data-science/) 帮助你准备统计和概率问题的书请点击:Think Stats, Probability and Statistics for Programmers () 帮助你准备统计和概率问题的互动课程请点击:Probability and statistics with KhanAcademy (https://www.khanacademy.org/math/probability) 第二类:编程问题 2013年5月26日发表于脸书的这条面试问题是:写出这样一个函数,输出两个整理好的数据列的合集。 8条答案中的一条是:f(a,b){return sort(unique(a,b))} 如果说统计和概率问题相对于数据科学工作,就像肉相对于一道土豆炖肉,那么编程就是其中必备的土豆。数据科学要求批量式处理数据,也就是需要编写程序来实现海量工作的自动化。 帮助你准备程序面试问题的文章请点击:Data science sexiness: Your guide to Python and R, and which one is best () 帮助你准备程序面试问题的书请点击:Cracking the Programming Interview (https://www.amazon.com/Cracking-Coding-Interview-Programming-Questions/dp/0984782850) 帮助你准备程序面试问题的DataCamp互动课程请点击:Intro to Python for Data Science (https://www.datacamp.com/courses/intro-to-python-for-data-science) 第三类:商业思维和案例研究 2013年4月5 日发在脸书上的这则问题是:你正在为用户编译一份每月上传的内容的报告,并注意到10月份的上传激增。具体来说,atv,是上传的图片激增。你觉得可能是什么原因导致这个现象?如何测试? 下面唯一的一条答案是:假设这些图片是万圣节的,对比检查那些不过万圣节的国家的图片上传趋势,以此作为某种反事实分析来测试。 数据科学的第三板是把你的发现,用驱动业务的行动和成果的方式进行解释。这类面试问题测试的是你对导致所观察到的行为发生的可能因素的思考能力。 帮助你准备商业思维和案例研究问题的文章请点击:Tips for Data Scientists: Think Like a Business Executive () 帮助你准备商业思维和案例研究问题的书请点击:Data Science for Business (https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/1449361323) 帮助你准备商业思维和案例研究问题的互动课程请点击:Data Analytics for Business (https://www.springboard.com/workshops/analytics) 第四类:文化/角色契合问题 (责任编辑:本港台直播) |