参与:吴攀、侯韵楚 Class Central 的数据顾问(Data Consultant)David Venturi 近日分享了其对于自学数据科学的课程推荐,本文主要推荐了数据科学过程(data science process)的入门课程。 一年前,我从加拿大顶级的计算机科学课程之一退出,并利用在线资源开始创建属于自己的数据科学硕士课程。我意识到,通过 edX 、Coursera 以及 Udacity,我只需用成本的一小部分便可以更迅速、有效地学到我所需要的一切。 这门课程差不多要完成了。我修读过许多数据科学相关的课程,并了解更多的课程。我知道其中有什么选择,也清楚成为数据分析师或数据科学家所需要的技能。我在几个月之前开始着手创建一个能够为数据科学的每个主题推荐最佳课程的评审驱动指南。 关于系列的第一个指南,我为初学级的数据科学家推荐了编码类指南,然后是概率与统计类的指南: 编码类:https://medium.freecodecamp.com/if-you-want-to-learn-data-science-start-with-one-of-these-programming-classes-fb694ffe780c#.42hhzxopw 概率与统计类:https://medium.freecodecamp.com/if-you-want-to-learn-data-science-take-a-few-of-these-statistics-classes-9bbabab098b9#.p7pac546r 现在来介绍数据科学 对于数据科学课程所介绍的一些内容若有不确定的地方也不用担心,atv直播,稍后会做出解释。 为了这本指南,我花了 10 多个小时搜集截至 2017 年 1 月提供的数据科学课程的每一个在线介绍,从它们的教学大纲和评论中提取关键信息并编辑评分。为了完成这个任务,我使用了开源的 Class Central 社区和它的具有数千课程评分与评论的数据库作为辅助。 Class Central 的主页:
自 2011 年以来,Class Central 的创始人 Dhawal Shah 一直比世界上任何人都密切关注在线课程,他亲自帮我列出了这份资源清单。 我们如何选择课程 每门课程必须符合三个标准: 它所教授的必须是数据科学过程(data science process),稍后会对其做出解释。 它必须按需或每几个月来提供课程。 它必须是一个交互式的在线课程,所以这里没有书或只读教程。虽然存在多种可行的学习方法,但本指南只专注于课程。 我们认为这个指南涵盖了所有符合上述标准的重要课程。由于 Udemy 中存在数百个课程,所以仅选择了评论最多且评分最高的课程。但我们总会有可能错过一些优秀的课程,atv,所以如果发现我们有所遗漏,请在评论区告知。 我们如何评估课程 为了计算每个课程的加权平均评分,我们汇集了 Class Central 和其他评论网站的平均评分和评论数。同时我们阅读文本评论,以该反馈作为数字评分的补充。 我们基于两个因素做出主观的大纲判断内容: 1. 数据科学过程的覆盖。课程是否略过了某些科目?它是否覆盖了某些科目过多的细节?请参阅下一部分来了解此过程的具体内容。 2. 通用数据科学工具的使用。课程是使用普遍的编程语言(如 Python 和/或 R)教授的吗?这些都不是必要的,但在大多数情况下有帮助,所以对这些课程稍作优先考虑。 Python 和 R 是数据科学中使用最普遍的两种编程语言 什么是数据科学过程(data science process)? 什么是数据科学?数据科学家做什么工作?这些是数据科学课程介绍所应回答的基本问题类型。哈佛大学教授 Joe Blitzstein 和 Hanspeter Pfister 的以下信息对典型的数据科学过程进行了概述,这会帮助我们回答这些问题。 来自 Opera Solution 的可视化 我们对于数据科学课程介绍的目标是熟悉数据科学过程,并不想太深入地涵盖过程的具体方面,因此便停留在该标题的「介绍/入门(intro to)」部分。 对于每一方面,理想课程应该解释过程框架内的关键概念、介绍常用工具并提供一些示例(动手实践更佳)。 我们只是在寻找课程介绍,因此本指南不包括约翰·霍普金斯大学的 Coursera 数据科学专业(Data Science Specialization)或 Udacity 的数据分析师纳米学位(Data Analyst Nanodegree)等专业。这些课程的汇编并未包含这个系列的目的:为每个科目找到包括数据科学教育在内的最佳个人课程。本系列文章的最后三个指南将详细介绍数据科学过程的每个方面。 基本编码、统计以及概率所需的经验 下面列出的课程需要基本的编程、统计和概率经验。这个要求可以理解,因为有些前沿科目通常包含几门专项课程。 这种经验可以从我们所推荐的数据科学职业指南的前两篇文章(编程、统计)中获得。 我们选择的数据科学最佳入门课程是: 数据科学 A-Z?:包含实际数据科学练习(Data Science A-Z?: Real-Life Data Science Exercises Included)(Kirill Eremenko/Udemy): https://www.udemy.com/datascience (责任编辑:本港台直播) |