本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】深度 | R vs Python:R是现在最好的数据科学语言吗?(3)

时间:2017-01-09 14:25来源:香港现场开奖 作者:118KJ 点击:
如果你正在学习数据可视化,那么你可以参考 Nathan Yau 的工作。他经常在他的博客(flowingdata.com)上上传一些使用 R 语言的数据可视化教程。(笔者同时推

如果你正在学习数据可视化,那么你可以参考 Nathan Yau 的工作。他经常在他的博客(flowingdata.com)上上传一些使用 R 语言的数据可视化教程。(笔者同时推荐他所写的《Data Points》作为参考,在这本书中主要讲授的是数据可视化的一些法则而非编程实现。)

笔者亦推荐 Hadley Wickham 所著的书。如果你对使用 R 语言进行数据可视化感兴趣的话,那么你应该拥有 ggplot2 这本书。它不仅教会你如何使用 R 语言中数据可视化库的使用方法,还能够改变你对数据进行可视化的观念。

同时,你还可以参考这本书:R for Data Science。这本书包含了对数据可视化非常棒的介绍,还有对很多 R 语言数据可视化工具库的介绍,是一本学习 R 语言的必备书籍。

使用 R 语言来学习机器学习

最后,如果你想开始学习机器学习,有很多优秀的使用 R 语言描述的机器学习的书籍可以参考。

我承认,现在有各种各样使用不同的编程语言的来描述机器学习的书籍,但我认为,在最好的那一部分书籍中有很大比例都是使用的 R 语言。

下面有两个使用 R 语言来介绍机器学习的优秀的教程:

统计学习导论(An Introduction to Statistical Learning)

应用预测建模(Applied Predictive Modeling)

这些书写得十分严谨同时也很容易理解。书中会提及一些理论知识(但是不会用很复杂的数学知识来为难你),同时也会教授你一些实用的技术。

毫无疑问,这是我给想学习机器学习的初学者最常推荐的两本书,并且它们都使用的是 R 语言。

如果你想学习数据科学,R 语言是一个绝佳的选择

最后强调一下,R 是一种学习数据科学的优质语言,因为许多优秀的书籍(以及一些其它的教程)都使用 R 来作为编程语言。

所以,如果你是数据科学的初学者,由于数据科学学习材料的数量和质量所限制,所我认为 R 语言是最好的选择。

一个关于 Python 的快速注解

就数据科学编程语言来说,Python 是目前唯一可以替代 R 的语言。(因为其它的替代方案缺乏完善的软件包生态系统或者是非开源/免费的)。

我不会在这里阐述我对 Python 的全部理解,但是我必须要讲的是,Python 的确是一种优秀的语言。我爱 Python。

话虽如此,对于数据科学的初学者来说,我仍然认为 R 是更好的选择,其中的原因我在上文中已经进行了概述。

再者,我认为关于基础数据科学概念(概率、统计、贝叶斯统计、机器学习)的许多最好的教科书和教程都是基于 R 的。当然,这并不是说没有优秀的数据科学书籍使用 Python,我只是认为基于 R 的书籍的平均质量高于用其它编程语言描述的书籍。

有关于 Python 的另一个问题是,很多学生在开发过程中会遇到一些困难。他们在学习的过程中并没有花多少时间来学习统计数据、数据可视化、数据操作、概率等,而是花费了大量的时间去学习数据结构、循环、流程控制、面向对象的编程和 Web 框架。这些技能可以用来完善核心的数据科学工具包,但它们不是我们想要了解的数据科学范畴的相关内容。事实上,我建议大多数初学者先学习基本数据科学相关的内容(如数据操作、可视化、分析等)后再学习软件开发。

虽然大多数的初学者在以后会学习软件开发的技术,但是很多使用 Python 来作为入门数据科学的初学者会陷入到软件开发和 Web 开发等领域。我认为之所以会出现这样的问题,是因为在许多方面,Python 都是运用于这些领域的。大多数关于 Python 的书籍并不是真正的数据科学书籍,而是讲述一些有关于编程和开发的内容。所以,有些数据科学的初学者选择使用 Python 描述的书籍来学习数据科学,然而他们最终却花费了数月甚至数年来学习软件和 web 开发而不是数据科学。

当然,我非常爱 Python,但是对于初学者而言,我认为选择 Python 有一些冒险。最好还是从 R 语言开始,因为统计学和数据科学就像「它的 DNA」一样和它绑定在一起。使用 R 语言,不仅更容易学习,也不容易偏离我们的学习范畴。

如果你想学习数据科学,那么就学习 R 语言吧

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容