本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:如何七周成为数据分析师18:Python的新手教程

时间:2017-08-12 02:16来源:天下彩论坛 作者:开奖直播现场 点击:
如何七周成为数据分析师18:Python的新手教程 2017-08-11 15:56 来源:人人都是产品经理 数据分析 原标题:如何七周成为数据分析师18:Python的新手教程 本文是《如何七周成为数据分析师》

如何七周成为数据分析师18:Python新手教程

2017-08-11 15:56 来源:人人都是产品经理 数据分析

原标题:如何七周成为数据分析师18:Python新手教程

本文是《如何七周成为数据分析师》的第十八篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分。

wzatv:如何七周成为数据分析师18:Python的新手教程

Python是近年来最火爆的语言,已经作为数据分析和机器学习的首选语言之一。

Python虽然被诟病不够快,但足够灵活和易上手。Python教程主要围绕数据分析展开,所以技术原理这类内容会略过,可以认为这是一篇重应用的课程。

想学会一门语言不是一朝一夕的事情,若大家想成为技术型的数据分析师,或者未来往数据挖掘发展,建议你要比文章内容学得更深。所有的代最好都手打一遍,这是最有效的学习方式。

数据分析环境

Python的编写环境,用Anaconda足矣。Anaconda是专业的数据科学计算环境,已经集成绝大部分包和工具,不需要多余的安装和调试。

Python版本建议3.0以上,现在最新版本是3.6,不要选择2.7的版本,否则你会被无尽的中文编问题困扰。

Anaconda在官网continuum.io/downloads 下载,选择最新版本,约400MB。

完成安装后,Win版本会多出几个程序,Mac版本只有一个Navigator导航。数据分析最常用的程序叫Jupyter,以前被称为IPython Notebook,是一个交互式的笔记本,能快速创建程序,支持实时代码、可视化和Markdown语言。

点击Jupyter进入,它会自动创建一个本地环境localhost。

wzatv:如何七周成为数据分析师18:Python的新手教程

点击界面右上角的new,创建一个python文件。

开始你的Python

wzatv:如何七周成为数据分析师18:Python的新手教程

界面上部是工具栏,编辑撤回运行等,下面是快捷操作,大家以后会熟悉的。页面正中便是脚本执行的地方,我们输入自己第一行代码吧:

wzatv:如何七周成为数据分析师18:Python的新手教程

(我就不用hello world)灰色框是输入程序的地方,回车是换行,shift+回车执行灰色区域的代码,它的结果会直接在下面空白处出现。这就是Jupyter交互式的强大地方,将Python脚本分成片段式运行,尤其适合数据分析的摸索调整工作。

这里的print叫函数,和excel的函数同理,是程序执行的主体,负责将输入转化成输出(函数留在下一篇细讲)。这里将hello qinlu这段文字输出。新手可能会奇怪为什么要加引号,这种用引号括起来的文字在程序中叫字符串。

Python是一门计算机语言,它的逻辑和自然语言不一样,编程语言的目的是执行任务,所以它不能有歧义。为了规避各种歧义,人们创造了语法规则,只有正确的语法,才能被转换成CPU执行的机器码。

先了解Python语法中的数据类型。计算机最开始只被用于数值运算,后来被赋予了各种丰富的数据类型。

wzatv:如何七周成为数据分析师18:Python的新手教程

上面两个是小学生都会的四则运算,在计算机语言中可没有那么简单。它涉及了两个数值类型,整数int和浮点数float。整数和浮点数在计算机内部存储的方式是不同的,我们不用知道具体原理,明确一点,整数运算是永远精确的,浮点运算则可能有误差。

两种数据类型也可以互换,通过int函数和float函数。

wzatv:如何七周成为数据分析师18:Python的新手教程

有了数值,必然有文本,程序中叫字符串,用英文引号括起来表示。单引号和双引号没有区别,所以”qinlu”和’qinlu’是等价的,引号是边界,输出的时候不会包含它。当字符串内本身包含引号时,也不影响使用。

wzatv:如何七周成为数据分析师18:Python的新手教程

需要注意的是,不论单引号还是双引号,一旦混用很容易出现错误。因为程序并不知道它是字符串的边界还是符号。

wzatv:如何七周成为数据分析师18:Python的新手教程

解决方法有两种,一种是使用三引号,三引号代表整体引用,而且包含换行。第二种是引号前面加\,它是转义字符,表示这个引号就是单纯的字符。

wzatv:如何七周成为数据分析师18:Python的新手教程

三引号也可以用来注释,通常是大段的文字解释,如果一句话,我们更习惯用#,#后面的内容均不会作为程序执行。

时间是特殊的数值类型,它将结合datetime模块讲解。

还有两个常见的数据类型,布尔值和空值。布尔值是逻辑判断值,只有True和False。

wzatv:如何七周成为数据分析师18:Python的新手教程

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容