本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

如何七周成为数据分析师21:Python分析之numpy和(2)

时间:2017-08-15 22:47来源:668论坛 作者:j2开奖直播 点击:
Series是一维的数据结构,DataFrame是一个表格型的数据结构,它含有不同的列,每列都是不同的数据类型。我们可以把DataFrame看作Series组成的字典,它既有行

Series是一维的数据结构,DataFrame是一个表格型的数据结构,它含有不同的列,每列都是不同的数据类型。我们可以把DataFrame看作Series组成的字典,它既有行索引也有列索引。想象得更明白一点,它类似一张excel表格或者SQL,只是功能更强大。

构建DataFrame的方法有很多,最常用的是传入一个字典。

如何七周成为数据分析师21:Python分析之numpy和

DataFrame会自动补充索引,并且将字典的key作为列标签,即column。在这里,dict的key顺序是DataFame的顺序,不再是无序的。

DataFrame中可以通过info函数直接查看数据类型和统计。

如何七周成为数据分析师21:Python分析之numpy和

如何七周成为数据分析师21:Python分析之numpy和

DataFrame的数据类型变更和numpy一样,用astype就行,记住要赋值。df.age = df.age.astype,图上只是举例,没有真的更改数据类型。

DataFrame的索引方式和Series一直,它选取的是列。

如何七周成为数据分析师21:Python分析之numpy和

返回的是一组Series,索引和原DataFrame一致。除了方括号选取,DataFrame还有更简单的选取方法。

如何七周成为数据分析师21:Python分析之numpy和

行也可以通过通过位置获取,用索引字段ix的方式。

如何七周成为数据分析师21:Python分析之numpy和

第二个方法不需要调用ix,直接以切片的形式获取行,切片的用啊和数组一样。记住,切片无法用单独的数字选取,只能用冒号切选范围。

列可以通过赋值的方式修改和添加,当列的名称是全新,则会在DataFrame的最右边自动加上新的一列。

如何七周成为数据分析师21:Python分析之numpy和

如何七周成为数据分析师21:Python分析之numpy和

列表和数组都可以赋值到列,长度必须匹配,列表是按照顺序,数组的话,可以按index参数设置的索引对应,若为空,则填上缺失值。

DataFrame的index不可更改,这是为了数据的安全性,但我们能通过index函数获取详情。

如何七周成为数据分析师21:Python分析之numpy和

DataFrame在数据选取上面非常强大。

如何七周成为数据分析师21:Python分析之numpy和

它支持常用的逻辑判断,例子中,后两种数据选取是通过布尔数组过滤出我们想要的结果。

如何七周成为数据分析师21:Python分析之numpy和

df.sex == ‘男’返回了一个布尔数组(记住,是两个等号,一个等号是赋值),然后通过布尔数组找出df中符合条件为true的结果。

现在我们希望找出年龄在20以下,且性别为男的人。

如何七周成为数据分析师21:Python分析之numpy和

这里用到布尔类型数据的计算公式,true and true 为true,false and true 为false。pandas中的逻辑符号,并且是&,或者是|。接下来过滤出性别为女,或者年龄为18的人。

如何七周成为数据分析师21:Python分析之numpy和

当逻辑条件复杂时,这种写法并不优雅,比如性别为男,且年龄在18岁,以及性别为女,且年龄在18岁以上的两类人群,这种过滤条件就比较复杂了。pandas中可以用query函数以类SQL语言执行查询。

如何七周成为数据分析师21:Python分析之numpy和

query中可以直接使用列名,它的功能远不至于此,大家有兴趣可以深入学习。

如何七周成为数据分析师21:Python分析之numpy和

DataFrame可以直接在列上进行运算,当DataFrame和DataFrame之间运算时,按索引进行加减乘除。

如何七周成为数据分析师21:Python分析之numpy和

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容