编译团队|张远园,行者,Aileen “ 导读:本期小白学数据继续带大家学习Python。这次小编们帮大家在网上搜集了很有用的几个Python常见库小抄表,方便大家学习和编码时查询。 ” 小白,我把上一期跟你的对话,整理成小白系列《小白学数据之新年计划-开始学Python吧!》,大家反响热烈!这下,大家都知道怎么开始学习Python了,哈哈! 小白:是啊是啊,我现在跟着你的指导,在网上学习完了Python基础,安装好了Python。可我总是记不住那些Python基础、语法啊,呜呜呜。。。 答:额,这样啊,容我想想。 有了,你知道小抄表么?就是考前大家都会做的科目提要,有时“好学生”们会“不慎”带进考场的那种? 小白:你这一说,我的确想起了我那“纯真”的考试岁月。可是,这跟Python有什么关系呢? 答:当然有关系,我可以给你做一个Python基础的小抄表啊!走一个嘞~ 在这张Python小抄表里,已经囊括了Python的相关介绍:变量,数据类型,字符串,列表,并最终落实到Python的基本科学计算包。 小白:你太有办法了,这可真是及时雨;以后需要用Python的时候,我查这张表就OK。但我最近有一些困惑啊:都说Python是大数据处理的好帮手,还有许多其它应用,可我学了Python基础之后,根本不知道怎么用Python来做这些事啊。 答:不急不急,这是因为你还不了解Python强大而丰富的库。比如说Pandas,当下最受数据科学家欢迎的数据分析Python包。 小白:Pandas?熊猫? 答:噢,是Python Data Analysis Library,它是python的一个数据分析包,基于NumPy(一种python的开源数字扩展,使python有更强大的矩阵运算功能,堪比Matlab)。 小白:噢~,酱紫。就是可以让python数据分析能力更强的利器咯! 答:是的。Pandas最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来, 有NumPy的加持,让Pandas 拥有了大量库和一些标准的数据模型,快速便捷地处理数据的函数和方法,可以让我们利用Python高效地操作大型数据集,使Python成为强大而高效的数据分析环境。 小白:哇,好赞。那我该怎么学Pandas? 答:这个嘛,说难也不难,我来帮你!Pandas为了使实际的数据分析更加简单,设计出了快速、灵活而可读性高的数据结构。但可能对于那些刚刚接触Pandas的小鲜肉们来说,Pandas并不是那么容易掌握,尤其是面对这个包里那么多的功能、那么多的选项。 因此,一份Pandas小抄表就显得特别滴重要!噔(一声)噔(二声)噔(一声)噔(二声)~ Pandas小抄表会带着你一览Pandas包的基础知识:从数据结构到输入/输出,数据选择,下降指数(dropping indices or columns),数据整理和排序,获取所用数据结构的基本信息,到数据操作的功能应用、数据对齐等等。这可是新手上路的必备手册噢! 小白:好棒!所以Python库主要就是Pandas包? 答:何止!跟大数据相关还有Bokeh可视化包,以及Scikit-Learn机器学习包。 小白:好奇妙,赶紧说道说道。嘿嘿,是不是还可以要小抄表? 答:你可真贼,我会整理整理,给你小抄表啦。 说起来,数据分析没有图表,那可是美女没有漂亮衣裳一样,无法让人欣赏啊。所以有了Bokeh,这个Python的交互式可视化包,只要你用现代化 Web 浏览器,就可以得到它提供的大型数据集高性能交互功能,Boken 可以非常快速地创建交互式的绘图、仪表盘和数据应用,就像那些美妆试衣的软件一样,让你的数据更清晰、美观的呈现在你面前。 小白:那可太好了,直播,我最怕做图表,费时费力啊。 答:哈哈,确实可以帮到你,不过,Bokeh可不止做图表这么简单。对于数据科学家而言,Bokeh是快速简单创建统计图表的理想工具。但Bokeh还有更多的优点,比如种类繁多的输出选项,可以将可视化结果嵌入应用中。正因为众多的可视化定制选项,使得Python库成为数据科学家工具箱中不可或缺的成员。 小白:哇,好强大。这要怎么学?复杂么? 答:不会啦,忘了我们有小抄?看,这张小抄表不仅提供了绘制专业图表的五个步骤,也将会介绍统计图表的基本知识。 (责任编辑:本港台直播) |