2017-07-28 15:58 来源:人人都是产品经理 数据分析 原标题:如何七周成为数据分析师06:数据可视化之手把手打造BI 本文是《如何七周成为数据分析师》的第六篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉BI,大可不必再看这篇文章,或只挑选部分。 前言 我们上一篇《如何七周成为数据分析师05:数据可视化之打造升职加薪的报表》教大家如何制作清晰美观的报表以及相应技巧,但是报表是结果的呈现,并不是数据分析的过程。 数据分析师更多用到的报表是BI。 BI全称商业智能(Business Intelligence),在传统企业中,它是一套完整的解决方案。将企业的数据有效整合,快速制作出报表以作出决策。涉及数据仓库,ETL,OLAP,权限控制等模块。 今天的学习我们只着重于数据分析过程,使用Power BI打造数据分析师Dashboard报表。为了更好的学习和实践,我们依旧会使用《如何七周成为数据分析师03:手把手教你Excel实战》的数据进行操作。这是做出的简单作品。 如果你还没有数据,atv,请在公众号:qinlu中的会话页发送关键词「练习数据」获取下载地址。 Power BI在微软官网有下载(注不注册无所谓的),只需要下载Desktop桌面操作版,大小约120MB。暂时只推出Win版本。 大家如果在下载过程中出现CAB文件损坏错误,大概是某软哪方面又出错了,可以换浏览器下载,也可以下载中文繁体版。反正我是一直报错。 为了方便大家偷懒,可以在公众号:qinlu中会话页发送关键词「BI下载」获取官网下载地址。 什么是Power BI BI工具主要有两种用途。一种是利用BI制作自动化报表,数据类工作每天都会接触大量数据,并且需要整理汇总,这是一块很大的工作量。这部分工作可以交给BI自动化完成,从数据规整、建模到下载。 另外一种是使用其可视化功能进行分析,BI的优点在于它提供比Excel更丰富的可视化功能,操作简单上手,而且美观,如果大家每天作图需要两小时,BI会缩短一半时间。 BI作为企业级应用,可以通过它连接公司数据库,实现企业级报表的制作。这块涉及数据架构,就不深入讲了。 Power BI是微软家的。如果大家熟悉Excel,应该会知道微软推出的Power Query、Power Pivot、Power View和Power Map,是Excel上非常强大的四个插件。Power BI则是微软将它们作为集合推出。 Power Query是用于数据提取、整合、搜索的插件。它偏向数据模型的建立,而不是单元格的使用。 Power Pivot是数据透视表的高级应用,使用DAX能进行大量的科学计算。性能方面,比Excel函数要快两个量级,百万级的处理不成问题。 Power View是图表的高级应用,实现了过滤、联动、拖拽等功能。 Power Map是可视化地图。 如果大家熟练掌握以上四个插件,那么在Excel上也能实现部分BI。毕竟Excel是企业中人手一款的工具,和BI相比有轻量级的好处,虽然数据分析师需要掌握的工具更多。 BI的步骤 市面上有很多丰富的BI工具,Tableau,QlikView,BDP等,各有侧重,也各有价格。但是操作过程都是相似的,大体分为五个步骤:数据源读取、数据清洗、数据关联、图表制作、Dashboard整合。熟悉了其中一个,再学会另外的就不难。 因为我工作用的BI是私有化部署到服务器,直接连接生产环境的,演示不方便。所以才用Power BI演示,实际我也说不上熟练。 数据源读取 我们打开Power BI,它会让我们登录,不用管它。 界面和Office软件比较接近。上面是操作工具项,左侧栏是导航栏。 Power BI 的左侧导航栏对应三个模块:仪表板、报表和数据集。仪表板或报表需要数据才能操作,我们先读取数据集。 点击工具栏的取得资料(奇怪的翻译)。 Power BI支持各类丰富数据源(市面上绝大部分BI都支持,只是读取方式略有差异),除了Excel和CSV 文件,它还支持Acess、SQL数据库、Hadoop/HDFS、Spark、第三方API等。 这是新手教程,连接CSV即可,选择载入练习数据DataAnalyst。 这里可以针对数据编辑,先略过,选择载入。 自动跳转到数据报表页,数据报表(Report)是数据规整和清洗过程。 (责任编辑:本港台直播) |