本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

如何七周成为数据分析师06:数据可视化之手把手(2)

时间:2017-07-29 03:16来源:118论坛 作者:本港台直播 点击:
大家还记得实战篇中演示的数据清洗吗?之前我们体验了一遍Excel函数清洗的过程。这次需要用BI再进行一遍清洗。数据清洗是分析师最蛋疼且耗时持久的

大家还记得实战篇中演示的数据清洗吗?之前我们体验了一遍Excel函数清洗的过程。这次需要用BI再进行一遍清洗。数据清洗是分析师最蛋疼且耗时持久的工作,没有之一。

数据清洗

Power BI有一个高级功能叫DAX(Data Analysis Expressions),它是整个 Power BI 使用的公式语言。

DAX近似Excel函数(大多数第三方BI,函数均接近Excel),故它针对新手非常友好。如果大家已经熟悉Excel函数,上手速度会很快。基本上函数名字都一样,如果不熟悉,可以查阅官网提供的文档。

我们先清洗报表中的薪水salery,和实战篇过程一样,需要将其拆分成两个新列,并且计算平均值。

如何七周成为数据分析师06:数据可视化之手把手

点击模型项的新建资料行(这里的翻译应该不对,应是column列,后文我都用列表示),此时新增加的列没有任何内容。我们需要做的操作就是以salery生成两列。

如何七周成为数据分析师06:数据可视化之手把手

这里需要用到DAX。当成函数使用它就行,不过Excel是单元格级别的引用,而DAX中的任何引用、计算、汇总等,都是以列为单位的。

=’Table Name'[ColumnName]

这是最简单的引用,Table Name是我们这张报表的名字,我载入的csv叫DataAnalyst,那么报表就叫做DataAnalyst,ColumnName是我们需要引用的列,名字叫做salary。下图公式就是范例。

如何七周成为数据分析师06:数据可视化之手把手

如果表名中有空格,需要加引号,如果没有则不需要。如果是跨表引用,TableName是必须的,直播,否则只需要ColumnName。DAX支持自动填充,可以通过模糊输入+回车快速输入。

我说过它近似Excel,那么Excel加减乘除的习惯可以直接使用在上面。

=’Table Name'[ColumnName1]+’Table Name'[ColumnName2]*3

接下来继续清洗步骤,我们查找k所在的字符串位置。

=search(“k”, DataAnalyst[salary],1)

利用left函数截取工资下限。

=left(DataAnalyst[salary],search(“k”, DataAnalyst[salary],1)-1)

如何七周成为数据分析师06:数据可视化之手把手

搞定。资料行重命名为bottomSalery。接下来是工资上限topSalery,使用”-“截取的时候报错了。

=search(“-“, DataAnalyst[salary],1)

检查一下发现原来是有“10K以上”这类字符串。DAX查找不到“-”,这时需要返回一个出错时表达的值。因为10k以上的描述无法确定工资上限,那么我们就把返回的值限定为bottomSalery。

在这里请记住,DAX的容错性比Excel低,只要DAX中有一行返回Error,那么整列都是Error。我们需要用Iferror函数保证容错性。

这里给出topSalary的计算,比较繁琐。

topSalery = IFERROR(mid(DataAnalyst[salary],SEARCH("-",DataAnalyst[salary],1)+1,LEN(DataAnalyst[salary])-SEARCH("-",DataAnalyst[salary],1)-1),DataAnalyst[bottomSalery])

如何七周成为数据分析师06:数据可视化之手把手

之后新建一列使用(DataAnalyst[bottomSalery]+DataAnalyst[topSalery])/2 计算该岗位的平均工资。

大家看到这里,是不是觉得DAX公式非常长?新手可以多增加辅助列来进行计算。

Excel中有比较方便的分列功能,那么Power BI中是否拥有呢?答案是肯定的,右键点击列,选择编辑查询选项。

如何七周成为数据分析师06:数据可视化之手把手

这里依旧吐槽翻译。分割资料行就是我们熟悉的分列功能。选择自定义,用“-”即可完成分列(原始数据会被拆分,所以建议先复制一列)。

如何七周成为数据分析师06:数据可视化之手把手

实战篇提到过,我们的北京数据是有重复值的,那么我们通过positionId这职位的唯一标示,来删除重复项。右键点击移除重复项目即可。

我们再看一下查询编辑的其他功能。

分组依据可以认为是数据透视表。可以选择多个字段进行分组。对结果进行求和、计数等操作。

如何七周成为数据分析师06:数据可视化之手把手

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容