环球网校是美国纳斯达克上市企业欢聚时代(NASDAQ:YY)旗下品牌 | 住房和城乡建设部 建筑人才培训合作单位
您现在的位置在: > 时事新闻 > 社会 >

几年大数据热席卷了整个世界,究竟如何还得具体分析?

2022-12-21 来源:网络 作者:佚名

数据分析师就业前景如何?

#

几年大数据热席卷了整个世界,市场上与大数据相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。 #

一、提出问题 #

相比于大数据算法工程师入门门槛相对更大,数据分析相关岗位可以说是入门相对更低。况且,学好数据分析也会对我们日常生活决策起到帮助作用。我们都知道数据分析师这类岗位就业前景好。但这只是个笼统概念,究竟如何还得具体分析。因此,我们先提出以下几个问题,带着问题去找答案。

#

1、 数据分析师在哪些城市招聘更热门? #

2、 数据分析师的薪资待遇如何? #

3、 各领域的数据分析岗位比较?

#

二、理解数据

#

所谓“巧妇难为无米之炊”,提出了问题却没有数据,该怎么分析呢?此时,我们可以借助工具爬取数据。在拉勾网爬取数据分析师招聘数据,由于拉勾网设置招聘页面最多显示30页额的规定,爬取1次的数据量远远不够,因此我根据数据分析师的不同关键词爬取了6次数据,共有3581条数据,得到如下的的数据excel表并理解每列数据含义。

#

三、数据清洗 #

具体操作步骤: #

1、隐藏掉一些不需要的列,重新给各列命名,将6张表格合并为1张excel表格。

#

2、以所有列名结合在一起为条件,删除1281条重复项,保留2299条数据。检查每一列并删除空白值,最后剩下2297条数据。

#

3、将“城市”列分列,只保留城市名称; #

4、将“月薪工作时限学历”列分成3列,分别为“月薪”、“经验要求”、“学历要求”。由于爬取数据时,网页限制,导致“月薪工作时限学历”列中月薪与经验年限之间存在25个空格,并且存在换行现象。使用函数2次,消除单元格内的空格并消除换行带来的影响。

#

5、将“公司情况”列分成4列,分别为“公司所在领域”、“公司所在领域”、“公司融资情况”、“公司规模”。最后结果如下图所示。

#

6、处理“月薪”列,将该列扩展出“最低薪资”、“最高薪资”、“平均薪资”列。其中使用的函数有FIND()、Left()、Mid()、Len()、()函数。并且使用帅选功能筛选出“#VALUE!”错误值并处理。 #

7、将“平均薪资”列进行降序排列并扩展至其他列。

#

8、借助数据透视表进行异常值处理。 #

我们发现透视表行标签里存在“大数据工程师”等这类不属于数据分析师的职位,这就属于异常值统计分析师,我们需要想办法将其去掉。“职位名称”列中存在“数据分析”、“数据运营”、“分析师”、“数据专员”关键词的就属于数据分析岗位。使用FIND()、COUNT()、IF()函数筛选并标记出来。

#

至此,数据清洗工作就算结束了。然后开始使用数据透视表进行分组分析。 #

四、数据分析 #

将数据清洗完的数据重新复制粘贴到新的工作表统计分析师,然后使用数据透视表进行分析。

#

通过上面两张图可知,北京、上海、杭州、深圳、广州招聘数据分析相关岗位较多,其次武汉、南京、长沙、成都、苏州、西安、郑州位于第二梯队。大家找工作可以把目光瞄准这些城市。另外,对于工作经验,基本上城市都会倾向对工作经验为1-3年和3-5年的需求量更大。 #

从上图得知,各城市平均薪资,一线城市是最高的。其次,杭州、无锡、珠海、宁波、苏州这些二三线沿海一带的城市平均薪资水平也较高。 #

从上图看出,互联网金融、O2O、数据服务、教育、电子商务、文化娱乐领域对数据分析师需求量相比其他行业更大。想要转行的朋友人可以多了解下这些行业,转行成功的几率更大。 #

责编:admin 返回顶部  打印

关于我们联系我们友情链接网站声明网站地图广告服务帮助中心