目录

 

绪论

正文

编写爬虫,已经获得了结构化的数据如图所示

利用pandas读入数据,进行数据处理,分析出4个城市共8个数据源的工资信息,并利用pyecharts生成柱形图。

用python的第三方包wordcloud生成词云

基于matplotlib的工资分布直方图

总结


绪论

随着我国经济与社会的快速发展.,科技的进步以及计算机的普及。程序员成为一个备受人们关注的群体,随着近年全国互联网创业热潮的兴起,"互联网+"、"云计算""人工智能"以及"区块链"等领域发展迅速,市场对程序员的需求更为旺盛。作为即将走下社会,步入工作岗位的我们,了解目前程序员的薪资现状,岗位职责就显得尤为重要,本文即将通过分析51job网站的程序员招聘信息,得出相关结论

正文

编写爬虫,已经获得了结构化的数据如图所示

利用pandas读入数据,进行数据处理,分析出4个城市共8个数据源的工资信息,并利用pyecharts生成柱形图。

根据数据源大小就可得知,java程序员的招聘需求要远远高于python程序员,几乎高出10倍以上。工资的最大值java四个城市均高于python,同时平均值除北京外,也是Java程序员最高,由此可见,Java程序员的就业前景相当广阔,基本不愁找不到工作,在同一个城市,招聘需求就达到了千次。而python作为一门后起之秀的脚本语言,虽然照Java有一定的差距,但是python的优点在于入门快,没有编程基础的人也能够轻松掌握,随着python的进步,现在已经有了机器学习,人工智能,大数据分析等多种就业方向,相信学python一定不会太差

用python的第三方包wordcloud生成词云

根据数据源可知,已经爬取了相关岗位职责信息,现在要根据这些信息,生成词云,从而更准确的分析去程序员岗位职责的要求的权重。

分析词云由于第一次没有做数据预处理,导致分析结果如图所示

信息均为一些无效信息,无法反映出招聘现状,通过用python自带的字符串处理函数,将诸如“开发经验”“熟练使用”“以上”词语去除后,再次进行词频分析如图所示(图为上海java数据源生成的词云)

从图中不难看出,本科学历已经变成了JAVA程序员的最基础的敲门砖,想要得到月入上万的收入,掌握基本的开源框架,拥有良好的团队合作能力,精通一门语言,分析用户需求,掌握oracle mysql等数据库就已经成立必须的技能

本图为上海python程序员岗位信息词云图。反映出了程序员的重要技能,首先,虽然大家说不要靠学历找工作,但是现在学历还是第一位。机器学习、django框架哦在python中十分重要,这些都是对程序员知识储备的要求,同时程序员处理工作的软实力也很重要,比如团队合作能力和良好的沟通能力,以及合作精神。这些都是一个团队良好运作的基本要求。还要求程序员有良好的学习能力,社会在不断进步。工作挑战不断出新,这就要求程序员不断学习深造,得到更好的工作机会。

基于matplotlib的工资分布直方图

绘制工资分布直方图,matplotlib优于pyecharts的地方在不需要进行词频统计,只要传入工资列表,设置组距即可,最后生成如图

根据各市工资分布区间来看,程序员工资分布基本都在10000-15000之间,尤其广州程序员工资明显高于其他市区,我们再来看工资的整体分布饼图。也说明了这一点

总结

根据以上可以看出,程序员的薪资水平还是很高的,各位码农们,加油干吧 ,如果想要python源码欢迎在下面评论或者私信我。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐