基于招聘网站的大数据专业相关招聘信息建模与可视化分析

这篇具有很好参考价值的文章主要介绍了基于招聘网站的大数据专业相关招聘信息建模与可视化分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

需要本项目的可以私信博主!!!

在大数据时代背景下,数据积累导致大数据行业的人才需求快速上升,大量的招聘信息被发布在招聘平台上。深入研究这些信息能帮助相关人士更好地理解行业动态,并对其未来发展进行预测。本文主要通过分析51job网站上的大数据职位招聘信息,进行一次可视化的呈现。

本研究首先使用Python爬虫技术,抓取51job网站的所有大数据相关职位信息。接着利用Python的数据清理技术,处理数据的重复项和异常项。然后,我们使用Python的统计排序技术对数据进行分析,并通过Python数据可视化技术将分析结果呈现出来。最后,我们使用机器学习技术预测大数据相关职位的平均薪资。

根据51job的大数据职位招聘信息可视化结果,我们可以看到大数据招聘岗位正在持续增长,这意味着社会对大数据专业人才的需求也在持续增长。大数据职位主要集中在一线城市,大多数职位来自私企和上市公司,主要集中在计算机软件、房地产和互联网行业。同时,大数据职位的薪资和福利待遇一般都很优厚。这些信息为求职者提供了选择大数据职位的参考。

通过预测模型,求职者可以提前了解即将应聘的大数据职位的预期薪资,预测模型的准确率可高达99%。

基于网络爬虫技术实现51job网站上大数据专业相关招聘信息的爬取,主要利用的是网络爬虫技术中的xpath方法和谷歌浏览器的开发者工具实现。

首先利用谷歌浏览器登录51job网站,利用谷歌浏览器的开发者工具查看网页中的cookie、useragent等标识,并且通过网站的搜索功能和翻页功能查看url的变化。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-1  谷歌浏览器的开发者工具页面

 

在以上的一系列爬取操作之后,共爬取到54950条数据,主要获取了十二个字段的大数据专业相关岗位信息,具体的字段以及含义如下表。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-2  爬取数据运行结果

表3-1  字段的含义解释

字段

含义

job_name

职位名称

company_name

公司名称

low_salary

最低薪资(万/月)

High_salary

最高薪资(万/月)

yaoqiu

要求

job_place

工作地点

company_nature

公司性质

job_content

工作内容

company_content

公司详情

release

发布时间

job_class

职位类别

fuli

公司福利

    首先是利用collections库的Counter函数对数据的重复值进行查看,这边主要是对岗位的url进行了统计查看,可以通过结果看出,每个url都只出现了一次,也就是说,每条数据都只出现了一次,并未出现重复值,因此,不用对数据进行去重操作。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-3  重复值统计结果

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-4  最高薪资异常值处理前后对比图

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划图3-5  最低资异常值处理前后对比图

图3-6  最基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划高薪资和最低薪资盒图

 

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-7  占比率前十类别运行结果

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-8  平均最高薪资前十类别运行结果

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-9  平均最低薪资前十类别运行结果

从岗位信息来看,每个岗位所在的城市不同,而每个城市的发展水平有差异,

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-10  大数据相关职位主要分布的前十城市运行结果

通过岗位信息对各个公司的大数据专业相关岗位数量进行统计分析。首先,通过列表将各个公司性质的大数据专业相关岗位进行统计,然后通过排序得出职位数量最多的前十个公司性质。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-11  公司性质前十运行结果

大数据专业相关岗位也分为很多种不同的岗位,

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-12  数量前十的岗位运行结果

目前需求量最大的十个岗位,令求职者关注的应该是这些岗位的薪资,因此,对这十个岗位进行了平均最高薪资和平均最低薪资的分析。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划图3-13  前十岗位对应的最高和最低薪资运行结果

为了验证大数据专业相关岗位在当前社会的真实发展趋势,以及社会对该岗位的需求增长趋势,对每日发布岗位的数量进行分析。根据日期对发布的岗位数量进行统计。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-14  每日发布数量运行结果

 

根据职位类别的数量统计,对所有职位类别进行词云图呈现,从词云图可以看出计算机软件、互联网、电子商务、计算机服务等职位类别对大数据专业相关岗位的需求比较大,求职者在求职的时候可以先考虑这些岗位类别的招聘。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-15  职位类别的词云图展示

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-16  职位类别的最高薪资和最低薪资的散点热力图展示

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-17  各类别平均薪资的分箱图展示

根据占比率前十的职位类别统计,对职位类别进行环状扇形图的呈现。根据环状扇形形图可以看出,计算机软件、房地产、互联网/电子商务的职位占比是比较大的,如果求职者想要取得更多的就业机会,可以优先选择这三个职位类别。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-18  占比率前十的职位类别环状扇形图展示

根据平均最低薪资前十和平均最高薪资的职位类别统计,对职位类别进行柱状图的呈现。根据柱状图,可以看到前十职位类别的平均最低薪资都在1.4万/月以上,前十职位类别的平均最高薪资都在2.2万/月以上。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-19  最低薪资前十职位类别的柱状图展示

图3-20  最高薪资前十职位类别的柱状图展示基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

根据各城市的大数据专业相关岗位数量统计,对城市职位分布进行中国地图热力图呈现。从图中可以看出,上海是大数据专业相关岗位需求量最大的城市,其次是广东,第三梯队是北京、江苏,浙江、四川和湖北排在第四梯队。可以看出,北上广作为一线城市,对大数据专业相关岗位的需求是更为迫切的。

图3-21  各城市大数据岗位数量的中国地图热力图展示

根据前十公司性质的大数据专业相关岗位数量统计,对公司性质进行条形图呈现。从条形图可以看出,民营公司占比最大,占66.15%,其次是上市公司和国企。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-22  岗位数量前十公司性质的条形图展示

根据各职位名称的数量统计,对职位数量进行条形图呈现和环状扇形图呈现。从条形图和环状扇形图可以看出,大数据开发工程师需求最旺盛,占比48%。其次是大数据分析工程师,占比15%。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-23  发布数量前十岗位的条形图展示

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-24  发布数量前十岗位占比的环状扇形图展示

根据前十职位的平均最高薪资和最低薪资统计,对薪资进行双折线图进行呈现。从图中可以看出,这些薪资岗位的薪资都相对平均,十分稳定。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

3-25  前十岗位的最高和最低薪资的双折线图展示

根据每日发布的职位数量统计

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

3-26  每日发布岗位数量的折线图展示

将数据中的福利字段(fuli)进行词云图呈现

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

3-27  岗位福利的词云图展示

 

图3-28  特征的相关性热力图展示

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-29  随机森林模型预测准确率运行结果

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-30  xgboost预测准确率运行结果

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-31  随机森林的平均薪资预测结果

利用数据对模型的训练过程,我利用plot_learning_curve()对模型的学习曲线进行了呈现,可以看出,模型在训练的过程中,准确率是在不断增加的。

基于招聘网站的大数据专业相关招聘信息建模与可视化分析,(持续更新)数据分析实战项目100例,Python爬虫实战系列,大数据,信息可视化,招聘信息可视化,51Job,原力计划

图3-32  模型学习曲线折线图展示


 

每文一语

纸上得来终觉浅,绝知此事要躬行文章来源地址https://www.toymoban.com/news/detail-706198.html

到了这里,关于基于招聘网站的大数据专业相关招聘信息建模与可视化分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 基于Python的51job(前程无忧)招聘网站数据采集,通过selenium绕过网站反爬,可以采集全国各地数十万条招聘信息

    使用Python编程语言和Selenium库来实现自动化的网页操作,从而实现登录、搜索和爬取职位信息的功能。 首先,导入了所需的库,包括time用于处理时间,selenium用于模拟浏览器操作,csv用于写入CSV文件,BeautifulSoup用于解析网页数据。然后,定义了一个名为login的函数,该函数接

    2024年01月19日
    浏览(25)
  • 基于Python的前程无忧、51job、智联招聘等招聘网站数据获取及数据分析可视化大全【代码+演示】

    基于Python的前程无忧、51job、智联招聘等招聘网站数据获取及数据分析可视化大全【代码+演示】

    职位标题 薪资 地区 工作年限要求 学历要求 发布时间 keyword pageNum jobRank 公司名称 公司类型 公司规模 行业 福利描述 HR标签 0 检具中级工程师(C) (MJ000656) 8千-1.2万·14薪 宣城 2年 大专 2023-12-08 04:00:38 c 1 0 上海保隆汽车科技股份有限公司 已上市 5000-10000人 汽车零配件 五险一

    2024年02月03日
    浏览(25)
  • 【大数据毕设】基于Hadoop的招聘网站可视化的设计与实现(一)

    【大数据毕设】基于Hadoop的招聘网站可视化的设计与实现(一)

    博主介绍 : ✌ 全网粉丝6W+,csdn特邀作者、博客专家、大数据领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于大数据技术领域和毕业项目实战 ✌ 🍅 文末获取项目联系 🍅 基于Hadoop的招聘网站可视化的设计与实现 摘要:现在,随着互联网网络的飞

    2024年02月10日
    浏览(15)
  • 基于Python flask 的某招聘网站爬虫,招聘岗位可视化系统

    基于Python flask 的某招聘网站爬虫,招聘岗位可视化系统

    一、介绍 原文地址 今天为大家带来的是Python基于Flask的招聘信息爬取,招聘岗位分析、招聘可视化系统。 此系统是一个实时分析招聘信息的系统,应用Python爬虫、Flask框架、Echarts、VUE等技术实现。 本项目利用 Python 从某招聘网站抓取海量招聘数据,进行数据清洗和格式化后

    2024年02月07日
    浏览(8)
  • python爬取招聘网站数据

    这段代码是使用Selenium自动化测试模块进行网页爬取的示例代码。它通过模拟人的行为在浏览器中操作网页来实现爬取。具体的流程如下: 导入所需的模块,包括Selenium、时间、随机、csv等模块。 打开浏览器,创建一个Chrome浏览器实例。 设置要爬取的页数范围。 循环遍历每

    2024年02月02日
    浏览(9)
  • SQL 招聘网站岗位数据分析

    SQL 招聘网站岗位数据分析

    1.删除包含空字段的行 2.按照企业和岗位进行去重保留最新一条 3.筛选招聘地区在北上广深 4.过滤周边岗位保留任职要求包含数据的岗位 需求1:按照城市分组统计招聘总量和招聘职位数   需求2:按照企业类型进行招聘量的统计及招聘占比计算 需求3:计算岗位薪资的单位,

    2024年02月05日
    浏览(13)
  • 基于Java+Servlet+Mysql的人才招聘网站的设计与实现(附源码 调试 文档)

    基于Java+Servlet+Mysql的人才招聘网站的设计与实现(附源码 调试 文档)

    摘要 本文介绍了一种基于Servlet人才招聘网站的设计与实现。该系统分为管理员、注册用户和企业用户三种角色,分别具有不同的功能。管理员主要负责用户管理、企业管理、新闻管理、职位管理和简历投递管理等;注册用户和企业在系统中的功能各不相同,注册用户可以查

    2024年02月05日
    浏览(12)
  • 大数据毕设分享 招聘网站爬取与大数据分析可视化 - python 分析 可视化 flask

    大数据毕设分享 招聘网站爬取与大数据分析可视化 - python 分析 可视化 flask

    🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天

    2024年02月19日
    浏览(12)
  • 面试 招聘网站

    智联招聘 http://www.zhaopin.com 前程无忧 http://www.51job.com 中华英才网 http://www.chinahr.com 猎聘 http://www.liepin.com BOSS直聘 http://www.zhipin.com 以上这几个网站的校招和社招模块都做的不错,建议大家认真完善这几大网站上的简历资料,有些企业没有自己的官方校招网站,会直接在这几个

    2024年02月08日
    浏览(11)
  • 大数据项目实战-招聘网站职位分析

    大数据项目实战-招聘网站职位分析

    目录          第一章:项目概述 1.1项目需求和目标 1.2预备知识 1.3项目架构设计及技术选取 1.4开发环境和开发工具 1.5项目开发流程 第二章:搭建大数据集群环境 2.1安装准备 2.2Hadoop集群搭建 2.3Hive安装 2.4Sqoop安装 第三章:数据采集 3.1知识概要 3.2分析与准备 3.3采集网页数

    2024年02月05日
    浏览(10)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包