基于决策树的招聘信息挖掘与分析.doc

资料分类:计算机信息 上传会员:小七想说话 更新时间:2022-10-23
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:21924
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:在互联网技术不断进步的时代大背景,数据的价值也日益得到彰显,从大量数据中获取有效信息变得尤为重要。数据挖掘技术便随之得到了发展,越来越多的人通过数据挖掘对数据间隐藏的有效信息进行挖掘。功能强大的python程序语言,已经在数据挖掘领域得到广泛的应用。python中包含的多种数据处理扩展包,这些扩展包数据挖掘工作提供便利的同时,其强大的科学计算能力也能使得数据挖掘过程更加高效。

本设计通过使用scrapy框架爬虫来对智联招聘网中的的信息进行采集,分析采集到的智联招聘信息数据,最终用决策树算法建立能够预测薪资待遇的分类模型。本文设计的开发平台为windows10,使用Pycharm作为开发工具,开发语言采用Python,使用mongodb来储存采集到的数据。通过Echarts实现数据可视化。通过使用决策树算法建立分类模型完成本次研究。

本文的决策树模型,可以使求职者在寻求工作时能够预测工资待遇,辅助求职者对招聘信息做出高效评估,查看用人单位提供的工资待遇是否符合预期,求职者可以在众多招聘信息中高效的找到适合自己的工作。此模型还可以用于优化用人单位的招聘信息,该模型能对招聘信息中的薪酬进行分类,获取现下各种职位的薪酬分布情况,供用人单位参考。从而对招聘信息做进一步调整,不仅提高了招聘的效率,而且提高了用人单位在行业中的竞争力。

 

关键词:数据挖掘;python;决策树算法;scrapy 框架爬虫

 

目录

摘要

Abstract

第1章 绪论- 1 -

1.1研究背景与意义- 1 -

1.1.1研究背景- 1 -

1.1.2研究意义- 1 -

1.2国内外研究现状- 1 -

1.2.1国外研究现状- 1 -

1.2.2国内研究现状- 2 -

1.3研究的内容- 3 -

1.4研究的思路与方法- 3 -

1.4.1研究思路- 3 -

1.4.2研究方法- 3 -

1.5全文组织结构- 4 -

第2章 Web数据挖掘- 4 -

2.1 Web数据挖掘的定义- 4 -

2.2 Web数据挖掘的分类- 5 -

2.3 Web数据挖掘的步骤- 5 -

2.4 Web数据挖掘的方法- 6 -

第3章 Python网络爬虫技术- 7 -

3.1 Python数据挖掘技术简介- 7 -

3.2 scrapy 爬虫框架- 7 -

3.2.1  网络爬虫- 7 -

3.2.2 scrapy 框架- 7 -

3.3常用的Python库- 8 -

3.3.1 pymongo 库- 8 -

3.3.2 NumPy和pandas库介绍- 9 -

3.4网站反爬虫及应对措施- 9 -

3.5数据预处理方法- 12 -

第4章 决策树算法- 14 -

4.1决策树的定义- 14 -

4.2 决策树的生成- 14 -

4.3 主要决策树算法- 15 -

第5章 数据可视化简介- 17 -

5.1 数据可视化概述- 17 -

5.2 ECharts简介- 17 -

第6章 基于决策树的招聘信息挖掘设计与实现- 18 -

6.1招聘信息数据挖掘目标确定- 18 -

6.2 招聘信息数据采集- 18 -

6.2.1数据采集原则及筛选条件- 18 -

6.2.2 Scrapy框架构建- 18 -

6.2.3采集招聘信息- 19 -

6.3招聘信息数据预处理- 24 -

6.4招聘信息数据建模- 28 -

6.5招聘信息数据可视化- 29 -

第7章 总结与展望- 33 -

7.1总结- 33 -

7.2 展望- 33 -

参 考 文 献- 34 -

致  谢- 36 -

相关论文资料:
最新评论
上传会员 小七想说话 对本文的描述:本研究在对网上招聘信息数据挖掘分析的基础上,通过建立薪资水平分类预测模型,一方面为数据挖掘分类算法在应用方面提供可借鉴的实践价值,另一方面为招聘薪资信息方面的筛选......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: