| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:11799 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:随着互联网技术的快速发展和大数据时代的到来,数据的重要性日益凸显,越发受到重视,如何在海量数据中获取自己所需的有用数据已经成为部分用户的需求。在大型招聘网站中,求职者如何在海量的招聘信息中使用有效的方法获取求职者所需信息成为一大难点,个性化推荐成为解决这一问题的有效方式。 基于向量相似度的求职推荐研究与应用主要功能可以完成用户简历与招聘信息间的相似度之间的计算,通过计算结果进行职位推荐。基本的流程通过Scrapy框架爬取数据,利用数据挖掘技术对爬取招聘信息数据进行处理,通过余弦相似度算法对处理好的数据进行相似度计算并推荐结果,将数据结果用Echarts可视化工具进行展示。实现本设计功能在windows10的系统环境下,采用的开发工具为Pycharm,采用的编程语言为Python,可视化展示通过Echarts工具可视化。 本设计可以实现对求职者的个性化职位推荐,从海量的求职数据中根据用户简历内容给求职者推荐适合求职者的职位,节约用户时间,对用户决策具有积极地意义。 关键词:爬虫框架 scrapy;数据挖掘;余弦相似度算法;Echarts
目录 摘要 ABSTRACT 第一章 绪论- 1 - 1.1 课题背景- 1 - 1.2国内外研究现状- 1 - 1.2.1 国内研究现状- 1 - 1.2.2 国外研究现状- 2 - 1.3 研究目的和意义- 2 - 1.3.1研究目的- 2 - 1.3.2研究意义- 2 - 1.4 全文组织结构- 2 - 第二章 python数据挖掘技术概述- 4 - 2.1 python数据挖掘简介- 4 - 2.2 数据预处理基本介绍- 4 - 2.3 数据预处理内容及方法- 5 - 第三章 网络爬虫介绍- 6 - 3.1网络爬虫- 6 - 3.2网络爬虫分类- 6 - 3.3反爬虫概述- 6 - 3.3.1反爬虫策略- 7 - 3.4 scrapy爬虫框架- 7 - 3.4.1 scrapy框架概述- 7 - 3.4.2 scrapy框架原理- 8 - 3.5 scrapy框架的使用步骤- 8 - 3.5.1 scrapy框架的安装- 8 - 3.5.2 scrapy项目创建- 9 - 3.5.3 创建爬虫及爬虫运行- 9 - 第四章 相似度分析及其基本算法- 11 - 4.1 基于向量相似度算法概述- 11 - 4.2 基于向量相似度的数据挖掘算法- 11 - 第五章 数据可视化- 14 - 5.1可视化概述- 14 - 5.2 可视化工具简介- 14 - 第六章 基于向量相似度的求职推荐实现- 16 - 6.1 源数据的获取- 16 - 6.2 获取数据的预处理- 18 - 6.3 招聘信息数据分析- 22 - 6.4 推荐结果- 23 - 6.5 实现求职推荐结果的可视化- 26 - 第七章 总结与展望- 27 - 7.1总结- 27 - 7.2 展望- 27 - 参考文献- 28 - 致谢- 29 - |

