Web小说爬虫及推荐系统设计与实现.doc

资料分类:计算机信息 上传会员:暖暖大将军 更新时间:2024-08-18
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:12594
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:在互联网快速发展的当今时代,越来越多的人放弃了购买纸质小说书籍的念头,因为在小说网站可以以低价甚至是免费的方式阅读小说。但是小说网站中书籍的种类数量繁多,还会有广告或者无用信息干扰阅读。本文讲述了开发实现Web小说爬虫及推荐系统的过程,读者用户通过权限认证进入小说系统,系统以简介准确的形式展示小说,还提供了小说推荐的功能提高用户阅读的效率。

本文将分为小说爬取模块、用户模块和管理员模块。在技术方面,使用jsoup爬虫技术爬取小说网站中的小说,筛选重要数据并过滤不必要的网站信息。使用基于物品相似度的协同过滤算法为用户推荐小说,物品间的相似度使用余弦相似度计算方法,使用词袋模型将文本转化为词向量来计算文本相似度,还使用了Hanlp中文自然语言处理中的标准分词进行分词。在交互方面,选择 Spring Boot自带的tomcat服务器进行客户端与服务端之间的数据交互。在数据管理方面,采用MySQL数据库进行关系型数据库管理。还使用了lombok插件通过注释的方法简化实体类的代码,在数据访问层使用JDBC template与数据库交互。

 

关键词:小说;推荐;jsoup;Spring Boot

 

目   录

摘   要

ABSTRACT

第一章  绪论-1

1.1 项目开发背景-1

1.2 项目意义与价值-1

1.3 项目研究内容-1

1.4 论文结构的安排-2

第二章  开发技术-3

2.1 springboot框架-3

2.2 jsoup-4

2.3 协同过滤算法-4

第三章  系统分析-7

3.1 可行性分析-7

3.2 需求分析-7

第四章  系统设计-9

4.1 总体结构设计-9

4.2 逻辑结构设计-9

4.3 功能模块设计-10

4.3.1 用户功能模块-10

4.3.2 管理员功能模块-11

4.3.3 小说爬取模块-14

4.4 数据库设计-14

4.4.1 概念设计-14

4.4.2 数据库表设计-16

4.5 算法设计-18

第五章  系统实现-21

5.1 lombok和小说爬取-21

5.1.1 lombok和实体类-21

5.1.2 小说爬取-21

5.2 推荐功能实现-22

5.2.1 类似推荐-22

5.2.2 同作者和同类型推荐-26

5.3 登录功能实现-28

5.3.1 用户登录界面展示-28

5.3.2用户登陆代码实现-29

5.4 用户功能实现-29

5.4.1 搜索小说-29

5.4.2 阅读、评分和评论-31

5.5 管理员功能实现-32

5.5.1 用户管理-32

5.5.2 小说管理-34

5.5.3 评论管理-37

5.5.4 类型管理-38

第六章  总结与展望-39

参考文献-40

致  谢-42

相关论文资料:
最新评论
上传会员 暖暖大将军 对本文的描述:为了解决纸质小说书籍和小说网站中存在的缺陷和问题,开发实现一个可以真正满足读者需求的系统是非常有必要的。本系统打破了纸质书籍的方式,实现了可重复免费地获取电子小说......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: