基于聚类算法实现老年人娱乐方式分析与预测.doc

资料分类:计算机信息 上传会员:小七想说话 更新时间:2022-10-23
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:9267
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:人口老龄化的逐年加重,老年人的养老问题成为社会关注的热点话题。当今社会,已经不是那种仅仅满足衣食住行生活必需的时代,而是如何丰富业余生活,让生活过的更有趣味。目前为止我国对于老年人的行为分析相对较少,缺少这方面的研究成果,但是,在人口老龄化逐年加剧的今天,老年人的生活更应该引起我们的注意。本文就是针对老年人的娱乐方式进行分析,了解老年人的娱乐方式,通过分析获取在娱乐生活方面有什么需求,根据分析的结论为老年人在娱乐生活方面提供解决方案。

本次毕业设计爬取了关于老年人的贴吧和养生之道网的内容。通过jieba分词实现文本分词、停用词过滤、语料库建立。建立了K-means聚类算法分析模型和Apriori关联规则分析模型,对老年人的娱乐方式进行分析,并分析出具有强关联规则的集合。通过matplotlib绘图库和wordcloud库实现数据的可视化,更加鲜明的看出当下老年人最喜欢的娱乐方式有书法、绘画、太极拳等。

本次毕业设计可以很好的说明老年人的娱乐方式存在一定的关联性和一定的聚类特征。通过本次分析可以得出老年人娱乐方式的关联性,为老年人推荐适合的娱乐方式,并试图建立老年人兴趣部落,让更多的老年人在一起互相交流,让晚年生活更加精彩。

 

关键词:老年娱乐;词云;文本聚类;关联分析

 

目录

摘要

Abstract

第1章 前言1

1.1 研究背景1

1.2 国内外研究现状1

1.2.1国外研究现状1

1.2.2国内研究现状1

1.3 研究的目的及意义2

1.3.1研究目的2

1.3.2研究意义2

1.4 全文组织结构2

第2章 基于python爬虫的数据收集4

2.1 简要介绍python爬虫4

2.2 利用python爬虫实现数据收集4

第3章 数据预处理5

3.1 文本分词5

3.2停用词过滤5

3.3 词频统计6

3.4TF-IDF值6

3.4.1TF-IDF值计算原理6

3.4.2计算TF-IDF值6

第4章 数据挖掘与可视化7

4.1 简要分析我国老龄人口与老龄人口抚养比7

4.2 K-means 算法实现文本聚类8

4.2.1聚类算法8

4.2.2 K-means 算法8

4.2.3 利用PCA进行降维9

4.2.4 利用K-means 算法实现数据聚类10

4.3 Apriori算法实现关联分析11

4.3.1 关联分析11

4.3.2 Apriori算法11

4.3.3 利用Apriori算法实现关联规则分析12

4.4 Matplotlib可视化库实现数据可视化12

4.4.1Matplotlib可视化库12

4.4.2 利用Matplotlib可视化库实现数据可视化12

第5章 总结与展望14

5.1总结14

5.2展望14

附录15

参考文献17

致谢19

相关论文资料:
最新评论
上传会员 小七想说话 对本文的描述:老龄化逐渐加剧的今天,老年人的日常生活受到越来越多的人关注,互联网的介入又丰富了老年人的晚年生活。通过对老年人智能手机应用使用行为数据的分析,分析出当下老年人在日......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: