| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:10538 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。而这种对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫,在爬取内容的基础上实现数据的可视化作为数据分析的直观表现。而作为拥有丰富的正则表达式函数以及很多访问Web页面的函数库的python语言自然而然成为了我们实现网络爬虫和数据分析的首选编程语言。 本文介绍的是通过对网易云音乐进行爬取得到目标歌曲的评论并采取词频统计和情感分析对爬取的评论进行数据分析,最终以可视化的方式呈现出来以此完成课题目标。
关键词: 网络爬虫 Python 网易云 数据分析
目录 摘要 Abstract 1.引言-1 1.1 课题研究背景、状况及发展趋势-1 1.2 课题研究意义及其主要研究内容-2 2.开发环境与技术-3 2.1开发环境-3 2.2 关键技术简介-3 2.2.1 Python-3 2.2.2 Requests库-3 2.2.3 Tktinter库-3 2.2.4 结巴分词-4 2.2.5 词云WordCloud-4 3.项目需求与设计-6 3.1 交互界面设计-7 3.2 网络爬虫模块设计-8 3.2.1目标信息爬取-8 3.2.2 数据解析和存储-8 3.3 数据分析模块设计-8 3.3.1词频统计-8 3.3.2 情感分析-9 4. 项目实现-10 4.1 交互界面-10 4.1.1窗口实现-10 4.1.2 数据输入-11 4.1.3 系统入口-12 4.1.4 运行状况显示-12 4.2 网络爬虫-13 4.2.1 获取歌曲排行榜-13 4.2.2 数据解析-14 4.3 数据分析-15 4.3.1 文本情感分析-15 4.3.2 关键词词频统计-16 5.系统测试-18 5.1 测试用例说明-18 5.1.1 模块测试阶段-18 5.1.2 系统整体测试阶段-18 5.2 测试环境-18 5.3 模块测试-18 5.3.1 界面生成测试-18 5.3.2 url连接测试-19 5.3.3 数据解析与输出测试-20 5.4 整体测试-21 结语-30 参考文献-31 致谢-32 |

