| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:14199 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:爬虫可以实现在有限时间内对数以万计的数据文件进行汇总分类,并进行进一步的分析。文字、图片、音频都是如此。对于音乐网站进行数据爬取,将获得的数据分析归类,研究当下流行趋势和大众音乐口味变化等。 使用Python代码编写爬虫程序,搭配Django语言和Mysql数据库实现爬取数据的保存管理和可视化。最后分析爬取的音频数据和评论数据,得到当前音乐流行趋势和大众心理状态变化过程。 以网易云音乐为目标,爬取网易云音乐的曲库数据,研究后得到以下结论: ①制定合理的爬虫策略能够有效的实现信息爬取的目标。 ②网站上音乐、图片、文件实际上有着各自独特的id码,按id码排列存储在服务器上的数据库中。 ③大众听歌口味和当下时代流行趋势仍以柔缓抒情为主,并且大都表现出积极向上的风格。 ④不同音乐平台用户侧重不同,听歌口味也各不相同。
关键词:网络爬虫;Python;Mysql;音乐社交
目 录 摘 要 ABSTRACT 第一章 概述 1 1.1 研究背景 1 1.2 Python爬虫 2 1.3 研究内容2 1.4 论文结构 3 第二章 Python简介4 第三章 程序设计5 3.1 系统配置5 3.2 XML信息寻找——Xpath语法5 3.3思路流程6 3.4 实现方案7 3.5 本章小结8 第四章 数据存储 9 4.1 Django网络框架 9 4.2 Mysql数据库10 4.3 操作步骤10 4.4 本章小结18 第五章 程序优化19 第六章 结果分析20 6.1 词频分析20 6.2 评论分析21 第七章 结语 23 参考文献 24 致谢 25 附录 26 |

