哔哩哔哩热门视频的数据分析与可视化.docx[原创毕业论文]

下一篇：没有了

摘要：哔哩哔哩又称 B 站，经历了十余年的变化与发展，如今作为上市的在线视频网站，越来越受到各年龄层用户的喜爱，成为了中国年轻世代高度聚集的文化社区和视频平台，也吸引了越来越多的视频创作者加入其中。

本项目采用Scrapy框架，对哔哩哔哩13个主要分区的热门视频进行数据爬取。采用Jieba分词工具、Pandas数据分析工具对其进行数据分析。使用Wordcloud词云工具、Matplotlib工具实现可视化，并针对可视化的数据进行进一步解析与评价。

本文旨在通过一系列技术手段实现对哔哩哔哩热门视频数据的获取与分析，以客观数据为基础，帮助创作者们进行视频题材的选定，从而以更贴近市场需求的方向进行视频创作，增大作品脱颖而出的几率。

关键词：网络爬虫；哔哩哔哩；视频博主；数据分析

摘要

Abstract

第一章绪论 1

1.1选题背景 1

1.2项目的价值及意义 3

第二章预备知识及原理说明 4

2.1 Scrapy爬虫框架 4

2.2 Selenium 自动测试工具 5

2.3 WordCloud 词云工具与Jieba分词工具 6

2.4 Pandas 数据分析工具与Matplotlib绘图工具 6

2.5 君子协议 7

第三章需求分析 8

3.1 综合分析 8

3.2模块分析与设计 9

3.2.1 爬虫 10

3.2.2 数据库 12

3.2.3 数据分析及可视化 14

第四章项目实现 15

4.1 爬虫实现 15

4.2 可视化实现 20

4.3 信息的分析及评价 25

4.4 项目测试 34

4.4.1 单元测试 35

4.4.2 集成测试 36

第五章总结与展望 38

致谢 39

参考文献 40