| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:13780 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:当今社会,互联网是一个不可或缺的信息交流媒介,每天都有成千上万条信息在互联网上传播、交换。随着互联网的飞速发展,网络秩序的维护也逐渐成为了刻不容缓的任务,所以也诞生了网络舆情监控系统的概念。 本文对网络舆情监控进行详细的设计与分析,首先分析其相关背景,提出网络舆情监控系统的主要目的和意义,该监控系统在获取信息方面采用的主要技术是爬虫技术,在此基础上实现一个功能较为完善全面的网络舆情监控系统。该系统会将获取的信息进行分词,分词主要运用了jieba分词器,然后系统会对这些分完词的数据进行分类,本文的分类是基于聚类分析的思想,在分类的过程中,引入了一个相似度向量模型,模型会把数据分为四类以便数据分析。为了更好的掌握舆情走势,该系统还设立了新闻跟踪板块,这个板块主要实现了对单类新闻各个月的新闻数量跟踪,该功能在后台有一个测试窗口,这个窗口主要是采用Python的Tkinter模块实现的。 在数据分析时,该系统有一个数据可视化的界面,该界面是以web的形式实现的,界面简洁、操作简单,界面用了一系列的表格、柱状图和折线图来展示本课题所研究的内容,最后也给出了本文的结论。 关键词:网络舆情监控 爬虫技术 聚类分析 新闻跟踪 数据可视化
目录 摘要 Abstract 1. 绪论-1 1.1 网络舆情的含义-1 1.2 网络舆情的特点-1 1.2.1 自由性-1 1.2.2 交互性-1 1.2.3 多元性-1 1.2.4 偏差性-2 1.2.5 突发性-2 1.3 网络舆情对社会、公众的影响-2 1.4 研究情况-2 1.4.1 国内研究情况-2 1.4.2 国外研究情况-3 1.5 论文结构-4 2. 文献综述和理论分析-5 2.1 文献综述-5 2.1.1 国内研究网络舆情的文献综述-5 2.1.2 国外研究网络舆情的文献综述-5 2.1.3 国内外文献综述-6 2.2 理论分析-6 2.2.1 网络舆情监控系统的概念-6 2.2.2 网络舆情监控系统的需求分析-6 2.2.3 网络舆情监控系统的理论分析-7 2.2.4 网络舆情监控系统的现实意义-7 3. 平台的分析与设计-8 3.1 爬虫技术-8 3.1.1 产生背景-8 3.1.2 分类-8 3.1.3 抓取目标分类-8 3.2 jieba分词器-9 3.2.1 jieba分词简介-9 3.2.2 分词原理-9 3.2.3 分词模式-9 3.3 聚类分析-10 3.3.1 分析对象-10 3.3.2 应用-10 3.3.3 方法和特征-10 3.4 Python GUI编程(Tkinter)-11 3.4.1 Tkinter简介-11 3.4.2 Tkinter优劣势-11 3.5 实现方法和装置-11 3.5.1 软件环境-11 3.5.2 硬件环境-11 3.5.3 开发工具-11 3.5.4 课题简介-12 3.5.5 爬虫的实现-12 3.5.6 数据存储-14 3.5.7 分词-14 3.5.8 相似度向量模型-15 3.5.9 Tkinter构建测试窗口-15 3.5.10 新闻跟踪-17 4. 数据可视化在web上的实现-18 4.1 主界面-18 4.2 各类新闻分布表-18 4.3 各类新闻分布图-19 4.4 政治类新闻跟踪-20 4.5 社会类新闻跟踪-20 5. 数据采集和分析-22 5.1 数据采集-22 5.1.1 四类新闻的分布情况-22 5.1.2 新闻跟踪的数据-22 5.2 数据制图-22 5.2.1 四类新闻分布制图-22 5.2.2 新闻跟踪制图-24 5.3 数据分析-24 5.3.1 四类新闻分布情况分析-24 5.3.2 新闻跟踪的分析-25 5.3.3 未来发展的趋势-25 6. 系统开发的影响-26 6.1 系统开发对社会人文的影响-26 6.2 系统开发对网络环境的影响-26 6.3 系统开发对法律的影响-26 7. 结束语-27 7.1 实验总结-27 7.2 未来的工作和展望-27 参考文献-28 致谢-29 |

