基于Splunk的网络日志大数据分析.doc[原创毕业论文]

需要金币：2000 个金币	资料包括：完整论文
转换比率：金额 X 10=金币数量，例100元=1000金币	论文字数：25276
折扣与优惠：团购最低可5折优惠 - 了解详情	论文格式：Word格式(*.doc)

上一篇：基于RLE的管道图像无损压缩.docx

下一篇：基于WiFi模块的智能工业吸尘器设计.docx

摘要：大数据是如今的顶级大趋势。在这种趋势下，数据数据就像在生长剂的作用下疯长的杂草一般从各种公共和私人渠道流出，且由于由于数量巨大，信息冗杂，人们往往很难从中获取有效信息。

如今，数据以每年成倍增长。2020年的数据产量将是2009年的几十倍倍。这一变化主要是由于全球人口增长，人均设备持有数增长，新技术的应用以及日常设备和机器中传感器的使用（互联网又一大趋势）产生的。在此大前提下，批量处理机器数据成为了企业的不能忽视的一个大问题。机器数据是指那些能够为企业业务发展提供动力的应用、服务器、存储、网络设备、安全设备以及其他相关设备制造出来的数据。机器数据可以反映客户、交易、应用、服务器、网络等的行为或活动。机器数据的范围远远超越了日志。

Splunk可以收集来自任何地方产生的数据，无论是物理环境、虚拟环境还是云环境。借助Splunk，用户可以在一个位置实时搜索、监控和分析来自不同位置的数据。过去需要花费数天解决的问题和安全事件借助Splunk可能只需几个小时或更短时间解决。

正因如此，在本课题中将对Splunk在大数据分析中的应用进行分析和研究，并将给出相关的实施案例和解决方法。

关键词：大数据、机器数据、splunk

摘要

Abstract

1. 绪论-1

1.1 课题研究背景-1

1.2 课题研究意义-1

1.3 课题研究内容和成果-2

1.4 论文结构-2

2. 相关工作-1

2.1 大数据分析-1

2.1.1大数据分析的基本概念-1

2.1.2大数据计算体系架构-1

2.2 Splunk单实例与分布式部署-2

2.2.1 Splunk部署的目的与因素-2

2.2.2 Splunk组件介绍-3

2.2.3 Splunk单实例部署-4

2.2.4 Splunk分布式部署-5

2.2.5 Splunk集群部署-7

2.3 Splunk add-on使用与相关的数据切割知识-8

2.4 Splunk 的SPL使用范例-10

2.4.1 SPL语言介绍-10

2.4.2通配符-10

2.4.3布尔表达式-11

2.4.4字段表达式-11

2.4.5 NOT和！=的区别-12

2.4.6搜索剖析-13

2.4.7字段-14

2.4.8引用和转义字符-14

2.4.9 SPL和正则表达式-15

2.4.10使用CASE（）和TERM（）来匹配短语-16

2.4.11关于子搜索-16

2.4.12事件抽样-18

2.4.13 SPL中部分函数使用-19

3. 系统设计与实现-21

3.1 系统方案设计-21

3.1.1 开发环境-21

3.1.2 系统框架结构-21

3.1.3 系统模块设计-22

3.1.4 系统工作流程-22

3.2 系统功能介绍-24

3.2.1 底层服务器-24

3.2.2 应用客户端-24

3.3 系统实现-25

3.3.1 解决安全问题实现原理-25

3.3.2 数据传输实现-25

3.3.3 底层服务器实现-25

3.3.4 应用客户端实现-30

3.3.5 其他功能模块的实现-36

3.4 本章小结-37

4. 系统测试-38

4.1 测试方案-38

4.2 测试环境-38

4.2.1 硬件环境-38

4.2.2 软件环境-39

4.3 测试结果与分析-39

4.3.1 告警查询-39

4.4 本章小结-43

5. 总结与展望-44

5.1 论文工作总结-44

5.2 未来工作展望-45

6. 系统开发对社会的影响-46

6.1 社会影响-46

7. 参考文献-47

8. 致谢-48

太能路灯控制的设计.doc	基于8279LED动态显示设计.doc	电子地图路径规划软件设计.doc
基于单片机的电梯运行控制系统设计.do	智能浇花系统的设计.doc	基于51单片机的电子鼻的设计与实现.doc
基于单片机的步进电机控制系统的设计	基于可编程控制器的双电机变频控制系统	红外投币器的设计与实现.doc
基于无线供电磁悬浮技术的LED灯演示仪	基于WIFI的太阳能照明智能控制系统.doc	智能教室管理系统的设计与实现.docx