基于Splunk的网络日志大数据分析.doc

资料分类:单片机自动化 上传会员:番番呀 更新时间:2023-05-16
需要金币2000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:25276
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:大数据是如今的顶级大趋势。在这种趋势下,数据数据就像在生长剂的作用下疯长的杂草一般从各种公共和私人渠道流出,且由于由于数量巨大,信息冗杂,人们往往很难从中获取有效信息。

如今,数据以每年成倍增长。2020年的数据产量将是2009年的几十倍倍。这一变化主要是由于全球人口增长,人均设备持有数增长,新技术的应用以及日常设备和机器中传感器的使用(互联网又一大趋势)产生的。在此大前提下,批量处理机器数据成为了企业的不能忽视的一个大问题。机器数据是指那些能够为企业业务发展提供动力的应用、服务器、存储、网络设备、安全设备以及其他相关设备制造出来的数据。机器数据可以反映客户、交易、应用、服务器、网络等的行为或活动。机器数据的范围远远超越了日志。

Splunk可以收集来自任何地方产生的数据,无论是物理环境、虚拟环境还是云环境。借助Splunk,用户可以在一个位置实时搜索、监控和分析来自不同位置的数据。过去需要花费数天解决的问题和安全事件借助Splunk可能只需几个小时或更短时间解决。

正因如此,在本课题中将对Splunk在大数据分析中的应用进行分析和研究,并将给出相关的实施案例和解决方法。

 

关键词:大数据、机器数据、splunk

 

目录

摘要

Abstract

1. 绪论-1

1.1 课题研究背景-1

1.2 课题研究意义-1

1.3 课题研究内容和成果-2

1.4 论文结构-2

2. 相关工作-1

2.1 大数据分析-1

2.1.1大数据分析的基本概念-1

2.1.2大数据计算体系架构-1

2.2 Splunk单实例与分布式部署-2

2.2.1 Splunk部署的目的与因素-2

2.2.2 Splunk组件介绍-3

2.2.3 Splunk单实例部署-4

2.2.4 Splunk分布式部署-5

2.2.5 Splunk集群部署-7

2.3 Splunk add-on使用与相关的数据切割知识-8

2.4 Splunk 的SPL使用范例-10

2.4.1 SPL语言介绍-10

2.4.2通配符-10

2.4.3布尔表达式-11

2.4.4字段表达式-11

2.4.5 NOT和!=的区别-12

2.4.6搜索剖析-13

2.4.7字段-14

2.4.8引用和转义字符-14

2.4.9 SPL和正则表达式-15

2.4.10使用CASE()和TERM()来匹配短语-16

2.4.11关于子搜索-16

2.4.12事件抽样-18

2.4.13 SPL中部分函数使用-19

3. 系统设计与实现-21

3.1 系统方案设计-21

3.1.1 开发环境-21

3.1.2 系统框架结构-21

3.1.3 系统模块设计-22

3.1.4 系统工作流程-22

3.2 系统功能介绍-24

3.2.1 底层服务器-24

3.2.2 应用客户端-24

3.3 系统实现-25

3.3.1 解决安全问题实现原理-25

3.3.2 数据传输实现-25

3.3.3 底层服务器实现-25

3.3.4 应用客户端实现-30

3.3.5 其他功能模块的实现-36

3.4 本章小结-37

4. 系统测试-38

4.1 测试方案-38

4.2 测试环境-38

4.2.1 硬件环境-38

4.2.2 软件环境-39

4.3 测试结果与分析-39

4.3.1 告警查询-39

4.4 本章小结-43

5. 总结与展望-44

5.1 论文工作总结-44

5.2 未来工作展望-45

6. 系统开发对社会的影响-46

6.1 社会影响-46

7. 参考文献-47

8. 致谢-48

相关论文资料:
最新评论
上传会员 番番呀 对本文的描述:因此,我们希望在此提出一种针对存在的大数据分析提出一种基于splunk软件的处理方式——认真研究Splunk的索引、搜索、告警[7]、报表、数据透视表[19]等功能,在此基础上进一步研究效......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: