基于Spark技术的电商用户行为可视化分析系统的设计与实现.docx

资料分类:计算机信息 上传会员:狂奔的小猪 更新时间:2021-11-17
需要金币2000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:15799
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:电商用户行为可视化分析系统是基于Spark分布式计算框架,根据数据中台的理念简单实现的数据可视化分析系统。用于电商平台的任务调度、用户浏览电商网站时各种行为的基本指标的分析以及数据的可视化。系统基于Linux虚拟机,用Hive和Mysql作为离线数据源,Kafka作为实时数据源,Spark用来实现基本指标的分析算法,Springboot用作实现对分析任务的调度和管理,Echarts用作对数据可视化。主要设计完成了数据库及数据仓库的设计、实时用户广告点击数据的记录和传输、会话的浏览时长及浏览深度的计算、品类排行榜的生成、页面pv及页面流跳转率的统计、各个商品的受欢迎程度进行排行榜的生成、广告点击黑名单的生成及过滤、广告点击量走势的实时统计、分析任务的调度及管理以及数据可视化等模块。

 

关键词:Spark;数据中台;电商用户行为;Springboot;可视化

 

目 录

摘 要

Abstract

1  绪论-1

1.1 研究背景-1

1.2 研究目的和意义-1

2  基础理论和相关技术介绍-3

2.1 Spark生态介绍-3

2.2 Hive介绍-4

2.3 Kafka介绍-4

2.4 Springboot介绍-4

2.5 Mysql介绍-4

2.6 Echarts介绍-4

3  系统分析与设计-5

3.1 系统需求分析-5

3.2 系统总体架构设计-6

3.3 系统功能模块设计-7

3.3.1 任务调度及数据展示系统功能设计-7

3.3.2 离线分析及实时处理作业系统功能设计-8

3.4 系统数据库设计-9

3.4.1 Hive数据仓库表设计-9

3.4.2 Mysql数据库表设计-11

3.5 实时数据源设计-15

4  系统功能实现与测试-16

4.1 离线分析及实时处理作业系统的功能实现-16

4.1.1 离线数据源的实现-16

4.1.2 用户会话分析模块的功能实现-17

4.1.3 页面流跳转率分析模块的功能实现-18

4.1.4 获取大区前三热门商品模块的功能实现-18

4.1.5 实时数据源的实现-19

4.1.6 广告点击实时统计模块的功能实现-19

4.2 任务调度及数据展示系统的实现-20

4.2.1 任务信息管理的实现-20

4.2.2 数据可视化的实现-22

4.3 系统测试-24

4.3.1 系统测试概述-24

4.3.2 实时数据源测试-25

4.3.3 系统功能测试-25

结    论-27

致    谢-28

参考文献-29

相关论文资料:
最新评论
上传会员 狂奔的小猪 对本文的描述:于是近年来数据中台的概念被阿里提出。数据中台大致的构造分为数据模型、数据服务和数据开发。在整个架构中,数据开发是最底层的,贯穿了整个中台,它能在保证不局限于模型和......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: