| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:11996 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.docx) |
摘 要
随着互联网+这一概念的不断发展,各种类型的营销活动和补贴活动也是层出不穷。在为正常用户带来福利的同时,也催生了一批专注于营销活动的“羊毛党”。羊毛党的行为称之为“薅羊毛”,而“薅羊毛”的本质即是欺诈。同套利黑产团伙的斗争,是一场永无止境的攻防战,使用技术手段进行“羊毛党”等反欺诈在现如今显得尤为重要。人工智能中的机器学习依靠统计学方式自行寻找能够在实践中发挥功效的决策流程,分析大数据,进而预测用户行为。运用人工智能技术进行反欺诈,是大势所趋。本文介绍了虚假用户识别的应用背景,依据DC竞赛的数据,运用python进行数据分析,清洗数据,结合文献与数据构建了“羊毛党”的一些特征,并在最终使用评分标准验证了分析得出的“羊毛党”特征对模型的预测结果有着正向作用,具有较高的识别能力。
关键词:羊毛党; 机器学习; 用户识别;数据处理
目 录
1 绪论 1
1.1 研究背景和意义 1
1.2 研究现状 1
1.2.1 国外现状 1
1.2.2 国内现状 2
2 “羊毛党”概述 3
2.1 引言 3
2.2 “羊毛党”产生的原因 3
2.2.1 互联网飞速发展 3
2.2.2 粗放式的获客方式 3
2.2.3 互联网金融监管体系尚不完善 3
2.3 “羊毛党”的危害 3
2.3.1 对互联网商家平台的危害 3
2.3.2 对互联网环境的危害 4
2.4 “羊毛党”的特征 5
2.4.1 金额小规模大 5
2.4.2 活跃于各个平台,平台粘性低 5
2.4.3 团伙性 5
2.4.4 大量账号集中少数用户手中 5
2.5 本章小结 5
3 探索式数据分析 7
3.1 引言 7
3.2 数据初探 7
3.3 数据清洗 8
3.4 描述性统计 9
3.5 多账号的“羊毛党” 15
4 特征工程 18
4.1 引言 18
4.2 特征构造 18
5 建立模型 22
5.1 模型选择 22
5.2 数据划分 22
5.2 评分标准 22
6 总结与展望 24
6.1 总结 24
6.2 展望 24
参考文献 26
致谢 27 |

