机器学习垃圾邮件检测.doc[原创毕业论文]

需要金币：1000 个金币	资料包括：完整论文
转换比率：金额 X 10=金币数量，例100元=1000金币	论文字数：12361
折扣与优惠：团购最低可5折优惠 - 了解详情	论文格式：Word格式(*.doc)

上一篇：机器学习房价数据分析与预测.doc

下一篇：机器学习声呐数据分析.doc

摘要：垃圾邮件的检测和识别对改善互联网环境，提升人们工作生活质量具有重要意义。垃圾邮件数据集由600封电子邮件数据组成，它包括100个输入变量和1个输出变量。输出0代表正常邮件，1代表垃圾邮件。本课题采用了三种经典的机器学习算法逻辑回归、朴素贝叶斯、随机森林对垃圾邮件数据集进行了机器学习，并通过10折交叉验证评估了模型的学习效果。实验结果证明，逻辑回归和随机森林两种算法的表现要优于朴素贝叶斯算法。

关键词：机器学习垃圾邮件检测人工智能逻辑回归朴素贝叶斯随机森林

摘要

Abstract

1-引言-1

1.1课题研究背景-1

1.1.1垃圾邮件的产生-1

1.1.2垃圾邮件的危害-1

1.2课题研究的现实意义与应用前景-2

2-机器学习工具与算法选择-4

2.1机器学习工具-4

2.2算法选择-4

2.2.1逻辑回归-5

2.2.2朴素贝叶斯-5

2.2.3随机森林-6

3-实验设计与结果-8

3.1数据预处理-8

3.1.1导入标准库和数据集-8

3.1.2处理重复数据与缺失数据-9

3.1.3特征缩放-10

3.2算法实现和结果-12

3.2.1逻辑回归的实现与结果-12

3.2.2朴素贝叶斯的实现与结果-15

3.2.3随机森林的实现与结果-16

3.3基于本章实验的一些思考-17

4-K折交叉验证与结果比较-19

4.1 K折交叉验证与K值选择-19

4.2 10折交叉验证算法实现-20

4.3结果比较-22

结语-24

参考文献-25

致谢-26

基于MATLAB的双闭环PWM直流调速虚拟实验系	基于单片机的温控风扇设计.doc	基于WIFI的PLC与单片机的通信系统设计--
PLC仿真实验平台的设计与实现.docx	大棚仓库温湿度自动控制系统.docx	高中物理动量守恒定律教学中应用探究式
基于PLC的智能取药系统设计（软件部分）	PLC在工业锅炉自动控制中的应用.doc	全自动洗衣机控制系统设计.doc
8路智能抢答器的设计.doc	市电无线监视装置的设计与实现.docx	基于蚁群算法的三维空间机器人路径规划