机器学习电离层数据分析.docx

资料分类:设计作品 上传会员:Chaturanga 更新时间:2023-04-27
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:10360
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:电离层是距离地面60千米以上的整个大气层,其存在大量的自由电子和离子,能改变无线电波传播方向并使其发生折射、反射等。因此知道一片区域电离层的好坏,对用无线电波传递信息的无线通信具有重要意义。

机器学习是通过对数据的研究让计算机拥有学习的能力,寻找数据的规律进而建立学习模型。本文对17组雷达回波数据进行分析研究,一共有 351个观察值,34 个输入变量和1个输出变量,输出为两个类别,一类为好,另一类为坏,因此这是一个二元分类问题。本文分别采用了支持向量机算法与朴素贝叶斯算法来构建学习模型,在测试集、训练集划分比例为2.5:7.5情况下,用支持向量机算法比用朴素贝叶斯算法构建的分类模型更优,最终能达到94%的分类准确率。

 

关键字:机器学习  支持向量机  朴素贝叶斯  预测

 

目录

摘要

Abstract

1.绪论-1

1.1研究背景及意义-1

1.2机器学习概述-1

1.3本文的章节安排-1

2.数据预处理-3

2.1导入标准库-3

2.2导入数据集-3

2.3重复数据的处理-3

2.4数据分类-4

2.5创建训练集和测试集-5

2.6特征缩放-5

3.分类模型的学习效果评价-7

3.1 准确率-7

3.2 精度、召回率、F1得分-7

3.3 AUC值与ROC曲线-8

4.数据特征缩放对分类模型的影响-9

4.1未对数据进行特征缩放-9

4.2对数据进行归一化处理-9

4.3对数据进行标准化处理-10

5.数据划分对分类模型的影响-11

5.1 train_test_split函数划分数据集-11

5.1.1 测试集与训练集的划分比例为1:9-11

5.1.2 测试集与训练集的划分比例为2:8-11

5.1.3 测试集与训练集的划分比例为3:7-12

5.2 cross_val_score交叉验证-12

5.2.1 将数据集分成10份-12

5.2.2 将数据集分成5份-13

6.支持向量机(SVM)-15

6.1支持向量机(SVM)算法概述-15

6.2 不同核函数对分类模型的影响-15

6.2.1线性核函数(linear)-15

6.2.2高斯核函数(rbf)-15

6.3 不同惩罚值对分类模型的影响-16

6.3.1惩罚值C=1与C=2-16

6.3.2不同惩罚值得到的模型准确率-17

7.朴素贝叶斯-19

7.1 朴素贝叶斯算法概述-19

7.2 GaussianNB与BernoulliNB-19

7.2.1 GaussianNB对分类模型的影响-19

7.2.2 BernoulliNB对分类模型的影响-19

8.总结与展望-21

8.1论文工作总结-21

8.2展望-21

参考文献-23

附录-24

致谢-26

相关论文资料:
最新评论
上传会员 Chaturanga 对本文的描述:监督学习是采用已知正确答案,通常称作标记的数据来训练,通过反馈验证得到学习模型;无监督学习是采用未标记的数据来训练,通过推断得到数据结构;半监督学习介于两者之间,......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: