| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:10247 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:近年来,糖尿病的发病率年年攀升,糖尿病引发的各种并发症更是给患者带来无尽的痛苦。因此,机器学习糖尿病数据,预测患者今后的发病趋势,对糖尿病的预防治疗有着重要的意义。 机器学习糖尿病数据分析,收集患者近五年的医疗记录,汇聚成糖尿病数据集。本数据集包含了768组数据,确定引起糖尿病的八个可能因素:怀孕次数,血浆葡萄糖浓度,舒张压,三头肌皮褶厚度,2小时血清胰岛素,体重指数,糖尿病谱系功能,年龄。本数据集拥有一个因变量,患病与否。 对糖尿病数据集,进行数据处理,包括完成数据清洗、数据分类、特征缩放等数据预处理。分别使用逻辑回归,朴素贝叶斯和随机森林创建学习模型,进行模型预测,评价机器学习结果。 绘制三种算法的准确率折线图比较算法学习效果,在非随机挑选验证集的情况下,,逻辑回归算法的准确率一直高于另外两种算法,且当验证集所占比例为5%时,该算法预测准确率达到92%。在随机挑选验证集的情况下,当验证集所占比例为15%,20%,25%时,逻辑回归算法准确率均高于其他算法,当验证集占5%时,朴素贝叶斯算法相对比较好。 关键词:机器学习 学习模型 模型预测 逻辑回归 朴素贝叶斯 随机森林
目录 摘要 Abstract 1 绪论-1 1.1 课题研究背景及意义-1 1.2 课题研究现状及趋势-1 1.3 论文主要内容-2 2 数据预处理-4 2.1 数据集整理-4 2.2 标准库及数据库的导入-4 2.2.1 标准库简介-5 2.2.2 导入标准库-5 2.2.3 导入数据集-5 2.3 训练集、验证集划分-7 2.4 特征缩放-8 2.5 构建混淆矩阵-10 2.6 本章小结-10 3 机器学习分类算法部分-11 3.1 逻辑回归算法-11 3.1.1 Sigmoid函数-11 3.1.2 逻辑回归创建学习模型-11 3.2 朴素贝叶斯算法-12 3.2.1 贝叶斯定理-12 3.2.2 朴素贝叶斯分类器原理简介-13 3.2.3 朴素贝叶斯创建学习模型-14 3.3 随机森林算法-15 3.3.1 决策树-15 3.3.2 随机森林算法-16 3.3.3 随机森林创建学习模型-17 3.4本章小结-18 4 机器学习效果对比分析-19 4.1 非随机挑选验证集-19 4.2 随机挑选验证集-22 5 总结-26 参考文献-27 致谢-28 附录一-29 附录二-32 |

