| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:14351 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:糖尿病是一种以高血糖为特征的慢性疾病,且具有明显的家族遗传特征,接近一半的患者有家族遗传史。近年来,中国成为世界糖尿病患者的第一大国,患者人数高达1.1亿人,且患病比例还在不断地上升。在这种情况之下,通过先进的技术手段做好糖尿病的前期预防工作、对普通百姓的患病几率进行评估以及对高危人群患病几率进行预测,从而达到预防的作用。本实验主要针对以下三个部分展开:第一点是对一些糖尿病的参数进行分析处理。影响糖尿病的因素有很多,例如血糖、血压、BMI等等,而且不同的年龄段的指标数值又有着很大的差异性,但是收集的数据集中又有些数值是无法使用的,比如某些不符合实际的数值或者是为零的数字,都需要排除在外,进行数据的筛选。第二点就是预测模型的设计与分析。通过多种分类算法对糖尿病的数据集进行预测分析,来判断之后患有糖尿病的可能性。主要的算法有决策树、随机森林、Logistic回归以及神经网络等。第三点,把数据结果可视化分析,采用数形结合的方式,观察模型的优劣,对模型进行调参,改进。
关键词:糖尿病 机器学习 神经网络 随机森林 Logistic回归
目录 摘要 Abstract 1.绪论-1 1.1 课题研究背景-1 1.2 课题研究目的-1 1.3 课题的研究现状-1 1.4 本文的主要工作-2 2.算法原理与分析-4 2.1 Logistic回归-4 2.2 决策树算法-4 2.3 随机森林算法-5 2.4 SVM算法-5 2.5 多层感知机-6 2.6 BP神经网络-6 3.可行性分析-8 3.1 技术可行性-8 3.2 操作可行性-8 3.3 经济可行性-8 3.4 社会可行性-8 4.实验设计-9 4.1 数据分析及理解-9 4.2 数据预处理-9 4.3 BP神经网络设计-16 4.4 sklearn机器学习库模型调用-19 5.实验结果与分析-22 6.结论与展望-26 6.1结论-26 6.2不足之处及未来展望-26 6.3本研究对各方面的影响-27 参考文献-28 致谢-29 |

