| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:10805 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:房价一直当今时代的一个核心话题,通过房价预测模型可以帮助人们预测未来的房价,了解房产的实际价值,为政府相关部门制定房地产政策提供可靠依据。本研究使用机器学习算法作为研究方法来开发住房价格预测模型。 影响房价的因素众多,如:地段,面积等因素。如何在众多的因素中找出影响房价的关键因素,是构造房价预测模型的难点。传统采用人工统计分类的方法效率低下,准确性不高。 本文采用机器学习来构建房价预测模型。并通过淘汰算法由机器自动筛选变量。实验采用包含506个原始数据的房地产数据包。该数据包包含13个输入变量,分别是(CRIM, ZN, INDUS, CHAS, NOX, RM, AGE, DIS, RAD, TAX, PTRATIO, B, LSTAT)。随机抽取其中70%的数据作为训练集,30%的数据作为测试集。 然后采用淘汰算法删除不相关的输入变量,对剩余的10个变量,再次进行建模。与未删除输入变量的建模结果相比,删除变量后的测试集验证均方根误差变化在10%以内。说明剩余的十个变量是房价预测模型的高相关参数。 关键字:房价预测,机器学习,数据模型,变量淘汰
目录 摘要 Abstract 1 引言-1 1.1研究背景及意义-1 1.2机器学习简介-1 1.3关于机器学习的算法-2 2 数据的预处理-5 2.1导入标准库-5 2.2导入数据集-6 2.3重复数据、缺失数据的处理以及数据的标准化-8 2.4划分测试集和训练集-9 3 变量分析-11 3.1字段CRIM分析-11 3.2字段ZN分析-12 3.3字段INDUS分析-12 3.4字段CHAS分析-13 3.5字段NOX分析-13 3.6字段RM分析-14 3.7字段AGE分析-15 3.8字段DIS分析-15 3.9字段RAD分析-16 3.10字段TAX分析-17 3.11字段PTRATIO分析-18 3.12字段B分析-18 3.13字段LSTAT分析-19 3.14本章总结-20 4 多元线性回归-21 4.1建立模型-21 4.2自变量淘汰-21 4.3模型重构-24 4.4本章研究总结-25 5总结与结论-26 致谢-27 参考文献-28 附录-29 |

