机器学习房价数据分析与预测.doc

资料分类:单片机自动化 上传会员:Chaturanga 更新时间:2023-04-24
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:10805
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:房价一直当今时代的一个核心话题,通过房价预测模型可以帮助人们预测未来的房价,了解房产的实际价值,为政府相关部门制定房地产政策提供可靠依据。本研究使用机器学习算法作为研究方法来开发住房价格预测模型。

影响房价的因素众多,如:地段,面积等因素。如何在众多的因素中找出影响房价的关键因素,是构造房价预测模型的难点。传统采用人工统计分类的方法效率低下,准确性不高。

本文采用机器学习来构建房价预测模型。并通过淘汰算法由机器自动筛选变量。实验采用包含506个原始数据的房地产数据包。该数据包包含13个输入变量,分别是(CRIM, ZN, INDUS, CHAS, NOX, RM, AGE, DIS, RAD, TAX, PTRATIO, B, LSTAT)。随机抽取其中70%的数据作为训练集,30%的数据作为测试集。

然后采用淘汰算法删除不相关的输入变量,对剩余的10个变量,再次进行建模。与未删除输入变量的建模结果相比,删除变量后的测试集验证均方根误差变化在10%以内。说明剩余的十个变量是房价预测模型的高相关参数。

关键字:房价预测,机器学习,数据模型,变量淘汰

 

目录

摘要

Abstract

1 引言-1

1.1研究背景及意义-1

1.2机器学习简介-1

1.3关于机器学习的算法-2

2 数据的预处理-5

2.1导入标准库-5

2.2导入数据集-6

2.3重复数据、缺失数据的处理以及数据的标准化-8

2.4划分测试集和训练集-9

3 变量分析-11

3.1字段CRIM分析-11

3.2字段ZN分析-12

3.3字段INDUS分析-12

3.4字段CHAS分析-13

3.5字段NOX分析-13

3.6字段RM分析-14

3.7字段AGE分析-15

3.8字段DIS分析-15

3.9字段RAD分析-16

3.10字段TAX分析-17

3.11字段PTRATIO分析-18

3.12字段B分析-18

3.13字段LSTAT分析-19

3.14本章总结-20

4 多元线性回归-21

4.1建立模型-21

4.2自变量淘汰-21

4.3模型重构-24

4.4本章研究总结-25

5总结与结论-26

致谢-27

参考文献-28

附录-29

 
相关论文资料:
最新评论
上传会员 Chaturanga 对本文的描述:基于机器学习的房价数据分析与预测系统设计终于完成。在开发该系统的经历中,依据房价数据模型构建出其大致的学习过程。 本文采用多元线性回归中反向淘汰机制算法,并根据预测......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: