置顶

房价要跌了?让我们利用地理人工智能技术预测一下

作者:admin | 分类:房产资讯 | 浏览:18 | 时间:2023-12-10 13:26:00

引言

引言

最近,据多家房地产机构发布的报告显示,全国多个城市的二手房价格出现明显下跌。在当今的房地产市场中,二手房市场占据了相当大的份额。由于新房供应有限,二手房市场已成为许多人的首选。然而,决定二手房价格的因素多种多样,包括房屋的位置、大小、装修、年代等。

二手房价格的波动,使得许多潜在买家和卖家都在寻求一种更加准确的方法来预测二手房价格。在这个背景下,我们能否利用AI技术,为预测二手房价格提供了一个全新的解决方案呢?

AutoML的广泛应用

在上一篇文《使用AutoML轻松预测网约车需求量》中,我们详细阐述了AutoML与传统机器学习之间的区别与优势。AutoML作为机器学习领域中的一个相对较新的分支,它主要将机器学习中所有耗时过程自动化,如数据预处理、最佳算法选择、超参数调整等,以节约大量时间在建立机器学习模型过程中。

传统机器学习工作流

AutoML近年来已经在各领域有着广泛的应用,例如在医疗领域,AutoML可以帮助医疗人员自动识别和分析医疗图像,从而提高诊断的准确性和效率;在交通领域,AutoML技术可以自动优化自动驾驶的算法,提高车辆的安全性和驾驶体验;在金融领域,AutoML技术的出现极大地简化了从数据到模型的过程,使计算机可以自主地对未知数据进行分析、分类与预测。

AutoML与GIS结合后,也不断迸发出新的火花。例如王毅在《基于自动机器学习的全球尺度滑坡灾害易发性预测》一文中表示,基于AutoML的滑坡易发性分析,相较于传统机器学习方法,能过得性能更鲁棒、精度更优越的预测结果[1];陈柯兵在《基于AutoML的长江下游周旬尺度枯水位及潮位预报》一文中表示,基于AutoML的水位预报模型可取得较高的精度指标[2]

回到最初的问题,我们能否利用AI技术,为预测二手房价格提供了一个全新的解决方案呢?答案是肯定的,接下来,让我们一起来下AutoML在二手房屋价格预测上是怎么一显神威的吧!

上海市二手房屋价格预测案例

二手房屋价格模型构建

我们以上海市二手房屋价格分析为例。决定二手房价格的因素多种多样,包括房屋的位置、大小、装修、年代等。

在本例中,我们将探究7个房屋本身的属性:房屋面积、所处区域、建房时间、楼层高度、卧室数量、所属楼层、房屋朝向,3个距离要素,分别是距办公楼、地铁站、小学的距离,以及区位繁华指数(采用夜间灯光影像代替)共11个解释变量与要预测的变量:房屋单价之间的关系。

各变量的详细描述如下:

要预测的变量:

1. 房屋单价_单价元(PRICE):该房屋每平方米价格

解释变量:

1. 房屋面积(AREA):房屋面积,单位平方米

2. 所处区域(REGION):房屋所在行政区区位

3. 建房时间(TIME):该房屋建造时间

4. 楼层高度(FLOOR)该房屋所属楼层层数

5. 卧室数量(NUM_1):该房屋内所含卧室数量

6. 所属楼层(PART):该房屋在所属楼层的区域(低区、中区、高区)

7. 房屋朝向(TOWARDS):房屋朝向

8. 距离办公楼的距离:单位米

9. 距离地铁站的距离:单位米

10. 距离小学的距离:单位米

11. 区位繁华指数:用夜间灯光影像代替

上海市夜间灯光影像

POI点位分布:小学(左) 地铁站(中) 办公楼(右)

训练集和预测集划分

      在二手房数据集中随机选择100条作为预测数据集,标记为红色。其余数据标记为蓝色作为训练数据集。

训练集(左)预测集(右)

训练集及预测集属性表示例

使用AutoML进行训练

接下来我们运行GeoScene Pro 4.0 中新推出的使用AutoML进行训练工具,通过指定训练集中需要预测的变量和相应的解释变量,能自动快速地训练出一个机器学习模型,用于后续针对预测集进行推理。

使用AutoML进行训练工具 工具参数

值得注意的是,在我们的模型中的三个距离要素(距办公楼、地铁站、小学距离)和一个栅格数据(夜间灯光数据),可直接将原始的矢量/栅格数据加入到工具中,无需做前期的提取计算,工具将自动进行提取,十分方便。

距离变量与栅格变量自动提取

使用AutoML进行预测

使用AutoML进行预测工具需要与使用AutoML进行训练工具配合使用,在工具中输入训练工具中输出的机器学习模型(*.dlpk),并指定预测集中各变量与模型中各变量的对应关系后,即可运行工具完成对预测集的推理过程。

使用AutoML进行预测 工具参数

结果分析

宏观尺度上预测结果表现如何?

预测完成后,使用分级色彩的方式,对预测的二手房屋价格进行展示:

预测结果

可以看到,从市中心向外房屋预测价格不断降低(深绿色->浅绿色),且高房价区域房屋预测价格高于同距离下(距市中心)低房价区域,与实际房屋价格分布规律相符合。

二手房价预测值和实际值差多少?

预测房价与实际房价对比分析

      接下来,我们对预测集中的二手房预测价格实际价格指标进行统计,可以看到:

      1.  预测房价平均值(56,197)与实际房价平均值(56,002)相差195,平均值预测误差为0.34%

      2.  预测房价中值(57,478)与实际房价中值(55,092)相差2386,中值预测误差为4.33%

      3.  其他统计量如最值、总和等多项统计指标中的误差相较于实际房屋价格比例极小,有较好的预测结果;

      总的来说,预测出的二手房屋价格与实际价格十分接近,预测结果较为精确。

小结

      相较于传统机器学习,AutoML将机器学习中所有耗时过程自动化,如数据预处理、最佳算法选择、超参数调整等,以节约大量时间在建立机器学习模型过程中。      

      GeoScene Pro 中的使用AutoML进行训练工具,可根据解释变量、解释栅格自动构建模型,并提供了多种模式、选项以供连续变量或分类变量训练使用。结合使用AutoML进行预测工具,可使用机器学习模型文件自动进行预测及输出。通过组合使用该工具,可降低专业知识门槛,使用户快速完成机器学习流程,并获得较为准确的机器学习模型,以及后续的预测过程。适合应用于需求预测、气象预测、大气污染预测等多种领域。

      如果您想要了解更为详细的操作流程,可以点击下方视频进行查看。

      您也可以点击下方的“阅读原文”链接,在我们的一站式GIS前沿技术学习平台-极思课堂上进行学习和互动。

参考文献:

[1]      王毅,陈曦,唐贵希等.基于自动机器学习的全球尺度滑坡灾害易发性预测[J].资源环境与工程,2022,36(05):604-613.DOI:10.16536/j.cnki.issn.1671-1211.2022.05.009.

[2]      陈柯兵,邓良爱,李瀛等.基于AutoML的长江下游周旬尺度枯水位及潮位预报[J/OL].水运工程:1-6[2023-11-16].https://doi.org/10.16233/j.cnki.issn1002-4972.20231106.032.

发表评论

取消
微信二维码
支付宝二维码