波士顿房价预测:主成分分析与回归模型
波士顿房价预测:主成分分析与回归模型
本次实验使用R语言中的MASS包,通过对波士顿周围506个街区的13个指标进行主成分分析,探索各指标之间的关系和对房价中位数的影响。
主成分分析
首先对13个指标进行主成分分析,求出特征值和特征向量,并绘制碎石图,以确定合适的主成分个数。通过观察碎石图发现,前6个特征值大于1,说明可以选择前6个主成分作为解释变量。接着做出前2个主成分的载荷图,尝试给各个主成分命名。根据载荷图的分布情况,第一主成分可以命名为'城市状况',主要受到城市犯罪率、非零售商用土地比例和地位较低者比例等因素的影响;第二主成分可以命名为'房屋状况',主要受到房屋平均房间数、住宅用地比例和自用房屋比例等因素的影响。
接着做出观测值的主成分得分图,以便综合评估和排序506个街区。通过观察主成分得分图,可以发现第一主成分得分高的街区,一般房价中位数较低;第二主成分得分高的街区,一般房价中位数较高。
主成分回归模型
最后,以房价中位数为影响变量,以前13个指标为解释变量,建立主成分回归模型,并写出回归方程。通过与最小二乘估计结果作对比,可以发现主成分回归模型的拟合效果更好,能够更好地解释指标之间的关系和对房价的影响。
原文地址: https://www.cveoy.top/t/topic/orgi 著作权归作者所有。请勿转载和采集!