from sklearn.svm import LinearSVR
import pandas as pd

# 读取数据
data_train = pd.read_csv('new_data.csv')

# 自变量参考列
x_list = ['建筑面积', '室', '厅', '卫']

# 数据标准化
data_mean = data_train.mean()  # 获取平均值
data_std = data_train.std()  # 获取标准偏差
data_train = (data_train - data_mean) / data_std

# 特征数据
x_train = data_train[x_list].values

# 目标数据,总价
y_train = data_train['总价'].values

# 创建LinearSVR对象
linearsvr = LinearSVR(C=0.1)

# 训练模型
linearsvr.fit(x_train, y_train)

代码解析:

  1. 导入库:首先导入 sklearn.svm 中的 LinearSVR 类和 pandas 库,用于处理数据。

  2. 读取数据:使用 pd.read_csv() 函数读取名为 'new_data.csv' 的 CSV 文件,并将数据存储到 data_train 变量中。

  3. 定义自变量列:将影响房价的自变量列名存储在 x_list 列表中,包括'建筑面积', '室', '厅', '卫' 等。

  4. 数据标准化:使用 data_train.mean()data_train.std() 计算数据的平均值和标准差,并进行标准化处理,使每个特征具有零均值和单位方差。

  5. 特征数据提取:使用 data_train[x_list].values 提取 x_list 中定义的自变量数据,并将其存储在 x_train 变量中。

  6. 目标数据提取:使用 data_train['总价'].values 提取目标数据(总价),并将其存储在 y_train 变量中。

  7. 创建LinearSVR对象:使用 LinearSVR(C=0.1) 创建一个 LinearSVR 对象,C 参数控制正则化强度,值为 0.1 表示较强的正则化。

  8. 训练模型:使用 linearsvr.fit(x_train, y_train) 方法使用特征数据 x_train 和目标数据 y_train 训练模型。

注意: 这段代码仅完成了房价预测模型的训练部分,还需要进行模型评估、预测等步骤。

Python 使用 LinearSVR 进行房价预测:数据预处理与模型训练

原文地址: http://www.cveoy.top/t/topic/J7a 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录