Python 线性回归模型：预测任务标价 (去除'预订任务限额均值'自变量)

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from sklearn.preprocessing import MinMaxScaler

# 读取Excel文件
data = pd.read_excel(r'D:\pythonProject3\会员信息\附件二：会员信息数据.xlsx')
data.dropna(inplace=True)
X = data[['信誉值均值', '商品周围商品个数', '会员点个数']]
y = data['任务标价']

# 填充缺失值
X.fillna(X.mean(), inplace=True)
y.fillna(y.mean(), inplace=True)

# 数据归一化
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

# 创建线性回归模型
model = LinearRegression()

# 训练模型
model.fit(X_scaled, y)

# 输出方程系数
coefficients = model.coef_
intercept = model.intercept_
print('方程：y = {}x1 + {}x2 + {}x3 + {}'.format(coefficients[0], coefficients[1], coefficients[2], intercept))

# 预测值
y_pred = model.predict(X_scaled)

# 求拟合优度
r2 = r2_score(y, y_pred)
print('拟合优度：', r2)

本代码示例使用 Python 的 scikit-learn 库构建线性回归模型，用于预测任务标价。代码首先从 Excel 文件读取数据，并删除 '预订任务限额均值' 自变量，然后进行缺失值填充和数据归一化。接着，创建线性回归模型并训练模型，最后输出方程系数和拟合优度。

通过去除 '预订任务限额均值' 自变量，我们可以分析其他自变量对任务标价的影响，并观察模型的拟合优度变化。这有助于我们更好地理解任务标价的影响因素，并为后续的决策提供依据。