首先,我们需要安装并导入所需的库,包括pandas和sklearn:

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score

然后,读取Excel文件并进行数据处理:

data = pd.read_excel(r'D:\pythonProject3\会员信息\附件二:会员信息数据.xlsx')
data.dropna(inplace=True)
X = data[['信誉值均值', '预订任务限额均值', '商品周围商品个数', '会员点个数']]
y = data['任务标价']

接下来,从数据中随机取样100组数据用于拟合模型:

sample = data.sample(n=100)
X_sample = sample[['信誉值均值', '预订任务限额均值', '商品周围商品个数', '会员点个数']]
y_sample = sample['任务标价']

然后,使用线性回归模型进行拟合:

model = LinearRegression()
model.fit(X_sample, y_sample)

计算拟合优度并输出:

r2 = r2_score(y_sample, model.predict(X_sample))
print("拟合优度:", r2)

最后,找到拟合度最高的方程并输出:

equation = "任务标价 = {:.2f} + {:.2f}*信誉值均值 + {:.2f}*预订任务限额均值 + {:.2f}*商品周围商品个数 + {:.2f}*会员点个数".format(model.intercept_, model.coef_[0], model.coef_[1], model.coef_[2], model.coef_[3])
print("拟合方程:", equation)

完整代码如下:

import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score

data = pd.read_excel(r'D:\pythonProject3\会员信息\附件二:会员信息数据.xlsx')
data.dropna(inplace=True)
X = data[['信誉值均值', '预订任务限额均值', '商品周围商品个数', '会员点个数']]
y = data['任务标价']

sample = data.sample(n=100)
X_sample = sample[['信誉值均值', '预订任务限额均值', '商品周围商品个数', '会员点个数']]
y_sample = sample['任务标价']

model = LinearRegression()
model.fit(X_sample, y_sample)

r2 = r2_score(y_sample, model.predict(X_sample))
print("拟合优度:", r2)

equation = "任务标价 = {:.2f} + {:.2f}*信誉值均值 + {:.2f}*预订任务限额均值 + {:.2f}*商品周围商品个数 + {:.2f}*会员点个数".format(model.intercept_, model.coef_[0], model.coef_[1], model.coef_[2], model.coef_[3])
print("拟合方程:", equation)

请注意,以上代码中的文件路径需要根据实际情况进行修改。

data = pdread_excelrDpythonProject3会员信息附件二:会员信息数据xlsxdatadropnainplace=TrueX = data信誉值均值 预订任务限额均值 商品周围商品个数 会员点个数y = data任务标价从中随机取样100组数据用来拟合求拟合优度并找到拟合度最高的方程并输出

原文地址: https://www.cveoy.top/t/topic/ixcW 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录