Python股票价格预测:线性回归模型实战与可视化
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_excel('E:\pythonProject5\深度学习\新建 XLS 工作表.xls')
# 选择特征和目标变量
features = data[['开盘', '涨跌额', '涨跌幅', '最低', '最高', '成交量', '成交金额']]
target = data['收盘']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.2, random_state=42)
# 训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测股票价格
predictions = model.predict(X_test)
# 对比实际价格进行验证
mse = mean_squared_error(y_test, predictions)
print('均方误差(MSE):', mse)
# 输出预测结果和实际价格
result = pd.DataFrame({'预测价格': predictions, '实际价格': y_test})
print(result)
# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 绘制预测价格和实际价格的图像
plt.plot(result.index, result['预测价格'], label='预测价格')
plt.plot(result.index, result['实际价格'], label='实际价格')
plt.xlabel('样本编号')
plt.ylabel('股票价格')
plt.title('预测价格 vs 实际价格')
plt.legend()
plt.show()
# 对第一列的结果按照从大到小的顺序输出
result = result.sort_values(by='预测价格', ascending=False)
print(result)
代码解读:
- 导入必要的库: 导入Pandas用于数据处理,Scikit-learn用于模型训练和评估,Matplotlib用于数据可视化。
- 读取数据: 使用Pandas读取股票数据。
- 数据预处理: 选择特征列和目标列,并将数据集划分为训练集和测试集。
- 模型训练: 创建线性回归模型,并使用训练数据进行训练。
- 模型预测: 使用测试集数据进行预测。
- 模型评估: 计算均方误差 (MSE) 来评估模型性能。
- 结果可视化: 使用Matplotlib绘制预测价格和实际价格的对比图。
- 结果排序: 对预测结果按照预测价格进行降序排序。
注意:
- 将 'E:\pythonProject5\深度学习\新建 XLS 工作表.xls' 替换为实际的股票数据文件路径。
- 可以根据需要调整模型参数和特征选择来优化模型性能。
- 股票市场波动较大,预测结果仅供参考,不构成投资建议。
原文地址: https://www.cveoy.top/t/topic/f3Fs 著作权归作者所有。请勿转载和采集!