基于时间序列数据的ARIMA模型预测未来20天数据
该代码使用 Python 中的 Pandas、NumPy、Matplotlib 和 statsmodels 库来构建 ARIMA 模型,并预测未来 20 天的数据。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
from statsmodels.tsa.stattools import adfuller
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
# 设置合适的字体
font_path = 'C:/Windows/Fonts/simsun.ttc' # 修改为你系统中合适的字体路径
font_prop = FontProperties(fname=font_path, size=12)
# 读取数据
data = pd.read_excel('D:\M_hua\text.xlsx')
print(data.columns)
# 将时间列作为时间索引
data.set_index('time', inplace=True)
# 查看原始数据的平稳性
def check_stationarity(series):
result = adfuller(series)
print('ADF检验结果:')
print('ADF Statistic:', result[0])
print('p-value:', result[1])
print('Critical Values:')
for key, value in result[4].items():
print(f'{key}: {value}')
# 查看原始数据的平稳性
print('原始数据的平稳性检验结果:')
check_stationarity(data.iloc[:, 0])
# 进行差分处理,直至平稳
diff_count = 0
while not adfuller(data.iloc[:, 0])[1] < 0.05:
data = data.diff().dropna()
diff_count += 1
# 重新设置时间索引为整数索引
data.reset_index(drop=True, inplace=True)
# 查看差分后数据的平稳性
print(f'经过{diff_count}阶差分后数据的平稳性检验结果:')
check_stationarity(data.iloc[:, 0])
# 绘制ACF和PACF图
fig, ax = plt.subplots(2, 1, figsize=(10, 8))
plot_acf(data.iloc[:, 0], ax=ax[0], lags=20)
plot_pacf(data.iloc[:, 0], ax=ax[1], lags=20)
ax[0].set_xlabel('Lags', fontproperties=font_prop)
ax[0].set_ylabel('ACF', fontproperties=font_prop)
ax[0].set_title('自相关系数图', fontproperties=font_prop)
ax[1].set_xlabel('Lags', fontproperties=font_prop)
ax[1].set_ylabel('PACF', fontproperties=font_prop)
ax[1].set_title('偏自相关系数图', fontproperties=font_prop)
plt.tight_layout()
plt.show()
# 构建ARIMA模型,并拟合数据
model = ARIMA(data, order=(1, 0, 1))
result = model.fit()
# 输出模型系数
print('模型系数:')
print(result.summary().tables[1])
# 获取差分序列拟合值
fitted_values = result.fittedvalues
# 可视化拟合结果
plt.plot(np.arange(len(data)), data.values, label='差分后数据')
plt.plot(np.arange(len(data)), fitted_values.values, color='red', label='拟合结果')
plt.legend(prop=font_prop)
plt.xlabel('时间', fontproperties=font_prop)
plt.ylabel('数据', fontproperties=font_prop)
plt.title('ARIMA模型拟合结果', fontproperties=font_prop)
plt.show()
# 预测未来二十天的数据
forecast = result.get_forecast(steps=20)
forecast_mean = forecast.predicted_mean
forecast_conf_int = forecast.conf_int()
# 可视化预测结果
plt.figure(figsize=(10, 6))
plt.plot(data.index, data.values, label='差分后数据')
plt.plot(forecast_mean.index, forecast_mean.values, color='red', label='预测结果')
plt.fill_between(forecast_conf_int.index, forecast_conf_int.iloc[:, 0], forecast_conf_int.iloc[:, 1], color='gray', alpha=0.3)
plt.legend(prop=font_prop)
plt.xlabel('时间', fontproperties=font_prop)
plt.ylabel('数据', fontproperties=font_prop)
plt.title('ARIMA模型预测结果', fontproperties=font_prop)
plt.show()
请根据你的实际情况修改代码中的文件路径和列名。运行代码后,你将获得ARIMA模型的拟合结果和预测的未来二十天的数据。
原文地址: https://www.cveoy.top/t/topic/bQdB 著作权归作者所有。请勿转载和采集!