用于时间序列的训练集代码
这是一个时间序列的训练集代码示例:
import pandas as pd
import numpy as np
# 生成时间序列数据
data = pd.DataFrame(np.random.randn(1000), index=pd.date_range('20160101', periods=1000), columns=['value'])
# 特征工程
data['lag1'] = data['value'].shift(1)
data['lag2'] = data['value'].shift(2)
data['lag3'] = data['value'].shift(3)
data['rolling_mean'] = data['value'].rolling(window=3).mean()
# 划分训练集和测试集
train_size = int(len(data) * 0.7)
train_data = data.iloc[:train_size]
test_data = data.iloc[train_size:]
# 特征和标签
X_train = train_data.drop('value', axis=1)
y_train = train_data['value']
X_test = test_data.drop('value', axis=1)
y_test = test_data['value']
这个示例中,我们首先生成了一个随机的时间序列数据。然后进行了特征工程,包括加入滞后数据和滚动均值。接着,我们将数据分为训练集和测试集,然后将特征和标签分开,用于训练和测试模型。
原文地址: https://www.cveoy.top/t/topic/wpY 著作权归作者所有。请勿转载和采集!