时间序列预测中的特征选择方法概述
近年来,随着时间序列数据的不断增长,如何有效地从大量数据中提取出关键信息,并利用这些信息进行准确的预测,成为了一个重要的研究方向。特征选择是时间序列预测中一项至关重要的步骤,它能够有效地识别出对预测结果影响最大的输入变量,从而提高预测精度并降低模型复杂度。
基于随机森林的特征选择
Tyralis和Papacharalampous (2017) 提出了一种基于随机森林算法的特征选择模型,以建议最佳的输入变量集合。作者使用了两个不同的时间序列数据集,并将结果与标准基准模型进行了比较。结果表明,特征选择的随机森林模型在使用少量短滞后输入特征时表现更好。
基于支持向量机的特征选择
Valente和Maldonado (2020) 提出了一种适应于特征选择的支持向量机 (SVR) 的时间序列预测方法。作者使用 ARIMA 模型进行特征选择以预测能源负载。对于高频数据,使用了 1700 个滞后,对于日常数据,使用了不到 400 个滞后。所提出的方法与选择的传统技术(如 ARIMA 模型)相比表现略好。
基于深度学习的特征选择
Niu 等人 (2020) 提出了一种两阶段的多目标包装器特征选择,以确定深度学习模型的最佳输入空间。使用 MAE、MSE 和 MAPE 统计量评估模型性能。作者报告说,特征选择的所提出的模型显著提高了预测性能。
集成特征选择算法
Ghosh 等人 (2022) 提出了一种集成特征选择算法,以预测印度国家股票交易所数据的股票价格,并评估 COVID-19 的影响。本研究使用了现货价格、市场情绪、行业前景、原油价格波动和汇率波动等特征。作者提出了一个结构模型来确定所选变量的影响,包括 Boruta 和正则化随机森林算法。使用 PCA 和自编码器的正则化贪婪森林和深度神经网络算法。指出输入特征的重要性取决于特定股票和考虑的时期。
总结
上述研究表明,特征选择在时间序列预测中发挥着至关重要的作用。通过采用适当的特征选择方法,可以有效地提高预测精度,并降低模型复杂度。未来,随着时间序列数据的不断增长,对更加高效、鲁棒的特征选择方法的需求也将不断增加。
原文地址: https://www.cveoy.top/t/topic/lBWo 著作权归作者所有。请勿转载和采集!