前沿: 从随机方法到软计算的时间序列预测最全综述
《从随机方法到软计算的时间序列预测最全综述》
P Hendikawati et al 2020, A survey of time series forecasting from stochastic method to soft computing, J. Phys.: Conf. Ser. 1613 012019
Forecasting is a part of statistical modelling that is widely used in various fields because of its benefits in decision-making. The purpose of forecasting is to predict the future values of certain variables that vary with time using its previous values. Forecasting is related to the formation of models and methods that can be used to produce a good forecast. This research is a survey paper research that used a systematic mapping study and systematic literature review. Generally, time series research uses linear time series models, specifically the autoregressive integrated moving average model that has long been used because it has good forecasting accuracy. The successfulness of the Box–Jenkins methodology is based on the reality that various models can imitate the behaviour of various types of series, usually without requiring many parameters to be estimated in the final choice of the model. However, the assumption of stationarity that must be met makes this method inflexible to use. With the advances in computers, forecasting methods from stochastic models to soft computing continue to develop and extend. Soft computing for forecasting can provide more accurate results than traditional methods. Moreover, soft computing has many advantages in terms of the amount of data that can be analysed and the time- and cost-effectiveness of the process.
1 Abstract
2 Introduction
3 Methodology
4 Result and Discussion
4.1 Stochastic Method
ARCH/GARCH通常用于通过分析数据序列中方差、误差和平方的影响来确定数据的波动性。如果选择的ARIMA模型不符合同方差假设,即模型仍然包含异方差性,则会使用ARCH/GARCH。该方法最初由Engle [13]引入,用于计量经济学数据,并侧重于金融应用。除金融数据外,还进行了许多将GARCH及其扩展方法应用于各种情境的研究。多个研究人员使用ARCH/GARCH分析具有波动性的数据,其中[14-20]发现ARCH/GARCH对于具有波动性的数据比ARIMA产生更好的结果。处理具有波动性和异方差性数据的另一种方法是由Morgan于1994年开发的EWMA方法。EWMA方法是一种估计未来波动性的步骤,通过给最新的观察数据比以前的数据更大的权重。[21]和[22]使用和分析了EWMA的表现,并获得了有前途的预测结果。表1至5提供了与从传统方法到利用计算机技术的复杂性方法的预测目的相关的已进行的研究列表。还总结了开发新的预测方法和技术的几项研究。
4.2 Nonlinear Time Series Modeling
4.3 Multivariate Time Series Method
单变量时间序列模型成功地用于预测,促使研究人员将模型的使用扩展到多变量情况。多种时间序列预测案例描述了两个或多个变量之间的关系。这可以通过使用涉及多个相关变量的更多信息来实现,从而提高模型预测数据的精度。几种适用于多元时间序列数据的时间序列数据预测模型包括向量自回归(VAR)、向量移动平均(VMA)和向量自回归移动平均(VARMA)。VAR用于分析模型中包含的干扰因素的动态效应。VAR分析与同时方程模型相同,因为它在一个模型中考虑了几个内生变量。但是,在VAR中,除了前一值解释的变量之外,每个变量还受到观察中其他内生变量的先前值的影响。VARMA模型是单变量ARIMA的概括,可用于预测多变量数据或具有多个变量的数据。VARMA模型的条件是数据必须是平稳的。VARMA模型是VAR和VMA模型的组合。这个模型的优点不仅在于能够预测数据,还在于能够看到数据之间的相互关系。[31-37]已开发了多个版本的多元VAR模型,实现了VAR/VARMA以预测各种经济案例。
4.4 Artificial Intelligence Method for Forecasting
平稳性是使用ARIMA模型进行时间序列分析过程的初始要求。在实际情况中,大多数时间序列数据都是非平稳的。人工神经网络(ANN)方法的发展为非平稳数据的时间序列分析提供了便利。然而,当时间序列数据分析过程中不需要平稳性假设时,会出现问题。随着科学的发展,许多新的技术和程序已经被开发出来。随着计算技术的进步,新的时间序列预测方法也已经被开发出来。人工智能是一种快速发展的预测方法。与随机方法相比,使用人工智能方法进行预测具有几个优点,包括(a)不需要形成特定的模型,(b)能够分析数据行为而不涉及数据的统计分布的某些假设,(c)能够处理复杂的模式和非线性数据,(d)提供更准确的预测结果。然而,使用人工智能方法的缺点是可能会陷入最优局部值。
4.5 Support Vector Machines
4.6 Fuzzy Logic for Forecasting
模糊逻辑是一种人工智能专家系统的发展,它可以通过将数据形成范围来简化计算以获得结果。模糊逻辑还具有灵活性,即能够适应问题的变化和不确定性,模拟复杂的非线性函数,并立即构建和应用专家经验,无需经过训练过程。已经用于预测的模糊逻辑时间序列预测方法包括模糊时间序列(FTS;时变和时不变)、模糊神经元(FNN)、神经模糊系统或神经模糊、模糊ARMA、模糊推理系统和ANFIS等多种方法。在日益复杂的系统中,模糊逻辑通常很难,并且需要很长时间来设置正确的规则和隶属函数。在NN中,当采用Yu和Chen模型的模糊逻辑时,组合方法必须是有方法的。多项实证研究表明,组合模型具有良好的应用效果。多位研究人员使用模糊逻辑和模糊组合与其他方法进行预测。例如,[70]、[71]和[72]提出了一种新的混合ANN与模糊的方法,可以成为提高预测精度的潜在方法,因为结合了ANN和模糊的优点以克服两种模型的局限性。计算机的发展也支持了使用模糊系统进行预测的发展。[73]提出了一种简化计算方法,可以最小化模糊关系矩阵的复杂计算,确定适当的去模糊化过程,并实现更好的预测精度。此外,[74]、[75]和[76]提出了用于预测的FTS。多位研究人员进一步发展了FTS,这是扩展模糊逻辑用于预测时间序列数据的一种方法。[77]首次展示了使用FTS的预测程序。其他使用FTS进行各种案例研究的研究人员包括[78]、[79]、[80]、[81]、[82]和[83]。此外,FTS正在不断发展,有多种新方法正在集成。[84]和[85]提出了一种新的FTS预测技术,比传统的FTS模型更准确。除此之外,[86]和[87]开发了一种基于FTS的混合模型,与其他方法结合,显示出良好的精度和性能。
4.7 Adaptive Neuro-fuzzy Inference System
多位研究者报告了ANFIS与其他各种方法和方法结合的卓越预测性能。[104]介绍了ANFIS和粗糙集的组合,以最小化模糊规则的数量,并采用ANFIS和PSO的简单结构来确定参数。[105]进行了实验,比较了萤火虫算法和ANFIS组合与其他方法的性能。[106]提出了基于子集ARIMA模型对原始数据进行预处理的ANFIS建模过程以选择输入变量。在开发良好的模型时,需要考虑三个重要概念,即选择输入变量、指定聚类数和选择隶属函数。[107]将减法聚类过程应用于聚类数据,以帮助简化模糊规则。
[108]设计了一个模糊系统与RKLM相结合,以适应其隶属函数和参数以提高系统性能。[109]使用了具有网格划分技术的ANFIS。[110]提出了一种基于自适应种群活动PSO算法与最小二乘法相结合的混合学习方法,以优化ANFIS模型。[111]介绍了将新的混合学习规则与Levenberg–Marquardt和梯度方法相结合应用于ANFIS技术的方法,作为一种替代通用混合学习方法。[112]综述了元启发式算法,如GA、PSO、ABC、CSO及其变体,以训练ANFIS以克服计算昂贵的问题并减少ANFIS规则库中的规则数。[113]提出了使用TS–ANFIS混合方法的预测系统。所提出的ANFIS混合方法表现出更好的性能,并且比传统方法更有效。此外,实验结果表明优化速度快,预测精度高。
5 Conclusion: The Future of Forecasting Development
当谈到未来技术和用户机构的发展时,预测会发生两件事。首先,计算机技术的发展与越来越复杂的软件开发相结合,将是预测领域中强有力的组合。各种此时难以想象的复杂方法和技术将很快实现并应用于实际案例。其次,随着数据量的增加,数据的变化和难度水平也在增加。需要使用大量数据进行预测的机构数量也将增加。这两种计算机技术和大量数据的组合,涉及预测和数据挖掘,将在未来迅速增长,并成为一种常见现象。因此,利用软计算方法开发新的预测方法和技术非常重要,这些方法不仅可以提供比传统方法更准确的预测结果,而且在处理数据量和时间、成本效益方面也有许多优势。
References
关于时间序列方法,1.时间序列分析的各种程序, 38页集结整理成文档,2.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作,3.R软件中的时间序列分析程序包纵览,4.时间序列分析的各种程序, 38页集结整理成文档,5.时间序列数据分析的思维导图一览, 金融经济学者必备工具,6.送书: 应用时间序列分析(经典),7.为啥时间序列模型比较难学?时间序列的正名路,8.面板数据单位根检验软件操作和解读全在这里,9.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data),10.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,11.送书: 应用时间序列分析(经典),12.时间序列模型分解,季节调整分析基础,13.动态因子模型是什么, 又怎么去实现? 14.动态面板分位数估计怎么做?15.动态面板门槛回归程序公布, 使用方法介绍,16.把动态面板命令讲清楚了,对Stata的ado详尽解释,17.时间序列分析概览(今天的重点1),18.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!19.一文读懂“非平稳时间序列计量经济学分析”, 包括单位根检验, 结构突变检验等,20.中断时间序列分析ITSA是什么? 很流行的政策评估新范式!21.可以在面板回归分析中使用时间序列解释变量或被解释变量吗?22.ARIMA时间序列模型的步骤, 程序和各种检验, 附上代码并通过示例进行解读!23.使用Stata做时间序列分析书籍, 包括模型讲解以及Stata示例操作,24.时间序列中的协整检验和VECM,以及回归后的系列估计操作
关于VAR方法,1.R软件中的时间序列分析程序包纵览,2.时间序列分析的各种程序, 38页集结整理成文档,3.时间序列数据分析的思维导图一览, 金融经济学者必备工具,4.送书: 应用时间序列分析(经典),5.为啥时间序列模型比较难学?时间序列的正名路,6.时间序列中的协整检验和VECM,以及回归后的系列估计操作,7.时间序列模型分解,季节调整分析基础,8.空间和时间的计量,关注二位国人,9.TVP-VAR时变参数VAR系列文献和估计程序,10.向量自回归VAR模型操作指南针,为微观面板VAR铺基石,11.VAR宏观计量模型演进与发展,无方向确认推断更好,12.应用VAR模型时的15个注意点,总结得相当地道,13.面板数据单位根检验软件操作和解读全在这里,14.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data),15.面板向量自回归PVAR是什么? 数据, 程序和解读一步到位,16.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作,17.动态因子模型是什么, 又怎么去实现?18.SVAR模型的起源、识别、估计与应用, 系统讲述,19.平滑转移自回归模型(STAR)应用与在R软件的操作,20.Copula函数,21.GVAR, 全局VAR模型是什么?该如何用软件实现, 有哪些研究文献和最新进展!22.前沿: BVAR, 贝叶斯VAR是什么, 为什么需要, 软件怎么做, 如何解读呢?23.结构性面板VAR是什么? 如何实现PSVAR呢?怎么解读?24.2021年AER上最新基于DSGE模型的宏观计量文章, 附上50篇时序, VAR模型文章!
4年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。