时间序列数据记录了基于时间间隔的数据点。对这类数据集进行分析对于识别模式、进行预测以及提供富有洞察力的信息至关重要。Box-Jenkins 模型是一种预测方法,用于对特定时间段的时间序列数据进行预测。
在本文中,我们将深入探讨用于 ARIMA 建模的 Box-Jenkins 方法,因为它能帮助我们分析和预测时间序列数据。
目录
- ARIMA 建模
- Box-Jenkins 方法
- Box-Jenkins 方法论的应用
让我们先讨论一下什么是 ARIMA 模型,以便我们对整个过程有一个扎实的理解。
ARIMA 建模
ARIMA 建模或自回归整合移动平均 是一种时间序列分析和预测方法。ARIMA 模型是自回归、差分和移动平均的结合,这些都是在时间序列建模中使用的。让我们把它分解开来,逐一讨论不同的组成部分:
- 自回归 (AR) 分量:自回归分量涉及对观测值与几个滞后观测值(先前观测的点)之间的关系进行建模。这个分量让我们了解到,时间序列的当前值与该序列的先前值有关。“自回归”一词表示模型使用了变量与其自身过去值的关系。AR 分量用 p 表示,可以表示为:
> Xt = c + \phi1.X{t-1}+\phi2.X{t-2}+…+\phip.X{t-p}+\epsilont
>
> 其中:
>
> – X_t 是时间 t 时的时间序列值。
> – c 是一个常数值。
> – \phi1, \phi2,…,\phi_p 是自回归系数。
> – \epsilon_t 是时间 t 时的误差。
- 整合 (I) 分量:整合分量通过差分使时间序列平稳化;这意味着时间序列的统计特性不随时间变化。它有助于稳定均值并从时间序列中消除趋势。差分用 d 表示,且 dYt = Yt – Y{t-1} 表示一阶差分。我们可以通过 d^2Yt、d^3Y_t 等进一步增加差分的阶数。
- 移动平均 (MA) 分量:该分量表示过去误差项对时间序列当前值的影响。移动平均分量可以用 q 表示,也称为移动平均的阶数。移动平均过程也可以表示为:
> Xt = c+ \epsilont+ \theta1.\epsilon{t-1}+ \theta2.\epsilon{t-2}+…+ \thetaq.\epsilon{t-q}
>
> 其中:
>
> – X_t 是时间 t 时的时间序列值。
> – c 是一个常数。
> – \epsilont, \epsilon{t-1},…, \epsilon_{t-q} 是噪声项或误差项。
> – \theta1, \theta2, …, \theta_q 是移动平均常数。
ARIMA(p,d,q):
ARIMA 模型结合了所有的 AR、I、MA 分量。ARIMA 建模结合了上述所有分量,其一般形式由以下公式给出:
> Xt = c + \phi1.X{t-1}+\phi2.X{t-2}+…+\phip.X{t-p} + \epsilont+ \theta1.\epsilon{t-1}+ \theta2.\epsilon{t-2}+…+ \thetaq.\epsilon{t-q}
一般的 ARIMA 预测过程包括为 p、d 和 q 选择合适的值,估计模型参数,并使用该模型进行预测。Box-Jenkins 方法论通常用于识别时间序列数据的 ARIMA 模型并进行拟合。
现在让我们详细讨论一下 Box-Jenkins 方法。
Box-Jenkins 方法是一种用于时间序列数据的预测和分析方法论。Box-Jenkins 方法包含三个阶段,通过这三个阶段可以执行时间序列分析。它包括不同的步骤,包括识别、估计、诊断检验、模型细化和预测。Box-Jenkins 方法是一个迭代过程,从识别到模型细化的步骤 1 到 4 通常会重复进行,直到获得合适且经过充分诊断的模型。需要注意的是,该方法假设潜在的时间序列数据是由平稳和线性过程产生的。Box-Jenkins 模型的不同阶段可以识别为:
识别:
识别是 Box-Jenkins 方法的第一步,它有助于确定对于给定的时间序列,哪些自回归 (AR)、差分 (I) 和移动平均 (MA) 分量的阶数是合适的。这一步有助于识别给定时间序列的 p、d 和 q 值。让我们看看这个阶段涉及的关键步骤:
- 平稳性检验:这个过程发生在 ARIMA 建模之前,平稳性检验是指检查时间序列的统计特性(如[均值](