集成时间序列模型提高预测精度

使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测

(资料图片仅供参考)

集成各种弱学习器可以提高预测精度，但是如果我们的模型已经很强大了，集成学习往往也能够起到锦上添花的作用。流行的机器学习库scikit-learn提供了一个StackingRegressor，可以用于时间序列任务。但是StackingRegressor有一个局限性;它只接受其他scikit-learn模型类和api。所以像ARIMA这样在scikit-learn中不可用的模型，或者来自深度神经网络的模型都无法使用。在这篇文章中，我将展示如何堆叠我们能见到的模型的预测。

我们将用到下面的包：

pip install --upgrade scalecast

conda install tensorflow

conda install shap

conda install -c conda-forge cmdstanpy

pip install prophet

数据集

数据集每小时一次，分为训练集(700个观测值)和测试集(48个观测值)。下面代码是读取数据并将其存储在Forecaster对象中:

import pandas as pd

import numpy as np

from scalecast.Forecaster import Forecaster

from scalecast.util import metrics

import matplotlib.pyplot as plt

import seaborn as sns

def read_data(idx = "H1", cis = True, metrics = ["smape"]):

info = pd.read_csv(

"M4-info.csv",

index_col=0,

parse_dates=["StartingDate"],

dayfirst=True,

)

train = pd.read_csv(

f"Hourly-train.csv",

index_col=0,

).loc[idx]

test = pd.read_csv(

f"Hourly-test.csv",

index_col=0,

).loc[idx]

y = train.values

sd = info.loc[idx,"StartingDate"]

fcst_horizon = info.loc[idx,"Horizon"]

cd = pd.date_range(

start = sd,

freq = "H",

periods = len(y),

)

f = Forecaster(

y = y, # observed values

current_dates = cd, # current dates

future_dates = fcst_horizon, # forecast length

test_length = fcst_horizon, # test-set length

cis = cis, # whether to evaluate intervals for each model

metrics = metrics, # what metrics to evaluate

)

return f, test.values

f, test_set = read_data()

f # display the Forecaster object

结果是这样的：

模型

在我们开始构建模型之前，我们需要从中生成最简单的预测，naive方法就是向前传播最近24个观测值。

f.set_estimator("naive")

f.manual_forecast(seasonal=True)

然后使用ARIMA、LSTM和Prophet作为基准。

ARIMA

Autoregressive Integrated Moving Average 是一种流行而简单的时间序列技术，它利用序列的滞后和误差以线性方式预测其未来。通过EDA，我们确定这个系列是高度季节性的。所以最终选择了应用order (5,1,4) x(1,1,1,24)的季节性ARIMA模型。

f.set_estimator("arima")

f.manual_forecast(

order = (5,1,4),

seasonal_order = (1,1,1,24),

call_me = "manual_arima",

)

LSTM

如果说ARIMA是时间序列模型中比较简单的一种，那么LSTM就是比较先进的方法之一。它是一种具有许多参数的深度学习技术，其中包括一种在顺序数据中发现长期和短期模式的机制，这在理论上使其成为时间序列的理想选择。这里使用tensorflow建立这个模型

f.set_estimator("rnn")

f.manual_forecast(

lags = 48,

layers_struct=[

("LSTM",{"units":100,"activation":"tanh"}),

optimizer = "Adam",

epochs = 15,

plot_loss = True,

validation_split=0.2,

call_me = "rnn_tanh_activation",

)

f.manual_forecast(

lags = 48,

layers_struct=[

("LSTM",{"units":100,"activation":"relu"}),

optimizer = "Adam",

epochs = 15,

plot_loss = True,

validation_split=0.2,

call_me = "rnn_relu_activation",

)

Prophet

尽管它非常受欢迎，但有人声称它的准确性并不令人印象深刻，主要是因为它对趋势的推断有时候很不切实际，而且它没有通过自回归建模来考虑局部模式。但是它也有自己的特点。1，它会自动将节日效果应用到模型身上，并且还考虑了几种类型的季节性。可以以用户所需的最低需求来完成这一切，所以我喜欢把它用作信号，而不是最终的预测结果。

f.set_estimator("prophet")

f.manual_forecast()

比较结果

现在我们已经为每个模型生成了预测，让我们看看它们在验证集上的表现如何，验证集是我们训练集中的最后48个观察结果。

results = f.export(determine_best_by="TestSetSMAPE")

ms = results["model_summaries"]

ms[

[

"ModelNickname",

"TestSetLength",

"TestSetSMAPE",

"InSampleSMAPE",

]

每个模型的表现都优于naive方法。ARIMA模型表现最好，百分比误差为4.7%，其次是Prophet模型。让我们看看所有的预测与验证集的关系:

f.plot(order_by="TestSetSMAPE",ci=True)

plt.show()

所有这些模型在这个时间序列上的表现都很合理，它们之间没有很大的偏差。下面让我们把它们堆起来!

堆叠模型

每个堆叠模型都需要一个最终估计器，它将过滤其他模型的各种估计，创建一组新的预测。我们将把之前结果与Catboost估计器叠加在一起。Catboost是一个强大的程序，希望它能从每个已经应用的模型中充实出最好的信号。

f.add_signals(

f.history.keys(), # add signals from all previously evaluated models

)

f.add_ar_terms(48)

f.set_estimator("catboost")

上面的代码将来自每个评估模型的预测添加到Forecaster对象中。它称这些预测为“信号”。它们的处理方式与存储在同一对象中的任何其他协变量相同。这里还添加了最后 48 个系列的滞后作为 Catboost 模型可以用来进行预测的附加回归变量。现在让我们调用三种 Catboost 模型：一种使用所有可用信号和滞后，一种仅使用信号，一种仅使用滞后。

f.manual_forecast(

Xvars="all",

call_me="catboost_all_reg",

verbose = False,

)

f.manual_forecast(

Xvars=[x for x in f.get_regressor_names() if x.startswith("AR")],

call_me = "catboost_lags_only",

verbose = False,

)

f.manual_forecast(

Xvars=[x for x in f.get_regressor_names() if not x.startswith("AR")],