杉原データサイエンス事務所のロゴ トップページ | 統計学の解釈学 | このサイトについて

時系列予測モデルの比較

以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。


このサイトの 時系列近傍法 は、主な使い道が予測です。 それぞれの手法のページで、得意・不得意について説明しています。 実際のところ、どのような違いがあるのかを、このページでは具体例で説明します。

比較の仕方

250個のサンプルからできている時系列データを作ります。 1番から200番までのデータでモデルを作り、201番から250番までを予測します。 作成したデータの201番から250番までが、"正解"になるので、どのくらい正解に近いのかを比較します。

比較するのは、以下の手法です。

現実にもありそうなデータによる比較

現実にもありそうなデータを作成して、比較します。

全体が一定の場合

平均が一定のように見えるので、 ホワイトノイズモデル が最適なデータに、他の手法を使った場合の結果です。

RWと移動平均以外は、大差ないです。 ホワイトノイズモデル とほぼ同じで、平均値の「50」に近い値が出ています。
時系列予測モデルの比較

直線的なトレンドがある場合

トレンドを予測できているのは、1次式とETSです。

移動平均とRWは、学習データの最後の方の延長として予測しています。 AR(1)とAR(3)は、学習データ全体の平均値に収束しています。
時系列予測モデルの比較

曲線的なトレンドがある場合

曲線的なトレンドがある場合について、ETSの振る舞いが異なる場合を2例紹介します。 いずれにしても、多項式以外の方法は適していません。

曲線的なトレンドの場合、3次多項式は正解に近い予測をしています。 ETSは、上昇傾向を捉えられているものの、「予測できている」と言えるような感じではありません。
時系列予測モデルの比較

3次多項式だけが、望ましい予測をしています。
時系列予測モデルの比較

周期的な場合

このデータの場合は、周期が24であることがわかっているので、S(24)をSモデルにしています。

ETSとS(24)だけが、周期性を予測できています。
時系列予測モデルの比較

どのモデルでも長期的な予測が不可能な場合

250番目までの予測が、どのモデルでも不可能な場合を2例紹介します。

ある程度は連続性があるので、長期的な予測はできていませんが、201番目くらいの直近の予測なら、そんなに大きくは外していません。

まず、大きく振動していますが、決まった周期は見られない場合です。 周期がわからないので、Sモデルは試していません。
時系列予測モデルの比較

ランダムウォークのような動きの場合です。
時系列予測モデルの比較

ARモデルで良い予測ができる場合

上記では、全体が一定の場合を除いて、移動平均、RW、AR(1)、AR(3)は良いところがありませんでした。

特殊なケースに限られますが、 AR(1)と、AR(3)については、良い予測ができる場合があるので紹介します。

直線の場合

データが直線的に並んでいる場合、上記で紹介したように、ばらつきがある場合は、1次式やETSでないと予測ができません。

しかし、ばらつきがまったくない直線の場合は、AR(1)やAR(3)でも、予測ができます。
時系列予測モデルの比較

3次曲線の場合

データが3次曲線のように並んでいる場合、上記で紹介したように、ばらつきがある場合は、3次多項式でないと予測ができません。

しかし、ばらつきがまったくない曲線の場合は、AR(3)でも、予測ができます。
時系列予測モデルの比較

周期曲線の場合

データに周期性がある場合、上記では、ETSとSモデルしか、周期性を捉えられませんでした。

しかし、ばらつきがまったくない場合は、AR(3)でも、予測ができます。
時系列予測モデルの比較

以下は、AR(3)とS(20)だけのグラフです。 AR(3)の方が、S(20)よりも正解に近いです。
時系列予測モデルの比較




杉原データサイエンス事務所のロゴ
杉原データサイエンス事務所によるコンサルティングとセミナー