以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。
ARMAモデル は、 時系列分析 の代表的なモデルです。 しかし、素直に「代表的」と思えないところがあります。
このページでは、それを説明します。
本題を説明するには、ARモデルとMAモデルの、それぞれについての理解が不可欠なので、それぞれについての説明からです。
ARモデル の説明にあるように、ARモデルは、移動平均を一般化したものです。 「重み付き移動平均」と言います。
一般化することで、直近のサンプルに重みを付けることができます。 また、季節性(周期性)を扱えるようになります。
ベースになる値がゆっくりと変化していて、観測しているのがベースの値に誤差が加わった現象の場合に、ARモデルは予測式になります。
ここで注意点があり、予測ができるかどうかと、現象のメカニズムが実際にその式のようになっているのかは、区別します。
ARモデルでわかるのは、ベースの値の推定値と、誤差の大きさです。 ARモデルでは、これらを使うことで予測ができます。
現象のメカニズムは、ベースになる値が生まれる仕組みです。 ARモデルの式が、メカニズムを表す式にもなっている現象は、筆者は思い当たらないです。
ARモデルで予測の精度が高かったとしても、現象のメカニズムが解明できたわけではないです。 この点を誤解している文献を、時々見かけます。
ARモデルが、メカニズムの式でもあることを確認したいのなら、予測の精度が高いことだけではなく、式と現象の対応を確認する必要があります。
MAモデル の説明にあるように、MAは、「Moving Average:移動平均」の略です。
一般的には、データからノイズを消して、主要な変化を見やすくする方法として、移動平均を使います。 ARモデルは、そうした方法のひとつです。
一方、MAモデルは、「観測したデータ自体が移動平均」という想定をしています。
MAモデルを使うと、観測した移動平均のデータから、移動平均の計算の元になっているデータを推定することができます。
ARモデルは、データから移動平均を求めるので、使う機会があります。
一方、 観測したデータ自体が移動平均になっている事例は、思い当たらないです。 そのため、MAモデルは、「知っていたら、いつか役に立つ時が来るかもしれない」というくらいのモデルです。
ARモデルとMAモデルは、時系列分析の教科書で、「必ず」と言って良いほど、紹介されますが、両者はこの点が大きく違います。
上記のように、MAモデルは、実用性があまりないです。 しかし、単独だけでなく、ARMAやARIMAといった形でも、時系列分析の教科書で定番のモデルです。
この理由ですが、ARMAモデルやARIMAモデルは、数学的な一般化ができるので、多くの研究者を惹きつけたことが理由かもしれません。 現実にそのような現象があるのかとは関係なく、モデル自体の数学的な性質が研究対象になっています。
MAモデルは、「ARMA、ARIMA、SARIMA、ARIMAX」というように、必ず入っています。しかし、実用面から考えるのなら、「呪縛」のような感じです。
そこで、「実務では不要」と割り切ると、SARIMAXモデルの敷居が一気に下がります。
MAを抜いた場合の利点は、 MAレスSARIMAXモデル のページで詳しく説明しています。
ここからが本題です。
ARMAモデル は、ARモデルとMAモデルを合体させたモデルです。
ARモデルは、データから、移動平均を推定するモデルです。 一方、MAモデルは、移動平均をデータとして、移動平均の背後にあるデータを推定するモデルです。
ARモデルとMAモデルは、逆の事象を想定しているのですが、それにも関わらず、ARMAモデルでは両者が合体しています。
「ARMAモデルは、ARモデルが合うデータでも、MAモデルが合うデータでも、対応することができるモデル」という理解の仕方が、おそらく正しいです。
文献によっては、「世の中には、ARとMAの両方が必要なデータがある」というような感じで書かれているものもあるのですが、そういうことはないと思っています。
「ARやMA単独よりも、ARMAの方が精度が高い」ということが、こうした見解を生んでいるようですが、それはおそらく誤解です。 ARMAの方が精度が高い理由は、メカニズムに合うからではなく、変数が増えることで 過学習 になっているからではないかと思います。
