自己相関分析 の一番簡単な形は、ある時点(ステップ)の値と、1つ前のステップの関係を調べる場合です。 ここでは、 「自己単相関分析」と呼ぶことにします。
単回帰分析 ではできない事が、 重回帰分析 ではできます。 しかし、 データに対してシンプルな見方をするので、 単回帰分析 の方が、データ解析のいろいろな場面で使われます。
これと同じ事が、 自己相関分析 にも当てはまります。 たしかに、 ARモデルとその発展形 を使わないとできない分析はあります。 しかし、自己単相関分析の理論は、使い道がいろいろあります。
図の折れ線グラフのデータの場合、あるステップの値をX(n)、1つ前のステップの値をX(n-1)として、 X(n)とX(n-1)の2次元散布図を描くと、図の散布図になります。 この散布図では、XとYの 相関性 を見る時と同じようにして、X(n)とX(n-1)の関係を見ています。
自己相関が高いと、相関が高い時と同じように、データが直線状に並んでいます。
自己相関が低いと、散布図からも相関が見られないです。
XとYのように、異なる変数の 相関性 (単相関)の話ではなかったことが、自己単相関にはあります。
それは、自己単相関が高くなるのは、X(n)とX(n-1)の値が近い場合ということです。
この事を使うと、応用範囲が広がります。
「自己単相関が高くなるのは、X(n)とX(n-1)の値が近い」、という事は、
「自己単相関が高い = 値がほぼ連続的につながっている」
という意味にもなります。
そこで、自己相関が、連続性の尺度に使えます。
連続性の尺度は、解析しようとしているデータに、時系列の特徴があるのかどうかの確認に使う事もできます。
また、連続性があるのなら、X(n+1)が未知のデータの時に、この値の予測値としてX(n)の値を使う方法があります。
日常の中での予測では、
「最近、上昇傾向だから、次も上に行く可能性が高いのでは?」や、
「最近、上昇が続いたから、次は下に行く可能性が高いのでは?」、
というように考えることが多いと思います。
しかし、この予測の方法は、直前の値を参照するだけで、「最近の傾向」という見方はしていません。 自己単相関分析 を知っていると、グラフを眺めて根拠のない予測をするよりも、精度が高くて簡単な予測ができます。
なお、このような予測をする時は、 ランダムウォークモデル になっているかを一度確認すると良いです。
データに周期性があると、1ステップ前以外の値との自己相関も高いことがあります。
この性質を使うと、n-1、n-2、n-3、、、という風に、順番に検証していくことで、周期を見つけることができます。
例の場合だと、18のステップで、1つの周期になっていると言えます。
順路 次は ARモデルとその発展形