トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

自己単相関分析

自己相関分析 の一番簡単な形は、ある時点(ステップ)の値と、1つ前のステップの関係を調べる場合です。 ここでは、 「自己相関分析」と呼ぶことにします。

単回帰分析 ではできない事が、 重回帰分析 ではできます。 しかし、 データに対してシンプルな見方をするので、 単回帰分析 の方が、データ解析のいろいろな場面で使われます。

これと同じ事が、 自己相関分析 にも当てはまります。 たしかに、 ARモデルとその発展形 を使わないとできない分析はあります。 しかし、自己単相関分析の理論は、使い道がいろいろあります。

自己単相関の調べ方

図の折れ線グラフのデータの場合、あるステップの値をX(n)、1つ前のステップの値をX(n-1)として、 X(n)とX(n-1)の2次元散布図を描くと、図の散布図になります。 この散布図では、XとYの 相関性 を見る時と同じようにして、X(n)とX(n-1)の関係を見ています。

自己相関が高いと、相関が高い時と同じように、データが直線状に並んでいます。
自己相関

自己相関が低いと、散布図からも相関が見られないです。
自己相関

尺度としての自己相関

XとYのように、異なる変数の 相関性 (単相関)の話ではなかったことが、自己単相関にはあります。

それは、自己単相関が高くなるのは、X(n)とX(n-1)の値が近い場合ということです。

この事を使うと、応用範囲が広がります。

連続性の尺度として

「自己単相関が高くなるのは、X(n)とX(n-1)の値が近い」、という事は、
「自己単相関が高い = 値がほぼ連続的につながっている」
という意味にもなります。 そこで、自己相関が、連続性の尺度に使えます。

連続性の尺度は、解析しようとしているデータに、時系列の特徴があるのかどうかの確認に使う事もできます。

また、連続性があるのなら、X(n+1)が未知のデータの時に、この値の予測値としてX(n)の値を使う方法があります。

日常の中での予測では、
「最近、上昇傾向だから、次も上に行く可能性が高いのでは?」や、
「最近、上昇が続いたから、次は下に行く可能性が高いのでは?」、
というように考えることが多いと思います。

しかし、この予測の方法は、直前の値を参照するだけで、「最近の傾向」という見方はしていません。 自己単相関分析 を知っていると、グラフを眺めて根拠のない予測をするよりも、精度が高くて簡単な予測ができます。

なお、このような予測をする時は、 ランダムウォークモデル になっているかを一度確認すると良いです。

周期性の尺度として

データに周期性があると、1ステップ前以外の値との自己相関も高いことがあります。

この性質を使うと、n-1、n-2、n-3、、、という風に、順番に検証していくことで、周期を見つけることができます。 例の場合だと、18のステップで、1つの周期になっていると言えます。
自己相関



順路 次は ARモデルとその発展形

Tweet データサイエンス教室