トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

尺度としての自己相関

単回帰分析 ではできない事が、 重回帰分析 ではできます。

しかし、 データに対してシンプルな見方をするので、 単回帰分析 の方が、データ解析のいろいろな場面で使われます。

これと同じ事が、 自己相関分析 にも当てはまります。 たしかに、 ARモデルとその発展形 を使わないとできない分析はあります。 しかし、 自己単相関分析 の理論は、使い道がいろいろあります。

自己単相関の高さの意味

XとYのように、異なる変数の 相関性 (単相関)の話ではなかったことが、自己単相関にはあります。

それは、自己単相関が高くなるのは、X(n)とX(n-1)の値が近い場合ということです。

この事を使うと、応用範囲が広がります。

連続性の尺度として

「自己単相関が高くなるのは、X(n)とX(n-1)の値が近い」、という事は、
「自己単相関が高い = 値がほぼ連続的につながっている」
という意味にもなります。 そこで、自己相関が、連続性の尺度に使えます。

連続性の尺度は、解析しようとしているデータに、時系列の特徴があるのかどうかの確認に使う事もできます。

予測の方法として

自己相関が高ければ
「最新の値を、次の値の予測値にする」
、というデータの使い方もできます。

なお、この予測の方法が役に立つかどうかは、データの間隔と扱いたい現象の関係が重要です。 例えば、1秒間隔のデータの場合には、「1秒前に予測値がわかっても、対策が間に合わない」となってしまう可能性があります。

反対に、自己相関が低ければ
「長期間のデータの平均値を、次の値の予測値にする」
と、できる事があります。

自己相関の高さによって、予測値に使うべきデータが変わって来るのがポイントです。 これを間違えると、非常に精度の低い予測になりかねませんので、注意が必要です。

ところで、
日常の中での予測では、
「最近、上昇傾向だから、次も上に行く可能性が高いのでは?」や、
「最近、上昇が続いたから、次は下に行く可能性が高いのでは?」、
というように考えることが多いと思います。

しかし、上記の予測の方法は、「最近の傾向」という見方はしていません。 しかも、いずれも予測値の出し方が簡単です。 自己単相関分析 を知っていると、グラフを眺めて根拠のない予測をするよりも、精度が高くて簡単な予測ができます。

なお、根拠があるのでしたら、「最近の傾向」を使った予測が良いこともあります。

ひとつ前以外の値との自己単相関分析

自己相関

右の図の周期的なデータの場合、X(n)とX(n-1)の相関が高いだけでなく、 X(n)とX(n-18)の相関も高いです。

そのため、 X(n) = X(n-18) + Error
という表現もできます。

周期性の尺度として

データに周期性があると、1ステップ前以外の値との自己相関も高いことがあります。

この性質を使うと、n-1、n-2、n-3、、、という風に、順番に検証していくことで、周期を見つけることができます。 例の場合だと、18のステップで、1つの周期になっていると言えます。




順路 次は ARモデルとその発展形

Tweet データサイエンス教室