トップページ |
ひとつ上のページ |
目次ページ |
このサイトについて | ENGLISH
「 相関 」と言えば、ふつうは「XとYの相関」という感じで、異なる変数の関係を調べますが、 自己相関分析では、基本的にひとつの変数の中だけの話です。 「自己」との相関を調べますので、自己相関分析と言います。
自己相関分析では、Xになるのが、前の測定の値とか、1時間前の値になります。 前の測定データには、さらに前のデータがありますから、 同じ値が、別の値のXになったりYになったりします。
図の折れ線グラフのデータの場合、あるステップの値をX(n)、1つ前のステップの値をX(n-1)として、 X(n)とX(n-1)の2次元散布図を描くと、図の散布図になります。 この散布図では、XとYの 相関性 を見る時と同じようにして、X(n)とX(n-1)の関係を見ています。
自己相関が高いと、相関が高い時と同じように、データが直線状に並んでいます。
自己相関が低いと、散布図からも相関が見られないです。
XとYのように、異なる変数の 相関性 (単相関)の話ではなかったことが、自己相関にはあります。
それは、自己相関が高くなるのは、X(n)とX(n-1)の値が近い場合ということです。
この事を使うと、応用範囲が広がります。
「自己相関が高くなるのは、X(n)とX(n-1)の値が近い」、という事は、
「自己相関が高い = 値がほぼ連続的につながっている」
という意味にもなります。
そこで、自己相関が、連続性の尺度に使えます。
連続性の尺度は、解析しようとしているデータに、時系列の特徴があるのかどうかの確認に使う事もできます。
データに周期性があると、1ステップ前以外の値との自己相関も高いことがあります。
この性質を使うと、n-1、n-2、n-3、、、という風に、順番に検証していくことで、周期を見つけることができます。
例の場合だと、18のステップで、1つの周期になっていると言えます。
「自己相関が高い = 最新のデータが、未来のデータに一番近い」ということになります。 そこで、自己相関が高いことを根拠として予測ができるようになります。
1ステップ前のデータとの自己相関が高いのなら、1ステップ前のデータが予測値です。 1周期前のデータとの自己相関が高いのなら、1周期前のデータが予測値です。
自己相関を根拠にする予測は、 時系列近傍法 の基本です。
ここまでは、ある時点(ステップ)の値と、1つ前のステップの関係を調べる方法として、 自己相関分析を説明しています。
理論は、 単回帰分析 を応用してています。
重回帰分析 を応用した場合もあり、 SARIMAX として開発されて来ています。 ただし、SARIMAXのMAの部分は、一般的な重回帰分析では解けないです。
順路
次は
見せかけの回帰
