相関偏相関分析 のページでは、「相関係数と偏相関係数の小さい値の方が、データの構造の情報になる」という仮説を前提として、 話が進んでいます。
「相関係数と偏相関係数の小さい方だけを見る」という思い切ったことをせずに、 両者を丁寧に確認するのが、このページの方針です。
相関偏相関行列は一般的ではないですが、相関行列や偏相関行列はよく知られていて、Rなどのツールでも簡単に求められます。
相関行列や偏相関行列は、対称行列になっていて、上三角行列と、下三角行列に同じ値が入っています。 データの整理という点では、スペースの無駄な感じです。
相関偏相関行列とは、下三角行列が相関行列、上三角行列が偏相関行列になっている行列です。 逆でも良いのですが、ここでは、この対応とします。
相関偏相関行列にすると、2つの行列の情報が1つにまとまっているので、「データの整理の方法のひとつ」、と筆者は考えています。 ただし、相関係数と偏相関係数は別物なので、数学的な行列の処理が、まったくできない行列です。
相関偏相関散布図は、横軸が相関係数、縦軸が偏相関係数になっている散布図です。
相関係数と偏相関係数は、プラスとマイナスの値があります。
変数の関係の強さを知りたい場合は、これらの値を2乗した方が見通しが良くなります。 2乗には、「絶対値の大きさを見る」という目的がありますが、関係の強いところだけを抽出したい場合、 2乗すると、0に近い値ほど極端に小さくなるので便利です。
複雑な構造をしたデータです。
矢印の元から先に行く時に、誤差が加わっています。
矢印は、プラスまたはマイナスで足すことを表します。
緑の三角形が、下三角行列で、相関係数行列から来ています。
残りが、上三角行列で、偏相関行列から来ています。
原点付近にたくさん重なっているのは、相関係数も偏相関係数も0に近い変数の組合せです。
相関偏相関2乗散布図にすると、プラスの領域だけにプロットが集まります。
緑で囲ったあたりは、相関係数の2乗は大きく、偏相関係数の2乗は小さいので、疑似相関になっている変数の組合せです。
赤で囲ったあたりは、偏相関係数の2乗は大きく、相関係数の2乗は小さいので、条件付きだと独立にならない変数の組合せです。
Rによる相関偏相関散布図 の中に、上記の実施例のコードがあります。
順路 次は 有向相関偏相関分析