トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

相関偏相関散布図

相関偏相関分析 のページでは、「相関係数と偏相関係数の小さい値の方が、データの構造の情報になる」という仮説を前提として、 話が進んでいます。

「相関係数と偏相関係数の小さい方だけを見る」という思い切ったことをせずに、 両者を丁寧に確認するのが、このページの方針です。

相関偏相関行列

相関偏相関行列は一般的ではないですが、相関行列や偏相関行列はよく知られていて、Rなどのツールでも簡単に求められます。

相関行列や偏相関行列は、対称行列になっていて、上三角行列と、下三角行列に同じ値が入っています。 データの整理という点では、スペースの無駄な感じです。

相関偏相関行列とは、下三角行列が相関行列、上三角行列が偏相関行列になっている行列です。 逆でも良いのですが、ここでは、この対応とします。

相関偏相関行列にすると、2つの行列の情報が1つにまとまっているので、「データの整理の方法のひとつ」、と筆者は考えています。 ただし、相関係数と偏相関係数は別物なので、数学的な行列の処理が、まったくできない行列です。

相関偏相関散布図

相関偏相関散布図は、横軸が相関係数、縦軸が偏相関係数になっている散布図です。

相関偏相関2乗散布図

相関係数と偏相関係数は、プラスとマイナスの値があります。

変数の関係の強さを知りたい場合は、これらの値を2乗した方が見通しが良くなります。 2乗には、「絶対値の大きさを見る」という目的がありますが、関係の強いところだけを抽出したい場合、 2乗すると、0に近い値ほど極端に小さくなるので便利です。

実施例

correlation
複雑な構造をしたデータです。 矢印の元から先に行く時に、誤差が加わっています。 矢印は、プラスまたはマイナスで足すことを表します。

相関偏相関行列

correlation
緑の三角形が、下三角行列で、相関係数行列から来ています。 残りが、上三角行列で、偏相関行列から来ています。

相関偏相関散布図

correlation
原点付近にたくさん重なっているのは、相関係数も偏相関係数も0に近い変数の組合せです。

相関偏相関2乗散布図

correlation
相関偏相関2乗散布図にすると、プラスの領域だけにプロットが集まります。

correlation
緑で囲ったあたりは、相関係数の2乗は大きく、偏相関係数の2乗は小さいので、疑似相関になっている変数の組合せです。 赤で囲ったあたりは、偏相関係数の2乗は大きく、相関係数の2乗は小さいので、条件付きだと独立にならない変数の組合せです。

ソフト

Rによる相関偏相関散布図 の中に、上記の実施例のコードがあります。




順路 次は 有向相関偏相関分析

データサイエンス教室