トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

偏相関係数による有向相関分析

多変量データの相関分析 で分析できるのは、変数間の無向な関係です。 相関の高い・低いはわかりますが、変数間の向きはわかりません。

一方、 偏相関係数による分析 のページで、相関係数と偏相関係数でわかることが違い、また、向きによってその違いが表れていることがわかります。

このページの「有向相関分析」というのは、 偏相関係数による分析 をヒントにして、筆者が考えた分析方法です。 もしかしたら、 ベイジアンネットワークによるデータの構造解析 として、同じ方法がすでに世の中にあるかもしれないのですが、筆者の知る限りではないようです。 ご存知の方は、ご教示いただけると幸いです。

求め方の糸口

偏相関係数による分析 のページを改めて見ます。

まず、X1が矢印の元の場合や、中間の場合、相関係数と偏相関係数を比べると、X2とX3は、X1を共通にしていることを表しているのは、偏相関係数の方です。 また、偏相関係数の方が絶対値が小さいです。
correlation correlation correlation correlation

一方、X1が矢印の先の場合、相関係数と偏相関係数を比べると、X2とX3が無関係なことを表しているのは、相関係数の方です。 また、相関係数の方が絶対値が小さいです。
correlation correlation correlation

ネットワークグラフ の描き方のルールと、矢印の方向を合わせるのが、方針になりそうなことがわかります。

求め方

弱点

上記の方法は、矢印の中間、元、先にある変数が1個しかない構造の時に、うまく働きます。 複数あることは想定していません。

複数ある場合への対策は、 有向相関偏相関分析 になります。

実施例

出力の行列は、上から順に、相関係数の2乗、偏相関係数の2乗、グラフを描くためのデータです。 数字と、矢印の太さが対応しています。

1つの変数が、矢印の元や中間の場合

correlation correlation correlation

元か中間かは、区別できないため、無向グラフです。

1つの変数が、矢印の先の場合

correlation correlation correlation

ベイジアンネットワークによるデータの構造解析

ベイジアンネットワークによるデータの構造解析 として、世の中では、以前から量的変数から有向グラフを導く方法が考案されています。

条件付き独立かどうか、つまり、偏相関係数からわかる構造を見て、矢印の向きを決めているようです。

このページのように、相関係数と偏相関係数の両方を見る方法は、筆者は見かけたことがないです。

ソフト

Rによる有向相関分析 に、上記の実施例のコードがあります。



条件付き独立になるデータの構造


順路 次は 多重有向相関分析

Tweet データサイエンス教室