トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

条件付き独立になるデータの構造

独立性の検定 をして変数の関係を分析をすると、 相関関係の探索 はできますが、データの構造の非対称性はわかりません。

条件付き独立による探索 をすると、 有向グラフになるデータの構造 が出せるようになります。

条件付きの独立と、因果の関係

下の散布図は、3変数のデータの関係を表しています。 真ん中の図は、データのでき方を示しています。 例えば、ABe1という変数は、A+Bに誤差のe1が加わってできていることを表します。

このデータでは、AB = A + Bという規則がデータの背景にあります。 しかし、観測できるのは、それぞれについて誤差が加わった値だけです。

AB、A、Bの間に原因と結果の関係はなく、単純にAB = A + Bであることを表しているとします。

このようなデータについて、 偏相関係数による分析 をすると、下の一番右のような有向グラフが描けます。

この例は、条件付き独立を調べて有向グラフを作れたとしても、必ずしも因果関係を表していないことを意味しています。

correlation correlation correlation

条件付き独立では、AとBから、ABに矢印が引かれるけれども、因果の向きは逆な例としては、化学が例になりそうです。 例えば、AとBが結合してABができるのなら、因果の向きと、条件付き独立の矢印の向きは同じです。 一方、ABが分離して、AとBができるのなら、矢印の向きは逆になります。






順路 次は 回帰モデルになるデータの構造

データサイエンス教室