トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

条件付き独立になるデータの構造

独立性の検定 をして変数の関係を分析をすると、 相関関係の探索 はできますが、データの構造の非対称性はわかりません。

「条件付き独立」について調べると、 有向グラフになるデータの構造 が出せるようになります。

条件付きの独立と、有向グラフの関係(質的変数)

AとBという質的データの変数が独立している場合、例えば、 分割表 は、下のようになります。 度数にあまり偏りがありません。
BN

AとBという質的データの変数が独立していて、 AとBが条件付きでも独立している場合は、例えば下図になります。 この場合は、度数にあまり偏りがありません。
BN

AとBという質的データの変数が独立していて、 AとBが条件付きでは独立しない場合は、例えば下の2つの例になります。 この場合は、度数が偏っています。
BN BN

条件付きでは独立しない場合、有向グラフは下図になります。 AとBという変数同士は独立しているので、AとBの間には線がありません。
BN

量的変数の場合

上記の考え方は、量的変数にも応用できます。

2つの変数を見ているだけだと独立なのに、第3の変数も加えると、独立していないように見える性質は、 偏相関係数による分析 で調べられます。

条件付きの独立を網羅的に調べる方法

変数がたくさんある時に、条件付き独立の関係を探索的に調べて、有向グラフを作る方法は、 ベイジアンネットワークによるデータの構造解析 として、多くのアルゴリズムが考案されています。

条件付きの独立と、因果の関係

下の散布図は、3変数のデータの関係を表しています。 真ん中の図は、データのでき方を示しています。 例えば、ABe1という変数は、A+Bに誤差のe1が加わってできていることを表します。

このデータでは、AB = A + Bという規則がデータの背景にあります。 しかし、観測できるのは、それぞれについて誤差が加わった値だけです。

AB、A、Bの間に原因と結果の関係はなく、単純にAB = A + Bであることを表しているとします。

このようなデータについて、 偏相関係数による分析 をすると、下の一番右のような有向グラフが描けます。

この例は、条件付き独立を調べて有向グラフを作れたとしても、必ずしも因果関係を表していないことを意味しています。

correlation correlation correlation

条件付き独立では、AとBから、ABに矢印が引かれるけれども、因果の向きは逆な例としては、化学が例になりそうです。 例えば、AとBが結合してABができるのなら、因果の向きと、条件付き独立の矢印の向きは同じです。 一方、ABが分離して、AとBができるのなら、矢印の向きは逆になります。



偏相関係数による分析

参考文献

つくりながら学ぶ! Pythonによる因果分析 因果推論・因果探索の実践入門」 小川雄太郎 著 マイナビ出版 2020
条件付き独立だと、有向グラフは1通りに決まる説明があります。





順路 次は 回帰モデルになるデータの構造

Tweet データサイエンス教室