独立性の検定 をして変数の関係を分析をすると、 相関関係の探索 はできますが、データの構造の非対称性はわかりません。
「条件付き独立」について調べると、 有向グラフになるデータの構造 が出せるようになります。
AとBという質的データの変数が独立している場合、例えば、
分割表
は、下のようになります。
度数にあまり偏りがありません。
AとBという質的データの変数が独立していて、
AとBが条件付きでも独立している場合は、例えば下図になります。
この場合は、度数にあまり偏りがありません。
AとBという質的データの変数が独立していて、
AとBが条件付きでは独立しない場合は、例えば下の2つの例になります。
この場合は、度数が偏っています。
条件付きでは独立しない場合、有向グラフは下図になります。
AとBという変数同士は独立しているので、AとBの間には線がありません。
上記の考え方は、量的変数にも応用できます。
2つの変数を見ているだけだと独立なのに、第3の変数も加えると、独立していないように見える性質は、 偏相関係数による分析 で調べられます。
ベイジアンネットワークによるデータの構造解析 にも書きましたが、変数がたくさんある時に、条件付き独立の関係を探索的に調べて、有向グラフを作る方法は、ボトムアップのアプローチです。
まず、2変数同士の独立性を調べて、独立の有無を調べます。
次に、3変数以上について、条件付き独立を調べて、2変数の調査では、「独立していない」となっていないとなった部分を切るかどうかを決めます。 合わせて、わかる範囲で矢印の方向も調べます。
条件付き独立になるデータの構造 には、因果関係に条件付き独立を使う場合の考え方をまとめています。
「つくりながら学ぶ! Pythonによる因果分析 因果推論・因果探索の実践入門」 小川雄太郎 著 マイナビ出版 2020
条件付き独立だと、有向グラフは1通りに決まる説明があります。
順路 次は スコアによる条件付き確率の探索