トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

条件付き独立になるデータの構造

独立性の検定 をして変数の関係を分析をすると、 相関関係による仮説の探索 はできますが、データの構造の非対称性はわかりません。

「条件付き独立」について調べると、 有向グラフになるデータの構造 が出せるようになります。

条件付きの独立と、有向グラフの関係

AとBという質的データの変数が独立している場合、例えば、 分割表 は、下のようになります。 度数にあまり偏りがありません。
BN

AとBという質的データの変数が独立していて、 AとBが条件付きでも独立している場合は、例えば下図になります。 この場合は、度数にあまり偏りがありません。
BN

AとBという質的データの変数が独立していて、 AとBが条件付きでは独立しない場合は、例えば下の2つの例になります。 この場合は、度数が偏っています。
BN BN

条件付きでは独立しない場合、有向グラフは下図になります。 AとBという変数同士は独立しているので、AとBの間には線がありません。
BN

条件付きの独立を網羅的に調べる方法

ベイジアンネットワークによるデータの構造解析 は、変数がたくさんある時に、条件付き独立の関係を網羅的に調べて、有向グラフを作るようになっています。



参考文献

つくりながら学ぶ! Pythonによる因果分析 因果推論・因果探索の実践入門」 小川雄太郎 著 マイナビ出版 2020
条件付き独立だと、有向グラフは1通りに決まる説明があります。





順路 次は 回帰モデルになるデータの構造

Tweet データサイエンス教室