上の図は、X、Y、Zの関係を表しています。
知りたいのは、ZとYの関係です。 例えば、Zが処置あり・なしの時に、Yが効果あり・なしのどちらになるのかを知りたいです。
ところが、Xの影響でZが変わるので、YとZのデータだけで「相関あり」となったとしても、本当は、Xが原因で、Zは関係ないかもしれません。 これは擬似相関です。
d分離は、介入という操作をすることによって、
第3変数の除去
をする方法です。
例えば、「もしもXの影響を受けずに、Zが処置ありだったら、Yはどうなるか」という仮想的な状況を考えます。 「もしもXの影響を受けずに」という操作が介入です。
「因果推論の科学 「なぜ?」の問いにどう答えるか」 ジューディア・パール、ダナ・マッケンジー 著 文藝春秋 2022
d分離が詳しく書かれています。
「つくりながら学ぶ! Pythonによる因果分析 因果推論・因果探索の実践入門」 小川雄太郎 著 マイナビ出版 2020
d分離として、回帰分析による方法、傾向スコアを使う方法を紹介しています。
回帰分析による方法というのは、Yの説明変数に、XとZを入れる方法です。
このモデルを使うと、XからZへのドアは閉じられています。
順路 次は 傾向スコア