仮想的な反事実の分析 として、まず考えられるのが、仮想的な反事実(反実仮想)のデータの分析です。
仮想的な反事実のデータは、実際にはありませんが、前提を上手に置くことで、それに近いデータを取得する方法があります。
マッチング法は 計量経済学 で出て来る方法です。 個々のサンプルについて、事実と反事実以外が近いものついて、「事実と反事実の関係のデータ」として利用します。
近いかどうかを判断する方法として、傾向スコアが提案されています。
なお、Xに相当する変数が複数ある場合は、 傾向スコアが近いというだけで、「事実と反事実の関係のデータ」と見なせるかどうかは、注意が必要かもしれません。
反事実のデータを扱う方法というのは、 欠損値のあるデータの解析 の一種と考えると良いようです。
反事実というのは、事実と同じ数だけあるので、欠損値が半分もあるデータということになります。
上のようなデータがあったとします。
Xが異なる場合に、処置ありの時のYの値Y1と、処置なしの時のYの値Y0のどちらか片方があります。
これに対して、欠損値を補完することで、反事実のデータを加えた例が、下のグラフです。
ここでは、XとYの関係が 単回帰分析 で表せそうなことに着目して、推定値を計算しています。 欠損値補完の方法はいろいろあるので、場合によっては、 他の方法の方が良いかもしれません。
この例は単回帰分析ですが、 機械学習 を応用して、反事実のデータ分析をする方法は、「反実仮想機械学習」と呼ばれています。
順路 次は 反実仮想による因果効果の分析