トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

反実仮想データの取得

仮想的な反事実の分析 として、まず考えられるのが、仮想的な反事実(反実仮想)のデータの分析です。

仮想的な反事実のデータは、実際にはありませんが、前提を上手に置くことで、それに近いデータを取得する方法があります。

マッチング法

マッチング法は 計量経済学 で出て来る方法です。 個々のサンプルについて、事実と反事実以外が近いものついて、「事実と反事実の関係のデータ」として利用します。

近いかどうかを判断する方法として、傾向スコアが提案されています。

なお、Xに相当する変数が複数ある場合は、 傾向スコアが近いというだけで、「事実と反事実の関係のデータ」と見なせるかどうかは、注意が必要かもしれません。

欠損値補完による反事実の推定(反実仮想機械学習)

反事実のデータを扱う方法というのは、 欠損値のあるデータの解析 の一種と考えると良いようです。

反事実というのは、事実と同じ数だけあるので、欠損値が半分もあるデータということになります。

causal_effect
上のようなデータがあったとします。 Xが異なる場合に、処置ありの時のYの値Y1と、処置なしの時のYの値Y0のどちらか片方があります。

これに対して、欠損値を補完することで、反事実のデータを加えた例が、下のグラフです。
causal_effect

ここでは、XとYの関係が 単回帰分析 で表せそうなことに着目して、推定値を計算しています。 欠損値補完の方法はいろいろあるので、場合によっては、 他の方法の方が良いかもしれません。

この例は単回帰分析ですが、 機械学習 を応用して、反事実のデータ分析をする方法は、「反実仮想機械学習」と呼ばれています。




順路 次は 反実仮想による因果効果の分析

データサイエンス教室