ARI因果効果モデル は、 時系列解析 の ARIMAモデル を転用して、 因果効果 を扱えるようにしたモデルです。
このページは、このアイディアをさらに進めてみたものです。
下の式が、一般化因果効果モデルです。
Y1とY0の差分が因果効果です。
目的変数が、因果効果になっているところは、 ARI因果効果モデル と同じです。 因果の有無を、因果効果という量で評価します。
また、 ARI因果効果モデル と同じく、右辺のf()の中に、Y0が含んでいます。 Y1とY0が、右と左のように同等のものなら、不要かもしれませんが、Y0が「基準」や「現状」と言えるようなもの場合、入れて置いた方が良い変数になります。
ARI因果効果モデル と違うのは、f()の中にXが入っている点です。 Xは、原因系と考えている変数で、1個とは限らないです。
機械学習 の一般的なモデルは、Y1やY0の片方を目的変数としてモデルを作るので、 Y1-Y0を目的変数とする発想はしていません。
一般化因果効果モデルは、Y1-Y0には、「因果効果」という意味があるものとして、モデルを作っています。
また、式の右辺と左辺の両方にY0が入るようなモデルの作り方は、普通はしないです。
仮想的な反事実の分析 のように 事実と反事実の分析 では、反事実のデータはない場合があります。
上記の一般化因果効果モデルは、事実と反事実の両方のデータがそろっていることを前提としているので、反事実のデータがなければ使えません。
そのような場合、 T-lerner で、反事実のデータを推定するという作業を前処理として行う方法が考えられます。
T-lernerやS-lerner は、Y1やY0についての式が求まります。 そのため、反事実のデータ(Y1とY0のいずれか)がないサンプルについて、因果効果の値(Y1-Y0)を計算できるようになります。
しかし、因果効果のY1-Y0の式が求まる訳ではないので、 「結局のところ因果効果はどのようなモデルで考えれば良いのか?」という疑問には答えられないです。
一般化因果効果モデルは、この疑問に答えるモデルになります。
T-lernerとうまく組み合わせると、 反事実のデータが存在しないケースでも、一般化因果効果モデルは作れます。
順路 次は 仮想的な反事実の分析