トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

コウザルフォレスト

コウザルフォレストは、 反実仮想機械学習 の一種です。

処置ありと、処置なしの時のYを予測するモデルを ランダムフォレスト で作ります。

あるサンプル(X)の時のYを、このモデルを使って求め、差を計算すると、因果効果の値になります。

ランダムフォレストを使う利点

反実仮想機械学習 は、 回帰分析 でもできますが、回帰分析では、XとYの関係がシンプルな数式で表せることが前提になります。

その前提が当てはまらない時の対策が、 決定木 です。 ランダムフォレスト は、雑多で大量のデータの扱いに適しています。



参考文献

データサイエンスの経済学 調査・実験,因果推論・機械学習が拓く行動経済学」 依田高典 著 岩波書店  2023
第5章がコウザル・フォレストになっています。


因果性と異質性の経済学A Causal Forest」 石原卓典・依田高典 著 京都大学大学院経済学研究科ディスカッションペーパーシリーズ  2020
24ページでコウザルフォレストが端的に解説されています。
https://www.econ.kyoto-u.ac.jp/dp/papers/j-20-004.pdf


ランダムフォレストによる因果推論」 中村知繁 著 慶應義塾大学  2020
研究されて来た順番としては、Regression tree(回帰木
→ Causal tree(因果木)
→ Causal forest(コウザルフォレスト:因果森)
→ Generalized random forest(GRF:一般化ランダムフォレスト)
となっています。 Causal treeの段階で、回帰木が、CATE(conditional average treatment effec:条件付き平均処置効果)の最適化問題として改良されています。
https://ies.keio.ac.jp/upload/20201201econo_nakamura_Slide.pdf


つくりながら学ぶ! Pythonによる因果分析 因果推論・因果探索の実践入門」 小川雄太郎 著 マイナビ出版 2020
因果効果の分析方法として、 ランダムフォレスト を使うものを紹介しています。
この本では、「コウザルフォレスト」という呼び方をしていないのですが、コウザルフォレストの提唱者によるコウザルフォレストは、予測したいサンプルのデータは、モデルの作成に入れないという工夫(honest性)も含めてコウザルフォレストとしているからではないかと思います。 また、この本では、 T-LernerとS-Lerner の両方について、実施例を紹介していますが、提唱者によるコウザルフォレストはS-Lernerのみのようです。



順路 次は 第3変数の除去

データサイエンス教室