「原因は何なのか?」、「原因らしい事がわかったが、本当に原因なのか?」、といった事のための分析は、様々な分野であります。 原因と結果の関係の分析は、「因果関係の分析」や「因果推論」と言います。
この分析では、必ずしもデータらしいデータを扱わない事もありますが、 データサイエンス の役割は大きいです。
仮説というのは、「原因と結果の関係はこうではないか?」、という仮の説です。 科学の世界では、「○○仮説」のような名前で呼ばれている仮説がいろいろあります。
仮説のままでは、本当かどうかはわかりません。 「科学的」と言われるアプローチでは、 仮説が真実であるかどうかを確認します。 これは、「 仮説の検証(実証分析) 」と呼ばれています。
このアプローチでは、仮説をいかにして作るかが重要です。 定性的な仮説の探索 が基本ですが、 定量的な仮説の探索 は、どんどん力を付けて来ています。
問題解決の手順 では、「要因解析」と呼ばれている段階が因果推論になります。
要因解析の2段階 のページにあるように、「仮説の設定」と「仮説の検証」の2段階に分けます。
このサイトでは、実務の中で起こる様々な因果関係を明らかにして、起きている問題を解決する時に必要な「因果推論」としてまとめています。
単に「因果推論」と書かれている文献は、「統計的因果推論」のことが一般的です。
統計的因果推論とは、「データだけから、因果関係を導き出そうとする研究分野」と言えるようです。
解明のためのプロセスが研究対象になっています。
一方、実務の上では、最終的な因果関係の解明が必須です。
幸い、実務では「データだけ」という前提条件はないので、様々なアプローチを組み合わせて解明を進めます。
例えば、因果関係のメカニズムは、可能な限り詳細になるまで考察をします。
統計的因果推論では、「薬Aは、病気Bを治せるか?」という因果関係の解明をする時に、
薬を飲んだかどうかと、病気が治ったかどうか、という2つの変数しか見ないのが普通です。
場合によっては、もうひとつか、ふたつの変数を増やします。
こういった情報だけで何とかしようとします。
実務でしたら、例えば、「Bという病気は、Cという菌が原因になっていて、Aという薬のDという成分の分子構造が、この菌の表面に触れると、
触れた部分で反応が起きて、表面が解け、菌は生存できなくなる。このため、病気が治る。」といった具体的なメカニズムまで踏み込んでいきます。
そして、このメカニズムが本当に起きるのかといったことを、ひとつひとつ検証していきます。
「因果推論 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ」 金本拓 著 オーム社 2024
このサイトの分類では、計量経済学、反実仮想機械学習、条件付き独立になるデータの構造の内容が、コンパクトにまとまっています。
順路 次は 定性的な仮説の探索