「原因は何なのか?」、「原因らしい事がわかったが、本当に原因なのか?」、といった事のための分析は、様々な分野であります。 原因と結果の関係の分析は、「因果関係の分析」や「因果推論」と言います。
この分析では、必ずしもデータらしいデータを扱わない事もありますが、 データサイエンス の役割は大きいです。
仮説というのは、「原因と結果の関係はこうではないか?」、という仮の説です。 科学の世界では、「○○仮説」のような名前で呼ばれている仮説がいろいろあります。
仮説のままでは、本当かどうかはわかりません。 「科学的」と言われるアプローチでは、 仮説が真実であるかどうかを確認します。 これは、「 仮説の検証(実証分析) 」と呼ばれています。
このアプローチでは、仮説をいかにして作るかが重要です。 定性的な仮説の探索 が基本ですが、 定量的な仮説の探索 は、どんどん力を付けて来ています。
このサイトでは、実務の中で起こる様々な因果関係を明らかにして、起きている問題を解決する時に必要な「因果推論」としてまとめています。
因果推論は、統計学の一分野のようにもなっていますが、そこで扱われている因果関係は、 相関関係による仮説の探索 や、 実証分析 になります。 ただ、このアプローチには限界があり、それは、 回帰モデルになるデータの構造 にまとめています。
相関関係による仮説の探索
や
仮説の検証(実証分析)
の内容は、「統計的因果推論」と呼ばれます。
単に「因果推論」と書かれている時は、「統計的因果推論」のことが一般的です。
統計的因果推論とは、「データだけから、因果関係を導き出そうとする研究分野」と言えるようです。
研究分野なので、因果関係が本当に解明できなくても、問題がありません。
一方、実務の上では、因果関係の解明が必須です。
幸い、実務では「データだけ」という前提条件はないので、様々なアプローチを組み合わせて解明を進めます。
例えば、因果関係のメカニズムは、可能な限り詳細になるまで考察をします。
統計的因果推論では、「薬Aは、病気Bを治せるか?」という因果関係の解明をする時に、
薬を飲んだかどうかと、病気が治ったかどうか、という2つの変数しか見ないのが普通です。
場合によっては、もうひとつか、ふたつの変数を増やします。
こういった情報だけで何とかしようとします。
実務でしたら、例えば、「Bという病気は、Cという菌が原因になっていて、Aという薬のDという成分の分子構造が、この菌の表面に触れると、
触れた部分で反応が起きて、表面が解け、菌は生存できなくなる。このため、病気が治る。」といった具体的なメカニズムまで踏み込んでいきます。
そして、このメカニズムが本当に起きるのかといったことを、ひとつひとつ検証していきます。
順路
次は
定性的な仮説の探索