以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。
「相関関係が因果関係を表しているとは限らない」という話題は、統計学の解説書でよく見かけます。
統計的因果推論 では、「相関関係を調べても因果関係の検証にはならないが、統計的因果推論は因果関係の検証になる」と主張しているのですが、誤解を招きやすい話になっています。 統計的因果推論ではどのようなことが説明されていて、どんなことで誤解しやすいのかについて、このページで整理してみました。
まず、「相関関係が因果関係を表しているとは限らない」という理由は2つあります。 こういったことが起こるので、相関関係を調べるだけでは、因果関係の検証にはならないです。
次に、統計的因果推論が因果関係の検証になる理由ですが、一口に「統計的因果推論」といっても、様々な手法があります。 以下では、ランダム化比較試験と、それ以外で分けます。
ランダム化比較試験(「A/Bテスト」とも呼ばれます)は、統計的因果推論では、「最高・最強」の方法として説明されます。
因果関係の検証になる一番の要素は、「試験(実験)」を実際にするところです。 現実にある人や物について、自分で原因をコントロールして得たデータなので、原因によって結果に違いが表れるのなら、それが因果関係の検証になります。
ランダムかどうかを気にせずに実験するよりも、きちんとランダムにした方がより良い実験になります。
統計的因果推論は統計学の一種で、統計学は数学の一種です。 ランダム化比較試験の中の数学的な部分は、「ランダム化」の部分です。 統計学の中には数理統計学のように、数学的な理論を極めていく分野もありますが、統計的因果推論の場合は、数学的な理論だけでなく、 現実に起きていることからデータを集める部分もセットになった分野になっています。
ランダム化比較試験は、専門書があります。 ランダム化比較試験よりも、条件が複雑な場合の実験については、「実験計画法」という名前で多くの専門書があります。
一方、統計的因果推論の専門書は、ランダム化比較試験についての話題が少なめで、試験をしないで因果関係を検証する話題が多めになっている傾向があります。
この方法として、「同じ対象にして、処置ありと処置なしで差があるのなら、それは因果関係がある証拠」とする考え方があります。 処置ありと処置なしの差は、「因果効果」と呼ばれます。
試験をしない統計的因果推論は、様々なデータの中から、「これは因果関係によって起きている」とみなすことができる部分を見つける方法を開発することで発展して来ています。因果関係を定量化する方法として、因果効果という指標を使っています。
誤解しやすいところを説明するための準備ができたので、以下は本題です。
因果効果が因果関係を表しているのは、実験をして得られたデータを使って計算した場合です。
背景のわからないデータから得られた因果効果の場合、疑似相関があるかもしれませんし、たまたま差が大きかったのかもしれないです。
「因果効果」という名前なことと、「処置あり・処置なし」の2条件で実験したデータと似ていることで、誤解を招きやすいようですが、 「相関関係が因果関係を表しているとは限らない」と同じことが、因果効果にも当てはまります。
統計的因果推論の文献では、「相関関係が因果関係を表しているとは限らない」という説明をしてから、ランダム化比較試験なら因果関係の検証ができることを説明をする流れになっていることが多いようです。
ランダム化比較試験は、「処置あり・処置なし」の2条件で実験したデータから因果効果を計算する手順になっています。
そのため、「因果関係を検証するには、「処置あり・処置なし」の2条件のデータを用意しなければならない」、「相関関係のように、連続データ(条件が無数にあるデータ)では、因果関係の検証ができない」という誤解を招きやすいようですが、そんなことはないです。 どのようなデータなのかをきちんと把握しているのなら、相関関係のような連続データでも因果関係の検証はできます。
ちなみに、連続データの場合の因果効果を説明している文献は少ないです。 この場合は、直線の傾き(回帰分析の係数)が因果効果になります。
ランダム化比較試験によって得られたデータで、因果効果が10点だったとします。 因果効果というのは、処置ありと処置なしの平均値の差です。
この「10点」という値が、因果関係があることによって表れたのか、因果関係はないけれどもたまたま表れたのかは、「10点」という数字だけでは区別できないです。
区別するには、データのばらつきを確認します。 例えば、処置なしが「50.1〜53.7点」で、処理ありが「60.2〜63.3点」というように、10点に比べて、それぞれのグループの中でのばらつきが小さいのなら、因果関係によって10点という差になったと考えられます。
厳密に統計的仮説検定をするまでもないこともありますが、少なくともばらつきは確認する必要があります。
統計的因果推論の専門書では、それぞれの手法の特徴について解説していて、データのばらつきについては触れていないことが多いですが、実務でそれらの手法を使う時には、ばらつきの確認も必要です。