トップページ |
統計学の解釈学 |
このサイトについて
以下は、筆者の私見です。 誤解があれば、ご教示いただけると幸いです。
統計的因果推論 では、「有向グラフ」と呼ばれている、矢印を使った図が出て来ます。 この矢印について、「因果関係を表している」と説明されることがあるのですが、間違っていることがあります。
このページでは、どんな時に因果関係を表していて、どんな時にそうではないのかを整理しています。
矢印が因果関係を表している場合は、2つあります。
例えば、料理なら、材料の量や品質、調理方法、等が原因で、味や見た目が結果なことは、わかっているので、因果関係を矢印で表すことができます。
製造プロセスや、化学現象などでも、同じように矢印を使った図を使えます。
「因果関係はこうではないか?」と、仮説を表現したい時に、矢印を使った図は便利です。
例えば、故障が起きた時に、原因や原因同士の因果関係について、考察したのが下の図です。
この図は、あくまで仮説なので、この後に、どれが本当なのかや、抜けていることがないのかを確認する必要があります。
この図が、「既にわかっている因果関係を表した」と、「因果関係の仮説を表した」のいずれなのかは、当事者以外は区別できないことがあるので、人に見せる場合は、説明の仕方に注意が必要です。 なお、書いた本人が、混同していることもあるので、説明される側の人も、注意して聞いた方が良いです。
有向グラフを作る方法は、「因果探索」と呼ばれています。 因果探索のツールは、自動的に分析して、有向グラフを出力します。
有向グラフを見ると、それが何を表しているのかに関わらず、「因果関係を表す図だ」や、「因果関係の仮説を表す図だ」と思う人が少なくないようです。
有向グラフになるデータの構造 で説明していますが、有向グラフは、何らかの非対称性に対して、矢印の向きを決めて作ります。
扱っている因果関係と、矢印の定義が合うのなら、有向グラフは因果関係を表す図になります。 しかし、筆者の経験する限りでは、そうなったことはないです。
例えば、毎回、「1、2、3」のどれかの目盛りに合わせて調節していたとします。 その場合、目盛りの値が原因で、調整後の値が結果です。 そして、調整後の値は、0〜4くらいの範囲に、連続的にばらつくとします。 この例の場合は、「原因よりも結果の方が、ばらつく」となっています。
では、内容のわからない変数が2つあって、片方のばらつきが大きかった場合、「原因と結果を特定できる」と言えるでしょうか? 2つの変数には、因果関係がないかもしれません。 また、因果関係があったとしても、ばらつきが大きい方が原因かもしれません。 さらには、ばらつきが大きい方が結果だとしても、2つの変数の因果関係は、ばらつきとは無関係かもしれません。
これらの可能性があるので、何らかの定義によって、有向グラフを作れたとしても、矢印の向きが因果関係の向きを表しているとは限らないです。 因果関係の矢印は、向きが逆かもしれませんし、矢印がつかなかったところに、本当の因果関係があるかもしれません。
因果推論の専門家の立場では、「因果関係を定義して、その定義に当てはまるのだから、これは因果関係。 因果探索の手法は、データから因果関係を見つけられる」となります。
実務家の立場では、 「因果関係のメカニズムがどうなっているのか」、 「そのメカニズムは、データに表れているのか」、 「データに表れているのなら、どのようにして表れれているのか」という点が、合って来ないと「因果関係がデータからわかった」とはなりません。
そのため、因果推論の文献は、専門家の立場で書かれることが多いので、実務で活用したい場合は、注意が必要です。
