トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

因果関係があるなら、原因と考えているイベントは、結果と考えているイベントよりも前に発生しているはず。 このデータでは、 原因と結果の起きたタイミングを見た時に、原因が結果の前に起きることもあるし、 反対に結果の方が前に起きることもあるから、因果関係の仮説は正しくないのでは?
因果の時間差

A(ご回答)

仮説は間違いかもしれません。しかし、正しい可能性も、まだ残っています。 時刻のデータがどのように記録されているのかを、確認する必要があります。

補足

因果の時間差 のページにもありますが、 原因と結果の関係を考えた時に、「結果の方が後」と考えるのは常識です。 因果推論時系列解析 では、この常識で仮説の検証をしたり、理論を作ったりしています。

しかし、現実の世界では起きていなくても、データの世界では、「結果の方が時刻が前」ということが起きることがあります。

例えば、「機械を操作したのが8:00。不良品ができたのが7:59」だとします。

時刻の前後関係からは、 「不良品ができたから、機械を操作したのかな?」とは考えられても、 「機械を操作したから、不良品ができた」とは考えられないです。

しかし、実際のデータ分析では、 「機械を操作したから、不良品ができた」という現象が正しくても、 「機械を操作したのが8:00。不良品ができたのが7:59」ということはありえます。

結果の方が時刻が前になる原因

「結果の方が時刻が前」が起きる原因としては、以下のようなことがあります。

データ分析の方向づけの仕方

経験的には、「原因かもしれない」と思っていることが、結果よりも1時間や1日たった後に起きているのなら、因果関係の仮説が間違っている可能性が高いです。

しかし、このページの冒頭の質問のように、「結果よりも原因が後」と「結果よりも原因が前」の両方が起きている時や、 1分間隔で記録しているデータなら、結果よりも数分たった後に、原因かもしれないことが起きているのなら、仮説は正しい可能性があります。

時刻データの前後関係では、仮説の正しさが検証できていませんので、この後の分析では、 データが記録される仕組みを原因系と結果系の両方で調べる必要があります。 けっこう大変です。


Tweet データサイエンス教室