トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

相関関係と因果関係

「相関関係と因果関係は違う」とは、よく言われる事です。しかし、そうは言っても、相関関係は定量的な仮説の探索の強力なヒントになる事が多いです。

相関関係として一番わかりやすいのは相関性と相関係数ですが、質的なデータの相関性もあります。

相関関係がある事から、因果関係のヒントを見つける

相関関係が見つかった場合は、その後の進め方が分かれます。場合分けしてから、現象の考察や次の解析に進みます。

①原因と結果の関係がある場合
②共通の原因がある場合（疑似相関）
③たまたまの場合

この考察は、データの背景をよく知らない人だけで進めると、行き詰まったり、見落としをしたりします。その場合は、深く関わっている人に協力してもらうと、深い考察ができることがあります。原因の原因があることに気付くこともあります。

②共通の原因がある場合

②の共通の原因は、「時間」や「空間（位置・場所）」との相関もあることを確認してみると良いです。それが突破口になることがあります。

③たまたまの場合

③の「たまたま」ですが、データのサンプリングによって、本来、相関がないのに相関があるような結果が出ることがあります。

この場合は、相関関係がない時の探索になって来ます。

参考文献

「SPSSクレメンタインによるデータマイニング」　牛田一雄・高井勉・木暮大輔　著　東京図書　2003
データマイニングの本ですが、多くのデータマイニングの本のようにマーケティング関係ではなく、工場の原因解析にデータマイニングを使う話を紹介しています。

「統計学が最強の学問である[実践編]　データ分析のための思想と方法」　西内啓著　ダイヤモンド社　2014
因果関係を洞察するための手段としての統計学の使い方を解説している本です。
回帰分析、ロジスティック回帰分析、因子分析、クラスター分析は、因果関係の仮説を見つけるための手段としています。
因果関係の検証の方法としては、ランダムサンプリングによる実験を挙げています。

「社会科学のリサーチ・デザイン　定性的研究における科学的推論」　G.キング、R.O.コヘイン、S.ヴァーバ　著　勁草書房　2004
副題が「定性的研究における」となっているのですが、内容は定量的な研究の話が多いです。統計的な因果推論や誤差について、統計学的な考え方を説明しています。
この本では、定量的な分析方法を知った上で、「社会はこのようになっています」といった定性的な結論につなげるには、どのようにしたら良いのかが説明されています。
定性的な説明の中にある、言葉や、言葉の間の関係を、統計学の考え方に当てはめることや、統計学を説明の裏付けにするのがポイントのようです。

順路次は相関関係の探索

杉原データサイエンス事務所によるコンサルティングとセミナー