「相関関係と因果関係は違う」とは、よく言われる事です。 しかし、そうは言っても、相関関係は 定量的な仮説の探索 の強力なヒントになる事が多いです。
相関関係として一番わかりやすいのは 相関性と相関係数 ですが、 質的なデータの相関性 もあります。
相関関係が見つかった場合は、その後の進め方が分かれます。場合分けしてから、現象の考察や次の解析に進みます。
この考察は、データの背景をよく知らない人だけで進めると、行き詰まったり、見落としをしたりします。 その場合は、深く関わっている人に協力してもらうと、深い考察ができることがあります。 原因の原因があることに気付くこともあります。
Aの共通の原因は、「時間」や「空間(位置・場所)」との相関もあることを確認してみると良いです。 それが突破口になることがあります。
Bの「たまたま」ですが、 データの サンプリング によって、本来、相関がないのに相関があるような結果が出ることがあります。
この場合は、 相関関係がない時の探索 になって来ます。
「SPSSクレメンタインによるデータマイニング」 牛田一雄・高井勉・木暮大輔 著 東京図書 2003
データマイニング
の本ですが、多くのデータマイニングの本のように
マーケティング
関係ではなく、工場の原因解析にデータマイニングを使う話を紹介しています。
「統計学が最強の学問である[実践編] データ分析のための思想と方法」 西内啓 著 ダイヤモンド社 2014
因果関係を洞察するための手段としての統計学の使い方を解説している本です。
回帰分析
、
ロジスティック回帰分析
、
因子分析
、
クラスター分析
は、因果関係の仮説を見つけるための手段としています。
因果関係の検証の方法としては、ランダムサンプリングによる実験を挙げています。
「社会科学のリサーチ・デザイン 定性的研究における科学的推論」 G.キング、R.O.コヘイン、S.ヴァーバ 著 勁草書房 2004
副題が「定性的研究における」となっているのですが、内容は定量的な研究の話が多いです。
統計的な因果推論や
誤差
について、統計学的な考え方を説明しています。
この本では、定量的な分析方法を知った上で、「社会はこのようになっています」といった定性的な結論につなげるには、
どのようにしたら良いのかが説明されています。
定性的な説明の中にある、言葉や、言葉の間の関係を、統計学の考え方に当てはめることや、統計学を説明の裏付けにするのがポイントのようです。
順路 次は 相関関係の探索