トップページ | Q&Aの一覧 | このサイトについて | ENGLISH

Q&A

Q(ご質問)

原因は、この変数ですか?

A(ご回答)

相関分析 をしたりして、目的変数(Y)と相関の高い変数が見つかった後に、冒頭の質問をいただくことがあります。

筆者は、状況によって、「その通りです」と「まだわかりません」を使い分けています。

「その通りです」になるのは、特性要因図、連関図、なぜなぜ分析などを使って 定性的な仮説の探索 をしてから、意図的に集めたデータを分析をしている時です。 定性的な話から、定量的な 仮説の検証 に進んでいますので、良い進め方と思います。

「まだわかりません」になるのは、「とりあえずデータ見た」という時です。 この段階で、相関があるということは、「変数同士が似ている」ということがわかっただけで、原因かどうかは何とも言えません。 定量的な仮説の探索 ができただけですので、原因を特定するには、相関が高い理由を考察するなど、別の確認方法も考える必要があります。

補足

「データ分析は、結論を出すもの」というイメージを持っている方には、 「 定量的な仮説の探索 ができただけなので、まだわかりません」、という説明は、なかなか理解していただけないことがあります。

特に、結論や対策を急ぐ必要がある場合は、「わかりません」では済まないので、「別の確認方法」についても同時に考えるようにしています。



Tweet データサイエンス教室