トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

散布図と相関性

2つの項目のデータを 2次元散布図 にプロット(打点)した時に、 ほぼ”直線状”にプロットが並ぶ場合、「相関(コリレーション)がある」と言います。 「相関が強い」とか、「相関性が高い」とも言われます。

相関性を評価する尺度が「相関係数(R)」です。 相関係数が+1や−1なら、プロットは完全に直線状になっています。 0に近いほどばらつきます。 相関係数は ばらつきの尺度 の一種です。

相関係数が+1や−1に近い時は、「相関がある」と言います。 +1の場合は「正の相関」、−1の場合は「負の相関」と言います。 「相関がある」の基準は、 実際のデータや解析の意味を考えて、ケースバイケースで考える必要があります。 解説書では、例えば、「0.6 以上」と書かれていることもあります。 これは考える時の目安になります。



二重測定による判別能力の向上


順路 次は 相関を語る時の落とし穴

Tweet データサイエンス教室