相関性と相関係数 のページにあるように、「相関性」と言えば、一般的には、量的変数の類似度の話です。 「相関係数」という尺度は、量的データで計算します。
データの形式は、量的と質的の2種類に大きく分かれますが、 質的変数についても、相関性はあります。
天気のデータの例で言えば、A地点とB地点は、天気が似ているので、「相関が高い」と言えます。 一方、A地点とC地点は、天気が似ていないので、「相関が低い」と言えます。
質的変数の相関性についても、考え方は、 相関性と相関係数 と似ています。
「質的変数について、変数の類似度の分析をしたい」という時に、「 ダミー変換 して、質的変数を量的変数にすれば、量的変数用の、変数の類似度の分析をすれば良い」 と思いたくなりますが、その方法だとできません。
ダミー変換すると、カテゴリのひとつひとつが変数になります。 それについて、量的変数用の、変数の類似度の分析を使うと、 カテゴリの類似度の分析 になります。
質的変数にダミー変換をして、相関係数で分析をする方法は、 カテゴリの相関分析 のページがあります。
質的変数について、変数の類似度の分析をするには、ダミー変換以外のアプローチをします。
独立性の検定 、 対数線形分析 、 ベイジアンネットワーク は、質的変数用の、変数の類似度の分析の方法になります。
質的な変数について、相関係数に相当するものは、「連関係数」と呼ばれています。 連関係数は、上の例のようなデータを、 分割表 の形にしてから計算されます。
順路 次は 分割表
Tweet