トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

質的変数用の、変数の類似度の分析

相関性と相関係数 のページにあるように、「相関性」と言えば、一般的には、量的変数の類似度の話です。 「相関係数」という尺度は、量的データで計算します。

データの形式は、量的と質的の2種類に大きく分かれますが、 質的変数についても、相関性はあります。

天気のデータ

質的な変数の相関性

天気のデータの例で言えば、A地点とB地点は、天気が似ているので、「相関が高い」と言えます。 一方、A地点とC地点は、天気が似ていないので、「相関が低い」と言えます。

質的変数の相関性についても、考え方は、 相関性と相関係数 と似ています。

変数の類似度と、カテゴリの類似度の関係

「質的変数について、変数の類似度の分析をしたい」という時に、「 ダミー変換 して、質的変数を量的変数にすれば、量的変数用の、変数の類似度の分析をすれば良い」 と思いたくなりますが、その方法だとできません。

ダミー変換すると、カテゴリのひとつひとつが変数になります。 それについて、量的変数用の、変数の類似度の分析を使うと、 カテゴリの類似度の分析 になります。

相関係数を使った質的データの分析

質的変数にダミー変換をして、相関係数で分析をする方法は、 カテゴリの相関分析 のページがあります。

質的変数用の、変数の類似度の分析

質的変数について、変数の類似度の分析をするには、ダミー変換以外のアプローチをします。

独立性の検定対数線形分析ベイジアンネットワーク は、質的変数用の、変数の類似度の分析の方法になります。

連関係数

質的な変数について、相関係数に相当するものは、「連関係数」と呼ばれています。 連関係数は、上の例のようなデータを、 分割表 の形にしてから計算されます。



順路 次は 分割表

Tweet データサイエンス教室