トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

質的データの相関性

散布図と相関性 のページにあるように、「相関性」と言えば、一般的には、量的データの変数の類似度の話です。 「相関係数」という尺度は、量的データで計算します。

データの形式は、量的と質的の2種類に大きく分かれますが、 質的なデータについても、相関性はあります。

質的な変数の相関性

天気のデータの例で言えば、A地点とB地点は、天気が似ているので、「相関が高い」と言えます。 一方、A地点とC地点は、天気が似ていないので、「相関が低い」と言えます。

この相関性は、変数同士の関係を見るので、 多変量解析 的です。 独立性の検定対数線形分析 が、古くから研究されています。

連関係数

質的な変数の相関性の尺度は、「連関係数」と呼ばれています。 連関係数は、このページのように変数ごとに縦に並んでいる表を、 分割表 の形にしてから計算されます。

天気のデータ

相関係数を使った質的データの分析

質的データの相関性は、連関係数が尺度になるのですが、質的データの分析に相関係数を使う分析方法もあります。 ダミー変換 をして、量的データにしてから相関係数を使います。

この方法を使うと、質的変数の相関性の分析ではなく、 個々のカテゴリの相関分析になります。

詳しくは、 個々のカテゴリの相関分析 のページがあります。




順路 次は 独立性の検定

Tweet データサイエンス教室