変数の類似度の分析では、データの表を縦に短冊状に切って、短冊同士の近さを見ます。
変数の類似度の分析は、 「変数がたくさんあるけど、分類できないか?」といった感じで、 データマイニング の最初の段階でします。
また、 多変量解析 で、 多重共線性 を考えながら、 変数の選択 をするための分析としても使われます。
「Natto」というフリーソフトでは、質的な変数の相関性が分析できるようになっています。
Nattoは、量的な変数が混ざっていると質的な変数に変換して分析できます。
ちなみに、Nattoは、 個々のカテゴリの類似度の分析 もできるようになっています。
量的変数の相関性では、2つの変数で散布図を描いた時に、データが一本の直線に近くなるかどうかで、相関の高さがわかります。 このため、線形の評価になります。
この考え方を、質的変数の相関性で考えると、質的変数の相関性の解析では、非線形を扱っています。
量的変数を 1次元クラスタリング で質的変数に変換して、質的な変数の類似度の分析をする方法は、非線形分析の目的でも役に立ちます。
Natto のサイトには、ソフトのダウンロードや、理論の解説があります。
順路
次は
多変量データの相関分析