トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

変数の類似度の分析

変数の類似度の分析では、データの表を縦に短冊状に切って、短冊同士の近さを見ます。
関係性の行列表現

変数の類似度の分析は、 「変数がたくさんあるけど、分類できないか?」といった感じで、 データマイニング の最初の段階でします。

また、 多変量解析 で、 多重共線性 を考えながら、 変数の選択 をするための分析としても使われます。

量的な変数の類似度の分析

質的な変数の類似度の分析

Natto

Natto」というフリーソフトでは、質的な変数の相関性が分析できるようになっています。
nattoの例

Nattoは、量的な変数が混ざっていると質的な変数に変換して分析できます。

ちなみに、Nattoは、 カテゴリの類似度の分析 もできるようになっています。

量的・質的の混合の類似度の分析

非線形の分析

量的変数の相関性では、2つの変数で散布図を描いた時に、データが一本の直線に近くなるかどうかで、相関の高さがわかります。 このため、線形の評価になります。

この考え方を、質的変数の相関性で考えると、質的変数の相関性の解析では、非線形を扱っています。

量的変数を 1次元クラスタリング で質的変数に変換して、質的な変数の類似度の分析をする方法は、非線形分析の目的でも役に立ちます。



参考文献

Natto のサイトには、ソフトのダウンロードや、理論の解説があります。



順路 次は 多変量データの相関分析

Tweet データサイエンス教室