トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

クラスター分析

クラスター分析では、 サンプルの仲間分けの分析 の一種です。 データの集団を”近い”者同士の小集団に分けます。 教師なし学習 の代表格です。

主成分分析自己組織化マップ と似ています。

なお、このページのクラスター分析は、狭義の意味のものになります。 サンプルの仲間分けの分析多対多の分析 で、データを塊ごとに見る時にも、「クラスター」という呼び方は使われます。

階層の「あり」・「なし」

クラスター分析は、大きく分けると「階層あり」と「階層なし」があります。

階層あり

「階層あり」では、トーナメント表のような形で、サンプルの近さのグラフが作られます。 近いもの同士の塊を、「クラスター」と解釈します。

階層ありの手法は、手法の名前と言うより、データ間の距離の定義に、様々なものが考案されています。

階層なし

「階層なし」では、「このサンプルは、これらのサンプルと同じクラスターです。」というシンプルな出力が出ます。 k-means法が有名です。

階層ありの手順




手法の使い分け



順路 次は テキストマイニング

Tweet