クラスターの予測の分析

クラスター分析では、サンプルがどのように分けられるのかを見て、近いもの同士をクラスターにします。

どのクラスターに属するのかがわからない新しいサンプルがあった時に、そのサンプルとクラスターの関係を調べるのが、このページの方法です。

予測の前の作業

クラスター分析で予測をする時には、「どのクラスターに属しているのか？」という作業を、予測の前の作業として実施します。

例えば、左のようなデータについて、クラスター分析をすると、右のように３つのクラスターを抽出できます。予測の時は、この結果を使います。
cluster cluster

混合分布法はクラスター分析の一種ですが、クラスター分けだけではなく、クラスター分けをする時に使ったサンプル以外のサンプルについて、「どのクラスターに属しているのか？」という統計モデルによる予測ができる方法です。

例えば、上記の作業の結果を使って、任意の位置のクラスターを予測すると、下図になります。
cluster

混合分布法は、それ自体が予測に使えるようになっています。混合分布法以外のクラスター分析の手法も、クラスターの予測には使えます。

クラスター分析でクラスターの名前のある変数を作ってから、その変数をラベルにして、ラベル分類の手法を使う手順になります。

クラスター分析の手法と、ラベル分類の手法の組合せで、いろいろなバリエーションができます。

Rによる混合分布法によるクラスターの予測の方法は、 Rによるクラスターの予測のページにあります。