クラスター分析 は、サンプルをクラスター(グループ)に分ける方法です。 座標の近いもの同士でクラスターを作ります。
その後は、「どういう風に分けられたのか?」、「このサンプルは、どのグループに属しているのか?」という分析をするのが一般的です。
しかし、クラスター分析の手法は、 統計モデルによる予測 にも使えるようになっています。
それぞれの方法は、基本的なクラスター分析から段階的に応用して出来上がっています。
下の図では、「応用」を矢印で表しています。
主成分分析 は教師なし学習ですが、 モデルを作った時に使われていないサンプルを入力データとして、主成分がどのように計算されるのかを見る使い方があります。 それと似た使い方です。
主成分分析 は 回帰分析 などの教師あり学習の手法を使う時に、説明変数の前処理として使う使い方があります それと似た使い方です。
ラベルの予測の方法には、 ベクトル量子化ロジスティック回帰分析 があります。 数値の予測の方法には、 ベクトル量子化回帰分析 があります。 ラベル(2値データ)でも、数値(連続データ)でも使えるのものとして、 ベクトル量子化平均法 があります。
順路 次は クラスターの予測の分析