数量化U類は、 数量化理論 の一種です。 オリジナルの数量化U類は、 Data1のタイプのデータを説明変数Xとして、 判別分析 で分析する方法です。
このページの広義の数量化I類は、
Data2のタイプのデータについても同じように分析することを想定しています。
例えば、下のデータの場合、 ダミー変換 すると3つの変数ができます。 Yを明確に分けることができるのは「XS」なので、数量化U類は、こういうカテゴリを見つけることができる分析方法と言えます。
アソシエーション分析
や
ラフ集合分析
と違って、「XがSではない」ということと、YがBであることに相関があることが見つけられるのが特徴と思います。
ただし、「XがSではない」といった条件は、実務での使いこなしが難しいように思っています。
上のようなデータがあったとします。
目的変数がYで、説明変数がX01とX02です。
質的変数を変換します。
Yは-1と1の2値にして、説明変数はダミー変換をします。
X01CとX02Uがないのは、
多重共線性
を避けるためです。
すると、予測値Y'が求まります。
0よりも大きければPで、小さければQが対応しますので、だいたい合っています。
0ちょうどになるサンプルは、どちらとも判断できません。
0ちょうどになるサンプルというのは、AとSの組合せの時です。
元のデータでは、AとSの組み合わせの時は、PとQの両方の場合があることを、0として表現していることがわかります。
数量化U類の使い道として、目的変数を基準として、質的変数になっている説明変数を量的変数にすることができます。
その場合は、
Y'を「予測値」と考えるのではなく、「目的変数を参照して、説明変数のグループを1つの連続変数に変換した変数」と考えます。
順路 次は 広義の数量化V類