トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

広義の数量化U類

数量化U類は、 数量化理論 の一種です。 オリジナルの数量化U類は、 Data1のタイプのデータを説明変数Xとして、 判別分析 で分析する方法です。

このページの広義の数量化I類は、 Data2のタイプのデータについても同じように分析することを想定しています。
数量化のデータ

数量化U類の特徴

例えば、下のデータの場合、 ダミー変換 すると3つの変数ができます。 Yを明確に分けることができるのは「XS」なので、数量化U類は、こういうカテゴリを見つけることができる分析方法と言えます。

アソシエーション分析ラフ集合分析 と違って、「XがSではない」ということと、YがBであることに相関があることが見つけられるのが特徴と思います。 ただし、「XがSではない」といった条件は、実務での使いこなしが難しいように思っています。
PCA

数量化U類による予測

dummy
上のようなデータがあったとします。 目的変数がYで、説明変数がX01とX02です。

質的変数を変換します。 Yは-1と1の2値にして、説明変数はダミー変換をします。 X01CとX02Uがないのは、 多重共線性 を避けるためです。
dummy

すると、予測値Y'が求まります。 0よりも大きければPで、小さければQが対応しますので、だいたい合っています。 0ちょうどになるサンプルは、どちらとも判断できません。 0ちょうどになるサンプルというのは、AとSの組合せの時です。 元のデータでは、AとSの組み合わせの時は、PとQの両方の場合があることを、0として表現していることがわかります。
dummy

質的変数の説明変数を、1つの連続変数に変換

数量化U類の使い道として、目的変数を基準として、質的変数になっている説明変数を量的変数にすることができます。 その場合は、 Y'を「予測値」と考えるのではなく、「目的変数を参照して、説明変数のグループを1つの連続変数に変換した変数」と考えます。
dummy



順路 次は 広義の数量化V類

データサイエンス教室