トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

広義の数量化Ⅱ類

数量化Ⅱ類は、数量化理論の一種です。オリジナルの数量化Ⅱ類は、 Data1のタイプのデータを説明変数Xとして、判別分析で分析する方法です。

このページの広義の数量化I類は、 Data2のタイプのデータについても同じように分析することを想定しています。
数量化のデータ

数量化Ⅱ類の特徴

例えば、下のデータの場合、ダミー変換すると３つの変数ができます。 Yを明確に分けることができるのは「XS」なので、数量化Ⅱ類は、こういうカテゴリを見つけることができる分析方法と言えます。

アソシエーション分析やラフ集合分析と違って、「XがSではない」ということと、YがBであることに相関があることが見つけられるのが特徴と思います。ただし、「XがSではない」といった条件は、実務での使いこなしが難しいように思っています。
PCA

数量化Ⅱ類による予測

dummy
上のようなデータがあったとします。目的変数がYで、説明変数がX01とX02です。

質的変数を変換します。 Yは-1と1の2値にして、説明変数はダミー変換をします。 X01CとX02Uがないのは、多重共線性を避けるためです。
dummy

すると、予測値Y'が求まります。０よりも大きければPで、小さければQが対応しますので、だいたい合っています。０ちょうどになるサンプルは、どちらとも判断できません。０ちょうどになるサンプルというのは、AとSの組合せの時です。元のデータでは、AとSの組み合わせの時は、PとQの両方の場合があることを、０として表現していることがわかります。
dummy

質的変数の説明変数を、１つの連続変数に変換

数量化Ⅱ類の使い道として、目的変数を基準として、質的変数になっている説明変数を量的変数にすることができます。その場合は、 Y'を「予測値」と考えるのではなく、「目的変数を参照して、説明変数のグループを１つの連続変数に変換した変数」と考えます。
dummy

順路次は広義の数量化Ⅲ類

杉原データサイエンス事務所によるコンサルティングとセミナー