トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

数量化理論

数量化理論(Quantification Methods)は、 質的データ になっている説明変数を ダミー変換 して0と1の量的データにして、多変量解析ができるようにする方法です。 「類」となっていますが、多変量解析のそれぞれの方法の質的データ版に相当します。

数量化理論ならではの話がある

筆者は初めて数量化理論を知った時、「ダミー変換さえしてしまえば、後は通常の多変量解析と同じ」という理解をしました。 ところが、この理解をしている内は、数量化理論でできることは限定されます。 そのため、データから何も結果を出せないことがありました。

数量化理論では、0と1になっているデータを扱います。 これによってどのようなモデルになっているのかを考えていくと、数量化理論ならではの分析の幅が広がります。

数量化I類は、何をしているのか?

以下は、I類を例にして説明します。 また、一番シンプルな例からになります。

説明変数がひとつで、質的変数の場合

簡単な例として、説明変数がひとつしかなく、「Aさん」、「Bさん」という2つの名前が入った質的データだったとします。 このような場合に、ダミー変換をして、Aさんの時にX=1、Bさんの時にX=0にしたとすると、 数量化I類によって、例えば、
Y = X + 1.3
という式が得られます。 この式は、
Y = 2.3 ・・・Aさんの時
Y = 1.3 ・・・Bさんの時
 、という事と意味が同じです。

つまり、質的変数をダミー変数で扱うモデルは、Y切片の分だけずれた場合のモデルです。 言い換えれば、カテゴリ毎に 層別 してY切片を求めています。

説明変数が複数でに量的変数と質的変数が混ざっている場合

説明変数に量的変数と質的変数が混ざっている場合に、質的変数についてはダミー変換をすれば、 重回帰分析をすることができますが、 質的変数が影響するのは、Y切片の部分です。

例えば、AさんとBさんで、Y切片分のずれを考慮するとモデルの当てはまりが良くなる場合には、 この分析は効果的です。 しかし、AさんとBさんの違いによって、式の傾きも変わる場合には、このモデルは良くありません。

式の傾きも変わるモデル

傾きが複数あるモデルは、データを加工すると作ることができます。

例として、説明変数に、量的変数と質的変数がひとつずつあるとします。 この量的変数と質的変数のダミー変数の積を作り、第3の変数にします。 ちなみに、この変数は「交互作用項」と呼ばれています。

そして、量的変数、質的変数のダミー変数、第3の変数で、重回帰分析をします。 これが、傾きが複数あるモデルになります。

第3の変数が有意にモデルに影響している場合は、AさんとBさんで傾きが異なることを 検定 したことになります。 また、ダミー変数が有意にモデルに影響している場合は、AさんとBさんでY切片が異なることを検定したことになります。
交互作用項が不要な例 交互作用項が必要な例





参考文献

データ分析をマスターする12のレッスン」 畑農鋭矢・水落正明 著 有斐閣 2017
計量経済学の分野での 仮説の検証(実証分析) のためのデータ分析を扱った本です。
ダミー変数を使った 重回帰分析 の話で、ひとつの章になっています。
式の傾きが変わらないモデルで使うダミー変数を「定数項ダミー」、傾きが変わるモデルで使うダミー変数を「係数ダミー」と呼んでいます。


順路 次は 因子分析

Tweet