トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

正準相関分析

正準相関分析は、 多対多の分析 の一種ですが、 A-A型A-B型 とは違います。

A-A型 は、Aの中の要素同士の関係を調べる方法です。 要素として変数を考えれば、 変数の類似度の分析 に使えますし、 サンプルを考えれば、 サンプルの類似度の分析 として使えます。

A-B型 は、Aの要素とBの要素の関係を調べます。

正準相関分析は、Aの要素とBの要素の関係を調べる方法ですが、AもBも変数なので、 変数の類似度の分析 として使う方法です。
関係性の行列表現

正準相関分析がすること

重回帰分析 は、説明変数の 線形和 と、目的変数の相関が最大になるように、線形和の係数を求めます。

正準相関分析では、目的変数も複数あって、それらの線形和を想定します。 そうして、目的変数の線形和と、説明変数の線形和の相関が最大になるように、これらの線形和の係数を求めます。

正準相関分析の使い道

正準相関分析は、 重回帰分析主成分分析 の両方の延長にあるような方法です。

重回帰分析 の式を作ると、 予測やシミュレーション に使うことができます。 また、目的変数とそれぞれの説明変数の関係の強さもわかります。 一方、正準相関分析のこういう使い方は、あまりないようです。

主成分分析 に似た使い方としては、 正準相関分析で高次元を2次元に圧縮 があります。

正準相関分析とコレスポンデンス分析の関係

質的変数を ダミー変換 すると、ひとつの変数が複数の変数に分かれます。 A、Bという質的変数があった時に、これをダミー変換すると、上記のAB-C型になります。 この形になったデータをAとBのそれぞれのグループに分かれた正準相関分析と考えると、 コレスポンデンス分析(対応分析) と同じになります。

正準相関分析にはグループが3つ以上の場合のものもあり、「一般化正準相関分析」と呼ばれることがあります。 グループが3つ以上の正準相関分析は、質的変数が3つ以上ある「多重対応分析」と呼ばれる方法になります。

グループが2つの正準相関分析は、「原因系と結果系」のように分けて使えます。 筆者は、グループが3つ以上の正準相関分析があることは知っていたのですが、 3つの時はそういう使い方にならないので。現実の問題での使い道はあまりなように思っていました。

一方で、質的変数が3つ以上ということは、よくあることです。 そのため、その方向性だと、グループが3つ以上の正準相関分析も使い道があります。

部分的最小二乗回帰分析(PLS)

部分的最小二乗回帰分析(PLS) は、正準相関分析で、片方のグループがひとつの変数だけの場合の方法と同じです。

ソフトウェア

R

Rによる正準相関分析のページがあります。



参考文献

図解でわかる多変量解析」 涌井良幸・涌井貞美 著 日本実業出版社 2001
正準相関分析が紹介されている数少ない本です。
重回帰分析主成分分析因子分析、 正準相関分析、 判別分析 について、式の意味が絵も豊富に使いながら、丁寧に解説されています。


多変量データ解析法 理論と応用」 柳井晴夫 著 朝倉書店 1994
正準相関分析という方法自体の歴史が解説されています。 1936年に始まって、1980年代でも発展が続いています。
正準相関分析とコレスポンデンス分析の関係が説明されています。


順路 次は 質的変数用の、変数の類似度の分析

データサイエンス教室