トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

正準相関分析で高次元を2次元に圧縮して可視化

回帰分析系で高次元を2次元に圧縮 の場合は、目的変数とその他の変数に分けます。 このページの方法は、目的変数が変数のグループになっている場合と解釈することができます。

回帰分析系では、1つの変数と複数の変数の関係を扱いますが、このページの方法では、複数同士の関係です。 これができる方法は、 正準相関分析 です。
2D

正準相関分析 を 、高次元を2次元に圧縮して可視化 の方法に応用します。

使い道

下の例は、左から順にが第1成分同士の散布図、第2成分同士の散布図、第3成分同士の散布です。 使っているデータは、1行目のサンプルだけ、他のサンプルとは違って適当に入れた値を使っているのですが、真ん中の散布図の方で、このサンプルが外れているのが見えています。 また、3つの因子がありますが、2つのグループで相関の高い因子は2種類しかないことがわかります。

高次元を2次元に圧縮して可視化 の方法は、散布図が1枚で分析するのが普通ですが、正準相関分析を使う場合、2枚以上見ないとわからない例になっています。
Canonical Correlation Analysis

Rによる正準相関分析 のページには、カーネル法を使った非線形の正準相関分析も載せましたが、まだ、実務で役立ちそうな分析例に、筆者は出会ったことがないです。

ソフト

R-EDA1

R-EDA1では、非線形の正準相関分析もできます。

two dimensions analysis by CCA

R

Rによる正準相関分析のページがあります。






順路 次は クラスター分析

Tweet データサイエンス教室