トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

要約分析の違い

独立成分分析因子分析主成分分析 では、潜在変数、独立成分、主成分という呼び方の違いがあるものの、何らかの変換をして、これらを求めている点は同じです。

また、これらは計算方法も違いますが、 EDA(探索的データ分析) や、説明変数の代わりとして使う場合は、同じ使い方をします。

このページは、これらの方法を「要約分析」という名前にして、比較してみたものです。

方法の比較

元の変数の特徴を際立たせるような形で、要約変数を作るのは、因子分析か独立成分分析というのが、下記からわかることでした。 現実のデータで、きれいな正規分布のことは少ないので、それも加味すれば、まず、最初に試すのは独立成分分析が良さそうです。

なお、因子分析と独立成分分析は、先に主成分分析をして、抽出する変数の数の検討をしないとエラーになりやすいです。 その意味では、一番手軽なのは主成分分析です。

機械的に、精度の高いモデルを作るのなら、主成分分析をベースとした主成分回帰分析がベストです。

正規分布のデータ

X01のグループと、X02のグループを区別できるのは、因子分析だけです。

ICA ICA

一様分布のデータ

X01と、X02を区別できるのは、独立成分分析だけです。

ICA ICA

信号のようなデータ

X01と、X02を区別できるのは、独立成分分析だけです。

ICA ICA

実験計画法のようなデータ

X01と、X02を区別できるのは、独立成分分析だけです。

ICA ICA

方法の違いの効果

主成分回帰分析隠れ変数の探索 では、説明変数の前処理として、主成分分析、独立成分分析、因子分析等のバリエーションがあります。

前処理の方法が変わると、考察できることが変わります。

ソフト

R

Rによる要約分析 では、主成分分析、独立成分分析、因子分析で求める各要約変数の寄与率だけを比較する分析の実施例があります。

R-EDA1

R-EDA1 では、3つの手法を選べます。
R-EDA1



カテゴリの要約分析

量質混合の潜在変数モデル


順路 次は SEM・共分散構造分析

Tweet データサイエンス教室