トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

因子分析

因子分析は、「データとして持っていないもの」について、データ解析をします。 多変量解析 の中でも、この点が際立った特徴になっています。

また、「因子分析」の名前によく表れていますが、 「原因を探る方法」や、「仮説を検証する方法」に特化しています。 多くのデータ解析は、予測や 判別 の方法として紹介される事が多いので、この点も特徴です。

潜在変数

因子分析は、潜在変数を使うところが、他の 多変量解析 の手法と大きく違います。

因子分析は、もともと心理学で考案されて来たものだそうです。 その段階では、潜在変数は「因子」を表現するものとして使われて来たようですが、 現在では、必ずしも因子を表すものではないです。

潜在変数は、データは持っていないけれども、データを持っている変数と関係がある変数です。 ここでは、データのある変数を、「顕在変数」と呼んでおきます。

数式としては、それぞれの顕在変数は、潜在変数の 線形和 で表します。

探索的因子分析と主成分分析の関係

SEM 比較的古い文献に載っている因子分析は、現在は、「探索的因子分析」と呼ばれています。

探索的因子分析では、線形和にすべての潜在変数を含むようにします。 また、潜在変数同士は、相関がないと仮定します。

主成分分析 は、顕在変数の線形和で主成分を表しますし、主成分同士は相関がないので、とても似ています。

主成分分析では、「分散の最大化」と、「主成分同士は無相関」というルールがあるので、自動的に線形和の係数が求まります。

ところが、因子分析の答えとして求まる係数は、無限にあります。

係数の決め方

探索的因子分析では、主成分を空間的に回転させると、潜在変数に一致します。 そのため、自分の仮説など、何らかの基準を使って、例えば、ひとつの潜在変数の係数を固定してしまうと、他の潜在変数の係数もある程度決まってきます。

因子分析は、解析者が「潜在変数と顕在変数の関係は、こうではないか?」、という仮説が、本当にデータと当てはまるのかを探るための方法です。

主成分分析の利用

主成分分析をすると、例えば、「10個の変数の値は、2つの主成分でほぼ説明できる。」、という事がわかります。

この結果を使って、「潜在変数は2つありそうだ。」というように解析の方向付けができます。

結果の考察の時の違い

主成分分析の結果を考察する時は、計算で求められた主成分(合成変数)に対して、解析者が解釈を付けます。 そのため、こじつけのような解釈になってしまう事もあります。

一方、因子分析は、合成変数の意味をあらかじめ設定してますので、あらかじめ解析者が解釈しやすいようになっています。

検証的因子分析

SEM 「潜在変数同士は無相関」と、「線形和にすべての潜在変数を含む」という条件を除いて、モデルを作ると、 検証的因子分析と呼ばれます。

共分散構造分析

因子分析では、顕在変数と潜在変数で、2つの階層があります。

顕在変数と潜在変数に、もっと複雑な関係がある時のモデルを分析する方法として、 共分散構造分析 があります。



A-A型

独立成分分析

参考文献

図解でわかる多変量解析」 涌井良幸・涌井貞美 著 日本実業出版社 2001
この本では、探索的因子分析を解説しています。


多変量解析法入門」 永田靖・棟近雅彦 共著 サイエンス社 2001
因子分析の結果の多くは、主成分分析の結果と一致するそうです。


よくわかる多変量解析の基本と仕組み 巨大データベースの分析手法入門」 山口和範、高橋淳一、竹内光悦 著 秀和システム 2004
探索的因子モデルから、検証的因子モデルまでをコンパクトに解説。


図解でわかる共分散構造分析 データから「真の原因」を探り出す新しい統計分析ツール」 涌井良幸、涌井貞美 著 日本実業出版社 2003
検証的因子分析モデルを、「確認的因子モデル」と読んでいます。 共分散構造分析の特徴や使い方を、まず、検証的因子分析モデルで解説しています。 その後で、共分散構造分析は、検証的因子分析モデル以外にも使える事を解説しています。



順路 次は SEM・共分散構造分析

Tweet データサイエンス教室