トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

疑似相関からの因果推論

Xという変数は、Yの原因ではないけれども、Yとの相関が高く、 疑似相関 の関係がある時に使える方法です。
causal_effect

因子分析の活用

上図のような時は、 因子分析 をすると、Lをあぶり出すことができることがあります。

主成分分析独立成分分析 も同じ目的で使えることがあります。

方法の違いは、 分解分析の違いのページにあります。

潜在変数を仮定しなかった場合

疑似相関からの因果推論のポイントは、YとXを区別せずに、因子分析をするところです。

ところで、Y、X1、X2という変数があると、 Yを目的変数、X1、X2を説明変数として、モデルを作りたくなります。 例えば、下のようなモデルです。
Y = A1 * X1 + A2 * X2 + B

実際、下のようなデータの構造の時は、このモデルが精度の高いモデルになることもあります。

causal_effect

この場合は、X1の中に入っているX2の要素を引き抜いて、Lを見えないところであぶり出しているので、精度の高いモデルになるのですが、 それは注意深く係数を見たりしないと、気付けないので注意が必要です。

精度の高いモデルにはなりますが、実際の現象の中ではYとは関係のないX2が、Yに影響しているモデルになるため、結果の考察で困ることになります。

ソフト

R

Rによる分解分析 では、主成分分析、独立成分分析、因子分析で求める各要約変数の寄与率だけを比較する分析の実施例があります。

R-EDA1

R-EDA1 では、3つの手法を選べます。
R-EDA1




順路 次は 隠れ変数の探索

Tweet データサイエンス教室