トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

非対称な因果の因果推論

このページで扱う「非対称な因果」ですが、 例としては、下のようなデータです。 Yが結果を表す変数で、X1とX2が原因を表す変数と仮定しています。

Yが1になる場合が、X1が1で、X2が0の場合と決まっています。 しかし、Yが0になる場合は、色々な条件があります。 このページでは、これを「非対称」と呼んでいます。
QCA

なお、 質的比較分析(QCA) の解説で、ある事象が起きる条件の反対が、ある事象が起きない条件になっていない時を「非対称」と呼んでいるものがあります。 このページの内容と似ています。

原因系が2変数以上(2因子以上)の時に、こういうことが起きます。 まれに起きることの、起き方のひとつです。

このような場合、例えば、X1とYだけを見ると、「X1とYは関係がない。」となります。 そのため、原因の変数が1つの場合よりも、発見が難しいです。

原因の変数が2つ以上の場合を見つける方法

サンプル数によって、適した方法が違って来ます。

サンプル数が多い時の方法は、確率の大小を調べられるので、 相反する事例が混ざっていたとしても、調べられます。 ただ、サンプル数が少ない事例は、「統計的に意味がなさそう」と判断されることがあるので、サンプル数が少ないデータには向きません。

サンプル数が少ない時の方法は、違いがはっきり出ている場合には使いやすいです。 はっきりしていない場合は、最初の仮説として使う感じが良いかと思います。 仮説を最初に置いて、サンプル数を増やして確認する進め方になります。

下の例は、 R-EDA1 の決定木とアソシエーション分析を使った例です。左がデータ、右が分析結果です。 X1がA1、X2がB2という条件だと、YがOKになっていることが分離できています。
QCA QCA QCA

原因の変数が2つ以上の場合の分析に、回帰分析系の方法は使えるか

このページの例のように、Yが0と1の2値の場合は、 ロジスティック回帰分析 でも分析できます。

Yは量的データの場合は、一般的な 回帰分析 系の方法になりますが、各変数の効果を足し合わせるモデルなので合わないです。 交互作用項 を工夫する方法はありますが、結果の考察が難しいです。



過程追跡 は、このページのようなデータよりもさらに事例が少なく、1回しか起きたことがないような場合の方法です。


順路 次は 仮説の検証(実証分析)

Tweet データサイエンス教室