仮想的な反事実は、実際にはないものですが、これをイメージすると、分析できることが格段に増えます。
物の世界だと、「同じ物」という物はあるので、処置ありと処置なしのグループに分けて分析ができます。 これによって、 事実と反事実の分析 ができます。
ところが、人の場合、 「同じ条件の人」はあり得ますが、「同じ人」という事はあり得ないです。 そのため、処置ありの人については、処置なしだったらどうなるのかはわかりません。
そのため、実際にはあり得ない話をしていますが、こういうものを仮定すると理論が組み立てられるようになります。
学術的には、こういうものが「反事実」や「潜在的効果変数」と呼ばれているものの考え方です。
反事実は、物の世界ではあり得る話で、人の世界ではあり得ない話になるので、ややこしいです。 そこで、このサイトでは、「仮想的な」と付けるようにして区別することにしています。
因果効果の分析 のページでは、処置をしたグループと、処置をしなかったグループの差を調べています。
仮想的な反事実を考えるのなら、 因果効果とは、同じ人について、処置をした場合と、処置をしなかった場合の差です。
あり得ない話を前提にして、さらに続けます。 もしも同じ人について、事実と反事実の両方のデータがあったとしても、 「その人だから、そうなった。」や、「同じ人だとしても、もう1回試して、同じデータになるかはわからない。」という疑問に対しては、その通りです。
一般的な話として、結論を出すには、前者に対しては、大勢の人のデータから調べること、後者については、同じ人について繰り返し調べることが必要です。 なお、後者については、前者で代用するしかないです。
仮想的な反事実を考慮するのが理想状態とすると、実際の進め方は、状況によって適したものが変わって来ます。
上記の定義通りにするのなら、因果効果の分析として、処置をした人と、処置をしなかった人の差を見るのは、正しくありません。
処置をした人と、処置をしなかった人に違いがあったとしても、処置をしたからそうなったのか、処置をしなくても違いが出るのかが、区別できないためです。
ただし、現実のデータ分析では、処置をした人と、処置をしなかった人の差を見るしか、方法がないこともあり、 そのようなデータ分析がとても多いです。 その場合については、「処置をしなくても違いが出るかもしれない。」というのはリスクとして考えて置くのが、実務的な対応方法と思います。
仮想的な反事実のデータをもしも取れるのなら、「薬を飲んだAさんが、もしも薬を飲んでいなかったら」ということを調べられるようになります。 これだけでも、仮想的な反事実のデータには、まず、この使い方が考えられます。 この分析については、 反実仮想データの取得 のページがあります。
さらに、「Aさんが薬を飲んだ場合と、飲んでいない場合の差(因果効果)」も調べられるようになります。 サンプルごとの因果効果の分析 の仮想的な場合への応用です。 この分析については、 反実仮想による因果効果の分析 のページがあります。
順路 次は 反実仮想データの取得