トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

比率の差の効果量の検定

比率の差の効果量の検定は、 比率の全体的な差の検定 の一種です。

平均値の差の効果量の検定 と似ています。

計算の基本的な考え方

平均値の差の検定の計算で使われている統計量は、ざっくり見ると、以下の形になっています。
平均値の差/(標準偏差/サンプル数nの平方根)

平均値の差の効果量の検定では、それを以下のようにします。
平均値の差/標準偏差

比率の差の効果量の検定も、これと同じ考え方をします。

効果量の信頼区間

比率は、これ自体が標準化されたような値(0から1で固定)なので、 効果量の信頼区間は、下記の式で良いような気がしています。 比率の差の検定 と同じ式です。

効果量の信頼区間(下側)の、具体的な計算方法

下記は、下側の求め方ですが、上側でも同様です。

EXCELの場合、例えば、比率がp1とp2の場合、下の式で効果量の信頼区間(下側)が求まります。
= ABS(p1-p2) - 1.96*(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2)))

検定統計量の式の導出


上の表で、緑色の部分の式は、教科書にのっているくらい有名な式です。

黄色の部分は、既存の式を眺めつつ、やりたいことができるための式を、筆者がアナロジーで出してみたものです。

P値の計算

EXCELの場合、例えば、p1、p2という2つの比率があり、それぞれのサンプル数がn1とn2の場合、下の式でp値が求まります。
=1-NORMDIST(ABS(p1-p2)*sqrt(1/n1+1/n2)/(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2))), 0 , 1,TRUE)

上の表のそれぞれの計算式を、EXCELの計算式として入れています。 NORMDIST関数の最初の引数には、検定統計量が入ります。 2番目の引数は、平均値の差が0かどうかが基準になるので、0です。 3番目の引数は、標準偏差が入ります。

P値の信頼区間

P値の信頼区間 は、効果量の信頼区間の上側と下側の値を、P値の計算式に入れて計算すれば良さそうです。

P値の信頼区間(上側)の、具体的な計算方法

P値の計算の、ABS(p1-p2)の部分に、効果量の信頼区間の下側の式を入れます。

EXCELの場合、下の式でp値の信頼区間(上側)が求まります。
=1-NORMDIST(ABS(p1-p2) - 1.96*(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2)))*sqrt(1/n1+1/n2)/(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2))), 0 , 1,TRUE)



順路 次は 比率分布の重なりの検定

データサイエンス教室