トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

比率の差の効果量の検定

比率の差の効果量の検定は、比率の全体的な差の検定の一種です。

平均値の差の効果量の検定と似ています。

計算の基本的な考え方

平均値の差の検定の計算で使われている統計量は、ざっくり見ると、以下の形になっています。
平均値の差／（標準偏差／サンプル数nの平方根）

平均値の差の効果量の検定では、それを以下のようにします。
平均値の差／標準偏差

比率の差の効果量の検定も、これと同じ考え方をします。

効果量の信頼区間

比率は、これ自体が標準化されたような値（0から1で固定）なので、効果量の信頼区間は、下記の式で良いような気がしています。比率の差の検定と同じ式です。

効果量の信頼区間（下側）の、具体的な計算方法

下記は、下側の求め方ですが、上側でも同様です。

EXCELの場合、例えば、比率がp1とp2の場合、下の式で効果量の信頼区間（下側）が求まります。
= ABS(p1-p2) - 1.96*(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2)))

検定統計量の式の導出

上の表で、緑色の部分の式は、教科書にのっているくらい有名な式です。

黄色の部分は、既存の式を眺めつつ、やりたいことができるための式を、筆者がアナロジーで出してみたものです。

P値の計算

EXCELの場合、例えば、p1、p2という２つの比率があり、それぞれのサンプル数がn1とn2の場合、下の式でp値が求まります。
=1-NORMDIST(ABS(p1-p2)*sqrt(1/n1+1/n2)/(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2))), 0 , 1,TRUE)

上の表のそれぞれの計算式を、EXCELの計算式として入れています。 NORMDIST関数の最初の引数には、検定統計量が入ります。２番目の引数は、平均値の差が０かどうかが基準になるので、０です。３番目の引数は、標準偏差が入ります。

P値の信頼区間

P値の信頼区間は、効果量の信頼区間の上側と下側の値を、P値の計算式に入れて計算すれば良さそうです。

P値の信頼区間（上側）の、具体的な計算方法

P値の計算の、ABS(p1-p2)の部分に、効果量の信頼区間の下側の式を入れます。

EXCELの場合、下の式でp値の信頼区間（上側）が求まります。
=1-NORMDIST(ABS(p1-p2) - 1.96*(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2)))*sqrt(1/n1+1/n2)/(SQRT((p1*(1-p1)/n1 + p2*(1-p2)/n2))), 0 , 1,TRUE)

順路次は比率分布の重なりの検定