トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

21世紀の、比率の差の検定

21世紀の検定 としての、 比率の差の検定 を、このページで整理します。

検定対象

2つのグループの比率の差です。

検定対象の信頼区間

比率の差の信頼区間は以下になります。

N1セルにグループ1のサンプル数、N2セルにグループ2のサンプル数、P1セルにグループ1の比率、P2セルにグループ2の比率、を入力しておくと、以下の関数はコピペで使えます。
n1 : グループ1のサンプル数
n2 : グループ2のサンプル数
p1 : グループ1の比率
p2 : グループ2の比率

下記は、下側の求め方ですが、上側でも同様です。

EXCELの場合、例えば、比率がp1とp2の場合、下の式で信頼区間(下側)が求まります。
=p1 - p2 - NORM.INV(1-0.025,0,1) * SQRT((p1*(1-p1)/n1+p2*(1-p2)/n2))

p値

以下のどちらの関数でも、同じp値が求まります。

=1-NORM.DIST((p1 - p2) / SQRT((p1*(1-p1)/n1+p2*(1-p2)/n2)), 0, 1, TRUE)

=1-NORM.DIST(p1 - p2, 0, SQRT((p1*(1-p1)/n1+p2*(1-p2)/n2)), TRUE)

p値の信頼区間

P値の信頼区間 は、p値を求める式に、信頼区間の下側を入れることで、定式化してみました。

=1-NORM.DIST(p1 - p2 - NORM.INV(1-0.025,0,1) * SQRT((p1*(1-p1)/n1+p2*(1-p2)/n2)), 0, SQRT((p1*(1-p1)/n1+p2*(1-p2)/n2)), TRUE)

効果量

比率の差の検定は、 平均値の差の検定 と似た形で検定をします。 そのため、 効果量 についても、同様に考えるのなら、以下で良いと考えられます。

= (p1 - p2) / SQRT(p1*(1-p1)+p2*(1-p2))

比率の比や、オッズ比も、効果量として良さそうです。


=p2 / p1


=(p2 / (1-p2)) / (p1 / (1-p1))

効果量の信頼区間

個別の比率の信頼区間は、以下のようになっています。

=p1 + NORM.INV(1-0.025,0,1) * SQRT(p1*(1-p1)/n1)
=p1 - NORM.INV(1-0.025,0,1) * SQRT(p1*(1-p1)/n1)

効果量の信頼区間 は、これを効果量の式に使えば良いと考えられます。

p1の方がp2よりも高いことを検証したい場合、
p1 > p2
だったとしても、
p1の信頼区間の下側 < p2の信頼区間の上側
になっていないかが、最初の確認点です。

次に、p1の信頼区間の下側と、p2の信頼区間の上側を使って効果量を計算した時が、効果量の信頼区間の下側になり、これがある程度確保できていないと、 「効果がある」とは考えられなくなります。

例えば、効果量を比率の比にする場合の、効果量の信頼区間の下限は、以下になります。
= (p2 + NORM.INV(1-0.025,0,1) * SQRT(p2*(1-p2)/n2)) / (p1 - NORM.INV(1-0.025,0,1) * SQRT(p1*(1-p1)/n1))

寄与率

寄与率 は、以下のようにして計算します。

比率を計算する前の元データを、以下のように加工します。 Zを使って、グループの違いを表します。1と0は逆でも問題ありません。
o value

ここまで準備できると、ここからは、 平均値の差の検定の寄与率 と基本的に同じです。 相関係数rを求めます。

寄与率は、相関係数の二乗です。
=r1^2

寄与率の信頼区間

寄与率の信頼区間(上側)です。 相関係数の検定にある信頼区間を使います。

= (( EXP(LN( (1+r1)/(1-r1) ) -2*1.96/SQRT(n1-3) ) -1) / ( EXP(LN( (1+r1)/(1-r1) ) -2*1.96/SQRT(n1-3) ) +1))^2

o値

相関係数の検定のo値 のページにまとめています。

参考文献

21-6. 母比率の差の信頼区間」  BellCurbe 統計WEB
母比率の差の信頼区間は、このサイトを参考にさせていただきました。
https://bellcurve.jp/statistics/course/18452.html?srsltid=AfmBOorEgW6RxFd4j1pK8EAUpshCQGVFgvUrhcZcHNOoSrg-tdwpAM8J


21-1. 母比率の信頼区間の求め方1」  BellCurbe 統計WEB
母比率の信頼区間は、このサイトを参考にさせていただきました。
https://bellcurve.jp/statistics/course/9122.html?srsltid=AfmBOoorHFHf1Q7nW2Es29kwKcEkbP-SRDHJ-lSQhVrjYPVgix7kOSMb



順路 次は 比率の差の検定のo値

データサイエンス教室