平均値の差の検定 に対してデータ全体の差の検定があり、 分散の比の検定に対して ばらつきの違いの全体的な検定 があるのと同じ位置付けの手法として、 比率の差の検定 に対して筆者が考案したのが、このページの「比率の全体的な差の検定」です。
2つ考えてみました。 いずれもデータ全体の差の検定の2つと似ています。
「2つの比率に違いあると言えるのか」ということを調べるための方法として、一般的には 比率の差の検定 がよく知られています。
この検定で、例えば「30/100」と「33/100」は、p値が0.76となって、「差はない」という結論になります。 また、「300000/10000000」と「303000/10000000」だと、p値が0.0000038となって、「差がある」となります。 比率の差がどんなに小さくても、サンプル数が多ければ、「有意な差がある」となる手法になっています。
そのため、2つの比率の数値があって、それを厳密に「違いがあるか」と調べる方法にはなっているのですが、 「2つの比率の差がどれくらい起きやすいのか?」ということを調べる方法にはなっていません。
左が、比率の差の効果量の検定 です。右が、 比率分布の重なりの検定 です。少し違っています。
順路 次は 比率の差の効果量の検定