比率分布の重なりの検定は、 比率の全体的な差の検定 の一種です。
差による分布の重なりの検定 と似ているですが、分布の考え方がポイントです。
比率分布というのは、上のグラフのようなものです。
比率を計算するための元データは、例えば、「0が90個、1が10個」といった0と1だけのデータです。 この場合、1の比率は0.1となりますが、これが上のグラフの「0.1」の部分を表します。
このグラフは、グラフの帯の幅を「1」と考えると、面積が「1」となり、確率密度関数として使えます。 確率密度関数は、一般的に山型の分布で表しますが、比率の場合、元のデータが0と1しかないため、このようなグラフで確率密度関数が表せます。
なお、比率分布のこのような表し方は、筆者が考案したものです。 既に世の中にあるかもしれませんが、筆者は見たことがありません。 もしあれば、このページの内容は、それに合わせるつもりです。
比率分布の違いの検定2では、p値の考え方が、基本的に正規分布の差の検定2と同じです。
2つの分布の共通部分の面積をp値とみなします。
2つの比率が、r2とr1で、r2の方が大きい場合、p値は以下の式になります。
p value = r2 + (1 - r1)
EXCELの場合、例えば、A2とB2というセルに2つの比率が入力されている場合、下の式でp値が求まります。
=1+MIN(A2:B2)-MAX(A2:B2)
順路 次は 相関係数の効果量の検定