比率の差の検定

比率の差は、とてもシンプルな指標です。百分率にして（100倍して）、「今回の選挙では、投票率が5ポイント上がりました」、といった感じで、ニュースなどでも使われる指標です。

ところで、 100／1000　と　400／2000の差と、1/10 と4 /20の差は、どちらも0.1です。

しかし、同じ0.1でも、0.1の信頼性や正確さは違います。比率の差の検定では、データの数も考慮して、「0.1」という数字に差があるといえるのかどうかを判定することに使います。

平均値の差の検定では、データのばらつきや数を考慮して、平均値に差があるのかを判定することと似ています。

このようなデータでは、薬の効果が評価したいです。比率の差の検定は、このような目的に使います。

母不良率の差の検定

品質学の分野では、比率の差の検定は、「母不適合品率の差の検定」や、「母不良率の差の検定」と呼ばれています。こちらの名前の方が、参考文献は多いようです。

比率の差の検定は、２つの方式があります。見た目は違うものの、データが同じなら、P値も同じになります。

比率の差の検定として、品質管理関係では、z検定の方式が教えられることが多いようです。カイ二乗検定の方式を説明する文献もあります。

ひとつは、「比率の差」という量を、 z検定を使って、検定する方式です。

カイ二乗検定の方式とP値は同じなのですが、比率の差について、直接的に調べるのは、z検定の方式の方なので、こちらの方がわかりやすいです。また、 21世紀の、比率の差の検定のページにあるように、効果量などへの応用は、こちらの方式の方が考えやすいです。

もうひとつは、２×２の分割表についてのカイ二乗検定（独立性の検定）で進めるルートです。

z検定の方式は、z値を求めて検定します。カイ二乗検定の方式は、カイ二乗値を求めて検定します。

スタートが違うのですが、式を変形すると、同じになっています。下の式は、分割表が、a,b,c,dの４つの成分になっている場合です。

比率の差の検定

ちなみに、有効数字を知っていると、
100／1000　＝　0.100
400／2000　＝　0.200
なので、差は0.100になります。また、
1／10　＝　0.1
4／20　＝　0.2
なので、差は0.1になります。

このように考えて、「同じ0.1でも、0.1の信頼性や正確さは違います。」とも言えます。

この考え方だと、
「8／80　と　8／40の差と、1/10 と 4/20の差」
については、「同じです」となります。

比率の差の検定をすると、p値（p-value）は、0.2171となります。結論は、有効数字の考え方と変わらないです。

有効数字で考える場合は、桁の数を使って比べるので、桁の数が変わるほど違わないと、違いがわからないのですが、比率の差の検定を使う場合は、p値を使えるので、データ数の細かな違いがわかります。

Rの実施例は、 Rによる違いの有無の分析のページにあります。 Rは、カイ二乗検定のルートを使っています。

Rがインストールされていないパソコンやタブレットなど、手軽にやるには、 R-QCA1 が良いかと思います。必要な４つの数値を入力すると、グラフとセットで結果が出ます。
ウェブアプリ　R-QCA1

「SPSSによるリスク解析のための統計処理」　石村貞夫・石村園子　著　東京図書　2004
オッズ比の計算や、比率の差の検定など。