トップページ |
ひとつ上のページ |
目次ページ |
このサイトについて | ENGLISH
比率の差は、とてもシンプルな指標です。 百分率にして(100倍して)、「今回の選挙では、投票率が5ポイント上がりました」、といった感じで、ニュースなどでも使われる指標です。
ところで、 100/1000 と 400/2000の差と、1/10 と4 /20の差は、どちらも0.1です。
しかし、同じ0.1でも、0.1の信頼性や正確さは違います。 比率の差の検定では、データの数も考慮して、「0.1」という数字に差があるといえるのかどうかを判定することに使います。
平均値の差の検定 では、データのばらつきや数を考慮して、平均値に差があるのかを判定することと似ています。
このようなデータでは、薬の効果が評価したいです。 比率の差の検定は、このような目的に使います。
品質学 の分野では、比率の差の検定は、「母不適合品率の差の検定」や、「母不良率の差の検定」と呼ばれています。 こちらの名前の方が、参考文献は多いようです。
比率の差の検定は、2つの方式があります。 見た目は違うものの、データが同じなら、P値も同じになります。
比率の差の検定として、品質管理関係では、z検定の方式が教えられることが多いようです。 カイ二乗検定の方式を説明する文献もあります。
ひとつは、「比率の差」という量を、 z検定 を使って、検定する方式です。
カイ二乗検定の方式とP値は同じなのですが、比率の差について、直接的に調べるのは、z検定の方式の方なので、こちらの方がわかりやすいです。 また、 21世紀の、比率の差の検定 のページにあるように、効果量などへの応用は、こちらの方式の方が考えやすいです。
もうひとつは、2×2の分割表についての カイ二乗検定(独立性の検定) で進めるルートです。
z検定の方式は、z値を求めて検定します。 カイ二乗検定の方式は、カイ二乗値を求めて検定します。
スタートが違うのですが、式を変形すると、同じになっています。 下の式は、分割表が、a,b,c,dの4つの成分になっている場合です。
ちなみに、
有効数字
を知っていると、
100/1000 = 0.100
400/2000 = 0.200
なので、差は0.100になります。また、
1/10 = 0.1
4/20 = 0.2
なので、差は0.1になります。
このように考えて、 「同じ0.1でも、0.1の信頼性や正確さは違います。」とも言えます。
この考え方だと、
「8/80 と 8/40の差と、1/10 と 4/20の差」
については、「同じです」となります。
比率の差の検定をすると、p値(p-value)は、0.2171となります。 結論は、有効数字の考え方と変わらないです。
有効数字で考える場合は、桁の数を使って比べるので、桁の数が変わるほど違わないと、違いがわからないのですが、 比率の差の検定を使う場合は、p値を使えるので、データ数の細かな違いがわかります。
Rの実施例は、 Rによる違いの有無の分析 のページにあります。 Rは、カイ二乗検定のルートを使っています。
Rがインストールされていないパソコンやタブレットなど、手軽にやるには、
R-QCA1
が良いかと思います。
必要な4つの数値を入力すると、グラフとセットで結果が出ます。
「SPSSによるリスク解析のための統計処理」 石村貞夫・石村園子 著 東京図書 2004
オッズ比の計算や、比率の差の検定など。
順路
次は
発生数の差の検定
