有意水準と検出力とサンプル数 の理論は、1群の検定についての説明になっています。
「2群の場合は、どうなのか?」このページの話です。
ここで1群の検定の手順を考えてみます。 詳しくは、 有意水準と検出力とサンプル数 にあります。
1群の検定では、データは、1群のものです。 一方、仮説にする分布は、帰無仮説用・対立仮説用の2つがあります。
1群の検定は、「データは、2つの分布のどちらに近いのか?」という方法として作られています。
2群を扱う検定は、平均値の差や、分散の比、など、2群の違いを調べるものです。
平均値の差の検定は、「平均値の差」という量のばらつきを調べる方法として、作られています。 2群の差の分散は、2群の分散の和になっていることを使って、2群の差のばらつきを調べます。
そのため、分析の最初では2群を扱っていますが、途中から1群の検定(平均値の検定)と同じ手順になっています。
分散の比も、同様で、途中から1群の検定になります。
したがって、2群の検定でも、帰無仮説用・対立仮説用の2つの分布を扱います。 差の場合は、差を平均値と見た時に、帰無仮説用は平均値が0で、対立仮説用は特定の値です。 比の場合は、比を平均値と見た時に、帰無仮説用は平均値が1で、対立仮説用は特定の値です。
平均値の差の検定の仕組み では、平均値の差の検定の理解の仕方として、2通りを説明しています。 「平均値の差は、平均値の分布のばらつきが何個分か?」という理解の仕方をしている時は、データが1群にまとめられていないです。
データが2群あって、その違いの有無を見ることが目的なら、仮想の分布として、帰無仮説用・対立仮説用の2つの分布を考える必要がなくなる、と筆者は考えています。
2群の検定は、伝統的に1群の検定に帰着させることで、方法が作られていますが、「2群には、2群用の検証方法がある」というのが、筆者の考え方です。
2群の検定では、帰無仮説と、帰無仮説と論理的に逆な対立仮説を考えれば良く、帰無仮説用・対立仮説用の2つの分布を考える必要はないと考えています。 こちらの方法の方が、シンプルです。
筆者は、上記のように考えて来た結果、「 ネイマン・ピアソン流の検定 の考え方は、1群の検定をする時に、判断ミスをしないために役立つことがあるが、2群の検定では不要では?」というのが、現時点での見解です。
2群を2群のまま分析するアプローチの場合、サンプル数の決め方が簡単です。 信頼区間・標準誤差から決める方法 の一種になります。
例えば、「平均値の差が、標準誤差より大きければ、有意とする」と決めるのなら、
に平均値の差と、標準偏差を代入すれば、サンプル数が求まります。
例えば、平均値の差が1で、標準偏差が両方とも1で、サンプル数が同じなら、右辺は、
1/(2/サンプル数の平方根)
です。よって、
サンプル数 > 4
という数字が出て来ます。
上の例の場合、群1、群2について、それぞれサンプルを4つずつ用意して、平均値と標準偏差を求めます。
(群1の平均値 − 群2の平均値)/(群1の標準偏差/群1のサンプル数の平方根 + 群2の標準偏差/群2のサンプル数の平方根)
を計算した時に、1よりも大きい数字が出た場合、「サンプル数が大きかったから」という可能性は排除できます。
平均値の差が大きかった可能性と、標準偏差が小さかった可能性だけになります。
「サンプルサイズの決め方」 永田靖 著 朝倉書店 2003
平均値の検定、平均値の差の検定、分散の比の検定、など、一般的な検定について、
統計学的な決め方で、対立仮説を決める方法を紹介しています。
順路 次は 不偏検定と最強力検定