トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

2群の検定の対立仮説

有意水準と検出力とサンプル数 の理論は、1群の検定についての説明になっています。

「2群の場合は、どうなのか?」このページの話です。

1群の検定の手順

ここで1群の検定の手順を考えてみます。 詳しくは、 有意水準と検出力とサンプル数 にあります。

1群の検定では、データは、1群のものです。 一方、仮説にする分布は、帰無仮説用・対立仮説用の2つがあります。

1群の検定は、「データは、2つの分布のどちらに近いのか?」という方法として作られています。

2群の検定の扱い方

2群を扱う検定としては、平均値の差や、分散の比の検定などがあります。

平均値の差の検定は、「平均値の差」という量のばらつきを調べる方法として、作られています。 そのため、分析の最初では2群を扱っていますが、途中から1群の検定(平均値の検定)と同じ手順になっています。

平均値の差の検定を、フィッシャー流で進める場合、帰無仮説は「差が0」、対立仮説は「差が0ではない」となります。

ネイマン・ピアソン流で進める場合、帰無仮説は「差が0」、例えば、対立仮説は「差が1」となります。

分散の比も、同様で、途中から1群の検定になります。仮説の置き方は、平均値の差の検定と同様です。

もうひとつの2群の検定

平均値の差の検定の仕組み では、平均値の差の検定の理解の仕方として、2通りを説明しています。 上記で説明したのは、教科書的な説明の方です。 t検定やz検定を使います。

直観的な説明の方の場合、データが1群にまとめられていないです。

データが2群ある場合、帰無仮説は「2群は同じ」、対立仮説は「2群は異なる」になります。

この場合の検定の方法としては、 分散分析 が開発されています。

2群の検定のサンプル数の決め方

2群を2群のまま分析するアプローチの場合、サンプル数の決め方が簡単です。 信頼区間・標準誤差から決める方法 の一種になります。

例えば、「平均値の差が、標準誤差より大きければ、有意とする」と決めるのなら、

に平均値の差と、標準偏差を代入すれば、サンプル数が求まります。

例えば、平均値の差が1で、標準偏差が両方とも1で、サンプル数が同じなら、右辺は、

1/(2/サンプル数の平方根)

です。よって、 

サンプル数 > 4

という数字が出て来ます。

決定したサンプル数の使い道

上の例の場合、群1、群2について、それぞれサンプルを4つずつ用意して、平均値と標準偏差を求めます。

(群1の平均値 − 群2の平均値)/(群1の標準偏差/群1のサンプル数の平方根 + 群2の標準偏差/群2のサンプル数の平方根)

を計算した時に、1よりも大きい数字が出た場合、「サンプル数が大きかったから」という可能性は排除できます。

平均値の差が大きかった可能性と、標準偏差が小さかった可能性だけになります。



参考文献

サンプルサイズの決め方」 永田靖 著 朝倉書店 2003
平均値の検定、平均値の差の検定、分散の比の検定、など、一般的な検定について、 統計学的な決め方で、対立仮説を決める方法を紹介しています。




順路 次は 不偏検定と最強力検定