トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

帰無仮説と対立仮説の検定

2種類の対立仮説 のページにあるように、 ネイマン・ピアソン流の検定 では、分布が2つあります。

分析の作業が1つの場合

サンプル数を固定する統計学 では、 有意水準、検出力、サンプル数の設計 を事前にします。

この場合、帰無仮説について、P値を調べて、有意水準以下かどうかを見ることで、 第1種と第2種の誤り の両方を考慮した分析になっています。

分析の作業が2つ必要な場合

一方、有意水準、検出力、サンプル数の設計 を事前にしていない場合、帰無仮説が否定されたからといって、直ちに対立仮説が肯定される理論にはなっていません。

「では、対立仮説はどうやって検証するのか?」となりますが、帰無仮説と同じ手順で調べます。

「サンプル数を増やせば、検出力が上がる」という解釈における誤解

「サンプル数を増やせば、検出力が上がる」というのは、その通りなのですが、 サンプル数を増やすと、どんなに小さな差でも、有意になるという、検定方法の特徴と、同じ話になっています。

サンプル数が多い事によって、意味のない差について、「有意な差」があるとなって、研究結果が間違った方向に進んでしまう問題に対しての対策にはなっていません。

「P値だけで判断するのは、研究方法として間違い」ということの対策として、一般的な解説では、「検出力でも確認する」が候補になることがあるようです。 ただし、その考え方は、フィッシャー流と、ネイマン・ピアソン流を混同して、「どんな検定でも、対立仮説の分析が必要」という誤解によるところがあるようです。

「P値が小さく、検出力が高い」の意味

「P値が高いというのは、第1種の過誤をしにくく、検出力が高いというのは、第2種の過誤をしにくい」という解釈が、一般的なようです。 ただし、この解釈が正しいのは、統計量の数字の違いだけの検証を目的としている場合になります。

統計量の分布 は、サンプル数が多ければ、どんなに小さな差でも、P値が限りなく小さく、検出力が限りなく大きく性質があるので、データ全体について差の有無を議論したい時は、参考にならない指標です。





順路 次は ベイズ流の検定

データサイエンス教室