検定 では、データのグループに 正規分布 などの分布を当てはめることで、 「このデータは、このグループのデータではない」という判定ができるようにしています。
とても便利な理論なのですが、弱点もあります。 判断ミスの可能性です。
正規分布 に限らず、検定で使われる分布は、無限に裾野が広がっている形をしています。 裾野というのは、確率的に発生しにくい領域です。
検定では、この裾野の領域にあるデータは、「このグループのデータではない可能性がある」と考えることで、判定をします。
この判定に使う基準の確率は、有意水準やα(アルファ)と呼ばれています。
無限に裾野が広がる分布を使いますので、 有意水準を0に設定することはできません。 一般的には、5%(0.05)を使うことが多いです。
5%(0.05)を基準にしますが、「判定ミスの確率が5%」という意味ではないです。
5%の確率になるくらい起こりにくいことという意味です。
統計学の解説では、 第1種と第2種の誤り という種類があります。
上記の話は、第1種の話と類似していますが、 フィッシャー流の検定 では、第2種に相当するものは、ないです。
順路 次は 多重性の問題