トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

第1種と第2種の誤り

検定 では、データのグループに 正規分布 などの分布を当てはめることで、 「このデータは、このグループのデータではない」という判定ができるようにしています。

とても便利な理論なのですが、弱点もあります。 その弱点は、第1種の誤り(第1種の過誤)と、第2種の誤り(第2種の過誤)の2種類があります。

第1種の誤り

正規分布 に限らず、検定で使われる分布は、無限に裾野が広がっている形をしています。 裾野というのは、確率的に発生しにくい領域です。

検定では、この裾野の領域にあるデータは、「このグループのデータではない可能性がある」と考えることで、判定をします。

この判定に使う基準の確率は、有意水準やα(アルファ)と呼ばれています。

無限に裾野が広がる分布を使いますので、 有意水準を0に設定することはできません。 一般的には、5%(0.05)を使うことが多いです。

この5%の意味は、「このグループのデータなのに、『このグループではない』、と、間違って判定してしまう確率が5%ある」という意味になります。 このような間違いが、第1種の誤りです。

第2種の誤り

例えば、1組の平均点が70点で、2組の平均点が80点だったとします。

1組のAさんが78点でした。 2組のBさんは73点でした。

1組のAさんを正しく分類するために、「79点未満なら1組、79点以上なら2組」という判定基準を作った場合、 Bさんは1組と判定されてしまいます。 このような間違いが、第2種の誤りです。

ちなみに、1組のCさんが81点だったために、「2組」と判定されてしまう間違いは、第1種の誤りになります。

検定をする時は、注目しているグループの分布のことばかり考えがちですが、 第1種の誤りの確率を少なくすることを優先すると、第2種の誤りの確率が高くなります。

第1種の誤りの確率はαと呼ばれることがありますが、第2種の誤りの確率はβ(ベータ)と呼ばれます。

検出力

βが小さくなると、(1−β)は大きくなります。

(1−β)は「検出力」と呼ばれます。 検出力が高いということは、第2種の誤りが起きにくいということになります。 検出力は、「陽性のものは、陽性と正しく判定したい」と言った目的がある時の、指標になります。

第1種と第2種のバランス

製造業の 品質管理 、等で合格基準(しきい値・閾値)を厳しくして、不良品の疑いのあるものを積極的に不合格と判定すると、 良品を「不合格」として、捨ててしまう確率が上がります。 これは、第1種の誤りが増えていることになります。 そのため、合格基準はできるだけ甘くしたいです。

一方で、合格基準が甘くなると、不良品を「合格」と判定して顧客に届けてしまう確率が上がります。 これは、第2種の誤りが増えていることになります。

消費者の立場では、合格基準は厳しいのが当たり前と思いますが、 合格基準が厳しいことによって、良品を大量に捨ててしまうようなことが起こると、 経営が成り立たなくなって来ますし、環境にも良くないです。

厳しい合格基準でも、歩留100%になるようなものづくりができれば、問題はないのですが、 そうはなかなかならないので、いつも2種類の誤りのバランスは考える必要があります。



順路 次は 多重性の問題

Tweet データサイエンス教室