トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

発生数の差の検定

このページの名前は、「発生数の差の検定」にしましたが、一般的ではないです。

「欠点数の差の検定」、「不適合数の差の検定」という名前だと、参考文献が見つかります。 ただ、「欠点数」や「不適合数」というのは、 品質学 の分野の言葉なので、それ以外の分野の人には、わかりにくさになっています。

発生数のデータについての分析方法です。

発生数とは

発生数というのは、発生回数や生起回数とも呼ばれます。

より正確には、単位時間内、1個当たりなど、何らかの範囲の中での、発生数のことです。

発生数はポアソン分布で

発生数を目的変数Yにする回帰分析として、 ポアソン回帰分析 があります。

発生数の差の検定も、ポアソン分布を元にした検定になります。

発生数と比率の関係

それぞれのサンプルについて、0と1に相当するものしかない場合、 比率の差の検定 になります。

発生数の検定は、それぞれのサンプルについて、0以上の整数のデータがある場合です。

例えば、「発生数が10以上は、不良品」というルールがあると、発生数のデータは、比率のデータに変換できます。

そのため、工場のデータ分析では、同じデータに対して、比率で考える場合と、発生数で考える場合の、2つの見方ができます。

発生数の差の検定の形

分散の比の検定 は分散の比が従うF分布を直接使う、F検定が開発されています。

発生数の差の検定については、ポアソン分布を直接使う方法は、世の中にないようです。 ポアソン分布は、期待値について、平均値がλ、分散がλになるので、 それらを 平均値の差の検定 に当てはめて定式化されています。

分母のλは、全体の平均の発生数です。

サンプル数が1個ずつでもできる?!

発生数の差の検定の最大の特徴は、サンプル数が1個ずつでもできることです。

平均値の差の検定 では、標準偏差を使うので、最低でも1つの群のサンプル数は、2個以上必要です。 計数の差の検定 としては、発生数の差の検定と仲間になっている 比率の差の検定 でも、比率を計算するためには、サンプル数が2個以上必要です。

しかし、発生数の差の検定で使う ポアソン分布 は、平均値が25なら、分散も25で、標準偏差は5です。 「平均値」という名前が正しいかは別にすれば、平均値は、データが1個あれば求まるので、ポアソン分布では、サンプル数は1個からできます。

ばらつきが考慮されない?!

平均値の差の検定 では、平均値と標準偏差を計算して、両方を使って検定をします。

一方、 比率の差の検定 でも同様ですが、計数の差の検定 では、平均値を計算すれば、標準偏差に相当するものは、平均値のちょっとした加工で求まります。

平均値の差の検定 は、「検定は、データのばらつきを考慮して、評価する方法」という理解の元で使われますが、計数の差の検定は、そのような手法にはなっていないです。



質的変数のばらつきの尺度

参考文献

2つの母不適合数の差の検定を例題で解説 〜統計的検定(その10)〜」 QCとらのまき
「2つの母不適合数の差の検定」という名前で紹介しています。
https://qctoranomaki.com/sqc/statistical-testing/step10/


順路 次は 21世紀の検定

データサイエンス教室