このページの名前は、「発生数の差の検定」にしましたが、一般的ではないです。
「欠点数の差の検定」、「不適合数の差の検定」という名前だと、参考文献が見つかります。 ただ、「欠点数」や「不適合数」というのは、 品質学 の分野の言葉なので、それ以外の分野の人には、わかりにくさになっています。
発生数のデータについての分析方法です。
発生数というのは、発生回数や生起回数とも呼ばれます。
より正確には、単位時間内、1個当たりなど、何らかの範囲の中での、発生数のことです。
発生数を目的変数Yにする回帰分析として、 ポアソン回帰分析 があります。
発生数の差の検定も、ポアソン分布を元にした検定になります。
それぞれのサンプルについて、0と1に相当するものしかない場合、 比率の差の検定 になります。
発生数の検定は、それぞれのサンプルについて、0以上の整数のデータがある場合です。
例えば、「発生数が10以上は、不良品」というルールがあると、発生数のデータは、比率のデータに変換できます。
そのため、工場のデータ分析では、同じデータに対して、比率で考える場合と、発生数で考える場合の、2つの見方ができます。
分散の比の検定 は分散の比が従うF分布を直接使う、F検定が開発されています。
発生数の差の検定については、ポアソン分布を直接使う方法は、世の中にないようです。
ポアソン分布は、期待値について、平均値がλ、分散がλになるので、
それらを
平均値の差の検定
に当てはめて定式化されています。
分母のλは、全体の平均の発生数です。
発生数の差の検定の最大の特徴は、サンプル数が1個ずつでもできることです。
平均値の差の検定 では、標準偏差を使うので、最低でも1つの群のサンプル数は、2個以上必要です。 計数の差の検定 としては、発生数の差の検定と仲間になっている 比率の差の検定 でも、比率を計算するためには、サンプル数が2個以上必要です。
しかし、発生数の差の検定で使う ポアソン分布 は、平均値が25なら、分散も25で、標準偏差は5です。 「平均値」という名前が正しいかは別にすれば、平均値は、データが1個あれば求まるので、ポアソン分布では、サンプル数は1個からできます。
平均値の差の検定 では、平均値と標準偏差を計算して、両方を使って検定をします。
一方、 比率の差の検定 でも同様ですが、計数の差の検定 では、平均値を計算すれば、標準偏差に相当するものは、平均値のちょっとした加工で求まります。
平均値の差の検定 は、「検定は、データのばらつきを考慮して、評価する方法」という理解の元で使われますが、計数の差の検定は、そのような手法にはなっていないです。
「2つの母不適合数の差の検定を例題で解説 〜統計的検定(その10)〜」 QCとらのまき
「2つの母不適合数の差の検定」という名前で紹介しています。
https://qctoranomaki.com/sqc/statistical-testing/step10/
順路 次は 21世紀の検定