まれに発生するものの分布は、ポアソン分布を元にすると良いことが知られています。
「まれに発生するもの」と言うとイメージがわきにくいと思います。 品質学 の分野の例で言えば、キズやゴミの数のデータは、ポアソン分布を仮定すると、うまく合う事があります。
ポアソン分布は、 発生数の差の検定 、 ポアソン回帰分析 、 u管理図 に応用されています。
ポアソン分布は、平均値と分散の期待値が同じになる点が面白いです。
下の表は、ポアソン分布に従うデータを11セット作って、平均値(Mean)と、分散(Var)を計算してみたものです。
いずれもサンプル数は、10万個あります。
「平均値と分散の期待値が同じ」ということは、イメージがわきにくいですが、 実際のデータで、平均値と分散を計算すると、まったく同じではないですが、ほぼ同じ値になることが、その意味になります。
ポアソン分布に従う分布は、平均値と分散が密接な関係を持っています。この点が、 正規分布 との大きな違いです。
ところで、上記の話は、純粋にポアソン分布に従うデータの話です。 実際のデータでは、ポアソン分布に従うこと以外の原因でも、ばらつきがあるかもしれません。
このような場合、分散や標準偏差では、ポアソン分布以外の原因によるばらつきの影響が評価できません。
このようなばらつきの指標としては、分散を平均値で割る方法が考えられます。 この指標の発想は、 変動係数 と似ています。
順路 次は 正規分布から作られる分布