回数や個数のデータは、ポアソン分布を元にすると良いことが知られています。
品質学 の分野の例で言えば、キズやゴミの数のデータは、ポアソン分布を仮定すると、うまく合う事があります。
ポアソン分布は、 発生数の差の検定 、 ポアソン回帰分析 、 u管理図 に応用されています。
ポアソン分布は、平均値と分散の期待値が同じになる点が面白いです。
下の表は、ポアソン分布に従うデータを11セット作って、平均値(Mean)と、分散(Var)を計算してみたものです。
いずれもサンプル数は、10万個あります。
「平均値と分散の期待値が同じ」ということは、イメージがわきにくいです。 実際のデータで、平均値と分散を計算すると、まったく同じではないですが、ほぼ同じ値になります。
ポアソン分布に従う分布は、平均値と分散が密接な関係を持っています。この点が、 正規分布 との大きな違いです。
ところで、上記の話は、純粋にポアソン分布に従うデータの話です。 実際のデータでは、ポアソン分布に従うこと以外の原因でも、ばらつきがあるかもしれません。
このような場合、分散や標準偏差では、ポアソン分布以外の原因によるばらつきの影響が評価できません。
このようなばらつきの指標としては、分散を平均値で割る方法が考えられます。 この指標の発想は、 変動係数 と似ています。
「ポアソン分布は、稀にしか起きない事、滅多に起きない事を扱うための分布。例えば、地震や交通事故のデータ」と説明されることが世の中では多いですが、 筆者は、この解釈は誤解と思っています。
ポアソン分布は、稀な現象専用の分布ではない のページにまとめています。
順路
次は
正規分布から作られる分布