信頼区間がゼロの統計学(統計学の不可能性) では、「その測定システムはどのくらいの能力で作られているのか?」、「有効数字がどのくらいなのか?」、という情報がものすごく重要です。
あらかじめわかっていれば良いのですが、そうではない時の推定方法を考えてみました。
上のヒストグラムは、
信頼区間に最小値がある統計学
のページと同じデータです。
ヒストグラムを見ると、-6から6まで範囲があります。
ゲージR&R のような考え方をすると、この位の範囲だと、0.1刻みくらいが精確に測れていれば十分です。 1刻みでもある程度は使えます。
唐突ですが、一番左の列のようなデータがあった場合に、1刻みの時は・・・、という風にして変換したものが右側の列です。
例えば、0.996727309は、1刻みだと1になり、0.001刻みだと0.997になります。
有効数字や分解能による誤差
の影響として、分散を計算したのが、下のグラフになります。
元のデータは、標準偏差が1なので、分散は1です。
このグラフから刻みが0.2になると、分散は0.01よりも小さいことがわかります。
元の分散が1なので、これの意味するところは、刻みが0.2になると有効数字や分解能の誤差の影響は、1%よりも小さいということになります。
つまり、標準偏差が1の分布の場合、刻みが0.2くらいでも元のデータの様子を十分に考察できます。
信頼区間に最小値がある統計学 のページに、現実的にどのくらいの精度でデータが取れるのか、といった話があります。
真の値がひとつあって、それを測ろうとして、標準偏差が1くらいになるのなら、刻みが0.2くらいで十分です。 それよりも細かい数値があったとしても、それが測れているとは考えにくいです。
細かい数値が測れているものだとしたら、標準偏差が1という大きな数値になっていることの理由を考える必要があり、 この数値が小さくなるようにしないと、細かい数値が役に立たないです。 「真の値がひとつ」という前提が成り立っていない可能性があります。
そのため、計算上は0.2よりも小さな差があったとしても、有効数字の観点では0になります。 信頼区間に最小値がある統計学 の話に戻るのですが、このような時は、検定をしなくても「差がない」と言えます。
スモールデータの検定の効果量 のところに、「0.8なら大きな効果」と考え、「0.2なら小さな効果」とあります。
効果量というのは、平均値の差を、標準偏差で割って標準化することによって、標準偏差が1の分布の知識を参照できるようにしたものです。
よって、効果量の話の0.2というのは、上記で標準偏差が1の分布で刻みが0.2と言っている時の0.2と、モノサシが同じです。 そのため、効果量で0.2を目安にするという話は、測定システムの精度が高く、0.2くらいが刻みになっている場合に対応しています。
品質工学 では 二段階設計 といって、まず、ばらつきを改善しようとします。 平均値の改善は2段階目にしています。
小さな平均値の差を「差がある」と明確に言いたいのなら、 まず、ばらつきを小さくして、真の値を少しでも精確に測れるようにする方針が理想的です。 (そうだとわかっていても、実際には難しいことが多いですが)
順路 次は アンケート・感性評価