トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

測定システムに必要な能力の推定(有効数字や分解能の推定)

信頼区間がゼロの統計学(統計学の不可能性) では、「その測定システムはどのくらいの能力で作られているのか?」、「有効数字がどのくらいなのか?」、という情報がものすごく重要です。

あらかじめわかっていれば良いのですが、そうではない時の推定方法を考えてみました。

目分量による簡単な方法


上のヒストグラムは、 信頼区間に最小値がある統計学 のページと同じデータです。

ヒストグラムを見ると、-6から6まで範囲があります。

ゲージR&R のような考え方をすると、この位の範囲だと、0.1刻みくらいが精確に測れていれば十分です。 1刻みでもある程度は使えます。

計算による方法


唐突ですが、一番左の列のようなデータがあった場合に、1刻みの時は・・・、という風にして変換したものが右側の列です。 例えば、0.996727309は、1刻みだと1になり、0.001刻みだと0.997になります。

有効数字や分解能による誤差 の影響として、分散を計算したのが、下のグラフになります。 元のデータは、標準偏差が1なので、分散は1です。 このグラフから刻みが0.2になると、分散は0.01よりも小さいことがわかります。 元の分散が1なので、これの意味するところは、刻みが0.2になると有効数字や分解能の誤差の影響は、1%よりも小さいということになります。

つまり、標準偏差が1の分布の場合、刻みが0.2くらいでも元のデータの様子を十分に考察できます。

有効数字や分解能の推定

信頼区間に最小値がある統計学 のページに、現実的にどのくらいの精度でデータが取れるのか、といった話があります。

真の値がひとつあって、それを測ろうとして、標準偏差が1くらいになるのなら、刻みが0.2くらいで十分です。 それよりも細かい数値があったとしても、それが測れているとは考えにくいです。

細かい数値が測れているものだとしたら、標準偏差が1という大きな数値になっていることの理由を考える必要があり、 この数値が小さくなるようにしないと、細かい数値が役に立たないです。 「真の値がひとつ」という前提が成り立っていない可能性があります。

そのため、計算上は0.2よりも小さな差があったとしても、有効数字の観点では0になります。 信頼区間に最小値がある統計学 の話に戻るのですが、このような時は、検定をしなくても「差がない」と言えます。

効果量との関係

スモールデータの検定の効果量 のところに、「0.8なら大きな効果」と考え、「0.2なら小さな効果」とあります。

効果量というのは、平均値の差を、標準偏差で割って標準化することによって、標準偏差が1の分布の知識を参照できるようにしたものです。

よって、効果量の話の0.2というのは、上記で標準偏差が1の分布で刻みが0.2と言っている時の0.2と、モノサシが同じです。 そのため、効果量で0.2を目安にするという話は、測定システムの精度が高く、0.2くらいが刻みになっている場合に対応しています。

平均値の差を明確にしたいのなら、まず、ばらつきの改善を

品質工学 では 二段階設計 といって、まず、ばらつきを改善しようとします。 平均値の改善は2段階目にしています。

小さな平均値の差を「差がある」と明確に言いたいのなら、 まず、ばらつきを小さくして、真の値を少しでも精確に測れるようにする方針が理想的です。 (そうだとわかっていても、実際には難しいことが多いですが)




順路 次は アンケート・感性評価

Tweet データサイエンス教室