トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

誤差の原因

誤差の原因は、ケースバイケースです。 筆者がそうだったのですが、 実際に誤差の原因を探す時には、すべてを網羅しない調べ方をしていることがあります。 場数を踏むと、だんだん見落としが減るようです。

誤差の種類と、原因の関係

誤差の種類には、 偶然誤差と系統誤差 がありますが、筆者が解析する時は、「誤差の原因は系統誤差」と思っている事が多いです。

偶然誤差と思っているのは、 同じサンプルを繰り返し測定した時の誤差です。 これは、驚くほど 正規分布 が当てはまる事が多いです。

誤差の原因

誤差の原因は、横並びではなく、階層構造になっています。 下記の場合は、下に書いてあるものほど、根本的な原因です。

測定器による繰り返し誤差

「測定精度」とも言われます。 同じものを同じように測定しても、測定値が違う時の誤差です。

測定試料を測定器に置く時のわずかな違いや、 測定器の振動、等が原因になっていることがあります。

測定器の違いによる誤差

「機差」とも言われます。 同じものを測っても、測定器が違うと異なる値が出る時の誤差です。 片方の測定器で測った値は、必ず高めになったりすることで、発覚します。

同じメーカーの同じ型番の測定器でも、異なることがあります。一般的には、
型番が違う
 → 測定原理は同じだが、メーカーが違う
 → 測定原理が違う
の順で誤差は大きくなりがちです。

型番が違うだけだたと、校正の問題なので、値を合わせることは、比較的簡単です。 もっと根本的なところが違っていると、平均値の違いと、繰り返し誤差の違いの、両方が問題になっていたりしますので、 合わせ切れないこともあります。

サンプリングによる誤差

均質でないものを サンプリング した時に出る誤差です。

プロセスによる誤差

異常状態の工程解析 では、真っ先に注目される誤差です。 同じ条件で同じように作っているつもりでも、 外気の温度の違いや、製造装置の違いが、誤差になることがあります。

ちなみに、測定装置の違いだけでなく、製造装置の違いも「機差」と呼ばれます。

人による誤差

人が違うことも誤差の原因になります。 人による誤差は、測定器による誤差、サンプリングの誤差、プロセスの誤差のすべてで起きることがあります。 人が原因になる時は、大きく2つに分かれるようです。

ひとつは、「手がぶれにくい」、「姿勢を一定にできる」等の作業のばらつきの個人差です。

もうひとつは、作業手順の違いによるばらつきです。 いつも同じ動きをしていても、個人で手順が違っていることで、測定値が変わることがあります。 これは、 標準化 が伝統的な対策方法です。

誤差の分離

確信がない限りは、 誤差の大きさは確認する必要があります。 例えば、測定器の繰り返し誤差を確認するには、同じサンプルを何回も測定してみる必要があります。 誤差は、 標準偏差 で表せます。 標準偏差の計算方法からもわかりますが、誤差の確認には、複数のデータを測定するのが基本です。

単独の要因の調査の場合は、ひとつの要因について、複数回分のデータがあれば良いのですが、 いくつかの要因が重なっている場合は、計算はややこしくなります。 このサイトでは説明していませんが、 実験計画法 を応用すると、各要因の標準偏差を分離して推定することができます。

上記の要因について、すべての誤差の大きさを見積もろうとすると、 各プロセスについて複数回サンプリング、 各サンプルを複数の測定器で測定、 各測定器での測定は複数回ずつ、 という作業があり、人による差がありそうな場合は、それも加味します。

誤差の原因(水準の違い)

上記の誤差の違いは、 各因子が持っているばらつきが原因です。

誤差の違いとしては、各水準によって、ばらつきが違うということも考えられますが、 分散分析による誤差の分離では、等分散が仮定されているので、各因子によるばらつきは見れても、 その中の水準の違いは見ていません。

水準による違いまで掘り下げる場合には、 品質工学 で使われている 直交表の外側配置 が必要になります。

順路 次は 誤差の伝播

Tweet データサイエンス教室