トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

有効数字と分解能

有効数字は、数値のデータとして意味のある範囲のことです。 例えば、「体温を測ったら36.50017℃でした。」という話を聞いたら、 「ちゃんと測れているのは36.5までで、最後の17は意味のない数字だろう」、というのは常識的にわかると思います。

分解能は、数値のデータの刻みになっているものです。 0.2刻みだとしたら、0.1842や1.003といった細かい数字が出ないので、有効数字と同じ特徴があります。 有効数字と違うのは、例えば、「0.2、0.4」というデータがあった時に、有効数字を考えている時は、0.1のような数字が出て来ることはあり得るのですが、 分解能が0.2だとしたら、0.1という数字が出てくることはあり得ないです。

有効数字による落とし穴

データベース からデータを持って来て、データ解析しよう。」となっている時には、有効数字は忘れがちです。

データベースには、データの桁数が予め決まっているところにデータが入っている事があります。 そのため、有効数字は1桁しかない数字でも、非常にたくさんの桁の数字として、データベースの中に入っていることがあります。

見かけ上はたくさん桁があるので、細かな桁の部分まで解析してしまいがちですが、 無意味な解析になっています。

また、大きな数と小さな数を足したり引いたりする時には、有効数字が原因でおかしな結果になる事がありますが、 有効数字を気にしないで計算していると間違いに気付けません。

有効数字

3.0」という風に書かれている数字の場合、有効数字は2桁ということになります。 「3」の場合、有効数字は1桁になります。 このように、有効数字を意識している時には、表記の仕方に注意が必要です。

有効数字が意識されている上で、 「20」という風に書かれているのでしたら、有効数字は2桁ということになります。 有効数字が1桁の確からしさしかないのでしたら、 例えば、「2*10」と書きます。

データベースの中のデータを扱う場合は、非常にたくさんの桁があっても、 有効数字は、上の方の桁のいくつかであることが多いです。 有効数字が見た目の桁数で判断できませんので、有効数字を知るには、複数のデータを見比べたり、 測定の仕組み自体を調べる必要があります。

有効数字で計算の確かな部分がわかる

3.0 + 2.0」の場合、答えは「5.0」で有効数字は2桁です。

3 + 2」の場合、答えは「5」で有効数字は1桁です。

3.0 + 2」の場合、答えは「5」で有効数字は1桁です。

足し算では、答えの有効数字は有効数字が一番少ないものになります。 掛け算や割り算でも同様です。

大きな値と小さな値が入っている場合の難しさ

3.0 + 0.0012」の場合、答えは「3.0012」ではなく、「3.0」で有効数字は2桁です。 このように、有効数字が増えるということはないです。 ものすごく精密に測ったデータが混ざっていても、その精密さは答えには影響できません。

また、このような計算をすると、足し算をした意味がなくなってしまいます。 この足し算をするには、「3.0000」として、5桁分の有効数字を確保しておく必要があります。

引き算の難しさ(桁落ち)

2.23 - 2.21」の場合、有効数字が3桁同士の計算ですが、答えは「0.02」で有効数字は1桁です。

引き算の場合、有効数字が減ってしまうことがあります。 これは「桁落ち」と呼ばれます。

桁落ちは、ほんの少ししか違わない数字同士の引き算で起きやすいです。 例えば、 標準偏差標準化 、等、引き算が含まれている計算では注意が必要です。

上記の例でしたら、一度有効数字が1桁になってしまったら、 その後の計算で、有効数字が3桁の数字と足し算や掛け算をした時に、答えの有効数字が1桁になってしまいます。

桁落ちは、計算の順番を変えると回避できることがあります。




順路 次は 有効数字や分解能による誤差

データサイエンス教室