トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平均値の意味の使い分け

平均値は、統計学の初歩で出て来る知識です。そのため、何気なく扱われることが多いです。

「平均値には種類がある」という話としては、「相加平均・相乗平均」、「移動平均」、「トリム平均」といった話題もありますが、それらは計算方法の話です。

このページの話は、「同じ計算をしていていも、平均値を求めるデータの内容によって、平均値の意味が違う」という話です。

平均値の意味の種類

真の値に固有の意味がある平均値

ひとつは、真の値に固有の意味がある平均値です。

例えば、ある人の体重の測定値です。

これは、真の値が必ずあるはずですが、測定のばらつきがあるので、測った値が、真の値である保証はありません。そこで、複数回測った平均値で、真の値を推定します。

真の値に固有の意味がある平均値は、精確な測定と密接な関係があります。

真の値に固有の意味がない平均値

もうひとつは、真の値に固有の意味がない平均値です。集団を表現する時の代表値としての平均値は、こういう平均値です。

これは、例えば、同じ体重でも、市民全員の体重の平均値です。例えば、100人をサンプリングして、その体重を測ります。

集団としての真の値はあって、測った値が、真の値である保証はないのは、上記の場合と同じです。ただし、真の値を測れたとしても、その値の人がいる訳ではないので、意味合いが異なります。

頻度論とベイズ論の違いとの関係

信頼区間と確信区間の使い分けは、頻度論とベイズ論の使い分けでもあります。

頻度論とベイズ論を比べた話題では、「〇〇の方が正しい」、「××の方が優れている」といった議論が昔からあります。この議論の中で、このページのような「真の値に固有の意味があるか」という観点は出て来ないようなのですが、筆者としては、「真の値に固有の意味があるか」という観点で扱っているデータを区別すると、使い分けがスッキリするように思っています。

順路次は標準偏差（ばらつきの尺度）

杉原データサイエンス事務所によるコンサルティングとセミナー