トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

平均値の意味の使い分け

平均値 は、 統計学 の初歩で出て来る知識です。 そのため、何気なく扱われることが多いです。

「平均値には種類がある」という話としては、「相加平均・相乗平均」、「移動平均」、「トリム平均」といった話題もありますが、それらは計算方法の話です。

このページの話は、「同じ計算をしていていも、平均値を求めるデータの内容によって、平均値の意味が違う」という話です。

平均値の意味の種類

真の値に固有の意味がある平均値

ひとつは、真の値に固有の意味がある平均値です。

例えば、ある人の体重の測定値です。

これは、真の値が必ずあるはずですが、測定のばらつきがあるので、測った値が、真の値である保証はありません。 そこで、複数回測った平均値で、真の値を推定します。

真の値に固有の意味がある平均値は、精確な 測定 と密接な関係があります。

真の値に固有の意味がない平均値

もうひとつは、真の値に固有の意味がない平均値です。集団を表現する時の代表値としての平均値は、こういう平均値です。

これは、例えば、同じ体重でも、市民全員の体重の平均値です。例えば、100人をサンプリングして、その体重を測ります。

集団としての真の値はあって、測った値が、真の値である保証はないのは、上記の場合と同じです。 ただし、真の値を測れたとしても、その値の人がいる訳ではないので、意味合いが異なります。

頻度論とベイズ論の違いとの関係

信頼区間と確信区間の使い分け は、頻度論とベイズ論の使い分けでもあります。

頻度論とベイズ論を比べた話題では、「〇〇の方が正しい」、「××の方が優れている」といった議論が昔からあります。 この議論の中で、このページのような「真の値に固有の意味があるか」という観点は出て来ないようなのですが、 筆者としては、「真の値に固有の意味があるか」という観点で扱っているデータを区別すると、使い分けがスッキリするように思っています。




順路 次は 標準偏差(ばらつきの尺度)

Tweet データサイエンス教室