平均値 は、 統計学 の初歩で出て来る知識です。 そのため、何気なく扱われることが多いです。
「平均値には種類がある」という話としては、「相加平均・相乗平均」、「移動平均」、「トリム平均」といった話題もありますが、それらは計算方法の話です。
このページの話は、「同じ計算をしていていも、平均値を求めるデータの内容によって、平均値の意味が違う」という話です。
ひとつは、真の値に固有の意味がある平均値です。
例えば、ある人の体重の測定値です。
これは、真の値が必ずあるはずですが、測定のばらつきがあるので、測った値が、真の値である保証はありません。 そこで、複数回測った平均値で、真の値を推定します。
真の値に固有の意味がある平均値は、精確な 測定 と密接な関係があります。
もうひとつは、真の値に固有の意味がない平均値です。集団を表現する時の代表値としての平均値は、こういう平均値です。
これは、例えば、同じ体重でも、市民全員の体重の平均値です。例えば、100人をサンプリングして、その体重を測ります。
集団としての真の値はあって、測った値が、真の値である保証はないのは、上記の場合と同じです。 ただし、真の値を測れたとしても、その値の人がいる訳ではないので、意味合いが異なります。
信頼区間と確信区間の使い分け は、頻度論とベイズ論の使い分けでもあります。
頻度論とベイズ論を比べた話題では、「〇〇の方が正しい」、「××の方が優れている」といった議論が昔からあります。 この議論の中で、このページのような「真の値に固有の意味があるか」という観点は出て来ないようなのですが、 筆者としては、「真の値に固有の意味があるか」という観点で扱っているデータを区別すると、使い分けがスッキリするように思っています。
順路
次は
標準偏差(ばらつきの尺度)