トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

信頼区間

筆者の場合、信頼区間は、実験で測定したデータのまとめ方として使い始めたのが最初です。 大学の物理実験で教わりました。 信頼区間を使うと、どのくらいの精度で求めた値なのかを示せます。

信頼区間は、こういう使い方をしているのなら、特に問題がないのですが、「区間の中に真の値が含まれている確率は?」といったことに応用しようとすると、 解釈の仕方が重要になって、世の中ではいろいろと議論があります。

信頼区間は、様々な統計量に対してありますが、このページでは、平均値用で説明します。 誤差とn数のページでは、分散の信頼区間があります。

信頼区間の求め方


信頼区間は、例えば、3個のサンプルのデータがあったら、それらの平均値と標準偏差を使って、上記のような範囲を求めたものです。 サンプルが少ないことを考慮して、t分布を仮定することが多いです。 ここでは例として、95%と書きました。

信頼区間の計算では、標準偏差をサンプル数の平方根で割る部分ががありますが、これは 標準誤差 と同じです。

標準誤差 のページに、サンプル数が増えると、平均値の分布の範囲が狭くなり、ひとつの値に収束していく話があります。 信頼区間は、このような平均値の分布の広がり方について、わかりやすく表す尺度になっています。

信頼区間の性質


上の散布図は、真の平均値が0、真の標準偏差が1になるデータから、n = 3のデータを10000回サンプリングして、10000回分の信頼区間を求めた結果です。

区間として書くと、ゴチャゴチャになるので、ここでは、信頼区間の上側を縦軸、下側を横軸にした散布図として表しています。 例えば、左上に赤丸でかこった点は、信頼区間の上側が約 9、下側が約 -7であることを表しています。

真の平均値が0なので、ほとんどの点は、信頼区間の上側は0より大きく、下側は0よりも小さくなります。 しかし、一部の信頼区間は例外で、上側が0よりも小さかったり、下側が0よりも大きかったりするものもあります。

95%の信頼区間を求めた場合、5%(= 100 - 95)がこの例外になります。 (筆者は、「本当かな?」と思ったので、100万個のデータを作って計算したところ、例外は0.0500054でしたので、確かに5%でした。)

95%信頼区間の、95というのは、ここに表れます。

信頼区間と、個々の平均値の関係

標準誤差 は、平均値の標準偏差です。

もしも、真の平均値と、真の標準偏差がわかっているのなら、その数字を上記の信頼区間の式に入れると、信頼区間の範囲には、95%の平均値が含まれます。 例えば、1万回分の平均値があるのなら、その内の95%は、信頼区間の範囲になります。

ところで、上記は「もしも」の話で、実際のデータ分析では、真の平均値と、真の標準偏差はわからないので、このような信頼区間は、求まりません。

例えば、3個のデータで平均値と標準偏差を作って、信頼区間を求めた場合、その信頼区間の中に、別の3個のデータの平均値がどのくらいの割合で入っているのかはわからないです。

信頼区間の解釈

信頼区間の95%の意味は、長い説明が必要なものです。 結局のところ、「信頼区間に、95%の確率で真の平均値が含まれる」と考えれば良いと、筆者は考えますが、世の中では、必ずしもそうではないです。

「信頼区間に、95%の確率で真の平均値が含まれる」という解釈について

「信頼区間に、95%の確率で真の平均値が含まれる」、という理解の仕方について、ネット等では、「間違い」と指摘することが普通のようです。

「間違い」と指摘される場合の理由は、「頻度論では、真の平均値は定数なので、分布を持つようなものではない。 だから、分布を仮定して、真の平均値の確率を議論するのは間違い。」とすることが多いようです。 「95%の信頼区間」という名前から、「真の平均値の分布」を思い浮かべていることを「間違い」と考えるのは、筆者も同じ意見です。

しかし、「目の前にある、1個の信頼区間は、100万回のうちの1個のようなもの。 100万回やれば、その中の、95%の区間の内側に真の平均値が含まれていることは確認できる。 だから、目の前の1個の信頼区間に真の平均値が含まれている確率は95%」 という事を思い浮かべているのなら、「信頼区間に真の平均値が含まれている確率は95%」という言い方は、正しいと思います。

「頻度論では、平均値に分布はない」について

「頻度論では、真の平均値は定数なので、分布を持つようなものではない。 だから、分布を仮定して、真の平均値の確率を議論するのは間違い。」という話は、その通りですが、「真の」がなければ、頻度論だとしても、 平均値に分布はあります。

頻度論だとしても、「3個のデータセットを100セット作って、平均値を100個計算する」という事をすれば、こういう平均値には分布があります。

「真の」が付くかどうかで、だいぶ違う話になります。

信頼区間と確信区間

信頼区間と確信区間は、いずれも統計量の区間です。 信頼区間は、一般的な統計学、つまり、頻度論をベースにした解説で出て来ます。 確信区間は、「信用区間」とも呼ばれ、ベイズ論をベースにした解説で出て来ます。

例えば、平均値には、信頼区間と確信区間の両方があります。

ソフト

EXCEL

Excelの関数を使うなら、A3セルからA7セルの間にデータがある場合、
信頼区間の上側=AVERAGE(A3:A7)+TINV(1-0.95,COUNT(A3:A7)-1)*STDEV(A3:A7)*SQRT(1/COUNT(A3:A7))
で求まります。

複雑な分布の信頼区間

ggplot2 や、 seaborn という グラフ統計のソフト には、複雑な分布についても、信頼区間を表示する機能があります。



順路 次は 推定から検定へ

Tweet データサイエンス教室