トップページ | ひとつ上のページ | 目次ページ | このサイトについて | ENGLISH

信頼区間と確信区間

信頼区間と確信区間は、いずれも統計量の区間です。 信頼区間は、一般的な統計学、つまり、頻度論をベースにした解説で出て来ます。 確信区間は、「信用区間」とも呼ばれ、ベイズ論をベースにした解説で出て来ます。

例えば、平均値には、信頼区間と確信区間の両方があります。 信頼区間と確信区間は、様々な統計量に対してありますが、このページでは、平均値用で説明します。 誤差とn数のページでは、分散の信頼区間があります。

筆者の場合、信頼区間は、実験で測定したデータのまとめ方として使い始めたのが最初です。 大学の物理実験で教わりました。 信頼区間を使うと、どのくらいの精度で求めた値なのかを示せます。

信頼区間は、こういう使い方をしているのなら、特に問題がないのですが、「区間の中に真の値が含まれている確率は?」といったことに応用しようとすると、 解釈の仕方が重要になって、世の中ではいろいろと議論があります。

信頼区間


信頼区間は、例えば、3個のサンプルのデータがあったら、それらの平均値と標準偏差を使って、上記のような範囲を求めたものです。 サンプルが少ないことを考慮して、t分布を仮定することが多いです。 ここでは例として、95%と書きました。

信頼区間の計算では、標準偏差をサンプル数の平方根で割る部分ががありますが、これは 標準誤差 と同じです。

標準誤差 のページに、サンプル数が増えると、平均値の分布の範囲が狭くなり、ひとつの値に収束していく話があります。 信頼区間は、このような平均値の分布の広がり方について、わかりやすく表す尺度になっています。

信頼区間の性質


上の散布図は、真の平均値が0、真の標準偏差が1になるデータから、n = 3のデータを10000回サンプリングして、10000回分の信頼区間を求めた結果です。

区間として書くと、ゴチャゴチャになるので、ここでは、信頼区間の上側を縦軸、下側を横軸にした散布図として表しています。 例えば、左上に赤丸でかこった点は、信頼区間の上側が約 9、下側が約 -7であることを表しています。

真の平均値が0なので、ほとんどの点は、信頼区間の上側は0より大きく、下側は0よりも小さくなります。 しかし、一部の信頼区間は例外で、上側が0よりも小さかったり、下側が0よりも大きかったりするものもあります。

95%の信頼区間を求めた場合、5%(= 100 - 95)がこの例外になります。 (筆者は、「本当かな?」と思ったので、100万個のデータを作って計算したところ、例外は0.0500054でしたので、確かに5%でした。)

95%信頼区間の、95というのは、ここに表れます。

信頼区間と、個々の平均値の関係

標準誤差 は、平均値の標準偏差です。

もしも、真の平均値と、真の標準偏差がわかっているのなら、その数字を上記の信頼区間の式に入れると、信頼区間の範囲には、95%の平均値が含まれます。 例えば、1万回分の平均値があるのなら、その内の95%は、信頼区間の範囲になります。

ところで、上記は「もしも」の話で、実際のデータ分析では、真の平均値と、真の標準偏差はわからないので、このような信頼区間は、求まりません。

例えば、3個のデータで平均値と標準偏差を作って、信頼区間を求めた場合、その信頼区間の中に、別の3個のデータの平均値がどのくらいの割合で入っているのかはわからないです。

信頼区間の解釈

信頼区間の95%の意味は、長い説明が必要なものです。 結局のところ、「信頼区間に、95%の確率で真の平均値が含まれる」と考えれば良いと、筆者は考えますが、世の中では、必ずしもそうではないです。

「信頼区間に、95%の確率で真の平均値が含まれる」という解釈について

「信頼区間に、95%の確率で真の平均値が含まれる」、という理解の仕方について、ネット等では、「間違い」と指摘することが普通のようです。

「間違い」と指摘される場合の理由は、「頻度論では、真の平均値は定数なので、分布を持つようなものではない。 だから、分布を仮定して、真の平均値の確率を議論するのは間違い。」とすることが多いようです。 「95%の信頼区間」という名前から、「真の平均値の分布」を思い浮かべていることを「間違い」と考えるのは、筆者も同じ意見です。

しかし、「目の前にある、1個の信頼区間は、100万回のうちの1個のようなもの。 100万回やれば、その中の、95%の区間の内側に真の平均値が含まれていることは確認できる。 だから、目の前の1個の信頼区間に真の平均値が含まれている確率は95%」 という事を思い浮かべているのなら、「信頼区間に真の平均値が含まれている確率は95%」という言い方は、正しいと思います。

「頻度論では、平均値に分布はない」について

「頻度論では、真の平均値は定数なので、分布を持つようなものではない。 だから、分布を仮定して、真の平均値の確率を議論するのは間違い。」という話は、その通りですが、「真の」がなければ、頻度論だとしても、 平均値に分布はあります。

頻度論だとしても、「3個のデータセットを100セット作って、平均値を100個計算する」という事をすれば、こういう平均値には分布があります。

「真の」が付くかどうかで、だいぶ違う話になります。

確信区間(信用区間)

確信区間は、信用区間とも呼ばれます。 名前も、内容も、信頼区間と似ていますが、計算方法が違います。

確信区間は、まず、事前分布として、真の平均値の分布を仮定して、データで補正する形で事後分布を得ます。 事前分布、事後分布という考え方は、ベイズ統計を使っています。

信頼区間との一番の違いは、「真の平均値には分布がある」と仮定する点です。

求まるものは、真の平均値の分布なので、そこから例えば、95%の区間を抽出すれば、95%の確率で真の平均値が含まれる区間になります。 「95%の確率で真の平均値が含まれる区間」という説明の仕方は同じですが、 「信頼区間に、95%の確率で真の平均値が含まれる」と言っている時とは、確率として想定していることが、まったく異なります。

確信区間への誤解

「確信区間は、95%の確率で真の平均値が含まれる区間」、と説明しましたが、これは誤解しやすいです。

確信区間は、「真の平均値の分布はこうなっている」と仮定して、その仮定をデータで補正したものから作られています。 そのため、最初の仮定が間違っていたら、補正したものも間違いです。 データに偏りがあるのなら、得られる確信区間にも影響します。

「確信区間は、95%の確率で真の平均値が含まれる区間」と説明するのは間違いではないですが、前提条件があって成り立っている話です。 「確信区間は、95%の確率で真の平均値が含まれる区間」だけを抜き出して来ると、信頼区間とは違って、 真の平均値のことが直接的にわかってしまう理論のように見えますが、そんなことはないです。

信頼区間と確信区間の使い分け

信頼区間(頻度論的なアプローチ)と確信区間(ベイズ論的なアプローチ)は、どちらが優れているものでもないです。 下記は、使い分けの参考になりそうな事になります。

同じ物を繰り返し測定した実験データの分析では、下記の3つのポイントのすべてに当てはまって来て、信頼区間を求めた方が良いです。

平均値の種類

世の中の平均値には、2種類あります。

ひとつは、真の値に固有の意味がある平均値です。 例えば、ある人の体重の測定値です。 これは、真の値が必ずあるはずですが、測定のばらつきがあるので、測った値が、真の値である保証はありません。 そこで、複数回測った平均値で、真の値を推定します。

もうひとつは、真の値に固有の意味がない平均値です。集団を表現する時の代表値としての平均値は、こういう平均値です。 これは、例えば、同じ体重でも、市民全員の体重の平均値です。例えば、100人をサンプリングして、その体重を測ります。 集団としての真の値はあって、測った値が、真の値である保証はないのは、上記の場合と同じです。 ただし、真の値を測れたとしても、その値の人がいる訳ではないので、意味合いが異なります。

「ベイズ論では、データを固定値、統計量を変数と考える」と説明されますが、固有の値を持っているのは個人の体重なので、 代表値としての平均値には、平均値の分布を仮定する確信区間が良いように思います。

一方、「頻度論では、データが変数、統計量が固有値と考える」と説明されます。 「真の値に固有の意味があり、データは測定の都合で真の値からばらついたものが、複数求まっている」、と想定している場合は、頻度論の考え方と合っているので、 信頼区間が良いようです。

区間の意味

上記のように信頼区間は、 標準誤差 の特徴を持っています。

信頼区間は、計算した平均値が、現在のサンプル数だと、どのくらいの確からしさで、求まっているのかの目安になります。

確信区間には、このような使い方ができないです。

計算のシンプルさ

確信区間の計算は、計算する人がデザインする部分が入っています。計算式も複雑です。

信頼区間は、何%にするか、という部分以外は、人が入る余地がなく求まります。計算式はシンプルです。 値の透明性という点では、信頼区間の方が便利です。

ソフト

EXCEL

Excelの関数を使うなら、A3セルからA7セルの間にデータがある場合、
信頼区間の上側=AVERAGE(A3:A7)+TINV(1-0.95,COUNT(A3:A7)-1)*STDEV(A3:A7)*SQRT(1/COUNT(A3:A7))
で求まります。

複雑な分布の信頼区間

ggplot2 や、 seaborn という グラフ統計のソフト には、複雑な分布についても、信頼区間を表示する機能があります。



順路 次は 推定から検定へ

Tweet データサイエンス教室